这几天硅谷投资人集体炸锅,起因是华尔街风投教父Marc Andreesen突然在X平台狂吹一家中国公司DeepSeek。

他说这家公司的开源模型R1是给全人类的礼物。要知道这位大佬投出过OpenAI和Databricks,现在居然给中国AI站台,这事确实不寻常。

纽约时报当天就发了长篇报道,字里行间透着酸味。说中国工程师用2000张显卡和550万成本,硬刚美国巨头几十亿烧出来的模型。
更扎心的是,R1在专业测试里已经追平OpenAI最新产品。


1月24日,美国消费者新闻与商业频道CNBC称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。

最戏剧化的是英伟达股价突然跳水,有交易员猜测是R1证明不用尖端芯片也能搞AI,吓得市场抛售算力股。
另据媒体报道,Meta(前身为 Facebook)员工在美国匿名职场社区teamblind上发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。
在此前,OpenAI前政策主管、Anthropic联合创始人杰克·克拉克表示,其认为DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型“将和无人机、电动汽车一样,成为不容忽视的力量。”

不过看客们先别急着下结论。Meta刚把年度预算加到650亿,谷歌还在抢购H100。现实是中美都在疯狂堆算力。
刷到这条新闻,突然想起二十年前硅谷嘲笑中国只会山寨。现在轮到他们研究我们的开源代码,这种角色互换挺有意思。
让欧美科技、创投圈大佬及媒体不吝溢美之词的中国大模型公司,究竟强在哪里?
几天前,总部位于中国杭州的DeepSeek发布推理模型R1,在性能逼近 OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。
纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。
“GPT o1一个月得200美元呢,DeepSeek能力强还完全免费,强啊,省钱了。”有网友评论道。还有人表示,自己近期通过DeepSeek的模型写代码,表现比GPT更好。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。
这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与 OpenAI 的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。

有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。
业内人士认为,DeepSeek的出现预示着中国AI产业正从“跟随创新”转向“范式创新”,全球AI竞争进入技术多极化时代。