Jay 发自 凹非寺
量子位 | 公众号 QbitAI

“闭源人工智能在阻碍我们探索真正的科学。”

说这句话的不是别人,是大名鼎鼎的Transformer发明者——Ashish Vaswani

打开网易新闻 查看更多图片

大佬之所以这么说,是因为他觉得OpenAI等闭源厂商被商业化冲昏了头脑,没心思做基础研究。

在Scaling Law碰壁后,独角兽们越来越搞不清技术方向。

迫于投资者压力,不得不亲自下场探索落地场景,更没精力去搞科研了。

为了填补这块空白,一路从Google到Adept再到Essential AI三次搬家的Vaswani,今年再度迎来巨大转折点——

All in基础研究,并且坚持要走开源路线。

打开网易新闻 查看更多图片

万万没想到,大佬三迁,只为打造西方世界的DeepSeek

“我们很乐意成为西方世界的DeepSeek”

2017年,还在Google Brain工作的Vaswani与团队共同写出了《Attention Is All You Need》,这篇论文在5年后开启了如今的GenAI大航海时代。

打开网易新闻 查看更多图片

可惜的是,老东家不太给力,各种条条框框把人束缚得动弹不得,这让Vaswani心灰意冷。

2022年,他离家出走,与Niki Parmar(Transformer八子之一)和David Luan(当时的Adept CEO)创办了Adept AI

可惜好景不长,据BloomBerg报道,Vaswani在Adept与某位联合创始人爆发了一次严重冲突。

这次争执让他意识到:

  • 只有创立一个完全属于自己的公司,才能有绝对的自由。

于是2022年底,他再次挥手告别,拉起新团队创立了Essential AI

打开网易新闻 查看更多图片

最开始,Essential AI还走的是务实派路线——主要业务就是帮企业做财务分析自动化。

结果,就在今年年初,Vaswani突然对董事会宣布:

放弃公司现有业务,并将精力全部投入基础研究。

What!?

这不是把商业模式直接推翻重来吗?

打开网易新闻 查看更多图片

要知道,对于一家原本服务于企业客户的初创公司来说,这可是一个风险性极高的Bet。

出乎意料的是,董事会和资方居然都在一定程度上对Vaswani表示了支持。

参与Essential AI上一轮融资的AMD在采访中表示:

这个路线确实有点不太寻常,但人工智能领域需要更开放的替代方案。

看来,三次迁居的努力没有白费,Vaswani终于如愿以偿,集结了一帮理念同频的大佬。

打开网易新闻 查看更多图片

为商业化四处奔波的这么多年,与资本和客户打了无数次交道,Vaswani真的累了。

蓦然回首,在他的精神世界中,其实一直有一块能承载他一切美好期许的土地,这片伊甸园的名字叫做——开源

他在Essential官网上写道:

在教育和医疗等领域,有真正的科学需要追求,我们不能让封闭的人工智能阻碍人类探索这些新方向。

是不是听着很耳熟,没错,Vaswani在与Economics Time的采访中直接承认了:

“短期内,我们想要成为西方世界的DeepSeek。”

打开网易新闻 查看更多图片

Vaswani认为,要想推动AI的边界绝不能靠OpenAI、Anthropic等依靠闭源模式盈利的独角兽。

在他的设想里,AI不该只服务于商业,而是要真正进入教育、医疗等关乎大众的场景,让普通人也能享受到技术红利。

比如,一个偏远地区的孩子也能用开源AI上到最好的课;一个小诊所也能借助开源工具做出最准确的诊断。

更重要的是,Vaswani可不光是喊口号,Essential在转型后的确下了不少真功夫

提出转型后的不久,2025年4月,Essential AI团队发表了一篇题为《Rethinking Reflection in Pre-Training》的论文。

这篇论文提出了一个颠覆性观点:

大型语言模型的反思能力其实在预训练阶段就开始萌芽。

简单来说,相较于用RL在后训练打补丁,他们在预训练中取得了突破,并且这个技术可能大幅降低训练成本。

要真能成,那对整个开源社区绝对是大利好。

Vaswani看到了什么?

为什么Vaswani说不能把希望寄托在独角兽公司身上?

Vaswani担心,这些模型性能最优异的独角兽正在阻碍人工智能进步。

有几家公司关闭了长期的研发工作,以便将所有资源用于商业化,这种现象在市场环境恶化时更加明显。

自Scaling Law迎来边际收益递减的拐点后,AI独角兽的产品化倾向已是众人皆知。

Anthropic做浏览器,OpenAI派出著名产品经理Kevin Weil…….各大模型厂商纷纷下场,亲自探索商业模式。

这折射出来的一个问题是创新者窘境

Scaling Law兴起后,暴力美学的砝码使得AI研究的天平从学术机构几乎完全向企业实验室倾斜。

不过,产业界虽垄断了最稀缺的生产要素,他们真的可以All in创新吗?

绝大多数时候不能。因为那可能烧掉几个亿,而且不一定能看到回报。

关键在于,无论公司成立的初衷是什么,创始人最终都得优先对投资人负责。

因此,探索商业模式和利益最大化是闭源模型的最终归宿,这从一开始就注定了。

如今,这把热烈的商业化之火同样烧到了硅谷这批天之骄子身上

今天等着小扎买买买,明天听说OpenAI搞收购,下个月又去创业。

打开网易新闻 查看更多图片

△由AI生成

这种节奏很适合追热点,但科研不一样——要搞出突破性的成果,你得花几年甚至十几年死磕一个方向。

而频繁的流动,让团队很难静下心来。

Vaswani叹息道,这不是科学应有的进步方式。

那Vaswani想要怎么做?开源阵营能够拯救AI吗?

老生常谈的话题——人多力量大,知识共享才是推动AI技术发展的关键动力。

闭源公司虽手握顶级资源和技术成果,但为了维护投资人的利益,不得不把这些秘密藏起来,以阻碍竞争对手。

但如果有成千上万的研究者和开发者一起贡献代码,整个生态齐心协力,并行推进,也许能克服开源阵营资源匮乏的问题。

当然,开源最重要的问题在于资金来源,毕竟咱不能总靠“用爱发电”。

对此,Vaswani参考了互联网产品的解法

交叉补贴大法好

什么是交叉补贴呢?

这是互联网时代很常见的一种商业模式,典型案例就是浏览器:Google搜索对用户完全免费,取得市场份额后依靠广告回血。

简单来说,就是一部分业务赚钱,用来补贴另一部分业务

打开网易新闻 查看更多图片

Vaswani对于Essential AI的计划是这样的:

先构建一个开源的垂直领域模型,这个基座本身不收钱。

但如果有客户想用这个基座搭建自己的AI,可以向Essential AI购买训练数据和相关产品。

通过这个途径赚来的钱,正好能用来反哺开源社区。

这样,既能保证技术开放,又能让公司活下去。

打开网易新闻 查看更多图片

此外,Vaswani还指出闭源不一定代表更高的投资回报率。

虽然闭源模型看起来更容易变现,但实际上也面临巨大的成本压力。

实际上,如果按照之前科技互联网的发展来看,开源通常是更赚钱的一方,毕竟构建起了一整个生态。

One More Thing

最后,关于Ashish Vaswani,或许还有一点点可以多说的。

打开网易新闻 查看更多图片

作为《Attention Is All You Need》论文的“一作”,他博士师承的两位导师,都是华人。

在2011年的南加州大学,有两名活跃在自然语言处理(NLP)前沿的教授——蒋伟(David Chiang)与黄亮(Liang Huang)。

他俩都是Ashish Vaswani的导师。

打开网易新闻 查看更多图片

△图左为蒋伟教授,图右为黄亮教授

蒋伟教授的学士和硕士均就读于哈佛大学,后到宾夕法尼亚大学攻读博士,他提出的分层短语翻译模型曾被Google Translate采用。

黄亮教授本科毕业于上海交通大学计算机系,同样是在宾夕法尼亚大学进修的PhD,主要研究方向是开发高效算法来加速NLP任务,Vaswani是他指导的第一名博士生。

怎么说呢,虽然Transformer八子里没有华人作者,但“功劳簿”里,也并非全然没有华人贡献。

这实际也是另一个维度的开源之力。AI也好、深度学习也好,之所以可以站上浪潮之巅,根本上就在于始终有一个持续交流、开放互助的生态环境。

开源是一种选择,更是一种精神和信仰。

参考链接
[1]https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech
[2]https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai
[3]https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms
[4]https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1
[5]https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/
[6]https://www.essential.ai/
[7]https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/