打开网易新闻 查看更多图片

作者 | 梁昌均

运营编辑|王一晴

大模型到底是闭源,还是开源?李彦宏近日发布的一封内部信,再掀起市场争议。

李彦宏在这封信中解释了百度坚持闭源的原因,一方面是因为已经有足够多的开源大模型,同时闭源模型能力会持续领先,闭源才有真正的商业模式。

换句话说,李彦宏认为开源在技术上无法追上闭源,也无法赚更多的钱。这也在一定侧面显示出,百度对闭源的文心一言的商业化的压力。

开源模型爆发,

能否追上闭源缺乏共识

目前,国内外大模型开源力量正在爆发。谷歌、Meta、马斯克的xAI,以及独角兽Mistral AI、Stability AI、Databricks等,国内的阿里、360、智谱、百川等先后开源大模型。

开源模型的竞争激烈程度,完全不弱于闭源。仅是最近一个月,先是xAI开源全球最大规模大模型Grok-1,其拥有3140亿参数;随后Databricks又突然开源参数1320亿的DBRX,号称是全球迄今为止最强的开源大模型。

最新消息称,开源模型界的“扛把子”Meta,计划在下个月内发布新一代开源大模型LLaMA 3,参数量可能超过1400亿,会支持多模态能力,从而对标GPT-4。

百度曾对开源也考虑过。李彦宏提到,百度内部有过非常激烈的讨论,最后决定是不开源。“当时的判断是,市场上一定会有开源模型,而且不止一家会开源。”

李彦宏认为,今天主流的开源模型,Llama、Mistral都是有相当影响力,国内市场也不缺百度开源的模型。“我们要开源,还得自己去维护一套开源的版本,这不划算。”

当然,更重要的是,李彦宏认为,闭源无论是在技术上还是商业模式上都比开源更具优势。他认为,闭源模型在能力上会持续地领先,而不是一时地领先。

在李彦宏看来,模型开源的意义不是很大,开源模型都是在外头零零散散、小规模地去做各种各样的验证应用,没有经过大算力的验证。反观闭源,才有真正的商业模式,能够赚到钱,能够赚到钱才能聚集算力、聚集人才。

李彦宏似乎借用了月之暗面创始人杨植麟的观点。后者在此前接受媒体采访时称,开源的贡献可能很多都没有经过算力验证,而闭源会有人才聚集和资本聚集,最后一定是闭源更好。

但对开源赶不上闭源的论断,很多人并不同意。周鸿祎在近日在公开课上表示,开源有生态之后,发展会非常快,而且美国开源不是单纯的开源,背后都有很多大公司的支持,开源现在跟闭源之间的距离已经没有那么大。

金沙江创投主管合伙人朱啸虎也认为,开源现在比非开源落后一年甚至一年半,但等闭源技术迭代曲线缓慢下来,开源会上去。

他给出的理由是,OpenAI就一两百个工程师,开源的全世界几百万、几千万工程师在用,怎么可能一直比闭源落后?“就像安卓,今天比iOS差吗?肯定不会。”

不少人都将模型开源类比为互联网时代开源的Linux或安卓。开源能借助全球的技术力量,从而快速实现迭代、体验改进和生态扩张。互联网的繁荣与此息息相关,开源的安卓在移动互联网时代占据80%的市场份额。

不过,李彦宏并不认可将模型开源和传统开源项目类比。“模型开源不是一个众人拾柴火焰高的情况,这跟传统的软件开源,如Linux、安卓等很不一样,由于是模型带来的开源,不知道参数为什么变成那个样子,这种情况下很难实现众人拾柴火焰高。”

李彦宏提到,虽然Llama鼓励大家去贡献各种各样的数据、代码,但是实际上大家明白最主要的开发者就是Meta这些人,它并不是一个真正由大家一起来协同开发的产品。

杨植麟同样认为,模型开源的开发方式跟以前不一样,以前是所有人都可以contribute(贡献)到开源,但现在开源本身还是中心化的。

开源到底有没有价值?

李彦宏再劝创业者要去做应用

实际上,开源模型被视为与闭源模型竞争的一个手段。OpenAI在GPT-3之后走向闭源,对GPT-4等更先进的模型,连具体参数都不再披露,技术细节也不再详细披露。

这导致很多追赶者无法复现OpenAI的技术路径,只能不断摸索,试错成本高。复旦大学教授张奇此前就对搜狐科技表示,如果要完全复刻GPT-4,初步估算,不走弯路的话可能需要20亿;稍微走弯路,如走错了技术路线,可能就是要往40亿去花。

因此对其它公司来说,追赶甚至超越OpenAI很难,而这意味着领先的闭源模型,有更大的机会抢先去占领更多的用户和市场。

这种情况下,开源就成为阻击闭源的武器。这也正是马斯克要开源旗下大模型的一大原因,其还以OpenAI违反最初开源协议为由,对OpenAI提起诉讼,试图借助司法逼迫其开源。

周鸿祎就提到,如果GPT免费,谷歌会很难受,而谷歌反击的办法就是把Gemini开源,让每家公司都有⼀个不逊色于GPT-4的大模型可以用,而且可以免费用,减少⼈们用GPT-4。

对于开源模型到底有没有价值,市场也存争议。不少观点认为,领先的模型去开源不太合理。“落后者才可能去这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”杨植麟说。

周鸿祎认为,模型开源最关键的作用是,它不闭门造车,能给大家提供物质准备,依据开源来做自己的垂直大模型。

百川智能创始人王小川曾对搜狐科技表示,开源能使后发者后发制人,更容易使朋友多多,也是为了商业化做储备,有各种用途和生态之后,就有了收费的可能。

王小川还判断,可能未来80%的企业都会用开源模型,闭源能力强,但成本非常高,没办法对场景做特别好的适配,而开源模型可以非常小巧,在很多地方非常好用。双方不是竞争关系,而是在不同场景下可以互补,不应该纠结是开源还是闭源。

李彦宏认为,虽然开源免费,但闭源更具成本优势。“只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。反过来,同等参数的情况下,闭源模型的能力也更强。”

今天不管是在中国,还是美国,最强的基础模型都是闭源。“通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。”李彦宏称。

李彦宏还再次批评了创业公司双轮驱动的模式。“既做模型又做应用,势必会分散精力,而创业公司的精力和资源是有限的,当资源有限的时候更应该专注。”

那么,AI创业者去做哪个更有优势?李彦宏的答案是,核心竞争力不应该是模型本身,这太耗资源,而且需要非常长时间的坚持才能跑出来,而应该利用各种模型组合去做应用。

李彦宏还不忘“卖货”,强调文心的功能最强,性价比最好,并试图安抚市场玩家,没有必要担心类似文心的闭源基础模型会通吃AI的应用。

这些字里行间都透露出百度的生意经,当更多的人去做应用,那用文心的人可能就更多。这是李彦宏不断呼吁“创业者不要去重复造基础模型的轮子、应该去卷应用”背后的“小心机”,也足以看出百度在大模型商业化上的迫切。