更容易赚钱？李彦宏坚持百度大模型闭源

作者 | 梁昌均

运营编辑｜王一晴

大模型到底是闭源，还是开源？李彦宏近日发布的一封内部信，再掀起市场争议。

李彦宏在这封信中解释了百度坚持闭源的原因，一方面是因为已经有足够多的开源大模型，同时闭源模型能力会持续领先，闭源才有真正的商业模式。

换句话说，李彦宏认为开源在技术上无法追上闭源，也无法赚更多的钱。这也在一定侧面显示出，百度对闭源的文心一言的商业化的压力。

开源模型爆发，

能否追上闭源缺乏共识

目前，国内外大模型开源力量正在爆发。谷歌、Meta、马斯克的xAI，以及独角兽Mistral AI、Stability AI、Databricks等，国内的阿里、360、智谱、百川等先后开源大模型。

开源模型的竞争激烈程度，完全不弱于闭源。仅是最近一个月，先是xAI开源全球最大规模大模型Grok-1，其拥有3140亿参数；随后Databricks又突然开源参数1320亿的DBRX，号称是全球迄今为止最强的开源大模型。

最新消息称，开源模型界的“扛把子”Meta，计划在下个月内发布新一代开源大模型LLaMA 3，参数量可能超过1400亿，会支持多模态能力，从而对标GPT-4。

百度曾对开源也考虑过。李彦宏提到，百度内部有过非常激烈的讨论，最后决定是不开源。“当时的判断是，市场上一定会有开源模型，而且不止一家会开源。”

李彦宏认为，今天主流的开源模型，Llama、Mistral都是有相当影响力，国内市场也不缺百度开源的模型。“我们要开源，还得自己去维护一套开源的版本，这不划算。”

当然，更重要的是，李彦宏认为，闭源无论是在技术上还是商业模式上都比开源更具优势。他认为，闭源模型在能力上会持续地领先，而不是一时地领先。

在李彦宏看来，模型开源的意义不是很大，开源模型都是在外头零零散散、小规模地去做各种各样的验证应用，没有经过大算力的验证。反观闭源，才有真正的商业模式，能够赚到钱，能够赚到钱才能聚集算力、聚集人才。

李彦宏似乎借用了月之暗面创始人杨植麟的观点。后者在此前接受媒体采访时称，开源的贡献可能很多都没有经过算力验证，而闭源会有人才聚集和资本聚集，最后一定是闭源更好。

但对开源赶不上闭源的论断，很多人并不同意。周鸿祎在近日在公开课上表示，开源有生态之后，发展会非常快，而且美国开源不是单纯的开源，背后都有很多大公司的支持，开源现在跟闭源之间的距离已经没有那么大。

金沙江创投主管合伙人朱啸虎也认为，开源现在比非开源落后一年甚至一年半，但等闭源技术迭代曲线缓慢下来，开源会上去。

他给出的理由是，OpenAI就一两百个工程师，开源的全世界几百万、几千万工程师在用，怎么可能一直比闭源落后？“就像安卓，今天比iOS差吗？肯定不会。”

不少人都将模型开源类比为互联网时代开源的Linux或安卓。开源能借助全球的技术力量，从而快速实现迭代、体验改进和生态扩张。互联网的繁荣与此息息相关，开源的安卓在移动互联网时代占据80%的市场份额。

不过，李彦宏并不认可将模型开源和传统开源项目类比。“模型开源不是一个众人拾柴火焰高的情况，这跟传统的软件开源，如Linux、安卓等很不一样，由于是模型带来的开源，不知道参数为什么变成那个样子，这种情况下很难实现众人拾柴火焰高。”

李彦宏提到，虽然Llama鼓励大家去贡献各种各样的数据、代码，但是实际上大家明白最主要的开发者就是Meta这些人，它并不是一个真正由大家一起来协同开发的产品。

杨植麟同样认为，模型开源的开发方式跟以前不一样，以前是所有人都可以contribute（贡献）到开源，但现在开源本身还是中心化的。

开源到底有没有价值？

李彦宏再劝创业者要去做应用

实际上，开源模型被视为与闭源模型竞争的一个手段。OpenAI在GPT-3之后走向闭源，对GPT-4等更先进的模型，连具体参数都不再披露，技术细节也不再详细披露。

这导致很多追赶者无法复现OpenAI的技术路径，只能不断摸索，试错成本高。复旦大学教授张奇此前就对搜狐科技表示，如果要完全复刻GPT-4，初步估算，不走弯路的话可能需要20亿；稍微走弯路，如走错了技术路线，可能就是要往40亿去花。

因此对其它公司来说，追赶甚至超越OpenAI很难，而这意味着领先的闭源模型，有更大的机会抢先去占领更多的用户和市场。

这种情况下，开源就成为阻击闭源的武器。这也正是马斯克要开源旗下大模型的一大原因，其还以OpenAI违反最初开源协议为由，对OpenAI提起诉讼，试图借助司法逼迫其开源。

周鸿祎就提到，如果GPT免费，谷歌会很难受，而谷歌反击的办法就是把Gemini开源，让每家公司都有⼀个不逊色于GPT-4的大模型可以用，而且可以免费用，减少⼈们用GPT-4。

对于开源模型到底有没有价值，市场也存争议。不少观点认为，领先的模型去开源不太合理。“落后者才可能去这么做，或者开源小模型，搅局嘛，反正不开源也没价值。”杨植麟说。

周鸿祎认为，模型开源最关键的作用是，它不闭门造车，能给大家提供物质准备，依据开源来做自己的垂直大模型。

百川智能创始人王小川曾对搜狐科技表示，开源能使后发者后发制人，更容易使朋友多多，也是为了商业化做储备，有各种用途和生态之后，就有了收费的可能。

王小川还判断，可能未来80%的企业都会用开源模型，闭源能力强，但成本非常高，没办法对场景做特别好的适配，而开源模型可以非常小巧，在很多地方非常好用。双方不是竞争关系，而是在不同场景下可以互补，不应该纠结是开源还是闭源。

李彦宏认为，虽然开源免费，但闭源更具成本优势。“只要是同等能力，闭源模型的推理成本一定是更低的，响应速度一定是更快的。反过来，同等参数的情况下，闭源模型的能力也更强。”

今天不管是在中国，还是美国，最强的基础模型都是闭源。“通过大模型降维做出来的模型就是更好的，这样也会导致闭源在成本上、在效率上也会有优势。”李彦宏称。

李彦宏还再次批评了创业公司双轮驱动的模式。“既做模型又做应用，势必会分散精力，而创业公司的精力和资源是有限的，当资源有限的时候更应该专注。”

那么，AI创业者去做哪个更有优势？李彦宏的答案是，核心竞争力不应该是模型本身，这太耗资源，而且需要非常长时间的坚持才能跑出来，而应该利用各种模型组合去做应用。

李彦宏还不忘“卖货”，强调文心的功能最强，性价比最好，并试图安抚市场玩家，没有必要担心类似文心的闭源基础模型会通吃AI的应用。

这些字里行间都透露出百度的生意经，当更多的人去做应用，那用文心的人可能就更多。这是李彦宏不断呼吁“创业者不要去重复造基础模型的轮子、应该去卷应用”背后的“小心机”，也足以看出百度在大模型商业化上的迫切。

更容易赚钱？李彦宏坚持百度大模型闭源

李彦宏，西二旗新卷王

巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

是谁杀死了谷歌搜索？

神仙来了虎扑，也得先排个名

“数字后福特主义”: 中国互联网平台的唯一明路?｜文化纵横

990万拍了二手迈巴赫却拒绝付款？他胆真大！敢把周鸿祎当猴耍

2024春晚，互联网大厂怎么不“打架”了？

这台新机一发布，全世界垃圾佬都得疯

后续！周鸿祎和二手车商聊天内容曝光，火药味十足，周鸿祎很硬气

说好得的三次3800，结果做了一次不退钱想开溜，小伙不愿意了

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

990万至今未付余款！周鸿祎玩剧本杀，还是褚会长背信弃义？

崩盘!快船惨败2-3独行侠哈登12中2乔治13中4东契奇35+10

消息称：特斯拉与百度达成协议，让FSD 进入中国市场！

特斯拉中国版FSD被曝采用百度高辅地图？自动驾驶终于要来了？

一哄而上，打不赢美国高科技

特斯拉联手百度落地FSD？智驾的局势要被彻底改写！

周鸿祎回应“迈巴赫中标者未付清余款”：褚会长需要时间把款筹齐

周鸿祎拍卖迈巴赫遭背刺：褚会长毁约收益最大，零元赚40万粉丝

更容易赚钱？李彦宏坚持百度大模型闭源

李彦宏，西二旗新卷王

巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

是谁杀死了谷歌搜索？

神仙来了虎扑，也得先排个名

“数字后福特主义”: 中国互联网平台的唯一明路?｜文化纵横

990万拍了二手迈巴赫却拒绝付款？他胆真大！敢把周鸿祎当猴耍

2024春晚，互联网大厂怎么不“打架”了？

这台新机一发布，全世界垃圾佬都得疯

后续！周鸿祎和二手车商聊天内容曝光，火药味十足，周鸿祎很硬气

说好得的三次3800，结果做了一次不退钱想开溜，小伙不愿意了

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

990万至今未付余款！ 周鸿祎玩剧本杀，还是褚会长背信弃义？

崩盘!快船惨败2-3独行侠 哈登12中2乔治13中4东契奇35+10

消息称：特斯拉与百度达成协议，让FSD 进入中国市场！

特斯拉中国版FSD被曝采用百度高辅地图？自动驾驶终于要来了？

一哄而上，打不赢美国高科技

特斯拉联手百度落地FSD？智驾的局势要被彻底改写！

周鸿祎回应“迈巴赫中标者未付清余款”：褚会长需要时间把款筹齐

周鸿祎拍卖迈巴赫遭背刺：褚会长毁约收益最大，零元赚40万粉丝

990万至今未付余款！周鸿祎玩剧本杀，还是褚会长背信弃义？

崩盘!快船惨败2-3独行侠哈登12中2乔治13中4东契奇35+10