升级后的文心大模型4.0，将带给我们什么样的惊喜？

推理成本提升10倍！升级后的文心大模型4.0将带给我们什么样的惊喜？

一个月前，我问了文心一言一个问题，世界上跑得最快的蚂蚁是谁？

它的答案是，“最快蚂蚁是撒哈拉银蚁，它速度可以达到855 毫米每秒，一秒多点就能爬一米，这个速度与人类步行速度相近。撒哈拉银蚁飞速跑动时，6只脚会同时离地，步频比博尔特还快10倍以上。”

今天，同一个问题，文心一言给出更详细答案。

“撒哈拉银蚁每秒移动速度可达到自身体长的108倍，相当于每秒移动近1米。它的步频比牙买加短跑名将博尔特还快10倍以上。在全速前进的情况下，每秒跑85.5厘米，踏出47步。它们在沙漠中快速奔跑时，6只脚会同时离地，像在空中飞翔一样。”

一道简单的自然科学问题，前后2个回答，文心一言回答得都很好，跟之前的回答相比，最新回答里的内容更加丰富，列举数字详实，逻辑性更顺，语言表述也更强。

1个月的时间，文心一言更新了答案，进步之快出人意料。那持续进步的文心一言，现在进展到哪一步了？

据消息人士透露，百度正在潜心训练文心大模型4.0，也就是对标GPT-4的版本，这个版本将很有可能在10月17日百度世界大会期间发布。

据说，跟文心3.5相比，文心4.0的数据量、推理成本等都比前者提高了一个数量级，参数数量直接从200亿提升到了亿万参数规模，训练成本更是提高了10倍，真可谓“烧钱”。

而为了满足如此大规模的参数，文心4.0是在万卡AI集群上训练出来的，这应该是国内首次使用万卡规模集群，进行大语言模型训练。

其实，很多业内人士都知道万亿规模的参数，万卡集群的运算，并不是一件容易的事情。特别搭建万卡集群本来就很难，发挥万卡集群的最大化作用更难。而百度因为有飞桨深度学习平台，深度联合优化，才能基于万卡集群训练如此规模的大模型，才能让大模型实现质的飞跃。

当然，大家还喜欢拿文心一言跟GPT-4对标。其实，训练中文大语言模型比英文更烧钱。中文文本的复杂性和多样性，需要更多的数据来获得高质量的模型。对使用者来说，文心更适用于中文语境。举个例子，文章开头的问题我也问过GPT-4，它给出的回答带着一股“翻译腔”。但看文心回答，中文表述自然通畅，跟我们日常说话并无不同。

最后，期待文心4.0早日发布，能再次享受文心一言带来的惊喜。

升级后的文心大模型4.0，将带给我们什么样的惊喜？

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

无需OpenAI数据，跻身代码大模型榜单！UIUC发布StarCoder-15B-Instruct

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

一哄而上，打不赢美国高科技

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

社区书记与访民通话录音曝光，颠覆了我对法律的认知！

约基奇40+7+13 掘金擒森林狼3-2 唐斯23+6

对话智己联席CEO刘涛：L6亏本卖，强项不是与友商pk流量

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

乌国防部：乌克兰加入北约联合作战实验室网络

我丁克被误诊患癌，弟妹们沉不住气，来病房大闹：车房都得给我们

你的亲戚能恶心到什么程度？网友现场怒怼，看完心里那叫一个爽！

贵州一景点门票9999元，景区：科考价值高，每年只允许200人入洞

2024春晚，互联网大厂怎么不“打架”了？

俄外长演讲称"俄有很多盟友" 身后女子眼珠乱转撩头发

人民日报翻车？赞扬挂科14门大学生考研成功，结果被扒是靠拼爹逆袭

加速“去殖民化”，香港将修改律例

西方再次误判，中国第4艘航母和076，又一次超出了外界预料

布林肯在基辅酒吧讲话：这是最艰难的时刻，我们与你们同在

合肥，不当“黑马”！