又被马斯克说中,中国AI再次登顶世界第一!

谁是最强开源大模型?海外在线平台CodeArena进行一次投票,结果却惊掉了许多人的下巴。

前三名中,来自中国的阿里云开源大模型Qwen拿下两席,Qwen 2.5 Coder32B位列第一,一直被认为是开源模型标杆的Llama 3.1排在第二,Qwen 2.5 72B排名第三!

打开网易新闻 查看更多图片

老外们一边破大防,一边极其不解!

破大防的是:Llama 3.1明明比Qwen 2.5 Coder32B大10倍,后者竟然赢了,中国AI好比打赢了科技上甘岭之战。

极其不解的是:西方媒体不说Llama 3.1天下第一吗?怎么最终霸榜的是中国的开源大模型!还是两个!

CodeArena这个在线平台还是有很多专业的用户。

通过比较不同大型语言模型 (LLM) 生成代码的能力,并且显示排名结果,这也方便了全球开发者观察谁才是开源大模型的王者。

在这个平台上,谁强谁弱根本瞒不住,真相一目了然。CodeArena的数据摆在那,谁也没得黑。

看到Qwen在海外为国争光,那些唱衰国内AI公司的人,不知作何感想?

其实有一小撮言论,总是盯着国产的大模型。在他们的意识里,国产AI天生就该永远落后美国,一旦国产AI有了突破,那也是山寨、套壳美国AI的结果。

可现实呢?反倒是美国的科技大佬和开发者们看清了中国AI的实力。2023年世界人工智能大会上,马斯克就给出过两个断言:

第一,中国下决心做好人工智能,那一定会做得非常出色。

第2, 马斯克相信,「中国在人工智能方面将拥有强大的能力。

打开网易新闻 查看更多图片

当黑子们还在网上贬损中国AI时,马斯克已经站到大气层看问题了。十分尴尬的是,曾让马斯克寄予厚望的Chatgpt,却接连爆出丑闻。

12月12日,OpenAI证实其聊天机器人ChatGPT在全球范围宕机,被很多国人神话的ChatGPT、Sora及API全部瘫痪。

随后,美国媒体爆料,OpenAI吹哨人Suchir Balaji被证实死亡,年仅26岁,他此前公开揭露OpenAI的ChatGPT机器人涉嫌侵犯版权法。意味深长的是,马斯克转发了Suchir Balaji死亡的消息,写下了“Hmm”。

打开网易新闻 查看更多图片

说实话,马斯克称赞中国AI,也说出了美国开发者们的心声。无论社媒还是油管上,阿里云开源Qwen大模型都是“流量王”,老外们像发现了新大陆,原来在AI大模型这块,天不只有美国的蓝啊!

老外们拿出美国AI压箱底的大模型对比,被测评成绩直接干傻眼了。美国开发者干脆飙脏话:等等,我的天呐,Qwen 2.5 72B绝对完胜了GPT4o和Claude Sonnet!

打开网易新闻 查看更多图片

老美有这么大反应,完全可以理解。GPT4o绝对是老外们心中的“遥遥领先”,透着慢慢的美国“技术乐观主义”。就比方说,GPT4o后边的o,代表着“omni”(全知全能)。当初GPT-4o一发布,就被国内媒体捧成能“使得ChatGPT进入实时互动纪元”。

可老外们想破脑袋也没料到,眼看GPT-4o即将封神,哪成想半路杀出个中国开源Qwen,还上演了开源完胜闭源的戏码,杀人诛心不过如此啊。

美国开发者列出详细评测数据,写道:在25个LLMs上运行MMLU-Pro CS基准超过59次,运行时间超过70小时之后,阿里巴巴的Qwen系列QwQ-32B-Preview是最好的本地模型!冠军!

打开网易新闻 查看更多图片

哪怕是十年前,都难以想象,中国科技能有在外网疯狂吸粉的今天。尤其在外网,风向彻底变了:咱们的Qwen甚至成了老外们的新标准,哪家公司新出的大模型强不强,得跟Qwen比较一下才有说服力!

打开网易新闻 查看更多图片

对一项科技最好的证明,莫过于使用者的认可。分享一个振奋人心的数据吧,全球开源社区基于Qwen系列二次开发的衍生模型数量已经突破了7.43万,超越Llama系列衍生模型,成为世界最大的生成式语言模型族群。等于说,全球那么多生成式语言大模型,我们的Qwen系列是最受欢迎和认可的!

总有人问:中国AI实力到底如何?国内讨论难免有人护犊子,有人自吹自擂,但这些海外的评价已经证明,Qwen就是中国开源AI大模型的绝对王者,更是征服了美国开发者的中国科技王牌。

阿里云这波确实干得很漂亮!