万万没想到老外追国货比我们还积极,更没想他们在追的竟是国产大模型。在韩国网友一句“韩国没有有竞争力的开源基础模式,即使存在的封闭模式开源,也似乎没有什么竞争力”的羡慕下,中国开源LLM模型秒变“别人家的小孩”。

打开网易新闻 查看更多图片

国产大模型到底有多火?过去一年海外社交平台上“千问又开源新模型了!”“千问新模型还挺好用!”这两大主题讨论帖频频出现,海外网友疯狂安利通义千问大模型。通义Qwen1.5-72B模型在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,多次进入盲测结果全球前10,受到海外开发者的追捧。

打开网易新闻 查看更多图片

越南网友点赞Qwen-72B开箱即用,表现完全不输GPT-4。一边被Qwen-72B模型的多语言能力征服,一边给非英语群体种草国产大模型。痴迷通义千问大模型的海外网友,发现了Qwen-72B的隐藏技能:不需要写任何特殊提示,Qwen-72B就能给出胜过专业医疗LLM给出的回答。当有网友吐槽Qwen-72B模型太大,不能轻松测试时,越南网友立刻推荐了通义开源大模型家族下的Qwen-14B,还有网友推荐Qwen1.5。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

众多大模型厂商中,通义千问做到了全尺寸开源,大量海外开发者在线催更,网友称这是“开放视觉语言模型的疯狂进步”。不得不说,我国的模型还是卷出来了!

打开网易新闻 查看更多图片

最近通义千问还开源了1000 亿参数的Qwen1.5-110B,让一众海外开发者跃跃欲试,在全球最大开源社区HuggingFace排行榜上力压Meta的Llama-3-70B 登顶第一。

而阿里云在5月9日最新发布的通义千问2.5,在理解能力、逻辑推理、指令遵循和代码能力上也卷出了新高度,在中文语境下更是赶超GPT-4 Turbo,堪称地表最强中文大模型。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

老外们从怀疑到尝试,从尝试到催更,不断被阿里云通义千问大模型的实力征服。国产大模型的崛起,让更多老外为东方力量倾倒,直呼“真香”!