打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

文:董指导

5月9日,阿里云正式发布了AI大模型“通义千问2.5”。从初代开始,历经一年多的研发迭代后,通义千问的能力再次提升。和上一个2.1版本相比,理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。

根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo,目前已经是中文大模型的领先者。

打开网易新闻 查看更多图片

同时,视觉理解模型在多个多模态标准测试中超越Gemini Ultra和GPT-4V;代码大模型也是行业领先,其支撑的智能编码助手通义灵码也是国内用户规模第一。

这个进展,对国内AI行业的发展还是有不少帮助的。

首先,加速行业格局塑造。

从大模型层面来看,国内大模型已经从“百模大战”,进入了“加速淘汰”的阶段。淘汰的主要指标依然是“资金、算力”。而通义千问2.5的发布,将会继续加速行业格局塑造,资金、人才等资源会持续涌向头部大模型公司。

其次,加速应用落地。

从2023年初到如今,一年多过去后,市场对AI的热情,已经有了一些消退。主要原因是应用落地速度较慢。

应用落地较慢的原因,供给端在于大模型的能力提升,需求端在于刚需且有支付能力的场景挖掘。

通义千问能力的提升,至少可以加速“长文本”场景的AI应用落地。包括金融、法律、传媒宣发、办公等场景。

另外,拓展阿里云的商业增长来源。

目前阿里云自研大模型通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万。

比如,小米“小爱同学”与通义达成合作,强化其多模态 AI 在小米汽车、手机等设备落地;诸如微博、众安保险、完美世界游戏等企业也都接入了通义大模型。中国科学院国家天文台、陕西煤业等也在用通义大模型在各自领域落地。

同时,通义大模型的研发进展,也是阿里云AI战略的体现,同时加速国内公有云扩张。

中国信通院数据显示,全球对比来看,我国公共云在云市场的占比为30%左右,显著低于美国的60%和欧盟的50%。而公共云的发展,就像水电一样,可以为全社会创新带来支撑。

整体来看,随着通义大模型的迭代,国内AI应用的生产能力得到加强;从而可以更高效、低成本地在需求和场景方面进行探索,加速AI在生活中的落地。而长文本场景,有望最先爆发。

-全文完

和董指导聊聊天

点个在看和赞再走~