打开网易新闻 查看更多图片

AI大模型价格真的是越来越卷啦。

5月21号,阿里云再次抛出重磅炸弹,通义千问的主力模型Qwen-Long宣布降价97%。

API的输入价格从千tokens 0.02元降价到0.0005元,相当于一块钱就能买到200万tokens,也就是约等于5本《新华字典》的文字量。

Qwen-Long是通义千问的长文本增强版模型,最高支持1千万tokens长文本输入,性能对标GPT-4,但降价后仅为后者的四百分之一。

而不只是输入价格,Qwen-Long的输出价格也大降90%,到千tokens0.002元,相比国内外的同行普遍的一两毛的价格,已经有了两个数量级的差别。

阿里云这轮降价量大管饱,一共涉及了9款商业化及开源模型,除了Qwen-Long,包括不久前发布的旗舰大模型Qwen-Max也降到千tokens 0.04元。

打开网易新闻 查看更多图片

Max是目前世界上表现最好的中文大模型,在权威平台OpenCompass上得分追平GPT-4-turbo,同时也杀入了Chatbot Arena的全球榜单15名。

另外值得一提的是,在全球排名前20的模型中,只有三款来自中国,但这三款模型却通通来自通义千问。

通义千问能够取得这份成就并不容易,这轮大降价的意义在某种程度上,也早就超过了一般商业竞争的逻辑

4月末的时候,中国工程院院士孙凝晖在人大常委会专题讲座中,曾指出中国AI发展的诸多困境,其中第四点,就是应用成本居高不下,阻碍了技术的交流扩散。

所以,这次通义千问的大规模降价,不但对互联网AI行业是一个利好消息,对全国各行各业大模型赋能,加速产业革新,都有重要的激励作用。

就像阿里云副总裁刘伟光,所说的“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

实际上,阿里云可能也是目前唯一能站出来,提出以降价推动AI爆发式增长的中国公司。

AI大模型虽然是新技术,但在实际研发和应用中,因为同样需要强大的算力、算法及基础设备作为支撑,所以与云计算一直有着千丝万缕的关系。

所以,目前的通义千问在国内的领先,很大一部分,就得益于之前在公共云服务上的技术红利和规模效应,这带来了巨大的成本和性能优势。

打开网易新闻 查看更多图片

例如,阿里云通过异构芯片互联,高性能网络与存储等核心技术,构建了极致弹性的AI算力调度系统,再结合百炼分布式推理加速引擎,大大降低了模型推理成本,这也就构成了通义千问降价的底气和基础。

当然,我们都知道,理论性能“够用”,不一定等于实际“好用”。

实际应用场景是复杂多样的,性能足够的大模型未必效果扎实,而想要效果体现,又必然要求更高研发建设成本。

可以说,模型的效果、性能和成本构成了一个“不可能三角”,很难都达到全方位、无死角的完美。

而阿里云现在做的,就是让不可能尽量变成可能。

这里的关键是AI大模型能不能具备“自适应推理”能力,可以根据输入数据的特性和计算环境,自动调整推理技术应用和计算资源,以应对各种行业工作环境。

在这方面,阿里云的大规模推理集群优化已经显现出相当成效。

从最新数据上来看, 通义大模型通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,已经在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮等多个领域落地应用。

最近一项成就是5月9日,小米的人工智能助手“小爱同学”已与通义千问达成合作,并且在小米汽车、手机等设备得到应用,其他像微博、众安保险、完美世界等企业,也同样先后宣布接入通义大模型。

打开网易新闻 查看更多图片

而从这些企业和最新趋势上来看,我们也不难发现,去年那种万企做模型的热潮正在降温,大家渐渐意识到,专业的事情还是只能交给专业的人来做。

一般企业从造轮子开始去做大模型,就算不计成本,那也是非常耗时而且没有性价比的事情。

阿里、微软、谷歌等公司已经证明,以公共云作为基础,提供大模型API服务,是有算力、算法、基础建设等全方位的优势。

即便是使用同样的开源模型,在公共云上的调用价格也远远低于私有化部署。

因为自建集群还得考虑,硬件采购、软件部署、网费、电费,人力,折旧等各种成本,而在云上是随取随用,按需付费,不要再操心计算资源闲置或者超载。

拿Qwen-72B开源模型来说,每个月1亿的tokens使用量,在阿里云上调用API只需要600块,而自己部署的成本却会超过一万。

如何再考虑数据安全保障的费用,还有公共云开放平台上更多的潜在机会,私有化部署,实在是一个事倍功半的选择。

总体来看,以公共云为后盾的大模型降价已经成为趋势,通义千问这轮降价同时也是在培养市场,会刺激一批企业和个人尝试调用大模型API服务进行工作或生活学习。

这样一方面是促使更多的行业和人群,使用AI提高效率,另一方面,也是增加千问大模型应用的广度与深度,然后根据这些反馈和经验,帮助阿里云进一步优化发展AI技术。

从历史上看,新技术往往两个爆发点,第一个是它刚刚诞生的时候,而二个,则是它能让普通人都消费得起。

2022年,AI大模型横空出世,令全世界惊艳,而现在,我们或许就正处于第二爆发点的前夜。

对通义千问降价是怎么看的呢?欢迎在评论区里留言。