作者:308
编辑:经纬
「从我的观点来看,大模型就是云的一个构成而已」。
8 月 21 日,在 2024 火山引擎 AI 创新巡展上海站的采访环节,火山引擎总裁谭待用上面这句话,谈到了大模型与云之间的关系。
他表示,无论是公有云,还是私有云,本质上大模型都是其中的一部分,大模型私有化也是私有云的一部分;在公有云中,调用大模型,本质上是在调用云上的一个 PaaS 服务,只不过这个 PaaS 服务特别重要。
也因此,谭待强调,没有必要把 AI 和云对立来看——而火山引擎作为云服务厂商的定位,是没有变化。
不过,不得不承认的是,大模型的加持,让火山引擎看到了它在云计算市场的未来机遇。所以,借重于这个千载难逢的机遇,火山引擎作为字节跳动的云计算业务板块,正在花大力气推动旗下豆包大模型的技术突破、成本降低和应用拓展,并且面向不同的行业寻找落地机遇。
从目前的情况来看,火山引擎已经取得了具备巨大可能性的突破。
进击的大模型:不仅仅是技术
作为火山引擎旗下的破局利器,豆包大模型的进化速度令人刮目相看。
这其中,一个典型且容易被外界感知的数据是:根据公开及内部测评集显示,最新版豆包大语言模型相比发布初期综合能力提升了 20.3%。
从具体的细分能力来看,豆包大模型实现了如下方面的提升:
角色扮演能力提升了 38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。
语言理解能力提升了 33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生产力场景中得到应用。
此外,模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。
基于这些技术能力的升级,火山引擎还在本次活动中公布了多个豆包垂类模型的最新升级,具体来说:
豆包·文生图模型对长文本有更精准的图文匹配能力,多主体、多位置、手部结构等复杂场景的生图能力更强,更善于理解中国特色元素,创造更具美感的中国风图片。
豆包·语音识别模型基于大语言模型丰富的知识和推理能力,通过上下文感知,提升语音识别准确性,在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%;支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。
豆包·语音合成模型升级了流式语音合成能力,能够实时响应、精准断句,支持「边想边说」。
另外,基于上述能力,火山引擎还专门发布了对话式 AI 实时交互解决方案,该方案整合了豆包大模型和实时音视频(RTC)技术,提供端到端的大模型实时对话方案。
基于该方案,企业可以轻松地在自己 AI 应用中嵌入该实时语音功能,用户不仅能用语音与 AI 进行交谈,还能像平时说话一样,在对话过程中适时打断或插话,经过升级后的 AI 声音具备较好表现力和感情色彩,对话更自然、更真实、更流畅。
另外,除了模型效果,针对企业生产环境对 AI 高并发需求出发,豆包通用模型pro 提供了国内最高标准的 800k 初始 TPM(每分钟处理 tokens 数量)。基于这样的能力,火山引擎可以在客户高并发的对话场景要求下,帮助客户完成多轮提示词的优化,并且提供充分的高并发保障,帮助客户应对高峰场景。
总体来看,经过技术能力的持续迭代,豆包大模型在三个月的时间里,已经完成了新一轮肉眼可见的能力进化,涵盖了基础能力提升、垂类模型优化、实时对话方案、高并发场景保障等多个与客户关联密切的方面。
除了能力本身,我们还也注意到,火山引擎还在活动现场介绍了一系列面向客户的大模型相关产品升级点,比如说火山方舟最新推出的全周期安全可信方案、扣子专业版、HiAgent 的最新能力等。
这背后,自然也离不开字节跳动本身在 AI 领域的深厚技术积累。
值得一提的是,除了技术开发,火山引擎也尤其注重于降低豆包大模型的成本,从而使得它的快速走向「价值创造阶段」。实际上,在 5 月 15 日的活动上,豆包主力模型面向企业市场就掀起了一场价格战,并由此掀起了行业里的大模型降价风潮。
其结果是,豆包大模型在过去三个月的使用量也在飞速提升。
根据谭待公布的数据,自 5 月 15 日正式对外发布以来,豆包大模型的日均 tokens 使用量已经超过 5,000 亿,而平均企业客户使用量也已经飞速增长了 22 倍。
对于豆包大模型的价格策略,谭待也在采访中表示:
首先,原来的价格就是太贵了,那么贵谁用得起,不是打价格战,我觉得是价格回归到应该回归的地方。当然区别是我们有能力做到,可能有的人不一定有能力做到而已。
OpenAI 都降价了,说明技术的进步就是能做到这么低的成本,并提供这么好的质量,然后要把红利让出来,让大家能更好地做 AI 转型。
大模型生态联盟,为何瞄准零售业?
对于火山引擎来说,大模型的技术能力和成本优势本身,只是它赖以实现整体商业闭环的第一步,这一步固然不可或缺——但从应用落地的角度来看,还需要面向具体的商业场景,寻求不同的可能性。
从目前的情况来看,火山引擎在大模型落地上,已经找到了属于它的方法论。
实际上,早在 5 月 15 日豆包大模型正式发布当天,火山引擎就已经在商业落地层面上走出了它的第一步。其中,在智能终端领域,火山引擎与 OPPO、vivo、荣耀、小米、三星、华硕等厂商共同成立了智能终端大模型,这些玩家的相应应用都已经接入到了火山引擎的大模型发布。
也就是在同一天,在汽车领域,火山引擎也联合中国电动汽车百人会、一汽、吉利、长城、广汽、捷途、智己等 20 多家厂商,一起成立了汽车大模型生态联盟。
而在 8 月 21 日的活动上,火山引擎更进一步,携手多点 DMALL 面向零售行业成立了一个全新的大模型联盟——零售大模型生态联盟。
据了解,该生态联盟的首批 18 家成员包括:物美集团、抖音电商、抖音生活服务、百胜、麦当劳、中国飞鹤、海底捞、居然之家、南7-11、重庆百货、百果园、波司登、天虹、三得利、绝味、名创优品、NielsenIQ、电通等,它们出席了当天的联盟启动仪式。
那么,零售大模型生态联盟成立的目的是什么?
根据火山引擎官方的说法,通过融合豆包大模型与 AI 能力,让零售企业能够以极低的试错成本将大模型技术应用到业务场景中,推动零售行业的智能化升级,提升行业的整体效能和创新能力,以适应不断变化的市场需求和消费者行为,加速零售行业的创新步伐。
很明显,这一联盟实际上就是推动将大模型应用于零售行业。
值得一提的是,在活动现场,多点 DMALL 创始人、物美集团创始人张文中也指出,零售大模型生态联盟对于零售企业来说是抱团取暖,共享联盟内的技术成果和最佳实践,降低企业成本,是当下零售企业拥抱 AI 的最好选择。
张文中还强调,「我们必须全面拥抱 AI,不仅是为了更好的未来,而且是为了生存」。
那么,火山引擎为什么选择了零售业?
在采访中,谭待表示,选择行业的理念,是希望能看到 AI 带来比较大变化的行业,汽车和手机都是终端,终端上 AI 的交互是很自然很贴切的,所以先开始——这次选零售,也是因为零售覆盖的人和数据是足够多的,这里面也能够产生很大的变化,相当于终端来说,又有很大的行业的壁垒和 know-how,那也是值得创新的。
他还表示,所有的经济消费最终都靠 C 端,最终的买家都是 C 端,B2B 最终一定是最后的 C端,火山引擎整体肯定是看的。有 C 端场景的行业是更优先的地方,而这个场景的数字化程度高、数据多,对云和对 AI 来说,都是更容易落地的场景,因此优先看这个方向。
值得一提的是,在本次活动中,除了新组建的零售大模型生态联盟,火山引擎还公布了它在汽车大模型生态联盟方面的最新进展。
具体来说,汽车大模型生态联盟也迎来了领克汽车、吉利银河、几何汽车、上汽荣威、上汽名爵、雄狮科技、大圣科技等多位新成员。根据火山引擎汽车行业总经理杨立伟介绍,当前,火山引擎正与联盟成员就新一代 AI 汽车行业定义、行业评测标准发布以及跨终端行业交流和共创等方向进行密切协作。
另外,火山引擎还宣布首次举办 AI 智能体商业赛事「火山引擎 AI 创造者大赛」,本次大赛由火山引擎携手领克汽车与英特尔联合主办、吉利研究院协办,鼓励开发者及技术爱好者利用豆包大模型和扣子专业版,针对领克汽车的真实业务场景,开发出具有实际应用价值的智能体解决方案。
火山引擎的星辰大海:成下一朵云
如今来看,大模型已经成为火山引擎助力客户面向 AI 转型的核心抓手。
当然,不仅仅火山引擎——如果站在整个行业的视角来看,中国云计算的几个大玩家,包括阿里、腾讯、华为等巨头,也都在技术层面发力大模型,并且努力寻求突破,谁也不希望在这一个崭新的技术潮流中被对手落下,从而成为掉队者。
但是,对于火山引擎来说,身为云计算市场的后来者,它有更大的动力和野心来通过大模型带来的 AI 技术变革来搅动目前整个中国云计算市场的格局。
某种程度上,它也有支撑其野心的一定能力。
一方面,火山引擎得到了字节跳动的体系优势支撑和底层能力支撑。
这个很容易理解。
从根本上来说,火山引擎的 AI 全栈云,都依托于字节跳动本身的海量资源共池,也就是说,从诞生起所有 IaaS、PaaS 层资源,以及推荐算法、数智平台等中台体系产品,都生长于同一朵云上。
基于这个前提,火山引擎数据中心、软硬件基础架构的统一,避免了「算力孤岛」和「数据孤岛」问题,结合火山引擎自研服务器、自研 DPU 卡、调度算法等技术能力,火山引擎 AI 全栈云在性能、稳定性和成本上具备了更大的优势。
换句话说,字节跳动本身,即是火山引擎背后的靠山,同时也是它的客户——不管是在上游的基础技术能力,还是在下游的数据层面,都为火山引擎提供了保障。
本质上,字节跳动为火山引擎提供了规模效应的关键支撑。
当然,不可不重视的是,字节跳动在 C 端也拥有巨量的用户入口(比如说抖音)和商业影响力,因此在面向企业层面的落地上,也有机会在业务层面与火山引擎在 B2C 的场景拓展中产生相应的协同优势——这一点很容易被忽略,但其实非常重要。
另一方面,AI 给云计算市场带来的变革机遇,是重大且长远的。
对于这个问题,谭待在采访中强调,AI 本质上与云是共生关系,如果把二者对立来看,那么 AI 也没有什么价值。因此,火山引擎虽然在强调 AI,但自身定位还是云服务厂商。
他强调,在这个时代里面,云服务厂商要做好的事情最重要的是两个,一是降本增效,通过规模优势把成本降低;二是帮企业做好创新,最重要的是把大模型做好——这两个事情,也是火山引擎最重要的事情。
在采访环节,谭待也提到,目前在 AI 应用领域,即使是一些「低垂的果实」,现在行业里摘得 10% 都不到,甚至在中国 5% 都不到。因此,从火山引擎的角度来看,第一步先要把「低垂的果实」摘完,慢慢积累得越来越多,可以够得更高;但目前的重点,还是先以务实的态度,拿到该拿的收益。
当然,火山引擎之所以敢于去挑战,还有一个背景:从长远的视角来看,云计算市场格局,其实并不算清晰。
究其原因,谭待在采访中表示,因为这个市场的盘子是非常大的,数字化在 GDP 里面占比越来越高,云在数字化里面的占比越来越高,企业一定会用云;今天中国云市场只有几千亿,未来到万亿肯定是时间问题,而且一定是多云。
他强调,格局到现在还不是清晰,仍然有很多的机会。
从这个角度来看,很显然,在谭待的长远视角中,AI,尤其是以大模型为代表的生成式 AI,是火山引擎迫切想要抓住的一个重大技术变革机遇。
值得关注的事,根据 IDC 在 2024 年 7 月份最新发布的《中国智算服务市场(2023 下半年)跟踪》报告,受国内生成式 AI 技术飞速发展的影响,GenAI IaaS(生成式 AI )市场在 2023 年实现爆发式增长,而字节跳动旗下的火山引擎成为 GenAI IaaS 领域市场份额最大的云厂商,而阿里、商汤、百度、腾讯依次居于其后。
从这个角度来看,火山引擎作为云计算市场的后来者,确实表现出了非常强烈的进击性。
当然,相对于整个云计算市场来说,GenAI IaaS 的盘子还比较小,但它无疑是一个潜力巨大的未来——因此,在这个维度上的领先,在很大程度上意味着,火山引擎正在蓄力想要打破现有的云计算市场格局,而且它的力量不可忽视。
毕竟,如果从技术和商业的维度上来观察,火山引擎作为字节跳动在云计算市场的重大布局,又一次在底层逻辑上继承了这家企业在技术积累、产品迭代、市场洞察和商业落地方面的独特基因和作战优势,它的潜力也很难被忽视。
无论如何,在云计算这个战场,火山引擎已经成为一个被同行高度重视的对手——其中一个典型的例证是:在 8 月 21 日2024 火山引擎 AI 创新巡展上海站的活动现场,已经颇有几位来自云计算大厂的员工来现场「取经」了。
本文来自微信公众号“智见 Time”