作者:万红杰、袁媛、周搏、邓思迪
导 语
过去一年,大模型发展超出大部分人所料:最新模型不断发布,多模态能力让模型能看、能听、能回答;推理能力让模型开启慢思考,数学和编程水平猛升;而今年的诺贝尔物理和化学奖授予人工智能相关学者,肯定了大模型的科学工具本质和贡献。但是,“杀手级应用”迟迟不出现,商业变现的成绩并未显现,公众都会疑惑,大模型究竟是远还是近?社会生产和人类生活中什么时候才能看到切实的模型应用?
我们选择了回顾。2024年,我们走访调研了阿里20多个业务团队和10多个外部典型企业客户,连续16个月跟踪大模型调用的内外部数据,我们看到:大模型的可用性已跨过产业规模化使用的“临界点”,通义等头部大模型厂商,正以“每3个月翻3倍”的速度增长,在社会各类生产运营中场景里快速渗透。
风起于浮萍之末,大模型这种国之重器,为何在产业渗透中却是 “润物细无声”?而模型的价值是否符合人类对它的巨大预期?本文将逐一探讨。同时,在产业之外,我们也看到大模型已成为基础科学领域发展的新“题眼”,而放眼未来,AI Agent将革新当前的软硬件形态、带来全新商业模式。AI4S和AI Agent的观察和研究将作为本文的续篇持续发布,敬请期待。
一、大模型为何产出小应用?
以阿里最熟悉的电商产业为例,大模型应用起步于内容生成,辅助中小商家生成商品的各类营销物料,支持虚拟模特一键换衣,帮助中国商品转战海外用各种语言展示。随着模型能力提升,逐步从商品发布,向营销投放、售前导购、物流配送及售后服务的电商全流程:在营销投放环节,阿里电商已经从AI生成广告,过渡到学习优秀投放案例,生成打分模型,自己挑选最佳营销素材;在物流配送环节,申通的快递员在送达后拍照上传,AI来识读、理解照片判断包裹是否真实送达客户家门口;在售后服务环节,申通AI能够听取客户投诉电话,综合客户信用和派送情况来辅助客服人员来定责定损,阿里电商甚至更进一步,能够在跟金融机构对接,帮助商户跟海外金融机构进行退款协商抗辩。
大模型在电商产业的渗透是千行百业的一个缩影。观察阿里服务的外部客户,当前使用通义模型的30万名企业客户,广泛分布于互联网、消费电子、汽车、品牌零售、交通物流、金融医疗、人力资源、教育旅游等十余个不同行业,如某互联网社交平台借助大模型重新设计数据标注流程,基于大模型打标+人工复审,大幅削减了人力成本,准确率从40%左右提升到70%。某招聘平台企业,在AI面试、简历质检、职位发布等环节广泛嵌入大模型,显著提升招聘信息处理效率,如基于大模型自动抽取职位描述要点并生成高质量招聘文案,发职位时间节省90%;利用AI帮助筛选简历,匹配效率翻倍,人力资源部门能更快速地定位潜在候选人。千行百业的应用场景异常多样、难以穷举尽数。
如何看待这些“小微”场景和它们带来的效率改善?我们可以回看2021年在全球GE提出工业互联网时喊出的口号:“The Power of 1%”,呼吁勿以善小而不为,不能忽略任何1个“1%”。“考虑工业巨大规模, 1%的燃油节省、1%的货运提升、1%的勘探优化,合计将为全球带来带来3000亿美金的经济效益”。大模型在产业渗透的价值规律非常类似:在颠覆产业现有的业务模式或运营流程之前,通过生产运营环节的优化和对人与机、流程与流程之间对接的效率优化,也能累积显著的规模效应。这种“润物无声”的渗透方式,通过无数微创新的累积,迅速形成了一股强劲的产业浪潮。
二、大模型应用渗透为何如此快?
在大模型产业快速渗透过程中,“模型达到可用临界点”与“易复制的成功用例”构成了大模型产业应用快速渗透的底层逻辑。
逻辑一:模型能力进步及推理成本下降,超过可用临界点,产业应用尽用
本轮大模型技术与过往AI最大的差异:一方面是多模态“生成”能力的大幅跃升,另一方面则是“理解、推理”能力的持续进化。于此同时,过去一年芯片和云端基础设施的快速演进使推理成本持续走低,进一步催生了规模化应用。以通义千问为例,一年内API调用价格下降97%,百万Token调用成本仅需0.5元,大幅降低了企业试错和部署门槛,千行百业应用的想象空间彻底打开。
(1)多模态“生成”能力:“生成”本身就是“生产力”
过去2年“生成”能力的跃升让大模型不再局限于文字处理,而是能实现文生图、文生视频、代码补全、语音生成等多模态的Any2Any输出。基于强大的理解和生成能力,AI在内容创作、客服、营销、代码开发等场景全面开花。以电商为例,淘宝今年4月陆续推出“素材生成”功能,仅半年时间,每月素材生成量已经超过2亿。而在代码开发领域,阿里云通义灵码仅一年时间就为企业生成超过10亿行代码,帮助上万家大型公司实现研发效率的大幅提升。从商品图到程序代码,从公文到PPT、小程序,“生成”能力带来的生产力革命正渗透到更多产业生态里。
(2)理解与推理:大规模场景落地的“逻辑底座”
如果说“生成”提供了直观冲击力,那么大模型的“理解、推理”能力则为“数据挖掘、信息理解与流程决策”提供了技术支撑,为大规模场景落地提供了底层引擎。一方面,通过海量数据训练和强泛化能力,大模型在信息抽取、打标、判责、内容风险识别等环节实现对传统机器学习算法的“降维打击”,“大模型换旧模型”成为产业实践中非常普遍的现象。过去,企业通常在语音识别、文本处理、视觉识别等任务场景分别使用ASR、NLP、CV等单模态模型,场景或数据稍有变化算法效果就会打折,甚至需要重新开发新的算法。比如在内容风控中,需要不同“变种”的风险内容开发相应的模型。如今,大模型以一体化的“通用理解与识别”能力,足以覆盖过去十几个分散模型的功能,极大简化了企业研发与维护成本。例如某电商平台,在内容风控场景用一个大模型统一了过去的10多个算法小模型,精准度均从60%提升至93%。另一方面,企业基于大模型的意图理解,通过内部数据的打通和流程编排,可以为复杂场景打造对应的“Agent”,进而为更复杂应用打开空间。
逻辑二:成功用例能快速复制
一旦大模型在某个行业或企业内部跑通一个成功用例,就会触发广泛而迅速的复制效应。背后原因主要在于大模型具备高通用性,且公有云模型服务让应用落地更为简单高效。这种高速复制极大缩短了大模型在不同行业落地的周期,也意味着应用成效会随着成功用例累积而呈更快增长。
首先,在企业内部层面,大模型一旦被证明能高效解决某一部门的问题,往往会迅速蔓延到业务流程和其他部门。菜鸟开始在客服、供应链管理等局部场景开展试点,得益于大模型泛化能力突出和相关工具链的成熟,内部其他部门迅速“跟进模仿”。据统计,截止10月菜鸟已在内部孵化了超过60个AI应用场景,涉及销售、客服、供应链、财务管理等若干方面,半年已累计为员工节省50万小时。
其次,在同行之间,成功案例的出现往往引发行业“跟随效应”。以人力资源行业“AI面试”场景为例,早期有招聘平台推出“AI面试”在面对校招、蓝领等大规模面试时,可极大幅压缩人力成本,并提升招聘效率。其他招聘平台见状迅速跟进,纷纷引入相似技术。目前市场上AI面试以有十多款主流产品。
而在跨行业的迁移复制上,不同行业看似业务形态迥异,却往往能复用相同的AI能力或流程模式,因而在公共云的基础上实现“跨行业复制”变得异常迅速。以打车平台的判责环节、快递公司对包裹投递的视觉确认为例,它们背后共同依赖大模型做大规模的数据挖掘。这些场景一旦跑通,来自各行各业的模仿者便能依托公共云完成高效率地复制与部署。
更为重要的是,相较于上一代AI算法,大模型的泛化性和公有云模型服务的普惠性带来应用落地上的极大优势。以大模型在视觉识别领域的应用为例,对比云上调用大模型与线下开展传统CV算法两种实现模式,由于不用单独建模和线下部署计算环境,工期和成本会差10倍以上,而对于普通企业更有吸引力的是,开发并不依赖于专业的算法人员。资金、时间、技术三重门槛同时降低,使得更多中小企业能够快速切入智能应用领域,极大地促进了创新和业务转型。
三、大模型的应用渗透为何快慢不均?
大模型在产业上的迅速普及固然可见,但并非所有领域和组织都能同步推进,一些领域进展迅猛,一些则偏于迟缓。结合行业实践可发现,可从以下三个关键视角透视这一“快慢不均”现象。
视角一:通用场景大模型“遍地开花”,专业领域值得期待
大模型跨行业应用多点开花,从应用量较大的场景中可以尝试总结的共同点在于:
用户体验敏感:无论是汽车的智能座舱、金融服务个性化咨询,还是教育的在线辅导,用户交互和体验提升始终是核心竞争力,大模型的意图理解和自然语言交互能力会有较大帮助。
效率提升需求高:从制造业的供应链优化到互联网媒体的评论管理,这些领域都是企业日常运营中的关键环节,模型的信息抽取和理解能力能够降低重复劳动、改善流程协作。
数据积累丰富:上述场景都在数字化转型过程中积累了相对丰富的文本、视频和流程运营数据,虽然之前的算法或数字化系统效果未达预期,但功不唐捐,沉淀数据可以转化为模型可理解利用的语料。
值得注意的是,尽管应用范围广泛,但目前尚未有单一行业形成特别成功的“行业模型”。这表明大模型当前的应用更多地体现在通用能力上,而在自动驾驶、疾病诊断等行业属性非常强的领域,更依赖于对大模型架构和工具链的复用,去重新构建领域模型,或者利用大模型迁移学习完成特定下游任务。随着具身智能的研究进展,模型将更好理解和学习时序数据和空间数据,从而增强其实时响应和精准控制的能力,可以期待新一代模型在产业中的应用场景再行突破。
视角二:大部分应用以赋能为主,AI原生场景在萌芽
当前,大模型“润物无声”的应用更多还在为“降本增效、改善体验”而落地在已有业务流程上,还未涉及对既有商业模式的重构和颠覆。一方面,对原业务的赋能往往见效更快,易于投入量产;另一方面,打造真正的“AI 原生”业务模式,需要技术和商业紧密结合,而且对于用户习惯和行业规则都有冲击,难免步伐较慢。
然而,随着大模型在业务中不断渗透,量变引起质变,原有的业务流程可能将被重新定义,新型的商业模式和业务流程将应运而生。以闲鱼近期灰测的“智能托售”Agent为例,针对个人卖家普遍面临的无法实时在线回复、缺乏谈价策略等痛点,闲鱼推出了24小时全方位商品托管服务。该AI代理不仅能实时响应买家信息,还能在获悉卖家底价后,提供多轮议价与动态调价功能。这不仅提升了供需撮合效率,还可能能为平台带来了新的收入来源——基于Agent服务的溢价收益模式。
虽然此类“AI原生场景”目前占比还较小,但其潜在发展空间不容忽视。一旦技术与商业逻辑充分匹配,新型业务模式和生态必然迎来新的爆发。
视角三:民企成AI应用急行军,央企/政府需卸载顾虑和包袱
从实践情况来看,大型民营和中小企业在大模型应用落地上明显更具活力,主要原因在于组织灵活度与创新激励带来的高试错与迭代效率。一旦大模型在某个环节验证可行,尝到“甜头”,就能迅速在其他流程复制拓展,并在短时间内取得显著的降本增效效果。例如,创维集团在内容生成、编排、投放等环节都启用了AIGC,人工运营成本大幅降低80%。申通客服对话场景节省了过亿成本,而调用大模型的年成本仅百万元,有可观投入产出比。值得注意的是,不同于训练阶段的算力需求,大模型在应用阶段需要更加高性价比、高弹性、高可用的计算资源,而且随着类似OpenAI o3强推理模型的逐步应用,模型单位推理成本可能会进一步增加。在此背景下,相较于投入大额资金和时间来采购、部署基础设施,很多民企选择积极拥抱公共云平台,充分发挥公有云规模效应带来的算力普惠价值和弹性伸缩能力,以满足推理需求的增长,从而实现 AI 应用的规模化落地和快速迭代。
相比之下,央国企和政府部门在大模型应用上却较难“轻装上阵”。以前文申通物流送达场景的AI识别为例,其同政府“一网统管”中城市管理场景下的视觉识别本质上逻辑高度一致。但政府在真正落地时可能要承受更大的“顾虑与包袱”。一方面,现有的云底座需要配合国产化硬件、遵循更加严格的数据安全规则,升级成本和周期都明显高于民企;另一方面,这种看似微小却能带来“The power of 1%”的创新点,实操中往往容易被忽视,导致潜在价值无法得到充分重视。最终结果就是,原本高度通用且能带来“The power of 1%”的AI能力,在央国企或政府场景的发挥不及民营与中小企业这般“轻装上阵”。
四、结语和建议
大模型的产业化已通过“润物细无声”的渗透方式实证了其落地的现实价值。虽然目前尚未诞生所谓的“杀手级应用”,但从电商、物流、制造业等多元场景的持续渗透已足以证明:每一次微小的场景创新都有可能带来可观的增益。“The Power of 1%”告诉我们,只要敢于去试、去用,就能不断积累微小的效率提升,最后汇聚成巨大的产业变革能量。据此提出以下建议:
第一,无需纠结于“杀手级应用”何时出现,鼓励企业“多试多用”才是正道。大模型在产业应用就不应通过单一爆款来诠释其技术价值,而是通过累积性场景优化,使整体产业获得质的提升。与其为“示范应用”苦等,不如加大对企业“试用落地”的扶持力度,让更多企业和机构愿意投入数据、人才和管理资源,快速跑通关键环节并形成可复制的成熟范式。
第二,鼓励央企与政府部门灵活部署,避免一刀切私有化。考虑到央企和政府部门在数据安全与合规方面的特殊需求,建议在明确敏感数据边界的前提下,对非敏感环节或部分管理场景积极采用公有云方案,循序渐进地探索大模型应用。对于内部流程管理与公共服务领域的小幅度效率提升,也应予以足够重视,力戒“善小则不为”的误区。
第三,从“算力补贴”向“应用补贴”转变。AI大模型正处于“智能涌现”到“应用涌现”发展的关键阶段。当前最需要的是在广泛实践中不断总结Know-How,加速规模化复制。因此可考虑对大模型产业应用按“模型调用量”等方式发放补贴与政策支持,激励各行业有针对性地进行场景打磨,助推产业整体向前迈进。
版块介绍 —产业之声
紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。
Reading
1、
2、
3、
4、
5、
6、
7、
8、
9、
10、
11、
12、
13、
14、
15、
16、
17、
18、
19、
20、
21、
22、
23、
24、
25、
26、
28、
29、