你使用大模型频率高吗?如果说前两年,大模型对你而言还只是一个陌生概念,那么到了此刻,它或许已深度融入日常生活与工作之中。
追溯大模型这个词的“出圈”,需将时间倒回至2022年11月底ChatGPT的发布,其一经问世,便在科技领域掀起惊涛骇浪。国内大模型也是自那时起开始崭露头角。
在两年多的时间里,大模型领域风起云涌,成为人工智能企业、相关厂商以及社会各界热议的热门话题。
本期,中国城市报记者盘点一年来大模型产生的变化,并通过相关采访分析,探讨接下来大模型又将如何影响和改变你我的生活。
从技术突破到多领域应用
什么是大模型?
“模型即算法,大模型则是由多个算法组成,通过海量数据的训练和调参来实现预期效果。”浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林此前在接受中国城市报记者采访时表示。
简单来说,大模型就如同一个“超级大脑”,它通过学习并记忆大量信息,能够理解并解答各类问题。这个 “大脑” 越大,所能处理的问题就越复杂,给出的答案也就越准确。
中国城市报记者了解到,大模型的火爆主要得益于算法和算力的突破,使得其在不同领域的应用不断涌现出突破性成果,并开始探索商业化的可行性。
“在传统AI时代,一个场景对应一个模型,存在模型参数量小、泛化性差、模型维护困难以及行业人才短缺等问题。”北大纵横管理咨询集团高级副总裁孙连才在接受中国城市报记者采访时表示,而在过去10年里,AI算法的算力需求提升了40万倍,模型复杂度持续提高。
深度科技研究院院长张孝荣在接受中国城市报记者采访时表示,与以往常提及的大数据和云计算不同,大模型更注重通过训练和学习海量数据以获得更准确的结果和智能决策,而云计算主要聚焦于计算能力的提供和大数据的存储。
大模型刚出现时,许多人怀疑它不过是短暂的热潮。然而,随着时间的推移,其展现出的强大影响力和持续发展的态势已逐渐清晰。
科技领域爱好者张先生向中国城市报记者表示,大模型已不断深入各个领域。例如在医疗行业,它可以辅助医生进行疾病诊断、制定治疗方案;在教育领域,能为学生提供个性化学习建议和作业辅导;在金融领域,可用于风险评估和投资决策。
在今年4月召开的中关村论坛上,创新工场董事长兼零一万物CEO李开复表示:“两年前,AI大模型的水平大概能达到普通人的水准,也就是在100个问题中能够答对34个。经过两年的发展,如今最好的大模型可以答对90%的问题。可以想象,再过两年,AI大模型将有巨大的发展机会。”
产业格局呈现马太效应
去年年末,中国城市报记者在采访几家头部科技企业关于大模型的投入情况时,这些企业都提到未来的发力方向是以应用为核心,致力于实现生态繁荣的愿景。
回顾过去这一年,大模型行业技术和产品频频迭代,从语言大模型到文生视频大模型,再到3D生成大模型,几乎每隔几个月便会有令人眼前一亮的大模型出现。
今年8月底至9月,国产视频生成大模型迎来新一轮爆发。MiniMax正式发布视频模型video-01,阿里云在云栖大会上发布通义万相全新视频生成模型,美图公司宣布奇想大模型(MiracleVision)完成视频生成能力的升级。
12月初,腾讯混元大模型正式上线视频生成能力。目前生成的视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。另一边,有消息称,月之暗面旗下的Kimi正在内测AI视频生成功能“Kimi 创作空间”,可通过12种预设风格模板和自定义创作功能,为用户制作个性化音乐视频。
12月18日,在“2024火山引擎FORCE原动力大会・冬”上,火山引擎带来豆包大模型家族全新升级。在大会上,豆包发布了视觉理解模型,具备更强的内容识别、理解和推理以及视觉描述等能力。
中关村物联网产业联盟副秘书长袁帅在接受中国城市报记者采访时表示,2024年,大模型行业在技术层面,展现出强大的推理能力和多模态生成能力,推动了智力即服务(IQaaS)模式的兴起;同时,AI 硬件市场也实现了快速增长,为大模型的发展提供了强有力的支撑;在应用方面,大模型已广泛应用于电商、影视、传媒等多个领域,并开始在工业、医疗、金融等行业发挥重要作用,展现出对传统产业改造提升的巨大潜力。
有业内人士分析,经过“百模大战”,基础大模型已经“去芜存菁”,只有约10%的具有市场活力、用户活跃度高的大模型脱颖而出,进入到了“决赛圈”。
对此,北京市社会科学院副研究员王鹏表示认同:“国内外的大模型产业格局均呈现出鲜明的马太效应,头部企业和创新企业成为主要竞争者。”
商业化落地加速
大模型的研发和运营成本一直都是天文数字。从前期的海量数据采集、清洗与标注,到中期的模型架构设计、复杂的算法研发,再到后期的大规模训练与优化,每一个环节都需要投入巨额资金。
据媒体报道,OpenAI今年运营总成本可能达到85亿美元。其中,推理和训练成本分别高达40亿和30亿美元。然而,OpenAI全年收入预估可能在35亿美元到45亿美元之间,远低于运营成本。
为了抓住人工智能的发展机遇,国内科技巨头也持续投入“真金白银”。但一个显著的变化是,如果说2023年各家科技企业都在专注于打磨模型参数、提升模型性能、角逐榜单排名等方面,那么到了2024年,越来越多的企业变得更加务实,开始更加关注落地场景和商业化。
有分析认为,随着大模型C端应用的持续落地,部分企业并非直接通过大模型收费方式实现商业变现,而是将通过侧面驱动行业换机潮来实现商业闭环。
袁帅研判,接下来,大模型或将在游戏、工业制造、人机交互等领域率先取得重大突破并形成较为成熟的商业模式。
中国信息通信研究院院长余晓晖表示,从近期来看,大模型已在日常办公、文本创作、图像视频生成等领域展现出较大的发展潜力和应用价值。从中长期看,大模型将与制造、生物医药、能源、交通等实体经济领域深度融合,不断提升创新效率、拓展应用领域、提高生产效能,成为各行业转型升级的基础赋能工具,带动更大范围更高水平的创新进步。
“大模型或将进一步影响和改变人们日常生活中的各个方面。”袁帅举例表示,通过优化端侧模型,移动设备上的AI应用将变得更加高效和智能;多模态大模型将赋予机器情感价值,打开人机陪伴市场;同时,大模型还有望在医疗、教育等领域发挥更大作用,为用户提供个性化、智能化的服务。这些变化将使人们的生活更加便捷、高效和丰富。
■中国城市报记者 郑新钰