打开网易新闻 查看更多图片

(图片来源:unsplash)

钛媒体AGI获悉,1月8日上午,北京智源人工智能研究院(以下简称“智源研究院”)发布《十大人工智能技术及应用趋势》报告,包括“具身智能”、世界模型、合成数据等全新 AI 技术趋势,以剖析科技演进轨迹。

智源研究院院长王仲远表示,当前我们处在 AI 发展的新拐点,大模型的能力涌现加速通用人工智能(AGI)时代的到来,原生统一多模态、具身智能、AI for Science,将进一步深化人工智能对世界的感知、理解与推理,连接数字世界与物理世界,驱动科学研究创新突破。智源研究院作为聚焦 AU 领域的新型研发机构,希望在这个特殊的时刻以十大趋势为出发点,为 AI 技术领域指明发展方向,携手共进。

智源研究院副院长兼总工程师林咏华在会上表示,大家都期待 AI 能够超越人类的智力,实现通用人工智能(AGI),并从数字世界走向物理世界,甚至在未来帮助我们去探索未知的领域(世界)。然而,随着AGI目标的逐步推进,实现这一目标的过程中可能会出现多种路径和方法(百花齐放),至于哪条路径能够通往终点,以及真正实现AGI还有多远的路要走,这些问题目前尚无定论。

打开网易新闻 查看更多图片

具体到智源研究院公布的2025年十大 AI 技术趋势中,趋势一是 AI for Science(AI4S)驱动科学研究范式变革。据统计,2024年,科研人员使用AI的比例快速增加,接近半数的科研人员认为,AI将对其工作领域产生积极影响,而美国和印度分别只有28%和41%。这意味着,AI对科学研究方法和流程的变革效应也开始显现。

随着诺贝尔奖物理学、化学奖都颁给了 AI 赛道,推动科学研究与 AI 技术不断结合,从聚焦优化特定任务向更复杂、更动态、更交叉的问题发展。2025年,多模态大模型将进一步融入科学研究,将赋能多维数据的复杂结构挖掘,辅助科研问题综合理解与全局分析,为生物医学、气象、材料发现、生命模拟、能源等基础与应用科学研究开辟新方向。

趋势二 “具身智能元年”,具身大小脑和本体的协同进化。2025年,“具身智能”将继续从本体扩展到具身脑的叙事主线,我们可以从三方面有更多期待。在行业格局上,国内近100家的具身初创公司或将迎来洗牌,厂商数量开始收敛;在技术路线上,端到端模型继续迭代,小脑大模型的尝试或有突破;在商业变现上,我们也必将看到更多的工业场景下的具身智能应用,部分人形机器人迎来量产。

趋势三、“下一个Token预测”:统一的多模态大模型实现更高效AI。人工智能的本质在于对人的思维的信息过程的模拟,人类对于信息的交互和处理,总是呈现多模态、跨模态的输入输出状态。当前的语言大模型、拼接式的多模态大模型,在对人类思维过程的模拟,存在天然的局限性。从训练之初就打通多模态数据,实现端到端输入和输出的原生多模态技术路线给出了多模态发展的新可能。基于此,训练阶段即对齐视觉、音频、3D等模态的数据,实现多模态的统一,构建原生多模态大模型成为多模态大模型进化的重要方向。

趋势四,Scaling Law扩展:RL(强化学习)+ LLMs,模型泛化从预训练向后训练、推理迁移。基于Scaling Law推动基础模型性能提升的训练模式“性价比”持续下降,后训练与特定场景的Scaling law不断被探索。强化学习作为发现后训练、推理阶段的Scaling Law的关键技术,也将会得到更多的应用和创新使用。

趋势五、世界模型加速发布,有望成为多模态大模型的下一阶段。据悉,世界模型具备更注重“因果”推理作用,赋予AI更高级别的认知和更符合逻辑的推理与决策能力,这种能力不仅能推动AI在自动驾驶、机器人控制及智能制造等前沿领域的深度应用,更有望突破传统的任务边界,探索人机交互的新可能。

趋势六、合成数据将成为大模型迭代与应用落地的重要催化剂。高质量数据将成为大模型进一步Scaling up的发展阻碍。合成数据已经成为基础模型厂商补充数据的首选。合成数据可以降低人工治理和标注的成本,缓解对真实数据的依赖,不再涉及数据隐私问题;提升数据的多样性,有助于提高模型处理长文本和复杂问题的能力。此外,合成数据可以缓解通用数据被大厂垄断,专有数据存在获取成本等问题,促进大模型的应用落地。

趋势七、推理优化迭代加速,成为AI Native应用落地的必要条件。大模型硬件载体从云端向手机、PC等端侧硬件渗透,在这些资源受限(AI算力、内存等)的设备上,大模型的落地应用会面临较大的推理侧的开销限制,对部署资源、用户体验、经济成本等均带来巨大挑战。算法加速和硬件优化技术持续迭代,双轮驱动加速AI Native应用落地。

在圆桌对话上,蚂蚁集团大模型对齐负责人温祖杰表示,OpenAI发布会上曾推出现实版的“Her”,你可以跟它进行实时互动,利用大模型观察你的行为动作,看周围的环境,交互更自然。多模态不止是指视频生成,其实还有图文多模态,OCR多模态等能力。比如蚂蚁集团的“探一探”,不仅通过视觉能力去拍照识图,而且还可以基于多模态能力实现多轮对话式的互动交流,这是一个更加符合真实体验的产品感知,在这些方向上可能会比较有前景。

趋势八、重塑产品应用形态,Agentic AI成为产品落地的重要模式。2025年,更通用、更自主的智能体将重塑产品应用形态,进一步深入工作与生活场景,成为大模型产品落地的重要应用形态,在2025年我们将看到更多智能化程度更高、对业务流程理解更深的多智能体系统在应用侧的落地。

智源研究院行业研究组负责人倪贤豪表示,从Chatbot到Copilot,再到Agent与Agentic AI,行业对于AI应用形态的理解越发深入。尤其是Agent到Agentci AI,其背后标志着从判断产品是否属于Agent,到探讨产品的智能化程度这一更有落地意义的转变。在未来一年时间里,未必我们能看到更多迥异的应用形态变化,也并不会出现很多完全不一样的Agent应用模式。

趋势九、AI应用热度渐起,Super App(超级应用)花落谁家犹未可知。近一年时间,生成式AI模型在图像、视频侧的处理能力得到大幅提升,叠加推理优化带来的降本,Agent/RAG框架、应用编排工具等技术的持续发展,为AI超级应用的落地积基树本。大模型应用从功能点升级,渗透到AI原生的应用构建及AI OS的生态重塑。虽然Super APP花落谁家尚未尘埃落定,但从用户规模、交互频次、停留时长等维度来看,AI应用热度持续攀升,已到应用爆发的黎明前夕。

倪贤豪表示,目前做出“超级应用”是有一定机会的。尽管移动互联网用户增速已经见顶,但我们在非网民用户群体里还是能看到规模过亿、具备消费能力但因代际原因无法便捷入网的用户。这些用户面临非现金支付、信息获取、线上买票挂号等刚需问题。对于这些问题的解决,我们未必需要Agent在智能化程度、自主性上做极致追求,基于较好的基础模型,结合以上不同能力对应的厂商接口适配(PlugIn、Tools),做出一款能满足上述用户群体需求的Agent,对于目前来说,模型和工程能力都是可行的。

倪贤豪认为,在这个逻辑下,如何对接不同厂商完成接口适配、封装,反而成为一个同样重要的问题。诸如此类的对接适配,对应的反而是对厂商渠道建设和运营能力的要求。

“因此,在All in One为标志特征的超级应用叙事里,大厂可能更有机会,以上提及的渠道建设能力,对于大厂而言相对成熟。但对于创业公司来说,这些工作需要从0到1做起,难度极大。”倪贤豪称。

趋势十、模型能力提升与风险预防并重,AI安全治理体系持续完善。作为复杂系统,大模型的Scaling带来了涌现,但复杂系统特有的涌现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了挑战。基础模型在自主决策上的持续进步带来了潜在的失控风险,如何引入新的技术监管方法,如何在人工监管上平衡行业发展和风险管控?这对参与AI的各方来说,都是一个值得持续探讨的议题。

温祖杰表示,AI安全具有显著的“对抗性”特征,这是一种此消彼长的关系。也就是说,当攻击手段增强时,防御手段也会相应提升,因此,在大型模型的安全能力方面,我们需要不断地提升攻防两端的实力,而采用“大模型对抗大模型”的方法,是一个积极的发展趋势。另外,在安全围栏技术方面,我们必须确保输入和输出的安全性,降低遭受攻击的风险,通过建立一套完整的策略系统和安全防护组合,我们可以推动AI大模型的安全应用落地。

事实上,AI 作为新质生产力的重要引擎,不仅代表了科技的前沿趋势,更是未来经济发展的关键驱动力,目前已产生明显的经济效益和社会效益。

研究机构IDC最新数据显示,随着 AI 应用持续走深向实,行业大模型在金融、医疗、教育、零售、能源等多个行业领域实现初步应用,到2025年,全球 AI 支出将达2270亿美元。预计到2030年,AI 将为全球经济贡献19.9万亿美元(约合145.9万亿元人民币),推动全球GDP增长3.5%。而目前,几乎98%的企业领导者将AI视为其组织的优先事项。

对于未来展望,多位行业专家纷纷表示,他们期望在2025年能够见证像GPT-5这样的下一代大模型的诞生,并在大模型的安全性和理论可解释性方面取得重大进展。“我不知道这是不是太美好了,但我希望有一个AI,可以跟人的学习效率差不多。”

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)