打开网易新闻 查看更多图片
智东西作者 云鹏编辑 漠影

今天,快速发展的大模型技术正在深刻变革着千行百业。

与此同时,大模型技术本身也在快速迭代,各类新的模型不断涌现,大模型在各个垂直行业的应用愈发深入,由大模型技术衍生出的新产品不断拓展新的场景和应用。

据彭博社研究,生成式AI市场在2032年或飙至1.3万亿美元(约合人民币9.5万亿元),大模型在颠覆传统工作流程和创造全新市场机会方面展现出巨大潜力。

但新技术带来机遇的同时必然带来挑战,如今全球AI领域的竞争激烈程度已经达到新的高点,技术迭代的速度也比以往任何时候都快,大模型的更新速度从月缩短到天。

国内外大模型赛道纷纷出现“洗牌”之势。在这样的行业背景下,企业的技术创新硬实力就显得尤为关键,能否在牌桌上成为“常胜将军”,唯有凭技术说话。

近日,全球知识产权解决方案提供商Questel发布了《2024深度学习专利全景报告》,该报告对大模型、深度学习领域的全球专利申请及发展状况进行了分析,也侧面体现了AI领域各路玩家在底层技术布局方面的情况。

值得一提的是,不论是深度学习专利还是大模型专利,我们都能看到诸多中国厂商名列前茅,尤其是在深度学习专利排行中,百度以6751件专利申请量排名全球第一,甩开第二名3倍以上,可以说是“遥遥领先”了。

打开网易新闻 查看更多图片

▲全球深度学习专利企业申请人排名

在全球大模型专利方面,谷歌以283件专利申请位列第一,百度申请数量达到了278件,几乎与谷歌看齐,位列中国第一,腾讯、阿里则紧随其后。

打开网易新闻 查看更多图片

▲全球大模型专利企业申请人排名

可以说,在深度学习、大模型等关键的AI技术创新领域,中国玩家都跑在了第一梯队,甚至部分实现了领先,而百度也成为了其中的领跑选手,这对于中国AI产业的发展来说至关重要。

深入到专利之中,我们看到百度的诸多专利兼顾技术创新和产业应用价值,在2025大模型变革之年,百度无疑将继续稳坐牌桌之上。

一、拿下多个细分赛道专利布局第一,打破传统AI模型局限性

根据Questel的报告,百度大模型有关专利在搜索、虚拟助理、安全、法律、情感分析等多个细分应用领域或场景布局较多,而这些细分领域几乎都是当下产业落地的重点赛道。

在这些细分领域,百度的大模型专利申请量都已经跃居全球首位,不得不说,百度在大模型技术和应用中的综合实力十分突出。

比如搜索、虚拟助理等领域,我们在AI产业中看到的一个突出趋势就是AI智能体的涌现,而今天的智能体早已不再是传统机械问答对话的语音助手,这些智能体需要真正提供个性化的AI体验,AI要真正了解你,真正理解用户的需求,并能够快速高效地调用各类应用和服务解决用户需求。

要实现这些体验,必然离不开模型层面的技术优化。

比如百度的一项关于大模型数据生成的专利就让深度学习模型可以动态调用外部资源,包括记忆库、搜索引擎、API等,这样一来,模型就可以实时获取外部数据,进而弥补模型内化数据的不足,这打破了传统AI模型局限。

打开网易新闻 查看更多图片

▲数据生成方法示意图

具体来看,长期记忆增强技术可以引入外部记忆库,从而让模型具有长时间记忆用户历史输入和回复的能力,进而提升模型对多轮对话和长期交互的支持能力。

实时问题回答方面,模型能够调用外部搜索引擎或检索模型,实时获取外部知识和动态数据,增强生成内容的时效性和准确性。

此外,模型还可以调用外部API,比如计算器、智能家居控制等,从而具备任务执行能力,从单纯的对话生成转向任务型AI助手。

多轮对话与逻辑推理方面,模型可以通过扩展知识来源和灵活调用组件,提升生成内容的准确性、上下文相关性、丰富性,从而更好地符合用户的需求。

不难看出,专利中的这些模型能力改进都十分有针对性,可以很好地改善一些常见于搜索、虚拟助理领域的对应痛点问题,包括智能客服、AI智能体、AI教育、AI医疗等场景。

比如在当下火爆的AI智能体应用方面,这一专利技术可以真正让AI具备长期记忆,进而更好的“记住用户”,成为真正万事通、贴心大管家。

当你让AI给你推荐过几首歌后,过段时间你可以直接跟AI说,给我再推荐一些跟上次曲风差不多的歌,模型就可以通过调用外部记忆库,查找曾经给我们推荐的歌曲,并生成针对性的回复,而不需要我们在重新提供听歌喜好等信息。

这种技术用在智能客服方面也可以显著改善体验,模型可以通过外部记忆库了解我们的订单信息、各类冗长的数字号码,从而省去我们每次都要重新提交这些繁琐信息的步骤,让沟通变得更加高效。

可以说,这类专利技术显著提升了AI大模型在各种对话类场景应用中体验的连贯性,让AI变得有记忆,更有温度。

二、深厚专利布局落到实处:文心大模型日均调用15亿次

在深度学习和大模型领域,百度类似的专利申请还有很多,其显著特点之一就是有很高的产业化、商业化价值,是真正解决行业痛点的技术创新,而非单纯的秀肌肉。

百度研发的基于图片的检索增强技术iRAG显著降低了图片生成的幻觉问题,让图片生成应用的体验迈上一个新台阶;百度在世界大会上展示的“秒哒”让不会写程序的素人具备程序员的能力,与全球主流的代码辅助生成形成鲜明的对比。

从Questel这份报告中我们能看出,百度作为在深度学习和大模型领域跑在最前列的企业,其技术和生态都给AI产业的发展带来了诸多推动作用,成为全球行业智能化升级的主要推手之一,不论对于消费者还是企业,都是如此。

据统计,截至2024年11月,百度的文心大模型日均调用量超过了15亿次,相比一年前增长了30倍。文心大模型日均处理的Tokens文本也超过了1.7万亿,文心一言的用户规模达到4.3亿。

打开网易新闻 查看更多图片

另一边,百度飞桨文心开发者数量超过了1808万,百度基于自身的技术能力储备,可以给不同应用场景“定制”基础模型,扩大轻量级模型产品组合。

目前服务的企业数量也已经超过了43万家,共创建了101万个模型。这些模型都在这些企业各自的细分赛道业务中发挥着重要作用。

三、创企洗牌求存,AI大模型产业激变在即,巨头挑梁冲刺超大模型

回顾2024年,展望2025年,如果说2024年是大模型比拼产业化、商业化落地的一年,那么2025年就可能是集中交卷后的“检验”之年,行业洗牌在即,各种变量交织在一起,让巨头和创企都绷紧了每一根神经。

相比之下,年轻的AI创企往往面临着更大的挑战,如果说2024年不少AI创企还在“追梦”,那么2025年的主题就更像是“求存”,如何真正的独立生存、找到属于自己的核心应用场景、拿出自己的产品、赢得市场认可,成为每个创企都要面对的难题。

在回应近期关于零一万物热点事件时,其创始人李开复就提到,今年会是大模型公司商业化的淘汰年,是中国大模型的考验年、应用爆发年,只有大厂能烧超大模型,初创公司投入超大模型预训练的性价比很低。

MiniMax创始人闫俊杰曾在2024年年中的演讲中提到,未来全球只会剩下5家大模型企业,AI圈明星投资人朱啸虎也曾说道,5年后将没有独立的大模型公司存在,原因是价格已经在成本之下,创业公司无法跟进。

国内被誉为“大模型六小龙”的企业,已经开始在大厂的夹缝中求存。

虽然说“狭路相逢勇者胜”,但在今天的AI产业中,凭一时之勇或一腔热血已经很难支撑AI企业长久的良性运行,最后比拼的仍然是硬实力,包括技术实力、人才储备、资本坚实程度,而在这些领域,以百度为代表的互联网巨头显然更有优势。

今天大模型之战愈发焦灼,算力之争、能源之争愈发紧迫,面对全球AI技术的快速发展和激烈竞争,中国AI想要在全球市场实现领先,甚至在终极AGI目标方向上取得重要突破,必然要靠大厂,创企给大厂让路,似乎已成为行业确定的趋势。

在这样的大趋势下,百度在几个关键领域都握有一手好牌。

首先就是技术的积累和创新。自2013年入局AI领域,百度近十年的累计研发投入近1700亿元,可以说是在国内AI领域走的最早的一批互联网企业。

在真金白银的研发投入下,百度文心大模型从迭代速度和实际商业化落地表现来看都是表现最突出的一批,在很多AI产业发展的关键趋势和节点上,我们都能看到百度的身影。

比如在当下AI赛道火热的智能体领域,百度文心智能体技术拿下了2024世界互联网大会领先科技奖,其在技术层面的突破带动了文心大模型能力的提升,加速了代码智能体、农民院士智能体、个人助手等应用的爆发,为社会经济发展带来了更多价值。

面向下一代模型,百度也在紧锣密鼓的布局,百度创始人兼CEO李彦宏在2024年第三季度的财报电话会上透露,百度将于2025年初发布文心大模型的新版本,巩固其在基础模型上的领先优势。

相比于其他大厂,百度在训练下一代超大模型方面也有着数据与场景的独特优势,包括搜索引擎带来的大规模中文数据、智能云积累的企业场景数据、AI原生应用产生的用户交互数据以及自动驾驶产生的大量高质量多模态数据。

可以说,从产业发展趋势、技术创新能力到全产业链生态的场景数据积累,百度都已成为中国大模型产业发展的核心变量。

结语:2025,AI井喷式增长继续,机遇挑战并存

或许正如李彦宏在全员信中所说的:今天的人工智能领域,竞争比任何时候都更加激烈,技术迭代的速度比以往任何时候都更快,我们面临的挑战也是前所未有的。

但挑战同样意味着机遇。面对海外科技巨头的压力和挑战,大模型技术的快速迭代恰恰是中国企业的机会所在,在底层技术创新领域的重点深耕,必然会给后续产业化落地应用带来优势,也有助于中国AI在全球走的更远,赢得更多话语权。

今天,AI大模型在各行各业各种场景迅速普及,AI实际渗透率越来越高,并且将在2025年继续井喷式增长,我们也期待以百度为代表的中国互联网大厂能在2025这个AI大模型的激变之年给产业带来更多惊喜。