2024 就要结束了,AI 呈现出怎样的趋势?又给 2025 年留下了怎样的伏笔?
3 个视角维度,10 大年度趋势,在量子位智库今日重磅发布的《2024年度AI十大趋势报告》中清晰详尽地呈现。
毫无疑问,现在的我们正处于一个深受 AI 全方位变革影响的时代。
区别于其他智库和研究机构,量子位智库基于量子位对人工智能领域的长期理解把握和深厚积淀,持续跟踪领域在产学研届的创新、洗牌、动态,结合对近百家初创公司、研究院、投资机构的深度交流,从技术、产品、行业三个维度勾勒 AI 现状、展望未来走势。
报告不仅深入剖析这一前沿科技如何迭代技术能力、重塑商业版图、引领产业升级,还敏锐洞察变革趋势,对未来路径进行前瞻性展望。
该报告也得到了产学研领域众多机构的支持,不仅在趋势提名上众智,在具体技术方面,也分享了精彩判断和评论。这让报告有了更广的视角基础,以及更深的产业生态基础,特此鸣谢——
现在,把镜头聚焦 AI,年度十大趋势,一起先睹为快:
大模型创新:架构优化加速涌现,融合迭代大势所趋
Scaling Law 泛化:推理能力成皇冠明珠,倒逼计算和数据变革
AGI 探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实
AI 应用格局:第⼀轮洗牌结束,聚焦 20 赛道 5 大场景
AI 应用竞争:多领域竞速运营大于技术,AI 助手兵家必争
AI 应用增长:AI+X 赋能类产品大干快上,原生 AI 爆款难求
AI 产品趋势:多模态上马,Agent 席卷⼀切,高度个性化呼之欲出
AI 智变千行百业:左手变革生产力,右手重塑行业生态
AI 行业渗透率:数据基础决定初速度,用户需求成为加速度
AI 创投:投融资马太效应明显,国家队出手频率提升
技术视角
大模型创新:架构优化加速涌现,融合迭代大势所趋
2017 年《Attention Is All You Need》论文发表,Transformer架构问世,并逐渐成为自然语言处理领域主流技术范式。但 Transformer 并非完美无缺,产学研界也一直存在一种声音:架构领域需要新的突破,来构建强大且高效的新一代基础大模型。
谁将革新甚至颠覆 Transformer,取而代之?
2023 年以来,大量创新大模型架构涌现,尝试在保留 Transformer 优势的同时解决其算力开销太高的问题,有望在性能与效率上实现突破,对 Transformer 的绝对统治地位形成有力挑战。
类循环神经网络模型(以 RWKV 为代表)
状态空间模型(以 Mamba 为代表)
层次化卷积模型(以 UniRepLKNet 为代表)
多尺度保持机制模型(以 RetNet 为代表)
液体神经网络模型(以 LFM 为代表)
多种有代表性的技术路径,在不同程度保留 Transformer 架构优势的基础上,结合 RNN、CNN 等思想所做出的创新发展,这也使得大模型架构呈现出日益明显的混合趋势, 更多创新架构具备 " 博采众家之长 " 的特点。
Scaling Law泛化:推理能力成皇冠明珠,倒逼计算和数据变革
技术层面,另一个备受关注的重点是Scaling Law的泛化。第一代 Scaling Law 指引模型开发者们在参数量、数据集和计算量之间寻找模型性能的最优解,引发了大家对算力、数据等资源分配的思考。
量子位智库观察到,参数量与计算量的膨胀带动我国万卡集群以及高性能网络的建设和发展;同时数据耗尽危机中,合理善用合成数据成为较优选择。
此外,OpenAI o1 无疑是今年受瞩目的模型之一,在它身上体现了推理能力的大幅提升。以 o1 为代表的新 Scaling Law,促使大模型追求更高的推理能力。
横向对比 Apple Intelligence Foundation、Gemma 2、Llama 3.1、Qwen2 训练方法可以看到,后训练的比重正在不断增加,模仿学习+强化学习成为典型 AI 发展路径范式。
AGI探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实
2024 年,AI 技术在多元方向持续突破,视频生成、世界模型、具身智能和空间智能等技术推动了人类对 AGI 的探索。
视频生成方面,扩散模型在多任务中取得显著成果,已成为视频⽣成的主流技术路径。尤以DiT(Diffusion Transformer)模型最受瞩目。
在世界模型领域,研究者们致力于开发能够模拟和理解真实世界的模型,核心在于通过学习大量数据,使模型能够自然涌现新的行为和决策能力。
与世界模型密不可分的还有具身智能。今年起,具身智能逐渐从概念走向落地,玩家们纷纷推出⾃⼰的⾸款⼈形机器⼈,同时开始在灵巧⼿自由度、控制精度和感知技术上发力,持续攻克技术难题。
而空间智能,则是一个与世界模型和具身智能都紧密相关的概念。空间智能指的是机器在三维空间和时间中感知、推理和⾏动的能⼒,其野望在于将空间计算操控虚拟世界的本领和具⾝智能触达现实世界的能⼒结合起来。
产品视角
AI应用格局:第⼀轮洗牌结束,聚焦20赛道5大场景
为了更好地从数据维度观察国内产品的现状,量子位智库选取了 400 余款具有代表意义的产品进行研究。
从细分赛道来看,这 400 款产品可以具体划分为 20 个品类——AI智能助⼿、AI陪伴、AI相机、AI写作、综合类套件、AI修图、AI视频、AI教育、AI⾳乐/⾳效、AI设计、AI⽣图、AI搜索、AI图⽰、AI总结和AI翻译,各赛道已分别产生代表产品进而再细分,并呈现出不同的发展特点。
其中,AI 智能助⼿是表现最突出的 AI 原⽣类产品,也是国内⼤模型⾃研⼚商技术实⼒的最直观体现。目前来看,AI 智能助手赛道内部已经出现了明显的梯队划分,豆包取得了断层式领先。
AI 陪伴虽然广受关注,但目前整体增长乏力,星野、猫箱等 Top 产品和 Killer APP 之间仍有相当距离。
AI 搜索则已经成为新的业务布局重点,既包括秘塔 AI 搜索等原生 AI 搜索,也包括类似纳米搜索、夸克浏览器的 AI 加强搜索和知乎直达、小红书达芬奇等业务 AI 搜索。
如果以具体使用场景划分,可以分为:重在整体效率提升的全使⽤场景、整体数据表现最优的⼯作提效、2025 年有望显著突破的创意⽣成、面临严峻合规挑战的休闲娱乐和⽇常⽣活等。
AI应用竞争:多领域竞速运营大于技术,AI助手兵家必争
为了更好地还原国内 AI 产品的现状,量子位智库从用户规模、新增速度、用户活跃和用户粘性四⼤⻆度进行了数据统计。
目前,APP 端和 Web 端均尚未出现比肩互联⽹时代现象级破圈之作的产品,且整体来看和海外同类型产品相差 5 倍以上。
在 APP 端,⽬前还没有产品能够拿出全维度的亮眼表现,市场缺乏诞生杀手级产品的场景。
截⾄ 2024 年 10 ⽉,共 56 款产品的历史下载量超百万,8 款产品历史下载量超千万,夸克和豆包的历史总下载量已过亿。
而从单月新增来看,夸克、豆包和 Kimi 智能助手月增长可达到千万级,10 款产品可达百万级;DAU 方面,夸克 DAU 超过 2600 万,豆包、Kimi、天天跳绳和文小言 DAU 超百万;用户粘性方面,夸克和叨叨三日留存率超过 30%。
在 Web 端,AI 智能助⼿赛道外的所有赛道都基本处于停滞状态,AI 搜索、AI 写作、AI ⽣图等赛道甚⾄出现了头部产品数据下滑、或是下滑后回升乏力的情况。
用户规模方面,月总访问量超千万的共 7 款产品,包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。
而在用户活跃度上,共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万,19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次,13 款产品平均访问时长超过 10 分钟。
在数据统计基础上,「量子位智库 AI 100」通过综合 100 和原生 100 两张榜单提名了国内优秀的 AI 产品。
AI应用增长:AI+X赋能类产品大干快上,原生AI爆款难求
当前,AI 产品可被划分为以 AI 为底层设计逻辑的AI原⽣类产品、在原有互联⽹产品上深度嵌⼊ AI 功能的AI+X产品、基于外接 API 微创新的套壳类产品和将多个产品 / 模型 API 集中拼凑的集合站类产品。
从数据来看,由于和业务流程融合得更为紧密、需求识别明确等原因,AI+X 类产品⽬前的整体数据表现显著优于 AI 原生类产品,并以办公软件和内容平台为重点布局领域。
对办公软件⽽⾔,续写、改写、命题写作等不同程度的 AI 写作功能,以及针对论⽂、⼩说等不同题材的 AI 总结功能基本成为标配。
其中,主要业务为提供模板及参考内容的素材库类产品和编辑器形态的办公软件表现更为突出,代表产品为百度⽂库和 WPS AI。由于 AI ⽣成效果会直接影响产品的核⼼使⽤体验,此类产品相对更强调具体功能的精准度。
而在内容平台中,AIGC ⼤多从三个⽅向共同发⼒:基于平台内容的 AI 搜索、⽤于带动 UGC 的 AI ⽣成功能及模板,还有⻔槛进⼀步降低的内容创作⼯具。
基于此,量子位智库对 AI 原生类产品提出了场景融合、简化用户体验、品牌信任和推广三大建议。
AI产品趋势:多模态上马,Agent席卷⼀切,高度个性化呼之欲出
随着⼤模型对图像和视频信息的处理能⼒快速提升,预计 2025 年将开始出现更为 ** 综合性 ** 的多模态交互,AI 能够通过物联⽹、特定信息等多种感知通道进⾏协同。
多模态输⼊和输出使 AI 交互性更强、交互频次更⾼,适⽤场景也更加丰富,AI 产品整体⽔平显著提升。
Agent作为融合感知、分析、决策和执⾏能⼒的智能体,能够根据⽤户历史⾏为和偏好,主动提供建议、提醒并个性化执⾏能⼒,为⽤户提供⾼度个性化的任务。其交互的主动性和⾃动化远超现有工具。
从技术和配套设施两⽅⾯发展来看,从 2025 年开始,AI Agent 即将⼴泛投⼊使⽤。量⼦位智库认为,AI Agent 有望带来独属于 AI 2.0 时代的交互⽅式、产品形态和商业模式。
从个性化推荐到直接⽣成个性化内容,AIGC 能够使⽤户体验的个性化程度有明显提升,这将帮助产品进⼀步完善⽤户体验,并通过提⾼⽤户忠诚度和迁移成本,实现差异化定价和进⼀步的服务增值,对产品的差异化竞争有重⼤意义。
⽬前,基于 AIGC 的⾼度个性化已经在 AI 教育(个性化题库及教学安排)、AI 陪伴(AI 个⼈助理及虚拟伙伴)、AI 营销(商品个性化推荐、营销内容个性化⽣成)领域有明显进展。在硬件端搭载的多款 AI 智能助⼿也已开始以⾼度个性的个⼈助理作为宣传重点。
行业视角
AI智变千行百业:左手变革生产力,右手重塑行业生态
过去的一年里,量子位智库发布多篇深度报告,持续追踪 AI 技术在千行百业的落地情况及发展潜力。
当前,AI 在行业应用中呈现AI+和AI原生两大情境。
在 AI+ 情境中,AI 多以生产力工具角色出现,渗透行业各环节;在 AI 原生情境中,行业则从⼀开始就基于 AI 技术发展。
量子位智库在《2024 年度 AI 十大趋势报告》中分析了 AI 在智能驾驶、具身智能、智能硬件、游戏、影视、营销、教育、医疗8 个场景的落地效果和行业特点。
总而言之,AI 对行业的变革和渗透值得高度关注,但仅有先后早晚、程度轻重之分,而没有有无之争。
AI行业渗透率:数据基础决定初速度,用户需求成为加速度
报告中,量子位智库将 AI 渗透行业的关键归纳为3类情景、9大因素,以解码行业发展背后不变的规律。
以下图所示的 8 个代表行业为例:
从 AI 行业影响力图谱可以看出,当前阶段,AI 对各行业的渗透及引发的变革,呈现出较为清晰的三个生态位:
第一梯队中的智能驾驶和具身智能行业对 AI 技术具有紧密需求和强伴生性,显示出强关联。
第二梯队包括营销、游戏行业、影视行业和智能硬件。前三者通过 AI 技术实现生产降本增效、深度整合工作流;智能硬件行业有望通过 AI 技术推动行业升级。
第三梯队涵盖了教育和医疗基础行业。这些行业在政策支持下积极拥抱 AI 技术,同时对安全可控性有更高要求。
总体而言,AI 技术在不同行业的渗透和变革力受到多种因素的影响,其中,行业的 ** 数据基础 ** 和 ** 用户需求 ** 或成关键因素。
AI创投:投融资马太效应明显,国家队出手频率提升
回顾 2024 年,放眼世界,AI仍旧是最强吸金赛道。
据统计,国内 AI 行业融资总金额增加,但事件数同比下降,反应了机构更加谨慎的理性态度;同时马太效应越发明显,资本更青睐热点赛道和高成熟度赛道。
在各细分赛道中,智能驾驶独占鳌头,投资事件数量和金额总数远超其他赛道,且多家企业的成功 IPO 为市场注入了巨大信心与活力。
AI+ 教育、AI+ 游戏、AI+ 医疗等赛道也迎来了投资总额的增长,调研统计结果显示,机构对技术难度更高、壁垒更强、更晚达到 TPF(Technology-Product Fit)的赛道展现出更强兴趣。
在政策方面,由于政府对 AI 技术本身及其在各行业落地的长期关注,尤其积极推进 AI 原生行业发展,北京、上海、武汉等城市已经出台一系列政策,吸引 AI 相关的人才聚集与企业落地。同时,国家队的频繁出手投资体现出政策的鼓励与支持。
获取完整报告
量子位智库长期从科研、投资、创业、转化等不同角度,长期陪伴大家一同经历前沿科技变革的时代。
通过《2024 年度 AI 十大趋势报告》,量子位智库期待能够为构建 AI 及相关产业体系化认知的提供有力参考。
完整报告下载链接:
https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?from=from_copylink