2025年3月24日,彭博社援引知情人士消息称,蚂蚁集团正通过阿里巴巴、华为等国产芯片,结合混合专家(MoE)机器学习技术,降低AI大模型训练成本约20%,且训练效果与英伟达H800芯片相当。
尽管蚂蚁集团未直接官宣,但其技术论文及行业动态已引发广泛讨论。
据披露,蚂蚁集团自研的MoE架构将任务拆解为细分领域,类似“专家团队协作”,通过算法优化提升低性能芯片的利用率。其开源模型“Ling-Plus”(参数规模2900亿)在国产芯片上训练1万亿Token的成本为508万元,较传统高性能设备(635万元)降低20%。
论文显示,该模型性能对标阿里通义Qwen2.5-72B、DeepSeek-V2.5等国际主流模型,并在部分基准测试中超过Meta同类产品。
这一技术方向与英伟达“依赖高端硬件堆砌”的策略形成鲜明对比。英伟达CEO黄仁勋曾强调“算力需求持续增长”,而蚂蚁的研究则试图证明,通过算法创新可在资源受限环境下实现高效训练,为中小企业降低技术门槛。
蚂蚁集团的尝试并非孤例。此前,科大讯飞与华为合作,在昇腾国产算力集群上实现MoE模型跨节点推理,效率提升200%;阿里、华为等企业亦在加码国产芯片研发。
值得关注的是,蚂蚁开源“Ling-Lite”与“Ling-Plus”两大模型,或推动技术普惠——中小企业可借此以更低成本参与AI创新。
资本市场对此反应积极。2024年9月以来,港股科技板块AI相关指数涨幅超77%,中芯国际、小米等国产芯片链企业股价持续攀升。分析认为,国产替代的可行性正被逐步验证,而成本优势或成全球AI竞赛的“新变量”。
针对外媒报道,蚂蚁集团回应称“针对不同芯片持续调优以降低成本,目前取得一定进展,将逐步开源分享”,未直接证实成本降幅。
知情人士透露,蚂蚁集团仍保留部分英伟达芯片用于开发,但主要依赖AMD及国产芯片进行模型训练。
这一技术路线面临双重挑战:一是国产芯片性能的稳定性仍需验证;二是国际供应链波动可能影响长期规划。不过,蚂蚁集团论文中“每一个FLOP都至关重要”的核心理念,凸显出中国科技企业对资源效率的极致追求。
尽管蚂蚁集团的技术突破尚未完全脱离国际供应链,但其探索为中国AI产业提供了新思路——通过算法创新弥补硬件差距,或将成为应对地缘政治风险的关键。正如中国发展高层论坛嘉宾所言,中国创新正不断给世界带来惊喜。
