虽然已经两年多过去了,但我仍然清楚地记得2022年11月30日ChatGPT发布的时候,它带给国内的巨大震撼。那两天,它可以说是中国最热门的新闻了。

所有人都惊讶地第一次发现,一个软件竟然能够像人类一样和我们用自然语言流畅地进行对话。当时让人感觉美国又率先在人工智能方面领先了中国一大步。

而且这让人产生了落后的担忧和焦虑,毕竟人和机器交互方式的每一次进步,都会带来巨大的革命性改变,比如当年的计算机最开始是各种命令行界面,后来出现了不需要输入命令的图形界面,微软在1985年11月发布的Windows 1.0就长这样(图形界面),直接点击图形化的按钮就好了。

打开网易新闻 查看更多图片

再后来微软在1995年8月发布了Windows 95,有了开始菜单、任务栏和桌面图标,变成了现在的经典桌面,获得了巨大的成功。

打开网易新闻 查看更多图片

同样地,苹果手机在2007年1月发布了iPhone,把键盘变成了触摸屏输入,大大提高了手机的屏幕占比,从而开启了智能手机时代,并且颠覆了之前的大部分手机巨头。因此ChatGPT这种全新交互方式的出现,也很容易让人想起历史上这类故事,让人觉得会不会又一个属于美国的Windows,iPhone时刻要来了。

不仅如此,在ChatGPT出现之前的三个月,美国政府已经在当地时间8月26日通知英伟达对中国禁售A100和H100高端AI GPU,这意味着硬件性能方面中国已经受到了限制,中国公司已经没有办法购买高性能的英伟达硬件来训练大模型了。所以当时这种“中国在AI大模型落后,再加上硬件又被美国制裁”的局面,一度让人对中国人工智能的前景感到担忧。

但2025年的今天,我们显然已经可以暂时松口气,我说的倒不是中国的人工智能已经像六代机一样领先美国了,而是说中国追赶的速度还是令人满意的,为什么呢?我就说四点:

第一点先说硬件,在国产算力方面,华为等企业已经扛起了提供国产算力的重任。

这几年 在英伟达硬件底座可得性越来越差的情况下, 国产AI算力主要就是华为的昇腾硬件底座,其在国产硬件中份额最高。 国家层面2022年规划建设的八大算力枢纽( 京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏 ),国产算力大部分用的就是华为的昇腾,占据绝对优势。

华为不只是帮助国内电信运营商,以及各行各业头部企业自己建立算力中心。 这几年,华为云在国内也建立了三大算力中心, 为国内的企业提供人工智能应用需要的云算力。 毕竟除了行业头部企业之外,绝大部分的企业并无自建AI算力中心的能力和资金,但又需要应用AI,同时不少企业还有算力潮汐需求。 华为云这三大算力中心分别在内蒙乌兰察布、贵州贵安和安徽芜湖,而且在技术方面还各有特色。

贵安是华为云全球规模最大AI算力中心,而且能效极高,其使用液冷散热技术使得年均PUE居然只有惊人的1.1(通俗的说就是1.1度电里面有1度用来跑算力,只有0.1度浪费了)。

而 芜湖则是最新建成的,也是技术领先的算力中心,它可以说是东数西算芜湖集群首个开服的项目,标志着华为云全球存算网的枢纽节点布局全面完成。它采用最新的CloudMatrix架构,而且对长三角等发达地区时延很低,仅仅10ms时延的光纤网直达华东及中部城市,满足对实时反馈要求高的业务需求。

目前华为云的昇腾AI云服务已经能够支持业界100+的主流大模型运行,并且能够做到集群故障10分钟内恢复。

打开网易新闻 查看更多图片

实际上,华为云已经洞察到未来人工智能性能增长一定会带来更大的算力需求,因此华为云 规划研发了下一代技术 CloudMatrix。 简单来说,就是AI大模型预训练一定需要成百上千台服务器同时工作,这是一个大的集群,不能只从单个服务器节点性能来考虑,而是要从集群整体性能来考虑。

CloudMatrix技术将算力集群里面的CPU、NPU、DPU、存储和内存等资源全部互联和池化,从单体算力向矩阵算力演进,建一切可池化、一切皆对等、一切可组合的AI原生云基础设施,为企业提供澎湃的AI算力。

也就是说,算力集群里面任何一台服务器上面的CPU、NPU、存储等等,都是AI训练和推理可以调用的资源。

CloudMatrix架构还利用华为在通信技术全球领先这一点,通过超高带宽的Scale-Up网络实现从“传统以太网”向“共享总线网络”演进,把所有的硬件资源全部高速互联起来,计算集群内所有硬件资源全部实现对等连接, 再通过瑶光智能云脑对这些云上资源进行统一建模、灵活调度组合,按需提供给应用,覆盖大模型和小模型的训练和推理。

根据华为的测试,应用了CloudMatrix技术后, 盘古大模型在训练场景与传统架构相比,稠密模型可以提升20%的效率,稀疏模型可以提升60%的效率。 在推理场景性能也能提升30%。

第二点是大模型技术中国在逐渐赶上来了,而且已经丰富多彩了。

根据不同的特色,现在我可以简单地把国产大模型分为几类:

1、有拼多多类型的,例如最近这段时间火爆的是12月26日发布的DeepSeek V3开源语言大模型,它火爆倒不是因为性能大大超过了国外同行,而是同样性能下对算力的节省表现的不错;

2、还有经常出现在各种全球大模型排行榜的,比如通义千问、智谱清言等;

3、还有日常普通人用的最多的,比如字节的豆包、月之暗面的kimi、百度的文心一言之类。现在在百度搜索栏操作,就调用了文心一言大模型的AI搜索能力。2024年11月的日活使用量,豆包已经逼近900万,而在2024年大火的kimi日活也有300万了,注意这是日活,已经是很高的使用量了,而且还在迅速增长。尤其是这个豆包,aicpb网站的排名说2024年11月的MAU(月活用户)人数已经5998万了,全球仅次于ChatGPT的2.8725亿排名第二。

4、基于行业场景,作用于改变业务流,提升生产力效率的行业大模型。典型的如华为云的盘古大模型,科大讯飞的星火大模型等等,都在行业已经有不少应用。这部分虽不为大众所熟知,却是扎扎实实带来行业变革,促进经济增长的“数智引擎”。

2024年11月18日,分析机构沙利文(Frost& Sulivan)发布了《中国行业大模型市场报告,2024》,其中提到华为云的盘古大模型,在行业大模型领域取得政务、工业、金融3个市场份额第一,其中政务大模型领域盘古大模型份额占50%,工业大模型领域盘古大模型占38%,金融大模型领域盘古大模型份额为33%。

这三个行业,政务和金融都关系到国家安全和稳定,工业则是中国的根基,他们都是选择华为云盘古大模型的最多。普通消费者听说过华为云盘古大模型的人并不太多,是因为华为云对盘古大模型的定位是更多地专注于to B的产业应用领域。到2024年5月,华为云盘古大模型都已经迭代到5.0版本了。展现了让我觉得非常强大的功能,比如建筑设计师画个草图,盘古大模型就能给建筑上色,并生成360度的建筑视频,对于设计师来说节省了大量的精力和成本。

打开网易新闻 查看更多图片

再比如这个功能也实在惊艳,你拍一个视频,盘古大模型就能够自动变成动漫,而且表情和长相都还是一样,这对影视制作来说能大大提高效率。

打开网易新闻 查看更多图片

另外值得一提的是,科大讯飞的星火大模型也是基于昇腾云算力在运行。

所以你看,从2022年11月30日到今天也才两年多的时间,中国的人工智能大模型就迅速涌现,并经历了从“百模大战”到已经有头部的大模型开始脱颖而出的态势,并且他们还各有特色。虽然说这两年都在反内卷,但另一方面,进步也确实快。

第三点是中国的AI在各行各业的应用的广度和深度已经非同一般,这方面我认为已经超越美国。

当地时间12月20日,美国《华盛顿邮报》发表了对前谷歌CEO埃里克·施密特(Eric Schmidt)的专访视频。他说中美两国在人工智能领域在进行史诗般的斗争,印象最深的还是他说了以下两句话:

中国能够把人工智能技术应用到现实世界中,这是我们只能梦想的事情。”

“我认为有充分的理由相信,即使我们赢得了比赛的第一部分,中国最终也会赢得比赛,因为他们能够在批量生产中更快地应用这种技术。”

施密特在中国其实算比较有名了,就在一年多以前的2023年10月,他还很自信地说中国的人工智能落后美国,但一年多后已经开始担忧中国会最终赢得比赛了,理由是中国能把AI用起来。

人工智能在中国最让我们熟知的应用就是智能手机以及自动驾驶,现在没有自动驾驶和智能座舱功能的汽车,在中国市场已经卖不出去了,而智能化程度高,自动驾驶功能强大的汽车,比如问界M9则在2024年大定20万辆,占了中国市场售价50万人民币以上汽车销量的一半,历史上第一次在该领域超过了国外品牌。

1月8日,中国科协、清华大学和环球时报社联合发布了2024年“新质生产力产业实践示范案例”50强榜单。

打开网易新闻 查看更多图片

我看了下这些案例,发现AI在国内各行各业的应用已经非常普遍,几乎各行业的头部企业都已经进行了实质性的AI应用,我这里从这些案例里面举几个例子:

1)物流行业

顺丰的丰语大模型,这是专为物流行业设计的AI语言模型,摘要准确率超95%,已在20多个业务场景中应用。快递小哥要是有专业问题可以用手机问丰语,比如某个物品能不能寄某个国家,答案就会立刻出现,这显著提升物流服务效率和质量,而且能让新员工的工作效率接近老员工,减少出错概率,更快学习成长。再比如自动填单功能,用户在输入的时候,丰语大模型会自动猜测想填的内容,直接点一下就自动填好了,无需各种文字输入。

2)互联网行业

腾讯音乐打造MuseLight大模型推理加速引擎,能为用户个性化推荐音乐,根据歌曲的内容自动生成合适的歌单封面,还能为创作者作曲提供各种推荐和灵感,并快速地创建乐谱,大大提升创作效率;另外还可以进行音乐版权检查,版权纠纷显著下降。

3)制造行业

安徽海螺水泥集团也将大模型应用到了生产流程。水泥熟料‌是一种半成品,主要用于制造水泥。它是由石灰石、粘土和铁质原料按适当比例混合后,经过高温煅烧部分熔融并快速冷却而得到的产物。国家规定要求水泥熟料3天和28天后的强度要达标,才能用于生产水泥,很显然如果放置这么多天后才发现强度有问题,那就影响了生产。而通过大模型则可以进行3天和28天强度的预测,可以在早期就发现问题。值得一提的是,海螺的大模型开发依托的就是华为云盘古大模型。

中国应用了AI的行业远不只是以上。上海宝武钢铁热轧生产线每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,需要耗费约5天的时间。他们使用了华为云盘古大模型后,能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。盘古大模型在宝钢1880热轧生产线上线后,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。

中国的动车也大量使用了AI技术。全国每天需要检测的动车大概有3.2万节车厢,过去需要大量的巡检工人在凌晨时段去完成,耗时耗力。如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2万个项点(检查点),覆盖8大类、350多种复杂故障,极大提高了高铁运营效率,降低了成本,也减少人工在凌晨时段去巡检的艰辛作业。

能源行业的山东能源,电力行业的南方电网、国家电网等等,都已经在应用AI,像国家电网的输电线路竟然长达两百多万公里,他们已经购买了至少几万架无人机做巡检,它们通过AI视觉就可直接判断有无问题。

第四点是中国对人工智能的应用已经开始从产业应用向科学研究应用扩展,称之为AI4S(AI for Science),我认为以中国AI在产业方面应用的成功,也将在科研方面再次进行复制。

2024年的诺贝尔奖已经让全球科学家感受到了AI的冲击, 诺贝尔物理学奖给了两个构建了AI神经网络(当前AI大模型的基础技术)的科学家, 诺贝尔化学奖三个得主中的两个是因为开发了能预测蛋白质的大模型。

产业对应的是科技的应用,科研则是科技的诞生,实际上当前已经有不少中国科研领域使用人工智能的案例。 比如我在西安交通大学的官网上,发现他们讲该校第一附属医院刘冰教授团队联合华为云开展的研发项目“华为云盘古药物分子大模型辅助新靶点新类别广谱抗菌药研发”入选2023 AIIA (中国人工智能产业发展联盟)人工智能十大先锋案例。

刘冰教授主要是想解决细菌耐药性危机,因此要研发能够消灭耐药菌的抗生素,最终联合华为云,基于盘古药物分子大模型成功发现了广谱抗菌药肉桂酰菌素。

药物的研发其实比较枯燥,就是要找出具备潜在药效的小分子化合物(小分子才能进入细胞,所以通常口服药物是小分子化合物,当然也有大分子药物,通常是注射的,作用于细胞表面),但自然界各种分子实在太多了,不可能用穷举法,因此导入AI来判断和预测是个好办法。

使用盘古药物分子大模型对自然界中已存在的17亿个分子结构进行预训练, 生成了1亿全新的小分子化合物的数据库, 这些小分子具备高类药性,并且结构新颖性约达100%。

此外,盘古药物分子大模型还可以兼具小分子-蛋白结合预测、小分子的80多种属性预测、小分子优化与生成等药物研发的关键环节所需的功能,科研团队利用这些功能,进行进一步筛选,最终成功从海量的小分子化合物中筛选出了具备潜在药效的小分子。 AI极大地推动了新抗生素的研发,目前肉桂酰菌素正在稳步推进临床研究。

这并不是华为云AI在科研方面的唯一应用,像南方科技大学坪山生物医药研究院的抗流感药物研发,北京大学的基因研究,深圳海洋局的全球海洋预报,中国农科院的育种研究,都有华为云的身影。

华为云也看到了科研领域对AI的巨大需求,因此也专门打造了 AI4S平台助力科研机构一站式开发:

AI4S平台除了给各大高校和科研机构提供昇腾算力以及对应的硬件加速套件/加速库之外, 还已经针对十几个科研领域(包括生物医药,计算化学,地球科学,电磁学,流体仿真,量子力学等)适配了包括华为自研以及第三方大模型在内的80多种模型。 全国的科研用户可以实现开箱即用,还可以自己对模型进行二次开发 。 值得注意的是,这里的科研用户不仅仅是高校和科研机构,企业现在也是我国科技研究的主力军。

2023年中国科学家发表在三大顶刊CNS(《细胞》《自然》《科学》)期刊论文数量世界第二位,仅次于美国,顶尖科研成果的产出距离美国越来越近。 中国的科研领域也开始大量应用AI的话,将会像产业领域一样,在AI应用方面走在美国的前面,这将大大加速中国顶尖科技成果赶超美国的时间。

老实说,美国这些年的制裁,反而把在美国技术基础上构建的中国AI能力,从硬件底座到大模型,都彻底逼向了自主创新和研发。 而这些年我们也逐渐发现,我们在应用到行业方面的能力是如此之强,规模是如此之大,毕竟光是一个制造业,我国论增加值也已经是美国的两倍了,论产量更是对美国压倒性优势。

就拿被美国人视为命脉的汽车产业,根据国际汽车制造商组织(International Organization of Motor Vehicle Manufacturers)提供的数据显示,2023年全球汽车总产量达到了令人瞩目的9350万辆,中国产量3016万辆,美国1061万辆,中国几乎是美国的三倍,也是有史以来第一个产量突破3000万辆的国家。

科研领域也是一样,中国的科研支出在不断增长,R&D支出位居世界第二位,而且强度还不低,根据国家统计局公布, 2023年 R&D占GDP比例为2.65 % ,位居世界第12位, 甚至超过了大部分发达国家。 这意味着随着GDP总量增长,我国科研支出迟早是世界第一。

中国从产业到科研这么大规模,如果 AI 应用都构建 在美国软硬件技术基础上,那就是用中国庞大的市 场拉动 了 美 国 公司的成长 。 而在这几年美国不断加码制裁的情况下,庞大的中国本土市场,以及国内千行百业积极的拥抱和应用AI,开始显现出了对于国产算力和大模型发展的强大拉动作用,这两年国产算力和大模型已经逐渐呈现燎原之势。

封锁和制裁,对能力弱的国家是有用的,对以前中国基础非常薄弱的时候也是有用的,但对现在的中国不太管用,封锁个十年八年,你会发现中国啥都有了。