文 | 科技旋涡
当地时间10月10日,AMD召开Advancing AI 2024大会,在会上,AMD发布了全新一代 Ryzen CPU、Instinct AI 计算卡、EPYC AI 芯片等一系列产品,交出了在AI时代的又一份答卷。
AMD CEO苏姿丰表示:“我们相信高性能计算是现代世界的基本组成部分,我们在使用技术解决世界上最重要的挑战,无论是云、医疗保健、工业、汽车、PC还是游戏。”
在AMD多个系列新品发布的背景下,让我们对未来的芯片市场竞争更加有兴趣,那么,AMD距离英伟达还有多远的距离呢?他们在AI时代又有怎样的愿景呢?
新品频发,AMD布局全平台
在今年6月,AMD正式带来了锐龙AI 300系列处理器,除了采用全新的命名之外,首次引入Zen 5 CPU架构、RDNA 3.5 GPU架构和XDNA 2 NPU架构,并搭载于笔记本新品上,其卓越性能和出色能效表现令人印象深刻。
而在10日的大会上,AMD再次推出了面向商用产品的锐龙AI PRO 300系列处理器,包含一款锐龙7和两款锐龙9新品,总计3个型号。3款处理器均搭载Ryzen AI技术,包括AMD Zen 5 CPU架构、RDNA 3.5架构的GPU,以及XDNA 2架构的 NPU。同时,新一代AMD PRO技术的加持,让它们的性能表现、AI算力以及安全性均得到显著升级。
从规格上来看,锐龙AI PRO 300系列处理器相比上代锐龙PRO 8040 系列处理器除了上面提到的架构升级外,还提升了以下几点,如CPU核心由8核提升到最高12核,GPU计算单元由12CUs提升到16CUs,NPU算力由16TOPs 提升到50-55TOPs,高速缓存数量由24MB提升到36MB。
与英特尔Core Ultra 7 165U相比,最高版本的Ryzen AI 9 HX PRO 375可提供高达40% 的性能提升和高达14%的生产力提升。与往常一样,HX版本的TDP高达55W,面向高性能笔记本电脑,而常规处理器的TDP可以固定为低至15W。
与上代AMD Ryzen Pro 7040系列处理器相比,Ryzen AI Pro 300不仅具有显著更高的通用和图形性能,而且还支持微软的Copilot+功能,其将在11月的下一次Windows更新中推出。
在此次发布会上,AMD现场展示了与微软合作的AI PC产品的“Recall”功能,可以通过输入“寻找朋友与花朵的合照”“XX产品的价格是多少?”“去除XX照片的阴影”等提示词,迅速在PC中完成相应的操作。
科技旋涡认为,将这样一款AI PC处理器带到企业级市场,AMD补全了在企业端AI市场的最后一块拼图。对于AMD来讲,这也让他们扩展出更大的市场,同时也是他们在AI时代又一次尝试。
数据中心芯片超越英特尔
在服务器端,Zen架构已经让AMD的市场份额从2017年的零上升到2024年第二季度的34%。
按照第三方市调机构的统计,第一代Naples EPYC 7001系列诞生之时,也就是2017年的时候,AMD在服务器市场上的份额几乎为零。
加上第二代Rome EPYC 7002系列的连续积累,2020年时AMD已经收获了8%的市场,初步站稳了脚跟。
之后,随着第三代Milan EPYC 7003系列的到来,AMD迎来爆发阶段,市场份额在2022年达到了惊人的27%。
第四代EPYC更是达到了新的高度,市场份额也稳步增加,截至2024年上半年已经占到34%,也就拿下了三分之一的天下,并且已经有了超过350个OEM平台、950个云实例。
在会上,AMD揭开了其全新Zen 5架构服务器CPU系列的详细细节。第五代EPYC Turin 处理器CPU适用于企业、AI和云服务用例。
AMD已将其具有全功能Zen 5内核的标准扩展优化模型和具有密集Zen 5c内核的扩展优化模型统一为一个堆栈,该堆栈以EPYC 9005 Turin为名,与英特尔的竞争对手Xeon处理器相比,性能表现令人印象深刻。
AMD表示,192核EPYC 9965比英特尔竞争对手的旗舰产品Platinum 8952+快2.7倍,速度提升显著。在具体应用方向上,还包括视频转码速度提高4倍、HPC应用程序性能提高3.9倍、虚拟化环境中每核性能提高1.6倍。AMD 还宣布推出其新的高频5GHz EPYC 9575F,据称在用于加速AI GPU 工作负载时,它比Zen 4 EPYC型号要快28%。
另外,I/O平台连接方面,PCIe 5.0通道最多还是160条,新增了PCIe连接加密功能,并且从CXL 1.1+升级到CXL 2.0。
安全性方面,新增可信赖I/O(Trusted I/O),以及美国国家标准与技术研究院(NIST)制定的美国联邦密码模块安全标准FIPS 140-3。
科技旋涡看到,AMD EPYC芯片从第一代开始就被人们视为他们重新崛起的标志,目前发展到第五代,从性能、销量等数据来看,AMD没有辜负人们对于他的期待,而且,在市场占有率方面,他们也在无限逼近英特尔,也许超越只是时间问题了。
AI芯片能力接近英伟达
作为最受市场关注的产品,MI325X与此前上市的MI300X一样,都是基于CDNA 3架构,基本设计也类似。
所以,MI325X更多可以被视为一次中期升级,采用256GB的HBM3e内存,内存带宽最高可达6TB/秒。公司预期这款芯片将从四季度开始生产,并将在明年一季度通过合作的服务器生产商供货。
在AMD的定位中,公司的AI加速器在AI模型创建内容或进行推理的用例中更具有竞争力,而不是通过处理海量数据训练模型。部分原因在于AMD在芯片上堆砌了更多的高带宽内存,使其能够比一些英伟达芯片表现更好。
横向比较,英伟达给最新款B200芯片配置了192GB的HBM3e内存,也就是两颗B100各连接4个24GB内存芯片,不过内存带宽倒是能达到8TB/秒。
AMD掌门苏姿丰在发布会上强调:“你们能看到的是,MI325在运行Llama 3.1时,能提供比英伟达H200高出多达40%的性能。”
数据中心人工智能加速器的市场将在2028年增长至5000亿美元,而这个数字在2023年时为450亿美元。在此前的表态中,她曾预期这个市场能够在2027年达到4000亿美元。
目前在AI芯片市场,英伟达仍然保持领先优势,AMD与英特尔都在试图追赶。按照2022、2023连续两年的数据统计,英伟达在数据中心GPU市场占据了90%以上的份额,几乎垄断了这一市场。
今年年初,英伟达又发布了其最强性能产品B200,运算速度比上一代H200芯片提升将近30倍,按计划将在今年第四季度量产上市,届时又将与竞争对手拉开差距。
而AMD则在与英伟达的竞争中长期将自身看作“市场多一种的选择”。
面对与英伟达的竞争,苏姿丰接受采访时曾经表示,AI芯片市场足够大,容得下多家企业,“AMD不是必须打败英伟达才能成功”。
AMD在会上还强调了与甲骨文、谷歌、微软、Meta等厂商的合作关系。苏姿丰表示,微软、OpenAI、Meta、cohere等多个厂商的生成式AI平台已使用MI300系列驱动。Meta则透露,公司已经部署超过150万个EPYC CPU。更多的客户已经让AMD在AI时代有了更强硬的依靠,同时也让他们有更多资本开拓新的市场。
AMD在发布会上展示了其在技术创新和市场战略上的坚定决心。随着新产品的推出和市场环境的变化,AMD能否继续保持这一发展势头,成为更加强大的挑战者,甚至在未来超越英伟达和英特尔,或许AMD的野心还不止于此,他们或许也想成为那家“伟大”的公司。