打开网易新闻 查看更多图片

新智元报道

编辑:拉燕

【新智元导读】最新500强超算名单出炉!AMD继续蝉联。

刚刚,世界上最快的500台超算名单出炉!AMD继续保持连胜,战绩斐然——500台超算中有121个系统用的都是AMD的芯片,同比增长29%。

此外,AMD自己的Frontier超算又在500强中脱颖而出,蝉联第一。

而基于相同架构的测试和开发系统也继续在Green 500榜单的能效指标中排名第二。

AMD还为Green 500榜单的前十名系统中的七个提供了芯片支持。专家表示,AMD驱动的Frontier超算仍然是地球上唯一一台完全合格的百亿亿级超级计算机。

英特尔驱动的竞品exaflop Aurora经过多年的推迟,仍未提交基准测试结果。而Frontier现在已全面投入运营了,并被研究人员用于大量科学工作,高下立判。

AMD继续领跑

Frontier在2022年6月已经以1.02exaflops的性能进入了500强榜单。而经过不断改进,现在已提高到1.194exaflops,增幅为17%。

与首次亮相时相同的8699904个CPU内核相比,这个增长幅度可以说是很大了。

对AMD来说,在500强中占据榜首位置是一个重要的里程碑,但许多其他AMD驱动的系统也名列榜首——由AMD CPU驱动的超级计算机继续占据前十名中的四个位置,而英特尔和IBM驱动的只占前十名中的两个。

AMD还为世界上最快的20个系统中的12个提供硬件支持。不过,英特尔的CPU仍然在榜单中占据主导地位,500强中,英特尔支持的系统总数高于AMD。

然而,AMD从未停止扩大占比,去年上榜的44个新超算中有21个采用的是AMD的芯片。

此外,AMD CPU在2016年还只为500强榜单上的13台超级计算机提供支持,但现在这个数字已经达到了121台,这得益于AMD更新的EPYC处理器。

与此同时,英特尔从2016年的454台的支持量减少到今天的360台,其中许多采用Xeon芯片的机器都可以追溯到近十年前了。

可见,从发展的速度和潜力上看,AMD无疑表现的更加出色。

不仅如此,Frontier在HLP-MxP基准测试中也位居世界第一。

HLP-MxP基准测试是衡量混合精度工作中HPC和AI性能的指标,AMD达到了9.95exaflops(比之前的7.9exaflops得分有所提高)。

与此同时,采用AMD技术的LUMI超算以2.2exaflops的分数位居第二。除了HLP-MxP,Frontier在HPCG基准测试中也排名第二,该基准测试比Linpack更注重系统级的性能。其HPCG-Pflops为14.05。

同时,采用AMD技术的LUMI以3.41HPCG-Pflops位居第二,而Fugaku则以16HPCG-Pflops位居榜首。

总的来看,AMD继续跻身超算500强、Green 500榜单、HPCG,以及HLP-MXP基准测试的前列。

同时,AMD在榜单中新超算的占比,也突显出AMD的CPU与I竞争对手相比具有性能优势。

专家预计,该趋势和技术占比往往会渗透到更广泛的数据中心市场,AMD的EPYC服务器芯片预计在明年的前景一片大好。

然而,由AMD Instinct MI300芯片支持的2-exaflop El Capitan 超级计算机在未来可能会从Frontier手中把第一名的位置抢过来。

Instinct MI300有多厉害?咱一起来看一看。

Instinct MI300

先来看看它长得有多帅。

打开网易新闻 查看更多图片

毫无疑问,Instinct MI300将会是一个颠覆行业的设计——APU混合了总共13个小芯片,其中许多是3D堆叠的,创建了一个具有24个Zen 4 CPU内,并融合了CDNA 3图形的芯片引擎和8堆HBM3。

总体而言,该芯片拥有1460亿个晶体管,是AMD投入生产的最大芯片。

此外,MI300拥有1460亿个晶体管,轻松超过了英特尔的1000亿个晶体管Ponte Vecchio,再加上128GB的HBM3内存,能打到爆表。

我们可以清晰地看到中心芯片侧面的八个HBM3堆栈。HBM堆栈之间是小的结构硅片,以确保在封装顶部拧紧冷却溶液时的稳定性。

该芯片的计算部分由九个5nm小芯片组成,它们是CPU或GPU内核,但AMD没有详细说明每个小芯片的使用数量。

Zen 4内核通常部署八核裸片,因此我们可以看到三个CPU裸片和六个GPU裸片。GPU芯片使用AMD的CDNA 3架构。

这九个裸片被3D堆叠在四个6nm基础裸片之上,这些裸片可以处理I/O和各种其他功能。

在另一个展示出来的MI300样品中,顶部裸片被砂带打磨机打磨过,我们就能看到四个有源中介层裸片的架构。

我们可以清楚地看到不仅可以在 I/O 块之间实现通信的结构,还可以看到与HBM3堆栈接口的内存控制器之间的通部分。

3D堆叠设计允许在CPU、GPU和内存芯片之间实现巨大的数据吞吐量,同时还允许CPU和GPU同时处理内存中的相同数据,从而节省电力、提高性能并简化编程。

AMD的发言人不愿透露更多细节,因此我们不清楚AMD是使用标准的TSV方法将上下裸片熔合在一起,还是使用更先进的混合键合方法。

AMD表示,MI300提供的AI性能是Instinct MI250的8倍,每瓦性能是Instinct MI250的五倍。

AMD还说,它可以将ChatGPT和DALL-E等超大AI模型的训练时间从几个月缩短到几周,从而节省数百万美元的电费。

当前一代的Instinct MI250为Frontier超算提供动力,这是世界上第一台百亿亿级计算机,而Instinct MI300 将为即将推出的两台exaflop El Capitan超算提供动力。

AMD告诉我们,这些halo MI300芯片价格昂贵且相对稀有,因此它们不会像EPYC Genoa数据中心CPU那样得到广泛的应用。

据悉,该芯片还将与英伟达的Grace Hopper Superchip竞争,后者在同一块板上结合了Hopper GPU和Grace CPU。

打开网易新闻 查看更多图片

基于Neoverse的Grace CPU支持Arm v9指令集,并且系统配备了两个与英伟达新品牌NVLink-C2C互连技术融合在一起的芯片。

但不管怎么说,超算芯片这一方面,AMD持续领跑。

参考资料:

https://www.tomshardware.com/news/amd-instinct-mi300-data-center-apu-pictured-up-close-15-chiplets-146-billion-transistors

https://www.tomshardware.com/news/amd-now-powers-121-of-the-worlds-fastest-supercomputers