近日,英伟达向OpenAI交付了全球首台DGX H200超级计算机,OpenAI的总裁兼联合创始人Greg Brockman在推特上发了一张与黄仁勋的合影,并在推文中写道:“世界上第一台NVIDIA DGX H200,由Jensen(黄仁勋)亲手交付给OpenAI,致力于‘推进人工智能、计算机和人类发展’”。

打开网易新闻 查看更多图片

从合影照片上可以看到,DGX H200超级计算机体积不小,外壳上还有手写的标语和黄仁勋亲笔签名。NVIDIA在去年年底正式推出H200和GH200产品线,以现有的Hopper架构为基础,增加了更多的内存和计算能力。其中H200配备141GB的HBM3e内存,运行速率约为6.25 Gbps,六个HBM3e堆栈为每个GPU带来4.8 TB/s的总带宽。相比于H100的SXM版本,H200的SXM版本将内存容量和总带宽分别提高了76%和43%。不过原始计算能力较H100无太大提升,只是在个别应用场景里会受益于更大的内存配置。

而GH200的AI性能则达到了1 Exaflop级别,内部包括了256个GH200 Grace Hopper芯片,芯片间共享144TB内存,并首次引入了新的NVLink Switch拓扑结构来构建整个超级计算机集群。新结构可提供比前一代系统更高的带宽,GPU-GPU和CPU-GPU的带宽分别高出10倍和7倍,互连能耗效率比竞品高出5倍。

Grace Hopper芯片则是将Hopper架构GPU和Arm架构Grace CPU结合,使用NVLink-C2C进行连接,其拥有72个Arm v9架构CPU内核和16896个FP32 CUDA核心,同时配备96GB的HBM3和512GB的LPDDR5X内存。这个组合可以让CPU和GPU在面对HPC或AI计算时更好地对工作负载进行分配,达到最佳的运行效率。