金磊 克雷西 发自 拉斯维加斯
量子位 | 公众号 QbitAI

最强云计算、最快GPU,联手出大招了!

就在刚刚,云计算霸主亚马逊云科技英伟达宣布:

推出首款云AI超级计算机,结合了英伟达H200 Grace Hopper超级芯片和亚马逊UltraCluster扩展功能。

打开网易新闻 查看更多图片

据悉,该合作项目代号为Project Ceiba,而这个超级计算机是配备了H200 NVL32与Amazon EFA互连技术的大规模系统,将部署在亚马逊云科技之上。

它共计搭载了16384颗英伟达H200超级芯片,能够处理65 exaflops速度等级的AI运算。

为了这个合作项目,老黄也是亲自来到亚马逊云科技年度盛会re:Invent的现场站台,重视程度可见一斑。

△左:亚马逊云科技 CEO:Adam Selipsky;右:英伟达CEO:黄仁勋

打开网易新闻 查看更多图片

与此同时,亚马逊云科技也成为了英伟达H200 Grace Hopper超级芯片的第一个大客户。

而之所以两大巨头要这般合作,双方的目标也是非常明确——剑指生成式AI

亚马逊云科技CEO Adam Selipsky在现场表示:

我们与英伟达合作了13年,推出了最广泛的英伟达 GPU解决方案可用于各种工作负载,包括绘图、游戏、HPC高性能计算、机器学习,以及现在的生成式AI。
我们将会让亚马逊云科技成为运行GPU的最佳云端环境。

黄仁勋也对生成式AI与云计算发表了他的观点:

生成式AI正改变各种云端负载,为多元内容创作在底层注入加速计算动能。
我们共同目标是为每个客户提供具有成本效益、先进生成式AI,为此英伟达与亚马逊云科技在整个计算堆栈展开合作,横跨AI基础设施、加速库、基础模型以及生成式AI服务。

而这次强强联手的合作,也仅仅是亚马逊云科技 re:Invent活动中的一隅。

现在,我们就来一同看下更多的重磅发布。

亚马逊云科技升级AI芯片

除了与英伟达展开合作之外,亚马逊云科技自家的芯片也迎来了大升级。

首先便是发布了升级后的通用AI芯片——Graviton4

打开网易新闻 查看更多图片

据了解,与上一代Graviton3相比,Graviton4的计算性能提高了30%,核心数量增加了50%,内存带宽增加了75%。

打开网易新闻 查看更多图片

Graviton4带来的一个新转变之一,便是通过对所有快速物理硬件接口的全面加密,这就显著提升了它的安全性。

亚马逊云科技透露,这款芯片将被应用于内存优化型的Amazon EC2 R8g实例,帮助客户提升高性能数据库、内存缓存和大数据分析工作的效率。

而且,R8g实例的大小更大,其vCPU和内存容量比前一代的R7g实例最多增加了三倍。

搭载Graviton4的电脑预计在接下来的几个月内上市。

亚马逊云科技进一步表示:

自从大约五年前推出Graviton项目以来,他们已经生产了超过200万个Graviton处理器。
而且,亚马逊云科技 EC2的前100位用户都已经选择使用Graviton,这证明了其在市场上的受欢迎程度。

亚马逊云科技在大会中带来的第二款升级芯片,则是Trainum2

如其名,这款芯片的主要用途就是针对拥有超大参数模型的训练。

打开网易新闻 查看更多图片

相比于上一代Trainium1,Trainum2在速度上快出了4倍,同时在能效方面也有2倍的提升。

在亚马逊云科技内部,Amazon EC2 Trn2实例将采用的正是Trainium2,每个实例内置16个Trainium芯片。

这些Trn2实例的目的是为了支持客户在下一代EC2 UltraCluster中大规模扩展,最多可达10万个Trainium2芯片,通过亚马逊云科技弹性织物适配器(EFA)的petabit级网络连接,能够提供高达65 exaflops的强大计算能力。

有了这种规模,客户就可以在数周而不是数月时间内训练3000亿参数的大语言模型!

正如Claude背后公司Anthropic的联合创始人Tom Brown所述:

我们正在与亚马逊云科技密切合作,使用Trainium芯片开发我们未来的基础模型。
Trainium2将帮助我们大规模构建和训练模型,我们预计它比第一代Trainium芯片快至少4倍,适用于我们的一些关键工作负载。

据悉,Trainium2将从明年开始用于支持新的服务。

Amazon Q:亚马逊工作版ChatGPT出道

在生成式AI方面,亚马逊云科技还发布了自家工作版的ChatGPT——Amazon Q,重新构想了未来的工作方式。

Amazon Q主要面向的是企业用户,它让员工可以利用公司的数据和专业知识获得答案、解决问题。

打开网易新闻 查看更多图片

Amazon Q基于亚马逊云科技17年的知识来训练,所以很懂亚马逊云科技,于是在使用亚马逊云科技过程中,可以随时随地提供帮助。

Adam说,Amazon Q改变了开发人员在亚马逊云科技上构建、部署和操作应用程序的方式。

它可以通过提出问题来了解亚马逊云科技功能和工作原理,或者确定最佳服务。

打开网易新闻 查看更多图片

Amazon Q不仅能介绍亚马逊云科技的各项功能,还可以根据用户需求,提供利用亚马逊云科技各项服务构建应用的方法。

打开网易新闻 查看更多图片

在使用亚马逊云科技遇到问题和故障时,Amazon Q也可以一键分析原因并想办法解决。

打开网易新闻 查看更多图片

在亚马逊云科技控制台之外,Amazon Q还可以在IDE中调用,实时帮助开发者生成或解释代码,并进行测试和优化。

打开网易新闻 查看更多图片

更为精彩的是,Amazon Q可以完成从计划到代码,再到完成后的测试和用户文档的全流程自动开发

假如要给应用添加新功能,开发人员只需要用自然语言描述需求,然后检查Amazon Q给出的建议并进行必要调整就可以了。

打开网易新闻 查看更多图片

不过,开发不是一劳永逸,程序的维护和升级也至关重要。

而如果这之中涉及到了编程语言的更新迭代,开发者可能需要花费几个月甚至几年对代码进行逐行调整。

而Amazon Q的代码转换功能,将这一时间缩短到了几分钟。

开发人员只需在 IDE 中打开他们想要转换的代码,然后要求Amazon Q对其进行“/transform”即可。

最近,5名开发人员用Amazon Q在短短两天内将1000个应用从Java 8升级到Java 17,平均每个用时还不到10分钟。

打开网易新闻 查看更多图片

除了面向开发者的Builder版本, Amazon Q还有为商业从业者提供的Business版本。

可以在亚马逊QuickSight数据分析平台和亚马逊云科技 Connect中使用。

打开网易新闻 查看更多图片

将Amazon Q连接到企业系统,还能得到定制版的Q,我们还可以看到Amazon Q帮助用户分析了下游客户的需求。

打开网易新闻 查看更多图片

在此基础之上,Amazon Q更是可以直接充当使用者的客服代表,解决下游用户提出的问题。

打开网易新闻 查看更多图片

做个总结的话,Business版本的Amazon Q一共拥有四重“专家”身份:

亚马逊云科技专家,对亚马逊云科技的每一个功能、模块都有充分的了解。
生意专家,能够分析行业状况下游客户的需求。
商业智能专家,能够对大量商业数据进行分析。
客服专家,对用户企业情况充分了解,可以充当智能客服工作。

打开网易新闻 查看更多图片

价格方面,Business和Builder版本的价格分别是每用户每月20美元和25美元。

还有其它发布

与这些芯片和聊天机器人Amazon Q同时发布的,还有全新的云存储服务亚马逊云科技 S3 Express One Zone。

它的速度是标准版S3的10倍,可以在1分钟之内处理数百万次请求,请求成本和计算成本分别降低了50%和60%。

打开网易新闻 查看更多图片

工具层面,生成式AI应用搭建平台Bedrock也值得关注。

Adam将其称作最简单的利用大模型搭建和扩展生成式AI的方式。

打开网易新闻 查看更多图片

此外还有和Trainium芯片配套的ML优化SDK 亚马逊云科技 Neuron。

排行前100的ML模型中,亚马逊云科技 Neuron支持93种。

打开网易新闻 查看更多图片

按照基础设施层、工具层和应用层这三个层级进行划分,此次发布中涉及生成式AI的产品都在下面这张图里了:

打开网易新闻 查看更多图片

One More Thing

据说这届亚马逊云科技的re:Invent活动吸引了来自全球的5万多人。

来,感受一下Keynote结束后的人山人海……

打开网易新闻 查看更多图片

参考链接:
[1]https://press.aboutamazon.com/2023/11/aws-unveils-next-generation-aws-designed-chips
[2]https://press.aboutamazon.com/2023/11/aws-and-nvidia-announce-strategic-collaboration-to-offer-new-supercomputing-infrastructure-software-and-services-for-generative-ai