打开网易新闻 查看更多图片

当地时间2025年1月6日下午,英伟达CEO黄仁勋在美国拉斯维加斯进行了CES 2025媒体日的最后一场主题演讲。在活动中,黄仁勋发布了包括RTX 50系列显卡、AI基础模型、NIM微服务等一系列新产品与新技术。除此之外,黄仁勋也在现场带来了英伟达的“One More Thing”——搭载Grace Blackwell芯片的NVIDIA Project Digits桌面AI超级计算机。

打开网易新闻 查看更多图片

图片来源:雷科技

作为CES 2025报道的一部份,雷科技内容团队也亲临拉斯维加斯主题演讲现场,为大家带来一手报道。

活动伊始,身着标志性黑色皮衣的黄仁勋,先简单回顾了英伟达1993年创立后的多个重要时间节点,比如英伟达在1999年发明了GPU;2006年推出了GeForce 8800 Ultra显卡,并提出了CUDA(统一计算架构)这一概念,引领了后续的GPU算力发展。在AI领域,英伟达在十多年前就已经洞察到AI的影响力,并一路伴随着AI行业的发展。

打开网易新闻 查看更多图片

图片来源:雷科技

到了AI时代,传统基于CPU的说明式硬编码开发模式,也应该转型为基于GPU、机器学习与神经网络的AI模式。而强大的GPU,正是这一转变的起点。

就这样,在几乎没有太多转折的情况下,英伟达发布了CES 2025期间的第一波新品——全新的Blackwell架构与新一代RTX 50系显卡。

RTX 50与DLSS 4:AI赋能,“以下克上”

作为第一批产品,此次英伟达公布了RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070四款桌面平台GPU(受美国出口管制,中国市场的5090为RTX 5090D)和对应的四款移动平台GPU。桌面GPU最快于今年1月发售,移动GPU最快3月发售。

打开网易新闻 查看更多图片

以本次发布的旗舰RTX GPU——RTX 5090为例,全新的RTX Blackwell核心让RTX 5090的晶体管数量从上一代的763亿(Ada Lovelace架构)提升至920亿,AI TOPS算力达3352,是RTX 4090算力的253%。RTX 5090还配备 32GB GDDR7显存,显存带宽高达1792 GB/s,几乎是RTX 4090的两倍。

打开网易新闻 查看更多图片

图片来源:雷科技

由于美国出口管制,英伟达无法在中国市场销售RTX 5090,取而代之是RTX 5090D。和RTX 5090相比,RTX 5090D的AI TOPS算力为2375,是RTX 5090的70%,是RTX 4090D的200%。

打开网易新闻 查看更多图片

图片来源:雷科技

为了凸显RTX 50系的性能飞跃,黄仁勋也强调“RTX 5070拥有和RTX 4090相同的性能表现”。当然了,熟悉英伟达这种跨代对比的朋友应该早就猜到了,这里比的自然是特定游戏在开启DLSS之后的表现。

在RTX 50系显卡上,英伟达同步推出了最新一代的DLSS 4。简单来说,DLSS 4改用了由英伟达超级计算机训练的全新Transformer AI模型,提升了DLSS 4的渲染精度和稳定性。

另外,基于第五代Tensor Core的能力,RTX 50系列的DLSS多帧生成技术(不是RTX 40系的DLSS帧生成)也可以为每一个实际渲染帧额外生成最多3帧画面,这对游戏平均帧率有相当显著的提升。

打开网易新闻 查看更多图片

图片来源:雷科技

不过发布会上英伟达似乎没提到NVIDIA Reflex能否与DLSS多帧生成技术配合使用。关于“DLSS多帧生成是否会导致画面响应时间变长”这个问题,我们还需要等待进一步的信息补充。

打开网易新闻 查看更多图片

图片来源:雷科技

售价方面,桌面显卡中,RTX 5090美国定价1999美元、RTX5090D中国定价人民币16499元。

Project DIGITS:AI计算的新起点

除了面向游戏玩家等终端消费者的RTX 50系产品,黄仁勋还在现场发布了基于Blackwell架构的NVLink72高速互联技术产品。我知道大家对NVLink72都非常陌生,这里我尝试用简单的例子给大家讲解一下。

简单来说,大型计算设备往往会用多块GPU,而要做的第一件事就是让多块GPU之间能互相连通。但常规通道的带宽难以应对多块GPU之间的高速数据吞吐。而NVLink技术,允许GPU之间点对点通信,不需要经过本身就繁忙的PCIe总线。

打开网易新闻 查看更多图片

图片来源:雷科技

而Blackwell架构下的NVLink 72,内置了18个NVLink交换机、“缝合”了72颗Blackwell GPU核心,将TF FP4性能提升至惊人的1.4 ExaFLOPS,内存容量也来到了14TB。

为了直观展示NVLink 72的“壮观”设计,黄仁勋甚至在台上“举盾”表演,恰到好处的背景音乐也逗乐了现场观众,带动了现场气氛。

但这还算不上是英伟达此次主题演讲的高光时刻。

在主题演讲快结束时,黄仁勋提到了英伟达的第一台AI超级计算机DGX-1。根据黄仁勋现场回忆,他们当时把这台DGX-1送给了OpenAI,而OpenAI确实也不负众望,成为了如今AI发展的代表。

打开网易新闻 查看更多图片

图片来源:英伟达

但在2025年,AI已经成为了科技发展的主战场。像DGX-1这种昂贵、庞大的AI超算,从某种程度上其实也阻碍了AI的进步。对此,英伟达决定重新打造一款人人都能用上的AI超算。而最终得到的,就是这款名为Project Digits的桌面AI超级计算机。

打开网易新闻 查看更多图片

图片来源:雷科技

核心方面,Project Digits搭载的GB10超级芯片由Blackwell CPU和Grace CPU组成,其中Grace CPU包含20个ARM核心。此外,Project Digits也配备了128GB LPDDR5X内存和4TB SSD。值得一提的是,Project Digits除了可以单独使用,还可以两个单元叠加使用,叠加状态下甚至可以运行超过4000亿参的模型。

根据英伟达介绍,Project Digits定价3000美元,最快5月上市。

NVIDIA Cosmo:推动AI训练进入新时代?

除了硬件外,英伟达在主题演讲中还推出了多项“软创新”,而其中重点当属世界基础模型平台——NVIDIA Cosmo。

简单来说,Cosmo是一个可以模拟现实物理的模型平台。基于Cosmo背后2000万小时视频训练,开发者可以利用英伟达Omniverse创建虚拟的三维场景,再由Cosmo生成如同高度拟真的训练场景,以便开发者训练自己的模型。

打开网易新闻 查看更多图片

图片来源:雷科技

以如今相当常见的自动驾驶训练为例,“Omniverse-Cosmo”的流程可以在短时间内打造多种复杂的多视角训练材料。同时开发者也可以随时对训练素材进行调整,比如加入雨天、封路、低能见度等环境因素。

打开网易新闻 查看更多图片

图片来源:雷科技

值得一提的是,Cosmo本身已经学习了大量现实中已经存在的事件,但如果生成的训练素材不符合实际需要,开发者甚至可以通过Prompt提示词的方式,直接生成想要的训练场景,比如“在能见度极低的大雨天有行人突然横穿车道”。

从此次发布的产品来看,英伟达在AI领域的进度已经甩掉同行一大截,而在CUDA、Tensor的“封锁下”,英伟达还将继续引领高算力AI平台,乃至整个AI行业的发展,成为AI产业名副其实的“柱石”。

打开网易新闻 查看更多图片

图片来源:英伟达

与此同时,Project Digits的出现也代表着传统AI PC行业将迎来“算力节点”的冲击,这对如今AI PC、AI手机等品类中“滥竽充数”的现象也将起到一定的净化作用。长期来看,这将提高AI产品的准入门槛,同时推动整个行业向更好发展。

但如果你对刚刚提到的这些AI技术完全不感兴趣,其实也没关系。对于你我这样的游戏玩家来说,光是“549美元的RTX 5070帧率比得上4090”这个好消息,就已经足够了。

25年1月7日,CES(国际消费电子展) 2025 即将盛大开幕,雷科技报道团已飞赴美国现场整备,届时我们将对CES展开全程专业报道,敬请关注。

打开网易新闻 查看更多图片