当地时间 1 月 6 日,在科技圈最瞩目的开年盛会 CES 2025 上,AI 芯片巨头英伟达重磅开场。
英伟达 CEO 黄仁勋(Jensen Huang)带来了一连串新品发布,展示了公司在从游戏显卡到生成式 AI、从个人计算到工业应用、再从虚拟世界到物理世界的全方位布局。
这家“挟芯片以令天下”的科技巨头,显然不再满足于它已经打下的算力江山:全面拥抱 AI,是它做出的选择。
当然,拥抱 AI 的前提是算力,而算力离不开显卡的支持,所以为英伟达打头阵的自然是显卡。
在发布会上,黄仁勋展示了全新的 RTX Blackwell 系列图形处理器(GPU,Graphics Processing Unit),包括 RTX 5070、5070 Ti,5080 和 5090。该系列的核心产品是 RTX 5090,它拥有 920 亿个晶体管、4000 AT TOPS、380 RT TFLOPS 和 1.8 TB/s带宽。
所有 RTX 50 系列显卡(公版)均为 PCIe Gen 5,使用 GDDR7 内存,并包含 DisplayPort 2.1b 连接器,可驱动高达 8K 和 165Hz 的显示器。
英伟达声称,得益于 DLSS 4 和 Blackwell 架构,其 50 系列旗舰显卡 RTX 5090 的性能将是 4090 的 2 倍。它拥有 32GB GDDR7 内存、1,792GB/秒的内存带宽和 21760 个 CUDA 核心。其总功率为 575 瓦,官方建议的 PSU 要求为 1000 瓦,比 4090 高出 125 瓦。
黄仁勋还展示了 RTX Blackwell GPU 的实时渲染演示,尤其是人工智能驱动的渲染。演示包括新的 RTX 神经材料(RTX Neural Materials)、RTX 神经人脸(RTX Neural Faces)、文本到动画,甚至是 DLSS 4。
“新一代 DLSS 可以生成的画面将不仅限于帧,它可以预测未来。”黄仁勋说,“我们利用 GeForce 来实现人工智能,现在人工智能正在彻底改变 GeForce。”
据介绍,英伟达的全新 RTX 神经着色器(RTX Neural Shaders)可用于压缩游戏中的纹理,而 RTX 神经人脸旨在利用生成式 AI 提高人脸质量。其下一代 DLSS 包括多帧生成,它每帧可生成最多三个额外帧,并且帧速率可比传统渲染提高 8 倍。
RTX 5090 的售价高达 1999 美元,而 RTX 5080、5070 Ti 和 5070 的售价分别为 999 美元、749 美元和 549 美元。RTX 5090 和 5080 将于 1 月 30 日上市,5070 Ti 和 5070 将于 2 月份上市。
接下来,围绕拥抱 AI 这一愿景,英伟达宣布了一系列新模型和产品。
在代理 AI 领域,英伟达推出了 Nemotron 语言模型系列,包括 Nano、Super 和 Ultra 三种规模。
“AI 正在进入一个新时代,代理 AI(Agentic AI)可以帮助人们解决复杂问题并自动执行重复性任务。”黄仁勋表示。
Nemotron 是一套开放模型系列,建立在 Llama 基础模型之上(该模型已被下载超过 6.5 亿次)。
这些模型经过了特殊优化,可以更好地执行指令跟随、对话、函数调用、编码和数学运算等任务。更重要的是,它们在保持高精度的同时,经过了优化,可以在各种英伟达加速计算资源上运行。
英伟达表示,Nemotron 模型使用其 NeMo 技术进行提取、修剪和对齐。使用这些技术,模型足够小,可以在各种计算平台上运行,同时提供高精度以及更高的模型吞吐量。
Nemotron 模型将以可下载和英伟达 NIM 微服务的形式提供,可部署在云端、数据中心、个人电脑和工作站上。
与此同时,英伟达还推出了一个名为 Cosmos 的世界基础模型(Cosmos World Foundation Model)。这是一个能够预测和生成“物理感知”视频的模型家族,借鉴了人类对世界的自然认知方式,能够生成模仿真实世界的合成数据。
除了帮助生成大型数据集外,Cosmos 还可以通过将图像从 3D 升级到真实来缩小模拟与现实之间的差距。
Cosmos 系列模型同样包含三种规模:用于低延迟和实时应用的 Nano、具有高性能基准的 Super,以及追求最高质量和精确度的 Ultra。
这些模型的参数规模从 40 亿到 140 亿不等,而且都经过了惊人规模的数据训练。据透露,训练数据量达到了 9000 万亿个 token,包含 2000 万小时的真实世界互动、环境、工业、机器人和驾驶数据。
Cosmos 世界基础模型的一大亮点是其开放性,开发者可以通过英伟达的应用程序编程接口(API,Application Programming Interface)、GitHub 以及 AI 开发平台 Hugging Face 获取这些模型。不过要注意的是,这里的开放并非严格意义上的开源,因为英伟达并未公开训练数据的细节,也没有提供从零构建模型所需的全部工具。
英伟达表示,在应用方面,Cosmos 世界基础模型展现出了强大的实力。它可以根据文本或视频帧生成“可控的、高质量”的合成数据,这对于训练机器人、无人驾驶汽车等领域的模型具有重要意义。
已经有包括 Waabi、Wayve、Foretellix 和优步在内的多家公司表示将采用该模型进行视频搜索、内容管理和自动驾驶车辆 AI 模型的构建等工作。
在个人计算领域,英伟达推出的 Project Digits 项目同样引人瞩目。
黄仁勋表示,这个项目将打造出“个人 AI 超级计算机”。它将采用该公司的 Grace Blackwell 硬件平台,将超算级别的性能浓缩进紧凑的外形中,并运行整个英伟达 AI 堆栈。
Project Digits 专为 AI 研究人员、数据科学家和学生设计,使用基于 Linux 的 DGX 操作系统。尽管其预计售价高达 3000 美元,但性能着实令人印象深刻:单台设备就能运行多达 2000 亿参数的模型,两台 Project Digits 设备连接后更可以处理 4050 亿参数的模型。
Project Digits 的核心是新推出的 GB10 Grace Blackwell 超级芯片,这款芯片是与联发科合作开发的,将英伟达 Blackwell GPU 与 20 核 Grace CPU 相结合。
每台 Project Digits 设备都配备了 128GB 内存和高达 4TB 的闪存。这款设备将于今年 5 月开始通过“英伟达顶级合作伙伴”发售。
在机器人领域,英伟达发布了 Isaac GR00T blueprint(Isaac GR00T 蓝图),以加速人形机器人的发展。考虑到人形机器人市场在未来二十年预计将达到 380 亿美元的规模,这一新动作无疑是为了抢占先机。
该蓝图提供了一套完整的解决方案,包括机器人基础模型、数据管道和仿真框架。其中的 GR00T-Teleop 工作流,允许开发者通过苹果 Vision Pro 捕捉人类动作,然后在数字孪生环境中让机器人模仿这些动作。这些动作会被记录下来作为基准数据。
接着,GR00T-Mimic 工作流会将捕获的人类示范动作扩展成更大的合成运动数据集。最后,基于英伟达 Omniverse 和 Cosmos 平台构建的 GR00T-Gen 工作流,通过领域随机化和 3D 升级技术进一步扩展这些数据集。
这些数据随后可以用于机器人策略训练,教会机器人如何在英伟达 Isaac Lab(一个用于机器人学习的开源模块化框架)中有效且安全地移动和与环境互动。波士顿动力(Boston Dynamics)等机器人公司已经开始采用 Isaac GR00T。
有了机器人模型,就不得不提数字孪生:英伟达推出了四个新的 Omniverse 蓝图用于虚拟现实和数字孪生应用,加速工业 AI 应用的开发和部署。
这些蓝图包括:用于工业环境中机器人群体开发和测试的 Mega 蓝图、用于自动驾驶车辆仿真的 AV 仿真蓝图、支持将大规模工业数字孪生流式传输到苹果 Vision Pro 的空间流蓝图,以及面向计算机辅助工程的实时数字孪生蓝图。
为了进一步推动 3D 世界构建,英伟达还推出了 USD Code 和 USD Search 微服务,开发者可以使用文本提示来生成或搜索 OpenUSD 资产。(注:OpenUSD 是通用场景描述的缩写,是一个用于在 3D 世界内进行描述、合成、仿真和协作的开放式可扩展生态系统,英伟达将其归于 Omniverse 产品线。)
配套发布的英伟达 Edify SimReady 生成式 AI 模型,则可以自动为现有的 3D 资产添加物理属性或材质等标签,将处理 1000 个 3D 对象的时间从 40 多个小时缩短到几分钟。
黄仁勋在演讲中特别强调:“物理 AI 将彻底改变价值 50 万亿美元的制造业和物流行业。所有移动的东西,从汽车和卡车到工厂和仓库,都将机器人化并由 AI 驱动。”这番话不仅展现了英伟达对未来的愿景,更凸显了其在推动 AI 技术落地方面的决心。
值得注意的是,这些技术创新并非孤立存在。例如,Cosmos 世界基础模型可以与 Omniverse 平台结合,通过其高度可控、物理准确的仿真功能,最大限度地减少世界模型常见的幻觉问题。
同样,Isaac GR00T 蓝图也可以与 Cosmos 和 Omniverse 无缝集成,形成一个完整的机器人开发生态系统。
从发布会上我们可以清楚地看到,英伟达早已不满足于“AI 芯片王者”的名号,它想要更多。
从个人开发者到大型企业,从虚拟世界到物理世界,英伟达正在试图打造一个 AI 驱动的生态系统,并在此基础上构建一个更加智能、高效、由 AI 驱动的未来。它是否能够做到,我们拭目以待。
参考资料:
https://www.nvidia.com/en-us/events/ces/
https://techcrunch.com/2025/01/06/nvidia-unveils-rtx-5090-gpu/
https://venturebeat.com/ai/nvidia-uses-genai-to-integrate-omniverse-virtual-creations-into-physical-ai-apps/
https://venturebeat.com/ai/nvidia-launches-blueprint-for-ai-agents-that-can-analyze-video/
https://venturebeat.com/ai/nvidia-unveils-isaac-gr00t-blueprint-to-accelerate-humanoid-robotics/
https://venturebeat.com/ai/nvidias-nemotron-model-families-will-advance-ai-agents/
运营/排版:何晨龙