智东西
编译 徐豫
编辑 云鹏
智东西12月18日消息,今天《连线》杂志专访了英伟达创始人兼CEO黄仁勋,从新AI系统Blackwell的推理效能优势,到英伟达的AI全球战略,聊了不少这家美国GPU巨头在半导体行业的最新进展。
黄仁勋称,AI已逐步成为一种基础设施,各AI开发商正大规模“制造智能”,并以此重塑各行各业。半小时内,他提及了至少23次“基础设施”。黄仁勋调侃道他自己也用AI Agent来写演讲稿。
此次访谈中,黄仁勋还回应了本周令半导体行业震颤的两件大事,一是英特尔CEO帕特·基辛格(Pat Gelsinger)正式退休,并从董事会卸任;二是美国商务部工业与安全局(BIS)公布对华半导体出口管制措施新规,波及24种半导体制造设备、3种用于开发或生产半导体的软件工具、高带宽内存(HBM),以及超140家半导体行业上下游公司。
由于深度学习和机器学习的出现,10年间,半导体行业的底层架构技术发生了根本性的转变,GPU席卷CPU市场。在他看来,这是英特尔困境的核心原因。而台积电在全球半导体供应链中仍会长期保有优势。
根据雅虎财经的数据,截至发稿,英伟达的股价年涨167%,最新市值为3.2万亿。
▲英伟达今年股价情况,涨幅接近167%(图源:雅虎财经)
以下是此次《连线》杂志资深撰稿人劳伦·古德(Lauren Goode)与黄仁勋访谈全程内容的编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改):
一、AI硬件潮英特尔没跟上
古德:前几天英特尔CEO帕特·基辛格(Pat Gelsinger)官宣退休,但有市场传闻说他是被迫下台的。我认为,20年前没有人会想象得到英特尔走到了这一步。
你是如何确保英伟达在10年、20年之后,不会落得同样的下场?为了确保这一点,你规划了哪些实际的战略?
黄仁勋:我和基辛格已有数十年的交情了,非常感谢他和英特尔提供的合作和支持。现在我们仍选用英特尔的CPU,并与他们一起开发和推进各种各样的产品和项目。
当一个行业发生一些根本性的变化时,其力量令人难以置信。深度学习和机器学习的技术创新,让全世界从在CPU上运行编码指令,转向在GPU上探索神经网络,这种趋势并不是可以与之抗争的。你要么走上这条路,要么错过这条路,并且没有人能保证这一点。
不管CPU的性能多强,你都抵抗不了机器学习的发展势头;不管一台计算机多先进,你都抵抗不了云计算的发展势头。由于机器学习的出现,不到10年,人们建造、处理工具的方式和内容都发生了根本性的改变。因此,你要长期为这些技术革新做好准备。
别忘了,英伟达是一家从基础技术架构起步的公司,成立两年后,公司实际发展方向完全变了。我们很快认清了一个事实,那便是当时我们所建立的架构、所拥有的技术都是错误的,于是无论如何都要去做GPU,去追赶深度学习领域。后续英伟达从一家芯片公司,发展为一家系统公司,再变成了一家基础设施公司。
二、半导体行业首次大规模制造智能
古德:你有说到英伟达在全球各地都有不少合作伙伴,但身处于当前政策变动、条件严苛的商业环境,你是怎么应对的呢?
黄仁勋:正如过去60年那样,世界在变的同时,AI行业也一直在变。我们现在能够解决的问题、能够提供的产品解决方案、能够实现的能力都是不寻常的。目前,技术行业和软件行业仍有领先优势,而以这两者为基础的其他行业,将在接下来的十年内经历重大变化。
古德:这周一,美国商务部扩大了出口管制,管控范围不仅限于半导体产业。与之相关的上下游供应链也会受到一定影响,而英伟达的GPU是其中一环。在你看来,出口管制的理由是否合理,中国市场的竞争对手会如何应对?
黄仁勋:首先,我们会尽最大努力了解和告知半导体行业的动态,以及英伟达如何在全球市场运作,并向上级解释这些事情。在那之后,我们的工作仍是继续专注于创新和推动技术进步,更好地满足客户的需求。这些都在我们的控制范围内。
古德:即将上任的特朗普政府近期提到了台积电(TSMC),他认为台积电抢走了美国的部分芯片业务。英伟达与台积电长期合作,你怎么看待这件事对两家公司关系的影响呢?
黄仁勋:无论是在半导体行业,还是在全球供应链市场,台积电的重要性都是不言而喻的。因此,我们很重视与台积电的合作,也在这份合作伙伴关系中越做越好。同时,全球供应链对台积电的依赖仍会持续很长一段时间。
古德:特朗普当选新一届美国总统以来,你和他交流过吗?
黄仁勋:我已经联系了特朗普总统并向他表示祝贺。
古德:那你是否想要与他进一步讨论英伟达的业务?
黄仁勋:AI是一个很宏大的话题。它不仅是一项新技术,更是一个全新的行业。当下,我们第一次大规模制造智能。
我选择“制造”这个词的原因是,通常一个行业形成的过程中,会制造出前所未有的东西。就像计算机行业当初制造软件一样,现在AI行业是制造智能,需要能源,需要大量工厂,并且对一个国家的社会、工业、经济和技术进步有重要影响。
三、感知、推理和计划能力是衡量AI Agent的标准
古德:最近AI Agent(AI智能体)的概念走红,不过其具体的定义似乎还不算清晰。那么,你认为AI Agent是什么,能做什么,为什么有些人称它是下一波生成式AI呢?
黄仁勋:从感知AI(Perception AI)到生成式AI(Generative AI),再到AI Agent。时至今日,AI可能实际上是一个机器人、一个AI系统或者其他形态。我认为这些有关AI Agent的描述,在不同的上下文语境中有时可以互换,不过其核心是不变的,即结合感知、推理和计划能力,这也是AI的基石。
目前,AI可以基于思维链(CoT)或其他架构的推理模型,把我们抛给它的任务,拆解成多步骤完成。除此之外,AI也可以生成图像、音乐、文档等等。这些意味着,未来你可以用各种各样的方式找到解决问题的方法,甚至可以让别人代劳一部分工作。
古德:你使用了哪些AI Agent来帮助你提高工作效率,以及怎么用的,可以举例说说吗?
黄仁勋:我现在用着好几个,个人体验都不错,比如Gemini和ChatGPT。我经常用AI来写一些东西,举个例子,我会把一个初版的大纲丢给AI,再给它一些我以前演讲内容的PDF文档,然后我就可以根据AI生成的内容进一步完善我的初稿。
古德:所以你是说,我任何时候给你发电子邮件,你都会回复,但其实这都是AI Agent干的?
黄仁勋:那不是,我设置了一个邮件过滤器,如果是你发的邮件,它会显示在页面最上方。
四、新标准化推动Blackwell能效提高30倍
古德:了解到英伟达最新的产品Blackwell已经开始交付了,其中有不少大客户。你认为Blackwell最大的亮点是什么,是速度更快吗?这对下游产业有哪些影响?
黄仁勋:Blackwell正在满负荷生产,进展顺利。
Blackwell是一个完整的系统,它给训练模型的效率带来了质的提升。过去通常需要等待几个月来处理训练模型所需的数据,然后再训练模型。Blackwell可以把这个时间压缩1/3到1/4,比如本来要用6个月,现在大概仅耗时1个半月左右。随着越来越多公司武装AI能力,3个月的时间差可能就会改变游戏规则。
另外在推理方面,我们发现推理过程遵循的不是Zero-shot Learning(零样本学习)或One-shot Learning(单样本学习),而是长期思考的模式。它本质上是AI先在脑海中构思出各种不同的解法,然后用更多的算力,提供更恰当的答案。
这是一种新的标准化(scaling)方式,我们称之为测试阶段标准化(test time scaling)或推理阶段标准化(inference time scaling)。这样一来,Blackwell的推理过程可以兼顾高效和节能,能效提升了30倍。
五、全球多个国家开始布局“主权AI
古德:我们来谈谈主权AI(Sovereign AI)。
黄仁勋:一方面,当前各国都发现AI的能力超出他们想象,他们开始意识到AI对国家的重要性、数据也是国家所拥有的自然资源、数据里反映了另一个社会,并理应出手收集、处理、利用这些数据。
另一方面,AI在很多方面担任了基础设施的角色,比如能源基础设施、通信基础设施、数字智能基础设施、AI工厂、数据中心等等。与此同时,在社会、教育、大学、研究和创业等环境中,AI也扮演了十分重要的角色。
也是出于对主权AI的考虑,我今天特地待在泰国,与当地的合作伙伴一起见证一家AI云服务公司的启动。迄今为止我们已大约有56家AI创企。
古德:如果把这个生成式AI爆发的的时代,重新定义为基础设施,在你看来这对于AI模型的发展意味着什么?
黄仁勋:首先,AI作为基础设施,通常意味着社会中的不同分工都需要用到它,包括大学、研究人员、创业公司、大公司等。
其次,我认为AI将基于互联网重构一套新的操作系统,我们使用计算机的方式将会改变。过去我们通过编程语言、检索文件和管理文件等方式与计算机沟通,未来则是通过提示词直接问问题,要求它为我们做一些事情。
这一变化的关键在于,搭载多个大语言模型的AI系统代替了传统操作系统,并且各个国家都可以创建自己的大语言模型和AI系统。
这些AI系统并非依靠单一的、参数量巨大的模型,而是集成不同类型、领域的模型。其中有些擅长推理,有些用于AI工具,有些负责信息检索,还有防护措施、合成数据生成、奖励和反思等模型。
来源:《连线》The Big Interview活动