人工智能的快速发展正在消耗大量能源,而我们对其具体影响的规模如今有了更清晰的了解。
哈佛大学 T.H. Chan 公共卫生学院与 UCLA Fielding 公共卫生学院的研究团队发表了一篇新论文,分析了美国 2,132 个数据中心的运作情况(覆盖全国 78% 的此类设施)。这些数据中心是人工智能模型训练的核心场所。每当我们通过 ChatGPT 等工具发出请求时,这些设施会被激活。数据中心不仅需要大量能源来驱动服务器,还需要维持设备冷却,进一步增加了能耗。
自 2018 年以来,美国数据中心的碳排放量已增长三倍。截至 2024 年 8 月,这些设施共排放了 1.05 亿吨二氧化碳,占全国碳排放总量的 2.18%。相比之下,美国国内商用航空业的年碳排放量为 1.31 亿公吨。同一时期,数据中心还消耗了全国约 4.59% 的总能源,这一比例较 2018 年翻了一倍。
虽然目前难以精确量化人工智能对碳排放激增的具体贡献,但自 2022 年 11 月 ChatGPT 问世以来,人工智能的使用确实显著增长。这主要是因为数据中心承载了多种任务,除了训练和调用人工智能模型,还包括托管网站、存储云端数据等。研究人员指出,随着人工智能逐步渗透到几乎所有经济领域,其在数据中心能源消耗中的占比正快速上升。
“这是一个相当显著的增长。”能源智库 Energy Innovation 的高级研究员 Eric Gimon 表示,他并未参与这项研究,但指出,“关于这种指数级增长潜力的分析令人印象深刻。不过,就提升能源效率或使用新型低能耗芯片而言,这个行业仍处于初期阶段。”
值得注意的是,这些数据中心所使用的能源来源高度依赖“污染严重”的化石燃料。由于许多数据中心位于如弗吉尼亚等产煤地区,其能源的“碳强度”比全美平均水平高出 48%。这项发表在arXiv上的论文(尚未经过同行评审)指出,美国有 95% 的数据中心设在能源污染程度高于全国平均值的地区。
论文作者之一、UCLA Fielding 公共卫生学院助理教授 Falco Bargagli-Stoffi 表示,这种现象不仅仅与数据中心选址于产煤地区有关。他指出,“全天候供应的高污染能源非常普遍,而许多数据中心为了保持 24 小时不间断运行,需要依赖这些能源。相比之下,风能或太阳能等可再生能源往往无法持续满足这种需求。”此外,政治因素、税收激励政策以及地方社区的反对意见也会影响数据中心的选址决策。
人工智能领域的一个关键转变正在加速碳排放的增长。AI 模型正从相对简单的文本生成模型(如 ChatGPT)迅速发展为复杂的图像、视频和音乐生成模型。此前,这些多模态模型大多停留在实验室研究阶段,而如今,这种情况正在发生变化。
OpenAI 于 12 月 9 日正式向公众发布了其视频生成模型 Sora。由于大量用户争相测试,该网站一度无法正常运行。类似的竞争模型,如谷歌的 Veo 和 Meta 的 Movie Gen 虽然尚未公开,但按照行业惯例,这些公司可能会很快推出相应产品。此外,音乐生成模型如 Suno 和 Udio 也在快速扩展,尽管其面临相关法律诉讼。英伟达上个月发布了自己的音频生成器,而谷歌则在开发一种名为 Astra 的 AI 视频助手,能够实时与用户周围的环境互动。
“从文本生成到图像和视频生成,数据处理的规模正以指数级增长。”论文的主要作者、比萨大学和 IMT 卢卡研究所的人工智能博士生、现为哈佛访问研究员的 Gianluca Guidi 表示。随着技术的广泛应用,碳排放量也将随之快速攀升。
研究团队的目标之一是开发更精确的方法来评估数据中心的能耗。然而,这项任务比预期复杂得多,因为相关数据分散于不同的来源和机构中。目前,研究团队已开发出一个全国数据中心碳排放量的可视化门户,希望为未来制定减少数据中心碳排放的政策提供数据支持。随着数据中心数量的激增,这一问题在未来几年将更加突出。
“环保倡导者和大型科技公司之间的矛盾只会日益加剧。”哈佛数据科学计划主任、哈佛大学教授 Francesca Dominici 表示,她也是论文的作者之一。“但我预测,未来四年内可能不会出台任何实质性的监管措施。”
https://www.technologyreview.com/2024/12/13/1108719/ais-emissions-are-about-to-skyrocket-even-further/