本文转自公众号:FT中文网
文: 陈钰什
图源:Getty Images、作者提供
AI模型开发的未来方向同样至关重要,因为某些方法相较于其他方法会消耗更多的能源。
陈钰什
自然之友玲珑计划三期伙伴
New Energy Nexus首席研究员,ISO可持续金融科技工作组专家,China ESG Alliance特别顾问,中国环境科学学会碳达峰碳中和专委会委员,著有《变革:元宇宙与数字经济》。
随着人工智能(AI)技术的迅猛发展,它已经成为推动经济社会发展的重要力量。与此同时,环境可持续性问题也日益凸显,成为全球关注的焦点。AI作为先进生产力,展现了其在应对环境挑战方面的巨大潜力。然而,AI的环境可持续发展并不是自动发生的,而是需要有意识地引导和管理,以避免在解决环境可持续发展问题的同时造成更多新的问题。
AI助力环境可持续的技术基础与潜力
随着电力需求的增长和脱碳努力的加强,电力系统变得越来越复杂。一方面,AI技术的应用显著提升了电力系统的效率。通过提高对供需的预测,AI技术能够将变化的可再生能源供应与电网需求相匹配,从而最大限度地提高可再生能源的经济价值,并使其更容易融入电网。例如,AI可以使用天气模型和涡轮机的位置信息来预测风力发电量。
然而,由于风流的变化,实际发电量可能会高于或低于预期,从而导致运营成本的增加。为了解决这个问题,谷歌及其人工智能子公司DeepMind在2019年开发了一个神经网络,以提高其700兆瓦可再生能源机组的预测准确性。基于历史数据,这个神经网络开发了一个模型,可以提前36小时预测未来的发电量,并且其准确度远高于之前的水平。
这种更高的可视性让谷歌能够提前出售其电力,而不是等到实时交易。这与其他由AI促进的效率措施一起,使其风力发电的财务价值提高了20% [1]。更高的价格改善了风力发电的商业案例,并可以推动对可再生能源的进一步投资。这也是谷歌推动24/7全天候无碳能源计划的基础,即到2030年,谷歌实现全部采购太阳能和风能等清洁能源,并实现小时级匹配其在全球各地运营设备的电力需求。通过更准确地预测输出峰值,像谷歌这样的公司能够调整其在计算负载高峰期的电力消耗,以与峰值消耗相吻合。这样做的结果是可以避免从市场上购买额外电力的需求。如果这种能力得到更广泛的扩展,不仅会对电网的脱碳产生积极影响,同时也将进一步促进清洁能源的生产和消费。
[1]https://blog.google/technology/ai/machine-learning-can-boost-value-wind-energy/
另一方面,AI本身也在推动着自身的能源革命。随着AI技术的发展,计算能力不断提高,而每处理单位能量消耗却显著下降。这种进步对环境可持续性具有积极意义,因为这意味着AI系统能够在消耗较少能源的情况下完成更多的任务,从而减少了对环境的压力。根据国际能源署(IEA)的数据,人工智能计算机芯片能源指数正在急速下降 [2]。
[2]https://www.iea.org/data-and-statistics/charts/efficiency-improvement-of-ai-related-computer-chips-2008-2023
在2024年的Computex贸易展上,Nvidia的联合创始人兼首席执行官黄仁勋发布的英伟达路线图也向我们展现了这种潜力。
上图清晰地揭示了两个重要趋势:一是人工智能(AI)计算能力的显著提升;二是每处理一个token(模型处理的基本数据单位)所需能量的显著下降。从2016年到2024年的八年时间里,AI计算能力经历了约1,000倍的增长。这条左侧的趋势线展示了一个指数级增长模式,显示出随着技术的进步与发展,AI的计算能力正在以前所未有的速度提升。最新的Blackwell系统能够达到20,000 TFLOPS(每秒万亿次浮点运算)的计算性能[ TFLOPS作为一个衡量计算机性能的单位,在高性能计算(HPC)和图形处理单元(GPU)的能力评估中被广泛采用。“FLOPS”(每秒浮点运算次数)这一术语中的“Tera-”前缀表示万亿,因此,1 TFLOPS意味着每秒钟可以执行一万亿次浮点运算。]
图表右侧的趋势线则展示了另一项关键进展:每处理一个token所需的能量消耗情况。自2016年以来,每token的能量需求呈现出明显的下降趋势,并且这一趋势在随后的几年中持续。根据图表中的数据,每token的能量需求在短短八年内降低了约45,000倍。这表明随着硬件与技术的进步,我们不仅能够实现更高性能,还能以更低的成本来达成这一目标。
这两条趋势线共同勾勒出一幅AI领域快速发展的生动图景。一方面,计算能力不断提升,为更复杂的人工智能任务提供了坚实的基础;另一方面,我们在提高性能的同时,也减少了能源消耗,这对于推动环境可持续发展具有深远意义。
从AI技术显著提升电力系统的效率、促进可再生能源生产和消费到AI计算能力与能效的飞跃,我们可以看到AI助力环境可持续的技术基础与潜力。
AI的双刃剑效应
虽然我们可以看到AI的效能不断提升,但是其自身材料和能源消耗和增长速度同样不可小觑。随着模型参数数量的激增,人们对能源消耗和温室气体排放的关注日益增加。这种增长的一个重要驱动因素是转向AI驱动的应用和服务,例如网络搜索。现有人工智能算法的确切能耗难以量化,但根据IEA的数据,对聊天机器人ChatGPT的一次典型请求消耗约10千焦耳的能量——这一数值几乎是传统谷歌搜索能耗的十倍。
根据IEA的数据,2022年全球数据中心消耗了165亿千兆焦耳的电力,占全球总需求的2%-4%。然而,由于数据中心往往在地理上集中分布,因此其对当地电力供应的影响尤为显著。例如,在美国至少五个州,数据中心的电力消耗已经超过了总量的10%;而在爱尔兰,这一数字更是达到了所有电力消耗的20%以上。随着AI技术的广泛应用,预计数据中心的电力消耗将进一步增加。IEA预测,到2026年,数据中心的能源消耗将增长35%至128%,这相当于瑞典(按最低估计)或德国(按最高估计)一年的能源消耗总量。
尽管如此高昂的能源成本,企业似乎认为这是值得的投资。根据谷歌2024年环境报告显示,其碳排放量在过去五年内增长了48%。今年5月,微软总裁布拉德•史密斯(Brad Smith)表示,自2020年以来,该公司的碳排放量增加了30%。尽管没有人愿意面对巨额的能源账单,但研发AI模型的企业却专注于获取最佳的结果。正如《自然》杂志所指出的那样,“当你训练世界上最大的模型时,人们通常不会关心能源效率。”
整体来看,AI发展存在三点环境可持续性挑战:
首先,AI应用的增长速度和方式仍然存在根本性的不确定性。初步数据显示,AI在家用领域的采纳速度甚至可能超过其他变革性的数字技术。但随着时间推移,究竟哪些AI应用会在家庭和企业中流行,将直接影响到能源需求。比如,视频生成比文本生成或AI搜索要耗费更多的能源。AI模型开发的未来方向同样至关重要,因为某些方法相较于其他方法会消耗更多的能源。此外,AI应用的财务回报也将影响数据中心的投资趋势,因为当前的支出与未来盈利预期密切相关。
其次,我们需要更好地理解硬件和软件效率持续提升的可能性。目前,AI相关计算机芯片的效率大约每两年半到三年就会翻一番,现代AI芯片执行相同计算所需的功率比2008年的模型减少了99%。与此同时,新的冷却技术正在研发之中,AI模型本身也在变得越来越高效。然而,数据中心的运营和能源性能相对缺乏透明度,这使得准确估计需求变得困难。对此,一些司法管辖区正在采取措施提高透明度。
第三,需要进一步探讨需求增长的物理限制和生态限制。当前对数据中心项目渠道的了解十分有限,相关数据也不易获取。此外,新材料、新工艺和全新设计在半导体行业的引入是一个漫长而充满挑战的过程,芯片生产可能会成为短期内的瓶颈。如果没有足够的发电和电网容量来支持最需要的地区,能源行业本身也可能成为制约AI发展的因素。此外,数据中心对水资源的消耗和对生物多样性的潜在影响也是常被忽视的问题。
从这些数据可以看出,尽管AI技术在提高电力系统效率方面展现出巨大的潜力,但其自身在解决环境可持续问题的同时也可能制造更多的问题。因此,出于对环境可持续性的考虑,迫切需要引导AI自身的环境可持续发展,避免AI在解决问题的同时制造更多的问题。为此,全面评估AI在多维标准下的环境绩效是必要的。
全面评估多维标准下的AI环境绩效
通过AI实现环境可持续发展意味着将AI活动纳入生态边界的框架内,构建“人—机器—环境”的跨时代发展工程。迈向智能时代的可持续未来,首先要对AI解决方案的净环境影响进行全面审视。传统的评估往往只聚焦于AI服务的部分直接环境影响,尤其是与使用阶段相关的能源流动。然而,实际上,AI服务的环境影响还包括材料流动,这一部分在现有的实践中并未得到充分重视。
因此,从全生命周期的角度来审视AI的重要性不言而喻,这可以全面评估从生产到使用直至生命终结各个阶段对环境的影响。
评估AI的全生命周期环境影响通常采用生命周期评估(LCA)的方法。LCA是一种全面评估产品或服务在其整个生命周期内环境影响的工具,涵盖了从原材料获取、生产、使用直至最终处理的各个阶段。主流的LCA方法包括ISO标准(ISO 14040和14044),以及由欧洲电信标准协会(ETSI)和国际电信联盟(ITU)为信息通信技术(ICT)部门制定的专门方法标准。这些标准为ICT设备和服务提供了详细的LCA指南,帮助企业和研究机构更科学地评估其产品的环境表现。
实施LCA评估的具体步骤包括定义目标和范围、清单分析、影响评估以及解释。然而,当前许多针对环境问题的人工智能解决方案缺乏对其成本与效益平衡的严格评估。ISO标准明确规定:“影响类别的选择应反映与所研究产品系统相关的一整套全面环境问题,并同时考虑到目标和范围。”这意味着,在推动AI解决方案的过程中,必须综合考虑多个环境标准。
为了全面评估AI解决方案的环境影响,有必要从其生命周期的三个主要阶段入手:生产、使用和结束生命周期(End of Life)。
一、生产阶段:这一阶段涉及硬件设备的制造,包括原材料的提取、加工和组装。生产过程通常伴随着较高的能源消耗和废弃物产生,因此,减少这一阶段的环境负担是实现AI可持续性的关键之一。
二、使用阶段:涵盖了AI系统在运行期间的能耗、数据采集、处理及存储等活动。使用阶段的能源效率和碳排放问题是当前评估AI可持续性的重点。优化算法、提高能效、采用清洁能源供电等方式均可有效降低这一阶段的环境影响。
三、结束生命周期阶段:涉及设备的废弃处理、回收或再利用。如果处理不当,电子废物可能会对环境造成长期的危害。因此,建立完善的回收体系,促进资源循环利用,是减轻环境负担的重要途径。
在评估AI解决方案的环境影响时,需要至少考虑以下五种关键指标:
一、生物多样性:代表对土地利用、生物多样性等方面的影响。保护生物多样性不仅是维护生态系统健康的基础,也是应对气候变化的重要组成部分。
二、ADP(大气沉积物潜力):衡量空气污染的程度。空气污染不仅影响人类健康,还会对生态环境造成损害。
三、Humtox(人类毒性):衡量物质对人体健康造成的危害。化学品和其他有毒物质的使用与排放,可能对人群健康构成威胁。
四、水:代表水的使用或水质影响。水资源的合理利用和水质保护对于维持生态平衡至关重要。
五、GWP(全球变暖潜能值):衡量温室气体排放对气候的影响。减少温室气体排放是应对全球变暖的核心措施之一。
从当前的影响分布来看[ Ligozat, Anne-Laure, et al. "Unraveling the hidden environmental impacts of AI solutions for environment life cycle assessment of AI solutions." Sustainability 14.9 (2022): 5172.],上图展示了一个简单的矩阵,其中横轴表示AI解决方案生命周期的不同阶段,纵轴则表示相关的环境影响指标。图中深蓝色方块位于使用阶段和GWP之间,这表明当前的关注点主要集中在AI在使用阶段的能源效率和碳排放问题上,而其他环境影响指标在评估AI的低碳发展时则被相对忽视。一个常见的误区是认为只要使用可再生能源,环境可持续性问题就能迎刃而解。事实上,生物多样性在数据中心可持续发展目标中可以发挥更大的作用,但尽管运营过程中通常会同时考虑能源效率和污染防治,却鲜有人深入探讨生物多样性保护。生物多样性的丧失会削弱生态系统应对气候变化的能力,因此,缺乏将生物多样性与低碳转型和环境治理价值相联系的广泛讨论是一个亟待解决的问题。
此外,随着AI发展对于淡水资源的消耗也是巨大的,而这部分问题同样未得到相应的重视。例如,谷歌在其《2024年环境报告》中提到,2023年该公司的水足迹相比前一年增加了17%,冷却其数据中心所需的总水量达到了61亿加仑,这一增长与用电量的增加相匹配。这一水量相当于每年灌溉美国西南部41个高尔夫球场所需的水量。这一数据反映出,即使是在积极采用清洁能源的背景下,AI技术的发展也会对水资源造成显著影响。
引导与管理:构建可持续AI的策略
为了全面理解AI技术的环境足迹,可以从其生命周期的不同阶段对其进行评估,包括第一级直接影响、第二级间接影响以及第三级深远影响。通过对这些不同层面的影响进行综合考量,可以有针对性地采取措施,促进技术发展与环境保护的和谐共生。
第一级影响(直接影响)
与AI服务相关的设备在其生命周期各阶段产生的直接影响主要包括:
一、原材料提取:这一阶段涉及将原材料从自然界中开采出来,如金属和其他矿物资源的开采。为了减少这一阶段的环境负担,可以通过使用模块化设计来方便未来的升级和维护,减少因技术更新换代而导致的硬件淘汰频率;并且鼓励制造商设计易于维修和升级的产品,通过软件升级和硬件维护延长电子设备的使用寿命。
二、制造:包括将原材料转化为实际设备的过程,例如制作GPU、服务器及其他硬件组件。在生产过程中,应优先使用可再生能源供电,减少化石燃料的依赖;实施环保生产流程,使用可回收或生物降解的材料,减少对环境的影响。
三、使用:设备在运行期间的能耗,包括数据的获取、处理和分析,以及模型训练和推理过程中消耗的能量。为了降低这一阶段的能耗,可以通过采用高效算法开发,减少计算所需时间和资源;通过改进AI算法来降低计算复杂度,减少训练和推理所需的能量消耗;以及使用更高效的神经网络架构或压缩模型大小,以减少能耗。
四、报废处理:设备达到其使用寿命后,如何处理和回收这些设备,包括电子废弃物的管理和回收。为了解决这一问题,应建立电子废弃物回收和再利用机制,确保废弃设备中的有用部件得到重新利用,并实施安全的电子废物回收计划,确保废旧设备中的有害物质得到妥善处理。
第二级影响(间接影响)
这些影响源于AI解决方案的实际应用,包括但不限于:
一、优化现有系统:通过AI进行分布式能源资产的综合管理;或是检测建筑物内的占用情况来优化能源消耗,提高整体系统的运行效率。
二、实现精细控制:当AI应用于智能建筑或其他自动化系统时,可以实现更精细的控制,从而节省能源和资源。
第三级影响(深远影响)
这些影响是由于引入了AI解决方案而引起的更广泛的社会或技术变化,包括但不限于:
一、反弹效应:效率提升导致成本下降,可能会促使人们增加消费,从而抵消了最初的节能效果。
二、行为改变:AI的引入可能会影响个人的行为模式,例如,如果智能系统使得室内温度更加舒适,用户可能会选择更高的温度设置。
三、系统转变:随着时间的推移,AI可能会驱动整个行业的变革,例如,自动驾驶汽车可能会改变交通模式和个人出行习惯。
四、持续改进与模拟:采用ASI策略(避免—转移—改进),通过AI技术预测和预防不必要的资源消耗,优化资源分配,改进现有系统和流程。
为了构建可持续发展的AI,我们必须采取综合的引导和管理措施,以全生命周期视角切入,更全面地从政策、企业实践推动AI的环境可持续发展。只有在实现经济效益的同时兼顾社会责任和环境保护,AI技术才能真正造福于人类社会。
(注:TFLOPS作为一个衡量计算机性能的单位,在高性能计算(HPC)和图形处理单元(GPU)的能力评估中被广泛采用。“FLOPS”(每秒浮点运算次数)这一术语中的“Tera-”前缀表示万亿,因此,1 TFLOPS意味着每秒钟可以执行一万亿次浮点运算。)
如果你希望深入了解陈钰什为应对气候变化所做的行动,推荐你阅读:
如果你想了解更多关于“自然之友公民气候行动计划-玲珑计划”,
欢迎点击公众号主页上方标签#玲珑计划以及下方菜单栏按钮【参与我们】-【玲珑计划】