打开网易新闻 查看更多图片

绿色是算力的底色。

真正实现绿色算力,则需要贯穿整个算力生命周期,从基础设施建设、算力生产、供给、服务到算力应用等环节,实现高效、清洁、低碳乃至零排放。

如今,全球数据中心的能耗已经占据了全球总能耗的3%,而且这个比例还在不断攀升。传统的风冷技术已经无法满足高功耗高密度服务器的散热需求,由于液冷技术具有更高的散热效率和能效,能大幅提高服务器的可靠性和稳定性,因此,推动液冷技术的发展成为降低服务器和数据中心能耗和碳排放的重要手段之一。

中国是液冷技术最大的试验场,在技术研发、产品应用和市场规模等方面都有所突破。但产业化程度还比较低,要促进产业化、规模化的增长,就需要制定产业发展的标准,来引领行业方向。而这,正是浪潮信息与英特尔联合发布全球首个全液冷冷板服务器参考设计的初衷所在。

走出“试验场”的产业化迷局

绿色算力看液冷,液冷技术发展看中国。

服务器和数据中心降低能耗是推动液冷技术发展的重要原因之一。随着数字化时代的到来,服务器和数据中心的规模不断扩大,能耗和碳排放也随之不断增加。截止到2022年底,我国在用的数据中心的规模达到了650万架。2023年6月底,在用的数据中心规模已经超过了760万架。短短一年时间,已经有100万架标准机架规模的增长,近五年增速更是超过了30%。

与此同时,在2021年,全国的数据中心二氧化碳的规模达到了7800万吨。2022年底,我国整体在用数据中心的能耗达到了1300亿千瓦时,已经占到全国总供电量的2%。

一面是服务器和数据中心规模的快增增长,一面是降低能耗和碳排放的现实压力,绿色算力的发展迫在眉睫。

传统的风冷技术已经无法满足高功耗高密度服务器的散热需求。从通用算力发展来看,通用算力的CPU功耗从2019年最高205瓦,快速演进到2022年的400到500瓦的规模,CPU功耗越来越高,越需要局部快速散热。而传统风冷的散热方式主要是由空气中的冷热交换实现制冷,当CPU功耗达到400瓦以上,传统的散热方式就会遇到很大的瓶颈。

根据测算,如果芯片的尺寸演进到10纳米的时候,整个芯片的性能提升一倍,它的功耗至少还要再提高到30%~40%,散热能力对芯片发展起着至关重要的作用。而相比传统的风冷技术,液冷技术能够更好地解决高功耗高密度服务器的散热问题。

浪潮信息服务器产品线总经理赵帅表示,得益于双碳战略、东数西算战略等,中国在液冷技术方面一直发展迅猛,在技术研发、产品应用和市场规模等方面都有所突破,而且已经有技术和标准通过中国的开放计算组织传导给全球的开放计算组织,再用于全球市场的推广和应用。

浪潮信息服务器产品线总经理赵帅

在大规模实践方面,中国的液冷技术企业和研究机构在液冷系统的设计、优化、集成等方面具有较强的实力,推出了一系列具有自主知识产权的液冷技术和产品,但当前液冷最大的难点在于产业化程度还比较低,生产厂家不多,成本比较高。“这背后的原因还是没有标准,大家用冷板的时候,标准都不一样,每一家的冷板都是几千片、几万片的规模,达不到百万片的规模,这个时候成本不可能降下来。”赵帅说。

怎么推动规模化?“标准”是一把尺子。

从技术突破到产业突围

2017年以来,液冷技术持续高速发展。按照液体与发热器件的接触方式来划分,大致分为冷板式(间接接触)、喷淋式和浸没式(直接接触)。

在中国信通院产业与规划研究所副总工程师王青看来,由于对数据中心整个原有改造的程度不高,部署成本相对更低,所以冷板式液冷在整个液冷数据中心中所占的比例超过了90%,而浸没和喷淋式的技术,技术还不是特别成熟,成本也比较高,离大规模应用还有一定时日。

在2022年,浪潮信息将“All in液冷”纳入公司发展战略,并且开始全线布局液冷。2023年,浪潮信息实现液冷服务器市场占比中国第一,浪潮信息天池液冷产业基地已实现液冷产品的标准化、品质化、系列化生产,年产能超10万台。

在不断推进液冷技术的产业化发展的过程当中,浪潮信息也发现了很多的问题:

首先,是安全。服务器内部包括冷板、铜板之间的接口,CPU冷板,以及两个CPU冷板之间,可能会有很多的液冷接口,存在漏液风险,安全管理比较困难。

其次,是收益。目前服务器中液冷的占比仍比较低。通用服务器的功耗在千瓦左右,通过液冷能做的散热在600瓦左右,收益对于只部署几百台服务器的客户而言并不是很明显。数据中心的能耗较高,即使部分使用了液冷的散热,PUE也很难降到1.1以内。

此外,液冷服务器的运维也比较复杂,特别是在标准化程度不高的时候,兼容性不足,导致液冷服务器运维难度较大。

赵帅表示,基于在液冷服务器产业中的这些问题,浪潮信息联合英特尔发布了全球首个“全液冷冷板服务器参考设计”,并面向业界开放。全液冷的冷板服务器设计架构,实现了单台服务器无风扇设计,所有机器部件100%液冷散热,在保障服务器散热最优能效的同时,也实现了服务器完整静音的设计和极致的PUE。“在这个过程中,浪潮信息做了非常多的标准,以及很好的指导、实践,让各行各业不同品牌都能按照同一个标准去运作。”

打开网易新闻 查看更多图片

在笔者看来,全液冷冷板服务器参考设计是从系统级解决方案出发,以模块化解耦设计思维,兼容不同厂商和型号的计算设备,探索出的高能效、易于运维、使用更安全,兼容性更出色的全液冷冷板服务器设计。另一方面,通过设计开放,也对产业探索全液冷冷板解决方案提供了新思路,加速全液冷冷板技术的普及和规模化应用,推动产业化进程。

全液冷技术“从1到N”

液冷产业的发展需要从多个方面入手,其关键点有两个,一是技术创新,二是标准建立。

在技术创新方面,浪潮信息基于全液冷冷板服务器参考设计,推出全液冷冷板服务器最佳实践,实现了对CPU、高功耗内存、NVMe 硬盘、OCP 网卡、电源、PCIe 转接卡和光模块等服务器主要发热部件的冷板全液冷覆盖,PUE降至接近于1的极致水平,并通过“去空调化”节省30%以上的数据中心空间,充分满足数据中心的高密度部署需求。

在标准化方面,浪潮信息和英特尔在2023年联合了60多家产学研用各个方面合作伙伴,一起打造了国内首批冷板式液冷数据中心核心部件团体标准,涵盖冷板、连接系统、冷量分配单元、监控系统等四部分,把整个冷板式液冷系统全部关键的液冷部件做了标准化。浪潮信息后续也会把液冷产业化的实践和标准,在OCTC等开放组织里面去做全面的开放和开源,希望更多的用户和厂商选用开放标准,并用标准推进液冷服务器在全国,乃至全球的大规模应用扩展。

浪潮信息希望,通过构建全液冷覆盖的冷板开放标准体系,能够解决在液冷大规模产业化的最后一公里,推进数据中心液冷大规模的部署应用。

英特尔解决方案咨询顾问李昌中表示,全液冷冷板服务器将成为液冷产业新方向。“一个产业的发展,从0到1很重要,从1到N也同样重要,全液冷冷板服务器参考设计更想解决的是从1到N的事情,把液冷产业的‘最后一公里’真正打通。”英特尔与浪潮信息合作,在践行“双碳”目标最有力的中国市场发布全液冷冷板服务器参考设计,是希望通过中国的示范效应,逐步推动这项技术在全球范围内的普及,以此促进绿色数据中心可持续发展。

浪潮信息与英特尔联合发布的全球首个全液冷冷板服务器参考设计,是一项重大的技术突破,也是浪潮信息在开源开放、产业链合作上迈出的实质一步,它对于液冷产业化、数据中心的绿色低碳可持续发展、云计算和数据中心的发展都具有重要的意义。绿色算力产业的发展,依托于技术创新、政策引导和标准制定,将为推动全行业的绿色转型和升级发挥更加重要的作用。