作者:刘钊屹

夏秋更迭之际是各大科技公司新产品发布会的密集期。8月19日,英特尔(Intel)在线上召开2021年第三届英特尔架构日活动,发布了若干技术架构的改变和创新。面对各方挑战,英特尔深化IDM2.0战略,着手面向数据中心、高性能计算机AI和客户端计算的未来架构,推出了一系列产品。

此次发布的首款产品,是性能混合架构Alder Lake。两款新一代x86内核分为能效核“Gracemont”(E-Core)和性能核“Golden Cove”(P-Core):能效核相比自家的第六代微架构Skylake,能带来单线程同功耗的40%性能提升或同性能40%的能耗需求。

同时,四个能效核相比运行四线程的两个Skylake内核,能带来低功耗下80%的吞吐量性能提升或同性能20%的能耗需求。而在性能核方面,与第11代酷睿架构Cypress Cove相比,相同频率下在一系列工作负载上平均提升了约19%,也提供了专门针对数据中心处理器和机器学习的专用硬件,AI加速提升约8倍。

同时搭载的英特尔硬件线程调度器,旨在动态和智能地在能效核和性能核之间分配工作负载。其中,能效核在吞吐量效率方面、以及在单线程性能方面也有所提升。性能核上则突破了低时延和单线程性能的限制。硬件线程调度器通过使用硬件遥测工具,可将需要更高性能的线程引导到当时适合的性能核,并通过扩展的PowerThrottling API和全新的EcoQoS分类,使开发人员和调度程序更好地明确线程所需的性能和能效。

打开网易新闻 查看更多图片

图 | 英特尔Alder Lake混合性能架构(来源:资料图)

“Monts的设计旨在实现最佳的面积效率和多线程性能,而Coves则为最大限度地提升单线程性能而设计,”英特尔高级副总裁兼加速计算系统和图形事业部总经理拉贾·科杜里(Raja Koduri)表示。据悉,Alder Lake基于 Intel 7(10nm SuperFin) 制程,适用于从移动端到台式机的产品,并将在今年开始出货。

此次,英特尔使用新品牌名锐炫(Intel Arc)回归,并展示了Alchemist(DG2)、Battlemage、Celestial和Druid SoC的独立显卡路线图。Alchemist SoC将于2022年第一季度上市,采用搭载Xe内核的Xe HPG独立显卡微架构。Xe内核使用台积电6nm工艺制造,拥有16个矢量引擎和16个被称为XMX的矩阵引擎、高速缓存和共享内部显存。因为使用软件优先的设计逻辑,Xe使计算密集型游戏的吞吐量提高了15% (至多80%),游戏加载时间缩短了25%。

图 | 英特尔高级副总裁兼加速计算系统和图形事业部总经理Raja Koduri和英特尔锐炫Intel Arc(来源:资料图)

同时推出的还有类似Nvidia DLSS和AMD FSR的XeSS技术,利用Alchemist的内置XMX AI进行深度学习以合成接近原生高分辨率渲染质量的图像,对游戏进行高画质和高分辨率下的帧数提升。 “因为我们这是一个软件优先的方案,也会支持开放的开源生态,” 英特尔研究院副总裁、英特尔中国研究院院长宋继强表示,“我们也会有一个通过DP4a的方式去支持更多的其他的显卡,所以这是一个软件的方案,同时也会利用到XPG里面专门的XMX加速器。”

这使得XeSS可以在包括集成显卡在内的各种硬件上提供基于AI的超级采样。据悉,英特尔也将于本月向独立软件供应商(ISV)提供XMX初始版本的SDK,DP4a版本将于今年晚些时候推出。

针对数据中心和服务器的“Sapphire Rapids”下一代英特尔至强CPU由Intel 7工艺生产,在提高计算性能的同时对云、微服务和AI等弹性计算模型上也着重进行了优化。它采用嵌入式多芯片互连桥接(EMIB)封装技术,在保持单晶片CPU接口优势的同时,具有较好的可扩展性。

而统一内存访问架构使每个线程均可完全访问缓存、内存和I/O等所有单元上的全部资源,可降低时延并提升带宽。Sapphire Rapids还提供了数据中心相关加速器,包括支持对加速器和设备调度与同步的加速器接口架构指令集(AIA)、为深度学习算法的Tensor提供加速的高级矩阵扩展(AMX)、和优化数据移动的数据流加速器(DSA)。

IPU(Infrastructure Processing Unit)基础设施处理器是该公司此次提出的新概念。“根据很多领先的云计算服务商,通过现在的工作负载和业务运营模式的转化,需要能够把用户、客户的一些业务程序和基础设施的支持程序分开,因为他们属于不同的人,他们也需要用不同的硬件来去加速。那么如果要把它分开就不能让所有东西都运行在CPU上,” 该公司表示,“IPU是一种可编程的网络设备,旨在使云和通信服务提供商减少在中央处理器(CPU)方面的开销,并充分释放性能价值,都是跟怎么样去虚拟化基础设施有关的。”

据介绍, IPU与CPU结合的数据中心结构有如下优势:它能够隔离基础设施功能和用户的工作负载,使用户全面掌控CPU;云运营商可以把基础设施任务转移到IPU上,有助于最大化CPU利用率和公有云收入; IPU允许云数据中心内存在无磁盘服务器架构。

据此,英特尔拿出三款有针对性的产品: “Oak Springs Canyon”参考平台、N6000加速开发平台“Arrow Creek”和“Mount Evans”。其中,“Mount Evans”作为英特尔的首个专用IPU,具有超大规模就绪、支持防火墙和虚拟路由等用例、支持高级加密和压缩加速等特点。

打开网易新闻 查看更多图片

图 | 英特尔Mount Evans基础设施处理器(来源:资料图)

“Ponte Vecchio”是英特尔推出的高性能计算卡,包含1000多亿个晶体管,采用5个不同的制程工艺和包括EMIB及Foveros 3D的封装技术。它基于Xe HPC微架构:每一块计算单元有8个Xe内核,4MB一级缓存,由台积电5nm制程制造;基础单元是Ponte Vecchio的连接组织,包括PCIe Gen5、HBM2e 内存、MDFI链路和 EMIB桥接等各种高带宽输入输出,基于Intel 7制程制造;Xe 链路单元提供了GPU之间的连接,支持每单元8个链路,实现高达90G的SerDes带宽。Ponte Vecchio已经下线提供样品,预计将于2022年发布。

图 | 英特尔Ponte Vecchio A0验证结果:高达45TFlops的32位浮点算力,5TBps的内存带宽,和2TBps的连接带宽(来源:资料图)

此次架构日,该公司还宣布了高性能计算统一软件栈oneAPI的新动态,其具有开放、规范、跨架构和跨厂商等特点,旨在提供跨架构的兼容性,并横跨Nvidia GPU、AMD GPU和Arm CPU。其表示:“ oneAPI现在已经在PC领域推得比较成功......是大家参与度也很高的开放的异构软件编程框架。目前已经有20万的用户,有300多个应用在开始使用。”

作为老牌计算芯片巨头和少有的半导体垂直整合型(设计、制造、封装、测试一体化、IDM)企业,英特尔正在努力前进。 2021年2月15日新任CEO 帕特·盖尔辛格(Pat Gelsinger)上任以后,IDM模式升级和深化成2.0版本,强调在发展先进制程的同时,加强与芯片代工厂的合作和制造外包服务。那么,IDM 2.0模式否成功?相关市场表现,还需拭目以待。