北京时间1月31日晚10点,NVIDIA正式解禁了RTX 40 SUPER系列台式机显卡的第3款型号——RTX 4080 SUPER,其产品定位介于RTX 4080和RTX 4090之间。

打开网易新闻 查看更多图片

先说一个好消息,早先的RTX 4080起售价为9499元,而全新的RTX 4080 SUPER起售价为8099元,NVIDIA这次把价格足足直降了1400元,降价幅度可谓相当之大,对于高端用户们来说无疑是颇具诱惑力的。

打开网易新闻 查看更多图片

本月早些时候上市的RTX 4070 SUPER和RTX 4070 Ti SUPER均赢得了不错的口碑。现在对于全新RTX 4080 SUPER,它的表现又会如何?此次评测笔者将利用映众RTX 4080 SUPER X3这款新显卡,为大家揭晓答案。

  Ada Lovelace架构与全新的RTX 4080 SUPER

RTX 4080 SUPER基于英伟达Ada Lovelace架构设计。为了让大家更好地了解到这款新显卡,笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。

(一) RTX 40 SUPER系列台式机显卡第3弹——RTX 4080 SUPER

打开网易新闻 查看更多图片

全新的RTX 4080 SUPER基于AD103-400显示核心设计,拥有10240个CUDA核心,搭配16GB容量、256bit位宽的GDDR6X显存。

算上RTX 4090和RTX 4090D,RTX 4080 SUPER是第3款CUDA核心数量过万的RTX 40系列台式机显卡。

而之前的RTX 4080基于AD103-300显示核心设计,拥有9728个CUDA核心,搭配16GB容量、256bit位宽的GDDR6X显存。

对比CUDA核心数量,全新的RTX 4080 SUPER相比RTX 4080有着约5%的规格提升。

更高端的RTX 4090基于AD102-300显示核心设计,拥有16384个CUDA核心,搭配24GB容量、384bit位宽的GDDR6X显存。

从硬件规格来看,RTX 4080 SUPER相比RTX 4080小幅提升。而跟更高端的RTX 4090相比,硬件规格差距依旧是很大的。

打开网易新闻 查看更多图片

(映众RTX 4080 SUPER X3显卡的GPU-Z信息)

本文选用的映众RTX 4080 SUPER X3显卡在频率设置上与RTX 4080 SUPER创始人版保持一致,其GPU频率为2295MHz,Boost频率为2550MHz,显存频率为1438MHz(等效23000MHz)。

(二) Ada Lovelace架构核心

打开网易新闻 查看更多图片

(Ada Lovelace架构核心)

打开网易新闻 查看更多图片

(Ada Lovelace架构核心GPC单元)

Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍,还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。

打开网易新闻 查看更多图片

(第三代RT Core结构示意图,相比前代,增加了2个功能)

Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入至高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级,这一项升级不可谓不小。

打开网易新闻 查看更多图片

(Ada Lovelace架构核心SM结构图)

Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外,带来了全新的第八代NVENC硬件编码器,这一全新的第八代NVENC硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。

打开网易新闻 查看更多图片

而除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存。其中RTX 4080 SUPER显卡所采用的AD103-400显示核心拥有64MB的L2缓存,L2缓存容量相比上一代RTX 3090 Ti显卡(6MB L2缓存)可谓提升巨大。大容量的L2缓存带来了数据命中率的有效提升,在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以进一步提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。

(三) DLSS 3与NVIDIA Reflex

Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。

打开网易新闻 查看更多图片

DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。

打开网易新闻 查看更多图片

DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。

打开网易新闻 查看更多图片

而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

目前DLSS 3版本已更新至DLSS 3.5。DLSS 3.5特别新增光线重建(Ray Reconstruction,简称RR),主要是解决目前光追游戏中人工设计的降噪器所带来的画面质量问题。

打开网易新闻 查看更多图片

在DLSS 3.5出现之前,降噪器的调整主要是交给游戏开发者来做的,也就是前文所说的人工设计的降噪器。降噪器会用前几帧的图像,以及混合邻近的像素去达成填充画面的目的。不过即便图像是完整的,但是仍有一些缺陷,比如说多帧结合产生的鬼影,还有画面细节上的缺失。为了得到较好的结果,一般多个降噪器会同时运行,这也对帧率造成了影响。而DLSS 3.5中的光线重建是人工设计降噪器的替代品。NVIDIA为其投入了DLSS 3的5倍训练数据量,因此它能识别出不同的光线追踪效果,从而准确处理图像中的每个像素。

  映众RTX 4080 SUPER X3显卡欣赏

打开网易新闻 查看更多图片

映众RTX 4080 SUPER X3显卡以黑、灰色为主色调,双槽厚度设计令其能够兼容更多的机箱。该显卡没有设计RGB灯效,也没有什么花哨的设计,低调不张扬。

由于采用的是3风扇散热设计,这款显卡的尺寸比较长,实测约33.7cm。

打开网易新闻 查看更多图片

显卡背面设计了金属背板,上面有一些镂空设计,以便兼顾散热效果。

打开网易新闻 查看更多图片

显卡输出接口为三个DP 1.4以及一个HDMI 2.1。

打开网易新闻 查看更多图片

散热器顶部上面印有“INNO3D GEFORCE RTX”的字样。

打开网易新闻 查看更多图片

显卡辅助供电接口为12VHPWR接口。

打开网易新闻 查看更多图片

下面将散热器拆卸下来,露出显卡PCB,继续欣赏一下它的用料。

这款显卡虽然长度为33.7cm,但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。

打开网易新闻 查看更多图片

映众RTX 4080 SUPER X3显卡的供电设计基于RTX 4080 SUPER创始人版方案。GPU左右共设计了17相供电,搭配电容铁素体电感、固态电容等高品质元器件,用料值得信赖。

打开网易新闻 查看更多图片

全新的AD103-400显示核心,芯片面积为378.6平方毫米,尺寸不算大。

显存是来自美光的GDDR6X,单颗2GB容量。这款显卡PCB正面共设计有8颗显存,组建了16GB显存容量。

打开网易新闻 查看更多图片

这款显卡采用的是HERCULEZ X3散热器,搭配有两枚直径约9.5cm散热风扇。风扇支持可拆洗 ,便于用户们日常保养清灰。此外,这款散热器支持智能风扇停转功能,在待机状态下或者轻负载状态下,它的这3枚风扇会全部停转,以便实现安静的运行效果。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

这款散热器的金属主体部分很大,纯铜镀镍底座,7根纯铜镀镍热管,其中2根8mm粗,5根6mm粗,加上大面积散热鳍片矩阵,不仅能够为GPU进行散热,而且还能够为显存、电感以及MOS管进行散热。

  测试平台介绍

打开网易新闻 查看更多图片

笔者组建了一套性能出色酷睿i9-14900K测试平台,用来测试显卡性能。为了对比映众RTX 4080 SUPER X3显卡的性能,笔者此次测试还加入了RTX 4080的成绩。

此次测试所选用的这款RTX 4080同样是一款非公版显卡,其GPU频率为2205MHz,Boost频率为2505MHz,显存频率为1400MHz(等效22400MHz)。

英特尔酷睿14代处理器搭配RTX 40系列显卡是支持Resizable BAR技术的。为了充分发挥比映众RTX 4080 SUPER X3显卡的性能表现,以下测试环节均是在Resizable BAR开启状态下进行的。

  游戏性能测试

(一) 3DMark基准测试

首先映众RTX 4080 SUPER X3在3DMark基准测试当中的表现。性能到底有多强,大家一看便知。

打开网易新闻 查看更多图片

在3DMark Time Spy测试项目中,映众RTX 4080 SUPER X3的性能约为RTX 4080的100.6%。

在3DMark Port Royal光线追踪测试项目中,映众RTX 4080 SUPER X3的性能约为RTX 4080的101.9%。

显而易见,全新的RTX 4080 SUPER相比RTX 4080,3DMark成绩只有一点点的提升。

(二) DLSS 3游戏实测

目前已有《赛博朋克2077》、《瘟疫传说:安魂曲》、《光明记忆:无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测,笔者将利用3款游戏进行测试。

DLSS 3游戏测试版——《赛博朋克2077》

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

DLSS 3游戏——《瘟疫传说:安魂曲》

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

DLSS 3游戏——《极限竞速:地平线5》

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

通过上述3款DLSS 3游戏来看,DLSS 3技术为RTX 40系列显卡带来的游戏帧数提升是巨大的。借助DLSS 3技术,RTX 4080 SUPER已能够在4K分辨率下畅玩大量新时代光追游戏,其中很多戏甚至能够实现4K 144帧的出色表现。

(三) 其它游戏实测

接下来,笔者再测试一些非DLSS 3游戏。

游戏实测——《中土世界:暗影之战》

打开网易新闻 查看更多图片

游戏实测——《无主之地3》

打开网易新闻 查看更多图片

游戏实测——《幽灵行动:荒野》

打开网易新闻 查看更多图片

游戏实测——《古墓丽影:暗影》

打开网易新闻 查看更多图片

游戏实测——《地铁:离去》增强版

打开网易新闻 查看更多图片

非DLSS 3游戏中,RTX 4080 SUPER的性能表现依然很好,畅玩大量4K游戏不在话下。

对比RTX 4080的话,RTX 4080 SUPER游戏性能依然提升很小。对于游戏玩家们来说,RTX 4080 SUPER和RTX 4080可以看作是一个档次的显卡。

  生产力性能测试

(一) AV1硬件加速编解码测试

为什么AV1编解码技术越来越受欢迎?理由很简单,采用AV1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用AV1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。

打开网易新闻 查看更多图片

目前剪映、万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用剪映这款软件,将一部H264编码的MP4视频,导出为一部AV1编码的MP4视频。

打开网易新闻 查看更多图片

显而易见,在RTX 40系列显卡AV1视频编码加速的助力之下,转换时间比单用处理器转换大幅缩短,加速效果相当显著。

(二) DLSS 3.5渲染测试——D5渲染器

打开网易新闻 查看更多图片

目前国产渲染器——D5渲染器已更新DLSS 3.5预览支持,可以让用户在复杂渲染模型的预览场景中获得更为流畅的使用反馈,为用户提供更高帧率的显示。笔者此次利用映众RTX 4080 SUPER X3进行了D5渲染器场景列车中环境非常复杂的《木构建筑》预览体验,并记录开启以及关闭DLSS 3.5进行预览的帧数变化。

打开网易新闻 查看更多图片

从帧数表现可见,这个渲染预览场景对于性能要求非常高,在未开启DLSS 3.5的情况下,预览帧数仅有16帧,不过在开启DLSS 3.5进行预览之后,帧数会提升到43帧,此时流畅度已很不错,DLSS 3.5的作用是非常明显的。

(三) AI图片生成测试

RTX 40系列显卡的Tensor核心拥有强大的深度学习能力,可以高效完成AI绘图创作。这次测试我们使用Satble Diffusion应用运行AI程序,绘制50张1000×1000分辨率的图片,并计算每分钟生成的张数。

打开网易新闻 查看更多图片

结果显示,映众RTX 4080 SUPER X3平均每分钟可生成5.4655张图片,AI绘图创作效率要略高于RTX 4080。

  散热器测试

(注:笔者所处的室温维持在26℃)

利用FurMark,笔者将对映众RTX 4080 SUPER X3进行压力测试。

打开网易新闻 查看更多图片

通过10多分钟的烤机,默认频率下满载时GPU温度稳定在约64.5℃,GPU频率稳定在约2715MHz左右,显卡满载功耗约310W左右。散热设计可靠,同时静音效果也不错,令人放心。

  产品总结

毕竟是NVIDIA的高端显卡,RTX 4080 SUPER拥有出色的游戏和生产力性能,畅玩4K游戏无压力,并且在日趋流行的AI创作应用方面也处于业界领先水平。如此强大的显卡,目前8099元起即可拥有。

关于RTX 4080 SUPER相比RTX 4080提升很小这个情况,很明显NVIDIA此次推出RTX 4080 SUPER并不是以提升性能为主要目的,而是希望将高端显卡的价格降下来。从RTX 4080的9499元起到现在RTX 4080 SUPER的8099元起,价格足足直降了1400元,NVIDIA这次的降价诚意还是可以的。

打开网易新闻 查看更多图片

作为本文的测试显卡,映众RTX 4080 SUPER X3拥有较为出色的散热设计,并且其双槽厚度能够令其兼容更多的机箱,心仪的用户可以到京东商城映众旗舰店购买,该显卡首发价就是8099元。