Ada Lovelace,英国著名诗人拜伦的女儿,也是一位伯爵夫人。Ada是世界上第一位程序员,也是世界上第一位程序媛。Ada建立了循环和子程序的概念, Ada编写了世界上第一个计算机程序,曾经预言计算机未来可以用来排版、编曲或是各种更复杂的用途。可惜天妒红颜,年仅36岁的她就离开了人人世间。后来,每年10月的第二个星期二,被定为Ada国际纪念日。

对,十月第二个星期二,就是今天,是Ada Lovelace的国际纪念日。今天,Ada Lovelace以另一种身份重回人们的视线,NVIDIA全新一代Ada Lovelace架构的RTX 40系GPU正式发售。NVIDIA以这样一种特殊的发售日纪念,缅怀这位计算机科学先驱,用刚猛无匹的GeForce RTX 4090发售,致敬这位对计算机程序语言做出杰出贡献的科学家。

打开网易新闻 查看更多图片

按照惯例,每一代NVIDIA的新GPU首发总是会以旗舰型号为先行者,RTX 20时代的RTX 2080、RTX 30时代也是RTX 3080,到了RTX 40时代,这一次首发上市的产品是RTX 4090这款真正的顶级旗舰型号。当然,关于RTX 40系GPU的架构深度解析,我们在10月10日的微信公众号头条文章已经为大家献上,今天在这里就不赘述了,让我们直入GeForce RTX 4090的评测吧!

从外观设计上来看,NVIDIA GeForce RTX 4090 FE的设计乍一看几乎与前一代的旗舰RTX 3090 Ti和RTX 3090一模一样。但是仔细观察才能发现,NVIDIA在细节上,对40系的产品做了很多细节上的设计。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

在散热结构上虽然还是沿袭了RTX 3090上非常成熟的双轴流通设计,而且在长宽的尺寸上也几乎保持一致。但由于RTX 4090相比RTX 3090 Ti在厚度上增加了不少,因此可以发现RTX 4090 Founders Edition的散热片厚度也随之增加了不少,相信也能够确保RTX 4090的散热性能不受影响甚至比RTX 3090或RTX 3090 Ti更优秀。另外,在风扇部分,NVIDIA在GeForce RTX 4090 FE上也做了些许改进,由RTX 3090 Ti的双9叶曲折扇改为了两只大面积的7叶类镰刀风扇,但是在静音效果上反而感觉更优秀。就风扇本身来说,较大扇叶面积的风扇能够提供更高的风压与风量,而风扇部分此次采用的流体动力轴和反方向旋转的设计,则让RTX 4090可以更安静、凉爽地运行。因此,NVIDIA在发布会上就曾宣称,RTX 4090设计的散热系统可以在相同的噪音水准下实现比RTX 3090多15%的气流,而在极限情况下能够提供比RTX 3090散热系统高出20%的额外气流f。这些显然都为NVIDIA宣传的RTX 4090性能暴增打下了良好的基础。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

▲RTX 4090 FE的包装采用斜面折翻设计,时尚科技感十足。

打开网易新闻 查看更多图片

▲风扇部分采用了大面积扇叶的风扇,以辅助实现更大的风量与风压。

打开网易新闻 查看更多图片

▲接口部分采用的是最新PCIe 5.0供电(ATX 3.0)的16Pin接口,和RTX 3090 Ti FE保持一致。

打开网易新闻 查看更多图片

▲RTX 4090 FE的厚度比RTX 3090 Ti厚了不少,也意味着它的散热片更宽,能带来更高的散热效率。

打开网易新闻 查看更多图片

▲视频输出接口部分仍然是传统的3DP 1.4a+1HDMI 2.1的组合

打开网易新闻 查看更多图片

▲支撑杆的安装结构采用了隐藏式设计,当不需要安装支撑杆时,磁吸结构的贴片可以完美隐藏安装螺丝孔。

打开网易新闻 查看更多图片

从规格上来看,采用AD-102-300(A1)核心的NVIDIA GeForce RTX 4090可以说是一头异常凶猛的“野兽”。单是从16384个CUDA核心以及763亿晶体管的配置,就已经将上一代的巨无霸RTX 3090 Ti甩在了身后。128个光追核心、512个AI张量核心的配置也让RTX 3090 Ti望尘莫及。这一切也使其具备了高达82.58TFlops的FP16及FP32计算能力,这些从理论数据上就已经达到了RTX 3090 Ti的两倍。而在核心频率部分,TSMC定制4nm工艺的使用终于使得RTX GPU的旗舰型号频率开始了狂飙,RTX 4090 FE公版的频率就被初始定格在2520MHz的Boost频率上,相对于RTX 3090 Ti的1860MHz而言可以说是有了天翻地覆式的改变。但是这种配置和架构上的进化,究竟能带来多大程度的性能提升?让我们一起来探索一下。

关于NVIDIA Ada Lovelace架构的详细技术解析,请参考微型计算机微信公众号10月10日的相关详细解析文章。在这里我们就不对架构、技术、产品部分进行详细的解析和阐述了。

性能实测,DLSS 3光芒万丈,RTX 4090登顶卡皇

相信关于GeForce RTX 4090的实际性能表现也是所有玩家最为关心的话题了,闲话不多说,让我们进入主题。

在测试部分,我们选择了上一代的顶级旗舰GeForce RTX 3090 Ti FE作为对比参考,主要考察前后两代旗舰产品在性能上到底有多大的差异。测试主要围绕游戏以及创作设计应用这两方面进行。同时考虑到DLSS 3和双NVENC AV1编解码是本次RTX 40系GPU的特色与核心,我们也特别针对这两方面进行了一些专项测试与解析,以期望得到一份完整、真实的GeForce RTX 4090的性能答卷。

测试平台

GPU:NVIDIA GeForce RTX 4090 FE、NVIDIA GeForce RTX 3090 Ti FE

CPU:AMD Ryzen 9 7950X

主板:AMD X670

内存:芝奇皇家战戟DDR5 6000 16GB×4

SSD:三星980Pro 2TB PCIe SSD

显示器:戴尔UP3218K(7680×4320@60Hz)

电源:海韵PX-1600(额定1600W)

下文所有测试数据皆基于此平台配置所产生。虽然我们使用的是截至评测时性能最强的处理器平台,但不同硬件平台配置和游戏具体设置之间有偏差,所得成绩数据数值可能会有所差异,请大家理性分析看待。我们测试重点在于解析RTX 4090与RTX 3090 Ti之间的性能迭代升级幅度。

临评测完成快要发布时,我们偶然发现测试平台与英特尔i9-2900K平台(其他配置相同)之间,因各种兼容性和硬件配置问题,存在一定的性能差距,特此说明。读者如果看到其他平台测试数据与本文测试结果在绝对值上有差异,仅供参考。

3DMark理论测试

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

在3DMark理论3D性能的测试部分,可以清楚地看到RTX 4090相比RTX 3090 Ti在性能上有了飞跃的提升,平均提升幅度超过了50%。在Port Royal光追性能测试部分更是达到了73%的性能提升,与NVIDIA发布时的数据基本相符。

传统光追游戏性能测试

在传统游戏性能测试部分,我们一共选择了14款对显卡需求较高的热门游戏进行了测试,这其中包括了光栅游戏、光追游戏以及支持DLSS的光栅或光追游戏。在分辨率的选择上,我们将重点放在了8K及4K分辨率上,毕竟对于RTX 4090或RTX 3090 Ti这种配置24GB显存的性能巨兽来说,4K+的游戏才是征战的重点。而对于少部分需求较高的游戏,我们也测试了1440p分辨率下的游戏表现,以获得更均衡的GPU性能考核标准。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

虽然GeForce RTX 4090 GPU已经完整支持DLSS 3功能,但由于支持DLSS 3的游戏目前还不是主流,因此我们的一部分重心仍然还是将放在传统游戏以及支持DLSS 2的游戏(含光追游戏)上,通过这些传统游戏性能的测试,我们来考察GeForce RTX 4090在普遍意义上,相对于RTX 3090 Ti在性能上到底提升了多少,多花这1000块钱值不值。而关于DLSS 3的部分,由于这是一大核心重点,我们将在后文单独提出讨论分析。

打开网易新闻 查看更多图片

从整体的测试结果来看,GeForce RTX 4090还是表现出了比较强势的劲头,在所有参与测试的14款热门游戏中,RTX 4090相对于RTX 3090 Ti整体体现出了50%~100%的性能提升不等,基本达到了相对于RTX 3090 Ti的1.5~2倍的性能表现。这也基本与NVIDIA在发布会上公布的数据大致相符。对于首发价格相对于RTX 3090 Ti高1000元,但却能获得接近翻倍的性能提升,单从这一点来说,RTX 4090还是挺值的。最后我们也将游戏测试数据做了一个综合衡量的对比表格,供大家参考。

DLSS 3+系统延迟深度测试,RTX 40系的黑科技大杀器

关于DLSS 3的技术解析,请大家参考微型计算机微信公众号10月10日的深度技术文章。在这里我们只给出概述。DLSS 3是伴随RTX 40系GPU发布而诞生的一项进化技术,它是在DLSS 2的基础上演变而来。而相较于DLSS 2,DLSS 3除了同时具备DLSS 2的分辨率AI缩放渲染功能之外,其主要核心是利用RTX 40系GPU的OFA(光流加速器)对渲染画面进行插帧,在每两帧游戏画面之间额外插入一帧,这样理论上就能够实现相对于DLSS 2最大帧率翻倍的性能提升。由于需要用到40系列的OFA,因此目前DLSS 3仅支持RTX 40系GPU。

此外,在DLSS 3中,NVIDIA还将Reflex打包植入了DLSS 3之中,这与DLSS 2可以单独调节支持Reflex的游戏也有所不同。因此我们在分析DLSS 3带来的性能提升时,也将一并分析Reflex对游戏系统整体延迟的影响。除此之外,由于最新的Frameview软件现在可以同时测试游戏的帧率、1% Low帧率以及PC系统延迟,因此我们也将在测试数据中对这些参数进行详细的解析,以更好地了解DLSS 3所带来的好处。

到首发评测结束时,市面上尚未有支持DLSS 3功能的游戏上线,因此我们的测试游戏皆来自游戏厂商和NVIDIA提供的Beta测试版或测试Demo。

以下测试皆基于GeForce RTX 4090 GPU

3DMark DLSS性能测试

3DMark即将在新的更新中加入NVIDIA DLSS 3的针对性测试(或许到你看到本文的时候,3DMark已经更新),而我们也在测试过程中拿到了更新了DLSS 3测试的Beta版。首先就来看看在3DMark DLSS性能测试中,RTX 4090和RTX 3090 Ti会有怎样的表现。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

从3DMark的DLSS性能测试中可以看出,在传统的DLSS性能测试中,RTX 4090横向对比RTX 3090 Ti,其性能提升程度约为50%~70%。而对比RTX 4090开启DLSS 3与RTX 3090 Ti开启DLSS 2的情况,开启DLSS 3之后RTX 4090的游戏、渲染帧率表现再度翻倍。这也说明了DLSS 3的Frame Generation功能起到了至关重要的作用,当然也是RTX 40系GPU独享的功能。

理论性能部分测试完毕,接下来让我们将目光放在游戏上。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

首先来看用Unity引擎做的游戏测试Demo《Unity:Enimies》。在全部最高等级的设置下,DLSS 3开启之后相相对于关闭DLSS的情况,帧率实现了接近翻倍的提升。同时,DLSS 3自动开启了Reflex,游戏系统的延迟在4K分辨率下降了约50%,在1440p下也大概下降了30%左右,十分明显。另外想说一下的是1% Low fps这个参数。关闭DLSS 3时,在1440p分辨率下1% Low fps约为41fps,而开启DLSS 3之后随着帧率的大幅度提升,1% Low fps也提升到了63fps左右,也就意味着基本不会出现时不时的卡顿现象,游戏更加流畅。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

在《瘟疫传说:安魂曲》的Beta测试版中,同样可以清楚地看到,在8K分辨率下开启DLSS 3之后,帧率提升程度达到了300%以上,相对DLSS 2也有50%以上的提升幅度。而在系统延迟上,8K分辨率下开启DLSS 3之后,系统延迟从176ms降低到了47ms,降低程度达到了75%以上,十分可观。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

《赛博朋克2077》Beta测试版的结果也比较相近,4K分辨率下开启DLSS 3之后,帧率提升程度达到了300%以上,DLSS 2相对于关闭DLSS的情况则约为200%的程度。同时系统延迟也有40%以上的降低,1% Low fps也从18fps提升到了87fps,游戏流畅性得到了极大的改善。当然,由于DLSS的作用机理,在1440p分辨率开启DLSS平衡模式后下帧率的提升程度略有下降,但仍然达到了200%以上。

打开网易新闻 查看更多图片

本次测试中我们测试了一个《逆水寒》的全景光追效果的Demo,这个Demo采用了基于路径追踪的全景光追效果,对显卡的计算能力带来了极大的压力。在RTX 4090显卡下,即使开启DLSS 2,4K分辨率下游戏帧率也保持在40fps以下,在关闭了DLSS之后,游戏帧率更是只有可怜的15fps左右,没有一点流畅性可言。不过在开启了DLSS 3之后,游戏帧率瞬间提升到了63fps,提升程度达到了400%以上。即使相对于DLSS 2,DLSS 3也带来了1.8倍左右的性能提升。而在游戏延迟方面,开启DLSS 3之后,系统整体延迟更是降低了80%以上,性能表现卓越。

打开网易新闻 查看更多图片

《微软模拟飞行》算是一个不算冷门的冷门游戏,在全球范围内也有着不少数量的小众粉丝。在本次测试中,我们拿到了这一游戏的DLSS 3测试版并进行了相关测试。测试结果也基本不出乎意外之外,在开启DLSS 3之后,游戏帧率相对于DLSS关闭的情况达到了接近200%左右的提升,相对于DLSS 2的情况,也有1.6倍左右的性能提升。

DLSS 3 Vs. DLSS 2

接下来我们再来看看RTX 3090 Ti开启DLSS 2和RTX 4090开启DLSS 2、DLSS 3的综合情况。从这一测试中我们可以更清楚地了解DLSS 3能为RTX 4090带来相对于RTX 3090 Ti多大的游戏性能提升。同样,测试的游戏也是我们上面用于DLSS 3测试的专用Beta版或Demo,并新增了《F1 22》支持DLSS 3的Beta测试版。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

非常清楚地看到,在与RTX 3090 Ti的DLSS 2性能相比较中,RTX 4090在相同设置下相对于RTX 3090 Ti仅能开启DLSS 2的情况,DLSS 3模式下帧率基本都实现或接近翻倍的效果。尤其是在《赛博朋克2077》Beta测试版和《逆水寒》全景光追Demo测试中,RTX 4090+DLSS 3的游戏帧率相对于RTX 3090 Ti+DLSS 2提升程度分别达到了120%和200%,效果立竿见影。

游戏性能测试总结

RTX 4090的传统游戏性能相对于RTX 3090 Ti提升幅度在50%~100%之间,十分可观;

RTX 4090在支持DLSS 3的游戏中,性能相对于开启DLSS 2的RTX 3090 Ti,性能基本达到了翻倍甚至更高;

DLSS 3表现出了非常强劲的势头,不光是帧率巨幅提升,系统延迟、1% Low fps都有非常明显的提升,可以将其称为RTX 40系GPU最大黑科技武器。

DLSS 3在帧率提升上性能卓越,那么相对于DLSS 2和原生画质,它是否又会带来明显的损失?我们用《赛博朋克2077》Beta测试版中的游戏画面进行了检测。检测工具当然是NVIDIA提供的iCAT图形图像分析处理软件。

打开网易新闻 查看更多图片

▲4K+DLSS性能模式画质比较

打开网易新闻 查看更多图片

▲8K+DLSS超级性能画质比较

从我们用于检测的游戏截图来看,在4K分辨率+DLSS性能模式的设置下,无论是DLSS 2还是DLSS 3,最终呈现的游戏画面相对于原生画质几乎看不出损失,与原生画质相差不大。对比DLSS 3和DLSS 2的性能模式,也可以看出二者基本没有差别,甚至DLSS 3模式下的画质还略微清晰一些。

在8K+DLSS超级性能模式设置下也基本一样,不过这时DLSS 2和DLSS 3的游戏画面在放大到200%之后能看出一些轻微的细节损失,不过在100%游戏画面下,三张图片仍然看不出明显差别。这足以说明DLSS 3对游戏画质的影响几乎可以忽略不计,至少多绝大多数玩家来说,完全不用担心开启DLSS 3之后在游戏中看到明显的画质损失。

再来看《逆水寒》全景光追Demo场景中的情况,我们同样在4K分辨率下截取了原生、DLSS 2和DLSS 3设置下的相同游戏画面,在iCAT中进行对比。

打开网易新闻 查看更多图片

▲在4K分辨率下开启DLSS 3 性能模式(图左)之后,相比原生画质(图中)和DLSS 2(图右)你甚至不会感觉到任何差异,画质没有任何差别。

打开网易新闻 查看更多图片

▲在对比视频的截图中可以看到,放大300%之后,DLSS 3下的4K画质(图左)相比原生画质(图中)丝毫不逊色,甚至在清晰度上还略有过之。所以开启DLSS 3的玩家完全没必要担心画质的损失,尤其是在4K+分辨率时,画质的表现甚至更加优秀。

打开网易新闻 查看更多图片

▲在夜空场景下,可以看到放大500%的视频同场景中,原生画质甚至出现了明显的锯齿(图中),但DLSS 3开启之后,锯齿则被很好地抑制住了,整体画质感觉更平滑清晰。

打开网易新闻 查看更多图片

▲原生画质(图中)远景处放大可以看到栏杆有明显的断裂状,但DLSS 3和DLSS 2皆非常平滑,没有画面的撕裂感和锯齿感。

就在刚才,我们收到了来自NVIDIA的信息,NVIDIA表示结合GeForce RTX 4090的全球发布,DLSS 3游戏发布情况将进行快速更新。以下是即将亮相的支持DLSS 3的游戏资讯(以下新版本更新或新游戏发布日期皆为支持DLSS 3的版本上市日期)。

●《超级人类》(SUPER PEOPLE):抢先体验版 10月12日13:00发布

●《生死轮回》(Loopmancer) 10月12日发布更新版

●《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新图形展示将于10月13日发布

●《微软模拟飞行》(Microsoft Flight Simulator):10月17日为Xbox Insider计划成员推出测试版

●《瘟疫传说:安魂曲》(A Plague Tale: Requiem):10月18日发布

另外, DLSS 3已经得到了许多全球领先游戏开发者的支持, 超过35款游戏和应用宣布即将支持该技术,包括:

《瘟疫传说:安魂曲》(A Plague Tale: Requiem)、《原子之心》(Atomic Heart)、《黑神话: 悟空》(Black Myth: Wukong)、《光明记忆: 无限》(Bright Memory: Infinite)、《切尔诺贝利人》(Chernobylite)、《战意》(Conqueror's Blade)、《赛博朋克2077》 (Cyberpunk 2077)、《达喀尔拉力赛》(Dakar Desert Rally)、《火星孤征》(Deliver Us Mars)、《毁灭全人类2: 重新探测》(Destroy All Humans! 2 - Reprobed)、《消逝的光芒2: 人与仁之战》(Dying Light 2: Stay Human)、《F1 22》《暗影火炬城》(F.I.S.T.: Forged In Shadow Torch)、寒霜引擎、《杀手3》(HITMAN 3)、《霍格沃茨:遗产》(Hogwarts Legacy)、《翼星求生》(ICARUS)、《侏罗纪世界:进化2》(Jurassic World Evolution 2)、《逆水寒》(Justice)、《生死轮回》(Loopmancer)、《星际海盗》(Marauders)、《漫威蜘蛛侠: 重制版》(Marvel’s Spider-Man Remastered)、《微软模拟飞行》(Microsoft Flight Simulator)、《午夜猎魂》(Midnight Ghost Hunt)、《骑马与砍杀2: 霸主》(Mount & Blade II: Bannerlord)、《永劫无间》(Naraka: Bladepoint)、NVIDIA Omniverse、NVIDIA Racer RTX、《破灭》(PERISH)、《传送门》RTX版(Portal with RTX)、Ripout、《潜行者2:切尔诺贝利之心》(S.T.A.L.K.E.R. 2:Heart of Chernobyl)、《炼狱神罚》(Scathe)、《超级人类》(SUPER PEOPLE)、《仙剑奇侠传七》(Sword and Fairy 7)、《重生边缘》SYNCED、《指环王: 咕噜》(The Lord of the Rings: Gollum)、《巫师3:狂猎》(The Witcher 3: Wild Hunt)、《王权与自由》(THRONE AND LIBERTY)、《幻塔》(Tower of Fantasy)、Unity、虚幻引擎 4 & 5、《战锤40K: 暗潮》(Warhammer 40,000: Darktide)。

创作设计,性能提升喜人

和RTX 3090、RTX 3090 Ti一样,设计创作应用当然是RTX 4090 GPU在4K+游戏领域之外的另一重要征战地。因此,RTX 4090在这一应用领域的表现如何,当然也引起了我们足够的兴趣,相信专注于这一领域的用户也有些迫不及待地想知道吧。

在这部分测试中,我们主要进行了两方面的测试,即应用最广的3D建模渲染和视频编辑处理。又因为双AV1编解码器的加入是RTX 40系GPU的核心特点之一,我们也特别进行了AV1视频和双编码器相关的体验。

视频、图片编辑处理

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

在首先进行的测试中我们选择了Premiere Pro 2022和剪映Pro进行视频转码测试。但很明显可以看出,现在的Premiere Pro和剪映对RTX 4090的双NVENC配置支持度并不好,不但还暂不支持AV1编码输出,而且视频编辑性能相对于RTX 3090 Ti的提升幅度很小,Premiere Pro中即使在8K视频转4K H.264视频的测试中也只有不到30%的提升程度,在其他两项测试中提升程度更是不到5%。而在剪映 Pro中,H.265视频转码测试RTX 4090领先约40%,H.264转码输出领先约20%,表现尚可。目前剪映对40系新编码器的支持的版本为3.5.0 beta测试版,且仅在4k分辨率导出的情况下才能调用到双编码器,而本次测试基于3.4.1正式版,因此这一成绩并不是4090的完全体,我们也希望剪映在4090发布后能尽快更新正式版,对新硬件提供更好的优化。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

在图片处理软件Photoshop的PugetBench测试中,RTX 4090相对于RTX 3090 Ti性能提升了50%左右。而在图片缩放处理软件ON1 Resize测试中,我们对5张6K图片进行了200%的AI无损放大处理,最后显示RTX 4090相对于RTX 3090 Ti的性能提升在70%左右,性能表现非常优秀。

打开网易新闻 查看更多图片

另一款视频编辑处理软件Davinci Resolve Studio的测试中,我们提前拿到了支持RTX 40系GPU双NVENC及支持NVIDIA AV1编码器的8.0 Beta版(到RTX 40系GPU上市时,Davinci Resolve应该会正式更新)并进行了相关的视频编辑转码测试。

在测试中我们选择了两段Prores 422HQ源视频,并在Davinci Resolve中进行了转码相关的对比测试(由于RTX 3090 Ti不支持AV1编码输出,因此无AV1编码输出相关对比数据,我们将在AV1视频的编解码体验中单独讲述)。测试结果显示,无论是4K源视频转H.265还是8K源视频转H.265编码输出,RTX 4090都表现出了100%以上的性能提升程度。在对视频进行魔法背景遮罩处理的AI剪辑工作中,RTX 4090相对于RTX 3090也有接近80%的性能提升。可以看出在支持RTX 40系GPU的视频处理软件中,RTX 4090的性能得到了充分的发挥,相对于RTX 3090 Ti的领先优势也十分明显。因此这让人也更加期望Premiere Pro赶快加入对RTX 40系GPU双编码器的支持吧!

3D建模渲染

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

3D建模渲染的测试部分我们选择了常用的四款软件 3DS Max 2023、Blender 3.1和SketchUp Pro 2022以及Octane Render,另外还加入了Blender Opendata benchmark的测试。

从整体测试来看,在建模渲染能力上,Blender Opendata benchmark、Blender 3.1以及Octane Render的各项测试中,RTX 4090相对于RTX 3090 Ti的性能提升幅度都在80%~100%,着实令人惊喜。在3DS Max 2023和SketchUp Pro 2022的模型渲染测试中,我们搭配了最新的V-Ray渲染插件,测试结果显示在这两款软件应用中,RTX 4090相对于RTX 3090 Ti也有40%~80%的性能提升,表现令人满意。

最后来谈谈RTX 40系GPU的AV1双编码器。由于目前除了RTX 40系和英特尔Arc独显之外,其他GPU暂时还不支持AV1硬件编码加速。所以在编码性能的对比测试部分,我们暂时找不到合适的对比对象。不过我们可以通过编码输出AV1和H.264视频,并通过iCAT软件来分析两段同源视频,以此体验以下AV1视频的优秀之处。

打开网易新闻 查看更多图片

首先我们通过OBS推流软件,录制了一段4K分辨率、MP4格式H.264编码的《古墓丽影:暗影》游戏内的Benchmark视频,长约3分钟。

然后我们用支持AV1编码转码输出的Davinci Resolve Studio 18将这段视频分别输出为1080p分辨率/6000Kbps码率的AV1格式视频、H.264视频和H.265视频。

打开网易新闻 查看更多图片

▲从导出的视频属性可以看出,AV1编码时,视频容量为700MB左右,而H.264编码的视频容量则达到了1.2GB。由此也可以看出AV1编码的高效。但容量减少如此之多,其质量能得到保证吗?

打开NVIDIA iCAT图形图像分析软件。

打开网易新闻 查看更多图片

将我们转码好的AV1格式和H.264格式的视频导入到iCAT中。

打开网易新闻 查看更多图片

在iCAT图像分析软件中,我们可以采用左右分频或重叠分割屏幕对比的方式来对两段不同格式的视频进行详细的画质对比。

打开网易新闻 查看更多图片

在播放的任何时候我们都可以随时暂停,并对画面进行放大、缩小等操作,从而可以对视频中的任何一帧进行详细比较。从对比中可以看出,AV1编码输出的1080p视频在画质上丝毫不逊色于H.264视频,在放大300%之后观察,甚至可以发现AV1编码还比H.264质量更高。

打开网易新闻 查看更多图片

▲在Split Screen模式下对比两段视频的任一帧,即使放大500%,仍然看不出明显的差别,AV1编码甚至更清晰一点点。

由此可见,AV1编码确实具备了高效、高质量的特色,毫无疑问代表着未来视频编码的主流方向。尤其时对于现在广大的UP主来说,更高效的编码加上更优秀的画质,很难想象还有什么能阻挡AV1编码视频的风靡,拭目以待吧!

散热与超频

对RTX 4090 FE显卡来说,散热从来都不应该是重点与问题。但本着显卡评测的核心之一,我们还是考察了RTX 4090 Founders Edition在散热与功耗方面的问题。

打开网易新闻 查看更多图片

首先在散热方面,经过Furmark烤机15分钟后,RTX 4090 Founders Edition的温度最终稳定在了72℃左右,虽然相比RTX 3090的63℃左右高了一些,但考虑到TGP增加了近50%,这点温度的升高是完全在情理之中的。甚至还可以说温度控制得比较到位,当然也和更大更厚的改进散热架构有一定的关系。

打开网易新闻 查看更多图片

说到超频,我们也尝试了用第三方软件对RTX 4090 Founders Edition进行了超频尝试,结果显示最高Boost频率可以稳定在2650MHz左右,相比默认频率提升了130MHz左右,性能提升约3%~5%。明显能感觉到NVIDIA将FE公版的整体功耗限制在了450W左右,想要突破必须得改动相关得BIOS设置,显然这还得要AIC得产品去完成极限的挑战了。不过还是那句话,对Founders Edition显卡来说,极限超频从来都不是它的菜,超频这一块的研究,还是放到非公版的AIC显卡上去吧。

毋庸置疑,实至名归的卡皇已到

按照惯例,先把我们前面所有的测试结果来个简洁整理吧:

1.GeForce RTX 4090采用新一代Ada Lovelace架构,规格参数上大幅度领先于前一代旗舰GeForce RTX 3090;

2.在绝大多数当前的主流游戏性能上,GeForce RTX 4090相对于RTX 3090 Ti有50%~100%的性能提升,十分可观;

3.GeForce RTX 4090带来了全新的DLSS 3技术,采用AI插帧算法,理论上最高可以实现同设置下DLSS 2的翻倍帧率提升,这是RTX 40系GPU最大的核心特色之一。在实际测试中也可以发现,DLSS 3相对于DLSS 2的帧率几乎都达到了80%以上的提升幅度。同比关闭DLSS的情况,开启DLSS 3之后,GeForce RTX 4090的游戏帧率可以达到3~5倍的提升程度,而且几乎不影响画质。

4.在设计创作性能上,GeForce RTX 4090加入了支持AV1编码的双NVENC编解码器,影音视频编辑创作将会更加高效。同时在建模渲染能力上,RTX 4090相对RTX 3090 Ti也有40%~100%的性能提升。

在完成了GeForce RTX 4090 Founders Edition的测试之后,我们最大的感慨就是NVIDIA这一次很好地在升级和换代之间把握好了尺度。对于核心架构来说,或许相对于Ampere还称不上具有革命性意义的换代,但是说到创新性的规格进化,我们觉得RTX 4090可以说是做到了完美。毫无疑问,全新OFA光流加速器的加入带来的DLSS进化到第三代,是本次RTX 40系GPU的核心特色重点,同时加上更新的SM带来的SER光追算法与能力提升,以及TSMC定制4nm工艺的应用,使得RTX 4090相对于RTX 3090 Ti表现出了跨越式的性能增长。无论是游戏性能还是设计创作性能,它都堪称当前消费级显卡之最,而且将上一代的卡皇RTX 3090 Ti以50%~100%的性能领先幅度甩在了身后。其实我们甚至觉得只需要一个DLSS 3,就足以让RTX 4090高处不胜寒了,也足以满足无数玩家一年多时间对RTX 40系GPU的期待。当然,作为旗舰产品,12999元的首发指导价也确实不算便宜,相信AIC的产品会更高一点。如果你的预算充足不差钱,那么我们强烈建议你即刻入手享受。如果预算有限,也不妨再等等,11月上市的RTX 4080甚至更往后一点的RTX 4070、RTX 4060也许会更适合你。但无论如何,就这次RTX 40系GPU的整体情况而言,我们认为它是实至名归的性能大升级,也值得拥有。尤其是GeForce RTX 4090更是当之无愧的新一代卡皇,实至名归!

明天,《微型计算机》将为大家呈现更多AIC厂商的非公版GeForce RTX 4090显卡评测,您不妨关注。

另外,值得一提的是,本次NVIDIA将限量推出GeForce RTX 4090 FE版,于北京时间10月12日晚9点在京东首发上市,旨在为钟爱FE版设计的发烧级玩家带来无与伦比的体验。届时玩家可以选购来自NVIDIA FE版和来自顶级显卡供应商的RTX 4090 GPU标频版和超频版。

APP:

https://pro.m.jd.com/mall/active/2Q3QibQnDKAMZ2q1o6J7nE4ahjFm/index.html

PC:

https://pro.jd.com/mall/active/2Q3QibQnDKAMZ2q1o6J7nE4ahjFm/index.html