【天极网DIY硬件频道】时隔两年,NVIDIA终于在9月1日为游戏爱好者带来新一代Ampere架构的GeForce显卡,率先登场的三款产品分别是RTX3090、RTX3080和RTX3070,分别取代RTXTITAN、RTX2080Ti和RTX2070Super。需要注意的是,国内没有公版的RTX3080,用户只能在AIC购买非公版本。

打开网易新闻 查看更多图片

三款产品中最早解禁的是公版RTX3080,解禁时间为9月16日,9月17日解禁非公版,本次评测的非公版RTX3080显卡来自iGame的Ultra10G。

打开网易新闻 查看更多图片

NVIDIARTX3080显卡采用三星8nm工艺制造,内建7组GPC,每组GPC有12个SM单元,NVIDIA关闭其中16组SM单元,为显卡提供68组、共8704个CUDA;显卡则采用最新一代频率17GHz的GDDR6X,拥有320bit位宽,总显存容量达10GB。

GeForce安培架构解析

GA100核心架构图

对于用户来说,安培架构GeForce显卡最明显的提升就是CUDA数量翻倍,而且GeForce显卡和同源的安培GA100大核的架构差异巨大。安培GA100核心架构分为四大部分,分别是16个FP32+16个INT32混合单元、32个FP32、32个FP64和TensorCore组成,安培GA100核心每个周期可以同步执行64个运算。

打开网易新闻 查看更多图片
GA102核心架构图

消费级GeForce的情况略有不同,NVIDIA直接取消其中的FP64单元,并减小TensorCore部分,增加RTCore,应对游戏使用需求。从GPU内部的架构图可以看到,每个SM单元细分为4个区,每个分区除了第三代TensorCore核心外,还有16个FP32单元、16个FP32/INT32组成的混合单元,其中混合单元可执行FP32或INT32运算。

每个分区执行16个FP32,加上16个FP32或者16个INT32运算,四个分区就可以实现4*32(32个FP32或16个FP32+16个INT32)运算,也就是一个周期内可以同时执行128个运算,这也是GeForce如果性能翻倍的根本原因。换句话说,只算浮点性能,安培GeForce显卡的性能已经实现翻倍。

为了确保运算性能,NVIDIA提升FP32性能需要配套,首先是一级缓存容量提高33%,并将带宽从116GB/s提高至219GB/s,共享内存的性能也从每周期64B翻倍到128B。

iGameGeForceRTX3080Ultra10G解析

与公版RTX3080采用正反双风扇设计不同,iGameRTX3080Ultra10G采用传统的三风扇设计。为了加强显卡的散热能力,7条热管和大面积鳍片,你能够快速将核心、显存以及供电等部分的热量带走。如此高规格的散热器,使显卡的整体厚度达到3槽,加上超过30cm的长度,让小机箱用户变得十分难受。

接口方面,RTX3080提供3个DP1.4a接口和1个HDMI2.1接口。iGame还为RTX3080Ultra10G提供一键超频按钮,方便用户切换到高性能BIOS。

打开网易新闻 查看更多图片

显卡散热器采用7条直径8mm热管,热管与鳍片之间采用回流焊工艺,使鳍片与热管成为一体,提升散热器的导热效率。

显卡背部配备一块大面积的金属背板,不仅为PCB提供更优秀的抗变形能力,iGame还十分巧妙的在显存部分加入导热贴,提升显存部位的散热能力。

作为一款TDP达320W的显卡,iGameRTX3080Ultra10G并没有采用公版新的12pin供电接口,而是由3个8pin接口为显卡供电,配合PCIe最大可提供525W的功率,确保显卡稳定运行。

iGame为RTX3080Ultra10G提供高达20相供电,其输入、输出滤波电容均来自富士通。

显卡核心为GA102-200-KD-A1,内建280亿个晶体管、核心面积628mm2,默认频率1440MHz,最高加速频率1710MHz。

10颗美光显存组成10GB容量,320Bit位宽、19GHz频率下,拥有760GB/s带宽。

理论性能测试

理论性能测试以3DMark为主,测试项目包括1080P、2K、4K分辨率的基准成绩、DX12性能、光线追踪和DLSS性能。与对位的RTX2080Ti进行对比。

除了为用户带来更优秀的游戏体验外,RTX3080同样可为用户带来出色的生产力。NVIDIA在Studio中内置包含AI加速功能的专用驱动和工具,让显卡提供更出色的渲染效果,缩短渲染时间。RTX3080显卡还提供新一代硬件编码和解码技术,为直播用户提供实时高编码视频录制和直播。

测试平台

CPU:英特尔酷睿i5-10600K

主板:iGame Z490 Vulcan X

内存:昂达DDR4 2666 8GB*2

显卡:iGame GeForce RTX 3080 Ultra 10G

电源:鑫谷昆仑KL750W

RTX3080在基于DX12的TimeSpy中得到13916分,TimeSpyExtreme得分则是7159分。与RTX2080Ti相比,TimeSpy有超过25%的性能提升,4K场景的TimeSpyExtreme提升超过30%。

在基于DX11的FireStrike测试中,RTX3080得分到26752,FireStrikeExtreme得到18036分,FireStrikeUltra得分10655分。与RTX2080Ti,RTX3080在4K分辨率的DX11场景下的提升均超过30%,幅度还是非常不错的。

在第二代RTCore的加持下,RTX3080的光追性能比RTX2080Ti高30%;第三代TensorCore夹持下的DLSS性能同样有超过25%的性能提升。

3DMark11的X分性能

与公版RTX 3080采用新散热设计不同,传统的散热器和3槽的高度,确保iGame RTX 3080 Ultra 10G拥有足够出色的散热能力,为热设计功耗达320W的GPU提供散热。为了更好的测试显卡的温度控制和噪音情况,笔者选择AIDA 64和FurMark进行1小时烤机测试。

在满载测试过程中,iGameRTX3080Ultra10G在通过iGamecenter手动将频率拉到1800MHz之后,在100%满载时的最大噪音为61.9分贝,最高温度也飙升至75摄氏度,比公版普遍的78度要低一些,毕竟三风扇和3槽的厚度,为显卡带来更优秀的散热能力。

游戏性能测试

作为高性能游戏显卡,GeForceRTX3080的游戏实测性能如何?笔者分别在1080P、2K和4K分辨率下,测试《巫师3》、《GTA5》、《战地5》、《孤岛惊魂5》、《绝地求生》、《刺客信条:奥德赛》、《古墓丽影:暗影》七款主流游戏,并记录游戏平均帧数,对比上代的RTX2080Ti、RTX2080两款显卡。

在1080P分辨率下,RTX3080的领先幅度最小,游戏的平均帧数仅比RTX2080高38%,比RTX2080Ti高约16%。如果使用1080P的高刷新率电竞显示器,用户暂时无需考虑升级RTX30系列。

2K分辨率下,RTX3080的性能比RTX2080Ti高达约25%,比RTX2080高52%,性能差距开始体现。但RTX2080在《刺客信条:奥德赛》平均帧数达到60帧,性能可满足2K分辨率的使用需求,但部分场景较低的帧数依然会对游戏体验造成影响。

RTX3080在4K分辨率下开始拉开差距,性能领先RTX2080Ti约33%,比RTX2080高67%。从测试的成绩可以看到,RTX3080在4K分辨率下的提升幅度巨大,流畅玩3A大作压力不大。

评测总结:在9月1日的发布会上,NVIDIA号称RTX30系列实现性能和热效率大幅度提升。从首发GeForceRTX3080来看,与RTX2080Ti相比有接近30%的性能提升,光追性能也提升50%。而且iGameGeForceRTX无论是散热设计、稳定性都十分出色,公版5499元的定价只有RTX2080Ti的一半,性价比至少翻番,对价格敏感的游戏用户十分重要。