RX Vgea的性能可以成为GTX 1080的有力挑战者吗?要知道虽然上市晚得多、功耗和价格也完全不占优势,但是市场要拥有RX Vega才显得完整。在成功发布Vega架构显卡之后,AMD的下一个重点就是Naiv架构显卡。

本文约3798字,需6分钟阅读

经过长达数月的集火轰炸之后,关于Radeon RX Vega显卡的性能测试,不只是对于小编们,相信对于读者来说其实也应该是有些厌倦的,在特意查找后台信息之后,发现早在去年3月份的GDC 2016大会,即公布双芯Radeon Pro Duo显卡的同时就已经正式公布后续线路图,其中织女星(Vega)、仙后座(Naiv)便以赫然在列。还是在三月份,外媒VideoCardz已经爆出Vega 10核心的部分细节,包括4096流处理器。此后在长达一年多的过山车中,关于Vega的任何细枝末节都会被我们先送上火车进行搬运,然后放在显微镜下观察,尤其是进入夏天之后,我们几乎已经榨干Vega Frontier的评测价值,包括游戏性能和专业性能。

打开网易新闻 查看更多图片

终于在今晚,AMD Radeon RX Vega显卡的最终性能得到解禁,我们首先来看看评测界的标杆:AnandTech的测试,虽然很遗憾的没有带来水冷版本的RX Vega,他们测试的主角是完整版的Vega 64风冷版,以及精简核心的Vega 56,两者在架构上延续Fiji,不过前者拥有64组CU单元,后者精简到56组CU单元。频率方面我们此前介绍过,都没有超过1600MHz,前者1247/1546MHz,后者1156/1471MHz,看来这应该是已经目前架构下,格罗方德工艺下的大核心的极限,而今晚对比的显卡则是同为公版的GTX 1070、GTX 1080、GTX 1080 Ti Founder Edition。

Vega简介:

AMD Radeon RX Vega终于呈现在我们面前,AMD终于在高端显卡市场上威风了一把。大家都渴望看到AMD如何呈现出最显卡。

AMD今天正式发布的RX Vega 64显卡将会基于满血版的Vega 10核心,同时拥有两个不同形态显卡,一个是风冷版、一个是水冷板。风冷版是基于传统的默认频率设计,还会分为普通版和“信仰”限量版。

RX Vega 64水冷板就更加强大了,和Radeon R9 Fury X一样使用外部的冷排进行散热,最大限度压榨出Vega 10核心的威力,进而可以boost/超频至更高的频率。所以说AMD今年已经认识到玩家所追求的东西不单单是性能,而且要有“逼格”、有性能。

RX Vega 56虽然是发布了,但是实际推出日期要到8月28日。这张卡对于大家来说可能更为甜点一些,虽然削减了一部分NCU单元,更低的默认频率,但是AMD设置了一个更低价格来匹配它的定位,更重要的是TDP也只有210W。

另外NVIDIA在AMD缺席高端显卡市场时间里,布置了GTX 1070、GTX 1080、GTX 1080 Ti、Titan Xp等等几款高性能显卡,AMD在过去一年里非常被动,尽管Polaris显卡帮助其挽回了部分市场份额,但是实际上要用Palaris显卡来对抗NVIDIA是非常困难的,知道今天AMD推出了RX Vega显卡,结束了这场尴尬。

按照AMD布局,RX Vega 64对位GTX 1080,RX Vega 56对位GTX 1070,性能基本上可以持平NVIDIA显卡。而且价格上或许有些优势,但是目前由于挖矿事业火热朝天,矿主们的加入可能使得AMD显卡价格提升甚至是缺货。

打开网易新闻 查看更多图片

anandtech表示AMD直到上周四才拿到RX Vega显卡,这意味着他们只有不到4天时间来完成评测,用来评估显卡性能时间非常有限。最后并吐槽了AMD的混乱管理,并要求评测媒体更多地关注RX Vega 56表现。

我们先来回顾一下Vega 10核心的主要特性,你很快就会发现,这一切似乎有些熟悉,是的,和一年多前的高端大核心Fiji有异曲同工之妙。64组NCU单元(之前叫CU单元),4096个流处理器,其他如纹理单元和光栅单元都是和Fiji核心一致。大家很好奇为什么AMD在Vega上没有扩大其规模,AMD工程师明确表示硬件规模虽然是一个基本限制,他们也知道怎么去构建一个规模更大核心,但是这样会花费更多额外工作。他们权衡利弊,决定将重点放在了应用上,重点利用HBCC以及减少无用功计算来提升Vega 10核心性能。

如果我们关注的地方从Vega 10核心上离开,你会发现与Fiji大不同的地方。第一个就是HBM 2显存,这一代RX Vega只要1片HBM 2显存就能到8GB水平,内存控制器直接减少了一半。虽然我们看到HBM 2没有达到预期的速度(512GB/s),但是单片显存确实减少了集成在GPU核心基板上的难度。

要注意的是Vega 10虽然也使用了infinity Fabric总线,但时钟频率与显存频率是分开控制的。还有一个问题值得大家关注,Vega 10虽然是Fiji的替代品,但不完全取代Hawaii,因为Hawaii完完全全就是为了HPC服务的,超高的FP64双精度性能(FP32:FP64=2:1)以及支持ECC功能。而Vega 10 FP32:FP64=16:1,虽然是提供了ECC功能,但仅限于内部使用,并不是的端到端的ECC。

Vega 10核心面积虽然高达486mm2,但是对比Fiji已经小了不少,全靠来自好基友GlobalFoundries的14nm LPP工艺。晶体管数目也是突飞猛进,高达125亿,比起Fiji多了39亿,比对手NVIDIA GP102核心还要多5亿。所以说Vega 10是目前消费级市场上晶体管数目最多的GPU,没有之一。

那么多出来的晶体管用在哪里呢?在没有更大规模的流处理器上,之恩给你归咎于Vega显卡的新架构、新特性上。

打开网易新闻 查看更多图片

另外我们惊喜地发现Vega 10核心频率可以达到1.7GHz,而不是Fiji那可怜的1.05GHz,提升达70%,这也是AMD在不增加NCU单元基础上,做到性能提升的秘诀。高频=高性能永远是不会错的。

整体来说Vega 10对于AMD来说是一个非常重要、关键的GPU核心,这将会成为AMD旗舰游戏卡GPU、专业卡GPU、服务器GPU,也是深度学习计算卡的重要组成部分。AMD没有能力做到与NVIDIA产品一对一的竞争,这表明AMD需要更聪明,充分地利用Vega 10完成多方位布局。

Vega 10不会孤独,因为有消息人士指出还有Vega 11核心产品在当中,鉴于Vega 10是一个庞大的核心,Vega 11核心规模将会比较小,就像是Polaris一样。

Vega 10作为GPU核心架构重塑之后第五代产品,会叫CGN 5.0吗?这个还真不知道,因为AMD在公开场合没有使用过这个称呼,一直都叫Vega架构,在回避这个核心架构问题。

另外Vega 10添加了FP16单元,使得可以提高某些视频处理器和8位整数操作上的性能,但是Vega没有从根本上颠覆之前的架构。他们还是有很多共通指出。很多人问,Vega架构的IPC会高于Fiji吗,anandtech给出了否定的答案。

Vega GPU中首度引入了紧缩的半精度计算支持,Vega的微架构被称为“NCU(下一代计算单元)”,每个NCU中拥有64个ALU,它可以灵活地执行紧缩数学操作指令,如每个周期可以进行512个8位数学计算,或者256个16位计算,或者128个32位计算。这不仅充分利用了硬件资源,也大幅度提升Vega在深度学习计算的性能。效果也非常显著,在之前公布的Radeon Instinct MI25计算卡就是基于Vega架构的,其FP32单精度浮点性能12.5TFLOPS,而半精度FP16性能直接翻倍到25TFLOPS。

现有的GCN单元中每个CU计算单元是64个流处理器,实际上是由4组固定16-Wide的单元组成,而Vega显卡的NCU单元中流处理器数目更具灵活性,可以根据工作负载来动态调配。AMD与NVIDIA在单精度与半精度单元使用上如出一辙,都是可以将两个16bit单元组装成一个完成的32bit单元使用。

RX Vega显卡介绍:

Vega显卡作为AMD今年的旗舰,RX Vega 64核心代号Vega 10 XT,一共64组NCU单元,每组又是64个流处理器单元,共同构成4096个流处理器,256个纹理单元,64个光栅单元,4MB的L2缓存。8GB的HBM 2,显存位宽为2048bit,而显存带宽高达484GB/s,略低于上上一代Fury X的512GB/s。RX Vega 64水冷版频率范围是1406-1677MHz,RX Vega 64普通版/限量版频率范围是1247-1546MHz。

RX Vega 56核心代号Vega 10 XL,NCU单元减少至56组,共3584个流处理器,224个纹理单元,64个光栅单元,4MB的L2缓存。8GB的HBM 2显存,显存位宽为2048bit,显存频率有所降低,导致显存带宽为410GB/s。RX Vega 56则稍微低一些,但也有1156-1471MHz水平。

在我们此前的游戏评测当中,争议比较多的地方在于Vega Frontier使用的驱动到底能不能表现出真实的游戏性能,而现在就是揭晓的时刻。首先来看看《战地1》的测试,在全部都是极高设定(Ultra)环境下,首先看看4K分辨率表现,RX Vega 64的帧数为58.1,略高与GTX 1080 Founder Edition的51.5帧,Vega 56可以跑到51.5帧紧追在后,GTX 1070 Founder Edition的整机为42.6帧,有明显差距。

再来看1080P分辨率的测试,在较为宽松的环境下,Vega 64竟然和GTX 1080交换位置,以130.3帧的成绩略输与后者的134.5帧,倒是Vega 56实现反超GTX 1070,前者为121帧,后者110.8帧。那么在《战地1》当中可以算是各有胜负。

打开网易新闻 查看更多图片

而在《奇点灰烬》当中的情况与《战地1》相似,测试全部是在极高设置下(Extreme Quality)进行。我们可以看到在4K分辨率下Vega 64的帧率依然略高于GTX 1080,前者成绩为59.1帧,后者为56.5帧,虽然差距说不上大,不过这里要注意的是,堂堂挟新架构、大显存加身的Vega 56竟然表现不如Fury X。。而在我们更加熟悉的1080P分辨率,Vega 64以很小的差距输给GTX 1080,前者成绩为81帧,后者成绩为84.8帧,同样算不上差距很大。而Vega 56凭借72.2帧的超过Fury X的67.9帧、GTX 1070的67.6帧。

这里要顺便吐个槽,虽然平时在知识储备、测试方案等方面都将AnandTech作为测试的标杆,但是在游戏测试部分,AnandTech完全没有列出没有自带Benchmark的游戏的测试环境是哪里?方案是什么?API是DirectX 11、DirectX 12?还是Vulkan?比如接下来的《毁灭战士4》。我们首先看看4K分辨率下的极高测试(Ultra),Vega 64的帧数为69.3,超过GTX 1080的61.6,这已经算是可感的差距。Vega 56的帧数为61.4帧,都很流畅,也高于Fury X的54.4帧,GTX 1070的50.3帧。

Vega还把领先优势带到1080P分辨率,Vega 64领先GTX 1080的优势更大,前者可以达到183帧,而后者可以达到170.7帧,而Vega 56可以跑出167帧,远超Fury X的143.2帧、GTX 1070的141.1帧,从领先优势来看这应该实在Vulkan API进行的测试。

《幽灵行动:荒野》的配置要求很高,或者说优化程度很低,并且其中就算预设的设置也包括NVIDIA GameWorks的新技术,比如草地特效和体积光等等,那么Vega的表现会如何呢?首先在4K分辨率、非常高(Very High)的测试下,(小编注:非常高并不是最高设置)Vega 64败下阵来,它可以跑出38.6帧,而GTX 1080可以跑出39.9帧,算是站在同一水平,而Vega 56可以跑出34.7帧,超过GTX 1070的32.7帧、Fury X的30.5帧。

那么在1080P分辨率呢?那就非常不好意思,Vega 64的成绩只有65.3帧,和Vega 56的64.4帧几乎处于同一水平,甚至Fury X的62帧也就在不远看着,而GTX 1070可以跑出75.8帧、GTX 1080可以跑出90帧,GTX 1080 Ti的三位数可以无视。

如果说《幽灵行动:荒野》的不仅优化差,针对性也过为强烈的话,那么我们接下来再看看《杀出重围:人类分裂》,这款游戏的要求丝毫不必《幽灵行动》来的低,甚至更为苛刻,那么两方表现如何呢?首先在4K分辨率,Vega 64凭借28.6的帧数超过GTX 1080的28.2帧,虽然这种流畅度已经没有现实意义,两张卡的性能也在咫尺之间。而Vega 56也很争气地超过GTX 1070,前者25.5帧,后者22.5帧,不过事实是两边都很卡顿。在1080P分辨率下Vega 64凭借2帧的优势领先GTX 1080,前者77帧、后者75帧依然保持很紧张的竞争,而Vega 56的69帧则可以和GTX 1070的61.3帧拉出不少身位。

如果说上面两款游戏的针对性太强的话,《侠盗猎车手V》应该的倾向性应该要温和一些,我们首先来看看4K分辨率,哇,Vega 64的28.8帧几乎和Vega 56的25.6帧处于同一水平,而GTX 1070可以跑出30.9帧,GTX 1080可以跑出38.3帧,那么1080P分辨率呢?Vega 64的79.9帧依然和Vega 56的73.5帧区别不大,但是GTX 1070依然可以跑出94.1帧,而GTX 1080更是可以跑出110.2帧。

综上,小编认为应该说RX Vgea的性能可以成为GTX 1080的有力挑战者,虽然上市很晚、功耗和价格都不占优势,但是市场要拥有RX Vega才显得完整。在成功发布Vega架构显卡之后,AMD的下一个重点就是Naiv架构显卡。