对于DIYer来说,今年的处理器市场无疑是近10年来最为精彩的,凭借基于ZEN架构的AMD锐龙7、锐龙5、锐龙3处理器的上市,AMD处理器在性能与价格上都与竞争对手英特尔的同级产品展开了有力的竞争,如今四核处理器即将成为主流市场标配,只需1500元就能买到拥有12条运算线程的处理器,这激烈的竞争为消费者带来了切实的好处。不过在有个领域,在今天晚上9点之前,却长时间处于一家独大的局面——这就是顶级消费级处理器市场。

打开网易新闻 查看更多图片

自2006年英特尔推出Core微架构,并发布Core 2 Extreme X6800顶级处理器击败当时的AMD FX-62处理器后,在长达11年的时间里,Extreme系列处理器一直借助首屈一指的性能,以及配套的各类X58、X79、X99、X299等高端主板称霸顶级处理器市场。

不过情况在今年终于有了一点改变,从基于AMD ZEN架构的锐龙处理器表现可以看到,这类处理器不仅单线程性能有了大幅提升,还通过加入SMT技术大幅提升了处理器的多线程运算能力,也就意味着ZEN架构不仅可以打造出像锐龙7、锐龙5这样的中高端处理器,更拥有开发出顶级处理器的潜力。

终于在11年之后,在今晚9点以后,这个猜想成为了现实。AMD再次重返顶级处理器市场了,带来了其新一代顶级产品——AMD 锐龙Threadripper处理器,以及配套的X399主板。

它是否拥有将现在的英特尔顶级处理器即Core i9系列斩于马下的能力?

自从AMD发布了全新的Zen架构的锐龙处理器家族后,AMD在CPU市场上的颓势地位就彻底改变了。锐龙的发布意味着AMD不仅重新开始推出顶级处理器,而且还通过挑战英特尔,重新引导市场走向健康的竞争发展中。战火总是永不停息的。在锐龙处理器发布后,AMD又开始布局全新的市场,将目光转向那些更高端、对更多CPU核心有需求的用户。

从市场角度和用户组成的情况来看,高端市场不仅仅只是游戏玩家,还有大量对渲染、3D建模、视频编辑、音频编辑、代码编译等工作有需求的用户。这些用户在之前只能选择最多四个物理核心的高端处理器来加速自己的工作,或者被迫选择更昂贵和稀少的专业级产品。不过,随着AMD全新推出的锐龙Threadripper系列处理器,这样的态势将彻底发生变化。

目前AMD推出了两款锐龙Threadripper处理器,型号分别是锐龙Threadripper 1950X和锐龙Threadripper 1920X。对于其规格列表如下:

从表中可以看出,这两款处理器在维持了高核心数量(均超过10个)的同时,在频率上也没有缩水,其中锐龙 Threadripper 1950X的最高频率甚至可以达到4.2GHz(当然只有4个核心开启的状态下),L2和L3缓存容量也至少达到了38MB,可以说AMD本次基本上属于将之前的超多核心、面向服务器和工业领域的高端处理器产品拓展至民用市场,极大的拓宽了民用市场用户的选择范围。

打开网易新闻 查看更多图片

▲锐龙Threadripper处理器抛弃了传统处理器所用的纸盒包装,每颗处理器都采用类似存放珠宝的大型首饰盒包装起来。包装外围由一层软性泡沫材质包裹,中间上部开有一个透明视窗,印有“Ryzen Threadripper”字样以及“ZEN”的经典图案。

▲处理器外围配有一层橙色安装导轨,可不用取下,安装时可引导插入处理器插槽相应的导轨中。同时,处理器附送了内六角安装螺丝刀。

▲可以看到Threadripper处理器比普通的8核心锐龙7处理器大了很多

另外,新的锐龙 Threadripper处理器全部改用了LGA封装,接口也换成全新的SocketTR4,简称sTR4,针脚触点数量高达4094个,远超英特尔之前HEDT平台的LGA 2066针脚数量,因此整个处理器的面积也大了不少,安装上也需要特殊扣具辅助。

和一般处理器安装不同的是,锐龙 Threadripper需要插入主板CPU扣具的固定槽内后,用螺丝固定在CPU扣具上,再涂抹硅脂并安装散热器。用户应该可以在主板说明书和CPU说明书上找到相应的说明。

打开网易新闻 查看更多图片

▲安装处理器时,需先遵照插槽上的提示,按顺序分别拧松编号为3、2、1的内六角螺丝,打开插槽,揭开保护盖。

▲再借助橙色导轨,将处理器插入插槽保护盖一侧的固定槽内。

▲然后将处理器平放在插槽上方,并按顺序分别拧紧编号为1、2、3的内六角螺丝即完成安装。

5大特点——使用在锐龙 Threadripper上的AMD Zen架构

有关AMD的Zen架构,之前本刊介绍过多次。在这里,本文还将简要回顾一下锐龙 Threadripper处理器所采用的Zen架构的特性。

根据AMD官方描述,Zen微架构拥有的以下几大特点:

01

更高的性能

采用了全新的增强指令集并行,大幅度提高了单线程性能。AMD Zen架构的设计目的在于有效提升了处理器的IPC。在内核架构上主要做出了四方面的改进:

一是采用了1.75倍于之前架构的、更大的指令调度器窗口以及1.5倍于之前架构的排序宽度和资源,大大缓解了指令拥塞情况。

二是采用了全新的缓存架构,允许部分频繁访问的微操作绕过L2和L3缓存直接读取。

三是采用了全新设计的、基于神经网络预测的分支预测单元,大幅度提高了分支预测效率,降低了由于分支预测失败带来灾难性后果的可能性。

四是加入了SMT功能,可以大幅度提高指令管线的填充度,提高效率。

▲Zen架构方面的改进

02

更大的吞吐量

通过全新的缓存结构和预取引擎,大幅度提升了数据吞吐速率。具体来说,Zen架构彻底改变了缓存体系,采用为每个核心配备64KB L1指令和数据缓存,以及512KB L2专用缓存,同时四个内核共享的8MB L3缓存的设计方案,更符合现代处理器的实际需求。

同时缓存带宽大幅度提升至前代产品的5倍,提高了缓存存取效率。此外,AMD还专门为缓存设计了一个预取器,用于推测那些数据将可能被缓存储存、那些数据可能会被核心调用,大幅度提高了缓存利用效率。

打开网易新闻 查看更多图片

▲Zen架构在缓存方面做出了重大调整

03

更好的能耗比

从设计端开始,以低功耗、高性能为目的设计产品,加入更多的智能和主动地管理处理器功耗功能,降低无效损耗,提高处理器能耗比。在这一点上,Zen架构的产品采用了全新的14nm FinFET密度优化版本工艺制造,相比前代28nm甚至32nm工艺,在大幅度降低了电压、漏电电流等不利因素的同时,提升了频率和能耗比。值得一提的是,这种全新的14nm工艺允许使用更低的工作电压和更小的管芯尺寸,从而进一步降低功耗、提升频率。

另外,AMD在架构方面改进(比如前文提到的微操作改进)、时钟管理政策的改善等,都带来了Zen架构产品在性能功耗比上的优异表现,这使得Zen架构可以从低功耗移动版处理器扩展至HEDT产品,拥有巨大的功耗弹性。

▲Zen架构加入了很多节能方面的设计。

04

更出色的可扩展性

通过使用名为Infinity Fabric的全新高性能连接,实现不同处理器模块的有效扩展,以及AMD不同IP核心之间的通讯。AMD的Infinity Fabric总线不仅可以通过其双向42GB/s的带宽实现不同CCX之间的高速连接,AMD还还可以利用Infinity Fabric实现对处理器不同核心之间的电压、温度、功耗、频率等细节数据进行实时的控制和调整,实现处理器的高效率运行。

▲Zen架构设计了基础核心,被称为CCX。所有的Zen架构、Ryzen家族的处理器都是基于这款核心扩展而来。

05

两种内存工作模式

AMD的锐龙 Threadripper处理器不仅规模大、技术新颖,还加入了不少新的技术。在内存方面,为了让用户有更出色的使用体验,AMD提供了两种不同的内存模式供用户选择。

▲AMD的Ryzen Master调节软件里提供了两种内存模式切换功能,本次测试中我们还是采用了默认的Distributed Mode。

其中一种模式被称为Distributed Mode,也就是采用UMA(Uniform Memory Access)统一内存访问模式。在这种模式下,系统将统一、优先使用所有可用的内存通道并自动分配相应任务。这种模式下,内存的总体性能和带宽表现会比较出色,这也是AMD的默认模式。

另一种模式被称为Local Mode,采用的是nUMA(Non-Uniform Memory Access)非统一内存访问模式。这种模式下,CPU核心和控制器最优先处理内存物理结构上离处理器最近的DIMM中的内容,除非内容过大会溢出到下一个内存模块。实际应用中,如果将游戏或者需要加快处理速度的应用放置在离CPU最近的DIMM中,可以降低这些应用的延迟并提高整体效能。

AMD在自家的Ryzen Master工具软件中,提供了两种模式调整的软件开关,用户只需要下载并安装Ryzen Master,就可以直接手动选择是采用Distributed亦或是Local模式。AMD还提供了测试数据,理论数据来看,Local模式下的延迟要比Distributed模式大约低了23%,从86.9ns降低至66.2ns,但内存传输带宽也低了最高约18%。而在实际应用中,这两种内存工作模式的影响则复杂得多。根据AMD的评估,在75个游戏中,无论是Distributed还是Local模式,对不同游戏的影响是不确定的,Local模式大约会有5%到10%(峰值)的增益。

总的来说,AMD提供的两种模式各有优劣,一般玩家使用默认模式就好,在本次测试中,我们也是采用Distributed Mode进行测试。对于追求极限、技术上也比较成熟的玩家可以考虑使用nUMA模式获得与众不同的性能体验,不过可能需要一些额外操作,还需要进一步研究才能充分发挥其性能,本刊也将在后续对这一模式进行深度测试。

连接、扩展——锐龙 Threadripper架构

目前AMD和英特尔都在推出超多核心处理器。比如英特尔的Xeon至强家族,就推出了最高达28核心的方案。不过,在核心数量超过4个以后,核心之间的互联和同步问题就成为了处理器设计的关键因素之一,在这一点上,AMD和英特尔走向了完全不同的道路。在这里,本文先说一些题外话。

英特尔在早期的超多核心设计中采用的是环形总线架构。相比传统的交叉总线架构,环形总线架构的优势要明确的多:环形总线结构更为简单,更为节省晶体管、功耗较低、在恰当的优化下能够带来非常不错的性能。英特尔在环形总线上的首款产品就是大名鼎鼎的Nehalem,后来又通过不断的优化,从一条环形总线到两条,英特尔的超多核心处理器从之前的6~8核心发展到最多22~24个,环形总线这才走向技术终点。

环形总线的优势主要是结构简单,但是随着核心数量越来越多,其缺陷也逐渐放大。比如环形总线上每个核心挂接的点也越来越多,使得延迟逐渐增高。尤其是缓存一致性广播等,需要不断的在环形总线只减传递数据,维持不同物理核心的同步,核心太多会导致数据传输等待时间变长。

在最差的情况下,双环形总线的两个物理核心同步延迟甚至会高达数十个周期,这会带来性能的大幅度降低和能源的损耗。因此,英特尔在新的处理器上放弃了环形总线设计,改用了全新的Mesh网络,同时为此彻底更新了处理器的缓存设计——环形总线的L3缓存较大,方便一致性的同时可以同时为多个处理器提供共享服务。

但是Mesh网路下,每个处理器都是节点,都可以传递和广播数据,这样一来一个较大的L3存在的意义就被削弱了,因此英特尔改用了较大的L2和较小的L3,并且不再采用包含式结构,转而采用独立式缓存设计,L2和L3缓存数据互不影响,从本代产品开始,英特尔全面采用Mesh互联架构设计超多核心处理器,从目前的测试来看,其效果和性能表现还是不错的。

回到AMD这里来。目前AMD所有的锐龙家族处理器产品都源于一个原生的四核心模块,被称为一个CPU Complex(CCX),CCX的内部链接可能是交叉互联也可能是通过其他的方式,由于其核心数量较少(只有四个物理核心),因此其技术难度相对来说低很多。对外部来说,AMD希望通过扩展CCX数量实现处理器核心数量增加,这就意味着各个CCX之间的连接就会成为关键。如果观察AMD发布的代号为“Naples”的EPYC处理器,就会发现AMD实际上是将两个CCX绑定为一个模块,然后再通过Infinity Fabric总线将其连接起来。

从宏观上看,Naples处理器四个模块之间使用的依旧是传统的交叉互联方案,只是总线换成了Infinity Fabric。每个模块的两个CCX再用Infinity Fabric连接在一起。比如桌面版本的锐龙 7就是两个CCX模块使用Infinity Fabric总线连接获得的“4+4”八核心处理器,也就是两个CCX的Infinity Fabric总线直连。更高端的服务器版本的32核心霄龙EPYC处理器使用的是“(4+4)×4”的设计,四个模块采用Infinity Fabric总线交叉互联。

锐龙 Threadripper处理器则采用的是“(4+4)×2”或者“(3+3)×2”的方式,也就是两个模块采用Infinity Fabric总线直连的方案。

▲AMD展示的EYPC处理器,可见四个核心模块在一个基板上。

▲AMD EYPC Naples处理器的内部链接架构简图

从连接角度来说,AMD的这种设计实际上避开了超多核心处理器设计所需要面对的物理连接上的问题,也避开了诸如使用环形总线或者Mesh架构这样的选择。相比环形总线或者Mesh网络,传统的交叉总线连接各模块的主要问题在于模块和模块之间的同步和并行性问题应该如何解决,也就是说如果两个不同CCX之间需要通讯的话,如何解决通讯延迟和带宽问题。在环形总线上,解决这个问题的是环形总线本身,在Mesh网络中,每个核心自己就是收发站,可以转发信息并选择最快、最近、不拥堵的路径。

举例来说,当两个具有高度相关性的线程同时在系统中运行时,操作系统可能将其随机分配在任何两个空闲的核心执行。如果是环形总线或者Mesh网络的话,在处理器内部能够以比较高的高效率互联互通,延迟甚至可以被各种方法所优化、掩蔽,或者处理器在调配中可以将这两个线程再度分配至拥有共享资源的两个核心执行(处理器对操作系统而言被看做一个整体的话),这样可以实现降低延迟、提高效率的目的。

但在传统网络中,如果两个有相关性的线程被分配给完全不同的两个模块处理,比如A模块处理线程1,B模块处理线程0,同时线程1和线程0存在高度相关性,其数据共享、一致性就需要通过总线来完成,这无疑增加了大量的通讯延迟。因为对传统结构的处理器来说,处理器A模块的A1核心和B模块的B1核心的通讯,需要通过A模块的转发中心转发至Infinity Fabric总线后,再交由B模块的转发中心,再到达B1核心,中间的延迟和带宽可能还是能够对性能产生影响的。

这还仅仅是一种情况,实际操作中,如果存在对带宽敏感的应用,那么最好将这个应用的不同线程均分在不同的CCX上,使其能够使用更多的DDR4带宽,因为每个CCX只能管理一对DDR4控制器。如果对延迟高度敏感,那么最好将所有线程都塞入一个CCX(当然最好小于等于4个),这样线程可以高速共享L3缓存,性能会有最佳表现。如果出现具有相关性、带宽敏感和延迟敏感的应用的多个线程需要执行,这就非常考验AMD的优化能力了。

另外,考虑到AMD宣称Infinity Fabric总线的双向带宽为42GB/s,目前单通道DDR4内存的带宽差不多也在20GB/s左右,Infinity Fabric总线的带宽实际上相当于双通道DDR内存,即使延迟和读取方面Infinity Fabric总线拥有绝对优势,但是这样的带宽和总线设计是否能满足CPU内部庞大的数据流量需求,尚不得而知。无论如何,CCX搭配Infinity Fabric总线的设计方案,还是需要尽可能的多的软件和系统优化才能发挥出应有的性能。

▲AMD展示的锐龙Threadripper处理器内部链接简图。

▲国外玩家对Ryzen Threadripper的开盖结果,和EYPC处理器如出一辙。

继续来看Threadripper。根据目前的消息来看,AMD的Threadripper处理器更像是从服务器级别的EPYC处理器中“下放”而来。因为从CPU接口以及内部核心排布来看,锐龙Threadripper处理器内部依旧存在四个模块,也就是8个CCX,32个物理核心。对锐龙Threadripper 1950X来说,AMD屏蔽了2个模块或者4个CCX、16个核心,实现“(4+4)×2”;对锐龙Threadripper 1920X来说,AMD在屏蔽2个模块或者4个CCX、16个核心的基础上,在开启的4个CCX中还额外每CCX屏蔽一个核心,最终实现了12个核心的效果,实现“(3+3)×2”。

目前AMD尚未对任何有关锐龙Threadripper处理器为什么使用这么多模块以及为何拆盖后有四个Die的问题给出明确的回答。这也引发了一些讨论,诸如未开启的模块是否依旧可以使用Infinity Fabric总线,两个开启的模块之间的Infinity Fabric总线连接是否有且只有一条——因为从实用角度考虑,如果能够有更多的总线连接两个模块,带宽资源和传输能力更高的话,对处理器实际并行计算时的表现还是有正向影响的,只是不知道AMD是如何处理的。

全新接口、全新芯片组——X399芯片组解析

在发布全新处理器的同时,AMD也发布了全新的X399芯片组与之相配。由于现代处理器已经都集成了诸如内存控制器、PCI-E总线控制器、SATA总线控制器、USB控制器等部件,因此芯片组主要用于提供诸如更多的USB、SATA、网络接口等功能。

▲AMD X399芯片组与锐龙处理器扩展能力对比,可见PCIe 3.0通道主要由处理器提供,X399芯片组主要提供USB 3.1、SATA接口。

AMD X399芯片组额外提供了2个USB 3.1 Gen 2,6个USB 3.1 Gen 1,6个USB 2.0,2个PCI-E 3.0通道和8个PCIe 2.0通道、8个SATA以及SATA RAID功能。当然,这是芯片组所提供的最大可连接设备数量,在实际使用中,厂商可能会根据需要来调整,比如将PCI-E 3.0通道转为PCI-E Express或者SATA接口等。另外,X399和CPU的连接依靠的是PCI-E 3.0 4X通道,从规格上来看,这是额外的通道,并不会占用芯片组本身的连接通道数量。

在和CPU搭配时,X399搭配CPU能够带来总计最多66条PCI-E 3.0通道,其中64条来自CPU,用户可以用其组建多卡系统或者更强悍的高速磁盘系统。比如AMD宣称可以搭配成2个PCI-E 3.0 16X搭配2个PCI-E 3.0 8X以及3个NVMe,或者是6个PCI-E 3.0 8X搭配1个4X NVMe,当然具体如何使用,还需要根据用户和厂商设计来定。

由于目前CPU支持四通道内存,但由于内存规格和兼容性等问题,X399主板搭配锐龙Threadripper处理器使用时,还存在不同的搭配情况。根据AMD官方说明,在启用四通道内存的情况下,根据内存Ranks(就是单面、双面内存)不同、每通道内DIMM数量不同(就是每通道插入多少内存条,最多每通道只支持2根内存条),内存频率会有显著差异,最高可以支持DDR4 2667,这是在使用四通道、单面内存、每通道一根内存条的情况下,最低只能使用到DDR4 1866,这是四通道、双面内存、每通道两根内存的情况下。

出现这种问题主要是考虑到内存同步和数据刷新延迟等,一般内存通道越多、Ranks越多、DIMM数量越多,支持的同步频率就会越低。

在超频功能上,X399支持对CPU的自由超频功能。因为目前所有锐龙Threadripper处理器都是不锁倍频的,用户可以自行调整核心频率、电压等设置。

首发X399主板大赏:ROG ZENITH EXTREME

不知大家是否记得,当今顶级主板品牌ROG的起源,实际上也来源于AMD平台。ROG第一款产品就是为Athlon 64 FX CPU设计出Crosshair主板。可以说ROG始于AMD高端桌面平台,现今华硕又为X399芯片组和锐龙Threadripper处理器,打造出ROG ZENITH EXTREME主板。此主板以天顶为名,将超频、散热、光影糅合一体,意在为玩家带来全新的AMD平台体验。

▲8相CPU核心供电设计,搭配IR国际整流器公司IR 3555M PowIRstage一体式封装MOSFET、日系黑金固态电容、12颗松下SP-Cap聚合物铝电容。

为了有力地支持像锐龙Threadripper这样的超多核心顶级处理器,ROG ZENITH EXTREME主板采用了优秀的做工用料。首先其处理器供电部分采用了8相CPU核心供电设计,每相供电电路搭配最大可承载60A电流的IR国际整流器公司IR 3555M PowIRstage一体式封装MOSFET,也就是说8相供电电路最大可承载480A电流,应对锐龙Threadripper处理器180W的TDP可以说绰绰有余。

此外主板处理器供电部分不仅搭配了可在105℃环境温度下工作10000小时的日系黑金固态电容、全封闭电感,还在主板PCB背面配备了总计12颗松下SP-Cap聚合物铝电容。SP-Cap聚合物铝电容是采用高导电率的聚合物材料作为阴极的片式叠层铝电解电容器。此类电容具有极低的等效串联电阻(ESR),降低纹波电压能力强,允许通过更大纹波电流。聚合物片式叠层铝电解电容器在高频下,阻抗曲线呈现近似理想电容器特性。

在频率变化情况下,电容量非常稳定,更适合在高频、高负载环境下工作,一般仅在高端板卡产品上能看到此类SP-Cap聚合物铝电容的采用。

▲LiveDash OLED显示屏不仅可以显示各种监控信息,还可显示非常有趣的小动画、LOGO。

最有特色的是在主板散热器上配备了名为LiveDash的OLED显示屏,玩家可通过它方便地掌握系统温度、CPU频率、风扇转速等信息。同时,用户还可以在这个小窗口上显示各种黑白动画(可加载显示用户自己设计的动画),如华硕LOGO、奔跑的恐龙、UFO,非常有趣,也令玩家的电脑更显个性化。

▲附送ROG Areion万兆网卡

网络方面,该主板不仅板载了支持802.11ad协议、理论传输速度可达4600Mbps的无线网卡,还为用户附送了最新的ROG Areion万兆网卡。这款网卡采用传统的半刀卡造型,占用单槽空间,与常规声卡和PCIe SSD差不多。同时它还配备了半封闭式铝合金保护罩,还有CNC工艺雕刻、醒目的ROG“败家之眼”LOGO。网卡芯片基于Aquantia的AQtion AQC107方案,并设计有大型散热片辅助散热,以保证网卡的稳定工作。

网卡接口采用了高大上的PCIe 3.0 x4,尾部提供自适应单LAN RJ45端口,兼容100Mbps、1Gbps、2.5Gbps、5Gbps和10Gbps。另外,尾部LAN口和PCB边缘设有指示灯,可显示工作状态。

▲借助AURA SYNC同步发光技术,主板可以多种色彩显示。

同时ROG ZENITH EXTREME主板也支持目前流行的AURA SYNC同步发光技术,不仅主板自身可以静态、呼吸、闪烁、多彩循环、节奏等多种模式、多种色彩显示,还可与其他支持AURA SYNC的灯带、显卡、外设等可发光配件以相同的模式、速度显示灯效,帮助玩家打造更加宏伟的整机灯效。

▲ROG ZENITH EXTREME主板上的DIMM.2 模组扩展卡可以帮助用户额外安装两块M.2 SSD。

此外ROG ZENITH EXTREME主板也拥有ROG主板特有的DIMM.2 模组扩展卡,通过一个DDR4插槽可扩展2个M.2 SSD插槽,此创新设计可以让用户在M.2 固态硬盘上安装内存条散热马甲,获得更高、更稳定的性能,也可支持更多的M.2 SSD。加上主板PCB上的M.2插槽,ROG ZENITH EXTREME主板最多可支持三块M.2 SSD。

▲识别本二维码,可直接前往ROG ZENITH EXTREME主板的销售页面,了解活动详情。

总体来看,ROG ZENITH EXTREME主板就是一款为锐龙Threadripper处理器量身打造的顶级产品,整合使用了各种功能与高品质元件,其官方售价在6999元左右。目前京东交100元定金可抵1000元的活动,使得该主板的售价大降至6099元,比较超值。扫描下图的二维码,就可直接前往ROG ZENITH EXTREME的销售页面,了解活动详情。

我们如何测试(一级标题)

本次测试最大的目的就是在技术规格、配置相近的情况下,检验AMD锐龙Threadripper处理器的性能是否能与价位相近的Core i9-7900X 10核心处理器匹敌。因此首先我们将通过基准性能、应用性能、游戏性能、处理器温度以及平台功耗这几大板块来进行锐龙Threadripper 1950X、锐龙Threadripper 1920X与Core i9-7900X的对比测试,同时,我们将对两款锐龙Threadripper处理器进行超频测试,以考察在采用超多核心设计时,处理器是否还拥有超频能力。

测试平台一览

主板:ROG Zenith Extreme、华硕PRIME X299-DELUXE

处理器:锐龙Threadripper 1950X、锐龙Threadripper 1920X

内存:芝奇TridentZ DDR4 3200 32GB内存套装(8GB×4)

硬盘:三星960PRO 512GB SSD+东芝饥饿鲨512GB SATA SSD+希捷3TB HDD

显卡:ROG-STRIX-GTX1080TI-O11G-GAMING

散热器:TT FLOE RIING360水冷散热器

电源:TT TOUGH POWER DPS G 1250W电源

处理器性能测试

测试点评:首先从处理器基准测试来看,采用16核心设计的AMD锐龙Threadripper 1950X显然有非常巨大的优势,凭借核心数量多的优势,它在所有考察了多线程运算的测试项目中都取得了领先。如CINEBENCH R15多核心渲染性能达到3051cb,32个框框同时渲染的速度远远超过以往任何一款消费级处理器,几乎也就看了两条朋友圈的时间,渲染就完成了。

而采用12核心设计的锐龙Threadripper 1920X在大部分多线程测试中相对于10核心设计的Core i9-7900X也有一定的优势。当然英特尔Core i9-7900X处理器凭借双核心可工作在4.5GHz的频率优势,在单线程性能方面则有更好的表现。

内存性能测试

▲AMD锐龙Threadripper 1950X内存性能

▲AMD锐龙Threadripper 1920X内存性能

▲Core i9-7900X内存性能

测试点评:内存性能方面,虽然AMD锐龙Threadripper处理器的官方规格为最高支持四通道DDR4 2666内存,但在ROG ZENITH EXTREME主板的配合下,两款AMD锐龙Threadripper处理器都能与Core i9-7900X处理器一样,实现对四通道DDR4 3200的支持。

而从传输带宽来看AMD锐龙Threadripper处理器已经可与Core i9-7900X匹敌,尤其是其近90000MB/s写入带宽优势突出,达到了一个四通道内存系统的正常表现。不过在内存延迟上,锐龙处理器内存延迟较高的问题在Threadripper处理器上仍然存在,因此其总体内存性能较Core i9系统还是有小幅差距。

应用性能测试

测试点评

在应用性能测试中,我们采用了多种实际软件、实际工作负荷进行体验。如特别采用HandBrake视频转码工具测试了AMD锐龙Threadripper处理器与Core i9-7900X处理器将4K视频(容量达3.64GB)转码为1080p H.265视频的消耗时间。采用著名的3D绘图制作软件3ds MAX来渲染由三匹玻璃马组成的模型进行渲染,输出分辨率更设定在4K(4096×2731)。对于CG行业来说,渲染是一道非常消耗时间的工作,特别是渲染表现光线折射、反射等效果的玻璃材质。可以看到这些软件对于超多核心处理器都有很好的支持,锐龙Threadripper 1950X在渲染中比Core i9-7900X少用了307秒,也就是足足5分钟的时间。

此外我们还在著名的MATLAB商业运算软件TLAB中循环200次进行5000×5000的二维离散傅里叶变换,数据类型为单精度,两款AMD锐龙Threadripper处理器的用时也要更少一些,表现更好。

总体来看当前工作应用软件对超多核心处理器已经有很好的支持,这也使得锐龙Threadripper 1950X在所有应用性能测试中的表现要更胜一筹,比Core i9-7900X更适合在高负荷工作中使用。而对于锐龙Threadripper 1920X处理器来说,由于它的核心数只比Core i9-7900X多两颗,而Core i9-7900X在频率上又有优势,因此两者在实际应用中可以说是各有胜负。

游戏性能测试

测试点评:在大部分依赖处理器单线程性能的游戏中,毫无疑问Core i9-7900X处理器要有优势一些,如在《杀手6》、《孤岛危机3》中都取得了明显领先。当然现在不少新游戏、DirectX 12游戏对多核心的支持越来越好,同时加上不少着重画质的游戏更依赖显卡性能,因此在这些游戏中,三款处理器的差异很小。甚至在《杀出重围:人类分裂》、《坦克世界》中,锐龙Threadripper 1950X还有非常小幅度的领先。

综合来说,AMD锐龙Threadripper处理器在游戏性能上与Core i9处理器仍有一定差距,但差距不大,且都能为玩家在最高画质设定加抗锯齿的环境下,带来流畅的游戏体验。

完全胜出:多任务运行测试

在日常使用中,很多人实际上是需要同时执行多个任务的,如需要同时运行游戏、直播、直播录像、视频转码的游戏主播;同时运行游戏、渲染或转码的设计人员。让电脑边工作、边游戏,做事娱乐两不误可以说是很多人的梦想,但以前碍于处理器核心数太少,这样的需求难以实现,而AMD锐龙Threadripper处理器的一大设计目的就是让这个梦想成真。

测试点评

可以看到,在单独运行《杀手6》时,Core i9-7900X系统的确有较大的帧速优势,不过一旦同时开启虎牙直播进行游戏直播,并开启直播录像与Handbrake视频转码,其游戏平均帧速就从原来的159fps大幅下滑至仅仅60fps。而两款AMD锐龙Threadripper处理器的抗压性则非常好,游戏帧速都仍然维持在75~77fps左右,其游戏帧速在多任务环境下反超Core i9-7900X。

而在一边运行《孤岛危机3》,一边进行3ds Max渲染时,Core i9-7900X所受到的影响就更大了,渲染时间从原来的2614秒大幅增加到4058秒,渲染时间足足增加了1444秒即约24分钟,显然边玩游戏边工作是非常影响效率,不可取的。而锐龙Threadripper 1950X在此环境下的渲染时间则仅增加了6分钟多一点,锐龙Threadripper 1920X的渲染时间也只增加了约10分钟。

也就是说原本三款处理器在单一渲染任务下的渲染速度差距并不是太大,但在多任务环境下,借助核心、线程数优势,AMD锐龙Threadripper处理器就可以获得快得多的渲染速度,让电脑真正具备边玩、边工作的能力。

功耗与温度测试

测试点评:那么更多的核心数是否会为处理器带来更高的功耗与温度呢?我们特别测试了三款处理器的待机功耗与温度,并通过Prime95 In-place large FFTS测试了它们的满载功耗与温度。从测试来看,虽然两款AMD锐龙Threadripper处理器的温度的确比Core i9-7900X要高一些,但都控制在合理范围内,如满载温度均在70℃以内。

功耗方面,AMD锐龙Threadripper的表现也并不惊人,锐龙Threadripper 1920X的功耗比Core i9-7900X低一些,拥有16核心的锐龙Threadripper 1950X满载功耗也就比Core i9-7900X高了约10W。

▲搭载锐龙Threadripper 1950X满载工作时,ROG ZENITH EXTREME主板供电电路的最高温度只有67.7℃。

▲搭载锐龙Threadripper 1920X满载工作时,ROG ZENITH EXTREME主板供电电路的最高温度更低,只有63.7℃。

值得一提的是,借助主板做工优秀的8相供电电路,以及AMD锐龙Threadripper仅仅180W的TDP,它们在满载状态下,也没有给主板带来明显的压力。锐龙Threadripper 1950X满载运行半小时后,ROG ZENITH EXTREME主板供电电路的最高温度只有67.7℃,供电电路区域的平均温度仅53.8℃;锐龙Threadripper 1920X满载运行半小时后,ROG ZENITH EXTREME主板供电电路的最高温度只有63.7℃,供电电路区域的平均温度仅51.7℃,ROG ZENITH EXTREME主板可以轻松地支持AMD顶级处理器满载运行。

超频测试

▲在ROG ZENITH EXTREME的配合下,我们可将锐龙Threadripper 1950X处理器、锐龙Threadripper 1920X处理器分别超频到4.0GHz、4.1GHz。

既然锐龙Threadripper 1950X处理器在默认状态下的满载温度并不高,那么它的频率是否还有一定的提升空间呢?

接下来,我们还在ROG ZENITH EXTREME主板BIOS中对两款锐龙Threadripper 1920X处理器进行了超频尝试。而对锐龙Threadripper的超频非常简单。对于锐龙Threadripper 1950X处理器来说,只要将电压设定在1.37V左右,它就可以在水冷散热环境下,以4GHz频率稳定运行像Handbrake 4K视频转1080p H.265、CINEBENCH R15处理器多线程渲染这种重载工作,其性能又有一定提升,如CINEBENCH R15渲染性能从3051cb提升到3341cb,提升幅度近10%。

对锐龙Threadripper 1920X处理器而言,则只需要将工作电压设定为1.352V,它就可以非常稳定地工作在4.1GHz,并通过Prime95 In-place large FFTS半小时烤机测试,超频能力与超频稳定性比锐龙Threadripper 1950X要更好一些。超频后的性能提升幅度也比较明显,CINEBENCH R15渲染性能从2435cb提升到2743cb,提升幅度达12.6%。

▲超频后,锐龙Threadripper 1950X的SiSoftware Sandra算数处理器性能达到近500GOPS,堪称当前消费级处理器中的王者。

▲锐龙Threadripper 1920X处理器超频后的CINEBENCH R15渲染性能也得到了很大的提升

让竞争来得更猛烈一些吧!

整体来看,AMD锐龙Threadripper 1920X显然是打了一场有准备的战争。

锐龙Threadripper 1950X处理器的多线程性能全面优于Core i9-7900X,锐龙Threadripper 1920X与Core i9-7900X相比虽是互有胜负,但关键的是,在价格方面,两款AMD锐龙Threadripper处理器也有优势。目前锐龙Threadripper 1950X的实际售价仅为8499-550-100(电子消费卡)=7849元,锐龙Threadripper 1920X的实际售价为6999-550-100(电子消费卡)=6349元。

两款产品都比市场售价仍在7999元,10核心20线程配置的Core i9 7900X还要便宜。显然,对于那些渲染、3D建模、音视频转码等充分利用处理器多线程性能的工作或者同时运行游戏、渲染、直播、转码的游戏主播、设计工作人员来说,顶级的AMD锐龙Threadripper将是除了Core i9处理器之外一个新的、颇具吸引力的选择。而顶级处理器也将因为AMD锐龙Threadripper处理器的到来掀起一阵“血雨腥风”——价格、规格方面双方都会爆发更加激烈的竞争,当然最终受益的还是我们消费者,因此让这样的竞争来得更猛烈一些吧。