最新的AMD CPU 架构被称为Zen 4 ,AMD 凭借Ryzen 7000系列 CPU对英特尔发起全面正面攻击。虽然 AMD 凭借其之前的 Ryzen 处理器在 CPU 性能、定价和平台寿命方面取得了进步,赢得了 PC 购买者的极大好评,但说到说到做到,大多数购买者都会去他们能获得最大收益的地方。

那么, AMD Ryzen 7 7700X等新芯片很好地兑现了其性能承诺,这对 AMD 来说是件好事——其中两款芯片出现在我们的最佳游戏 CPU完整指南中。但是是什么让它们发挥作用以及 AMD 最新 CPU 中还隐藏着哪些其他功能呢?让我们仔细看看。

注意:本文部分内容参考:https://www.ecscoupon.com/5221.html(以下内容仅供参考)。

AMD Zen 4 平台和产品线

在深入研究 Zen 4 本身的架构之前,让我们快速回顾一下我们在这里讨论的处理器,其中包括芯片以及其他关键产品。

最初的发布名单中有四款 Ryzen 7000 系列 CPU:16 核Ryzen 9 7950X、12 核Ryzen 9 7900X、8 核 Ryzen 7 7770X 和 6 核Ryzen 5 7600X。所有这些 CPU 都支持同步多线程 (SMT),因此运行中的应用程序线程数是其内核数的两倍。

打开网易新闻 查看更多图片

从那时起,AMD 推出了更便宜的非 X CPU,例如 12 核Ryzen 9 7900,并且还推出了三款新芯片,这些芯片具有巨大的 3D V 缓存堆栈,并且末尾带有“3DX”他们的型号名称。 8 核版本给我们留下了深刻的印象,虽然它缺乏其他高端 Zen 4 CPU 的时钟速度,但其巨大的缓存使其成为一款强大的游戏芯片。

在非 3DX 芯片上,时钟速度远远超过 Zen 3 芯片。 16 核 7950X 的峰值单核时钟频率高达 5.7GHz,与Ryzen 9 5950X相比,最大时钟速度提高了 0.9GHz,即 18% 。所有其他发布的 CPU 也都具有不错的升压时钟,范围从 Ryzen 5 7600X 上的 5.3GHz 到 Ryzen 9 7900X 上的 5.6GHz。

然而,7000 系列时钟速度和处理能力普遍提高的一个负面后果是热量和功耗的增加——这是能源危机的理想时机。 5000 系列的热设计功耗 (TDP) 最高为 105W,但 7950X 和 7900X 的 TDP 均为 170W。您可能不需要升级电源来适应这些变化,除非您当前的电源已经达到极限,但正如在之前测试中发现的那样,高质量的冷却至关重要,因为这些芯片会发热。

打开网易新闻 查看更多图片

为了应对最大 TDP 的增加,AMD 还推出了一种 Eco 模式,可用于将 CPU TDP 限制为 105W 甚至 65W,尽管这显然会影响峰值性能,105W 时时钟速度会降至 5GHz 以下,甚至 4GHz 以下在我们的测试中为 65W。尽管如此,我们发现在启用 Eco 模式的情况下,我们的 Ryzen 7 7700X 测试芯片仍然可以获得出色的性能,正如您在我们的有关如何超频 AMD Ryzen 7000 CPU 的指南中看到的那样。

如果您想购买其中一款 CPU,则需要升级您的主板,因为新芯片使用新插槽。外面是 AM4 的引脚网格阵列 (PGA) 插座,其中引脚位于 CPU 上,而内部是焊盘网格阵列 (LGA) 布局,其中主板充当引脚的宿主,CPU 具有扁平的金接触点。

打开网易新闻 查看更多图片

从本质上讲,它将损坏引脚的负担从 CPU 转移到了主板制造商,但也允许更密集的引脚网格,AM5 支持 1,718 个触点,而 AM4 为 1,331 个触点。您可以阅读我们的最佳 AMD X670E 主板指南,以各种价格找到您的最佳选择。我们还建议在安装 AMD Zen 4 CPU 时 使用导热膏防护罩。

建议让你的 Ryzen 7000 系列升级更加昂贵的是需要投资 DDR5 内存,因为 Ryzen 7000 系列 CPU 和 AM5 主板根本不支持 DDR4 内存。 DDR5 具有时钟速度和功耗优势,但仍比 DDR4 要求更高。

最后,Ryzen 7000 系列处理器的另一个有趣的功能优势是它们都包含集成Radeon 显卡,这是标准 Ryzen 芯片的首创。假设您不喜欢游戏,因此不需要额外的专用显卡,这里的集成显卡将足以满足桌面工作,从而节省您额外显卡的成本。

AMD Zen 4 的秘密

拆开 Ryzen 7000 系列芯片的集成散热器 (IHS),您会看到两个或三个主芯片,由一两个 Zen 4 核心复合体 (CCX) 芯片 (CCD) 和输入/输出芯片 (IOD) 组成)。

IOD 控制核心芯片之间以及整个 CPU 与系统其余部分之间的通信。它包括 Infinity Fabric 互连、DDR5 DRAM 控制器、PCIe 5 接口、USB 3.2 接口等功能。这也是新 RDNA 2 集成 GPU 的所在地。

打开网易新闻 查看更多图片

同时,每个 CCD 都包含 8 个 Zen 4 核心,尽管只有部分核心可以启用,并且根据芯片的核心数量,您将获得一个或两个 CCD。例如,Ryzen 7 7770X 将有两个 CCD,每个 CCD 的两个核心被禁用。

除了核心之外,每个 CCD 还包含 32 个 1MB L3 缓存块,这些缓存块与第二个 CCD 的缓存组合在一起,形成整个 CPU 的单个共享 L3 缓存。当 CCD 的核心被禁用时,L3 缓存的相邻两个 1MB 块也会被禁用。

打开网易新闻 查看更多图片

除了 Infinity Fabric 互连区域和一些额外的系统管理单元之外,这就是 CCD 的全部组成部分 - 所有其余的 CPU 功能都被卸载到 IOD。

这种使用多个芯片实现不同功能的方法(称为小芯片设计)具有多种优点和一个主要缺点。其优点包括提高制造效率和成本,因为与包含 CPU 中所有部件的较大单个芯片相比,您可以在硅晶圆中安装更多较小的 CCD 芯片。

您还可以像AMD在这里所做的那样,对CPU的某些部分使用更便宜、更旧的工艺,只为核心保留最先进和最昂贵的工艺。任何缺陷的影响也会减少,因为一个损坏的 CCD 使用的硅比整个损坏的 CPU 芯片要少得多。

其他优点包括能够使用相同的核心构建模块创建各种 CPU 设计。使用相同的组件,AMD 理论上可以提供从 2 核到 16 核桌面处理器的任何设计,并且该公司的 EPYC 服务器处理器每个 CPU 最多使用 12 个 CCD。

小芯片设计的主要缺点是管理 CCD 和 IOD 之间的数据流。传统上,采用硅外互连会导致速度显着降低,但 AMD 已成功使其 Infinity Fabric 互连工作得足够好,使其小芯片设计能够跟上目前的步伐。

英特尔尚未在其 CPU 中使用小芯片设计。相反,它目前使用单块硅片来生产第 13 代 Raptor Lake 处理器,例如英特尔酷睿 i9-13900K。不过,未来它的 Meteor Lake CPU 将采用小芯片设计。

AMD 的 CCD 采用中国台湾半导体 (TSMC) 最新的 5 纳米工艺制造,但新的 IOD 是基于稍旧的 6 纳米台积电工艺制造的。两者都是 Ryzen 5000 系列的升级版,Ryzen 5000 系列的核心芯片采用 6nm 或 7nm 工艺,IOD 则采用 14nm 工艺。

打开网易新闻 查看更多图片

与以往一样,采用更小的制造工艺意味着更低的功耗,在这种情况下,时钟速度也有相当显着的提高。 AMD 声称,在与 Ryzen 5000 系列芯片相同的性能水平下,Ryzen 7000 系列 CPU 的功耗将下降 62%,或者在相同功耗的情况下性能将提高 49%。

虽然这些改进很大程度上归功于新的制造工艺,但很大一部分来自新的 Zen 4 架构,AMD 声称每时钟指令 (IPC) 比 Zen 3 提高了 13%。

这实际上是我们从新 Ryzen 处理器中看到的最低代际变化,但两位数的提升仍然令人印象深刻,再加上时钟速度的显着提升,AMD 预计单核性能将比 Zen 3 有所提升29%。

打开网易新闻 查看更多图片

AMD Zen 4 架构概述

仔细观察Zen 4的核心设计,从框图的角度来看,新核心的整体设置看起来与Zen 3非常相似,具有相同的前端布局、相同的执行引擎布局以及很大程度上相同的加载/存储和缓存设置。相比之下,从 Zen 2 到 Zen 3 的转变包含了几个更明显的宏观层面的变化。

然而,在更深层次上,Zen 4 的整个设计进行了调整,以及一些更明显的变化,例如增加了对 AVX-512 指令的支持、更大的 L2 缓存和更大的微操作缓存。与以往的芯片设计一样,它可以是许多较小调整的组合,这些调整加起来会带来性能和效率的巨大变化,而不是需要完全重新设计。

打开网易新闻 查看更多图片

AMD Zen 4 前端变化

处理器核心设计的前端是将发送到 CPU 的较大指令解码为较小的微操作 (micro-op),然后将其传递到芯片的执行引擎部分。

这些微操作存储在微操作队列中,然后由执行引擎的单独整数和浮点部分调度执行。有些操作也可以直接传递到微操作队列,而不需要进一步解码,并且这些宏操作在加入微操作队列之前存储在操作缓存中。

Zen 4 的前端设计在很大程度上与 Zen 3 非常相似,具有 32KB 指令缓存,每个时钟周期可以将 4 条指令从解码器提交到微操作队列,而宏操作缓存最多可以提交每个周期九个宏操作。 Zen 4 还保留了 Zen 3 的每个时钟周期 6 个微操作的调度率——它可以将每个周期的 6 个操作传递给整数或浮点引擎。

Zen 4 的第一个重大前端改进是操作缓存增大了 68%。这允许核心立即处理执行引擎的更多潜在工作并确定其优先级,以确保它以最有效的方式将工作传递给执行引擎。

分支预测引擎也得到了改进。分支是程序等待具有多个结果的计算结果的地方 - if/then/else 类型的语句。在进入下一阶段之前等待分支结果得到解决可能会使 CPU 缺乏工作。因此,CPU 使用分支预测来猜测分支的结果,并为该分支结果设置数据和操作。

分支预测是 CPU 接收指令时所经历的最初阶段之一,因为尽早正确猜测可以节省大量时间并浪费资源。在 Zen 4 中,分支预测器进行了多项改进,包括更大的 L1 分支目标缓冲区 (BTB) 和更大的 L2 BTB。

虽然 AMD 提供了 Zen 4 架构改进 13% 的 IPC 改进数据,但它并没有详细说明架构的每个单独更改对总体改进的贡献有多大。这些比例的直观表示(如下)显示,仅分支预测变化就对 IPC 增长做出了第三大贡献。

与此同时,其他综合前端变化占 IPC 总增长的最大部分。从本质上讲,这表明在将 CPU 工作负载传递到芯片的数字运算执行引擎部分之前,有效管理 CPU 工作负载对于性能的重要性。

打开网易新闻 查看更多图片

AMD Zen 4 执行工程

从 Zen 3 和 Zen 4 的框图来看,两者在核心的执行引擎部分没有任何变化——宏观上,Zen 4 的执行引擎与 Zen 3 相同。它仍然存在宽度问题(对于整数引擎,每个周期可以执行的操作数为 10;对于浮点引擎,为 6 宽。

调度程序安排也保持与以前相同的整数 4×2 设置和浮点 2×3 设置。顺便说一句,英特尔当前的核心设计与 AMD 最新的核心设计之间的一个显着区别是,英特尔使用组合的整数和浮点调度程序,而不是此处使用的单独路径。

然而,执行引擎内部隐藏着一些变化,这些变化结合在一起提供了性能的适度提升。其中包括增加 25% 的指令退出队列、用于整数和浮点引擎的更大的主寄存器文件,以及整个核心更深的缓冲区。除此之外我们没有任何细节,但本质上这使得整个引擎拥有比 Zen 3 稍大的数据存储。

AMD Zen 4 加载/存储和缓存更改

AMD 将性能的显着提升更多地归功于 Zen 4 核心的加载和存储部分的变化。这些处理在核心和系统内存或内部缓存之间来回移动数据。

同样,整体设置与 Zen 3 基本相同,每个时钟周期最多有 3 个内存操作(三个内存加载或两个内存存储)和六个表遍历器(用于自动管理转换后备缓冲区中的条目)。然而,L2 数据缓存大小增加了 50%,而加载队列也增加了 22%。

这些更大的数据存储允许同时传输更多数据,从而增加了正确数据可用于后续其他操作的机会。较大缓存的缺点是芯片空间增加以及确保有效访问存储的潜在困难,但显然 AMD 认为较大的存储将带来净收益。

数据访问结构的其他变化包括支持从 L2 到 L3 缓存以及从 L3 缓存到内存的更多未命中未命中。高速缓存未命中是指所需的数据未存储在该高速缓存中,因此 CPU 必须移动到更高级别的高速缓存,甚至移动到系统内存来检索该数据。

在进行这些数据检索过程时,与该高速缓存未命中有关的信息保存在所谓的未完成未命中存储中。增加这些存储的大小可以确保任何更多的缓存未命中以及与之相关的进程都可以保持待机状态,以便在解决未命中时尽快再次执行。

再次查看 AMD 对 Zen 4 架构的每项更改对 IPC 增加的贡献的直观细分,虽然 L2 缓存更改是显示的最小块,但加载/存储更改贡献了第二大比例的改进。这再次表明了有效管理进出执行引擎的数据对处理器性能的重要性。

Zen 4 AVX-512 说明

Zen 4 中更有趣的新增功能之一是对 512 位向量指令(一次对多个数据位执行相同计算的指令)的适当硬件支持,称为 AVX-512。这些由英特尔首创,通常仅用于科学、人工智能和其他此类专业应用,但得到了越来越多的支持,并且是英特尔长期以来一直强调的重要功能。

具有讽刺意味的是,在第 12 代酷睿处理器中,英特尔实际上取消了 AVX-512 支持。它被删除的部分原因是该架构使用了不同的 P 核(支持 AVX-512)和 E 核(不支持 AVX-512),这增加了管理指令的复杂性,但它也指出了这一点是针对普通桌面处理器用户的利基指令集。因此,AMD现在带来的支持尤为引人注目。

英特尔的 AVX-512 实施方案也因耗电而臭名昭著,会导致巨大的功率峰值,远远超出芯片的额定功率输出。与此同时,AMD 声称其 AVX-512 硬件能够高效运行。然而,AMD 的设计采用 256 位宽单指令多数据(SIMD)设计,因此与 Intel 的完整 512 位宽单周期设计相比,需要两个时钟周期才能执行完整的 512 位宽指令,因此难怪 AMD 可以声称其设计更加节能。

AMD 声称,由于这款新的 AVX-512 硬件,与 Zen 3 相比,FP32 推理计算提高了 1.31 倍,Int8 推理计算提高了 2.47 倍。

打开网易新闻 查看更多图片

AMD Zen 4新IOD

Zen 4 相对于 Zen 3 的几个最大变化在于其 IOD,因为它现在不仅集成了集成显卡,而且还支持 DDR5 和 PCIe 5 等新功能。另外,整个芯片的制造工艺也发生了很大的变化,从相对古老的14nm工艺变成了6nm工艺。

硅制造技术的这一变化的最终结果将是每个芯片上组件的功耗显着降低,尽管 Zen 4 芯片比 Zen 3 芯片更密集且功能丰富,但它不一定会消耗更少的功率总体而言,如果您使用集成 RDNA2 显卡,则肯定不会。

AMD 明确表示,集成 GPU 并非用于游戏,而只是用于支持桌面使用,支持高分辨率显示输出(DisplayPort 2 和 HDMI 2.1)、带 DisplayPort Alt 模式的 USB Type-C ,以及AV1和H.264视频解码和编码。这对于游戏玩家来说基本上无关紧要,但对于更广泛的 PC 市场来说,它为 AMD 的 CPU 提供了更广泛的低成本和紧凑型系统。

更重要的是,虽然AMD表示它不是为了游戏本身,但集成显卡系统仍然包含单个AMD RDNA 2双计算单元,因此它可以在技术上支持运行最新游戏的所有最新处理要求,但这里的重点是在“技术上”。

RDNA 2 GPU 每个计算单元有 64 个流处理器,因此 Zen 4 CPU 的集成 GPU 中有 128 个。相比之下,Radeon RX 6600 拥有 28 个计算单元(1,792 个流处理器),因此该集成 GPU 与中等独立 GPU 之间存在巨大的性能差距。

打开网易新闻 查看更多图片

AM5 插槽和新主板芯片组

Ryzen 7000 系列平台拼图的最后一块是 AMD 随附的新 AM5 插槽和大量新主板芯片组以及所有相关主板的推出,以支持新处理器。

除了更高的引脚数和翻转引脚排列之外,Socket AM5 还包括多项与电源相关的增强功能,包括与主板电压调节器的双向通信和电压调节器健康状况监控。结果应该是更好的系统稳定性和潜在的更多超频空间。

打开网易新闻 查看更多图片

至于这些芯片组,AMD 提供了四种芯片组:X670E、X670、B650E 和 B650。然而,虽然 AMD 谈论芯片组,但实际上该公司只创建了一个芯片组芯片,该芯片组芯片将针对每种芯片组类型以不同的配置实现。

因此,对于 X670 和 X670E 主板,上行链路和下行链路配置将使用两个芯片,而 B650 变体将使用单个芯片。

结果是,X670 系列主板将提供基本上是 B650 系列主板两倍的功能和连接选项。因此,举例来说,您将在 X670 主板上获得 2 个 SuperSpeed USB 20Gbps 端口和 12 个 USB 480Mbps 端口,而 B650 则只有 1 个 SuperSpeed USB 20Gbps 端口和 6 个 USB 480Mbps 端口,除非主板制造商添加第三方控制器。

芯片组之间的其他差异包括 X670E 配置在所有 PCIe 插槽和 M.2 插槽上支持 PCIe 5,而 X670 仅支持一个 PCIe 插槽 - 其余的将是 PCIe 4。同时,B650 的连接选项比其他芯片组少,而A620则更少,同时也不允许超频支持。

AMD EXPO 内存

与 Zen 4 一起推出的是 AMD 的全新 EXPO 内存技术。 EXPO 从根本上是英特尔 eXtreme Memory Profiles (XMP) 的竞争对手,是 AMD 用于超频 DDR5 RAM 的一键式技术。

与 XMP 一样,EXPO 认证的内存将保证内存套件在 EXPO 额定时钟速度、电压和时序下具有稳定的性能。此外,与 XMP 一样,它不一定保证该套件能够以额定速度与您选择的 CPU 配合使用,只是内存套件可以单独达到这些速度。

然而,鉴于这些套件将使用 AMD CPU 进行测试,而不是像 XMP 那样使用英特尔 CPU 进行测试,因此与未经认证的内存套件相比,它与新 AMD 芯片配合使用的机会更大。我们发现 EXPO 在我们的测试中表现良好,您可以在我们的AMD EXPO 内存基准测试功能中亲自看到这一点。我们最近还评测了一些Corsair Vengeance RGB EXPODDR5 内存套件。

总结

AMD 的 Zen 4 CPU 无疑在 2022 年底首次发布时开局不稳。主板和新 CPU 都很昂贵,而且与英特尔的第 13 代和第 12 代芯片不同,你还被迫使用DDR5内存。然而从那时起,这些CPU的价格就下降了,DDR5内存的价格也直线下降。

与此同时,最近推出的带有 3D V 缓存的 AMD Zen 4 CPU 使 AMD 在游戏性能方面成为了赢家。英特尔的高端第 13 代 Raptor Lake CPU 仍然具有出色的多线程性能,而 Corei5-13600K 则提供了非常便宜的升级,因为您可以选择使用旧的 DDR 4 RAM。

但是,如果你从头开始构建新系统,我们强烈建议您构建基于Ryzen 7 7700的 8 核设备,或基于 Ryzen 7 7800X3D 的高端游戏系统。