打开

3090Ti会出现吗? RTX 30系显卡核心对比

subtitle
中关村在线 2021-06-15 12:17

截至目前,GeForce RTX 30系列显卡的发布基本已经告一段落,虽然此次共有60、70、80、90的四个常规型号,以及Ti系列的三个型号,共7款显卡。但核心却只有三种,分别为GA102、GA104和GA106,所以这几个芯片到底有什么区别,所谓的阉割核心又有什么区别,下面笔者给大家逐一讲解一下。

在每个显卡的GPU核心中,包含无数的大大小小的处理单元,首先我们从最小的流处理器(SM)来看。

打开网易新闻 查看更多图片
SM详解

在新的NVIDIA Ampere架构中,每个SM单元包含四个大的处理分区共128个CUDA核心,4个第三代Tensor Core,1个第二代RT Core,1个256 KB的缓存文件,1个128 KB的L1缓存,这个L1缓存可以根据不同的工作需求来调配缓存,工作效率发挥至最大。

本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

如刚刚发布的GeForce RTX 3070 Ti共有6144个CUDA,其实它有3072个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了6144的CUDA数量。

01 GA102核心
完整的GA102核心

完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成。在整个架构图中,GPC是占据主导地位的高级模块,拥有所有的关键图形处理单元,每个GPC包含一个专用光栅引擎。在新的NVIDIA Ampere架构中,每个GPC还包含了两个ROP分区,每个分区包含8个ROP单元。

根据图中可以计算出,完整GA102核心的CUDA数量应该是10752个,目前还没有一款显卡达到,即便是RTX 3090的CUDA数量也只是10496个,所以可以推断RTX 3090屏蔽了一组TPC,意味着只有82个SM单元。

所以从理论上来讲,GA102还有余力,而且RTX 3080 Ti和RTX 3090也只差了2个SM单元,GeForce RTX 3090 Ti的出现也不是没有可能。

RTX 3080阉割后的GA102核心

上图为RTX 3080所使用的GA102核心,即便我们不知道架构原理,但也能明显看出该核心被大幅削减过,RTX 3080共有8704个CUDA,所以可以推算出相比完整的GA102,其屏蔽了8组TPC,也就是少了16个SM单元,2048个CUDA。

02 GA104核心
GA104核心示意

RTX 3060 Ti、RTX 3070以及RTX 3070 Ti均采用了GA104核心,不过NVIDIA官方并没有放出架构图,我们只能以完整的GA102来做参考。

RTX 3070共有5888个CUDA,所以根据我们之前的计算,可以推算出,RTX 3070共有46个SM单元,23个TPC,也就是上图中圈出来的范围。但我们仅以数量来进行参考,真正的核心设计不可能只是简单粗暴的裁剪。

RTX 3060 Ti共有4864个CUDA,RTX 3070 Ti共有6144个CUDA,大家也可以动手计算一下这两个卡都各有多少TPC,多少个SM单元。

03 GA106核心
完整的GA106核心

目前采用GA106核心的只有RTX 3060,完整的GA106 GPU包含3个GPC(图形处理集群)15个TPC(纹理处理集群)30个SM(流处理器)3840个CUDA。而RTX 3060共有3584个CUDA,28个SM单元,所以使用的也并不是完整的GA106核心。

从目前发售的显卡来看,使用GA106核心的只有RTX 3060;使用GA104核心的则有RTX 3060 Ti、RTX 3070、RTX 3070 Ti;而使用GA102核心的则有RTX 3080、RTX 3080 Ti、RTX 3090,包含整个RTX 30系家族共有7款显卡。

特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。
帮TA点赞
大家都在看打开应用 查看全部
网易热搜每30分钟更新
打开应用 查看全部
打开