NVIDIA GeForce 30系列

GeForce RTX 30系列
	GeForce RTX 3090 创始版
发布日期	2020年9月17日，4年前
代号	GA10x
架构	Ampere
产品系列	GeForce RTX
电晶体	133亿 (GA106); 174亿 (GA104); 283亿 (GA102);
制造工艺	三星 8nm
显示卡
中端GPU	GeForce RTX 3050; GeForce RTX 3060; 行动平台：; RTX 3050 ; RTX 3050Ti; RTX 3060
高端GPU	GeForce RTX 3060 Ti; GeForce RTX 3070; GeForce RTX 3070 Ti ; 行动平台：; RTX 3070 ; RTX 3070Ti
旗舰GPU	GeForce RTX 3080; GeForce RTX 3080 Ti; GeForce RTX 3090; GeForce RTX 3090 Ti ; 行动平台：; RTX 3080 ; RTX 3080Ti
API支持
Direct3D	Direct3D 12 Ultimate（12_2）
OpenGL	OpenGL 4.6
OpenCL	OpenCL 3.0
Vulkan	Vulkan 1.3
历史
前代产品	NVIDIA GeForce 20系列
后继产品	NVIDIA GeForce 40系列

NVIDIA GeForce RTX 30系列是NVIDIA继GeForce RTX 20系列之后开发的图形处理器系列。于2020年9月1日正式发布，并于2020年9月17日开始发货^[1]。

GeForce 30系列图形处理器基于安培微架构，拥有第二代光线追踪核心和第三代张量核心，Nvidia称其运行性能和能效约为之前图灵微架构图形处理器的两倍^[1]^[2]，使用三星电子的8纳米工艺制造。

架构特性

在上一代图灵架构，引入了分数据类型计算的理念，将整数型（INT32）和单精度浮点型（FP32）两种不同的数据类型交给两种不同的ALU进行计算，提高了SM单元的并行计算效率。不过现代游戏应用中最为常见的还是FP 32计算，INT 32 ALU的使用率比FP 32 ALU的低。为提升计算效率，新一代安培架构引入了可同时支援INT 32和FP 32两种数据类型的新ALU，取代了原本只支援INT 32计算的ALU。也就是说，现在有两条不同的数据路径（Datapath），一条能够处理整数或单精度浮点，另一条只能处理单精度浮点计算。原本整个SM单元同时可以处理64个INT 32计算指令和64个FP 32计算指令，安培上则是变成128个FP 32计算指令或64个INT 32计算指令和64个FP 32计算指令。为配合规模有一定扩张的计算单元，安培SM的共享缓存/L1数据缓存容量从96KB增长到了128KB，同时其带宽变为原来的两倍。

第二代RT Core

安培微架构的RT Core(Ray Tracing core,光线追踪核心)在图灵架构的基础上将三角形求交模块数量增加到两个（以并行方式运作），在基础的BVH计算上面，新一代RT Core也能够快上2倍。同时，第二代RT Core还增加了一个三角形位置内插模块，在允许BVH内的数据做少量更新的情况下，就能实现移动物体运动模糊效果的显著性能提升。在OptiX 7.0 中，开发人员可以为几何体指定特定的移动路径，让每条射线和时间关联起来，从而实现移动物体的所有运动模糊效果加速。

第三代Tensor Core

Tensor Core(张量核心)是专门针对深度学习加速设计的矩阵运算单元，可以执行基于深度学习的应用，例如光线追踪降噪和DLSS抗锯齿渲染。图灵中每个SM都配有8个Tensor Core(每个子核有两个Tensor Core)，每个Clock(周期)可以执行512个FP16 Tensor操作。而在安培架构，每个SM里有4个Tensor Core（每个子核有一个Tensor Core），但是每个Tensor Core的处理能力倍增，因此每个SM也能执行512个FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 两种新的数据格式，并引入硬件稀疏化技术，操作的能力上增加一倍达到等效每周期1024 个FP16 操作。

产品

型号	推出日期	核心代号	制程	电晶体数 & 晶粒面积	核心组态^[a]	二级暂存(MB)	时脉频率			显示记忆体				填充率		运算效能 (TFLOPS)					汇流排介面	TDP (W)	NVLink支援	发售价格 (美金)
型号	推出日期	核心代号	制程	电晶体数 & 晶粒面积	核心组态^[a]	二级暂存(MB)	预设 (MHz)	加速 (MHz)	记忆体 (MT/s)	容量 (GiB)	频宽 (GB/s)	类型	介面频宽 (bit)	像素 (GP/s)	材质 (GT/s)	单精度	双精度	半精度	张量 (FP16)	光追	汇流排介面	TDP (W)	NVLink支援	发售价格 (美金)
GeForce RTX 3050	2022年1月27日	GA106-150-KA-A1	三星 8N	133亿 276mm²	2560:80:32:80:28 (20) (3)	2	1552	1777	14000	8	224	GDDR6	128	49.6 56.86	124.1 142.2	7.946 9.098	0.124 0.142	7.946 9.098			PCIe 4.0 x8	130	否	$249
GeForce RTX 3060^[3]	2021年 2月25日	GA106-300-A1		133亿 276mm²	3584:112:48:112:28 (28) (3)	3	1320		15000	12	360.0		192	63.4 85.3	147.8 199.0	9.46 12.74	0.148 0.199	9.46 12.74		25	PCIe 4.0 x16	170		$329
GeForce RTX 3060^[3]	2021年 9月1日	GA104-150-A1^[4]		174亿 392.5mm²	3584:112:48:112:28 (28) (3)	3	1320		15000	12	360.0		192	63.4 85.3	147.8 199.0	9.46 12.74	0.148 0.199	9.46 12.74		25		170		$329
GeForce RTX 3060 Ti^[5]	2020年 12月2日	GA104-200-A1			4864:152:80:152:38 (38) (6)	4	1410	1665	14000	8	448.0		256	112.8 133.2	214.3 253.1	13.72 16.20	0.214 0.253	13.70 16.20	? 129.6	32		200		$399
GeForce RTX 3070^[6]	2020年 10月29日^[7]	GA104-300-A1			5888:184:96:184:46 (46) (6)		1500	1725	14000		448.0			144.0 165.6	276.0 317.4	17.66 20.31	0.276 0.318	17.66 20.37	141.31 162.98	40^[8]		220		$499
GeForce RTX 3070 Ti^[9]	2021年 6月10日	GA104-400-A1			6144:192:96:192:48 (48) (6)		1575	1770	9500 (19000)^[b]		608.3	GDDR6X		151.18 169.9	302.36 339.8	19.35 21.75	0.302 0.340	19.35 21.75				290		$599
GeForce RTX 3080^[10]	2020年 9月17日	GA102-200-KD-A1		283亿 628.4mm²	8704:272:96:272:68 (68) (7)	5	1440	1710		10	760.0		320	138.2 164.2	391.68 465.12	25.07 29.77	0.392 0.465	25.06 29.76	200.54 238.14	58		320		$699
GeForce RTX 3080 Ti^[11]	2021年 6月3日	GA102-225-A1			10240:320:112:320:80 (80) (7)	6	1395	1665		12	912.4		384	153.5 186.5	438.5 532.8	28.57 34.71	0.438 0.533	28.06 34.10				350		$1199
GeForce RTX 3090^[12]	2020年 9月24日	GA102-300-A1			10496:328:112:328:82 (82) (7)		1395	1695	9750 (19500)^[b]	24	935.8			156.2 189.8	457.6 555.96	29.28 35.58	0.459 0.558	29.38 35.68	235.08 285.48	69^[8]		350	2路 NVLink	$1499
GeForce RTX 3090 Ti^[13]	2022年 3月22日	GA102-350-A1			10752:336:112:336:84 (84)(7)		1560	1860	10500 (21000)	24	1008			174.7 208.3	524.1 625.0	33.54 39.99	0.524 0.625	33.54 39.99	320			450	2路 NVLink	$1999

^ 流处理器数量：纹理映射单元数量：渲染输出单元数量：张量核心数量：光线追踪核心数量（SM数量）（GPC数量）。面向非专业用途的Ampere架构中每个GPC由16个ROP及最多12个SM组成，每个SM固定包括128个流处理器（单精度浮点处理器）、64个32位长整型处理器、4个TMU、4个张量核心和1个光线追踪核心；GA100核心的浮点处理器配置则略有不同，参见NVIDIA Tesla
^ ^2.0 ^2.1 类似于早已在闪存行业应用的MLC技术，GDDR6X一次存取可以操作两个比特，括号内用于比较GDDR6的等效传输速率

另见

参考文献

^ ^1.0 ^1.1 GeForce Special Event. 英伟达. [September 1, 2020]. （原始内容存档于2020-09-02）.
^ Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬体指南. August 31, 2020.
^ NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. （原始内容存档于2022-02-26）.
^ Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. （原始内容存档于2021-11-13）（美国英语）.
^ NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. （原始内容存档于2021-01-12）.
^ NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-14）.
^ GeForce RTX 3070 Availability Update. [2021-11-13]. （原始内容存档于2022-01-11）.
^ ^8.0 ^8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. （原始内容存档于2022-01-12）.
^ NVIDIA GeForce RTX 3070 Family. [2021-06-02]. （原始内容存档于2022-02-26）.
^ NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-19）.
^ NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. （原始内容存档于2022-03-01）.
^ NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. （原始内容存档于2022-02-26）.
^ 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. （原始内容存档于2022-05-12）（中文（台湾））.

外部链接

GEFORCE RTX 30 SERIES（页面存档备份，存于互联网档案馆）

[a-3] 流处理器数量：纹理映射单元数量：渲染输出单元数量：张量核心数量：光线追踪核心数量（SM数量）（GPC数量）。面向非专业用途的Ampere架构中每个GPC由16个ROP及最多12个SM组成，每个SM固定包括128个流处理器（单精度浮点处理器）、64个32位长整型处理器、4个TMU、4个张量核心和1个光线追踪核心；GA100核心的浮点处理器配置则略有不同，参见NVIDIA Tesla

[b-11] 2.0 ^2.1 类似于早已在闪存行业应用的MLC技术，GDDR6X一次存取可以操作两个比特，括号内用于比较GDDR6的等效传输速率

[geforceSpecialEvent-1] 1.0 ^1.1 GeForce Special Event. 英伟达. [September 1, 2020]. （原始内容存档于2020-09-02）.

[toms3090GA102-2] Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬体指南. August 31, 2020.

[4] NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. （原始内容存档于2022-02-26）.

[5] Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. （原始内容存档于2021-11-13）（美国英语）.

[6] NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. （原始内容存档于2021-01-12）.

[7] NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-14）.

[8] GeForce RTX 3070 Availability Update. [2021-11-13]. （原始内容存档于2022-01-11）.

[:4-9] 8.0 ^8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. （原始内容存档于2022-01-12）.

[10] NVIDIA GeForce RTX 3070 Family. [2021-06-02]. （原始内容存档于2022-02-26）.

[12] NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-19）.

[13] NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. （原始内容存档于2022-03-01）.

[14] NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. （原始内容存档于2022-02-26）.

[15] 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. （原始内容存档于2022-05-12）（中文（台湾））.

[1]

[2]

[a]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[b]

[10]

[11]

[12]

[13]

显示卡
GeForce RTX 3090 创始版
发布日期	2020年9月17日，4年前（2020-09-17）
代号	GA10x
架构	Ampere
产品系列	GeForce RTX
电晶体	133亿 (GA106) 174亿 (GA104) 283亿 (GA102)
制造工艺	三星 8nm
中端GPU	GeForce RTX 3050 GeForce RTX 3060 行动平台： RTX 3050 RTX 3050Ti RTX 3060
高端GPU	GeForce RTX 3060 Ti GeForce RTX 3070 GeForce RTX 3070 Ti 行动平台： RTX 3070 RTX 3070Ti
旗舰GPU	GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090 GeForce RTX 3090 Ti 行动平台： RTX 3080 RTX 3080Ti
API支持
Direct3D	Direct3D 12 Ultimate（12_2）
OpenGL	OpenGL 4.6
OpenCL	OpenCL 3.0
Vulkan	Vulkan 1.3
历史
前代产品	NVIDIA GeForce 20系列
后继产品	NVIDIA GeForce 40系列