GeForce RTX 20系列 - 维基百科,自由的百科全书

Geforce RTX 20 系列

RTX 2080Ti 創始版
发布日期2018年9月20日,​6年前​(2018-09-20
2019年7月9日,​5年前​(2019-07-09
(Super系列)
代号TU10x
架构Turing
产品系列GeForce RTX
电晶体
  • 108億 12nm(TU106)
  • 136億 12nm(TU104)
  • 186億 12nm(TU102)
制造工艺台積電 12nm(FinFET)
显示卡
中端GPUGeForce RTX 2050
GeForce RTX 2060
GeForce RTX 2060 Super
高端GPUGeForce RTX 2070
GeForce RTX 2070 Super
GeFroce RTX 2080
GeForce RTX 2080 Super
旗舰GPUGeForce RTX 2080 Ti
NVIDIA TITAN RTX
API支持
Direct3DDirect3D 12 (12_2)
OpenGLOpenGL 4.6
OpenCLOpenCL 1.2
VulkanVulkan 1.2
历史
前代产品GeForce 10系列
相关产品GeForce 16系列
后继产品GeForce 30系列

GeForce RTX 20系列NVIDIAGeForce GTX 10系列之后开发的图形处理器系列。该系列于2018年8月20日在Gamescom(科隆游戏展)上发布[1][2][3],首發產品是GeForce RTX 2080及2080Ti[4]。此系列產品被重新命名為RTX而非沿用已使用多年的GTX,以突顯对光线跟踪的支持。

架构特性

[编辑]

RTX 20系列基于图灵微架构(Turing),其主要特点是支持实时光线跟踪(Ray tracing)技术。[5]该系列显卡通过搭载RT(光线追踪运算)核心,显著加速了光线跟踪的计算过程。这些核心能够高效处理四叉树和球形层次结构,并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统的使用立方体贴图或深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真,尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。

该系列显卡还搭载了张量運算核心(Tensor Core)。张量核心最初是为深度学习任务设计的,例如训练图像超分辨率模型。然而,消费级显卡中的张量核心主要用于进行已经训练完成的深度学习模型的推理。这些模型的训练和分析通常在高性能计算机上进行,后者负责确定并优化实现特定目标(如图像超分辨率)的方法。之后,消费级显卡上的张量核心会使用这些经过高性能计算机训练获得的模型,从而实现例如提高图像分辨率等功能,如深度學習超級採樣(DLSS)[6]

NVIDIA早在基于帕斯卡伏打图形处理微架构的GeForce GTX TITAN系列上就已经在画面运算中应用了深度学习光线追踪技术,但由于当时设备性能的限制,仅能生成静态画面,而GeForce RTX 20系列则首次在画面处理中大规模采用深度学习技术,并引入了与深度学习相结合的光线追踪实时动态画面技术。[7]

細節

[编辑]
  • GeForce RTX 20系列採用的台積電12nm FFN製程由伏特微架構使用的12nm FFC製程改進(但本質上依舊是台積電16nm FF+製程的延伸版本),性能是後者的1.1倍,功耗只有後者的70%,核心面積則可以縮小20%
  • 為容納數量龐大的運算單元,GeForce RTX 20系列的核心面積相比帕斯卡微架構大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm 2
  • GeForce RTX 20系列支持 CUDA 计算能力 7.5
  • GeForce RTX 20系列採用了全新的SM陣列設計: TPC包含了兩個SM單元(Pascal為1個),SM單元重新分配為64個FP32、64個INT32、8個Tensor Core 、1個RT Core ,同時添加了獨立的INT數據路徑,支援FP32和INT32操作的並發執行。
  • 為共享暫存、一級暫存、紋理暫存引入了統一架構,一級暫存與共享暫存大小是靈活可變的,可以根據需要在64+32KB或者32+64KB之間變換,讓一級暫存更充分利用資源,也減少一級暫存延遲,並提供比Pascal GPU中使用的一級暫存更高的頻寬,同時二級暫存容量提升。
  • Tensor Core(張量核心) : 負責人工智慧、神經網路運算,增加了新的INT8和INT4精度模式,FP16半精度也能夠被完整支援通常會用到矩陣融合乘加(FMA)運算,新的INT8精度模式的工作速率是此速率的兩倍,張量核心為矩陣運算提供了顯著的加速,除了新的神經圖形功能外,還用於深度學習訓練和推理操作。
  • NGX (Neural Graphics Acceleration)框架: 利用張量核心,在遊戲中實現深度學習功能,GeForce Experience會自動匹配Turing顯卡並且下載可用的NGX Core軟件包,對應如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
  • DLSS (深度學習超級採樣) : 利用張量核心實現在較低的实际分辨率下更快地渲染,。
  • AI InPainting : 利用基于大量真實世界圖像訓練的模型,GeForce RTX 20系列可以補全圖片中缺失的內容、移除照片的噪點、失真部分。
  • AI Super Rez : GeForce RTX 20系列可以將原始图像的分辨率放大2倍、4倍、8倍,使圖像更加銳利。
  • AI Slow-Mo : GeForce RTX 20系列可以对常見的30fps的影片進行智慧補幀計算,獲得240/480fps的慢動作影片,而不需要專門的高幀率攝影機。
  • RT Core : 一條專門為光線追踪計算设计的渲染流水線,用於加速計算邊界體積層次(BVH)遍歷以及光線和三角求交(光線投射)。
  • 支持GDDR6顯示記憶體
  • 附有影像串流壓縮技術(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
  • 功能集PureVideo的硬體加速視訊解碼
  • NVLink連接器(與伏打微架構的不相容)
  • VirtualLink VR
  • GPU Boost 4[8]

設計

[编辑]

在RTX的光线追踪示范程序中使用了微软的DXR 、NVIDIA的OptiX 以及Vulkan等API来实现光线追踪功能[9]

芯片规格

[编辑]
型號 推出日期 核心
代號
製程
(nm)
晶体管數
&
晶粒面積
核心配置 時脈頻率 填充率 顯示記憶體 運算性能 (TFLOPS) 每秒
光線數
(十億)
匯流排
介面
TDP
(W)
NVLink
支援
發售價格(美金)
核心組態
SPs:TMUs:ROPs[a]
光追
核心
張量
核心
二級
暫存

(MB)
預設
(MHz)
加速
(MHz)
記憶體
(MT/s)
像素
(GP/s)
材質
(GT/s)
容量
(GB)
頻寬
(GB/s)
類型 介面
頻寬
(位元)
單精度
(加速)
雙精度
(加速)
半精度
(加速)
張量
浮點
零售版 創始版
GeForce RTX
2060
2019年
1月15日
TU106-
200A-
KA-A1
12 108億
445mm2
1920:120:48
(30 SM)
30 240 3 1365 1680 14000 65.52 163.8 6 336 GDDR6 192 5.24
(6.45)
0.16
(0.20)
10.5
(12.9)
51.6 5 PCIe
3.0
x16
160 $349
GeForce RTX
2060 TU104
2020年
1月10日
TU104-
150-KC-
A1
136億
545mm2
$300
GeForce RTX
2060 Super
2019年
7月9日
TU106-
410-
A1
108億
445mm2
2176:136:64
(34 SM)
34 272 4 1470 1650 90.5 191.4 8 448 256 6.12
(7.18)
0.19
(0.22)
12.2
(14.4)
57.4 6 175 $399
GeForce RTX
2070
2018年
10月17日
TU106-
400-A1
2304:144:64
(36 SM)
36 288 1410 1620 90.24 203.04 6.50
(7.47)
0.20
(0.23)
12.3
(14.9)
59.7 $499 不適用
TU106-
400A-A1
1620+ $499+ $599
GeForce RTX
2070 Super
2019年
7月9日
TU104-
410-A1
136億
545mm2
2560:160:64
(40 SM)
40 320 1605 1770 102.72 256.8 8.22
(9.06)
0.26
(0.28)
16.4
(18.1)
72.5 7 215 2路
NVLink
$499
GeForce RTX
2080
2018年
9月20日
TU104-
400-A1
2944:184:64
(46 SM)
46 368 1515 1710 96.96 278.76 8.92
(10.1)
0.28
(0.32)
17.8
(20.1)
80.5 8 $699 不適用
TU104-
400A-A1
1710+ $699+ $799
GeForce RTX
2080 Super
2019年
7月23日
TU104-
450-A1
3072:192:64
(48 SM)
48 384 1650 1815 15500 105.6 316.8 496 10.1
(11.2)
0.32
(0.35)
20.3
(22.3)
89.2 250 $699
GeForce RTX
2080 Ti
2018年
9月27日
TU102-
300-K1-
A1
186億
754mm2
4352:272:88
(68 SM)
68 544 5.5 1350 1545 14000 118.8 367.2 11 616 352 11.8
(13.4)
0.37
(0.42)
23.5
(26.9)
107.6 10 $999 不適用
TU102-
300A-K1-
A1
1545+ $999+ $1,199
NVIDIA Titan
RTX
2018年
12月18日
TU102-
400-A1
4608:288:96
(72 SM)
72 576 6 1770 129.6 388.8 24 672 384 12.4
(16.3)
0.39
(0.51)
24.9
(32.6)
130.5 11 280 $2,499
  1. ^ 流處理器數量 : 纹理映射單元數量 : 渲染输出单元數量

另见

[编辑]

參見

[编辑]
  1. ^ GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21]. (原始内容存档于2018-08-20) (英语). 
  2. ^ Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始内容存档于2018-08-20) (美国英语). 
  3. ^ Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. (原始内容存档于2018-08-20). 
  4. ^ Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始内容存档于2018-08-20) (美国英语). 
  5. ^ Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. (原始内容存档于2018-08-20). 
  6. ^ GeForce RTX 2080 即可享受 4K HDR 60FPS 遊戲效能,DLSS 反鋸齒效能再增加 1 倍. techbang.com. 2018-08-24 [2018-10-08]. (原始内容存档于2018-10-09) (中文(臺灣)). 
  7. ^ 新增 RT 與 Tensor ,NVIDIA GeForce RTX 2080/2080Ti Turing 架構、Founders Edition、效能表現一次看懂. techbang.com. 2018-09-19 [2018-10-08]. (原始内容存档于2018-10-09) (中文(臺灣)). 
  8. ^ The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. [2018-10-08]. (原始内容存档于2018-09-15). 
  9. ^ NVIDIA RTX™ platform. Nvidia. [2018-08-21]. (原始内容存档于2018-08-24). 

扩展链接

[编辑]