都知道光線追蹤RTX顯示卡的厲害,全靠這些黑科技
【PConline 雜談】2018年是顯示卡及遊戲發展史上的一個重要分水嶺,因為這一年NVIDIA推出了RTX 2080 Ti/2080/2070三款顯示卡,它們使用了全新的圖靈架構,除了繼續提升顯示卡遊戲效能之外,圖靈GPU最大的變化是帶來了RTX實時光線追蹤及Tensor Core人工智慧加速技術,這兩個新技術改變了遊戲玩家對3D遊戲畫質的認知,光線追蹤渲染技術發展了四十多年終於普及到每個遊戲玩家面前了。
除了光線追蹤及AI加速之外,RTX 20系列顯示卡還升級了多項黑科技,比如效能強大的12nm FFN工藝、頻寬提升75%的GDDR6視訊記憶體以及全新玩法的GeForce Experience優化,這些新技術使得RTX 20系列顯示卡相比現有顯示卡有了質的提升。
▍ 定製12nm FFN工藝:186億電晶體
相比目前Pascal架構顯示卡(GTX10系)使用的16nm FinFET工藝,圖靈架構的RTX 2080 Ti顯示卡升級到了12nm FFN工藝,這種工藝不同於以往的通用工藝,是NVIDIA與臺積電合作定製的先進工藝,相比16nm工藝提升了10%的效能、降低了25%的能耗,同時減少了20%的的核心面積,而NVIDIA定製的工藝效能水平又比標準版12nm工藝更好,效能再上一層樓。
得益於更先進的工藝,RTX 2080 Ti顯示卡的TU102核心總計集成了186億個電晶體,相比Pascal顯示卡的118億電晶體提升58%,更多的電晶體不僅帶來了多達4608個CUDA核心,還增加了全新的RT Core、Tensor Core,為圖靈顯示卡帶來了RTX實時光線追蹤渲染及AI加速運算能力,使得圖靈一代的顯示卡相比現在的顯示卡有了質的變化。
▍ RT Core帶來了RTX光線追蹤:
包括RTX 2080 Ti顯示卡在內,三款圖靈架構的顯示卡相比以往的顯示卡不只是效能提升,還有量變到質變——圖靈顯示卡是NVIDIA也是目前整個顯示卡業界第一個做到實時光線追蹤渲染的顯示卡,這要歸功於NVIDIA在圖靈GPU中增加了專門的RT Core單元,專門用於加速RTX光線追蹤渲染。
TU102核心的SM單元架構
NVIDIA在圖靈顯示卡中改變了RT渲染的工作流程,將其從Shader渲染器中獨立出來,變成了單獨的RT Core,專門用於RT運算,每個SM單元有一個專用的RT Core,RTX 2080 Ti顯示卡上總計68組RT Core,帶來了10+ Giga Rays/s的光線追蹤渲染能力,而現在的Pacal顯示卡的渲染能力只有1.2 Giga Rays/s,效能提升了10倍,而老黃現場宣佈的6倍光線追蹤渲染效能還是很謙虛的了。
在圖靈顯示卡問世之後,RT光線追蹤技術也成為新一代3A遊戲大作的選擇,包括戰地5、古墓麗影以及國內的逆水寒等多款遊戲都宣佈支援光線追蹤技術,其中戰地5已經在11月中旬釋出了RTX補丁,3D遊戲正式進入了光線追蹤時代。
左(開啟DXR)、右(關閉DXR)
光線追蹤技術能夠明顯提高遊戲畫質,特別是遊戲中的光影效果,如上圖所示,因為有許多汽車燃燒、炸彈爆炸的畫面,所以光線追蹤效果是最明顯。首先看槍管本身,左側的槍管是能比較好地還原現場的光影過渡效果的,右側槍管則純黑沒什麼變化。其次就是水面上的汽車、火光的倒映,都比右側的細節更好。
除了光線追蹤技術之外,RTX 2080 Ti顯示卡還支援AI運算,全新的Tensor Core也給顯示卡AI帶來了新的玩法,其中一個例子就是DLSS(深度學習超級取樣)抗鋸齒,它被玩家稱為“大力水手”,這個名字還真的挺適合的,因為DLSS技術大力出奇跡,利用Tensor Core的深度計算效能,讓本地生成的影象跟使用超級取樣生成的影象對比,然後通過學習、觀察其中的差距來複現後者的質量,進而提高畫質,同時還能減少效能損失,也就是提高抗鋸齒的效能,實測顯示DLSS加持下,RTX 2080顯示卡的效能都可以達到GTX 1080顯示卡的1.5倍到2倍左右,效果非常明顯。
RTX 2080 Ti顯示卡的光線追蹤及AI運算能力帶來了更多可能性
▍ 視訊記憶體新革命:提速75%的GDD6來了
作為新一代顯示卡,RTX 2080 Ti及RTX 2080/2070系列顯示卡在視訊記憶體技術上也實現了革命性升級,首發了GDDR6視訊記憶體。與主流的8Gbps GDDR5視訊記憶體相比,新一代的GDDR6視訊記憶體頻率更高,標準起步就是12Gbps,目標是16Gbps,未來還可以進一步提升到18Gbps、20Gbps。
目前RTX 2080 Ti顯示卡上使用的GDDR6視訊記憶體是14Gbps,考慮到這還是第一代的產品,這個頻率還是OK的,因為它已經比GDDR5 8Gbps視訊記憶體的頻寬提升了75%,同樣在256bit或者384bit位寬下能帶來448GB/s、672GB/s的頻寬,效能非常接近HBM 2視訊記憶體了,但是成本要便宜很多。
GDDR6記憶體帶來記憶體頻寬大幅提升,不過NVIDIA還從源頭進一步降低了對頻寬的消耗,圖靈顯示卡支援更先進的記憶體壓縮演算法,全新的GPU壓縮引擎可以自動匹配最合適的演算法以便在不同的材質上尋找最有效的壓縮方法,與GP102核心的GTX 1080 Ti顯示卡相比,RTX 2080 Ti的記憶體壓縮能夠提升50%的效率,與頻寬更高的GDDR6一起為圖靈架構的SM單元效能提升50%保駕護航。
▍ 硬體強大,驅動、優化也要跟得上:RTX截圖功能(ANSEL RTX)
除了新顯示卡顯示卡之外,NVIDIA還推出了與圖靈顯示卡相匹配的配套優化——更新的驅動及更好用的GeForce Experience(簡稱GFE)軟體,實際上有了後者的話,驅動升級就不需要擔心了,GFE可以自動下載安裝最新NVIDIA驅動,確保顯示卡即時更新到為最新遊戲優化的驅動程式。
在光線追蹤技術問世之後,GFE軟體也隨之升級了很多新功能,比如支援RTX遊戲的Ansel截圖,在支援光線追蹤功能的遊戲中開啟 Ansel 模式時,如果使用自由相機四處遊走,遊戲引擎將使用遊戲內的圖形設定。當玩家暫停動作時,Ansel RT 將快速提升光線追蹤水平,使其超過遊戲內照片的最高實時水平。
以“神力科莎 (Assetto Corsa Competizione)”為例,呼叫 Ansel RT 可顯著增加投射到場景中的光線數量,每個畫素的折射率提升 10 倍,環境光遮蔽樣本提升 12 倍,陰影樣本增加 32 倍,反射樣本增加 40 倍。
此外,RTX 20系列顯示卡的AI運算能力還可以讓你輕鬆擷取8K遊戲圖片,哪怕遊戲並不支援8K,使用 GeForce RTX 顯示卡啟用 Ansel,並在“Super Resolution”(超高解析度)下選擇 AI Up-Res。在點選擷取時,AI Up-Res 將以 1 倍的解析度擷取影象,然後藉助 AI 影象增強功能,智慧地將圖片解析度提升到 8K,其中的細節比原始影象更清晰。
▍ 非公版做工與設計升級,可玩性更高
在RTX 2080 Ti/2080/2070顯示卡的FE創始人版(也就是常說的公版顯示卡)中,NVIDIA這一次也改變了顯示卡的設計及用料,首次加入了開放式雙風扇設計,散熱也強化了,使用了均熱板及13相供電,比之前的公版顯示卡強多了。不過玩家都知道公版卡再好也不如顯示卡廠商的非公版設計豪華,這一代的非公版RTX 20系列顯示卡也確實是更上一層樓,散熱、功耗及信仰燈上無以復加。
技嘉 AORUS顯示卡能與主機板、記憶體、電源等配件實現燈效同步
大部分非公版RTX 2080 Ti/2080顯示卡都是三風扇設計,比如技嘉AORUS GeForce RTX 2080 Ti XTREME 顯示卡,3個10cm大風扇再加上7根熱管組成了風之力均流疊合散熱系統,而且把RGB燈效做到了扇葉上,所以這款顯示卡不論是散熱效果還是信仰燈效都別具一格。
AORUS記憶體
配合AORUS Engine能就能自由地對整個平臺的燈效進行設計,對於玩燈愛好者、MOD玩家來說,是充滿吸引力的設計。
相比公版RTX 2080 Ti顯示卡的13相供電,非公版顯示卡的供電及用料也會強化,技嘉AORUS GeForce RTX 2080 Ti XTREME顯示卡就是16+3相供電,整個PCB上滿滿的都是供電電路及濾波電路,做工控看了也會非常滿足。
▍ PConline 總結:
RTX 2080 Ti/2080/2070三款顯示卡使用的圖靈核心是全新一代的GPU架構,相比前面幾代的GPU常規升級換代,圖靈GPU這一次可以說是從量變到質變,帶來了全新的CUDA核心架構、RT Core光線追蹤技術、Tensore Core人工智慧加速及高階渲染功能,四方面的變化使得圖靈顯示卡在3D遊戲畫質、效能上有了革命性升級。
對於顯示卡自身來說,圖靈這一代的顯示卡定位更加高階,所以在顯示卡散熱、做工、用料、信仰燈及可玩性等方面也有了大幅提升,特別是諸多黑科技加持下的RTX 2080 Ti/2080高階顯示卡,比如技嘉AORUS GeForce RTX 2080 Ti XTREME顯示卡,這些顯示卡帶給高階玩家的使用體驗是很不一樣的。