當(dāng)NVIDIA基于新一代Ampere安培架構(gòu)的GeForce RTX 30系列顯卡發(fā)布之時,幾乎在所有玩家的內(nèi)心都默默的宣判了AMD的死刑。
因為此前在流處理器數(shù)量相同的情況下,同時代的NVIDIA顯卡性能是遠強于AMD顯卡,就算是RDNA構(gòu)架也不能難幸免。RX 5700 XT無法戰(zhàn)勝擁有相同2560個流處理器數(shù)量的RTX 2070 Super,前者是7nm,后者是12nm。
新一代RTX 3090一上來就宣告擁有10496個流處理器,帶來的震撼可想而知!至于傳說中的RDNA2,很早之前大家就知道了,它最多擁有5120個流處理器??峙履菚r沒人會覺得RNDA2會威脅到RTX 3090,甚至RTX 3080都可以高枕無憂。
不過如同Zen3處理器帶給大家的震撼一樣,10月29日發(fā)布的RDNA2 GPU的實際性能表現(xiàn)幾乎超出了所有人的預(yù)料!
RDNA 2雖然是RDNA架構(gòu)的更新版本,并不是完全重新設(shè)計。但在RDNA原有的基礎(chǔ)上,RDNA2性能提升1倍,能效提升至少50%,ROP單元翻倍,完整支持DX12 Ultimate等技術(shù)特性,支持硬件光線追蹤。
可以發(fā)現(xiàn)整體布局沒有太大變化,當(dāng)然各個功能模塊都是調(diào)整優(yōu)化過的,而最突出的,一是增加了獨立的Infinity Cache高速緩存,二是在每個計算單元內(nèi)加入了專用的光追加速器Ray Accelerator。
至于RDNA 2架構(gòu)的底層細節(jié),比如說計算單元的變化,AMD這次沒有給出更多資料,只是簡單提到了幾點,包括精簡TLB以降低延遲、重新設(shè)計32位像素流水線并支持HDR格式、優(yōu)化幾何分派與曲面細分、全方位精細時鐘門控、頻率樹分離與門控、最小化數(shù)據(jù)轉(zhuǎn)移、重新平衡流水線、高性能庫等等,但沒有任何圖示。
以下是RDNA2構(gòu)架新技術(shù)解析:
1、Smart Access Memory (SAM)顯存智取技術(shù)
在游戲運行的時候,CPU是不能一次性訪問全部顯存的,比如RTX 3090有24GB顯存,而CPU只能訪問其中的256MB。于是有大量數(shù)據(jù)會回到內(nèi)存后給CPU處理器完成后再轉(zhuǎn)移到顯存,此時不僅浪費了帶寬也造成了無謂的資源浪費。
Smart Access Memory (SAM)可以讓搭載AMD 500系列芯片組在搭載Zen3 CPU和RDNA2 GPU的時候,讓Zen3 CPU可以完整訪問全部顯存,而且?guī)掃€是PCIe 4.0的速度,理論上最多可以讓游戲性能提升13%。
2、Ray Accelerator單元
在RDNA2構(gòu)架中,加入了硬件光追單元Ray Accelerator!與NVIDIA的完全專用RT Core相比,RDNA2的Ray Accelerator緊密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的現(xiàn)有HW。
這是AMD放出的RNA 2光追渲染效果圖,可以看到RDNA2實時光線追蹤效果與傳統(tǒng)光柵化渲染的差別。
AMD聲稱,相比于軟件方案,RDNA 2架構(gòu)的硬件加速光追性能,可以提升10倍之多,同時給出了部分游戲的實際性能,2K分辨率下《使命召喚:現(xiàn)代戰(zhàn)爭》可以跑出95FPS,《孤島危機重制版》可達90FPS,《戰(zhàn)地5》能有70FPS。
3、全局Infinity Cache
在大容量三級緩存的加持下,Zen3的IPC性能獲得了巨大的性能提升。如今AMD將這個理念帶入了GPU領(lǐng)域。
傳統(tǒng)的GPU構(gòu)架中,一般只有1.5~4MB的緩存,RDNA2除了4MB的L2緩存之外,還加入了128MB的全局Infinity Cache緩存,所有的CU單元均可以訪問。
AMD Infinity Cache 作為一個巨大的帶寬放大器,其有效帶寬可以達到256 位 16 Gbps GDDR6 顯存的 4 倍。在Infinity Cache的帶動下,512GB/s帶寬的RX 6900 XT的性能表現(xiàn)足以媲美936GB/s帶寬的RTX 3090。
4、Fidelity FX超分辨率抗鋸齒技術(shù)
針對NVIDIA DLSS深度學(xué)習(xí)超采樣抗鋸齒技術(shù),AMD也提出了超分辨率(FidelityFX Super Resolution),簡稱FSR。目前這個技術(shù)正在開發(fā)中,不久之后會在新驅(qū)動中提供支持
歷代AMD顯卡在ROP單元數(shù)量上都非常保守,最頂級型號的GPU最多就只有64個ROP。這一次AMD非常的激進,RX 6800 XT直接就配備了128個ROP,也是GPU歷史上第一款擁有128個ROP的顯卡。
責(zé)任編輯:pj
-
處理器
+關(guān)注
關(guān)注
68文章
19390瀏覽量
230600 -
amd
+關(guān)注
關(guān)注
25文章
5485瀏覽量
134404 -
cpu
+關(guān)注
關(guān)注
68文章
10896瀏覽量
212512
發(fā)布評論請先 登錄
相關(guān)推薦
評論