赶尸艳谈,亚洲狠狠干欧美网站在线播放

E3 2019游戲大會期間，AMD正式發(fā)布了基于7nm新工藝、Navi新核心、RDNA新架構(gòu)的新一代顯卡Radeon RX 5700系列，包括RX 5700 XT、RX 5700兩款型號，均面向規(guī)模最為龐大的甜點級市場和主流游戲玩家。

AMD發(fā)布的新一代RX 5700系列顯卡基于7nm新工藝和Navi新核心，而在底層是全新的RDNA架構(gòu)，已經(jīng)走過七年半的GCN架構(gòu)就此揮手作別。

這些年來，很多用戶玩家尤其是A飯一直期待一個全新的GPU架構(gòu)，但這種事兒的難度遠超一般人想象，某種程度上設(shè)計一個新的GPU架構(gòu)甚至要比設(shè)計一個新的CPU架構(gòu)還要難。RDNA架構(gòu)就花費了AMD研發(fā)團隊長達四年的時間，凝聚了無數(shù)人的心血，也開啟了AMD顯卡歷史上第五代重大架構(gòu)的新時代。

2000年前，R100核心是A卡的第一代架構(gòu)，用的還是固定單元設(shè)計，3D幾何轉(zhuǎn)換和光照效果如今看起來都極為原始。

2001-2007年的R200-R500是第二代架構(gòu)，簡單的VS紋理著色器、PS像素著色器分離式設(shè)計，不同的只是比例不同，整個渲染流水線就像一個單通道的單行道。

2008-2011年的第三代TeraScale架構(gòu)(代表核心R600)實現(xiàn)了一個飛躍，VS、PS融合為統(tǒng)一著色器，也就是我們常說的流處理器，支持VLIW(超長指令字)，然后就是2011-2019年的GCN架構(gòu)(代表核心Southern Islands)，統(tǒng)一著色器加獨立的標(biāo)量、矢量單元，二者比例為1:4。

如今，迎來了全新的RDNA(Radeon DNA)，還是統(tǒng)一著色器，但標(biāo)量和矢量單元走向融合，支持SIMT(單指令多線程) ILP(指令集并行)，類似CPU處理器的SIMD(單指令多數(shù)據(jù)流)，單線程性能和指令集執(zhí)行效率大大提升。

需要強調(diào)的是，RDNA是一個全方位重新設(shè)計的架構(gòu)，并不是GCN的又一個升級版，也不是與GCN的混合體，只是集成了GCN架構(gòu)的指令以保持向下兼容，現(xiàn)有技術(shù)仍然可以在RDNA架構(gòu)上得到支持。

RDNA架構(gòu)將是AMD GPU顯卡未來多年的基石，接下來我們將看到采用7nm+工藝的第二代版本RDNA 2，看路線圖有望明年初和我們見面。

除了RDNA新架構(gòu)，Navi核心還有7nm工藝、GDDR6顯存、PCIe 4.0總線、Radeon媒體引擎、Radeon顯示引擎等諸多全新特性。

Navi 10核心集成了103億個晶體管，相比Vega 64 125億個少了大約18％，而核心面積只有251平方毫米，相比Vega 64 495平方毫米更是小了足足一半，因此單位面積性能提升了足足1.3倍。

盡管晶體管更少、面積更小，Navi 10核心的性能相比于Vega 64卻提升了14％，同時功耗降低了23％，能效比因此大漲50％。

純架構(gòu)性能上，Navi相比于Vega在同等功耗、同等配置下提升多達50％，反應(yīng)到實際產(chǎn)品上，這貢獻了產(chǎn)品性能提升的60％左右，另外有大約25％來自7nm新工藝的加持，還有約15％來自頻率以及功耗的改進。

AMD表示，RDNA架構(gòu)的設(shè)計理念主要有四個方面，性能上要滿足在現(xiàn)代游戲負載需求，能效上要充分優(yōu)化功耗和帶寬利用率，功能上要壯大生態(tài)，擴展性上要從移動到桌面到云端通吃。

為實現(xiàn)上述目標(biāo)，RDNA架構(gòu)主要從三大方面進行了變革，包括CU計算單元、緩存、流水線，接下來我們逐一和大家分享，但鑒于GPU架構(gòu)的技術(shù)性太強，我們只是蜻蜓點水地大致看一下，最后還有AMD關(guān)于光線追蹤的規(guī)劃。

新的計算單元設(shè)計一共分為40組，每組2個標(biāo)量處理器、64個流處理器、4個64位雙線性過濾單元，總計80個、2560個、160個，執(zhí)行延遲更低，單線程性能更強，緩存效率更高，整體計算能效比GCN架構(gòu)有著巨大的提升，而且可適應(yīng)從游戲到計算各種負載。

多級緩存一致性可以帶來更低的延遲、更高的帶寬、更低的功耗，包括各處零級緩存、512KB一級緩存、4MB二級緩存。

整個圖形引擎也做了重新調(diào)整，更加順暢高效，包括幾何引擎、64個紋理單元、4個異步計算引擎(ACE)，負載分配更加均衡，可以在更低的功耗下達成更高的頻率，能效更高。

CU計算單元方面，雖然看起來每一組還是64個流處理器，數(shù)量沒變，但這個數(shù)字是AMD反復(fù)設(shè)計后與處理資源最為平衡的的組合，同時整個計算單元的結(jié)構(gòu)進行了徹底重組，和GCN時代完全不一樣了。

RDNA架構(gòu)下，每個CU計算單元的標(biāo)量解碼和發(fā)射單元、矢量解碼和發(fā)射單元、調(diào)度器的數(shù)量都增加了一倍來到兩個，指令處理率因此也提升一倍。

同時，四個SIM16矢量單元、四個SIMD4特殊功能單元變?yōu)閮蓚€SIMD32、兩個SIMD8，比如64個線程可組合為兩個Wave32，然后由兩個SIMD32執(zhí)行兩個Wave32，實現(xiàn)單時鐘周期指令發(fā)射(之前需要四個)，SIMD ALU單元的利用率也從25％來到了100％，而且支持Wave32、Wave64兩種執(zhí)行模式，以應(yīng)對不同負載需求。

此外，為了強化資源調(diào)度和利用的效率，RDNA架構(gòu)還將每兩個CU計算單元緊密地捆綁在了一起，組成一個工作組處理器(Work Group Processor)，使得可用ALU單元、寄存器數(shù)量翻番，緩存帶寬更是之前的四倍。

緩存方面，RDNA架構(gòu)設(shè)計了一套多級一致性結(jié)構(gòu)，每個雙CU組合內(nèi)都有自己的零級緩存，與ALU單元的載入帶寬翻番，增加了四組新的一級緩存(都是16-way 128KB)，降低了二級緩存(16-way 4MB)的擁堵，整體延遲和功耗大大減低。

按照AMD的說法，零級緩存的延遲降低了21％，一二級緩存降低24％，內(nèi)存延遲也低了7％。

另外在一致性多級緩存下，到處都支持Delta數(shù)據(jù)壓縮(DCC/圖中箭頭黃色部分)，提高傳輸率，同時還改進了色彩壓縮算法，可供顯示引擎讀取，著色器也能同時讀寫壓縮的色彩數(shù)據(jù)。

圖形引擎流水線方面進行了大刀闊斧的重組，包括四個增強的ACE異步計算引擎，地位更加中心化的結(jié)合處理器(包含四個原語單元)，64個像素單元。

異步計算一直是A卡的獨門絕技，也是起在DX12、Vulkan API下表現(xiàn)更好的關(guān)鍵，如今得到增強后，可以更精準地實時控制其他模塊。

有趣的是，RDNA GPU架構(gòu)設(shè)計也借鑒了Zen CPU架構(gòu)設(shè)計的一些先進理念，尤其是在時鐘門控方面，效率和能效極高，同時還減少了達到更高頻率所需要的邏輯層級。

Radeon顯示引擎也大幅躍進，支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR，針對高分辨率HR顯示器優(yōu)化，可輸出4K/240Hz、8K/60Hz，而且都只需一根數(shù)據(jù)線即可達成，同時還優(yōu)化了VR頭顯顯示。

Radeon多媒體引擎則大大改進了視頻編解碼，增加了新的H.265 HDR/WCG編碼器，全面支持H.264 1080p600、4K150、8K30解碼和1080p360、4K90編碼，H.265 1080p360、4K90、8K24解碼和1080p360、4K60編碼，VP9 4K90、8K24解碼，整體編碼速度加快40％。

對于大家非常關(guān)注的光線追蹤支持，GCN、RDNA架構(gòu)都沒有專門的硬件單元加速，不過事實上，AMD ProRender、Radeon Rays都早就支持了光線追蹤，分別面向內(nèi)容創(chuàng)作渲染和游戲開發(fā)。

在下一代RDNA架構(gòu)上，AMD會通過硬件單元，支持特定的光線追蹤效果在游戲中實時渲染，而即便到了更遙遠的未來，AMD也不會將光線追蹤全部一股腦扔給硬件來本地處理，否則效率會非常低下，而是將借助云計算，實現(xiàn)全場景的光線追蹤，保證畫面效果的同時，不會給本地硬件太大的壓力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19286

瀏覽量
229866
amd

amd

+關(guān)注

關(guān)注
25

文章
5468

瀏覽量
134174
顯卡

顯卡

+關(guān)注

關(guān)注
16

文章
2434

瀏覽量
67627
GPU架構(gòu)

GPU架構(gòu)

+關(guān)注

關(guān)注
0

文章
15

瀏覽量
8466

原文標(biāo)題：四年研發(fā)，終成正果！AMD 全新GPU架構(gòu)解析：相比 Vega 64 面積更小，性能提升14％，功耗降低23％

文章出處：【微信號：wc_ysj，微信公眾號：旺材芯片】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

AMD最強AI芯片，性能強過英偉達H200，但市場仍不買賬，生態(tài)是最大短板？

。 ? 其中，全新旗艦AI芯片的型號為AMD Instinct MI325X GPU，雖然仍然是采用CDNA 3架構(gòu)，但是相較于AMD In

發(fā)表于 10-14 01:32 ?3449次閱讀

<b class='flag-5'>AMD</b>最強AI芯片，<b class='flag-5'>性能</b>強過英偉達H200，但市場仍不買賬，生態(tài)是最大短板？

芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

芯原股份近日宣布，正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計算

發(fā)表于 12-24 10:55 ?142次閱讀

芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

芯原股份（芯原，股票代碼：688521.SH）今日宣布推出全新Vitality架構(gòu)的圖形處理器（GPU）IP系列，具備高性能計算能力，廣泛適用于云游戲、AI PC、獨立顯卡和集成顯卡等

發(fā)表于 12-19 15:55 ?142次閱讀

芯原發(fā)布全新Vitality架構(gòu)GPU IP系列

發(fā)表于 12-19 15:26 ?278次閱讀

《CST Studio Suite 2024 GPU加速計算指南》

問題，但會降低舊GPU硬件性能，可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式（Windows only）：某些GPU計算需要啟用，可通過命令行

發(fā)表于 12-16 14:25

《算力芯片高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

在數(shù)據(jù)挖掘工作中，我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù)，這讓我對GPU架構(gòu)和張量運算充滿好奇。閱讀《算力芯片》第7-9章，讓我對這些關(guān)鍵技術(shù)有了全新認識。 GPU

發(fā)表于 11-24 17:12

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

本篇閱讀學(xué)習(xí)第七、八章，了解GPU架構(gòu)演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構(gòu)演進 GPU圖像計算發(fā)展 ●從三角形開始

發(fā)表于 11-03 12:55

AMD與NVIDIA GPU優(yōu)缺點

在圖形處理單元（GPU）市場，AMD和NVIDIA是兩大主要的競爭者，它們各自推出的產(chǎn)品在性能、功耗、價格等方面都有著不同的特點和優(yōu)勢。一、性能

發(fā)表于 10-27 11:15 ?717次閱讀

AMD全新處理器擴大數(shù)據(jù)中心CPU的領(lǐng)先地位

在Computex 2024 開幕主題演講上，AMD 詳細介紹了全新的 CPU、NPU 和 GPU 領(lǐng)先架構(gòu)，為從數(shù)據(jù)中心到個人電腦的端到端 AI 基礎(chǔ)

發(fā)表于 09-19 11:01 ?533次閱讀

名單公布！【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

和像素統(tǒng)一的G80到現(xiàn)在重金難求的H100；AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn)；中國的高性能計算芯片逐步獲得更多TOP500排名；華為Ascend 910 NPU芯片也成為AI時代

發(fā)表于 09-02 10:09

GPU云服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢

GPU云服務(wù)器作為一種高性能計算資源，近年來在人工智能、大數(shù)據(jù)分析、圖形渲染等領(lǐng)域得到了廣泛應(yīng)用。它結(jié)合了云計算的靈活性與GPU的強大計算能力，為企業(yè)和個人用戶提供了一種高效、便捷的計算解決方案。下面我們將從

發(fā)表于 08-14 09:43 ?391次閱讀

AMD推出全新AMD銳龍和EPYC處理器，擴大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

、游戲、內(nèi)容創(chuàng)造和工作效率提供領(lǐng)先性能 ?在Computex 2024 開幕主題演講上，AMD?(納斯達克股票代碼: AMD) 詳細介紹了全新的?CPU、NPU 和?

發(fā)表于 06-04 19:21 ?1001次閱讀

進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

冷卻技術(shù)，提高計算密度，減少占地面積，并通過高帶寬、低延遲的GPU通信，有效減少數(shù)據(jù)中心的碳足跡和能源消耗。相較于傳統(tǒng)的NVIDIA H100風(fēng)冷基礎(chǔ)設(shè)施，GB200在相同功耗下實現(xiàn)25倍的性能

發(fā)表于 05-13 17:16

天璣9300旗艦芯：全大核CPU架構(gòu)，性能與能效的提升

“全大核”CPU 架構(gòu)設(shè)計打破常規(guī)，摒棄小核，采用超大核（Arm Cortex-X）與大核（Arm Cortex-A）的組合，以更高時鐘頻率提升性能和能效，同時降低功耗，延長電池壽命。

發(fā)表于 05-06 10:22 ?630次閱讀

深入解讀AMD最新GPU架構(gòu)

GCN 取代了 Terascale，并強調(diào) GPGPU 和圖形應(yīng)用程序的一致性能。然后，AMD 將其 GPU 架構(gòu)開發(fā)分為單獨的 CDNA 和 RDNA 線路，分別專門用于計算和圖形。

發(fā)表于 01-08 10:12 ?1227次閱讀

搜索歷史

AMD全新GPU架構(gòu)解析性能提升14％功耗降低23％

評論

AMD最強AI芯片，性能強過英偉達H200，但市場仍不買賬，生態(tài)是最大短板？

芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

芯原發(fā)布全新Vitality架構(gòu)GPU IP系列

《CST Studio Suite 2024 GPU加速計算指南》

《算力芯片高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

AMD與NVIDIA GPU優(yōu)缺點

AMD全新處理器擴大數(shù)據(jù)中心CPU的領(lǐng)先地位

名單公布！【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

GPU云服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢

AMD推出全新AMD銳龍和EPYC處理器，擴大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

天璣9300旗艦芯：全大核CPU架構(gòu)，性能與能效的提升

深入解讀AMD最新GPU架構(gòu)

搜索歷史

AMD全新GPU架構(gòu)解析 性能提升14％功耗降低23％

評論

AMD全新GPU架構(gòu)解析性能提升14％功耗降低23％