詳解AMD RDNA2 GPU架構(gòu)設(shè)計(jì)方案

2019年，AMD 放棄了長(zhǎng)期使用的 GCN 架構(gòu)，轉(zhuǎn)而采用 RDNA。本文我們將來分析下RDNA 2，RDNA 2在RDNA 1基礎(chǔ)上進(jìn)行了擴(kuò)展，同時(shí)添加了光線追蹤支持和其他一些增強(qiáng)功能。在本文中，我們可以做一些有趣的事情，并從 RDNA 2 的角度來看一些游戲。 ?

01?架構(gòu)

顧名思義，RDNA 2 建立在 RDNA 1 架構(gòu)之上。AMD 進(jìn)行了多項(xiàng)更改以提高效率并使硬件功能保持最新狀態(tài)，但基本的 WGP 架構(gòu)仍然存在。每個(gè) WGP 或工作組處理器都具有四個(gè) SIMD。每個(gè) SIMD 都有一個(gè)32寬的執(zhí)行單元，用于最常見的操作。RDNA 2 獲得一些額外的點(diǎn)積運(yùn)算指令，以幫助加速機(jī)器學(xué)習(xí)。例如，V_DOT2_F32_F16 將成對(duì)的 FP16 值相乘、相加，然后添加一個(gè) FP32 累加器。它不像Nvidia的張量核那樣，在Nvidia中，像HMMA這樣的指令直接處理8×8矩陣。但這些指令讓RDNA 2用更少的指令來做矩陣乘法，而不是使用普通的融合乘法-加法指令。每個(gè) SIMD 都有 32 個(gè)寬度的執(zhí)行單元用于最常見的操作，一個(gè) 128 KB 的矢量寄存器文件，并且可以跟蹤多達(dá) 16 個(gè)波面。因此，AMD 減少了 RDNA 2 可以跟蹤的波面數(shù)量，從 RDNA 1 中的 20 個(gè)。GPU 不會(huì)像高性能 CPU 那樣進(jìn)行亂序執(zhí)行。相反，它們保持大量線程處于運(yùn)行狀態(tài)，并在線程之間切換以保持執(zhí)行單元被占用以隱藏延遲。在 RDNA 2 上，SIMD 基本上有 16 路 SMT，而在 RDNA 1 上有 20 路。

RDNA 2 架構(gòu)的 WGP 和 Nvidia Ampere 的 SM 的基本草圖這聽起來像是一種回歸（regression），但跟蹤更多的波陣面(類似于CPU線程)可能是昂貴的。線程或波面選擇邏輯必須解決與CPU調(diào)度器非常相似的問題。每個(gè)周期，每個(gè)條目都必須檢查，看它是否準(zhǔn)備好執(zhí)行了。AMD可能希望將每個(gè)周期的檢查次數(shù)從20次減少到16次，以便在更低的功率下達(dá)到更高的時(shí)鐘速度。在相同的處理節(jié)點(diǎn)上，RDNA 2的時(shí)鐘比它的前身要高得多，所以AMD在這方面做得很好。 RDNA 2也比安培好。盡管這兩種架構(gòu)都使用基本的構(gòu)建模塊(SMs或WGP)，每個(gè)周期可以執(zhí)行128個(gè)FP32操作，但RDNA 2 WGP可以保持64個(gè)波陣面。Ampere SM只能保持飛行中的48個(gè)warp。RDNA 2也有更多的向量寄存器文件容量，這意味著編譯器可以在不減少占用的情況下在寄存器中保存更多的數(shù)據(jù)。

這讓 RDNA 2 WGP 有更好的機(jī)會(huì)通過保持更多的工作在進(jìn)行中來隱藏延遲。將其與更好的緩存相結(jié)合，每個(gè) RDNA 2 WGP 都應(yīng)該能夠比 Ampere SM 更有力。 WGP 的四個(gè) SIMD 被組織成兩個(gè)一組，AMD 稱之為計(jì)算單元 (CU)。一個(gè) CU 有自己的內(nèi)存管道和 16 KB L0 向量緩存。在 CU 級(jí)別，AMD 增強(qiáng)了內(nèi)存管道以添加硬件光線跟蹤加速。具體來說，紋理單元現(xiàn)在可以執(zhí)行射線相交測(cè)試，每個(gè)周期進(jìn)行四次框測(cè)試或每個(gè)周期進(jìn)行一次三角形測(cè)試。盒子測(cè)試發(fā)生在 BVH 的上層，而三角測(cè)試發(fā)生在最后一層。BVH，或有界頂點(diǎn)層次結(jié)構(gòu)，使用分而治之的方法加速光線追蹤。因?yàn)闄z查場(chǎng)景中的每個(gè)三角形都非常昂貴，盒子測(cè)試縮小了光線穿過的區(qū)域，理想情況下 GPU 最后只檢查一組狹窄的三角形。

RDNA 2中引入的光線追蹤加速指令光線追蹤加速是通過一些新的紋理指令來訪問的。顯然，這些指令實(shí)際上并沒有做傳統(tǒng)的紋理工作，但是紋理單元是附加這個(gè)額外功能的一個(gè)方便的地方。新的指令本身只做交集測(cè)試。常規(guī)的計(jì)算著色器代碼處理遍歷BVH。它還必須計(jì)算逆射線方向，并將其提供給紋理單元，即使紋理單元本身有足夠的信息來計(jì)算。AMD可能想要最小化支持光線追蹤的硬件成本，并且認(rèn)為他們有足夠的常規(guī)著色器來解決這個(gè)問題。 ?

02?緩存

除了在功能上與英偉達(dá)不相上下之外，RDNA 2還可以擴(kuò)展到性能上。最高端的RDNA 1 GPU RX 5700 XT只有20個(gè)WGP。它也建立在一個(gè)251平方毫米的小芯片上，與英偉達(dá)的中端卡競(jìng)爭(zhēng)，而不是挑戰(zhàn)他們的高端卡。RDNA 2的RX 6900 XT將WGP數(shù)翻了一番，并提高了時(shí)鐘速度，顯示了AMD想要挑戰(zhàn)英偉達(dá)最佳性能的雄心。但就像增加CPU的核心數(shù)量一樣，GPU的擴(kuò)展也會(huì)產(chǎn)生更高的帶寬需求。英偉達(dá)選擇了耗電384位GDDR6X設(shè)置來為安培供電。AMD選擇了256位的GDDR6配置。為了避免內(nèi)存帶寬瓶頸，RDNA 2獲得了額外級(jí)別的緩存。AMD將其命名為“無(wú)限緩存”，并在內(nèi)部將其稱為MALL(內(nèi)存連接最后一級(jí))。

RDNA 2和英偉達(dá)Ampere的緩存層次結(jié)構(gòu)的簡(jiǎn)化草圖 MALL的名稱是有意義的，因?yàn)樗械?a href="http://wenjunhu.com/v/tag/3668/" target="_blank">VRAM訪問都要經(jīng)過它。RDNA 2的L2也是一個(gè)由整個(gè)GPU共享的緩存，但是如果虛擬內(nèi)存頁(yè)面被設(shè)置為非緩存，就可以繞過它。同步屏障也可以刷新L2以確保一致性。這些訪問可以被RDNA 2上的無(wú)限緩存捕獲，而以前的AMD GPU將從VRAM中提供服務(wù)。因?yàn)長(zhǎng)2應(yīng)該足夠大以捕獲大量的內(nèi)存訪問，無(wú)限緩存的性能并不是那么重要，AMD在一個(gè)單獨(dú)的時(shí)鐘域上運(yùn)行無(wú)限緩存。這意味著它可以調(diào)得更低以節(jié)省電力。 ?

03?延遲

通過延遲測(cè)試，我們可以看到AMD復(fù)雜的四級(jí)緩存系統(tǒng)的運(yùn)行情況。我們還可以看到英偉達(dá)更簡(jiǎn)單的兩級(jí)緩存結(jié)構(gòu)。Ampere的SMs具有更大的L1緩存容量，當(dāng)RDNA WGP必須從較慢的每個(gè)SA L1緩存時(shí)，可以讓SM服務(wù)請(qǐng)求從其第一級(jí)緩存。在較大的測(cè)試規(guī)模下，RDNA 2具有明顯的延遲優(yōu)勢(shì)，特別是當(dāng)測(cè)試規(guī)模溢出英偉達(dá)的L2時(shí)。

與 RDNA 1 相比，前三個(gè)緩存級(jí)別的性能提升較小，主要來自時(shí)鐘速度的提高。然后 Infinity Cache 在更大的測(cè)試規(guī)模上產(chǎn)生巨大影響。對(duì)于如此大的緩存，延遲非常低。作為對(duì)比，RTX 3090 的 L2 有 140 ns 的延遲，但只有 6 MB 的容量。無(wú)限緩存延遲也值得仔細(xì)研究。AMD 的 Adrenaline Edition 軟件非常先進(jìn)，可以讓用戶幾乎任意設(shè)置最大時(shí)鐘速度。我們可以使用它來查看緩存在 GPU 核心時(shí)鐘變化時(shí)的行為。

在較低的時(shí)鐘下，RDNA 2 的 WGP 從 Infinity Cache 獲取數(shù)據(jù)所需的周期更少。這可能意味著在較低時(shí)鐘下提高著色器利用率。從矢量方面，我們看到了同樣的故事。RDNA 2 與速度更快的 RDNA 1 非常相似，帶有一個(gè)額外的巨大緩存。矢量訪問比標(biāo)量訪問延遲更高。Nvidia 沒有單獨(dú)的標(biāo)量?jī)?nèi)存層次結(jié)構(gòu)。他們的架構(gòu)確實(shí)有常量緩存，但那些是只讀的，并且比 AMD 的標(biāo)量數(shù)據(jù)路徑服務(wù)的用途更有限。

Nvidia 受益于較小測(cè)試規(guī)模的較低延遲，而 RDNA 2 在較大測(cè)試規(guī)模上保持優(yōu)勢(shì)。AMD 的 L2 和 Infinity Cache 延遲看起來非常好，考慮到 RDNA 2 必須檢查比 Nvidia 更多的緩存級(jí)別。一旦我們到達(dá) VRAM，情況就會(huì)逆轉(zhuǎn)。 ?

04?帶寬

帶寬也很重要，因?yàn)?GPU 旨在并行處理大量操作。讓我們從查看單個(gè)工作組的帶寬開始。運(yùn)行單個(gè)工作組將我們限制在 AMD 上的單個(gè) WGP，或 Nvidia 架構(gòu)上的 SM。這是我們可以在 CPU 上獲得的最接近單核帶寬的值。與 CPU 上的單核帶寬一樣，此類測(cè)試并不特別代表任何現(xiàn)實(shí)世界的工作負(fù)載。但它確實(shí)讓我們從單個(gè)計(jì)算單元的角度了解了內(nèi)存層次結(jié)構(gòu)。

不評(píng)論第一級(jí)緩存帶寬，因?yàn)橛捎诘刂飞珊瓦吔鐧z查開銷，這很難測(cè)試通過一個(gè)WGP, RDNA 2通過高時(shí)鐘實(shí)現(xiàn)了非常高的緩存帶寬。這種優(yōu)勢(shì)在大型測(cè)試中尤其突出，其中128 MB無(wú)限緩存發(fā)揮了作用。AMD的緩存架構(gòu)比英偉達(dá)的要好得多。在低占用時(shí)，即使是無(wú)限緩存也可以提供比安培L2更多的帶寬。隨著我們使用更多的工作組和加載更多的WGP或SMs，帶寬需求明顯上升。這對(duì)共享緩存提出了更大的要求。AMD在這方面做得很好。L2帶寬開始時(shí)非常出色，并且隨著我們加載更多WGPs而擴(kuò)展得非常好。在我們開始獲得良好的帶寬之前，我們必須在Nvidia的RTX 3090上加載更多的SM。

Infinity Cache 帶寬擴(kuò)展也非常好，實(shí)際上與 RDNA 1 的 L2 帶寬非常接近。它無(wú)法與 Nvidia 的 3090 上的 L2 帶寬相匹配，但它不需要，因?yàn)樗懊娴?4 MB L2 應(yīng)該可以捕獲大量訪問。到目前為止，AMD 在緩存帶寬方面看起來相當(dāng)不錯(cuò)。然而，VRAM 是另一回事。

Nvidia 擁有巨大的 VRAM 帶寬優(yōu)勢(shì)。對(duì)于高速緩存無(wú)法容納的大量工作負(fù)載，Ampere 耗盡 VRAM 帶寬的可能性要小得多。然而，兩代 RDNA 都更善于利用它們擁有的 VRAM 帶寬。他們不需要那么多的工作來充分利用他們的可用帶寬。 ?

05?CU和WGP模式

AMD RDNA 架構(gòu)中的 WGP 可以在 WGP 模式和 CU 模式下運(yùn)行。在 WGP 模式下，128 KB LDS 用作單個(gè)統(tǒng)一內(nèi)存塊。WGP 中的所有四個(gè) SIMD 都可以訪問整個(gè) 128 KB。在 CU 模式下，LDS 被分成兩個(gè) 64 KB 的一半，每個(gè)都與一對(duì) SIMD 相關(guān)聯(lián)。 LDS延遲在兩種模式下保持相同，約為19.5 ns，即使CU模式應(yīng)該簡(jiǎn)化來自LDS的請(qǐng)求路由。這同樣適用于RDNA 1，它具有大約26.6 ns的LDS延遲。 LDS組織差異使我們能夠通過使用單個(gè)工作組進(jìn)行測(cè)試來命中單個(gè)CU（WGP 的一半）。因?yàn)槊總€(gè)CU都有自己的內(nèi)存管道和L0緩存，所以當(dāng)我們?cè)赪GP中只使用一個(gè)CU 時(shí)，我們會(huì)看到 L0 帶寬下降。一旦我們到達(dá) L2 之后，帶寬就不會(huì)下降。

與RDNA 1相比，這是一個(gè)很大的改進(jìn)，RDNA 1在緩存層次結(jié)構(gòu)中看到了帶寬的顯著下降。帶寬通常取決于隊(duì)列隱藏延遲的能力，因此RDNA 2在分配隊(duì)列條目方面可能更靈活。也許L1和L2之間的一些隊(duì)列在RDNA 1中按CU分配，但在RDNA 2中按WGP分配。對(duì)于GPU工作負(fù)載，這意味著如果運(yùn)行在WGP的一半中的波提前結(jié)束，RDNA 2會(huì)表現(xiàn)得更好。 ?

06?從游戲的角度

RDNA 2 是游戲優(yōu)先架構(gòu)，所以讓我們看看 RX 6900 XT 在這些工作負(fù)載中必須處理什么。研究游戲也將幫助我們了解游戲工作負(fù)載是什么樣的。 賽博朋克2077,RT On CD Projekt Red的《賽博朋克2077》是現(xiàn)代GPU技術(shù)的展示。它使用帶有大量光線追蹤的DirectX 12來提供豐富的圖形效果。不幸的是，這些影響可能非常嚴(yán)重。光線追蹤對(duì)性能的影響尤其大。請(qǐng)記住，這個(gè)游戲的數(shù)字是在GPU的最大時(shí)鐘設(shè)置為1800mhz的一致性下獲得的。3950X禁用了boost。因此，這里的數(shù)字不應(yīng)被視為股票業(yè)績(jī)數(shù)字，也不應(yīng)與其他系統(tǒng)進(jìn)行比較。我們只關(guān)注顯卡在做什么工作。在這場(chǎng)比賽中，我們將沿著Jig Jig街向下看。

俯視賽博朋克 2077 中的Jig-Jig街 RT 相關(guān)工作占用大約 21 毫秒的幀時(shí)間。其中超過 9 毫秒用于構(gòu)建 BVH，因此優(yōu)化 BVH 構(gòu)建時(shí)間幾乎與優(yōu)化 BVH 遍歷一樣重要。為了渲染光線追蹤效果，6900 XT 必須進(jìn)行 5.8 億次方框相交測(cè)試和 1.095 億次三角形相交測(cè)試。以達(dá)到的 25.9 FPS，即每秒 150 億次盒子測(cè)試和 28 億次三角測(cè)試。

使用 Radeon GPU Profiler 檢查幀。頂視圖在渲染框架時(shí)顯示占用情況除了光線追蹤，賽博朋克還大量使用計(jì)算。傳統(tǒng)的光柵化退居二線，也許顯示出尖端游戲的趨勢(shì)。因?yàn)榇蟛糠謺r(shí)間都花在了光線追蹤上，所以讓我們從運(yùn)行時(shí)間最長(zhǎng)的 DispatchRays 調(diào)用開始仔細(xì)看看。具體來說，讓我們看看單獨(dú)使用 7.2 毫秒的那個(gè)：

在我們正在查看的電話周圍放一個(gè)方框在內(nèi)部，RDNA 2 將光線跟蹤內(nèi)核視為計(jì)算著色器。這個(gè)特定的調(diào)用啟動(dòng)了 32,400 個(gè)計(jì)算波陣面。6900 XT 的 40 個(gè) WGP 總共可以保持 2560 個(gè)波面在飛行中，所以這足以填滿整個(gè) GPU。然而，RDNA 2 無(wú)法讓這個(gè)內(nèi)核的 2560 個(gè)波面保持在飛行狀態(tài)，因?yàn)樗鼪]有足夠的向量寄存器文件容量。與 CPU 不同，GPU 可以靈活地分配向量寄存器文件容量。為每個(gè)線程（波面）提供更多寄存器有助于防止寄存器溢出，但也會(huì)減少它可以保持運(yùn)行的線程數(shù)量。對(duì)于這個(gè)內(nèi)核，編譯器選擇使用 96 個(gè)矢量寄存器，這意味著 RDNA 2 的矢量寄存器文件容量?jī)H足以跟蹤每個(gè) SIMD 的 10 個(gè)波面，或者整個(gè) GPU 中的 1600 個(gè)。一方面，這意味著每個(gè) SIMD 都無(wú)法通過在一個(gè)停頓時(shí)在波面之間切換來保持執(zhí)行單元忙碌。另一方面，使用更多的寄存器可以讓編譯器暴露更多的指令級(jí)并行性。從配置文件來看，RDNA 2 花費(fèi)大量時(shí)間占用受向量寄存器容量限制，因此減少 RDNA 1的最大占用看起來是合理的。

更多關(guān)于那次call的細(xì)節(jié) 在這種情況下，操作者可能做出了正確的權(quán)衡，或者至少?zèng)]有做出糟糕的決定。51%的矢量ALU使用率處于一個(gè)良好的位置。著色器沒有被充分利用。與此同時(shí)，利用率不會(huì)超過70-80%，這意味著只能使用計(jì)算方案。我們也看到少量的LDS使用。AMD使用LDS存儲(chǔ)BVH遍歷堆棧，使寫入和延遲敏感的讀取遠(yuǎn)離未優(yōu)化的全局內(nèi)存路徑。其他光線跟蹤調(diào)用顯示了類似的硬件使用模式。

這是命中 RT 單元的著色器的基本塊。著色器必須使用三個(gè)額外的指令來計(jì)算光線方向的倒數(shù)，并將其與光線方向一起提供。三個(gè)額外的指令并不多，但這些相互指令相當(dāng)昂貴，并且與更簡(jiǎn)單的 FP32 操作相比只能以四分之一的速率執(zhí)行。最重要的是，編譯器必須使用三個(gè)額外的寄存器來保存反向光線方向。我不確定這會(huì)產(chǎn)生多大的影響，但還有改進(jìn)的余地。不幸的是，AMD 沒有通過他們的分析工具公開 Infinity Cache 計(jì)數(shù)器。不過，我們還是可以看看前三級(jí)緩存是怎么做的。首先，L0 緩存命中率很差，略低于 55%。即使在 Bulldozer 等低于標(biāo)準(zhǔn)的實(shí)現(xiàn)中，CPU 通常也能看到超過 80% 的一級(jí)緩存命中率。128 KB 的中級(jí)緩存有助于捕捉其中的一些未命中，使累積的 L0+L1 命中率略低于 73%。我在這里的印象是L0和L1緩存太小了。4 MB L2 是這里的英雄，在進(jìn)入更高延遲的 Infinity Cache 之前將累積命中率提高到 95.4%。 RDNA 2 的 16 KB 標(biāo)量緩存實(shí)現(xiàn)了相對(duì)較好的命中率，剛好超過 90%，更重要的是從向量路徑卸載了一些請(qǐng)求。從指令方面看，L1i 的命中率超過 99%。GPU 程序的指令足跡似乎比 CPU 程序小，32 KB L1i 似乎足夠了。 BVH建筑 RGP 將幾個(gè)部分注釋為對(duì)構(gòu)建BVH的BuildRaytracingAccelerationStructure的調(diào)用。如前所述，這些部分占用了很大一部分光線追蹤時(shí)間，所以讓我們也看看其中的一個(gè)。最長(zhǎng)的一個(gè)是調(diào)用號(hào) 4838，奇怪的是它是一個(gè) DispatchRays 調(diào)用并顯示交叉測(cè)試活動(dòng)。我不確定那是什么意思，所以我將轉(zhuǎn)到第二長(zhǎng)的那個(gè)。調(diào)用4221對(duì)應(yīng)于CmdDispatchBuildBVH，在計(jì)算隊(duì)列中運(yùn)行。它的占用率很低，因?yàn)橹挥?60個(gè)波陣面發(fā)射。這遠(yuǎn)遠(yuǎn)不足以填滿GPU，所以這部分可能會(huì)受到延遲的限制。同步障礙阻止GPU使用異步工作來保持執(zhí)行單元繁忙。幸運(yùn)的是，這部分只持續(xù)1.7毫秒。

與上面介紹的光線遍歷部分不同，AMD 的驅(qū)動(dòng)程序選擇在這個(gè) BVH 構(gòu)建部分使用 wave64 模式。我懷疑這是最好的選擇。wave32 模式在占用率低的情況下應(yīng)該更可取，因?yàn)樗试S更多的線程級(jí)并行性。但 AMD 可能有充分的理由使用 wave64，所以我將不再是一個(gè)紙上談兵的四分衛(wèi)，而是轉(zhuǎn)向緩存。和以前一樣，指令緩存命中率非常高。標(biāo)量緩存沒有足夠的標(biāo)量?jī)?nèi)存訪問。在向量方面，16 KB L0 的性能非常差，命中率低于 25%，而 128 KB L1 也可能不存在。RDNA 的 L2 最終服務(wù)于大部分內(nèi)存流量，并且以比光線遍歷部分更極端的方式。由于占用率很低，L0/L1 緩存命中率很低，L2 延遲很可能成為構(gòu)建 BVH 時(shí)的限制因素。 計(jì)算 除了光線追蹤（技術(shù)上被視為 RDNA 上的一種計(jì)算形式）之外，《賽博朋克 2077》還大量使用了計(jì)算著色器。該游戲中的非光線追蹤計(jì)算往往包含大量持續(xù)時(shí)間較短的調(diào)用，而不是一些非常繁重的調(diào)用。持續(xù)時(shí)間最長(zhǎng)的計(jì)算調(diào)用（編號(hào) 4473）是為 wave32 模式編譯的，運(yùn)行時(shí)間不到 0.7 毫秒。RDNA 2 午餐吃這個(gè)。著色器不使用大量矢量寄存器或 LDS 空間，并啟動(dòng) 130,560 個(gè)波前。因此，入住率非常好。

矢量ALU的利用也很好。事實(shí)上，這簡(jiǎn)直太好了。再高一點(diǎn)，我們就稱這部分為有限計(jì)算。RDNA 2的標(biāo)量數(shù)據(jù)路徑在卸載應(yīng)用于波前的計(jì)算中起著關(guān)鍵作用。緩存命中率也有助于良好的計(jì)算利用率。大約94%的向量訪問是由L0和L1緩存提供服務(wù)的，其中大部分來自L0。L2使累積命中率超過98%。L1指令緩存和標(biāo)量緩存的命中率如此之高，以至于失敗基本上是噪音。對(duì)于這個(gè)著色器，良好的緩存命中率和高占用率結(jié)合起來讓RDNA 2發(fā)光。第二長(zhǎng)的計(jì)算著色器(編號(hào)4884)運(yùn)行了不到半毫秒，并表現(xiàn)出不同的特征。它使用的是wave64，并且占用被矢量寄存器文件容量限制為每個(gè)SIMD只有四個(gè)波。盡管如此，RGP仍然報(bào)告了非常好的VALU利用率。這可能是因?yàn)檫@個(gè)內(nèi)核絕大多數(shù)由矢量ALU指令組成。沒有太多的內(nèi)存訪問，而且大量的內(nèi)存訪問確實(shí)會(huì)發(fā)生在標(biāo)量路徑上。

此外，這個(gè)計(jì)算著色器的分支很少，RGP 沒有選擇任何已采用的分支。GPU 上的分支非常昂貴，GPU 沒有分支預(yù)測(cè)并且必須暫停線程直到分支條件得到解決。沒有采取的分支也意味著分歧不是一個(gè)大問題?？偟膩碚f，這個(gè)著色器主要由直線 FP32 spam組成。GPU 喜歡這些東西。RDNA 2 也不例外，盡管占用率低，但硬件利用率非常好。

07?賽博朋克2077，RT關(guān)閉

光線追蹤效果很酷，但Cyberpunk 2077在關(guān)閉 RT 的情況下看起來仍然非常好。如果美術(shù)師和開發(fā)人員擅長(zhǎng)他們的工作，傳統(tǒng)的光柵化仍然可以渲染出令人印象深刻的場(chǎng)景，而 CP2077 的工作人員似乎絕對(duì)能勝任這項(xiàng)任務(wù)。

開頭附近的大量空白區(qū)域沒有 GPU 活動(dòng)表明我們受 CPU 限制如果沒有光線追蹤，傳統(tǒng)的頂點(diǎn)和像素著色器就會(huì)介入并發(fā)揮更大的作用。然而，該游戲仍然大量使用計(jì)算著色器，并且異步計(jì)算也出現(xiàn)了。三個(gè)持續(xù)時(shí)間最長(zhǎng)的調(diào)用都是計(jì)算的，總結(jié)如下：

比較三個(gè)最長(zhǎng)的GPU調(diào)用，這三個(gè)都是計(jì)算著色器 RDNA 2在這些計(jì)算內(nèi)核中表現(xiàn)非常好，即使對(duì)于運(yùn)行時(shí)間最長(zhǎng)的內(nèi)核來說，利用率處于較低的水平。矢量寄存器文件容量繼續(xù)限制架構(gòu)可以利用的并行性，但這個(gè)問題并不是AMD獨(dú)有的。在緩存方面，128 KB L1通常表現(xiàn)不佳。我們看到256 KB的中級(jí)緩存對(duì)于cpu來說已經(jīng)很普通了。GPU緩存就更難了。一次又一次，RDNA 2的L1錯(cuò)過的比命中的多。我很高興AMD選擇在RDNA 3中增加L1緩存容量。好的一面是，標(biāo)量緩存和指令緩存的命中率繼續(xù)保持良好。 ?

08?光柵化

與光線追蹤不同，傳統(tǒng)的柵格化管道非常高效。光柵化可以使用簡(jiǎn)單的計(jì)算將3D點(diǎn)映射到2D屏幕空間，而不是到處發(fā)送光線并觀察它們擊中了什么。然后，GPU使用固定功能硬件將工作分配到像素著色器，這些著色器決定這些像素應(yīng)該是什么顏色。像以前一樣，讓我們看看CP2077中幾個(gè)最長(zhǎng)的柵格化調(diào)用。

通過柵格化工作，L1緩存的顯示更加可信。hitrate仍然不是很好，但在某些情況下，它可以捕捉到足夠多的L0錯(cuò)誤，以確保絕大多數(shù)請(qǐng)求不需要從L2或更高的地方得到滿足。這可能是一個(gè)很大的優(yōu)勢(shì)，因?yàn)長(zhǎng)1的延遲和帶寬特性比L2要好得多。還有一組頂點(diǎn)著色器工作靠近幀的開始。這很難分析，因?yàn)橛写罅康奈⑿『艚校Q探一些顯示，它們通常每次發(fā)射不到100個(gè)波陣面。從我們的延遲和帶寬縮放測(cè)試來看，RDNA 2在低占用率的情況下表現(xiàn)非常出色，可能比英偉達(dá)的Ampere更好地應(yīng)對(duì)這些呼叫。 ?

09?泰坦尼克榮譽(yù)與榮耀

擁有數(shù)百萬(wàn)美元預(yù)算的大型工作室能夠制作出具有深刻故事情節(jié)和令人印象深刻的視覺效果的復(fù)雜游戲。但他們并沒有壟斷樂趣，獨(dú)立創(chuàng)作者用較小的預(yù)算也可以創(chuàng)造出沉浸式和視覺上令人驚嘆的東西。其中一個(gè)例子就是正在進(jìn)行中的《泰坦尼克號(hào)榮譽(yù)與榮耀》項(xiàng)目，該項(xiàng)目專注于用3D技術(shù)重現(xiàn)泰坦尼克號(hào)。它使用虛幻引擎，并使用DirectX 12運(yùn)行。與許多獨(dú)立游戲一樣，開發(fā)者花在優(yōu)化上的時(shí)間和資源較少。但也許是因?yàn)樗€沒有經(jīng)過優(yōu)化，演示文稿的細(xì)節(jié)水平令人驚嘆，即使在現(xiàn)代GPU上也非常沉重。

頭等艙休息室場(chǎng)景獲得側(cè)寫。這里的細(xì)節(jié)令人難以置信在這里，我們俯視頭等艙休息室，游戲以 4K 分辨率運(yùn)行，GPU/CPU 時(shí)鐘設(shè)置如前。像素著色器主導(dǎo)此工作負(fù)載，但計(jì)算著色器也發(fā)揮作用。異步計(jì)算使用率極低，幾乎所有調(diào)用都發(fā)生在圖形隊(duì)列上。

最長(zhǎng)的調(diào)用是事件 1325，一個(gè)以 wave64 模式運(yùn)行的像素著色器。它發(fā)射了 129,652 個(gè)波前，或足以覆蓋 4K 分辨率下的每個(gè)像素的波。由于向量寄存器文件的限制，占用率很低。向量 ALU 的利用率也很低，這可能是由于占用率低和緩存命中率一般。

長(zhǎng)時(shí)間運(yùn)行的像素著色器的分析器統(tǒng)計(jì)信息事件 1330 是第二長(zhǎng)的調(diào)用，是一個(gè)啟動(dòng) 16,320 個(gè) wave32 波前的計(jì)算著色器。占用率再次受到向量寄存器文件的限制，但這次每個(gè) SIMD 有 12 個(gè)波更好。著色器實(shí)現(xiàn)了 27.7% 的矢量 ALU 利用率，這是可以接受的，但仍然偏低。L0 命中率還不錯(cuò)，為 59.69%，而 L1 命中率低得令人尷尬，只有13.11%。幸運(yùn)的是，二級(jí)緩存以 99.82% 的命中率挽救了局面。計(jì)算利用率應(yīng)該真的更好，因?yàn)槊總€(gè) SIMD 12 個(gè) wave 并不是很糟糕的占用率。但仔細(xì)觀察就會(huì)發(fā)現(xiàn)另一個(gè)問題。工作在線程之間分布不均，有些線程先于其他線程完成。

放大該計(jì)算著色器，添加注釋并將著色設(shè)置為著色器引擎顯然，下一個(gè)調(diào)用需要計(jì)算著色器寫入的數(shù)據(jù)，因此同步屏障會(huì)阻止它執(zhí)行，直到計(jì)算著色器中的所有線程都完成執(zhí)行。最后，這意味著許多 6900 XT 的 WGP 處于空閑狀態(tài)或沒有足夠的線程級(jí)并行性來有效隱藏延遲。這對(duì)任何 GPU 來說都不是很好，但 RDNA 2 的高時(shí)鐘速度和在低占用率下更好的處理應(yīng)該讓它比 Nvidia 的 Ampere 更好地應(yīng)對(duì)。通過 THG，我們可以看到 DirectX12 在光柵化方面的作用。它不像《賽博朋克 2077》那樣進(jìn)行光線追蹤，但兩種工作負(fù)載的緩存行為驚人地相似。 ?

10?槍手、熱火、PC

Gunner, HEAT, PC (GHPC) 是坦克模擬獨(dú)立游戲。它旨在準(zhǔn)確描繪冷戰(zhàn)后期坦克上的火控系統(tǒng)和傳感器，同時(shí)比 DCS 之類的東西更容易獲得。與 THG 演示不同，GHPC 使用 Unity 引擎并運(yùn)行 DirectX 11。不幸的是，AMD 的分析器不支持 DirectX 11。我使用 PIX 來分析游戲。但這一直很煩人，因?yàn)?PIX 有一個(gè)令人討厭的習(xí)慣，即它自己和它試圖分析的游戲都會(huì)崩潰。 GHPC 絕大多數(shù)使用傳統(tǒng)的像素和頂點(diǎn)著色器。我在 4K 下運(yùn)行游戲，所以毫不奇怪，有很多像素著色器工作。使用計(jì)算著色器。但與上面的 DirectX 12 工作負(fù)載不同，它們所起的作用非常小。

GHPC 運(yùn)行時(shí)間最長(zhǎng)的像素著色器比 THG 的緩存友好得多。我們看到超過 90% 的 L0 命中率。L1 命中率最終在 70-80% 之間非常出色，L2 命中率在 90% 以上和 60% 左右之間波動(dòng)。標(biāo)量和指令緩存命中率基本上是 100%。不幸的是，PIX 沒有顯示有關(guān)執(zhí)行單元利用率的指標(biāo)，但我希望它非常好。那是因?yàn)橛螒蛲鶗?huì)使卡產(chǎn)生大量熱量，即使在低于標(biāo)準(zhǔn)時(shí)鐘速度時(shí)也是如此。幸運(yùn)的是，PIX 確實(shí)公開了比 RGP 多得多的計(jì)數(shù)器，因此我們可以研究光柵化管道的其他方面。長(zhǎng)時(shí)間運(yùn)行的像素著色器受計(jì)算限制，似乎要處理繪制煙霧效果?？蚣茉缙诘恼{(diào)用主要處理繪圖對(duì)象，如房屋和道路。因?yàn)檫@些調(diào)用很短，而且經(jīng)常相互重疊，所以我們看到一些光柵化瓶頸出現(xiàn)了?！癙AStalledOnRasterizer”意味著圖元組裝器生成圖元的速度快于光柵化器處理它們的速度。這可能表明光柵化器或之后的任何地方存在瓶頸。

PAStalledOnRasterizer 為灰色， PSExportStalls 為紅色另一個(gè)指標(biāo)是“PSExportStalls”，它表示像素著色器程序何時(shí)計(jì)算了顏色信息，但光柵化管道中的最后階段還沒有準(zhǔn)備好接受數(shù)據(jù)。罪魁禍?zhǔn)字皇荶單元，它進(jìn)行深度測(cè)試以確保只顯示未被遮擋的像素。例如，如果坦克的一半位于房屋后面，則 Z 單元部分將確保房屋的像素顯示在最終幀中。如果來自許多不同對(duì)象的大量像素必須經(jīng)過這種深度測(cè)試，Z 單元可能很難跟上。但回過頭來看，最大的性能罪魁禍?zhǔn)卓隙ㄊ菬熿F和陰霾效果。繪制這些效果占用的 GPU 時(shí)間最多，并且像素著色器操作非常繁重。在這些著色器期間，紋理單元幾乎一直處于活動(dòng)狀態(tài)，因此也可能存在紋理瓶頸。 ?

11?緩存評(píng)論

長(zhǎng)期以來，GPU緩存一直落后于 CPU 緩存。在 2000 年代初期，GPU 沒有通用緩存層次結(jié)構(gòu)。他們確實(shí)有專門的緩沖區(qū)，但在大多數(shù)情況下，他們依賴于顯式并行和高帶寬內(nèi)存設(shè)置。到 2000 年代后期，內(nèi)存帶寬限制促使 GPU 采用緩存。這些往往比 CPU 緩存小得多，兩級(jí)緩存設(shè)置是常態(tài)。CPU 大約在那個(gè)時(shí)候轉(zhuǎn)向三級(jí)設(shè)置，以便通過高核心數(shù)和大型共享緩存保持性能。

曾幾何時(shí)，在 Geforce 4 時(shí)代，GPU 緩存是不切實(shí)際的。哦，時(shí)代變了…… RDNA 2 通過采用比我們?cè)诖蠖鄶?shù) CPU 上看到的更復(fù)雜和更高容量的緩存層次結(jié)構(gòu)來扭轉(zhuǎn)一切。它使用令人難以置信的四級(jí)緩存，最后一級(jí)緩存有 128 MB 的容量。相比之下，即使是 AMD 的 VCache CPU 也只有 96 MB 的末級(jí)緩存，并且使用三級(jí)緩存設(shè)置。就像 CPU 一樣，DRAM 技術(shù)也在努力跟上 GPU 性能的提升。但與 CPU 不同的是，GPU 對(duì)延遲不太敏感，這使得這種緩存設(shè)置變得實(shí)用（延遲似乎是 L4 緩存不受 CPU 歡迎的主要原因）。很高興看到 GPU 全面發(fā)展并比 CPU 更頻繁地使用緩存。

整體命中率，對(duì)于整個(gè)幀的所有訪問但是更復(fù)雜的緩存設(shè)置不一定好。更多級(jí)別的緩存意味著您可能會(huì)檢查更多標(biāo)簽的命中。如果緩存級(jí)別沒有捕獲大量?jī)?nèi)存訪問，它最終可能會(huì)延遲對(duì)數(shù)據(jù)最終來自何處的訪問。因此，RDNA 2 的 L1 緩存令人失望，與其他緩存級(jí)別相比命中率較低。它要么需要變得更大，要么應(yīng)該放棄以支持更大的 L0 緩存。

假設(shè)每個(gè)標(biāo)量緩存訪問都獲得一個(gè) 64 位值。讓我們暫停片刻，欣賞 GPU 緩存必須處理的海量數(shù)據(jù)。緩存還有助于提高帶寬，這對(duì) GPU 來說更為重要。L1 緩存確實(shí)減少了進(jìn)入 L2 的流量，但我懷疑 L2 是否需要這種幫助。AMD 的 RX 6900 XT 已經(jīng)擁有大量的 L2 帶寬，甚至與 Nvidia 更大的 RTX 3090 相比也是如此。因此，L1 最終僅用于整合來自多個(gè) WGP 的請(qǐng)求，從而簡(jiǎn)化了 L2 路由。縮小范圍，我們可以查看請(qǐng)求計(jì)數(shù)，乘以請(qǐng)求大小，然后乘以實(shí)現(xiàn)的幀率，以估計(jì) GPU 從其緩存中提取了多少數(shù)據(jù)。L0 緩存每秒提供數(shù) TB 的數(shù)據(jù)，如果我以標(biāo)準(zhǔn)時(shí)鐘運(yùn)行我的 6900 XT 而不是將其限制在 1800 MHz，這個(gè)數(shù)字會(huì)更高。即使在 L2，我們也看到超過 1.5 TB/s 的帶寬需求。沒有數(shù)兆字節(jié)緩存的現(xiàn)代 GPU 將非常缺乏帶寬，即使我們?yōu)樗峁┫?Nvidia A100 上那樣的六堆棧 HBM2E 設(shè)置。 ?

12?游戲趨勢(shì)

從我看過的一小部分游戲來看，計(jì)算似乎正在發(fā)揮更大的作用。計(jì)算著色器在 Cyberpunk 2077 中尤為突出，這是一款以大量預(yù)算開發(fā)的現(xiàn)代 AAA 游戲。我將光線追蹤視為一種計(jì)算形式。RDNA 2 將光線追蹤視為計(jì)算。我不確定 Nvidia 做了什么，但 Pascal 使用計(jì)算著色器處理光線追蹤。即使沒有光線追蹤，賽博朋克也會(huì)在傳統(tǒng)光柵化的同時(shí)使用大量計(jì)算。預(yù)算較小的獨(dú)立游戲往往更強(qiáng)調(diào)光柵化管道，但仍會(huì)利用計(jì)算。他們這樣做的程度可能在很大程度上取決于游戲引擎，因?yàn)楠?dú)立開發(fā)者通常沒有時(shí)間從頭開始創(chuàng)建自己的游戲引擎。Titanic Honor and Glory 使用的 Unreal Engine 具有大量計(jì)算能力。GHPC 使用 Unity 引擎，計(jì)算量很小。雖然傳統(tǒng)的光柵化管道仍然非常重要，但我們可能會(huì)看到它越來越多地在新游戲中得到計(jì)算的補(bǔ)充。

對(duì)虛幻引擎的城市演示中的幀進(jìn)行分析，顯示大量使用計(jì)算和光線追蹤因此，現(xiàn)代視頻卡需要具有良好的計(jì)算能力，而 RDNA 2 不會(huì)讓人失望。它可能沒有 Nvidia 的 Ampere 架構(gòu)的大量 FP32 吞吐量，但它處于更好地利用其現(xiàn)有執(zhí)行單元的有利位置。 ?

13?結(jié)論

RDNA 2 對(duì) AMD 來說是一個(gè)重要時(shí)刻。在過去十年左右的時(shí)間里，Nvidia 普遍主導(dǎo)著高性能 GPU 市場(chǎng)。AMD（和 ATI）偶爾會(huì)生產(chǎn)出可以與 Nvidia 的最佳產(chǎn)品正面交鋒的顯卡，但這種情況似乎永遠(yuǎn)不會(huì)持續(xù)很長(zhǎng)時(shí)間?；?RDNA 2 的 RX 6900 XT 就是其中之一，其重要性與基于 Terascale 2 的 HD 5800 相同。Terascale 2 提供了 Nvidia Fermi 卡的大部分性能，但功耗要低得多。同樣，RDNA 2 提供了 Ampere 的大部分性能，但電源效率更高。至少部分原因在于 RDNA 2 對(duì)緩存的使用，而不是大型 GDDR6X 設(shè)置。因此，RDNA 2 代表了 GPU 緩存策略的轉(zhuǎn)折點(diǎn)。該緩存設(shè)置以另一種方式使 RDNA 2 具有重要意義。它代表了 GPU 緩存策略向優(yōu)先考慮一般計(jì)算性能的轉(zhuǎn)折點(diǎn)。

濫發(fā)更多的著色器，然后構(gòu)建一個(gè)巨大的 VRAM 子系統(tǒng)來提供它的日子似乎已經(jīng)一去不復(fù)返了。這同樣適用于基于圖塊的渲染，它試圖通過優(yōu)化光柵化順序來優(yōu)化緩存占用空間。隨著計(jì)算變得越來越重要，基于光柵化的技巧開始產(chǎn)生較小的影響。與 CPU 一樣，答案似乎是更多緩存。AMD的下一代GPU架構(gòu)，RDNA 3采用了類似的四級(jí)緩存子系統(tǒng)。Nvidia 同樣正在擺脫對(duì)巨大 VRAM 配置的依賴。Ada Lovelace大大增加了 L2 緩存容量，RTX 4090 獲得了 72 MB 的 L2。即使更大的 GDDR6X 設(shè)置或 HBM 可以提供足夠的帶寬來僅使用 4 MB 或 6 MB 的緩存，這樣的解決方案也會(huì)太耗電或太昂貴。 RDNA 2 還為 AMD 的 GPU 陣容帶來了硬件光線追蹤加速。

與 Nvidia 的全力以赴的方法相反，AMD 可能試圖以最低的硬件成本獲得可接受的性能。我認(rèn)為這是一個(gè)明智之舉，因?yàn)槌Ｒ?guī)計(jì)算和光柵化仍然主導(dǎo)著很多工作負(fù)載，并且絕對(duì)不需要光線追蹤來產(chǎn)生良好的視覺效果。此外，即使 GPU 功率和裸片面積達(dá)到極限，未來的光線追蹤工作負(fù)載也不太可能通過當(dāng)今的技術(shù)實(shí)現(xiàn)。那是因?yàn)槲覀冸x使用純光線追蹤渲染 AAA 標(biāo)題還差得很遠(yuǎn)，即使是有限的光線追蹤效果也會(huì)帶來如此大的性能損失，以至于 Nvidia 和 AMD 求助于使用升級(jí)技術(shù)。但重要的是，RDNA 2 的光線追蹤實(shí)現(xiàn)為 AMD 提供了一些可以構(gòu)建的東西。緩存設(shè)置也是如此。在為未來的成功奠定基礎(chǔ)方面，RDNA 2 幾乎與 RDNA 1 相似。

編輯：黃飛

閱讀全文

amd(132527) amd(132527)
gpu(126253) gpu(126253)
VRAM(8401) VRAM(8401)
光線追蹤(21330) 光線追蹤(21330)

評(píng)論

相關(guān)推薦

AMD首席執(zhí)行官：下一代Zen和rDNA核心重點(diǎn)是架構(gòu)，而不是制程技術(shù)

AMD首席執(zhí)行官Lisa Su在最近的財(cái)報(bào)電話會(huì)議上表示，即將推出的Zen和rDNA內(nèi)核將更多地關(guān)注系統(tǒng)架構(gòu)，而不是制程技術(shù)。該聲明是在AMD 7納米產(chǎn)品上市首個(gè)完整季度之后發(fā)布的，其中包括

2019-11-05 16:31:27

5414

AMD GPU翻車？三星Exynos 2200實(shí)測(cè)竟被驍龍8甩開30%！

同被定位為手機(jī)旗艦平臺(tái)，其最大的亮點(diǎn)可能就是與AMD合作，采用了RDNA2架構(gòu)的GPU，型號(hào)為Samsung Xclipse 920。 ? 那么AMD的GPU在手機(jī)SoC上的首次亮相，會(huì)對(duì)

2022-02-18 09:32:59

3297

7900XTX與AMD的RDNA 2架構(gòu)相比差異

測(cè)試緩存和內(nèi)存延遲讓我們可以很好地了解 RDNA 3 的緩存和內(nèi)存設(shè)置。延遲測(cè)試在后 GCN AMD 圖形架構(gòu)上也很復(fù)雜，因?yàn)槿謨?nèi)存層次結(jié)構(gòu)可以通過標(biāo)量或矢量數(shù)據(jù)路徑訪問，它們具有不同的一級(jí)緩存。

2023-01-10 10:55:30

1054

AMD RDNA2 GPU架構(gòu)擴(kuò)展技術(shù)詳解

RDNA 2 建立在 RDNA 1 架構(gòu)之上。AMD 進(jìn)行了多項(xiàng)更改以提高效率并使硬件功能保持最新狀態(tài)，但基本的 WGP 架構(gòu)仍然存在。

2023-02-23 09:29:09

2024

AMD首個(gè)RDNA 2 架構(gòu) GPU市場(chǎng)成為AI必爭(zhēng)地

一、AMD RDNA 2 光線追蹤效果演示，下一代顯卡將支持 3月20日消息根據(jù)外媒WCCFTECH的報(bào)道，AMD發(fā)布了首個(gè)RDNA 2 架構(gòu) GPU 在微軟DXR API下的光線追蹤演示視頻

2020-03-21 09:16:19

4428

手機(jī)端最強(qiáng)GPU成了，還要搭上特斯拉的車？

AMD于6月1日的臺(tái)北電腦展上公布了兩款新產(chǎn)品和兩項(xiàng)新技術(shù)，分別是基于RDNA2架構(gòu)的筆記本顯卡Radeon RX 6000M系列和搭載Zen 3核心的銳龍5000G臺(tái)式機(jī)APU，還有超采樣技術(shù)

2021-06-02 09:33:54

5384

AMD迎頭猛追Intel 全球首發(fā)7nm GPU很威風(fēng)！

`處理器大廠美商超微（AMD）日前發(fā)布全球首款7奈米制程資料中心繪圖處理器（GPU），為新世代人工智能（AI）、云端運(yùn)算與高效能運(yùn)算挹注動(dòng)能。AMD Radeon Instinct MI60

2018-11-20 11:35:12

ARM架構(gòu)的GPU和臺(tái)式機(jī)的GPU有什么區(qū)別

達(dá)或者AMD的獨(dú)立顯卡則是需要很高端的才支持4K的分辨率。這樣的話投入完全不是一個(gè)級(jí)別。2：移動(dòng)GPU的能耗比是否比獨(dú)立的PC的GPU高？3：支持2K分辨率和4K顯示的市面上的ARM處理器的GPU

2020-07-18 08:04:38

HSA----CPU+GPU異構(gòu)系統(tǒng)架構(gòu)詳解

解析HSA----CPU+GPU異構(gòu)系統(tǒng)架構(gòu)

2021-02-03 07:07:34

NVIDIA火熱招聘GPU高性能計(jì)算架構(gòu)師

：hrallenlinGPU高性能計(jì)算架構(gòu)師 (功能驗(yàn)證)- 校招/社招工作職責(zé)： * 深入了解下一代GPU架構(gòu)與GPU高性能計(jì)算領(lǐng)域的最新功能* 與GPU架構(gòu)設(shè)計(jì)者深入溝通以制定架構(gòu)驗(yàn)證測(cè)試計(jì)劃* 基于測(cè)試計(jì)劃和隨機(jī)

2017-09-01 17:22:28

kintex產(chǎn)品架構(gòu)設(shè)計(jì)文檔（成為架構(gòu)師也是電子人不錯(cuò)的選...

kintex產(chǎn)品架構(gòu)設(shè)計(jì)文檔（成為架構(gòu)師也是電子人不錯(cuò)的選擇） ROCE（儒仕）,用心為每一位電子人！Xilinx7系列普及講座，架構(gòu)師設(shè)計(jì)方案模板，交流學(xué)習(xí) 內(nèi)容請(qǐng)下載附件pdf，更多內(nèi)容請(qǐng)登錄ww..rocetech..com

2013-04-30 16:41:13

【汽車電氣架構(gòu)設(shè)計(jì)軟件】

因工作需要，求整車電氣架構(gòu)設(shè)計(jì)軟件——PREEvision（盜版），價(jià)格可議，WetChat/***，非誠(chéng)勿擾

2017-04-18 14:20:20

為何要進(jìn)行嵌入式軟件架構(gòu)設(shè)計(jì)？如何設(shè)計(jì)？

為何要進(jìn)行嵌入式軟件架構(gòu)設(shè)計(jì)？如何進(jìn)行嵌入式軟件架構(gòu)設(shè)計(jì)？

2021-11-01 06:31:26

基于KeyStone架構(gòu)的DSP電源設(shè)計(jì)方案

基于KeyStone架構(gòu)的DSP電源設(shè)計(jì)方案電源硬件電路設(shè)計(jì)與計(jì)算

2021-02-04 06:48:30

基于LM3444方案的led架構(gòu)設(shè)計(jì)

【W(wǎng)EBENCH 大賽作品】基于LM3444方案的led架構(gòu)設(shè)計(jì)

2018-08-29 17:26:09

基于磁貼的GPU架構(gòu)優(yōu)缺點(diǎn)

本指南介紹了基于磁貼的GPU架構(gòu)的優(yōu)缺點(diǎn)。它還將ARM馬里基于瓷磚的GPU架構(gòu)設(shè)計(jì)與臺(tái)式PC或控制臺(tái)中常見的更傳統(tǒng)的即時(shí)模式GPU進(jìn)行了比較。馬里GPU使用基于平鋪的渲染體系結(jié)構(gòu)。這意味著GPU

2023-08-02 12:54:29

基于7nm RDNA架構(gòu)的顯卡將取代北極星產(chǎn)品線

根據(jù)消息報(bào)道，AMD的Navi 14 GPU已經(jīng)出現(xiàn)在Compubench上，基于7nm RDNA架構(gòu)，將取代入門級(jí)北極星產(chǎn)品線。

2019-08-29 14:02:00

1659

AMD Radeon Pro 5000M系列移動(dòng)顯卡為蘋果全新16英寸MacBook Pro帶來高性能的RDNA架構(gòu)

AMD Radeon Pro 5000M系列移動(dòng)顯卡采用全新的AMD RDNA架構(gòu)打造，從一開始就為卓越的性能、可擴(kuò)展性和高能效而設(shè)計(jì)。

2019-11-14 10:07:00

2369

AMD或在CES2020展會(huì)上宣布RDNA2架構(gòu) 再次用上HBM2顯存

今年7月份首發(fā)RX 5700系列顯卡之后，AMD的7nm RDNA架構(gòu)顯卡已經(jīng)小有成就，再加上即將上市的RX 5500及RX 5300系列，中低端的布局差不多了，下一步就是真正的高端顯卡——7nm+工藝的RDNA2架構(gòu)顯卡了。

2019-11-19 14:28:43

970

采用全新的7nm架構(gòu)，AMD RDNA架構(gòu)的解析

隨著AMD的全新7nm制程工藝的RDNA架構(gòu)推出，代表著AMD在未來的GPU市場(chǎng)上將有一番大作為，在過去的幾代中，AMD的GPU已經(jīng)利用了很久的基于GCN架構(gòu)的計(jì)算單元。

2019-12-10 17:06:40

2957

AMD的RDNA 2圖形架構(gòu)性能最高可提高50%，預(yù)計(jì)將在2020年夏天發(fā)布

根據(jù)消息報(bào)道，AMD的RDNA 2圖形架構(gòu)將為玩家?guī)硇阅苌系闹卮箫w躍，在不增加功耗的情況下，RDNA 2的性能最高可提高50%。

2020-01-14 14:26:10

4894

AMD蘇姿豐宣布采用RDNA2構(gòu)架能效比將獲大幅提升

北京時(shí)間3月6日凌晨，AMD CEO 蘇姿豐在AMD財(cái)務(wù)分析師大會(huì)上宣布，采用下一代的RDNA2構(gòu)架的Radeon RX GPU能效比將比現(xiàn)有的RDNA GPU提升50%。

2020-03-06 11:30:38

1786

AMD公布GPU發(fā)展的線路圖

按照傳統(tǒng)，AMD今天向金融分析師公布了GPU發(fā)展的線路圖。線路圖中不僅包含了去年夏天發(fā)布的Radeon RX 5700 XT RDNA，范圍還涵蓋了RDNA 2以及RDNA 3。

2020-03-06 14:59:31

2605

AMD宣布全新GPU架構(gòu)“CDNA” 將專注于計(jì)算/張量操作性能

AMD CPU架構(gòu)這幾年發(fā)展的順風(fēng)順?biāo)?，Zen、Zen+、Zen 2、Zen 3、Zen 4每一代都表現(xiàn)驚艷，GPU架構(gòu)就相對(duì)暗淡一些了：GCN已經(jīng)服役多年廉頗老矣，RDNA閃亮登場(chǎng)但依然無(wú)法和對(duì)手全面抗衡。

2020-03-06 15:35:13

2356

索尼PS5和微軟Xbox Series X都會(huì)搭載AMD GPU

AMD今天在財(cái)務(wù)分析師大會(huì)上暗示，索尼PS5和微軟Xbox Series X均會(huì)搭載基于RDNA2架構(gòu)的GPU，從而實(shí)現(xiàn)硬件級(jí)的光追支持。

2020-03-07 09:07:23

2020

AMD確認(rèn)索尼和微軟新主機(jī)均支持基于RDNA2架構(gòu)的光追

最近圍繞新一代主機(jī)索尼PS5、微軟Xbox Series X（簡(jiǎn)稱XSX）的光追問題產(chǎn)生了分歧，不過兩家主機(jī)的粉絲不用擔(dān)心了，AMD確認(rèn)它們都支持基于RDNA2架構(gòu)的光追。

2020-03-07 09:16:13

2024

RDNA2架構(gòu)能效比進(jìn)步了50%，big Navi顯卡要漲價(jià)了

AMD今天上午發(fā)布了RDNA2架構(gòu)，能效比現(xiàn)在的RDNA一代架構(gòu)還要高50%，堪稱10年來AMD顯卡最大的進(jìn)步。

2020-03-07 09:39:26

2053

AMD RDNA2架構(gòu)發(fā)布相比一代能效比提升50%堪稱10年來最大進(jìn)步

AMD發(fā)布了RDNA2架構(gòu)，能效比現(xiàn)在的RDNA一代架構(gòu)還要高50%，堪稱10年來AMD顯卡最大的進(jìn)步。

2020-03-07 10:17:51

2934

AMD高管確認(rèn)新主機(jī)將如期在今年圣誕節(jié)前上市

2020-03-07 11:00:58

1481

AMD RDNA 2架構(gòu)顯卡光線追蹤圖公布，在上代基礎(chǔ)上提高50%每瓦性能

在昨天AMD的財(cái)務(wù)分析日上，官方簡(jiǎn)要介紹了一下RDNA 2架構(gòu)顯卡技術(shù)的方面的信息，并公布了一張硬件光線追蹤的效果圖。

2020-03-07 16:50:10

2763

RX 6000系列或成為首個(gè)使用雙風(fēng)扇的AMD公版卡散熱效果將更好

AMD前兩天在分析師大會(huì)上正式宣布了RDNA2 GPU架構(gòu)，不出意外的話下一代顯卡RX 6000系列就會(huì)用上這個(gè)架構(gòu)。此外，RX 6000公版卡的設(shè)計(jì)也會(huì)改變，單風(fēng)扇變成雙風(fēng)扇設(shè)計(jì)。

2020-03-08 15:20:12

1716

RDNA 3和Navi 3X蓄勢(shì)待發(fā)，AMD的GPU線路圖已公布

2020-03-08 20:01:37

3152

A卡的翻身之仗，RDNA2支持硬件光追且提升50%性能

自從AMD推出了專為7nm工藝設(shè)計(jì)的RDNA架構(gòu)的顯卡RX5700系列之后，一改原先舊GCN架構(gòu)的能效低、發(fā)熱大、功耗大之類的毛病。

2020-03-08 21:14:15

2554

AMD放棄渦輪散熱，RX 6000顯卡將用上雙風(fēng)扇

AMD 前兩天在分析師大會(huì)上正式宣布了 RDNA2 GPU 架構(gòu)，不出意外的話下一代顯卡 RX 6000 系列就會(huì)用上這個(gè)架構(gòu)。

2020-03-08 22:37:24

1812

AMD放棄渦輪散熱 RX 6000顯卡單風(fēng)扇變成雙風(fēng)扇設(shè)計(jì)

2020-03-09 08:47:20

2809

AMD模糊RDNA3架構(gòu)顯卡工藝的說法

上周的財(cái)務(wù)分析師大會(huì)上，AMD干貨滿滿，宣布了5nm Zen4架構(gòu)，同時(shí)還推出了新一代的RDNA2架構(gòu)，能效比RDNA第一代提升了50%，堪稱AMD GPU十年來最大變革。

2020-03-11 08:53:07

2145

RDNA3架構(gòu)到底會(huì)用上什么工藝？蘇姿豐回應(yīng)還不到時(shí)候

2020-03-11 09:59:42

2032

AMD下一代RDNA3架構(gòu)或?qū)⒉捎?nm工藝，官方暫沒透露

2020-03-11 15:23:04

2762

AMD RDNA2圖形架構(gòu)與RDNA相比，每瓦性能提高50％

在2019年7月亮相的7 nm RDNA架構(gòu)，AMD的性能/瓦數(shù)比以前的“ Vega”架構(gòu)提高了近50％。

2020-03-11 17:01:11

3981

AMD對(duì)未來感到更加興奮將繼續(xù)致力于成為高性能計(jì)算的領(lǐng)導(dǎo)者

在上周的財(cái)務(wù)分析師大會(huì)上，AMD宣布了5nm Zen4處理器及RDNA2 GPU，同時(shí)確認(rèn)計(jì)算GPU與游戲GPU分家，前者將使用CDNA架構(gòu)。

2020-03-11 17:11:26

2268

RX 7000系列顯卡能不能用的上5nm工藝

財(cái)務(wù)分析師會(huì)議上，AMD充滿了干貨，宣布了5nmZEN4的架構(gòu)，還引入了新一代RDNA2的架構(gòu)，能效比第一代高50%，AMD GPU十年最大的變化就是它。

2020-03-13 14:38:49

1774

AMD RX 5600顯卡搭載最新7nm RDNA架構(gòu)，性能如何

RDNA架構(gòu),擁有36個(gè)計(jì)算單元,1357Mhz的基礎(chǔ)頻率,1560MHz的加速頻率,并且搭載了6GB GDDR6顯存。

2020-03-16 20:56:30

4290

微軟虛擬機(jī)采納AMD Radeon Instinct計(jì)算卡

微軟Xbox Series X、索尼PS5都采用了定制的AMD RDNA2 GPU架構(gòu)，搭檔定制的AMD Zen2架構(gòu)，成為AMD的又一個(gè)高光時(shí)刻，而在其他領(lǐng)域，AMD CPU/GPU也是頻頻獲得青睞。

2020-03-20 08:47:33

1628

AMD稱在11月份將上市RDNA2架構(gòu)的big Navi家族顯卡

之前爆料稱，RDNA3之所以這么模糊，是AMD官方故意的，因?yàn)檫@一代很可能采用小芯片設(shè)計(jì)，類似CPU中的Zen2一樣，將CU單元及IO單元分離，以便靈活提升CU計(jì)算單元的規(guī)模。

2020-08-10 14:02:49

2231

AMD RDNA2架構(gòu)RX 6000系列顯卡細(xì)節(jié),熱設(shè)計(jì)功耗220~238瓦

眼看就要進(jìn)入10月份，NVIDIA RTX 3070將要發(fā)售，3060等也許也會(huì)伺機(jī)登場(chǎng)。對(duì)于10月28日的RDNA2架構(gòu)RX 6000系列顯卡來說，壓力不小。

2020-09-27 15:17:29

2577

AMD宣布了Ryzen ZEN3處理器和Radeon RDNA2 GPU的主題演講日期

在萬(wàn)眾期待中，AMD宣布了Ryzen ZEN3處理器和Radeon RDNA2 GPU的主題演講日期。AMD首席執(zhí)行官蘇姿豐博士表示：對(duì)于游戲玩家來說這將是一個(gè)令人激動(dòng)的秋天是時(shí)候用AMD

2020-09-27 15:49:01

2129

AMD申請(qǐng)CDNA商標(biāo)成功，CDNA顯卡即將到來

10月8日發(fā)布Zen3架構(gòu)的銳龍5000處理器之后，這個(gè)月底AMD還會(huì)有RDNA2架構(gòu)的RX 6000系列顯卡，主要跟RTX 3080系列顯卡競(jìng)爭(zhēng)。大家知道GPU不止是用于游戲卡，現(xiàn)在還是數(shù)據(jù)中心

2020-10-19 17:38:28

1384

AMD 6nm“倫勃朗”APU曝光：Zen3+RDNA2架構(gòu)、支持DDR5和USB4

元luan的局面。根據(jù)3DCenter的整理，Zen2、Zen3將配合Vega與RDNA2 GPU，組合帶來四套新的APU產(chǎn)品。首先是Zen2+Vega的Lucienne，和當(dāng)前的Renoir

2020-10-22 17:06:30

2418

AMD揭曉： Zen3銳龍5000處理器可解鎖RX 6000顯卡更強(qiáng)性能

今天凌晨，AMD終于揭曉了基于RDNA2架構(gòu)的RX 6000系列顯卡，首發(fā)RX 6800、RX 6800 XT和RX 6900 XT三款，分別對(duì)標(biāo)取代RTX 2080 Ti、RX 3080和RTX

2020-10-29 09:37:38

1428

索尼發(fā)布唯一能完整支持RDNA2先進(jìn)功能的主機(jī)—Xbox Series X|S

在RX 6000發(fā)布之后，微軟Xbox官網(wǎng)也發(fā)了一篇文章，宣布旗下的Xbox Series X|S是唯一能完整支持RDNA2先進(jìn)功能的主機(jī)。

2020-10-29 10:28:51

1375

逆襲RTX 3090 蘇媽笑了 AMDRX 6900XT史上最強(qiáng)A卡

6800XT與同為7nm工藝的5700XT相比，也有高達(dá)54%的每瓦性能提升。 RDNA2架構(gòu)還支持全新AMD Infinity Cache技術(shù)，與僅支持GDDR6的AMD RDNA架構(gòu)設(shè)計(jì)相比，可提供多達(dá)2.4倍的帶

2020-10-29 18:09:32

2269

特斯拉盯上AMD，欲把RDNA2架構(gòu)用于車載系統(tǒng)

AMD全新推出的RDNA2架構(gòu)已經(jīng)有桌面顯卡（Radeon RX 6900 XT/6800XT/6800）、索尼PS5、微軟Xbox Series X主機(jī)等產(chǎn)品，可這僅僅是個(gè)開始。

2020-11-10 09:47:00

1691

AMD RDNA3圖形架構(gòu) 性能將再提升50%左右

在承諾Zen4架構(gòu)將有著和Zen3不相上下的架構(gòu)改進(jìn)細(xì)節(jié)后，AMD執(zhí)行副總裁Rick Bergman也不忘聊聊顯卡。這一代RDNA2頂著NVIDIA Ampere架構(gòu)的巨大壓力問世，沒想到做到

2020-11-11 18:06:34

1654

RDNA2頂著NVIDIA Ampere架構(gòu)的巨大壓力問世

在承諾Zen4架構(gòu)將有著和Zen3不相上下的架構(gòu)改進(jìn)細(xì)節(jié)后，AMD執(zhí)行副總裁Rick Bergman也不忘聊聊顯卡。

2020-11-12 09:52:11

1317

AMD下一代RDNA3會(huì)使用新的工藝

雖然說AMD剛推出了Zen 3架構(gòu)的銳龍5000系列處理器以及RDNA 2架構(gòu)的RX 6000系列顯卡，但大家總會(huì)對(duì)廠家未來的產(chǎn)品充滿興趣。TheStreet的記者近日訪問了AMD執(zhí)行副總裁Rick

2020-11-12 11:44:31

1482

RDNA2架構(gòu)的RX 6000系列顯卡即將上市

Zen3架構(gòu)的銳龍5000系列處理器上市快兩周了，RDNA2架構(gòu)的RX 6000系列顯卡馬上也上市了。今天微星也發(fā)布了適用于500系主板的新BIOS，支持SMART ACCESS MEMORYG功能，性能可提升10%以上，3A平臺(tái)這一波完美了。

2020-11-19 08:59:48

1487

AMD Radeon RX6000系列顯卡上市

Cache 和最高可達(dá) 16GB 的 GDDR6 顯存。 AMD 表示，全新 RDNA2 架構(gòu)提供了很多強(qiáng)大的性能，包括： AMD 高速緩存技術(shù)（Infi

2020-11-19 10:42:06

2069

RDNA2架構(gòu)的6900XT下個(gè)月即將發(fā)布

基于RDNA2架構(gòu)的AMD RX 6800、6800 XT已經(jīng)發(fā)售，6900XT則要等到12月2日。

2020-11-20 09:29:02

4837

AMD Radeon RX 6000系列顯卡特性及游戲性能一覽

芯品上市 RADEON 2020年11月18日發(fā)售 AMD Radeon RX 6000系列顯卡，基于突破性的AMD RDNA2游戲架構(gòu)，支持高帶寬PCIe 4.0技術(shù)和16GB GDDR6顯存

2020-11-20 14:12:51

3700

解讀AMD RDNA2顯卡內(nèi)核的靈魂之Zen2

RX 6800正式解禁上市的時(shí)候，我們?cè)?jīng)解析過其幕后的RDNA 2架構(gòu)的設(shè)計(jì)與特性?，F(xiàn)在，國(guó)外大神又根據(jù)RNDA 2的內(nèi)核圖，繪制了各個(gè)模塊的分布。

2020-11-23 09:33:45

1549

AMD RDNA2架構(gòu)GPU采用全新圖形緩存方法的原因是什么?

與RDNA 2架構(gòu)一起引入的Infinity Cache是一個(gè)新的緩存系統(tǒng)，它與 RX 6800 XT 和RX 6800中的GDDR6存儲(chǔ)器接口一起運(yùn)行。對(duì)于AMD來說，這也是一筆不小的數(shù)目，其工程師告訴我們，這是將游戲性能從1080p解鎖到4K的關(guān)鍵，否則它將被龐大而耗電的選擇所困擾。

2020-11-23 10:44:31

1376

AMD欲推出Radeon RX 6000M移動(dòng)GPU

AMD 內(nèi)部似乎正在測(cè)試基于 RDNA2 的 Radeon RX 6000M 移動(dòng) GPU，針對(duì)于筆記本電腦市場(chǎng)的 Navi 23/24 早期信息已經(jīng)被泄露。根據(jù)網(wǎng)友在 Twitter 上爆料

2020-12-10 14:48:24

1578

AMD RX 6000系列顯卡性能測(cè)試

如果說Zen3架構(gòu)的AMD銳龍5000系列桌面處理器的優(yōu)異表現(xiàn)、大獲成功還在意料之中，那么RDNA2架構(gòu)的AMD RX 6000系列顯卡的高光閃現(xiàn)，就超出了幾乎所有人的預(yù)料。

2020-12-18 10:03:09

3520

傳AMD明年的7nm晶圓訂單暴漲80%

AMD今年推出了7nm工藝的銳龍5000、RDNA2架構(gòu)的RX 6000系列顯卡，不過上市一兩個(gè)月來還是在缺貨，原因是7nm產(chǎn)能緊張，這個(gè)問題可能要到明年才能緩解了。

2020-12-21 11:17:07

1377

AMD新一代撕裂者處理器將明年發(fā)布

2020行將結(jié)束，對(duì)于AMD來說，可以說是收獲的一年。年初，第三代線程撕裂者發(fā)布上市，下半年則是Zen3架構(gòu)處理器和RDNA2圖形顯卡的主場(chǎng)，期間，AMD還重磅收購(gòu)了賽靈思。

2020-12-25 15:42:31

1639

AMD Zen3架構(gòu)的新一代處理器或明年登場(chǎng)

2020-12-25 15:39:06

1937

AMD即將推出RDNA3架構(gòu)顯卡

AMD的RX 6000系列顯卡用上了7nm RDNA2架構(gòu)，能效比再次提升50%，性能也摸到了RTX 3090的水平，而今天預(yù)計(jì)會(huì)推出RDNA3架構(gòu)顯卡了。

2021-01-05 09:48:41

1756

RDNA3顯卡或使用小芯片堆核良率大幅提升

AMD的RX 6000系列顯卡用上了7nm RDNA2架構(gòu)，能效比再次提升50%，性能也摸到了RTX 3090的水平，而今天預(yù)計(jì)會(huì)推出RDNA3架構(gòu)顯卡了。 RDNA3架構(gòu)會(huì)有什么樣的改進(jìn)？性能

2021-01-05 10:00:23

1496

RDNA3顯卡或采用小芯片堆核

2021-01-05 09:55:02

1403

AMD RDNA2 架構(gòu)中端顯卡上半年發(fā)布：雙風(fēng)扇標(biāo)準(zhǔn)尺寸顯卡和單風(fēng)扇ITX 顯卡

在今天的發(fā)布會(huì)上，AMD 透露新款 RDNA2 架構(gòu)的中端顯卡將于上半年發(fā)布，包括一款雙風(fēng)扇標(biāo)準(zhǔn)尺寸顯卡和一款單風(fēng)扇的 ITX 顯卡。 ? 雙風(fēng)扇版可能是 Radeon RX 6700 系列

2021-01-13 14:02:48

2261

AMD或于7月前推出RDNA 2 GPU驅(qū)動(dòng)筆記本電腦

AMD今天在CES 2021新聞發(fā)布會(huì)上透露，渴望購(gòu)買新游戲筆記本電腦的客戶應(yīng)該能夠在7月之前的某個(gè)時(shí)候購(gòu)買第一款RDNA 2 GPU驅(qū)動(dòng)筆記本電腦。

2021-01-13 16:55:06

1407

AMD的RDNA3架構(gòu)詳細(xì)細(xì)節(jié)

進(jìn)入2021年了，AMD的下一代顯卡是時(shí)候曝光了，接替去年RDNA2的應(yīng)該是研發(fā)中的RDNA3架構(gòu)，代號(hào)Navi 3X，其中大核旗艦Navi 31有可能使用MCM多芯片架構(gòu)，2倍規(guī)模。

2021-01-24 09:24:46

3840

AMD下代旗艦核心Navi 31顯卡規(guī)格曝光

2021-01-24 09:40:23

2315

AMD新款 “核彈”顯卡曝光：雙芯片設(shè)計(jì)

，Navi 31 采用雙芯片設(shè)計(jì)，每個(gè)芯片有 80 個(gè) CU，總流處理器數(shù)量將達(dá)到 10240 。 IT之家了解到，AMD 去年發(fā)布了 RDNA2 架構(gòu)的 RX 6000 系列。最高型號(hào) R

2021-01-25 10:12:13

1990

AMD GPU首次殺入三星手機(jī)SoC

AMD RDNA系列GPU架構(gòu)在性能、能效方面表現(xiàn)不俗，也得到了三星、特斯拉的青睞，轉(zhuǎn)戰(zhàn)進(jìn)入手機(jī)、汽車行業(yè)。

2021-01-30 10:05:10

1580

AMD新品發(fā)布會(huì)將在3月3日舉行

AMD官方賬號(hào)日前確認(rèn)，定于北京時(shí)間3月3月24點(diǎn)舉辦發(fā)布活動(dòng)，推出RDNA2新卡。

2021-02-25 09:52:34

1103

AMD SAM顯存智取技術(shù)可漲處理器性能16%

今天凌晨，AMD RX 6700 XT顯卡發(fā)布，這是目前最便宜的RDNA2架構(gòu)光追卡，建議零售479美元，國(guó)行3699元，18號(hào)開賣。

2021-03-04 14:42:59

2587

AMD承諾不會(huì)砍掉Infinity Cache緩存技術(shù)

昨晚AMD發(fā)布了RX 6700 XT顯卡，這是RDNA2架構(gòu)家族第二波產(chǎn)品，國(guó)內(nèi)售價(jià)3699元，針對(duì)友商的RTX 3070顯卡。

2021-03-05 09:35:24

4168

AMD或推RDNA架構(gòu)礦卡以對(duì)抗NVIDIA

近期在AMD的GPU更新Linux驅(qū)動(dòng)程序里，極大機(jī)會(huì)包含了基于RDNA架構(gòu)的專用礦卡信息。據(jù)Phoronix報(bào)道，這次AMD的Linux驅(qū)動(dòng)程序里有確切指出Navi 12核心，而且使用這款核心的顯卡是不帶視頻輸出功能的，通俗地說，就是從驅(qū)動(dòng)程序?qū)用婢筒恢С忠曨l輸出功能。

2021-03-07 10:42:36

1772

BLE實(shí)驗(yàn)詳解之藍(lán)牙鍵盤設(shè)計(jì)方案

BLE實(shí)驗(yàn)詳解之藍(lán)牙鍵盤設(shè)計(jì)方案

2021-03-30 16:41:08

兩種GPU之間的延遲對(duì)比 AMD RDNA2完勝NVIDIA安培

CPU緩存與內(nèi)存延遲測(cè)試，相信大家都有所耳聞，但是GPU同樣的測(cè)試卻幾乎沒人做過。 ChipsAndCheese就做了一次特別的測(cè)試，對(duì)比考察了AMD、NVIDIAGPU架構(gòu)的緩存、顯存

2021-04-21 13:51:20

1701

兩項(xiàng)合作達(dá)成，AMD正在肆意成長(zhǎng)

在近日的臺(tái)北電腦展上，AMD宣布了其最新的兩個(gè)合作。一是與特斯拉的合作，即特斯拉的新款旗艦轎車和SUV將采用AMD的RDNA 2 GPU架構(gòu)。二是AMD公布了他們正在與三星合作開發(fā)

2021-06-18 11:48:00

3246

復(fù)雜裝備的PHM數(shù)據(jù)體系架構(gòu)設(shè)計(jì)方案

復(fù)雜裝備的PHM數(shù)據(jù)體系架構(gòu)設(shè)計(jì)方案

2021-06-25 16:02:48

基于無(wú)線寬帶的林業(yè)監(jiān)控網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)方案

基于無(wú)線寬帶的林業(yè)監(jiān)控網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)方案

2021-06-29 16:56:54

AMD突破性的RDNA 2架構(gòu)

動(dòng)力，帶來高幀率的游戲樂趣和先進(jìn)的內(nèi)容創(chuàng)建功能。突破性的RDNA 2架構(gòu) AMD Radeon RX 6000M系列移動(dòng)顯卡建立在突破性的AMD RDNA 2游戲架構(gòu)上，與AMD RDNA架構(gòu)相比，可提供高達(dá)1.5倍的性能提升，或在相同的性能水平[1]上降低高達(dá)43%的功耗。專為發(fā)燒友而設(shè)計(jì)，無(wú)論

2021-09-07 15:51:48

3741

AMD全新銳龍6000處理器Zen3+核心與RDNA2顯卡融

新的AMD銳龍6000系列處理器全線產(chǎn)品,將高效且強(qiáng)悍的新“Zen 3+”核心架構(gòu)與基于全新AMD RDNA 2架構(gòu)的內(nèi)置顯卡

2022-01-05 17:42:21

522

AMD發(fā)布基于CDNA 2架構(gòu)的Instinct MI210 GPU

基于AMD CDNA 2架構(gòu)并由ROCm 5提供支持，AMD Instinct MI210 GPU幫助主流用戶加速洞察和發(fā)現(xiàn)。

2022-03-26 09:53:19

1526

高通擴(kuò)展驍龍計(jì)算生態(tài)系統(tǒng) 基于AMD RDNA 2架構(gòu)的GPU推出

　　AMD（超威，納斯達(dá)克股票代碼：AMD）宣布推出基于最新AMD RDNA 2架構(gòu)的AMD Radeon PRO V620 GPU，可為當(dāng)今苛刻的云工作負(fù)載提供高性能的GPU加速，包括沉浸式AAA游戲體驗(yàn)、密集型3D工作負(fù)載以及大規(guī)模云端現(xiàn)代辦公生產(chǎn)力應(yīng)用程序。

2022-03-28 10:15:28

1066

AMD RDNA 3/Navi 3X GPU升級(jí)

但盡管如此，目前單節(jié)點(diǎn)跳轉(zhuǎn)本身無(wú)法提供50%的單位性能提升(RIP Dennard縮放)。因此，計(jì)劃對(duì)RDNA 3進(jìn)行幾項(xiàng)架構(gòu)改進(jìn)。這包括AMD的下一代片上無(wú)限緩存，以及AMD所說的優(yōu)化圖形管道。據(jù)該公司稱，GPU計(jì)算單元(CU)也在進(jìn)行重構(gòu)，不過重構(gòu)的程度還有待觀察。

2022-07-25 09:43:57

761

5nm工藝的銳龍7000系列處理器將在三季度上市

對(duì)于RX 7000系列顯卡，AMD官方確認(rèn)的只有5nm工藝，RDNA3架構(gòu)，能效在RDNA2基礎(chǔ)上再次提升50%，用上全新的架構(gòu)、小芯片封裝及無(wú)限緩存等設(shè)計(jì)。

2022-08-04 11:53:10

1481

AMD發(fā)布更為先進(jìn)且基于突破性AMD RDNA 3架構(gòu)和小芯片設(shè)計(jì)的游戲顯卡

AMD （超威）今日發(fā)布了基于下一代高性能、高能效的AMD RDNA 3架構(gòu)的全新顯卡——AMD Radeon RX 7900 XTX和Radeon RX 7900 XT顯卡。繼非常成功且基于AMD

2022-11-10 14:37:59

790

AMD RDNA2 GPU架構(gòu)詳解

每個(gè) SIMD 都有 32 個(gè)寬度的執(zhí)行單元用于最常見的操作，一個(gè) 128 KB 的矢量寄存器文件，并且可以跟蹤多達(dá) 16 個(gè)波面。因此，AMD 減少了 RDNA 2 可以跟蹤的波面數(shù)量，從 RDNA 1 中的 20 個(gè)。

2023-02-23 13:57:41

2074

AMD Radeon RX 7000系列筆記本電腦顯卡基于先進(jìn)的AMD RDNA 3架構(gòu)

? 今年，AMD宣布為筆記本電腦帶來全新AMD Radeon RX 7000系列移動(dòng)顯卡，基于先進(jìn)的AMD RDNA 3架構(gòu)，助力打造性能卓越的移動(dòng)平臺(tái)，帶來出色的性能功耗比、驚艷畫面與高幀率游戲

2023-03-02 17:32:40

2122

AMD帶領(lǐng)GPU進(jìn)入Chiplet時(shí)代 RDNA3架構(gòu)深入解讀

11月3日，AMD 透露了其 RDNA 3 GPU 架構(gòu)和 Radeon RX 7900 系列顯卡的關(guān)鍵細(xì)節(jié)。

2023-06-12 10:14:45

697

AMD銳龍8000 APU浮出水面：Zen5、RDNA3.5絕配

按照慣例，AMD將在明年初發(fā)布銳龍8000系列移動(dòng)處理器，工藝、架構(gòu)都會(huì)有全面提升，其中CPU用上Zen5、Zen5c的大小核組合，GPU則升級(jí)為RDNA3.5。

2023-07-18 09:28:19

644

揭秘GPU：高端GPU架構(gòu)設(shè)計(jì)的挑戰(zhàn)

在計(jì)算領(lǐng)域，GPU（圖形處理單元）一直是性能飛躍的代表。眾所周知，高端GPU的設(shè)計(jì)充滿了挑戰(zhàn)。GPU的架構(gòu)創(chuàng)新，為軟件承接大模型訓(xùn)練和推理場(chǎng)景的人工智能計(jì)算提供了持續(xù)提升的硬件基礎(chǔ)。GPU架構(gòu)設(shè)

2023-12-21 08:28:00

381