神马午夜,亚洲和欧洲一码二码区别7777

從Stable Diffusion這一AI應(yīng)用出現(xiàn)之后，在極短時間內(nèi)就迅速走紅，成為眾多玩家口口相傳的“最美小姐姐”生成工具。不過這一AI計算畫圖工具在Stable Diffusion官方推出之初，無論是WEB UI的部署還是模型的訓(xùn)練生成，都基本是基于NVIDIA CUDA加速的算法，因此A卡最初并不被Stable Diffusion官方支持。不過好在Stable Diffusion算是一個開源的產(chǎn)品，在眾多社區(qū)聚集玩家的支持下，也出現(xiàn)了許多支持A卡GPU 加速計算的分支，比如我們今天要測試的基于DirectML的部署，就能實現(xiàn)AMD Radeon顯卡的Stable Diffusion AI計算硬件加速。

如果要自己在本地部署基于DirectML的Stable Diffusion話，相比便捷的基于CUDA的WEB UI部署要相對復(fù)雜一些，不過現(xiàn)在網(wǎng)上已經(jīng)有比較成熟的整合包供玩家適用，玩家們只需要下載相應(yīng)的整合包，就能一鍵實現(xiàn)在本地的傻瓜式安裝部署，可以為大家節(jié)省相當(dāng)多的時間。

▲我們選擇用于測試的這個整合包安裝完畢之后，自動進入AMD GPU加速計算模式，在本地開啟http://127.0.0.1:7860即可打開本地Stable Diffusion的AI畫圖界面。

▲在本地WEB UI界面上可以自由設(shè)置相關(guān)的AI藝術(shù)圖生成參數(shù)，點擊“生成”即可開始畫圖。具體請參考線上相關(guān)教程，在此我們不贅述。

那么，基于DirectML的Stable Diffusion部署分支能不能實現(xiàn)對AMD顯卡的硬件計算加速支持呢？它的效率到底如何？在此前A卡玩家經(jīng)常只能在Linux系統(tǒng)下運行Stable Diffusion，通過ROCM(Radeon Open Compute)模擬CUDA加速，如今在Windows系統(tǒng)下直接實現(xiàn)A卡的AI加速計算，能否達到我們的預(yù)期目標呢？為此，我們選擇了AMD Radeon RX 5000系、RX 6000系以及RX 7000系的數(shù)款顯卡，進行了一番詳細的體驗。

體驗平臺

顯卡：AMD Radeon RX 5500XT(8GB)、RX 5700(8GB)、RX 6500XT 4GB、RX 6600(8GB)、RX 6700XT(12GB)、RX 6750XT(12GB)、RX 6800(16GB)、RX 6900XT(16GB)、RX 7900 XT(20GB)、RX 7900 XTX(24GB)

CPU：英特爾酷睿i9-13900K

主板：英特爾Z790

內(nèi)存：DDR5 6000 16GB×2

SSD：AORUS NVMe PCIe SSD 2TB

操作系統(tǒng)：Windows 11 Pro 22H2

驅(qū)動程序：AMD Software Adrenalin Edition 23.4.3

通過測試，我們想知道：

AMD Radeon 5000系、6000系和7000系之間，在Stable Diffusion的AI畫圖算力上有多大差別？

相比傳統(tǒng)的CPU AI計算加速，AMD GPU加速性能到底如何？

▲我們所采用的網(wǎng)絡(luò)開源共享的部署方案可以正確實現(xiàn)AMD顯卡的硬件加速計算，可以看到在圖片生成的過程中GPU的占用率一直保持在100%。

模型為Novel AI Final-runed(CKPT)

測試一：AI生成時尚美女

在第一部分的測試中，我們通過關(guān)鍵詞生成一個大眼的時尚美女小姐姐，還要有一定的照片感。關(guān)鍵詞設(shè)置如下(部分引用自網(wǎng)絡(luò)開源共享關(guān)鍵詞)：

lora0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black choker, cute, (Kpop idol), (aegyo sal:1), (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium

分辨率設(shè)置：512×512

采樣步進：20

提示詞引導(dǎo)系數(shù)：7

生成批次-每批數(shù)量：1-1、4-1

在測試中由于絕大部分顯卡都擁有8GB以上的顯存，因此我們在運行參數(shù)上基本設(shè)置了正常的高顯存默認模式，只有4GB顯存版的RX 6500XT運行時采用了添加了--lowvram的低顯存運行模式(否則就無法運行)。從整體測試結(jié)果來看，AMD從Radeon RX 5000系到RX 7000系的顯卡幾乎都很好地實現(xiàn)了Stable Diffusion應(yīng)用的AI計算加速性能，尤其是Radeon RX 7000系顯卡性能相比RX 6000系顯卡有了巨大的提升。比如RX 6900XT在該設(shè)置與模型算法下的圖片生成率約為8.87張/秒，而RX 7900 XT則可以達到15.76張/秒，性能提升接近100%。

而相比CPU來說，全系A(chǔ)MD顯卡都占有非常明顯的優(yōu)勢，RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右，即使前兩代的入門級顯卡RX 5500XT，性能上也幾乎接近酷睿i9-13900K的5倍。

唯一有點異常的是RX 6500XT，按照核心規(guī)格來看，它應(yīng)該是要強于RX 5500XT的，不過由于顯存配置僅為4GB，因此在測試中開啟了低顯存運行模式之后，其圖片上生成速度受到了極大影響，遠低于GPU加速的正常表現(xiàn)，僅能達到略高于CPU計算的水準。

測試二：AI生成較為復(fù)雜的水邊別墅風(fēng)景照

在接下來的測試中，我們用一系列相對復(fù)雜的關(guān)鍵詞來生成一座位于水邊的別墅，同時還伴有陽光、波紋、倒影等效果要求。關(guān)鍵詞如下：

‘beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k,’

分辨率設(shè)置：512×512

采樣步進：50

提示詞引導(dǎo)系數(shù)：7.5

生成批次-每批數(shù)量：1-1、2-1、4-1

這部分的測試結(jié)果與前一測試基本保持了一致性。仍然是RX 7000系顯卡在性能上獨占鰲頭，相對于RX 6000系顯卡的對位提升在100%左右，與CPU的計算性能相比，GPU加速計算的性能提升仍然非常顯著，RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右，入門級顯卡RX 5500XT，性能上也幾乎接近酷睿i9-13900K的5倍。

4GB顯存配置RX 6500XT由于僅能在低顯存模式下運行，因此圖片上生成速度還是受到了極大影響，遠低于GPU加速的正常表現(xiàn)，大致與酷睿i9-13900K相當(dāng)。

寫在最后

這是一次簡單但卻比較有趣的測試，通過這次體驗，我們認為有幾點參考意見可以總結(jié)給玩家們參考：

1.當(dāng)前AMD顯卡已經(jīng)可以通過開源的部署方案實現(xiàn)在Windows系統(tǒng)下的Stable Diffusion AI計算加速，而且網(wǎng)上也有許多的傻瓜式整合包，感興趣的玩家完全可以一試；

2.從測試結(jié)果來看，AMD顯卡在Stable Diffusion的AI圖片生成計算中能夠發(fā)揮出遠勝于CPU計算的性能增幅，使用GPU加速計算能帶來事倍功半的效果；

3.從測試情況來看，測試中當(dāng)渲染分辨率設(shè)置超過512時(如768×768)，就會出現(xiàn)爆顯存的情況，這與部署方案和模型有一定關(guān)系，但也反映了在正常模式下運行時，8GB顯存幾乎是Stable Diffusion的硬性入門要求。如果顯存低于8GB，即使在512×512分辨率下渲染，也會出現(xiàn)顯存不足的情況，此時就不得不采用--lowvram的低顯存運行方案，但會極大地拖累計算速度，如測試中的RX 6500XT 4GB。所以要想暢玩Stable Diffusion，我們建議顯卡的顯存為8GB或更高為佳；

4.從整體結(jié)果來看，我們認為AMD GPU還有極大的算法優(yōu)化空間，憑不可靠經(jīng)驗判斷，從RX 7900 XTX到酷睿i9-13900K的性能差距還不足夠大。這和我們部署的算法方案以及模型都有一定關(guān)系，也希望各社區(qū)的程序員們能開發(fā)出更多更優(yōu)秀的針對AMD顯卡的計算加速方案。

不管如何，AMD顯卡對Stable Diffusion的硬件加速計算性能已經(jīng)得到了展現(xiàn)，效果也比較明顯，對AMD顯卡用戶來說毫無疑問是利好的福音消息，剩下的就是玩家與AMD需要堅持的繼續(xù)優(yōu)化之路了。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

amd

amd

+關(guān)注

關(guān)注
25

文章
5470

瀏覽量
134211
算法

算法

+關(guān)注

關(guān)注
23

文章
4613

瀏覽量
92957
AI算法

AI算法

+關(guān)注

關(guān)注
0

文章
251

瀏覽量
12263

原文標題：AI算法畫小姐姐，AMD顯卡比頂級CPU快30倍！AMD Radeon顯卡Stable Diffusion AI畫圖體驗測試

文章出處：【微信號：Microcomputer，微信公眾號：Microcomputer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

AMD確認2025年推出RDNA 4顯卡,光追與AI性能大幅提升

10月30日，AMD在2024年第三季度財報電話會議上宣布了一個關(guān)于GPU的重要信息：其下一代RDNA 4顯卡計劃于2025年初發(fā)布。AMD首席執(zhí)行官蘇姿豐明確表示：“我們計劃在202

發(fā)表于 10-30 16:50 ?671次閱讀

AMD全新處理器擴大數(shù)據(jù)中心CPU的領(lǐng)先地位

在Computex 2024 開幕主題演講上，AMD 詳細介紹了全新的 CPU、NPU 和 GPU 領(lǐng)先架構(gòu)，為從數(shù)據(jù)中心到個人電腦的端到端 AI 基礎(chǔ)架構(gòu)帶來強大算力。AMD預(yù)覽了將

發(fā)表于 09-19 11:01 ?534次閱讀

簡單認識AMD Radeon RX 6750 GRE系列顯卡

今日推薦AMD Radeon RX 6750 GRE系列顯卡，它擁有至高12GB GDDR6顯存，多達40個計算單元，以及高達96MB的AMD Infinity Cache無限緩存技術(shù)，并且將光線

發(fā)表于 09-18 11:02 ?716次閱讀

簡單認識<b class='flag-5'>AMD</b> Radeon RX 6750 GRE系列<b class='flag-5'>顯卡</b>

AMD Radeon RX 7700 XT顯卡的主要特性

作為DIY玩家，如果你正在尋求一款性能上能夠暢玩1440p游戲，功能上能夠滿足內(nèi)容生產(chǎn)創(chuàng)作需求的顯卡，那么AMD Radeon RX 7700 XT值得你入手。

發(fā)表于 09-18 10:57 ?983次閱讀

<b class='flag-5'>AMD</b> Radeon RX 7700 XT<b class='flag-5'>顯卡</b>的主要特性

如何維修一張電腦顯卡型號是amd的rx580 燒壞的部位？

大家好！我在維修一張電腦顯卡型號是amd的rx580 燒壞的部位是一個電感情況如下圖我覺得應(yīng)該用飛線方法補焊盤再接電感但是一直找不到1伏的兩個相連的元器件

發(fā)表于 09-13 03:07

蘋果 A18 芯片發(fā)布：CPU 提升 30%、GPU 提升 40%

核 CPU 包括 2 個性能核心和 4 個效率核心，比 iPhone 15 的 A16 Bionic 快 30%，能耗降低 30% 。 G

發(fā)表于 09-11 12:19 ?651次閱讀

蘋果 A18 芯片發(fā)布：<b class='flag-5'>CPU</b> 提升 <b class='flag-5'>30</b>%、GPU 提升 40%

AMD將推出Zen5架構(gòu)CPU，效能比Zen4快40%

AMD的Zen 5 CPU架構(gòu)采用了臺積電的3納米制程。雖然目前關(guān)于Zen 5 CPU的細節(jié)尚不清楚，但預(yù)計將提高性能效率，內(nèi)建人工智能和機器學(xué)習(xí)優(yōu)化，并重新管道化前端。據(jù)報道，單核心效能將提升15%，多核心效能將提升

發(fā)表于 08-08 14:25 ?504次閱讀

技嘉推出全新AMD Radeon PRO W7000系列工作站顯卡

隨著技術(shù)的不斷進步，工作站顯卡在專業(yè)人士、創(chuàng)作者和AI開發(fā)人員中的需求日益增長。為了滿足這一市場需求，技嘉于6月22日正式推出了全新的AMD Radeon PRO W7000系列工作站顯卡

發(fā)表于 06-22 11:51 ?1186次閱讀

PROPHESEE 攜手 AMD，推出業(yè)界首款兼容 Kria? KV260 視覺 AI 入門套件的事件視覺解決方案

月 30 日，中國上?！I(lǐng)先的神經(jīng)擬態(tài)視覺傳感公司 Prophesee 宣布，其 Metavision? HD 事件視覺傳感器和 AI 算法現(xiàn)已支持 AMD Kria? KV260

發(fā)表于 05-30 10:41 ?970次閱讀