從Stable Diffusion這一AI應(yīng)用出現(xiàn)之后,在極短時間內(nèi)就迅速走紅,成為眾多玩家口口相傳的“最美小姐姐”生成工具。不過這一AI計算畫圖工具在Stable Diffusion官方推出之初,無論是WEB UI的部署還是模型的訓(xùn)練生成,都基本是基于NVIDIA CUDA加速的算法,因此A卡最初并不被Stable Diffusion官方支持。不過好在Stable Diffusion算是一個開源的產(chǎn)品,在眾多社區(qū)聚集玩家的支持下,也出現(xiàn)了許多支持A卡GPU加速計算的分支,比如我們今天要測試的基于DirectML的部署,就能實現(xiàn)AMD Radeon顯卡的Stable Diffusion AI計算硬件加速。
如果要自己在本地部署基于DirectML的Stable Diffusion話,相比便捷的基于CUDA的WEB UI部署要相對復(fù)雜一些,不過現(xiàn)在網(wǎng)上已經(jīng)有比較成熟的整合包供玩家適用,玩家們只需要下載相應(yīng)的整合包,就能一鍵實現(xiàn)在本地的傻瓜式安裝部署,可以為大家節(jié)省相當(dāng)多的時間。
▲我們選擇用于測試的這個整合包安裝完畢之后,自動進入AMD GPU加速計算模式,在本地開啟http://127.0.0.1:7860即可打開本地Stable Diffusion的AI畫圖界面。
▲在本地WEB UI界面上可以自由設(shè)置相關(guān)的AI藝術(shù)圖生成參數(shù),點擊“生成”即可開始畫圖。具體請參考線上相關(guān)教程,在此我們不贅述。
那么,基于DirectML的Stable Diffusion部署分支能不能實現(xiàn)對AMD顯卡的硬件計算加速支持呢?它的效率到底如何?在此前A卡玩家經(jīng)常只能在Linux系統(tǒng)下運行Stable Diffusion,通過ROCM(Radeon Open Compute)模擬CUDA加速,如今在Windows系統(tǒng)下直接實現(xiàn)A卡的AI加速計算,能否達到我們的預(yù)期目標呢?為此,我們選擇了AMD Radeon RX 5000系、RX 6000系以及RX 7000系的數(shù)款顯卡,進行了一番詳細的體驗。
體驗平臺
顯卡:AMD Radeon RX 5500XT(8GB)、RX 5700(8GB)、RX 6500XT 4GB、RX 6600(8GB)、RX 6700XT(12GB)、RX 6750XT(12GB)、RX 6800(16GB)、RX 6900XT(16GB)、RX 7900 XT(20GB)、RX 7900 XTX(24GB)
主板:英特爾Z790
內(nèi)存:DDR5 6000 16GB×2
操作系統(tǒng):Windows 11 Pro 22H2
驅(qū)動程序:AMD Software Adrenalin Edition 23.4.3
通過測試,我們想知道:
AMD Radeon 5000系、6000系和7000系之間,在Stable Diffusion的AI畫圖算力上有多大差別?
相比傳統(tǒng)的CPU AI計算加速,AMD GPU加速性能到底如何?
▲我們所采用的網(wǎng)絡(luò)開源共享的部署方案可以正確實現(xiàn)AMD顯卡的硬件加速計算,可以看到在圖片生成的過程中GPU的占用率一直保持在100%。
模型為Novel AI Final-runed(CKPT)
測試一:AI生成時尚美女
在第一部分的測試中,我們通過關(guān)鍵詞生成一個大眼的時尚美女小姐姐,還要有一定的照片感。關(guān)鍵詞設(shè)置如下(部分引用自網(wǎng)絡(luò)開源共享關(guān)鍵詞):
lora0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black choker, cute, (Kpop idol), (aegyo sal:1), (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium
分辨率設(shè)置:512×512
采樣步進:20
提示詞引導(dǎo)系數(shù):7
生成批次-每批數(shù)量:1-1、4-1
在測試中由于絕大部分顯卡都擁有8GB以上的顯存,因此我們在運行參數(shù)上基本設(shè)置了正常的高顯存默認模式,只有4GB顯存版的RX 6500XT運行時采用了添加了--lowvram的低顯存運行模式(否則就無法運行)。從整體測試結(jié)果來看,AMD從Radeon RX 5000系到RX 7000系的顯卡幾乎都很好地實現(xiàn)了Stable Diffusion應(yīng)用的AI計算加速性能,尤其是Radeon RX 7000系顯卡性能相比RX 6000系顯卡有了巨大的提升。比如RX 6900XT在該設(shè)置與模型算法下的圖片生成率約為8.87張/秒,而RX 7900 XT則可以達到15.76張/秒,性能提升接近100%。
而相比CPU來說,全系A(chǔ)MD顯卡都占有非常明顯的優(yōu)勢,RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右,即使前兩代的入門級顯卡RX 5500XT,性能上也幾乎接近酷睿i9-13900K的5倍。
唯一有點異常的是RX 6500XT,按照核心規(guī)格來看,它應(yīng)該是要強于RX 5500XT的,不過由于顯存配置僅為4GB,因此在測試中開啟了低顯存運行模式之后,其圖片上生成速度受到了極大影響,遠低于GPU加速的正常表現(xiàn),僅能達到略高于CPU計算的水準。
測試二:AI生成較為復(fù)雜的水邊別墅風(fēng)景照
在接下來的測試中,我們用一系列相對復(fù)雜的關(guān)鍵詞來生成一座位于水邊的別墅,同時還伴有陽光、波紋、倒影等效果要求。關(guān)鍵詞如下:
‘beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k,’
分辨率設(shè)置:512×512
采樣步進:50
提示詞引導(dǎo)系數(shù):7.5
生成批次-每批數(shù)量:1-1、2-1、4-1
這部分的測試結(jié)果與前一測試基本保持了一致性。仍然是RX 7000系顯卡在性能上獨占鰲頭,相對于RX 6000系顯卡的對位提升在100%左右,與CPU的計算性能相比,GPU加速計算的性能提升仍然非常顯著,RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右,入門級顯卡RX 5500XT,性能上也幾乎接近酷睿i9-13900K的5倍。
4GB顯存配置RX 6500XT由于僅能在低顯存模式下運行,因此圖片上生成速度還是受到了極大影響,遠低于GPU加速的正常表現(xiàn),大致與酷睿i9-13900K相當(dāng)。
寫在最后
這是一次簡單但卻比較有趣的測試,通過這次體驗,我們認為有幾點參考意見可以總結(jié)給玩家們參考:
1.當(dāng)前AMD顯卡已經(jīng)可以通過開源的部署方案實現(xiàn)在Windows系統(tǒng)下的Stable Diffusion AI計算加速,而且網(wǎng)上也有許多的傻瓜式整合包,感興趣的玩家完全可以一試;
2.從測試結(jié)果來看,AMD顯卡在Stable Diffusion的AI圖片生成計算中能夠發(fā)揮出遠勝于CPU計算的性能增幅,使用GPU加速計算能帶來事倍功半的效果;
3.從測試情況來看,測試中當(dāng)渲染分辨率設(shè)置超過512時(如768×768),就會出現(xiàn)爆顯存的情況,這與部署方案和模型有一定關(guān)系,但也反映了在正常模式下運行時,8GB顯存幾乎是Stable Diffusion的硬性入門要求。如果顯存低于8GB,即使在512×512分辨率下渲染,也會出現(xiàn)顯存不足的情況,此時就不得不采用--lowvram的低顯存運行方案,但會極大地拖累計算速度,如測試中的RX 6500XT 4GB。所以要想暢玩Stable Diffusion,我們建議顯卡的顯存為8GB或更高為佳;
4.從整體結(jié)果來看,我們認為AMD GPU還有極大的算法優(yōu)化空間,憑不可靠經(jīng)驗判斷,從RX 7900 XTX到酷睿i9-13900K的性能差距還不足夠大。這和我們部署的算法方案以及模型都有一定關(guān)系,也希望各社區(qū)的程序員們能開發(fā)出更多更優(yōu)秀的針對AMD顯卡的計算加速方案。
不管如何,AMD顯卡對Stable Diffusion的硬件加速計算性能已經(jīng)得到了展現(xiàn),效果也比較明顯,對AMD顯卡用戶來說毫無疑問是利好的福音消息,剩下的就是玩家與AMD需要堅持的繼續(xù)優(yōu)化之路了。
審核編輯 :李倩
-
amd
+關(guān)注
關(guān)注
25文章
5470瀏覽量
134211 -
算法
+關(guān)注
關(guān)注
23文章
4613瀏覽量
92957 -
AI算法
+關(guān)注
關(guān)注
0文章
251瀏覽量
12263
原文標題:AI算法畫小姐姐,AMD顯卡比頂級CPU快30倍!AMD Radeon顯卡Stable Diffusion AI畫圖體驗測試
文章出處:【微信號:Microcomputer,微信公眾號:Microcomputer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論