常聽人說(shuō)AI對(duì)存儲(chǔ)性能提出了新需求,那么AI對(duì)存儲(chǔ)有怎樣的需求呢?
人工智能全流程中,涉及數(shù)據(jù)的采集、數(shù)據(jù)的預(yù)處理、模型訓(xùn)練、模型部署等環(huán)節(jié),跟以往操作差異最大的在于訓(xùn)練環(huán)節(jié),為此,有外媒動(dòng)手做了一個(gè)評(píng)測(cè)。結(jié)果顯示,在訓(xùn)練環(huán)節(jié),高性能存儲(chǔ)設(shè)備對(duì)于性能的提升完全沒有幫助。
測(cè)試架構(gòu)是這樣的,一臺(tái)戴爾PowerEdge R740xd服務(wù)器,有兩塊至強(qiáng)黃金6130 CPU,256GB DRAM內(nèi)存,用它來(lái)運(yùn)行byteLAKE的AI測(cè)試,測(cè)試的變量是三款SSD,一個(gè)是鎧俠SAS 口的PX04S,一個(gè)是三星的983ZET,還有一個(gè)是英特爾傲騰900P。
鎧俠SAS口 PX04S SSD
三星PCIe卡983ZET
英特爾傲騰900P
測(cè)試中分析了機(jī)器學(xué)習(xí)在訓(xùn)練階段的性能表現(xiàn),測(cè)試程序用的是byteLAKE的EWA Gurad,它是一個(gè)實(shí)時(shí)監(jiān)測(cè)模型,該模型包括一個(gè)輸入層,22個(gè)卷積層,5個(gè)池化層,2個(gè)路由層,還有一個(gè)探測(cè)層。
測(cè)試優(yōu)劣的評(píng)判標(biāo)準(zhǔn)是時(shí)間,就是做5000個(gè)Epoch所耗費(fèi)的時(shí)間,每換一次SSD就進(jìn)行一次測(cè)試,測(cè)試結(jié)果如下。
鎧俠 98小時(shí) 24分
三星 98小時(shí) 44分
英特爾 98小時(shí) 42分
明顯可見,本地的SSD對(duì)性能幾乎沒有影響,換了不同性能的SSD,既有SAS口的,也有PCIe口的,既有NAND SSD也有機(jī)遇3D Xpoint的SSD,最終性能表現(xiàn)都差不多。
在數(shù)據(jù)的獲取時(shí),SSD會(huì)有優(yōu)勢(shì),但在計(jì)算環(huán)節(jié),對(duì)SSD的要求并不高,那是不是說(shuō)明CPU的訓(xùn)練能力不夠,導(dǎo)致瓶頸呢?
為了進(jìn)一步測(cè)試,在服務(wù)器里加入來(lái)了一塊英偉達(dá)T4顯卡,然后再跑一下測(cè)試。
鎧俠 4h 30分鐘
三星 4小時(shí) 28分鐘
Intel 4小時(shí) 27分鐘
GPU的加速效果還是非常明顯的,提升了22倍,計(jì)算性能提升來(lái)的話,SSD的性能差異是否明顯呢?從數(shù)據(jù)來(lái)看,顯然還是沒什么影響。
測(cè)試結(jié)果發(fā)現(xiàn),高性能的存儲(chǔ)并沒有提升AI訓(xùn)練階段的性能,由于AI模型的復(fù)雜結(jié)構(gòu)限制,機(jī)器學(xué)習(xí)訓(xùn)練的時(shí)間要遠(yuǎn)遠(yuǎn)高于數(shù)據(jù)載入的時(shí)間。雖然英偉達(dá)T4顯卡加速了機(jī)器學(xué)習(xí)的速度,但并沒有讓SSD發(fā)揮優(yōu)勢(shì),
當(dāng)然,想要看具體某個(gè)零部件對(duì)于系統(tǒng)性能影響的話還需要許多細(xì)致的工作,比如,換一個(gè)AI框架,換別的零部件什么的。這一測(cè)試其實(shí)是有意義的,可以讓我們找出有利于性能提升的部分,把錢花在刀刃上。
責(zé)任編輯:pj
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9262瀏覽量
85766 -
AI
+關(guān)注
關(guān)注
87文章
31316瀏覽量
269659 -
人工智能
+關(guān)注
關(guān)注
1792文章
47525瀏覽量
239256
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論