借助 NVIDIA AI,戴爾、浪潮、Microsoft Azure 和 Supermicro 在今天發(fā)布的新 MLPerf 基準(zhǔn)測(cè)試中創(chuàng)下快速訓(xùn)練 AI 模型的記錄
看看誰(shuí)剛剛在快速訓(xùn)練 AI 模型方面創(chuàng)下新速度記錄:戴爾科技、浪潮、Supermicro以及在 MLPerf 基準(zhǔn)測(cè)試中首次亮相的 Azure 均在使用 NVIDIA AI。
在今天宣布的 MLPerf 訓(xùn)練 1.1 結(jié)果中,NVIDIA平臺(tái)在所有八個(gè)熱門(mén)工作負(fù)載中都創(chuàng)下了記錄。
圖示:在新一輪的測(cè)試中,NVIDIA AI 訓(xùn)練所有模型的速度都快于替代方案
NVIDIA A100 Tensor Core GPU 提供了最出色每芯片性能, Selene 是NVIDIA內(nèi)部基于模塊化NVIDIA DGX SuperPOD架構(gòu)構(gòu)建的AI超級(jí)計(jì)算機(jī),借助NVIDIA InfiniBand網(wǎng)絡(luò)和NVIDIA軟件棧進(jìn)行擴(kuò)展,A100在Selene上實(shí)現(xiàn)了最快的AI訓(xùn)練速度 。
圖示:NVIDIA A100 GPU 在所有八項(xiàng) MLPerf 1.1 測(cè)試中均實(shí)現(xiàn)最好的每芯片訓(xùn)練性能
云服務(wù)更上一層樓
根據(jù)最新結(jié)果,在訓(xùn)練 AI 模型方面,Azure 的 NDm A100 v4 實(shí)例的速度遙遙領(lǐng)先。它運(yùn)行了新一輪的每項(xiàng)測(cè)試,擴(kuò)展到多達(dá) 2,048 個(gè) A100 GPU。
Azure 不僅展示了出色性能,而且在美國(guó)的六個(gè)地區(qū),現(xiàn)在所有人都可以租借和使用其出色性能。
AI 訓(xùn)練是一項(xiàng)需要大量投入的大型工作。NVIDIA希望用戶借助他們選擇的服務(wù)或系統(tǒng)以創(chuàng)紀(jì)錄的速度訓(xùn)練模型。
因此,NVIDIA將 NVIDIA AI 與面向云服務(wù)、主機(jī)托管服務(wù)、企業(yè)和科學(xué)計(jì)算中心的產(chǎn)品相結(jié)合。
服務(wù)器制造商各顯身手
在OEM 中,浪潮憑借其八路GPU服務(wù)器NF5688M6 和NF5488A5液冷服務(wù)器在單節(jié)點(diǎn)性能方面創(chuàng)下了最多記錄。戴爾和 Supermicro 在四路 A100 GPU 系統(tǒng)上創(chuàng)下了記錄。
共有 10 家 NVIDIA 合作伙伴提交了本輪測(cè)試結(jié)果,其中包含 8 家 OEM 和 2 家云服務(wù)提供商。它們占所有提交的 90% 以上。
這是 NVIDIA 生態(tài)系統(tǒng)在 MLPerf 訓(xùn)練測(cè)試中的第五次亮相,也是到目前為止最出色的亮相。
NVIDIA的合作伙伴之所以積極參與,是因?yàn)樗麄冎?MLPerf 是唯一符合行業(yè)標(biāo)準(zhǔn)、經(jīng)過(guò)同行評(píng)審的 AI 訓(xùn)練和推理基準(zhǔn)測(cè)試。對(duì)于評(píng)估 AI 平臺(tái)和供應(yīng)商的客戶來(lái)說(shuō),這是一個(gè)有價(jià)值的工具。
為速度認(rèn)證的服務(wù)器
百度 PaddlePaddle、戴爾科技、富士通、技嘉科技、慧與、浪潮、聯(lián)想和 Supermicro 提交了基于本地?cái)?shù)據(jù)中心的結(jié)果(單節(jié)點(diǎn)和多節(jié)點(diǎn)任務(wù))。
NVIDIA幾乎所有的 OEM 合作伙伴都在 NVIDIA 認(rèn)證系統(tǒng)上運(yùn)行了測(cè)試,NVIDIA為需要加速計(jì)算的企業(yè)客戶驗(yàn)證了服務(wù)器。
提交的范圍展示了 NVIDIA 平臺(tái)的廣度和成熟度,該平臺(tái)為各種規(guī)模的企業(yè)提供最佳的解決方案。
既快速又靈活
NVIDIA AI 是唯一用于提交所有基準(zhǔn)測(cè)試和用例的平臺(tái)參與者,這展示了其通用性和高性能??焖凫`活的系統(tǒng)提供客戶所需的生產(chǎn)力,以加快他們的工作速度。
AI訓(xùn)練基準(zhǔn)測(cè)試涵蓋當(dāng)今最熱門(mén)的八個(gè) AI 工作負(fù)載和場(chǎng)景,例如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、推薦系統(tǒng)、增強(qiáng)學(xué)習(xí)等。
MLPerf 測(cè)試透明、客觀,因此用戶可以依靠結(jié)果做出明智的購(gòu)買(mǎi)決策。該行業(yè)基準(zhǔn)測(cè)試組織成立于 2018 年 5 月,得到阿里巴巴、ARM、Google、Intel 和 NVIDIA 等數(shù)十家行業(yè)領(lǐng)先公司的支持。
三年內(nèi)加速 20 倍
回顧過(guò)去,數(shù)據(jù)顯示,僅在過(guò)去 18 個(gè)月,NVIDIA A100 GPU 的性能就提升了 5 倍以上。這要?dú)w功于軟件的持續(xù)創(chuàng)新,這也是NVIDIA目前工作的重心。
自從三年前 MLPerf 測(cè)試首次亮相,NVIDIA 的性能提高了 20 倍以上。這種大規(guī)模加速源于NVIDIA在全棧 GPU、網(wǎng)絡(luò)、系統(tǒng)和軟件方面取得的進(jìn)步。
圖示:NVIDIA AI 在三年內(nèi)實(shí)現(xiàn)了 20 倍以上的改進(jìn)
持續(xù)改進(jìn)軟件
NVIDIA的新進(jìn)展來(lái)自多項(xiàng)軟件改進(jìn)。
例如,借助一類(lèi)新的內(nèi)存復(fù)制操作,NVIDIA在針對(duì)醫(yī)學(xué)成像的 3D-UNet 基準(zhǔn)測(cè)試中實(shí)現(xiàn) 2.5 倍的操作加速。
得益于微調(diào) GPU 以進(jìn)行并行處理的方式,NVIDIA在針對(duì)物體檢測(cè)的 Mask R-CNN 測(cè)試中實(shí)現(xiàn) 10% 的速度提升,而在針對(duì)推薦系統(tǒng)的測(cè)試中實(shí)現(xiàn)了 27% 的提升。NVIDIA只是重疊了獨(dú)立操作,這種技術(shù)尤其適合跨多個(gè) GPU 運(yùn)行的作業(yè)。
NVIDIA擴(kuò)展了 CUDA 圖形的使用范圍,盡可能減少與主機(jī) CPU 的通信。得益于此,NVIDIA在針對(duì)圖像分類(lèi)的 ResNet-50 基準(zhǔn)測(cè)試中實(shí)現(xiàn)了 6% 的性能提升。
NVIDIA在NCCL 上實(shí)施了兩種新技術(shù)。NCCL 是NVIDIA的庫(kù),用于優(yōu)化 GPU 之間的通信。對(duì)于 BERT 等大型語(yǔ)言模型,這樣可以將結(jié)果加速高達(dá) 5%。
利用NVIDIA的工作結(jié)果
NVIDIA使用的所有軟件均在 MLPerf 倉(cāng)庫(kù)提供,因此每個(gè)人都可以獲得NVIDIA的出色結(jié)果。NVIDIA不斷將這些優(yōu)化整合到 NGC(NVIDIA的 GPU 應(yīng)用程序軟件中心)上的容器。
它是全棧平臺(tái)的一部分,已在新的行業(yè)基準(zhǔn)測(cè)試中得到驗(yàn)證,可從各種合作伙伴處獲得,能夠處理當(dāng)今真正的 AI 作業(yè)。
原文標(biāo)題:MLPerf | 云服務(wù)、OEM 借助 NVIDIA AI 讓 AI 訓(xùn)練更上層樓
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4986瀏覽量
103066 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9160瀏覽量
85425 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4778瀏覽量
72129
原文標(biāo)題:MLPerf | 云服務(wù)、OEM 借助 NVIDIA AI 讓 AI 訓(xùn)練更上層樓
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論