在五項(xiàng)新的行業(yè)指標(biāo)中,NVIDIA 贏得了其中的四項(xiàng)。這些指標(biāo)聚焦于AI在高性能計(jì)算中的應(yīng)用,是一種推動(dòng)科學(xué)和行業(yè)進(jìn)步的方法。
MLPerf HPC 1.0 是用于衡量高性能計(jì)算中 AI 性能的行業(yè)基準(zhǔn)測(cè)試,而 NVIDIA 賦能的系統(tǒng)在該基準(zhǔn)的五項(xiàng)測(cè)試中勝出四項(xiàng)。
MLPerf 是用于深度學(xué)習(xí)的行業(yè)基準(zhǔn)測(cè)試,首次發(fā)布于 2018 年 5 月。上述戰(zhàn)績(jī)是 MLPerf 基準(zhǔn)測(cè)試的最新結(jié)果。MLPerf HPC 解決了一種計(jì)算方式,可借助 AI 加速并增強(qiáng)超級(jí)計(jì)算機(jī)上的模擬。
分子動(dòng)力學(xué)、天文學(xué)和氣候模擬的近期進(jìn)展都使用 HPC+AI 取得了科學(xué)突破。這種趨勢(shì)可以推動(dòng)科學(xué)和工業(yè)領(lǐng)域用戶采用E級(jí)(Exascale) AI。
基準(zhǔn)測(cè)試衡量?jī)?nèi)容
MLPerf HPC 1.0 在 HPC 中心的三個(gè)典型工作負(fù)載中測(cè)試 AI 模型訓(xùn)練。
Cosmoflow 判斷望遠(yuǎn)鏡圖像中物體的細(xì)節(jié)。
Deepcam 測(cè)試對(duì)氣候數(shù)據(jù)中颶風(fēng)和大氣河流的檢測(cè)。
Opencatalyst 跟蹤系統(tǒng)預(yù)測(cè)分子中原子間力的成效。
每個(gè)測(cè)試分為兩個(gè)部分。衡量系統(tǒng)訓(xùn)練模型的速度的指標(biāo)被稱為強(qiáng)標(biāo)度。其對(duì)應(yīng)的弱標(biāo)度是衡量系統(tǒng)最大吞吐量的指標(biāo),即系統(tǒng)在給定時(shí)間內(nèi)可以訓(xùn)練多少模型。
與去年 MLPerf 0.7 那一輪的強(qiáng)標(biāo)度最佳成績(jī)相比,NVIDIA 為 Cosmoflow 性能提升了多達(dá) 5 倍。在 deepcam 方面,則將性能提高了近 7 倍以上。
勞倫斯伯克利國(guó)家實(shí)驗(yàn)室 (Lawrence Berkeley National Laboratory) 的 Perlmutter 系統(tǒng)使用了 5,120 個(gè) NVIDIA A100 Tensor Core GPU 中的 2,048 個(gè),在 opencatalyst基準(zhǔn)中成績(jī)斐然。
在弱標(biāo)度類別中,NVIDIA使用每個(gè)作業(yè) 16 個(gè)節(jié)點(diǎn)和 256 個(gè)同時(shí)作業(yè)來(lái)主導(dǎo) deepcam。NVIDIA所有的測(cè)試都在 NVIDIA Selene(如上圖),即NVIDIA內(nèi)部系統(tǒng)和大型工業(yè)超級(jí)計(jì)算機(jī)上運(yùn)行。
最新結(jié)果顯示 NVIDIA AI 平臺(tái)及其性能領(lǐng)先性的另一個(gè)維度。這是 NVIDIA 第八次在 MLPerf 基準(zhǔn)中獲得最高分,該基準(zhǔn)涵蓋數(shù)據(jù)中心、云和網(wǎng)絡(luò)邊緣的 AI 訓(xùn)練和推理。
龐大的生態(tài)系統(tǒng)
本輪八名參與者中有七名使用 NVIDIA GPU 提交了結(jié)果。
其中包括德國(guó)于利希超級(jí)計(jì)算中心、瑞士國(guó)家超算中心,以及美國(guó)的阿貢國(guó)家實(shí)驗(yàn)室、勞倫斯伯克利國(guó)家實(shí)驗(yàn)室、國(guó)家超級(jí)計(jì)算機(jī)應(yīng)用中心和德克薩斯高級(jí)計(jì)算中心。
于利希超算中心(Jülich Supercomputing Centre)主任 Thomas Lippert 表示:“通過(guò)基準(zhǔn)測(cè)試,我們已經(jīng)證明我們的機(jī)器能夠在實(shí)踐中發(fā)揮其潛力,并有助于讓歐洲在 AI 方面保持領(lǐng)先?!?/p>
MLPerf 基準(zhǔn)由 MLCommons 提供支持。后者是由阿里巴巴、Google、英特爾、Meta、NVIDIA 等牽頭的行業(yè)組織。
我們的實(shí)現(xiàn)方式
如此強(qiáng)勁的表現(xiàn)都得益于 NVIDIA AI 平臺(tái)的成熟發(fā)展。該平臺(tái)目前已包括完整的軟件堆棧。
在這一輪中,NVIDIA使用每個(gè)人都可以使用的工具來(lái)調(diào)整代碼,例如可以加速數(shù)據(jù)處理的 NVIDIA DALI 和能夠減少小批量延遲的 CUDA Graphs,追蹤將橫向擴(kuò)展到 1,024 個(gè)或更多個(gè) GPU。此外還應(yīng)用了 NVIDIA SHARP,這是 NVIDIA MagnumIO 中的一個(gè)關(guān)鍵組件,可提供網(wǎng)絡(luò)計(jì)算以加速通信并將數(shù)據(jù)操作卸載到 NVIDIA Quantum InfiniBand 交換機(jī)網(wǎng)絡(luò)。
NVIDIA用于提交作品的所有軟件均可從 MLPerf 倉(cāng)庫(kù)獲得。NVIDIA定期將此類代碼添加到 NGC 目錄。該目錄是NVIDIA預(yù)訓(xùn)練 AI 模型、行業(yè)應(yīng)用程序框架、GPU 應(yīng)用程序和其他軟件資源的軟件中心。
責(zé)任編輯:haq
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4989瀏覽量
103074 -
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269129
原文標(biāo)題:SC21 | MLPerf 基準(zhǔn)測(cè)試闡明為什么 AI 是 HPC 的未來(lái)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論