在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強大功能為超級計算機提供強大助力。
美國洛斯阿拉莫斯國家實驗室(LANL)正在與 NVIDIA 進行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應(yīng)用的性能提高 30 倍。
LANL 研究人員預(yù)計,使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及 NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。
面向 DPU 的開放式 API
這些努力還將有助于進一步定義 OpenSNAPI ,任何人都可通過該應(yīng)用接口來控制 DPU 。這是統(tǒng)計計算框架(Unified Communication Framework)的一個項目,Unified Communication Framework 是一個旨在實現(xiàn) HPC 應(yīng)用異構(gòu)計算的聯(lián)盟,成員包括 Arm 、IBM 、NVIDIA 、美國國家實驗室和美國的一些大學(xué)。
LANL 已經(jīng)感受到網(wǎng)絡(luò)計算的強大功能,這要歸功于其創(chuàng)建的 DPU 賦能的存儲系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達同類存儲系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率。”
德克薩斯州打造出云原生超級計算平臺
德克薩斯高級計算中心(TACC)近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2 。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計算的開發(fā)平臺。
TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。
MPI 獲得加速
在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個 HPC 熱門編程模型的運行速度提高 26%。
他們通過卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了 P3DFFT ,這是一個用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。
俄亥俄州立大學(xué)計算機科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團隊推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載。”
HPC 中心和云中的 DPU
對于運行藥物研發(fā)或飛機設(shè)計等 HPC 仿真應(yīng)用的超級計算機而言,高達兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個 HPC 中心的代碼請求。
Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。
他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計算,而 InfiniBand 已經(jīng)在為它提供支持?!?/p>
達勒姆開發(fā)負載均衡
歐洲的多個研究團隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負載。
例如,英格蘭北部的達勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個節(jié)點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現(xiàn) MPI 作業(yè)的負載均衡。該項目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。
劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用
劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU 。
倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。
Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機 CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時,慕尼黑工業(yè)大學(xué)計算機體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項目的一部分。
在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實驗室合作,利用 BlueField-2 DPU 加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達 20% ,且不會損失模擬的準確性。
不斷擴展的網(wǎng)絡(luò)
本月早些時候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。
NEC 將使用 H100 的為筑波大學(xué)計算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計算機。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。
與此同時,Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。
他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載。”
-
處理器
+關(guān)注
關(guān)注
68文章
19293瀏覽量
229977 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4990瀏覽量
103120 -
軟件
+關(guān)注
關(guān)注
69文章
4953瀏覽量
87561 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8893瀏覽量
137465
發(fā)布評論請先 登錄
相關(guān)推薦
評論