0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA BlueField DPU將加速計(jì)算提升到新的水平

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-06-01 10:29 ? 次閱讀

全球的超級計(jì)算中心都在紛紛利用 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上的 NVIDIA BlueField DPU 將加速計(jì)算提升到一個(gè)新的水平。

在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強(qiáng)大功能為超級計(jì)算機(jī)提供強(qiáng)大助力。

美國洛斯阿拉莫斯國家實(shí)驗(yàn)室(LANL)正在與 NVIDIA 進(jìn)行一項(xiàng)為期多年的廣泛合作,這項(xiàng)合作旨在將計(jì)算型多物理應(yīng)用的性能提高 30 倍。

LANL 研究人員預(yù)計(jì),使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運(yùn)行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及 NVIDIA DOCA 軟件框架在計(jì)算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。

面向 DPU 的開放式 API

這些努力還將有助于進(jìn)一步定義 OpenSNAPI ,任何人都可通過該應(yīng)用接口來控制 DPU 。這是統(tǒng)計(jì)計(jì)算框架(Unified Communication Framework)的一個(gè)項(xiàng)目,Unified Communication Framework 是一個(gè)旨在實(shí)現(xiàn) HPC 應(yīng)用異構(gòu)計(jì)算的聯(lián)盟,成員包括 Arm 、IBM 、NVIDIA 、美國國家實(shí)驗(yàn)室和美國的一些大學(xué)。

LANL 已經(jīng)感受到網(wǎng)絡(luò)計(jì)算的強(qiáng)大功能,這要?dú)w功于其創(chuàng)建的 DPU 賦能的存儲系統(tǒng)。

加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類存儲系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。

一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計(jì)算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?/p>

德克薩斯州打造出云原生超級計(jì)算平臺

德克薩斯高級計(jì)算中心(TACC)近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2 。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計(jì)算的開發(fā)平臺。

TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。

MPI 獲得加速

在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個(gè) HPC 熱門編程模型的運(yùn)行速度提高 26%。

他們通過卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了 P3DFFT ,這是一個(gè)用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。

俄亥俄州立大學(xué)計(jì)算機(jī)科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團(tuán)隊(duì)推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因?yàn)樗鼈兛梢约铀龠\(yùn)行各種工作負(fù)載?!?/p>

HPC 中心和云中的 DPU

對于運(yùn)行藥物研發(fā)或飛機(jī)設(shè)計(jì)等 HPC 仿真應(yīng)用的超級計(jì)算機(jī)而言,高達(dá)兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個(gè) HPC 中心的代碼請求。

Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。

他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計(jì)算,而 InfiniBand 已經(jīng)在為它提供支持?!?/p>

達(dá)勒姆開發(fā)負(fù)載均衡

歐洲的多個(gè)研究團(tuán)隊(duì)正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。

例如,英格蘭北部的達(dá)勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個(gè)節(jié)點(diǎn)的 Dell PowerEdge 集群上使用 BlueField DPU 以實(shí)現(xiàn) MPI 作業(yè)的負(fù)載均衡。該項(xiàng)目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。

劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用

劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU 。

倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動數(shù)據(jù),以便在需要時(shí)數(shù)據(jù)已然就位。

Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機(jī) CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。

與此同時(shí),慕尼黑工業(yè)大學(xué)計(jì)算機(jī)體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項(xiàng)目的一部分。

在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實(shí)驗(yàn)室合作,利用 BlueField-2 DPU 加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達(dá) 20% ,且不會損失模擬的準(zhǔn)確性。

不斷擴(kuò)展的網(wǎng)絡(luò)

本月早些時(shí)候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。

NEC 將使用 H100 的為筑波大學(xué)計(jì)算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計(jì)算機(jī)。研究人員將使用該系統(tǒng)實(shí)現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。

與此同時(shí),Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。

他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載?!?/p>

原文標(biāo)題:ISC22 | HPC 研究人員借助 NVIDIA BlueField DPU 為網(wǎng)絡(luò)計(jì)算的未來打下堅(jiān)實(shí)基礎(chǔ)

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5052

    瀏覽量

    103361
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    451

    瀏覽量

    38840
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    365

    瀏覽量

    24218

原文標(biāo)題:ISC22 | HPC 研究人員借助 NVIDIA BlueField DPU 為網(wǎng)絡(luò)計(jì)算的未來打下堅(jiān)實(shí)基礎(chǔ)

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA BlueField-3 DPU上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢

    WEKA是可擴(kuò)展軟件定義數(shù)據(jù)平臺的先驅(qū),NVIDIA 正在與其合作, WEKA 先進(jìn)的數(shù)據(jù)平臺解決方案與功能強(qiáng)大的NVIDIA BlueField
    的頭像 發(fā)表于 01-07 09:43 ?147次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField</b>-3 <b class='flag-5'>DPU</b>上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,提升產(chǎn)品競爭力。
    的頭像 發(fā)表于 12-27 16:24 ?189次閱讀

    NVIDIA加速計(jì)算如何推動醫(yī)療健康

    近日,NVIDIA 企業(yè)平臺副總裁 Bob Pette 在 AI Summit 一場演講中重點(diǎn)談?wù)摿?NVIDIA 加速計(jì)算如何推動醫(yī)療健康、網(wǎng)絡(luò)安全和制造等行業(yè)實(shí)現(xiàn)轉(zhuǎn)型。他表示,
    的頭像 發(fā)表于 11-20 09:10 ?318次閱讀

    ADS1298SPI提升到更高頻率無法讀取任何信息,為什么?

    ,通過DRDY引腳的外部中斷中能正確的讀取測量的數(shù)據(jù)。最多能實(shí)現(xiàn)2KHz的數(shù)據(jù)采集。 現(xiàn)在要將數(shù)據(jù)采集率設(shè)置為8KHz,1MHz的SPI不夠用了。我嘗試SPI的時(shí)鐘頻率提升到2,4,8,10MHz4個(gè)
    發(fā)表于 11-18 06:25

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫,是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺,適用于金融、電力
    的頭像 發(fā)表于 09-09 09:57 ?498次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平臺<b class='flag-5'>提升</b><b class='flag-5'>計(jì)算</b>性能

    NVIDIA BlueField-3 DPU助力思科提高工作負(fù)載安全性和運(yùn)營效率

    、位置和外形尺寸的應(yīng)用程序工作負(fù)載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,企業(yè)的安全性和運(yùn)營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentat
    的頭像 發(fā)表于 06-27 17:31 ?795次閱讀

    基于ESP32S進(jìn)行BLE MESH開發(fā),基于的是BLE4.2,是否可以提升到BLE5.0?

    1.現(xiàn)在基于ESP32S進(jìn)行BLE MESH開發(fā),基于的是BLE4.2,是否可以提升到BLE5.0? 2.BLE4.2是否可以接收到BLE5.0 Beacon?Code: Select all
    發(fā)表于 06-12 07:49

    借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動和 API,以便為 NVIDIA BlueField DPU 和 SuperNI
    的頭像 發(fā)表于 05-29 09:22 ?523次閱讀

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計(jì)算中心提供加速

    德國、日本和波蘭的超級計(jì)算機(jī)利用 Grace-Hopper 和量子-經(jīng)典加速超算平臺推進(jìn)量子計(jì)算研究 ? ? 德國漢堡 —— 國際超算大會(ISC)—— 2024 年 5 月 13 日
    發(fā)表于 05-13 15:21 ?211次閱讀
    <b class='flag-5'>NVIDIA</b> 通過 CUDA-Q 平臺為全球各地的量子<b class='flag-5'>計(jì)算</b>中心提供<b class='flag-5'>加速</b>

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?776次閱讀

    測試提升到一個(gè)新的水平

    《半導(dǎo)體芯科技》雜志文章 SPEA公司半導(dǎo)體和MEMS測試業(yè)務(wù)部副總裁Emanuele Bardo與Silicon Semiconductor編輯Philip Alsop討論了該公司與半導(dǎo)體行業(yè)相關(guān)的自動測試設(shè)備專業(yè)知識,重點(diǎn)介紹了技術(shù)創(chuàng)新以及公司的未來增長計(jì)劃。 SPEA于1976年在意大利北部成立。創(chuàng)始人曾在著名的意大利公司Olivetti工作,后來在通用電氣工作,然后創(chuàng)立了SPEA。最初的業(yè)務(wù)與ICT測試儀的生產(chǎn)有關(guān)——用于組裝好的PCBA板的測試。 1993年,SPEA生產(chǎn)了第一臺半導(dǎo)體測試儀,一年后投入市場。作
    的頭像 發(fā)表于 04-09 17:13 ?351次閱讀
    <b class='flag-5'>將</b>測試<b class='flag-5'>提升到</b>一個(gè)新的<b class='flag-5'>水平</b>

    Cadence與NVIDIA聯(lián)合推出利用加速計(jì)算和生成式AI重塑設(shè)計(jì)

    中國上海,2024 年 3 月 25 日——楷登電子(美國 Cadence 公司,NASDAQ:CDNS)近日宣布,公司深化與 NVIDIA 在 EDA、系統(tǒng)設(shè)計(jì)與分析、數(shù)字生物學(xué)和人工智能領(lǐng)域的多年合作,推出兩款變革性解決方案,利用
    的頭像 發(fā)表于 03-25 14:36 ?640次閱讀

    NVIDIA發(fā)布專為大規(guī)模AI量身訂制的全新網(wǎng)絡(luò)交換機(jī)-X800系列

    NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)和 NVIDIA Spectrum?-X800 以太網(wǎng)絡(luò)是全球首批高達(dá) 800Gb/s 端到端吞吐量的網(wǎng)絡(luò)平臺,將計(jì)算和 AI 工作負(fù)載的網(wǎng)絡(luò)性能
    的頭像 發(fā)表于 03-20 09:54 ?535次閱讀

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計(jì)

    作為專為 NVIDIA? BlueField? 網(wǎng)絡(luò)平臺而設(shè)計(jì)的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標(biāo)準(zhǔn) API 在
    的頭像 發(fā)表于 02-23 10:02 ?505次閱讀

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學(xué)習(xí)模型,并借助NVIDIA Triton推理服務(wù)器在NVIDIA V1
    的頭像 發(fā)表于 01-17 09:30 ?727次閱讀