0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA BlueField DPU提高 HPC 應用程序性能和可擴展性

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-10-12 10:04 ? 次閱讀

超級計算機用于建模和模擬科學計算中最復雜的過程,通常是為了洞察新發(fā)現(xiàn),否則這些新發(fā)現(xiàn)在物理上是不切實際的或不可能演示的。

NVIDIA BlueField DPU(數(shù)據(jù)處理器)正在將高性能計算(HPC)資源轉(zhuǎn)化為更高效的系統(tǒng),同時在從數(shù)學建模和分子動力學到天氣預報、氣候研究,甚至可再生能源的廣泛科學研究中加速解決問題。

BlueField 已經(jīng)在云網(wǎng)絡(luò)、網(wǎng)絡(luò)安全、通信和邊緣計算領(lǐng)域產(chǎn)生了顯著影響。此外,在高性能計算的多個領(lǐng)域引發(fā)了應用程序性能和系統(tǒng)效率方面的創(chuàng)新。

NVIDIA BlueField-3 提供了強大的計算能力,其基于多個 Arm AArch64 內(nèi)核、多線程數(shù)據(jù)路徑加速器、集成的 NVIDIA ConnectX-7 400Gb/s 網(wǎng)絡(luò) ,以及 I/O 路徑中的各種可編程加速引擎。它配備了雙 DDR 6500MT / s DRAM 控制器,并配有高達 32 GB 的板載內(nèi)存。BlueField-3 是第三代片上數(shù)據(jù)中心基礎(chǔ)設(shè)施,可實現(xiàn)從云到核心數(shù)據(jù)中心再到邊緣的、高效且強大的軟件定義、硬件加速基礎(chǔ)設(shè)施。

那么,這一切對高性能計算意味著什么呢?

提高 HPC 應用程序性能和可擴展性

HPC 就是為了提高性能和可擴展性。近二十年來,InfiniBand 網(wǎng)絡(luò)在性能和應用程序可擴展性方面一直處于領(lǐng)先地位,這有幾個原因。

從高層次來看,InfiniBand 只是最有效的數(shù)據(jù)移動方式:直接數(shù)據(jù)放置。在數(shù)據(jù)從網(wǎng)絡(luò)接口通過系統(tǒng)到達需要它的實際應用程序時,無需涉及 CPU操作系統(tǒng),也無需制作數(shù)據(jù)的多個副本。

如果 InfiniBand 已經(jīng)如此高效,BlueField 會帶來什么好處?

InfiniBand 多年來一直在解決的關(guān)鍵挑戰(zhàn)之一是將網(wǎng)絡(luò)通信開銷從 CPU 移開,使其能夠?qū)r間集中在最擅長的事情上:應用程序計算和分支代碼。

當今主流服務(wù)器中的 CPU 過于通用,在數(shù)百或數(shù)千個與實際計算幾乎無關(guān)的進程中共享其計算周期、時間和資源。

BlueField 通過卸載、加速和隔離廣泛的高級網(wǎng)絡(luò)、存儲和安全服務(wù),為超級計算帶來了前所未有的創(chuàng)新和效率。

為什么人工智能時代帶來了

對 BlueField DPU 的需求

人工智能研究領(lǐng)域作為一門學科于 1956 年成立。甚至在那之前的十年,科學家們就開始討論創(chuàng)造人工大腦的可能性。隨著現(xiàn)代計算機硬件和軟件的發(fā)展,這些概念很晚才成為現(xiàn)實。

2006 年,NVIDIA 推出了業(yè)界首個針對 GPU 的 C 編譯器開發(fā)環(huán)境 CUDA ,解決復雜計算問題的速度比傳統(tǒng)方法快 100 倍。今天,人工智能成果豐碩,幾乎推動了科學研究的每個領(lǐng)域,改變了我們的生活,塑造了工業(yè)格局。

同樣, 2006 年年中推出了用于非阻塞集合操作的首個提案。為消息傳遞接口(MPI)的集合組通信功能而提出的非阻塞接口在理論上肯定是成效斐然的。然而,它并沒有在許多應用程序中實現(xiàn)。也許這是因為,在引入 DPU 之前,無法實現(xiàn)全部好處。

今天,隨著 BlueField-3 的問世,這項技術(shù)已經(jīng)提供了創(chuàng)新、性能和效率所需的基本要素。為了提高應用程序性能和可伸縮性,并消除操作系統(tǒng)抖動的影響,非阻塞集合操作重新引起了人們的興趣。

科學計算還有幾個領(lǐng)域,包括早期的例子,BlueField 正在展示其如何將 HPC 轉(zhuǎn)化為高效和可持續(xù)的計算。

通過網(wǎng)絡(luò)計算節(jié)省 CPU 周期

NVIDIA 的 Scalable Hierarchical Aggregation and Reduction Protocol(SHARP)技術(shù)通過將許多阻塞集體操作從 CPU 卸載到交換網(wǎng)絡(luò),且無需在端點之間多次發(fā)送數(shù)據(jù),從而提高了 MPI 操作的性能。這種創(chuàng)新的方法減少了到達聚合節(jié)點時穿越網(wǎng)絡(luò)的數(shù)據(jù)量,并大大減少了 MPI 操作時間。

BlueField 通過利用其 Arm 內(nèi)核實現(xiàn)非阻塞操作,擴展了額外的網(wǎng)絡(luò)計算能力。這使系統(tǒng)主機 CPU 能夠執(zhí)行峰值重疊計算。

圖 2 顯示了一個使用 MVAPICH2- DPU 庫的示例,該庫正在進行優(yōu)化,以充分利用 BlueField 的全部潛力。它顯示了提取主機上發(fā)生的計算與 MPI_Ialltoall 通信之間的峰值重疊的能力。

適用于 HPC 工作負載的計算存儲

計算存儲(或稱為存儲計算)為傳統(tǒng)存儲設(shè)備帶來了 HPC 功能。在計算存儲中,您可以在存儲設(shè)備內(nèi)或旁邊執(zhí)行選定的計算任務(wù),從而減輕主機處理負擔并減少數(shù)據(jù)移動。BlueField 提供在單卡上結(jié)合存儲和網(wǎng)絡(luò)計算的能力。

BlueField 使存儲軟件堆棧能夠從計算節(jié)點卸載,同時還可作為網(wǎng)絡(luò)架構(gòu)附加 NVMe 控制器,能夠加速關(guān)鍵存儲功能,如壓縮、校驗和計算以及奇偶校驗生成。此類服務(wù)在并行文件系統(tǒng)中提供。

整個存儲系統(tǒng)堆棧在 Linux 內(nèi)核中透明卸載,同時在 NVMe 目標端由 NVIDIA DOCA 簡單實現(xiàn)標準存儲功能。

新一代開放存儲架構(gòu)為加速、隔離和保護高性能存儲系統(tǒng)提供了一種新的范例。該系統(tǒng)采用硬件和軟件協(xié)同設(shè)計,使 DPU 對用戶來說非常高效和透明。

文件系統(tǒng)的加速意味著提高存儲系統(tǒng)中關(guān)鍵功能的性能,而存儲系統(tǒng)性能是基于深入學習的科學探究的關(guān)鍵促成因素。

將存儲客戶端和服務(wù)器完全卸載到 DPU 的能力帶來以前無法實現(xiàn)的安全和性能隔離級別。關(guān)鍵數(shù)據(jù)平面和控制平面功能移動到 DPU 上的單獨域。這樣可以免除服務(wù)器 CPU 的工作負擔,并在 CPU 或其軟件受損的情況下保護功能。

NVIDIA DOCA 軟件框架

NVIDIA DOCA SDK 是釋放 BlueField 潛力的關(guān)鍵。NVIDIA DOCA 和 BlueField DPU 通過一個全面、開放的開發(fā)平臺,共同實現(xiàn)了應用程序的開發(fā),這些應用程序可以提供突破性的網(wǎng)絡(luò)、安全、存儲和應用程序性能。

NVIDIA DOCA 支持一系列操作系統(tǒng)和發(fā)行版,包括驅(qū)動程序、庫、工具、文檔和示例應用程序。即將發(fā)布的 NVIDIA DOCA 1.5 和 2.0 版本引入了廣泛的網(wǎng)絡(luò)、存儲、安全功能和增強功能,為 HPC 開發(fā)人員提供突破性的性能和高級編程能力:

全新的通信通道庫

快速訪問主機內(nèi)存以實現(xiàn) UCX 加速

存儲仿真(SNAP),包括存儲加密

全新的 NVIDIA DOCA 服務(wù),包括 UCC 卸載服務(wù)和遙測服務(wù)

NVIDIA DOCA 安全 SDK

改變 HPC 領(lǐng)域的今天和明天

許多創(chuàng)新領(lǐng)域已經(jīng)初露端倪,BlueField DPU 、NVIDIA DOCA 以及社區(qū)將繼續(xù)為 HPC 領(lǐng)域帶來改變。

有些想法已經(jīng)實現(xiàn)了,例如在數(shù)據(jù)中心范圍內(nèi)增強性能隔離,或增強作業(yè)調(diào)度程序以實現(xiàn)更智能的作業(yè)安排。

由于科學應用程序通常是高度同步的,因此系統(tǒng)噪聲對大型 HPC 系統(tǒng)的負面影響可能會對性能產(chǎn)生更大的影響。減少存儲等其他過程引起的系統(tǒng)噪音至關(guān)重要。

遙測信息功能強大。它不僅僅是收集有關(guān)路由器、交換機和網(wǎng)絡(luò)流量的信息。相反,可以通過工作負載和 I/O 特性收集和共享信息。

AI 框架精確地調(diào)整了 NVIDIA Quantum-2 InfiniBand 平臺中的性能隔離算法。共享公共數(shù)據(jù)中心資源(如網(wǎng)絡(luò)和存儲)的多應用程序環(huán)境可以確保能實現(xiàn)的最佳性能,就像應用程序作為單個實例在裸機上運行一樣。

BlueField DPU 完全有能力應對大規(guī)模計算帶來的挑戰(zhàn)。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4996

    瀏覽量

    103211
  • 網(wǎng)絡(luò)安全
    +關(guān)注

    關(guān)注

    10

    文章

    3173

    瀏覽量

    59877
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    364

    瀏覽量

    24207
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    316

    瀏覽量

    23808
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3783

    瀏覽量

    91239

原文標題:借助 DPU 開啟 HPC 和超級計算性能的新時代

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    擴展您的Chart FX應用程序:標準化升級適應更多領(lǐng)域

    擴展性基礎(chǔ)設(shè)施標準化升級后,將會帶來更好的集成體驗和更輕松的Chart FX擴展部署。這些Chart FX擴展是.NET程序集,允許Chart FX快速有效地適應實時、金融、統(tǒng)計、地圖
    的頭像 發(fā)表于 12-31 09:42 ?69次閱讀
    <b class='flag-5'>擴展</b>您的Chart FX<b class='flag-5'>應用程序</b>:標準化升級適應更多領(lǐng)域

    Perforce Helix Core通過ISO 26262認證!為汽車軟件開發(fā)團隊提供無限擴展性、細粒度安全性、文件快速訪問等

    News!Helix Core通過ISO 26262認證,符合汽車系統(tǒng)開發(fā)所需的安全和可靠性標準,助力汽車軟件安全合規(guī)!具備無限擴展性、細粒度安全性、文件快速訪問...是眾多汽車OEM和供應商的首選版本控制工具。
    的頭像 發(fā)表于 11-12 14:41 ?841次閱讀
    Perforce Helix Core通過ISO 26262認證!為汽車軟件開發(fā)團隊提供無限<b class='flag-5'>可</b><b class='flag-5'>擴展性</b>、細粒度安全性、文件快速訪問等

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 軟件平臺釋放了 NVIDIA BlueField 網(wǎng)絡(luò)平臺的潛力,并為NVIDIA BlueField和Connec
    的頭像 發(fā)表于 11-09 13:50 ?284次閱讀

    使用HIC啟用外圍擴展應用程序應用說明

    電子發(fā)燒友網(wǎng)站提供《使用HIC啟用外圍擴展應用程序應用說明.pdf》資料免費下載
    發(fā)表于 09-14 09:44 ?0次下載
    使用HIC啟用外圍<b class='flag-5'>擴展</b><b class='flag-5'>應用程序</b>應用說明

    NVIDIA JetPack 6.0版本的關(guān)鍵功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構(gòu)建端到端加速 AI 應用提供全面的解決方案。JetPack 6 通過微服務(wù)和一系列新功能,擴展了 Jetson 平臺的靈活性和
    的頭像 發(fā)表于 09-09 10:18 ?446次閱讀
    <b class='flag-5'>NVIDIA</b> JetPack 6.0版本的關(guān)鍵功能

    使用低成本MSPM0 MCU在無線電動工具和園藝工具中實現(xiàn)擴展性

    電子發(fā)燒友網(wǎng)站提供《使用低成本MSPM0 MCU在無線電動工具和園藝工具中實現(xiàn)擴展性.pdf》資料免費下載
    發(fā)表于 09-02 11:47 ?2次下載
    使用低成本MSPM0 MCU在無線電動工具和園藝工具中實現(xiàn)<b class='flag-5'>可</b><b class='flag-5'>擴展性</b>

    NVIDIA BlueField-3 DPU助力思科提高工作負載安全性和運營效率

    、位置和外形尺寸的應用程序工作負載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,將企業(yè)的安全性和運營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentation)提供了更大的靈活性。它現(xiàn)在還擴展
    的頭像 發(fā)表于 06-27 17:31 ?776次閱讀

    借助NVIDIA DOCA 2.7增強AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高
    的頭像 發(fā)表于 05-29 09:22 ?507次閱讀

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    芯片標志著 NVIDIA 在高性能計算、優(yōu)化連接性和擴展性領(lǐng)域的重大進展。 7. 網(wǎng)絡(luò)技術(shù) GB200 集成了 NVIDIA 的最新網(wǎng)絡(luò)技
    發(fā)表于 05-13 17:16

    英業(yè)達推出 P8000IG6 - 為AI和HPC工作負載的最先進平臺

    基于 NVIDIA? HGX??人工智能(AI)超級計算平臺所構(gòu)建的服務(wù)器,旨在實現(xiàn)高靈活性和擴展性,協(xié)助數(shù)據(jù)中心能夠針對最先進的工作負載快速、無縫地進行擴展。 臺北2024年4月8
    的頭像 發(fā)表于 04-08 16:28 ?615次閱讀

    NVIDIA推出GB200 NVL72液冷系統(tǒng)的大型集群

    現(xiàn)代數(shù)據(jù)中心的設(shè)計與建設(shè),無疑是一項兼具挑戰(zhàn)與機遇的復雜任務(wù),需要在性能、能效與擴展性等多個維度進行深思熟慮。作為業(yè)界翹楚,NVIDIA始終致力于探索數(shù)據(jù)中心的前沿技術(shù)。
    的頭像 發(fā)表于 03-27 10:14 ?779次閱讀

    NVIDIA Blackwell DGX SuperPOD助力萬億級生成式AI計算

    全新 DGX SuperPOD 采用新型高效液冷機架級擴展架構(gòu),基于 NVIDIA DGX GB200 系統(tǒng)構(gòu)建而成,在 FP4 精度下可提供 11.5 exaflops 的 AI 超級計算性能和 240 TB 的快速顯存,且可
    發(fā)表于 03-21 09:49 ?225次閱讀

    基于NVIDIA DOCA 2.6實現(xiàn)高性能和安全的AI云設(shè)計

    網(wǎng)絡(luò)平臺上快速創(chuàng)建應用程序和服務(wù),并啟用 NVIDIA BlueField DPUNVIDIA
    的頭像 發(fā)表于 02-23 10:02 ?482次閱讀

    什么是HPC性能計算

    性能計算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計算機技術(shù),通過合理地組織計算機資源以及運用適合的算法和程序,提高計算效率和處理能
    的頭像 發(fā)表于 02-19 13:27 ?878次閱讀
    什么是<b class='flag-5'>HPC</b>高<b class='flag-5'>性能</b>計算

    分布式大屏控制系統(tǒng)的擴展性設(shè)計

    分布式大屏控制系統(tǒng)的擴展性設(shè)計是確保系統(tǒng)能夠適應不斷增長的需求和未來發(fā)展的關(guān)鍵因素。以下是擴展性設(shè)計的幾個方面: 模塊化設(shè)計:將系統(tǒng)劃分為多個模塊,每個模塊具有獨立的功能和接口。這
    的頭像 發(fā)表于 01-29 14:46 ?604次閱讀