0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 2024-03-21 09:49 ? 次閱讀

NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX SuperPOD。這臺 AI 超級計(jì)算機(jī)可以用于處理萬億參數(shù)模型,能夠保證超大規(guī)模生成式 AI 訓(xùn)練和推理工作負(fù)載的持續(xù)運(yùn)行。

全新 DGX SuperPOD 采用新型高效液冷機(jī)架級擴(kuò)展架構(gòu),基于 NVIDIA DGX GB200 系統(tǒng)構(gòu)建而成,在 FP4 精度下可提供 11.5 exaflops 的 AI 超級計(jì)算性能和 240 TB 的快速顯存,且可通過增加機(jī)架來擴(kuò)展性能。

每個 DGX GB200 系統(tǒng)搭載 36 個 NVIDIA GB200 超級芯片,共包含 36 個 NVIDIA Grace CPU 和 72 個 NVIDIA Blackwell GPU。這些超級芯片通過第五代 NVIDIA NVLink 連接成一臺超級計(jì)算機(jī)。與 NVIDIA H100 Tensor Core GPU 相比,GB200 超級芯片在大語言模型推理工作負(fù)載方面的性能提升了高達(dá) 30 倍。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA DGX AI 超級計(jì)算機(jī)是推進(jìn) AI 產(chǎn)業(yè)變革的工廠。新一代 DGX SuperPOD 集 NVIDIA 加速計(jì)算、網(wǎng)絡(luò)和軟件方面的最新進(jìn)展于一體,能夠幫助每一個企業(yè)、行業(yè)和國家完善并生成自己的 AI?!?/strong>

Grace Blackwell 架構(gòu)的 DGX SuperPOD 由 8 個或以上的 DGX GB200 系統(tǒng)構(gòu)建而成,這些系統(tǒng)通過 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)連接,可擴(kuò)展到數(shù)萬個 GB200 超級芯片。用戶可通過 NVLink 連接 8 個 DGX GB200 系統(tǒng)中的 576 塊 Blackwell GPU,從而獲得海量共享顯存空間,來賦能下一代 AI 模型。

面向生成式 AI 時代的全新機(jī)架級擴(kuò)展的DGX SuperPOD 架構(gòu)

采用 DGX GB200 系統(tǒng)構(gòu)建而成的全新 DGX SuperPOD 采用了統(tǒng)一的計(jì)算網(wǎng)絡(luò)。除第五代 NVIDIA NVLink 網(wǎng)絡(luò)外,還包括 NVIDIA BlueField-3 DPU,并將支持同為今日發(fā)布的 NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)。這個架構(gòu)可為計(jì)算平臺中的每塊 GPU 提供高達(dá)每秒 1800 GB 的帶寬。

另外,第四代 NVIDIA 可擴(kuò)展分層聚合和規(guī)約協(xié)議(SHARP)技術(shù)可提供 14.4 teraflops 的網(wǎng)絡(luò)計(jì)算能力,與上一代產(chǎn)品相比,新一代 DGX SuperPOD 架構(gòu)的網(wǎng)絡(luò)計(jì)算能力提高了 4 倍。

統(tǒng)包式架構(gòu)搭配先進(jìn)的軟件,實(shí)現(xiàn)前所未有的正常運(yùn)行時間

全新 DGX SuperPOD 是一臺完整的數(shù)據(jù)中心級 AI 超級計(jì)算機(jī),在與 NVIDIA 認(rèn)證合作伙伴提供的高性能存儲集成后,能夠滿足生成式 AI 工作負(fù)載的需求。每臺超級計(jì)算機(jī)都在出廠前完成了搭建、布線和測試,從而大大加快了在用戶數(shù)據(jù)中心的部署速度。

Grace Blackwell 架構(gòu)的 DGX SuperPOD 具有智能預(yù)測管理功能,能夠持續(xù)監(jiān)控軟硬件中的數(shù)千個數(shù)據(jù)點(diǎn),通過預(yù)測并攔截導(dǎo)致停機(jī)和低效的根源以節(jié)省時間、能耗和計(jì)算成本。

即使沒有系統(tǒng)管理員在場,該軟件也能識別需要重點(diǎn)關(guān)注的領(lǐng)域并制定維護(hù)計(jì)劃,靈活調(diào)整計(jì)算資源,通過自動保存和恢復(fù)作業(yè)來防止停機(jī)。

如果軟件檢測到需要更換組件,該集群將激活備用容量以確保工作能夠及時完成。為任何必要的硬件更換做好安排,以免出現(xiàn)計(jì)劃之外的停機(jī)。

NVIDIA DGX B200 系統(tǒng)推動各行各業(yè) AI 超級計(jì)算發(fā)展

NVIDIA 還發(fā)布了一款統(tǒng)一用于 AI 模型訓(xùn)練、微調(diào)和推理的通用 AI 超級計(jì)算平臺 NVIDIA DGX B200 系統(tǒng)。

采用風(fēng)冷傳統(tǒng)機(jī)架式設(shè)計(jì)的 DGX 已被全球各行各業(yè)數(shù)千家企業(yè)廣泛采用,DGX B200 是 DGX 系列的第六代產(chǎn)品。采用 Blackwell 架構(gòu)的全新 DGX B200 系統(tǒng)包含 8 個 NVIDIA B200 Tensor Core GPU 和 2 個第五代英特爾至強(qiáng)處理器。用戶還可以使用 DGX B200 系統(tǒng)構(gòu)建 DGX SuperPOD,打造能夠幫助大型開發(fā)團(tuán)隊(duì)運(yùn)行多種不同作業(yè)的 AI 卓越中心。

DGX B200 系統(tǒng)憑借全新 Blackwell 架構(gòu)中的 FP4 精度特性,可提供高達(dá) 144 petaflops 的 AI 性能、1.4TB 海量的 GPU 顯存和 64TB/s 的顯存帶寬,從而使得該系統(tǒng)的萬億參數(shù)模型實(shí)時推理速度比上一代產(chǎn)品提升了 15 倍。

DGX B200 系統(tǒng)包含帶有 8 個 NVIDIA ConnectX-7 網(wǎng)卡和 2 個 BlueField-3 DPU 的高性能網(wǎng)絡(luò),每個連接的帶寬高達(dá) 400 Gb/s,可通過 NVIDIA Quantum-2 InfiniBand 和 NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺支持更高的 AI 性能。

軟件和專家為擴(kuò)大生產(chǎn)級 AI的規(guī)模提供支持

所有 NVIDIA DGX 平臺均包含用于企業(yè)級開發(fā)和部署的 NVIDIA AI Enterprise 軟件。DGX 用戶可以通過使用該軟件平臺中的預(yù)訓(xùn)練的 NVIDIA 基礎(chǔ)模型、框架、工具套件和全新 NVIDIA NIM 微服務(wù)來加速他們的工作。

NVIDIA DGX 專家與部分獲得 NVIDIA DGX 平臺支持認(rèn)證的合作伙伴將在每個部署環(huán)節(jié)為用戶提供幫助,以便其迅速實(shí)現(xiàn) AI 投產(chǎn)。在系統(tǒng)投入運(yùn)行后,DGX 專家還將繼續(xù)協(xié)助用戶優(yōu)化其 AI 管線和基礎(chǔ)設(shè)施。

供應(yīng)情況

NVIDIA 全球合作伙伴預(yù)計(jì)將在今年晚些時候提供基于 DGX GB200 和 DGX B200 系統(tǒng)構(gòu)建而成的 NVIDIA DGX SuperPOD。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5160

    瀏覽量

    104844
  • 超級計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    2

    文章

    465

    瀏覽量

    42182
  • 超級芯片
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    8971
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    522

    瀏覽量

    629
收藏 0人收藏

    評論

    相關(guān)推薦

    NVIDIA GTC2025 亮點(diǎn) NVIDIA推出 DGX Spark個人AI計(jì)算機(jī)

    和聯(lián)想)提供。 NVIDIA 發(fā)布了由 NVIDIA Grace Blackwell 平臺驅(qū)動的 DGX 個人 AI
    的頭像 發(fā)表于 03-20 18:59 ?507次閱讀
    <b class='flag-5'>NVIDIA</b> GTC2025 亮點(diǎn)  <b class='flag-5'>NVIDIA</b><b class='flag-5'>推出</b> <b class='flag-5'>DGX</b> Spark個人AI計(jì)算機(jī)

    NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief

    NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief
    的頭像 發(fā)表于 03-20 18:35 ?162次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構(gòu)技術(shù)解析

    NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell 架構(gòu)技術(shù)解析
    的頭像 發(fā)表于 03-20 17:19 ?196次閱讀

    NVIDIA 宣布推出 DGX Spark 個人 AI 計(jì)算機(jī)

    臺式超級計(jì)算機(jī)由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計(jì)算機(jī)制造商(包括華碩、Dell Technolog
    發(fā)表于 03-19 09:59 ?177次閱讀
       <b class='flag-5'>NVIDIA</b> 宣布<b class='flag-5'>推出</b> <b class='flag-5'>DGX</b> Spark 個人 AI 計(jì)算機(jī)

    MediaTek與NVIDIA攜手設(shè)計(jì)GB10 Grace Blackwell超級芯片

    MediaTek與NVIDIA近日宣布了一項(xiàng)重要合作,雙方將共同設(shè)計(jì)NVIDIA GB10 Grace Blackwell
    的頭像 發(fā)表于 01-13 10:48 ?330次閱讀

    MediaTek與NVIDIA攜手打造超級芯片

    近日,在即將舉行的CES2025消費(fèi)電子展上,MediaTek宣布了一項(xiàng)重大合作——與NVIDIA共同設(shè)計(jì)NVIDIA GB10 Grace Bla
    的頭像 發(fā)表于 01-10 13:49 ?307次閱讀

    MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級芯片

    MediaTek近日正式宣布與NVIDIA攜手合作,共同設(shè)計(jì)NVIDIA GB10 Grace Blackwell
    的頭像 發(fā)表于 01-08 15:32 ?507次閱讀

    NVIDIA推出個人AI超級計(jì)算機(jī)Project DIGITS

    NVIDIA 推出個人 AI 超級計(jì)算機(jī) NVIDIA Project DIGITS,全球的 AI 研究員、數(shù)據(jù)科學(xué)家和學(xué)生都可獲取 NVIDIA
    的頭像 發(fā)表于 01-08 11:03 ?551次閱讀

    聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個人AI超級計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級
    的頭像 發(fā)表于 01-07 16:26 ?342次閱讀

    Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

    ,宣布推出高性能的SuperCluster。這一端對端AI數(shù)據(jù)中心解決方案采用NVIDIA Blackwell平臺,專為兆級參數(shù)規(guī)模的生成式AI時代所設(shè)計(jì)。全新SuperCluster將可大幅增加液冷
    發(fā)表于 11-25 10:39 ?608次閱讀
    Supermicro<b class='flag-5'>推出</b>直接液冷優(yōu)化的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b>解決方案

    NVIDIA助力丹麥發(fā)布首臺AI超級計(jì)算機(jī)

    這臺丹麥最大的超級計(jì)算機(jī)由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級計(jì)算機(jī)。
    的頭像 發(fā)表于 10-27 09:42 ?649次閱讀

    NVIDIA GB200芯片產(chǎn)能受挫,股價遭遇重挫

    近日,全球圖形處理器(GPU)巨頭NVIDIA遭遇了前所未有的產(chǎn)能挑戰(zhàn),其備受矚目的GB200系列芯片預(yù)計(jì)產(chǎn)量大幅低于市場預(yù)期,這一消息如同重錘般擊中了投資者信心,導(dǎo)致公司股價在美股市場經(jīng)歷了一場劇烈震蕩。
    的頭像 發(fā)表于 08-08 10:33 ?888次閱讀

    NVIDIA GB200超級芯片引領(lǐng)液冷散熱新紀(jì)元

    ,特別是其單顆B200芯片功耗高達(dá)1000W,以及由一顆Grace CPU與兩顆Blackwell GPU組成的超級
    的頭像 發(fā)表于 08-01 16:35 ?1461次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    解決方案——DGX SuperPOD?。每個采用液冷技術(shù)的機(jī)架配備36個NVIDIA GB200 Grace
    發(fā)表于 05-13 17:16

    英偉達(dá)Blackwell平臺網(wǎng)絡(luò)配置分析

    采用 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD 專為訓(xùn)練和推理萬億參數(shù)生成式AI 模型而構(gòu)建。
    的頭像 發(fā)表于 04-17 11:01 ?1883次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品