結(jié)合全新 NVLink Switch系統(tǒng),每臺 DGX SuperPOD 可提供 1 Exaflops 的 AI 性能;全新 NVIDIA Eos 超級計(jì)算機(jī)有望成為全球運(yùn)行速度最快的 AI 系統(tǒng);通過擴(kuò)展的 DGX Foundry 服務(wù)即刻助力客戶啟程。
加利福尼亞州圣克拉拉市 —— GTC 大會 —— 太平洋時(shí)間 2022 年 3 月 22 日 —— NVIDIA 今日宣布推出第四代 NVIDIA? DGX? 系統(tǒng),這是全球首個基于全新 NVIDIA H100 Tensor Core GPU 的 AI 平臺。
DGX H100 系統(tǒng)能夠滿足大型語言模型、推薦系統(tǒng)、醫(yī)療健康研究和氣候科學(xué)的大規(guī)模計(jì)算需求。每個 DGX H100 系統(tǒng)配備八塊 NVIDIA H100 GPU,并由 NVIDIA NVLink? 連接,能夠在新的 FP8 精度下達(dá)到 32 Petaflop 的 AI 性能,比上一代系統(tǒng)性能高 6 倍。
DGX H100 系統(tǒng)是新一代 NVIDIA DGX POD? 和 NVIDIA DGX SuperPOD? AI 基礎(chǔ)設(shè)施平臺的構(gòu)建模塊。新的 DGX SuperPOD 架構(gòu)采用了一個全新的 NVIDIA NVLink Switch 系統(tǒng),通過這一系統(tǒng)最多可連接 32 個節(jié)點(diǎn),總計(jì) 256 塊 H100 GPU。
新一代 DGX SuperPOD 提供 1 Exaflops 的 FP8 AI 性能,比上一代產(chǎn)品性能高 6 倍,能夠運(yùn)行具有數(shù)萬億參數(shù)的龐大 LLM 工作負(fù)載,從而推動 AI 的前沿發(fā)展。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI 已經(jīng)從根本上改變了軟件的功能和產(chǎn)出方式。利用 AI 來革新自身所處行業(yè)的公司也意識到了自身 AI 基礎(chǔ)設(shè)施的重要性。NVIDIA 全新 DGX H100 系統(tǒng)將賦能企業(yè) AI 工廠,助力其從數(shù)據(jù)中提煉出我們最具價(jià)值的資源,即‘智能’?!?/p>
宣布推出全球運(yùn)行速度最快的 AI 超級計(jì)算機(jī) —— NVIDIA Eos
NVIDIA 將率先使用突破性的新型 AI 架構(gòu)來構(gòu)建 DGX SuperPOD,賦能 NVIDIA 研究人員的研究工作,推動氣候科學(xué)、數(shù)字生物學(xué)和 AI 未來的發(fā)展。
“Eos”超級計(jì)算機(jī)將于今年晚些時(shí)候開始運(yùn)行,共配備 576 臺 DGX H100 系統(tǒng),共計(jì) 4608 塊 DGX H100 GPU,有望成為全球運(yùn)行速度最快的 AI 系統(tǒng)。
NVIDIA Eos 預(yù)計(jì)將提供 18.4 Exaflops 的 AI 計(jì)算性能,比日本的 Fugaku 超級計(jì)算機(jī)快 4 倍,后者是目前運(yùn)行速度最快的系統(tǒng)。在傳統(tǒng)的科學(xué)計(jì)算方面,Eos 預(yù)計(jì)將提供 275 Petaflop 的性能。
對于 NVIDIA 及其 OEM 和云計(jì)算合作伙伴,Eos 將成為其先進(jìn) AI 基礎(chǔ)設(shè)施的藍(lán)圖。
借助 DGX H100 系統(tǒng)、DGX POD 和 DGX SuperPOD,輕松擴(kuò)展企業(yè)級 AI
在企業(yè)從初始項(xiàng)目發(fā)展到廣泛部署的過程中,DGX H100 系統(tǒng)能夠?qū)崿F(xiàn)輕松擴(kuò)展,滿足企業(yè)的 AI 需求。
除了八塊 H100 GPU 以及總計(jì) 6400 億個晶體管之外,每個 DGX H100 系統(tǒng)還包含兩個 NVIDIA BlueField?-3 DPU,以用于卸載、加速和隔離高級網(wǎng)絡(luò)、存儲及安全服務(wù)。
八個 NVIDIA ConnectX?-7 Quantum-2 InfiniBand 網(wǎng)卡能夠提供 400 GB/s 的吞吐量,可用于連接計(jì)算和存儲,這一速度比上一代系統(tǒng)提升了一倍。第四代 NVLink 與 NVSwitch? 相結(jié)合,能夠在每個 DGX H100 系統(tǒng)中的各個 GPU 之間實(shí)現(xiàn) 900 GB/s 的連接速度,是上一代系統(tǒng)的 1.5 倍。
DGX H100 系統(tǒng)使用雙 x86 CPU,能夠與 NVIDIA 網(wǎng)絡(luò)和 NVIDIA 合作伙伴提供的存儲設(shè)備相結(jié)合,使 DGX POD 能夠靈活用于各種規(guī)模的 AI 計(jì)算。
借助 DGX H100 系統(tǒng),DGX SuperPOD 可成為具有可擴(kuò)展性的卓越的企業(yè)級 AI 中心。DGX SuperPOD 中的 DGX H100 節(jié)點(diǎn)和 H100 GPU 由 NVLink Switch 系統(tǒng)和 NVIDIA Quantum-2 InfiniBand 連接,帶寬速度可達(dá) 70 TB/s,比上一代產(chǎn)品高 11 倍。NVIDIA 合作伙伴提供的存儲設(shè)備將經(jīng)過測試和認(rèn)證,以滿足 DGX SuperPOD AI 計(jì)算的需求。
多個 DGX SuperPOD 單元可組合使用,為汽車、醫(yī)療健康、制造、通信、零售等行業(yè)提供開發(fā)大型模型所需的 AI 性能。
NVIDIA DGX Foundry 托管的開發(fā)解決方案正在全球擴(kuò)展,使 DGX SuperPOD 客戶能夠在他們的系統(tǒng)安裝期間,立即獲取先進(jìn)的計(jì)算基礎(chǔ)設(shè)施。北美、歐洲和亞洲的新增地點(diǎn)支持遠(yuǎn)程訪問 DGX SuperPOD(或其中部分)。
DGX Foundry 中包含 NVIDIA Base Command? 軟件,后者能夠使客戶基于 DGX SuperPOD 基礎(chǔ)設(shè)施,輕松管理端到端 AI 開發(fā)生命周期。
通過在全球各地的 Equinix IBX? (International Business Exchange? ) 數(shù)據(jù)中心托管的 NVIDIA LaunchPad 實(shí)驗(yàn)室,符合資格的企業(yè)可以免費(fèi)體驗(yàn) NVIDIA Base Command 和 DGX 系統(tǒng)。
企業(yè)級 AI 軟件 MLOps 助力客戶提高 AI 采用率
為支持正在進(jìn)行 AI 開發(fā)的 DGX 客戶,NVIDIA DGX-Ready 軟件合作伙伴(包括 Domino Data Lab、Run:ai 和 Weights & Biases 等)提供的 MLOps 解決方案將加入“NVIDIA AI 加速”計(jì)劃。
參與活動的合作伙伴提供的 MLOps 應(yīng)用程序?qū)⒔?jīng)過驗(yàn)證,為 DGX 客戶提供企業(yè)級工作流以及集群管理、調(diào)度與編排解決方案。
此外,NVIDIA DGX 系統(tǒng)現(xiàn)在包含 NVIDIA AI Enterprise 軟件套件,該套件新增了對裸金屬基礎(chǔ)設(shè)施的支持。DGX 客戶可使用軟件套件中包含的預(yù)訓(xùn)練 NVIDIA AI 平臺模型、工具包和框架(例如 NVIDIA RAPIDS?、NVIDIA TAO 工具套件、NVIDIA Triton 推理服務(wù)器? 等)來加快工作速度。
DGX-Ready 托管服務(wù)計(jì)劃能夠簡化 AI 部署
隨著企業(yè) AI 采用率不斷提高,客戶正在尋求更多選擇,以便添加實(shí)現(xiàn)業(yè)務(wù)轉(zhuǎn)型所需的基礎(chǔ)設(shè)施。NVIDIA 推出新的 DGX-Ready 托管服務(wù)計(jì)劃,能夠?yàn)橄Mc服務(wù)提供商開展合作來監(jiān)督其基礎(chǔ)設(shè)施的客戶提供支持。
德勤是率先與 NVIDIA 合作開展此計(jì)劃的全球提供商,并將經(jīng)過認(rèn)證,可與區(qū)域供應(yīng)商(CGit、ePlus、Insight Enterprises 和 PTC System)一起,為歐洲、北美和亞洲的客戶提供支持。
德勤咨詢首席合伙人兼 AI 與數(shù)據(jù)運(yùn)營服務(wù)負(fù)責(zé)人 Jim Rowan 表示:“只有企業(yè)能夠?qū)⒓夹g(shù)集成到運(yùn)營中時(shí),AI 才可能助推業(yè)務(wù)實(shí)現(xiàn)突破。借助新的 DGX-Ready 托管服務(wù)計(jì)劃,客戶可以輕松采用先進(jìn)的 AI 技術(shù)以及由德勤全球?qū)<夜芾淼?NVIDIA DGX 系統(tǒng)和軟件?!?/p>
DGX-Ready 生命周期管理計(jì)劃助力實(shí)現(xiàn)輕松升級
現(xiàn)在,客戶可以通過新的 DGX-Ready 生命周期管理計(jì)劃,借助新的 NVIDIA DGX 平臺升級其現(xiàn)有 DGX 系統(tǒng)。
參加 DGX-Ready 生命周期管理計(jì)劃的 NVIDIA 渠道合作伙伴將可以更新上一代 DGX 系統(tǒng),以供新客戶進(jìn)行購買,并擴(kuò)展用于 AI 基礎(chǔ)設(shè)施的全球通用系統(tǒng)的獲取途徑。
供貨信息
從第三季度起,NVIDIA 的全球合作伙伴將開始供應(yīng) NVIDIA DGX H100 系統(tǒng)、DGX POD 和 DGX SuperPOD。
客戶還可以選擇在由 Cyxtera、Digital Realty 和 Equinix IBX 數(shù)據(jù)中心 等 NVIDIA DGX-Ready 數(shù)據(jù)中心合作伙伴運(yùn)營的托管設(shè)施中部署 DGX 系統(tǒng)。
評論
查看更多