0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時代

向上 ? 來源:英偉達(dá) ? 作者:英偉達(dá) ? 2025-03-20 15:35 ? 次閱讀

加速訓(xùn)練和測試時擴(kuò)展推理,加速 AI 推理、代理式 AI 和物理 AI。

? 全球領(lǐng)先計(jì)算機(jī)制造商、云服務(wù)提供商和 GPU 云供應(yīng)商將強(qiáng)化訓(xùn)練和測試時擴(kuò)展推理能力,從邏輯推理到代理式 AI和物理 AI。
? 全新開源的 NVIDIA Dynamo 推理軟件,通過顯著提升吞吐量、更快的響應(yīng)速度以及降低總體擁有成本(TCO),實(shí)現(xiàn)推理 AI 服務(wù)的規(guī)?;瘮U(kuò)展。
? NVIDIA Spectrum-X 增強(qiáng)型 800G 以太網(wǎng)網(wǎng)絡(luò),為 AI 基礎(chǔ)設(shè)施顯著降低延遲和抖動。

NVIDIA 推出 NVIDIA BlackwellAI 工廠平臺的新一代產(chǎn)品 —— NVIDIA Blackwell Ultra,開啟了 AI 推理新時代。

NVIDIA Blackwell Ultra 提升了訓(xùn)練和測試時擴(kuò)展推理能力(test-time scaling inference), 即通過在推理過程中增加計(jì)算量來提升準(zhǔn)確率的技術(shù),以幫助全球各地的企業(yè)加速AI推理、代理式AI及物理AI等應(yīng)用的開發(fā)與部署。

基于一年前推出的突破性的 Blackwell 架構(gòu),Blackwell Ultra 包括 NVIDIA GB300 NVL72 機(jī)架級解決方案和 NVIDIA HGX? B300 NVL16 系統(tǒng)。 GB300 NVL72 的 AI 性能是NVIDIA GB200 NVL72 的 1.5 倍,這使得建造 AI 工廠 的收入機(jī)會與基于NVIDIA Hopper?構(gòu)建的系統(tǒng)相比增加了 50 倍。

人工智能實(shí)現(xiàn)了巨大的飛躍 —— 推理和代理式AI對計(jì)算性能的需求呈數(shù)量級增長,”NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示?!拔覀?yōu)檫@一時刻設(shè)計(jì)了 Blackwell Ultra —— 它是一款單一且多功能的平臺,能夠輕松高效地完成預(yù)訓(xùn)練、后訓(xùn)練以及推理型AI推理任務(wù)?!?/p>

NVIDIA Blackwell Ultra 實(shí)現(xiàn) AI 推理

NVIDIA GB300 NVL72 在一個機(jī)架設(shè)計(jì)中連接了 72 個 Blackwell Ultra GPU 和 36 個基于Arm Neoverse 架構(gòu)的 NVIDIA Grace? CPU,整體表現(xiàn)如同一個巨型 GPU,專為測試時擴(kuò)展而打造。通過 GB300 NVL72,AI 模型能夠利用平臺增強(qiáng)的計(jì)算能力探索多種解決方案,將復(fù)雜請求分解為多個步驟,從而生成更高質(zhì)量的響應(yīng)。

GB300 NVL72 預(yù)計(jì)還將通過 NVIDIA DGX? Cloud提供,該平臺是一個端到端的全托管 AI 平臺,部署于領(lǐng)先的云服務(wù)上,通過軟件、服務(wù)和 AI 專業(yè)知識為不斷發(fā)展的工作負(fù)載優(yōu)化性能。配備 DGX GB300 系統(tǒng)的 NVIDIA DGX SuperPOD? 采用 GB300 NVL72 機(jī)架設(shè)計(jì),為客戶提供了一個交鑰匙式 AI 工廠。

NVIDIA HGX B300 NVL16 相比 Hopper 代產(chǎn)品,LLM 推理速度提速了 11 倍,計(jì)算性能提升了 7 倍,內(nèi)存容量擴(kuò)大了 4 倍,可為最復(fù)雜的工作負(fù)載(如 AI 推理)提供突破性性能。

此外,Blackwell Ultra 平臺特別適用于以下應(yīng)用:
  • 代理式 AI, 利用復(fù)雜推理和迭代規(guī)劃自主解決復(fù)雜的多步驟問題。 AI 智能體系統(tǒng)超越了簡單的指令執(zhí)行。 他們能夠推理、規(guī)劃并采取行動以實(shí)現(xiàn)特定目標(biāo)。
  • 物理 AI,使企業(yè)能夠?qū)崟r生成合成的、具有高度真實(shí)感的視頻,用于大規(guī)模訓(xùn)練機(jī)器人自動駕駛汽車等應(yīng)用。

NVIDIA 橫向擴(kuò)展基礎(chǔ)架構(gòu)以實(shí)現(xiàn)絕佳性能

先進(jìn)的橫向擴(kuò)展型網(wǎng)絡(luò)是 AI 基礎(chǔ)架構(gòu)的重要組成部分,可在降低延遲和抖動的同時提供卓越性能。

Blackwell Ultra 系統(tǒng)與[ NVIDIA Spectrum-X? 以太網(wǎng)]和[ NVIDIA Quantum-X800 InfiniBand]平臺無縫集成,通過 NVIDIA ConnectX?-8 SuperNIC 為系統(tǒng)中的每個 GPU 提供 800 Gb/s 的數(shù)據(jù)吞吐率。 這為 AI 工廠和云數(shù)據(jù)中心提供了極佳的遠(yuǎn)程直接內(nèi)存訪問(RDMA)能力,使其能夠無瓶頸地處理 AI 推理模型。

NVIDIA BlueField?-3 DPU,作為 Blackwell Ultra 系統(tǒng)的重要組件,能夠?qū)崿F(xiàn)多租戶網(wǎng)絡(luò)架構(gòu)、GPU 計(jì)算資源彈性擴(kuò)展、數(shù)據(jù)訪問加速以及實(shí)時網(wǎng)絡(luò)安全檢測 。

全球技術(shù)領(lǐng)導(dǎo)者擁抱 Blackwell Ultra

合作伙伴預(yù)計(jì)將從 2025 年下半年開始推出基于 Blackwell Ultra 的產(chǎn)品。

思科、戴爾科技、慧與、聯(lián)想和超微預(yù)計(jì)將推出基于 Blackwell Ultra 的各類服務(wù)器,此外還包括 Aivres、華擎、華碩、Eviden、Foxconn、技嘉科技、英業(yè)達(dá)、和碩、云達(dá)科技(QCT)、緯創(chuàng)和緯穎科技。

云服務(wù)提供商亞馬遜云科技(AWS)、谷歌云、微軟 Azure 和 Oracle Cloud Infrastructure(OCI),以及 GPU 云提供商 CoreWeave、Crusoe、Lambda、Nebius、Nscale、Yotta 和 YTL 將成為首批提供 Blackwell Ultra 支持實(shí)例的供應(yīng)商。

NVIDIA 軟件創(chuàng)新減少 AI 瓶頸

全部 NVIDIA Blackwell 產(chǎn)品組合都得到 NVIDIA AI 全棧平臺支持。 同時發(fā)布的 [NVIDIA Dynamo]開源推理框架可擴(kuò)展推理 AI 服務(wù),通過提供最高效的測試時計(jì)算擴(kuò)展解決方案,得以實(shí)現(xiàn)吞吐量的飛躍,同時降低響應(yīng)時間和模型服務(wù)成本。

NVIDIA Dynamo 是全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化 token 收益。它可以協(xié)調(diào)和加速數(shù)千個 GPU 之間的推理通信,并使用分離式服務(wù)在不同的 GPU 上分離大語言模型的預(yù)處理和生成階段。這使得每個階段都能根據(jù)其特定需求進(jìn)行獨(dú)立優(yōu)化,確保 GPU 資源利用率最大化。

Blackwell 系統(tǒng)非常適合運(yùn)行全新的 [NVIDIA Llama Nemotron 推理模型]和 NVIDIA AI-Q Blueprint,這些都得到用于生產(chǎn)級 AI 的 [NVIDIA AI Enterprise]軟件平臺支持。 NVIDIA AI Enterprise 軟件平臺包括 [NVIDIA NIM][?][ 微服務(wù)],以及企業(yè)可以在 NVIDIA 加速的云、數(shù)據(jù)中心和工作站上部署的 AI 框架、庫和工具。

Blackwell 平臺建立在 NVIDIA 強(qiáng)大的開發(fā)工具生態(tài)系統(tǒng)之上,包括 NVIDIA CUDA-X? 庫、超過 600 萬開發(fā)者和 4,000 多個可跨數(shù)千 GPU 擴(kuò)展性能的應(yīng)用程序。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5142

    瀏覽量

    104765
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    32758

    瀏覽量

    272186
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3890

    瀏覽量

    92563
收藏 0人收藏

    評論

    相關(guān)推薦

    揭曉英偉達(dá)最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,新機(jī)器人壓軸

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時間3月19日晚間,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在2025年GTC開發(fā)者大會上發(fā)表了主題演講,介紹了英偉達(dá)
    的頭像 發(fā)表于 03-19 09:05 ?999次閱讀
    揭曉<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>最強(qiáng)芯片!<b class='flag-5'>Blackwell</b> <b class='flag-5'>Ultra</b>、Rubin芯片亮相,新機(jī)器人壓軸

    英偉達(dá)GTC2025亮點(diǎn)NVIDIA開源cuOpt開啟決策優(yōu)化新時代

    每秒鐘都在進(jìn)行關(guān)鍵決策。物流公司決定貨運(yùn)卡車的調(diào)度方案,零售企業(yè)思考貨架的最優(yōu)配置,航空公司在暴風(fēng)雨后緊急改變航線。這些絕非是簡單的路線選擇,更是包含數(shù)百萬個變量的高風(fēng)險(xiǎn)謎題,一旦出錯,不僅造成經(jīng)濟(jì)損失,還會造成客戶流失。 然而,這種情況正在發(fā)生改變。 NVIDIA 宣布開源其
    的頭像 發(fā)表于 03-21 19:34 ?495次閱讀

    英偉達(dá)GTC2025亮點(diǎn)NVIDIA Blackwell加速計(jì)算機(jī)輔助工程軟件,實(shí)現(xiàn)實(shí)時數(shù)字孿生性能數(shù)量級提升

    Ansys、Altair、Cadence、Siemens 和 Synopsys 等領(lǐng)先軟件提供商紛紛采用 NVIDIA Blackwell NVIDIAGTC 大會上宣布,包括
    的頭像 發(fā)表于 03-21 15:12 ?237次閱讀

    英偉達(dá)GTC2025亮點(diǎn)NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    、優(yōu)化能源電網(wǎng)等。在 NVIDIA GTC 全球 AI 大會上,來自 Google DeepMind、Isomorphic Labs、I
    的頭像 發(fā)表于 03-21 15:10 ?468次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點(diǎn)</b>:<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌攜手<b class='flag-5'>開啟</b>代理式與物理<b class='flag-5'>AI</b>的未來

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?280次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點(diǎn)</b>:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達(dá)GTC2025亮點(diǎn)NVIDIA與行業(yè)領(lǐng)先存儲企業(yè)共同推出面向AI時代的新型企業(yè)基礎(chǔ)設(shè)施

    的參考設(shè)計(jì),領(lǐng)先的存儲提供商可用來構(gòu)建全新的 AI 基礎(chǔ)設(shè)施,以滿足 AI 推理工作負(fù)載的嚴(yán)苛要求:即企業(yè)存儲平臺,搭載由 NVIDIA 加速計(jì)算、網(wǎng)絡(luò)和軟件驅(qū)動的
    的頭像 發(fā)表于 03-21 09:42 ?202次閱讀

    英偉達(dá)GTC25亮點(diǎn)NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴(kuò)展測試時計(jì)算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的
    的頭像 發(fā)表于 03-20 15:03 ?351次閱讀

    英偉達(dá)GTC2025大會關(guān)鍵信息點(diǎn)總結(jié) Blackwell Ultra 量子計(jì)算與機(jī)器人

    英偉達(dá) GTC 2025 大會關(guān)鍵信息點(diǎn)總結(jié)
    的頭像 發(fā)表于 03-20 14:18 ?172次閱讀

    英偉達(dá)Blackwell GPU未來一年訂單爆滿

    據(jù)摩根士丹利(大摩)透露,人工智能(AI)芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)NVIDIA)的管理層在近期的一系列與投資人的會議中,分享了關(guān)于其下一代繪圖處理器(GPU)
    的頭像 發(fā)表于 10-17 16:52 ?676次閱讀

    英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練,實(shí)時大語言模型推理

    、NVLink交換機(jī)、Spectrum以太網(wǎng)交換機(jī)和Quantum InfiniBand交換機(jī)。 ? 英偉達(dá)稱,Blackwell擁有6項(xiàng)革命性技術(shù),可支持多達(dá)10萬億參數(shù)的模型進(jìn)行AI
    的頭像 發(fā)表于 09-04 09:10 ?3138次閱讀

    英偉達(dá)Blackwell架構(gòu)揭秘:下一個AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

    英偉達(dá)行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    英偉達(dá)Blackwell芯片已投產(chǎn),預(yù)告未來AI芯片發(fā)展

    英偉達(dá)創(chuàng)始人兼CEO黃仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是英偉達(dá)A
    的頭像 發(fā)表于 06-04 09:23 ?2107次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡化AI
    的頭像 發(fā)表于 06-04 09:15 ?821次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    2024年3月19日,[英偉達(dá)]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構(gòu)BLACKWELL,并推出基于該架構(gòu)的超級芯片GB20
    發(fā)表于 05-13 17:16

    英偉達(dá)發(fā)布新一代AI芯片架構(gòu)Blackwell GPU

    近日,英偉達(dá)首席執(zhí)行官黃仁勛在GTC 2024會議上發(fā)表主題演講,重磅推出全新AI芯片架構(gòu)Blackwell GPU。這一創(chuàng)新技術(shù)的首款芯片
    的頭像 發(fā)表于 03-26 11:19 ?1010次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品