0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief

向上 ? 2025-03-20 18:35 ? 次閱讀

NVIDIA Blackwell 架構(gòu)為生成式 AI加速計算帶來的突破性進步。Blackwell 基于多代** NVIDIA 技術(shù)構(gòu)建,以出眾的性能、效率和規(guī)模揭開了生成式 AI 領(lǐng)域的新篇章。

NVIDIA Blackwell Architecture Technical Brief免費下載
*附件:NVIDIA Blackwell Architecture Technical Brief.doc

新型 AI 超級芯片

Blackwell 架構(gòu) GPU 具有 2080 億個晶體管,采用專門定制的臺積電 4NP 工藝制造。所有 Blackwell 產(chǎn)品均采用雙倍光刻極限尺寸的裸片,通過 10 TB/s 的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的 GPU。

第二代 Transformer 引擎

第二代 Transformer 引擎將定制的 Blackwell Tensor Core技術(shù)與 NVIDIA? TensorRT? -LLM 和 NeMo? 框架創(chuàng)新相結(jié)合,加速大語言模型 (LLM) 和專家混合模型 (MoE) 的推理和訓(xùn)練。

為了強效助力 MoE 模型的推理 Blackwell Tensor Core增加了新的精度 (包括新的社區(qū)定義的微縮放格式),可提供較高的準確性并輕松替換更大的精度。Blackwell Transformer 引擎利用稱為微張量縮放的細粒度縮放技術(shù),優(yōu)化性能和準確性,支持 4 位浮點 (FP4) AI。這將內(nèi)存可以支持的新一代模型的性能和大小翻倍,同時保持高精度。

安全 AI

Blackwell 內(nèi)置 NVIDIA 機密計算技術(shù),可通過基于硬件的強大安全性保護敏感數(shù)據(jù)和 AI 模型,使其免遭未經(jīng)授權(quán)的訪問。Blackwell 是業(yè)內(nèi)首款具備可信執(zhí)行環(huán)境 (TEE) I/O 功能的 GPU,它不僅能夠與具備 TEE-I/O 功能的主機一同提供性能卓越的機密計算解決方案,還能通過 NVIDIA? NVLink? 技術(shù)提供實時保護。與未加密模式相比, Blackwell 機密計算功能供了幾乎相同的吞吐量性能?,F(xiàn)在,除了保護 AI 知識產(chǎn)權(quán) (IP) 和安全地實現(xiàn)機密 AI 訓(xùn)練、推理和聯(lián)邦學(xué)習(xí),企業(yè)甚至還能以高性能的方式保護最大的模型。

NVLink、NVSwitch 和 NVLink Switch 系統(tǒng)

是否能釋放百億億級計算和萬億參數(shù) AI 模型的全部潛力取決于服務(wù)器集群中每個 GPU 之間能否快速、順暢的通信。第五代 NVIDIA? NVLink? 可擴展至 576 個 GPU,為萬億和數(shù)萬億參數(shù) AI 模型釋放加速性能。

NVIDIA NVLink 交換機芯片可在一個有 72 個 GPU 的 NVLink 域 (NVL72) 中實現(xiàn) 130TB/s 的 GPU 帶寬,并通過 NVIDIA SHARP? 技術(shù)對 FP8 的支持實現(xiàn) 4 倍于原來的帶寬效率。NVIDIA NVLink 交換機芯片能以驚人的 1.8TB/s 互連速度為多服務(wù)器集群提供支持。采用 NVLink 的多服務(wù)器集群可以在計算量增加的情況下同步擴展 GPU 通信,因此 NVL72 可支持的 GPU 吞吐量是單個 8 卡 GPU 系統(tǒng)的 9 倍。

解壓縮引擎

過去,數(shù)據(jù)分析和數(shù)據(jù)庫工作流依賴 CPU 進行計算。加速數(shù)據(jù)科學(xué)可以顯著提高端到端分析性能,加速價值創(chuàng)造,同時降低成本。Apache Spark 等數(shù)據(jù)庫在接手、處理和分析大量數(shù)據(jù)等數(shù)據(jù)分析工作上發(fā)揮著關(guān)鍵作用。

Blackwell 擁有的解壓縮引擎以及通過 900GB/s 雙向帶寬的高速鏈路訪問 NVIDIA Grace? CPU 中大量內(nèi)存的能力,可加速整個數(shù)據(jù)庫查詢工作流,從而在數(shù)據(jù)分析和數(shù)據(jù)科學(xué)方面實現(xiàn)更高性能。Blackwell 支持 LZ4、Snappy 和 Deflate 等最新壓縮格式。

可靠性、可用性和可服務(wù)性 (RAS) 引擎

Blackwell 通過專用的可靠性、可用性和可服務(wù)性 (RAS) 引擎增加了智能恢復(fù)能力,以識別早期可能發(fā)生的潛在故障,從而更大限度地減少停機時間。NVIDIA AI 驅(qū)動的預(yù)測管理功能持續(xù)監(jiān)控硬件和軟件中數(shù)千個數(shù)據(jù)點的整體運行狀況,以預(yù)測和攔截停機時間和低效的來源。這建立了智能可靠性技術(shù),節(jié)省時間、能源和計算成本。

NVIDIA 的 RAS 引擎提供深入的診斷信息,可以識別關(guān)注領(lǐng)域并制定維護計劃。RAS 引擎通過快速定位問題來源縮短周轉(zhuǎn)時間,并通過促進有效的補救最大限度地減少停機時間。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5142

    瀏覽量

    104758
收藏 0人收藏

    評論

    相關(guān)推薦

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    能比上一代NVIDIA Hopper?提高了15倍。采用第二代Transformer引擎、定制的Blackwell Tensor Core技術(shù)、TensorRT?-LLM和Nemo?框架的創(chuàng)新,顯著加速了
    發(fā)表于 05-13 17:16

    jAVA語言環(huán)境白皮書

    jAVA語言環(huán)境白皮書The Java Language Environment (A White Paper)1. Introduction to Java
    發(fā)表于 10-14 17:35

    最新的智能電網(wǎng)的白皮書資料

    ,因而遇到的這些問題并非那些打從資料、技術(shù)方案所能解決的,所以自己就養(yǎng)成了搜集各大公司智能電網(wǎng)的白皮書的習(xí)慣。 下面各大公司2010年最新的智能電網(wǎng)的白皮書資料,在這里分享出來,有需要的童鞋可以去看
    發(fā)表于 12-23 21:08

    ZigBee白皮書

    ZigBee白皮書
    發(fā)表于 08-20 09:50

    簡儀科技怒對LabVIEW的白皮書

    本帖最后由 niezidong 于 2017-8-23 20:43 編輯 簡儀科技最近搞的開源平臺跟NI是針鋒相對啊。近期的宣傳都帶火藥味,還出了一本白皮書。見附件。這白皮書就差直接說搞LabVIEW沒前途了。各位對此有何高見?
    發(fā)表于 08-11 15:55

    IPTV服務(wù)質(zhì)量白皮書

    IPTV服務(wù)質(zhì)量白皮書
    發(fā)表于 10-14 14:11

    物聯(lián)網(wǎng)領(lǐng)域白皮書分享

    最近研究了一些物聯(lián)網(wǎng)相關(guān)的白皮書,分享給各位電友
    發(fā)表于 03-30 14:48

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    基于先進的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲技術(shù),可將集群中 Grace Blackwell 超級芯片的數(shù)量擴展至數(shù)萬個,通過 NVIDIA NVLink可將多
    發(fā)表于 03-19 10:56 ?568次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?900次閱讀

    NVIDIA AI芯片Blackwell推遲發(fā)布引熱議,公司強調(diào)Hopper需求強勁

    據(jù)8月5日最新消息,NVIDIA新款A(yù)I芯片Blackwell因被曝存在設(shè)計缺陷而推遲發(fā)布的消息,迅速在業(yè)界引發(fā)了廣泛討論與關(guān)注。面對這一市場傳聞,NVIDIA官方迅速作出回應(yīng),強調(diào)其旗艦產(chǎn)品
    的頭像 發(fā)表于 08-05 15:05 ?678次閱讀

    NVIDIA未來1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無疑已成為NVIDIA歷史上極為成功的產(chǎn)品典范,其市場需求量已攀升至前所未有的高峰。   憑借在全球AI算力領(lǐng)域的領(lǐng)先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發(fā)表于 10-12 16:20 ?793次閱讀

    NVIDIA向開放計算項目捐贈Blackwell平臺設(shè)計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎(chǔ)元素捐贈給開放計算項目(OCP),并擴大 NVIDIA
    的頭像 發(fā)表于 11-19 15:30 ?377次閱讀

    MediaTek與NVIDIA攜手設(shè)計GB10 Grace Blackwell超級芯片

    MediaTek與NVIDIA近日宣布了一項重要合作,雙方將共同設(shè)計NVIDIA GB10 Grace Blackwell超級芯片。這款超級芯片將被應(yīng)用于NVIDIA的個人AI超級計算
    的頭像 發(fā)表于 01-13 10:48 ?313次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?322次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構(gòu)技術(shù)解析

    NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell 架構(gòu)技術(shù)解析
    的頭像 發(fā)表于 03-20 17:19 ?151次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品