0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于NVIDIA H100 GPU的問(wèn)題解答

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-07-18 10:35 ? 次閱讀

NVIDIA 帶來(lái)知乎精彩問(wèn)答甄選系列,將為您精選知乎上有關(guān) NVIDIA 產(chǎn)品的精彩問(wèn)答。

本期為問(wèn)答甄選第二期 ——探索 H100 的奧秘!

NVIDIA H100 是全球 AI 基礎(chǔ)設(shè)施的引擎,

讓企業(yè)能夠利用其實(shí)現(xiàn)自身 AI 業(yè)務(wù)的加速。

今年的 GTC22 上 NVIDIA 發(fā)布其首款基于 Hopper 架構(gòu)的 GPU —NVIDIA H100。

該款 GPU 集成了 800 億個(gè)晶體管。H100 是全球范圍內(nèi)最大的性能出眾的加速器,擁有革命性的 Transformer 引擎和高度可擴(kuò)展的 NVIDIA NVLink 互連技術(shù)等突破性功能,可推動(dòng)龐大的 AI 語(yǔ)言模型、深度推薦系統(tǒng)、基因組學(xué)和復(fù)雜數(shù)字孿生的發(fā)展。

以下三個(gè)知乎甄選問(wèn)答將為您了解NVIDIA H100帶來(lái)更加精彩的解答!

Q:NVIDIA GTC 2022 大會(huì)官宣,Hopper 計(jì)算架構(gòu)要來(lái)了,該架構(gòu)有哪些值得期待的亮點(diǎn)?

A:NVIDIA 宣布推出采用 NVIDIA Hopper架構(gòu)的新一代加速計(jì)算平臺(tái)。與上一代產(chǎn)品相比,該平臺(tái)實(shí)現(xiàn)了數(shù)量級(jí)的性能飛躍。這一全新架構(gòu)以美國(guó)計(jì)算機(jī)領(lǐng)域的先驅(qū)科學(xué)家 Grace Hopper 的名字命名,將取代兩年前推出的 NVIDIA Ampere 架構(gòu)。

使用 Transformer 引擎訓(xùn)練 AI 模型:

隨著一些模型(例如大型語(yǔ)言模型)達(dá)到數(shù)萬(wàn)億參數(shù),AI、高性能計(jì)算和數(shù)據(jù)分析變得日益復(fù)雜。在當(dāng)今計(jì)算平臺(tái)上,大型 AI 模型可能需要數(shù)月來(lái)完成訓(xùn)練。而這樣的速度對(duì)于企業(yè)來(lái)說(shuō)太慢了。

NVIDIA Hopper 架構(gòu)從頭開(kāi)始構(gòu)建,憑借強(qiáng)大的算力和快速的內(nèi)存來(lái)加速這些新一代 AI 工作負(fù)載,從而處理日益增長(zhǎng)的網(wǎng)絡(luò)和數(shù)據(jù)集。Transformer 引擎是全新 Hopper 架構(gòu)的一部分,將顯著提升 AI 性能和功能,并助力在幾天或幾小時(shí)內(nèi)訓(xùn)練大型模型。

Transformer 引擎采用 16 位浮點(diǎn)精度和新增的 8 位浮點(diǎn)數(shù)據(jù)格式,并整合先進(jìn)的軟件算法,將進(jìn)一步提升 AI 性能和功能。

采用全新 DPX 指令將動(dòng)態(tài)編程速度提升 40 倍:

NVIDIA Hopper GPU 架構(gòu)利用全新 DPX 指令,將動(dòng)態(tài)編程速度提高多達(dá) 40 倍。動(dòng)態(tài)編程是一種應(yīng)用于基因組學(xué)、量子計(jì)算、路線優(yōu)化等領(lǐng)域算法中,用以解決問(wèn)題的技術(shù)。

Q:基于 Hopper 架構(gòu)的 NVIDIA H100 GPU 有什么突破性創(chuàng)新?

A:H100 GPU 為加速大規(guī)模 AI 和 HPC 設(shè)定了新的標(biāo)準(zhǔn),帶來(lái)了六項(xiàng)突破性創(chuàng)新:

先進(jìn)的芯片—— H100 由 800 億個(gè)晶體管構(gòu)建而成,這些晶體管采用了專為 NVIDIA 加速計(jì)算需求設(shè)計(jì)的尖端的 TSMC 4N 工藝,因而能夠顯著提升 AI、HPC、顯存帶寬、互連和通信的速度,并能夠?qū)崿F(xiàn)近 5TB/s 的外部互聯(lián)帶寬。H100 是首款支持 PCIe 5.0 的 GPU,也是首款采用 HBM3 的 GPU,可實(shí)現(xiàn) 3TB/s 的顯存帶寬。20個(gè) H100 GPU 便可承載相當(dāng)于全球互聯(lián)網(wǎng)的流量,使其能夠幫助客戶推出先進(jìn)的推薦系統(tǒng)以及實(shí)時(shí)運(yùn)行數(shù)據(jù)推理的大型語(yǔ)言模型。

新的 Transformer 引擎—— Transformer 現(xiàn)在已成為自然語(yǔ)言處理的標(biāo)準(zhǔn)模型方案,也是深度學(xué)習(xí)模型領(lǐng)域最重要的模型之一。H100 加速器的 Transformer 引擎旨在不影響精度的情況下,將這些網(wǎng)絡(luò)的速度提升至上一代的六倍。

第二代安全多實(shí)例 GPU—— MIG 技術(shù)支持將單個(gè) GPU 分為七個(gè)更小且完全獨(dú)立的實(shí)例,以處理不同類型的作業(yè)。與上一代產(chǎn)品相比,在云環(huán)境中 Hopper 架構(gòu)通過(guò)為每個(gè) GPU 實(shí)例提供安全的多租戶配置,將 MIG 的部分能力擴(kuò)展了 7 倍。

機(jī)密計(jì)算—— H100 是全球首款具有機(jī)密計(jì)算功能的加速器,可保護(hù) AI 模型和正在處理的客戶數(shù)據(jù)。客戶還可以將機(jī)密計(jì)算應(yīng)用于醫(yī)療健康和金融服務(wù)等隱私敏感型行業(yè)的聯(lián)邦學(xué)習(xí),也可以應(yīng)用于共享云基礎(chǔ)設(shè)施。

第 4 代 NVIDIA NVLink—— 為加速大型 AI 模型,NVLink 結(jié)合全新的外接 NVLink Switch,可將 NVLink 擴(kuò)展為服務(wù)器間的互聯(lián)網(wǎng)絡(luò),最多可以連接多達(dá) 256 個(gè) H100 GPU,相較于上一代采用 NVIDIA HDR Quantum InfiniBand網(wǎng)絡(luò),帶寬高出9倍。

DPX 指令—— 新的 DPX 指令可加速動(dòng)態(tài)規(guī)劃,適用于包括路徑優(yōu)化和基因組學(xué)在內(nèi)的一系列算法,與 CPU 和上一代 GPU 相比,其速度提升分別可達(dá) 40 倍和 7 倍。Floyd-Warshall 算法與 Smith-Waterman 算法也在其加速之列,前者可以在動(dòng)態(tài)倉(cāng)庫(kù)環(huán)境中為自主機(jī)器人車隊(duì)尋找最優(yōu)線路,而后者可用于 DNA 和蛋白質(zhì)分類與折疊的序列比對(duì)。

H100 的多項(xiàng)技術(shù)創(chuàng)新相結(jié)合,進(jìn)一步擴(kuò)大了 NVIDIA在 AI 推理和訓(xùn)練的領(lǐng)導(dǎo)地位,利用大規(guī)模 AI 模型實(shí)現(xiàn)了實(shí)時(shí)沉浸式應(yīng)用。H100 將支持聊天機(jī)器人使用功能超強(qiáng)大的monolithic Transformer 語(yǔ)言模型 Megatron 530B,吞吐量比上一代產(chǎn)品高出 30 倍,同時(shí)滿足實(shí)時(shí)對(duì)話式 AI 所需的次秒級(jí)延遲。利用 H100,研究人員和開(kāi)發(fā)者能夠訓(xùn)練龐大的模型,如包含 3950 億個(gè)參數(shù)的混合專家模型,訓(xùn)練速度加速高達(dá)9倍,將訓(xùn)練時(shí)間從幾周縮短到幾天。

Q:NVIDIA H100 在 AI 基礎(chǔ)架構(gòu)方面有什么作用?

A:基于 Hopper 架構(gòu)的 NVIDIA H100,是“全球 AI 基礎(chǔ)架構(gòu)的新引擎”。

語(yǔ)音、對(duì)話、客服和推薦系統(tǒng)等 AI 應(yīng)用正在推動(dòng)數(shù)據(jù)中心設(shè)計(jì)領(lǐng)域的巨大變革。“AI 數(shù)據(jù)中心需要處理海量且持續(xù)的數(shù)據(jù),以訓(xùn)練和完善 AI 模型,原始數(shù)據(jù)進(jìn)來(lái),經(jīng)過(guò)提煉,然后智能輸出——企業(yè)正在制造智能并運(yùn)營(yíng)大型 AI 工廠。” 這些工廠全天候密集運(yùn)行,即便是質(zhì)量上的小幅改進(jìn)也能大幅增加客戶參與和企業(yè)利潤(rùn)。

H100 將幫助這些工廠更快發(fā)展。這個(gè) “龐大” 的 800 億晶體管芯片采用了臺(tái)積電的 4 納米工藝制造而成。

“Hopper H100 是有史以來(lái)最大的一次性能飛躍——其大規(guī)模訓(xùn)練性能是 A100 的 9 倍,大型語(yǔ)言模型推理吞吐量是 A100 的 30 倍?!?/p>

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4986

    瀏覽量

    103066
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128951
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30896

    瀏覽量

    269108
  • H100
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    289

原文標(biāo)題:NVIDIA 知乎精彩問(wèn)答甄選(二) | 探索 H100 的奧秘!

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    C2000常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《C2000常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 12-06 16:04 ?0次下載
    C2000常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    電路設(shè)計(jì)常見(jiàn)問(wèn)題解答

    電路設(shè)計(jì)充滿挑戰(zhàn),即便是最富經(jīng)驗(yàn)的工程師也難免遭遇困惑與阻礙?!峨娐吩O(shè)計(jì)常見(jiàn)問(wèn)題解答》是ADI精心籌備的一份實(shí)用指南,力求為您鋪設(shè)一條清晰的學(xué)習(xí)與實(shí)踐之路。
    的頭像 發(fā)表于 11-05 17:02 ?448次閱讀
    電路設(shè)計(jì)常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    英偉達(dá)H100芯片市場(chǎng)降溫

    隨著英偉達(dá)新一代AI芯片GB200需求的不斷攀升,其上一代明星產(chǎn)品H100芯片卻遭遇了市場(chǎng)的冷落。據(jù)業(yè)內(nèi)人士透露,搭載H100的服務(wù)器通常以8卡的形式進(jìn)行出售或出租,而在去年,這類服務(wù)器的售價(jià)普遍
    的頭像 發(fā)表于 10-28 15:42 ?569次閱讀

    BQ2404x、BQ2405x和BQ2409x常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《BQ2404x、BQ2405x和BQ2409x常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 10:10 ?0次下載
    BQ2404x、BQ2405x和BQ2409x常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    Keystone EDMA常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《Keystone EDMA常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 10-11 10:43 ?0次下載
    Keystone EDMA常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    Keystone NDK常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《Keystone NDK常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 10-11 10:41 ?0次下載
    Keystone NDK常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    TVP51xx產(chǎn)品系列-常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《TVP51xx產(chǎn)品系列-常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 10-08 14:36 ?0次下載
    TVP51xx產(chǎn)品系列-常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    TFPxxx常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《TFPxxx常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 09-29 09:56 ?0次下載
    TFPxxx常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    RS-232常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《RS-232常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 10:55 ?0次下載
    RS-232常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    MSP MCU上Σ-Δ ADC的常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《MSP MCU上Σ-Δ ADC的常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 10:53 ?0次下載
    MSP MCU上Σ-Δ ADC的常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    關(guān)于UCC25640x LLC諧振控制器的常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《關(guān)于UCC25640x LLC諧振控制器的常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 09:37 ?0次下載
    <b class='flag-5'>關(guān)于</b>UCC25640x LLC諧振控制器的常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    OMAPL138/C6748 ROM引導(dǎo)加載程序資源和常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《OMAPL138/C6748 ROM引導(dǎo)加載程序資源和常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 09:31 ?0次下載
    OMAPL138/C6748 ROM引導(dǎo)加載程序資源和常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    TMP LM 75比較常見(jiàn)問(wèn)題解答

    電子發(fā)燒友網(wǎng)站提供《TMP LM 75比較常見(jiàn)問(wèn)題解答.pdf》資料免費(fèi)下載
    發(fā)表于 08-30 11:40 ?0次下載
    TMP LM 75比較常見(jiàn)<b class='flag-5'>問(wèn)題解答</b>

    英偉達(dá)H200和H100的比較

    英偉達(dá)H200和H100是兩款不同的AI芯片,它們各自具有獨(dú)特的特點(diǎn)和優(yōu)勢(shì)。以下是關(guān)于這兩款芯片的一些比較。
    的頭像 發(fā)表于 03-07 15:53 ?4656次閱讀

    H100 GPU供應(yīng)改善,AI市場(chǎng)需求依舊強(qiáng)勁

    值得注意的是,H100 GPU的供求關(guān)系已經(jīng)緩解,且維護(hù)成本高起,部分客戶正在置換這類硬件以轉(zhuǎn)向云服務(wù),這種轉(zhuǎn)變?cè)谶^(guò)去的市場(chǎng)緊縮中很少見(jiàn)到。同時(shí),市場(chǎng)上雖然有其他選擇如AMD的MI300 GPU,性能穩(wěn)定且價(jià)格低廉。
    的頭像 發(fā)表于 02-29 16:10 ?714次閱讀