0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新一代GPU之王B200面世,帶動(dòng)產(chǎn)業(yè)鏈狂歡!

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-03-19 23:58 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))作為AI時(shí)代不容置疑的無(wú)冕之王,英偉達(dá)每年舉辦的GTC大會(huì)不僅是針對(duì)英偉達(dá)軟硬件生態(tài)開(kāi)發(fā)者的一場(chǎng)盛會(huì),也是英偉達(dá)展示肌肉的舞臺(tái)。在近日舉辦的GTC大會(huì)上,英偉達(dá)CEO黃仁勛在發(fā)布新品的同時(shí),也宣告了一個(gè)新的計(jì)算時(shí)代的到來(lái)。

黃仁勛表示,我們需要更大的模型,然后用更多的多模數(shù)據(jù)去訓(xùn)練它,而不再局限于互聯(lián)網(wǎng)上的文本數(shù)據(jù),還有圖片、圖表。正如我們通過(guò)電視來(lái)獲取支持知識(shí)一樣,這些大模型也將快速接入視頻數(shù)據(jù),比如最近爆火的Sora等。

192GB HBM3e內(nèi)存,Blackwell架構(gòu)的前鋒

為了應(yīng)對(duì)更大的模型,自然也就需要更大的GPU,這才有了英偉達(dá)此次發(fā)布的Blackwell GPU平臺(tái)。Blackwell架構(gòu)以數(shù)學(xué)家David Harold Blackwell命名,作為兩年前發(fā)布的Hopper架構(gòu)繼任者,Blackwell可以說(shuō)實(shí)現(xiàn)了設(shè)計(jì)到性能上的全方位升級(jí),而首個(gè)享受這些升級(jí)的,就是B200 GPU。

全新的B200 GPU基于臺(tái)積電4NP工藝,采用了兩個(gè)GPU die集成在同一芯片上的設(shè)計(jì),并配備了192GGB的HBM3e超大內(nèi)存。也正因如此,B200單芯片的晶體管數(shù)量達(dá)到了驚人的2080億個(gè),TDP也高達(dá)1000W。但這樣瘋狂的堆料帶來(lái)的自然是性能的翻倍提升,在FP8精度的訓(xùn)練性能上,B200 GPU的算力是上一代的2.5倍。

wKgaomX5twWARXkfAAmVJFg1468232.png?
兩代GPU架構(gòu)支持精度 / 英偉達(dá)


有趣的一點(diǎn)在于,在英偉達(dá)第二代Transformer引擎的支持下,此次B200加入了對(duì)FP4精度的支持,從而支持到規(guī)模更大,性能要求更高的模型。在FP4精度下的推理性能,B200的算力更是達(dá)到了上一代的5倍。如果以1750億參數(shù)的GPT-3大模型作為實(shí)例進(jìn)行測(cè)試的話(huà),B200 GPU的總體性能是H100的7倍,訓(xùn)練速度則是H100的4倍。

為了更好地提升B200的擴(kuò)展性,英偉達(dá)基于最新的第五代NVLink技術(shù),開(kāi)發(fā)了一塊全新的NVLink Switch芯片,雙向帶寬高達(dá)1800GB/s,是上一代的兩倍。與此同時(shí),NVLink支持的最大擴(kuò)展規(guī)模也得到了提升,如今最多支持576塊B200 GPU互聯(lián)互通。

wKgaomX5tyOAX88kABIoDTWVbVY026.png?
GB200超級(jí)芯片 / 英偉達(dá)


除了新架構(gòu)的GPU外,英偉達(dá)基于NVLink C2C互聯(lián)技術(shù),也為超級(jí)芯片GH200打造了下一代繼任者GB200。GB200超級(jí)芯片由一個(gè)Grace CPU與兩塊B200 GPU組成,并以超低功耗卻能實(shí)現(xiàn)900GB/s超大帶寬的互聯(lián)。不過(guò)此次英偉達(dá)并沒(méi)有對(duì)CPU的架構(gòu)進(jìn)行升級(jí),仍然采用的是72核Arm Neoverse N2的設(shè)計(jì),所以此次GH200的主要性能提升還是在GPU上,英偉達(dá)GB200在LLM推理性能上有了30倍的提升,但能效比也提升了25倍。

wKgZomX5t0OAZKvkACBFL86q3WQ679.png?
GB200 NVL72與GB200配置與性能 / 英偉達(dá)


針對(duì)萬(wàn)億參數(shù)級(jí)別的超級(jí)大模型,英偉達(dá)基于GB200和NVLink技術(shù)推出了集成36/72個(gè)GPU的GB200 NVL36/72方案?;贕B200 NVL72打造的MGX系統(tǒng)更是可以實(shí)現(xiàn)30TB的統(tǒng)一內(nèi)存,130TB/s的總帶寬,甚至是單機(jī)柜exaFLOP級(jí)(FP4精度)的AI算力。英偉達(dá)表示,即便面對(duì)1.8萬(wàn)億參數(shù)的GPT-MoE-1.8T超大模型,也可以實(shí)現(xiàn)比同數(shù)量H100 GPU高出4倍的訓(xùn)練性能,以及實(shí)時(shí)的AI推理。

B200發(fā)布后,哪些產(chǎn)業(yè)同步受益

過(guò)去英偉達(dá)先進(jìn)AI GPU的熱度,已經(jīng)帶動(dòng)了一批上下游產(chǎn)業(yè)的發(fā)展,而隨著B(niǎo)200的發(fā)布,相關(guān)市場(chǎng)或再度迎來(lái)一輪爆發(fā)。從制造上游來(lái)看,無(wú)疑晶圓代工廠(chǎng)受益最大,無(wú)論是提供邏輯代工、先進(jìn)封裝方案的臺(tái)積電,還是為新GPU提供大容量HBM內(nèi)存的三大存儲(chǔ)廠(chǎng)商(SK海力士、三星和美光)。

四年之前,英偉達(dá)在GA100采取了將芯片分成兩半,通過(guò)高速互聯(lián)技術(shù)來(lái)完成通信的設(shè)計(jì),然而這一大膽的設(shè)計(jì)卻很少被人注意。而如今在CUDA、GPU團(tuán)隊(duì),以及臺(tái)積電的先進(jìn)邏輯與封裝工藝下,B200終于采用了Chiplet的設(shè)計(jì),將兩個(gè)GPU die集成在單個(gè)封裝內(nèi),并做到了逼近臺(tái)積電4NP工藝節(jié)點(diǎn)的極限die面積,以及高達(dá)10TB/s的C2C互聯(lián)速度。

再考慮到未來(lái)即將出貨的H200和B100 GPU,這一系列芯片將進(jìn)一步推動(dòng)臺(tái)積電4nm工藝走向滿(mǎn)載的產(chǎn)能利用率,而這還是在過(guò)去只被視為淡季的Q1。更不用說(shuō)這一系列芯片帶來(lái)的CoWoS產(chǎn)能壓力,據(jù)報(bào)道,臺(tái)積電已經(jīng)計(jì)劃投資160億美元在臺(tái)灣建設(shè)6座新的CoWoS封裝設(shè)施,甚至有爆料稱(chēng)臺(tái)積電開(kāi)始考慮出海擴(kuò)張CoWoS封裝產(chǎn)能,第一站很可能會(huì)在日本,足以看出GPU的訂單數(shù)量之夸張。

這也進(jìn)一步推動(dòng)了存儲(chǔ)廠(chǎng)商在HBM上的營(yíng)收占比,三大參與廠(chǎng)商在HBM產(chǎn)能供應(yīng)上的競(jìng)爭(zhēng)已經(jīng)進(jìn)入了白熱化階段。本次GTC線(xiàn)下活動(dòng)中,SK海力士、三星和美光均展示了自己的HBM3e解決方案。據(jù)TrendForce預(yù)估,2024年全年HBM產(chǎn)能將同比提升260%,于整個(gè)DRAM行業(yè)產(chǎn)值占比從去年的8.4%擴(kuò)大至20.1%。不過(guò),對(duì)于存儲(chǔ)廠(chǎng)商而言,今年的訂單基本已經(jīng)排滿(mǎn)了,依照英偉達(dá)和AMD的發(fā)布計(jì)劃來(lái)看,即便在瘋狂擴(kuò)產(chǎn)下,2025年的產(chǎn)能恐怕也抵不住即將瘋狂襲來(lái)的訂單。

另一個(gè)即將從數(shù)據(jù)中心進(jìn)一步攫取更多市場(chǎng)機(jī)會(huì)的產(chǎn)業(yè)為液冷,而且服務(wù)器廠(chǎng)商們?cè)缫褱?zhǔn)備好了對(duì)應(yīng)的解決方案。目前隨著服務(wù)器AI算力的不斷增強(qiáng),液冷解決方案的普及率在整個(gè)服務(wù)器市場(chǎng)依然算不上高,甚至不到5%。

B200、GB200以及GB200 NVL72盡管一再?gòu)?qiáng)調(diào)提高了能效比,但對(duì)于單個(gè)系統(tǒng)的散熱要求依然提高了。畢竟單個(gè)GB200 NVL72機(jī)柜的計(jì)算單元規(guī)模就比過(guò)去的DGX系統(tǒng)高出不少,液冷是英偉達(dá)目前給出的唯一設(shè)計(jì),畢竟單個(gè)GB200超級(jí)芯片的最高TDP可達(dá)2700W。

為此服務(wù)器OEM幾乎同時(shí)宣布了對(duì)應(yīng)的液冷服務(wù)器配置方案,比如戴爾推出了首個(gè)采用液冷配置的PowerEdge XE9680服務(wù)器,Supermicro也發(fā)布了液冷ORV3 MGX系統(tǒng)。鴻海集團(tuán)也發(fā)布了針對(duì)GB200 NVL72的先進(jìn)液冷解決方案,具備高達(dá)1300kW的強(qiáng)大散熱能力。

最后自然就是服務(wù)器上的高速通信了,與B200同步公布的還有Quantum-X800 InfiniBand和Spectrum?-X800 Ethernet這兩大高速網(wǎng)絡(luò)解決方案。在與英偉達(dá)LinkX線(xiàn)纜和光模塊的組合下,可以做到最高2公里內(nèi)的800GB/s網(wǎng)絡(luò)傳輸速度。盡管這是英偉達(dá)收購(gòu)Mellanox后發(fā)布的專(zhuān)用方案,但無(wú)疑加快了800G網(wǎng)絡(luò)普及的進(jìn)程。

計(jì)算光刻,反哺芯片制造

去年,英偉達(dá)推出了cuLitho這一軟件庫(kù),借助GPU的強(qiáng)大算力有望將光罩的開(kāi)發(fā)速度提升40倍。在今天的GTC大會(huì)上,英偉達(dá)也宣布和臺(tái)積電、新思達(dá)成合作,正式將其計(jì)算光刻技術(shù)投入生態(tài)當(dāng)中去,并充分利用英偉達(dá)此次發(fā)布的Blackwell GPU。

計(jì)算光刻主要用于芯片的開(kāi)發(fā)和制造環(huán)節(jié),通過(guò)建立大量的數(shù)學(xué)和物理模型來(lái)幫助客戶(hù)設(shè)計(jì)光罩。相比傳統(tǒng)基于CPU的計(jì)算光刻技術(shù),基于GPU加速和生成式AI算法的計(jì)算光刻技術(shù)要高效得多,英偉達(dá)聲稱(chēng)集成了350個(gè)H100的系統(tǒng)就可以替代掉一個(gè)由40000個(gè)CPU組成的計(jì)算光刻系統(tǒng),加速生產(chǎn)時(shí)間的同時(shí),降低了成本、部署空間和功耗。

寫(xiě)在最后

盡管每次在英偉達(dá)展示其新品后,這些產(chǎn)品都會(huì)成為其他AI硬件公司拿來(lái)作為各種性能對(duì)比的參考,比如這次Groq就在GTC會(huì)后很快正面回應(yīng)了英偉達(dá),并發(fā)布了“Groq仍然更快”的聲明。然而,明眼人都能看出來(lái),在當(dāng)今的市場(chǎng)環(huán)境下,英偉達(dá)在A(yíng)I行業(yè)的地位依舊不可撼動(dòng)。

其中不僅有架構(gòu)創(chuàng)新、CUDA的功勞,也少不了英偉達(dá)在半導(dǎo)體上下游多年來(lái)的經(jīng)營(yíng)。臺(tái)積電優(yōu)先給英偉達(dá)CoWoS封裝產(chǎn)能,AI服務(wù)器廠(chǎng)商們?cè)诎l(fā)布會(huì)后一呼百應(yīng),都佐證了英偉達(dá)已經(jīng)為這個(gè)新計(jì)算時(shí)代打造好了一條完整且已經(jīng)得到證實(shí)的AI生態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4749

    瀏覽量

    129034
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3786

    瀏覽量

    91277
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    頭部電池企業(yè)擴(kuò)產(chǎn)熱,鎖單鋰鹽帶動(dòng)產(chǎn)業(yè)鏈高景氣

    自三季度以來(lái),電池行業(yè)迎來(lái)了顯著的復(fù)蘇跡象,以寧德時(shí)代和億緯鋰能為代表的領(lǐng)軍企業(yè)重啟并加速了投資與擴(kuò)產(chǎn)活動(dòng),且這些項(xiàng)目多以10GWh及以上的大規(guī)模為主。這系列動(dòng)作不僅限于產(chǎn)能擴(kuò)張,還帶動(dòng)了整個(gè)鋰電產(chǎn)業(yè)鏈上下游的活躍度提升,包括
    的頭像 發(fā)表于 10-28 13:46 ?252次閱讀

    NVIDIA DGX B200首次面向零售市場(chǎng):配備8塊B200 GPU

    10月13日最新消息,NVIDIA的DGX B200 AI服務(wù)器近期已在Broadberry上架,標(biāo)價(jià)515,410美元(相當(dāng)于約364.2萬(wàn)元人民幣)。   自發(fā)布以來(lái),Blackwell架構(gòu)就備受業(yè)界矚目,NVIDIA首席執(zhí)行官黃仁勛對(duì)其贊譽(yù)有加,微軟、Meta等科技巨頭也迅速跟進(jìn)采用。
    的頭像 發(fā)表于 10-14 14:34 ?663次閱讀

    英偉達(dá)或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達(dá)在美國(guó)加利福尼亞州圣何塞會(huì)議中心召開(kāi)的GTC 2024大會(huì)上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現(xiàn)行H100/H200
    的頭像 發(fā)表于 08-08 17:19 ?543次閱讀

    星曜半導(dǎo)體完成10億元B輪融資,中國(guó)移動(dòng)產(chǎn)業(yè)鏈發(fā)展基金領(lǐng)投

    近日,國(guó)內(nèi)射頻前端領(lǐng)域的領(lǐng)軍企業(yè)浙江星曜半導(dǎo)體有限公司(以下簡(jiǎn)稱(chēng)“星曜半導(dǎo)體”)宣布,已成功完成總額高達(dá)10億元的B輪融資,這融資額刷新了國(guó)內(nèi)近年來(lái)射頻前端賽道最大單輪融資記錄。本輪融資由中國(guó)移動(dòng)產(chǎn)業(yè)鏈
    的頭像 發(fā)表于 06-27 18:15 ?911次閱讀

    英偉達(dá)GPU新品規(guī)劃與HBM市場(chǎng)展望

    在COMPUTEX 2024主題演講中,英偉達(dá)(NVIDIA)公布了其GPU產(chǎn)品的未來(lái)規(guī)劃。據(jù)英偉達(dá)透露,B100、B200和GB200系列GPU
    的頭像 發(fā)表于 06-13 09:44 ?829次閱讀

    特斯拉加碼AI布局:xAI將采購(gòu)30萬(wàn)塊英偉達(dá)B200芯片

    特斯拉CEO埃隆·馬斯克近日在社交平臺(tái)上公布了項(xiàng)重要消息,旗下的人工智能初創(chuàng)公司xAI計(jì)劃采購(gòu)30萬(wàn)塊英偉達(dá)B200 AI芯片。這大規(guī)模采購(gòu)計(jì)劃標(biāo)志著特斯拉在人工智能領(lǐng)域布局的進(jìn)
    的頭像 發(fā)表于 06-05 09:21 ?670次閱讀

    進(jìn)步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    帶寬和1.8TB/s的NVLink帶寬,使處理能力翻倍,大幅增加內(nèi)存容量和帶寬,為處理大規(guī)模人工智能模型和復(fù)雜計(jì)算提供必要資源。 針對(duì)大規(guī)模模型如GPT-MoE-1.8T,HGX B200的推理性能比上一代
    發(fā)表于 05-13 17:16

    會(huì)員風(fēng)采!華秋電子——致力于“為電子產(chǎn)業(yè)增效降本”的數(shù)字化智造平臺(tái)

    ”、高可靠多層板制造平臺(tái)“華秋PCB”、電子元器件電商“華秋商城”、BOM鍵配單/SMT/PCBA服務(wù)的“華秋SMT”等電子產(chǎn)業(yè)站式服務(wù)平臺(tái)。全面打通產(chǎn)業(yè)上、中、下游,形成電子
    發(fā)表于 05-13 09:53

    英偉達(dá)H200性能顯著提升,年內(nèi)將推出B200新一代AI半導(dǎo)體

    天,NVIDIA發(fā)布了H200的性能評(píng)估報(bào)告,表明在與美國(guó)Meta公司的大型語(yǔ)言模型——LLM“Llama 2”的對(duì)比中,H200使AI導(dǎo)出答案的處理速度最高提升了45%。
    的頭像 發(fā)表于 04-01 09:36 ?1438次閱讀

    英偉達(dá)宣布推出新一代GPU Blackwell,SK海力士已量產(chǎn)HBM3E

    在英偉達(dá)GTC 2024大會(huì)上,英偉達(dá)CEO黃仁勛宣布推出新一代GPU Blackwell,第款Blackwell芯片名為GB200,將于今年晚些時(shí)候上市。
    的頭像 發(fā)表于 03-20 11:32 ?1230次閱讀
    英偉達(dá)宣布推出<b class='flag-5'>新一代</b><b class='flag-5'>GPU</b> Blackwell,SK海力士已量產(chǎn)HBM3E

    英偉達(dá)發(fā)布新一代AI芯片B200

    在美國(guó)加州圣何塞舉辦的英偉達(dá)GTC生態(tài)大會(huì)上,英偉達(dá)CEO黃仁勛以場(chǎng)震撼人心的演講,正式推出了公司的新一代GPU——Blackwell。作為Blackwell家族的首款芯片,B200
    的頭像 發(fā)表于 03-20 10:07 ?997次閱讀

    英偉達(dá)發(fā)布性能大幅提升的新款B200 AI GPU

    英偉達(dá)宣稱(chēng),B200在性能上比以往最好的GPU快30倍不止。由它構(gòu)成的服務(wù)器集群相比上一代,運(yùn)算能力飛躍性提升,甚至能使大語(yǔ)言模型的訓(xùn)練速度翻番。
    的頭像 發(fā)表于 03-20 09:37 ?825次閱讀

    英偉達(dá)計(jì)劃拉大GB200B100/B200規(guī)格差異,以刺激用戶(hù)購(gòu)買(mǎi)GB200

    早些時(shí)候,IT之家用張路線(xiàn)圖展示了英偉達(dá)計(jì)劃在2024年推出Hopper GH200 GPU,其后將依次推出基于Blackwell的GB200以及GX
    的頭像 發(fā)表于 03-14 16:36 ?2794次閱讀

    戴爾發(fā)布英偉達(dá)B200 AI GPU:高功耗達(dá)1000W,創(chuàng)新性冷卻工程設(shè)計(jì)必要

    市場(chǎng)傳言,這款B200雖然運(yùn)算性能更強(qiáng),卻又面臨著驚人的能耗,最高或可至1000W,同比H100增長(zhǎng)超過(guò)40%。由于搭載Hopper架構(gòu)及HBM3e高帶寬內(nèi)存,英偉達(dá)B200被行業(yè)視為運(yùn)行速度最高的AI芯片;
    的頭像 發(fā)表于 03-05 09:30 ?1968次閱讀

    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”

    根據(jù)各方信息和路線(xiàn)圖,NVIDIA預(yù)計(jì)會(huì)在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1356次閱讀
    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)的<b class='flag-5'>新一代</b><b class='flag-5'>GPU</b>加速器“<b class='flag-5'>B</b>100”