繼英特爾發(fā)布全新一代AI加速芯片Gaudi 3后,近日宣布將專為中國市場(chǎng)推出特別版本—HL-328及HL-388兩款硬件產(chǎn)品。這兩款硬件均兼容OAM相容夾層卡與PCle加速卡兩種形式。
據(jù)官方透露,Gaudi 3的白皮書中詳細(xì)描述了這兩款硬件的上市時(shí)間表,分別是6月24日的HL-328以及9月24日的HL-388。
在硬件規(guī)格方面,中國版Gaudi 3與原版保持一致,同樣具備96MB SRAM片上存儲(chǔ)、128GB HBM2e高帶寬存儲(chǔ),帶寬高達(dá)3.7TB/s,并配備PCIe 5.0 x16接口和解碼標(biāo)準(zhǔn)。然而,受美國對(duì)AI芯片出口管制規(guī)定影響,該款芯片的綜合運(yùn)算性能(TPP)需控制在4800以下方可出口至中國,這意味著中國版Gaudi 3的16位性能不得超過150 TFLOPS。
據(jù)英特爾數(shù)據(jù)顯示,Gaudi 3在FP16/BF16計(jì)算模式下可實(shí)現(xiàn)1835 TFLOPS,較之英偉達(dá)H100在大模型訓(xùn)練速度提升40%,推理效率提高50%。
顯而易見,為了符合出口規(guī)定,中國版Gaudi 3必須大幅度降低AI性能。為此,中國版Gaudi 3可能會(huì)減少核心數(shù)量(原版包含8個(gè)矩陣數(shù)學(xué)引擎和64個(gè)張量?jī)?nèi)核)和降低工作頻率。
-
英特爾
+關(guān)注
關(guān)注
61文章
9964瀏覽量
171784 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85851 -
sram
+關(guān)注
關(guān)注
6文章
767瀏覽量
114691
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論