0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾Gaudi 3 AI芯片:5nm工藝設(shè)計,訓(xùn)練推理皆強(qiáng)

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-04-10 11:10 ? 次閱讀

4 月 9 日,英特爾在 Vision 2024 大會上公布最新一代 Gaudi 3 AI 芯片并宣布將于同年第三季度批量上市。相較于英偉達(dá) H100,Gaudi 3 訓(xùn)練性能提升 170%,推理能力增幅 50%,效率提升 40%,而成本顯著降低。

此外,英特爾在發(fā)布會上還宣布更改旗下數(shù)據(jù)中心CPU產(chǎn)品名稱:原“Granite Rapids”和“Sierra Forest”將更名為“Xeon 6”系列。新品預(yù)計今年發(fā)售,并支持性能提升后的標(biāo)準(zhǔn)化 MXFP4 數(shù)據(jù)格式。

除此之外,英特爾正研發(fā)適用于以太網(wǎng)的 AI NIC ASIC 及 AI NIC 小芯片。這兩款產(chǎn)品尤其適合于其未來的 XPU 和 Gaudi 3 處理器,有望通過英特爾代工廠對外銷售。有關(guān)網(wǎng)絡(luò)產(chǎn)品的詳細(xì)信息尚未公開。

據(jù)悉,Gaudi 3 采用 5nm 制程,F(xiàn)P8性能較前代翻番,BF16性能增大至四倍,網(wǎng)絡(luò)帶寬增加一倍,內(nèi)存帶寬擴(kuò)大約 1.5 倍,能夠提供Mezz卡、板載以及PCIe三種形式。

Gaudi 3擁有64個第五代張量處理核心和8個矩陣計算引擎,并配備128GBHBM內(nèi)存和96MBSRAM。設(shè)計有24條200GBERoCE標(biāo)準(zhǔn)以太網(wǎng)總線和最多16條PCIe5.0總線。

在板載版,聚類產(chǎn)品型號為HLB-325。由八塊Gaudi 3 Mezz卡組成的模塊提供約14.6PFLOPS的FP8性能,極大的帶寬速率達(dá)29.6TB/s的HBM2e內(nèi)存,64個線性計算引擎,192條200GBE網(wǎng)絡(luò)總線和上述所有。

在PCIe版本,型號為HL-338的卡具有單卡達(dá)1835TFLOPS的FP8峰值性能,128GBHBM2e內(nèi)存,8個線性計算引擎,24條200GBE網(wǎng)絡(luò)總線,功率消耗600W,占兩卡槽的整體空間高度。

一個由8個Gaudi 3 AI加速器構(gòu)成的節(jié)點(diǎn)可提供14.7PF FP8計算性能,128GB的內(nèi)存,8.4TB/s的網(wǎng)絡(luò)讀寫速度,而64個節(jié)點(diǎn)的集群(512個AI加速器)能提供的最大計算性能為7.52EF FP8,525.3TB的內(nèi)存和614TB/s的網(wǎng)絡(luò)讀寫速度。更高的,1024個節(jié)點(diǎn)的集群可以達(dá)到15EF FP8的計算性能,1PB的內(nèi)存和1,229PB每秒的網(wǎng)絡(luò)讀寫速度。

在實(shí)際測試中,與英偉達(dá)的主流產(chǎn)品H100比較,Gaudi 3在相同節(jié)點(diǎn)數(shù)時的平均訓(xùn)練時間要高出約1.7倍,LLAMA2 70億的模型參數(shù)的情況下超過了H100的1.5倍,對于LLAMA2 130億參數(shù)的模型,Gaudi 3在最高時也超過了H100的1.7倍,同樣,GPT 3已達(dá)到1750億參數(shù),且Gaudi 3在推理速度和能效表現(xiàn)上均優(yōu)

英特爾近日發(fā)布了其下一代 GPU 路線規(guī)劃——Gaudi 3,包括風(fēng)冷和液冷版本,計劃于明年三至四季度相繼批量交付。Gaudi 3 由戴爾、惠普、聯(lián)想及超微等眾多合作伙伴負(fù)責(zé)生產(chǎn)和銷售,據(jù)稱下半年有望登陸英特爾自家的云服務(wù)——Developer Cloud。除了 Gaudi 3,英特爾還向我們展示了公司在各層面的 AI 產(chǎn)品線的最新進(jìn)展。

為了更好地優(yōu)化 AI 的表現(xiàn),英特爾發(fā)布了全新的 Xeon 6 處理器,主要用于大模型的訓(xùn)練。Xeon 6 采用了高效能的 E-core 核心和高性能的 P-core 核心,其中 E-core 核心代號為 Sierra Forest,能效較前一代提升了整整兩倍半,而 P-core 則代號為 Granite Rapids,支持 MXFP4。值得一提的是,比起前一代 Xeon 處理器,Xeon 6 的機(jī)身架構(gòu)擴(kuò)展了整整 2.7 倍,已經(jīng)開始被許多用戶用來升級老舊設(shè)備,以此達(dá)到節(jié)能減排的目的。

值得一提的還有物聯(lián)網(wǎng)的應(yīng)用。今年,英特爾預(yù)計將共售出超過 4000 萬臺基于酷睿 Ultra 處理器的 AI PC,除了消費(fèi)級市場,AI 也正逐漸走進(jìn)人們生活的方方面面,如工業(yè)制造、醫(yī)療健康等領(lǐng)域。據(jù)悉,該公司將于年內(nèi)發(fā)布一系列新的邊緣芯片,這些產(chǎn)品將涵蓋酷睿 Ultra、酷睿、凌動處理器和 Arc GPU,旨在覆蓋多個不同行業(yè)的應(yīng)用需求。

另外,英特爾還透露計劃此次與Ultra Ethernet Consortium合作,推出一種名為 AI Ethernet 的網(wǎng)絡(luò)解決方案,專門解決海量數(shù)據(jù)遷移中的網(wǎng)絡(luò)擁堵問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9998

    瀏覽量

    172042
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10890

    瀏覽量

    212430
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4833

    瀏覽量

    72257
收藏 人收藏

    評論

    相關(guān)推薦

    使用英特爾AI PC為YOLO模型訓(xùn)練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進(jìn)行模型訓(xùn)練了。
    的頭像 發(fā)表于 12-09 16:14 ?426次閱讀
    使用<b class='flag-5'>英特爾</b><b class='flag-5'>AI</b> PC為YOLO模型<b class='flag-5'>訓(xùn)練</b>加速

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器和英特爾Gaudi 2D AI
    的頭像 發(fā)表于 12-03 11:20 ?264次閱讀

    Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉達(dá)GPU

    近日,人工智能技術(shù)公司Inflection AI宣布了一項(xiàng)重要決策,其最新的企業(yè)平臺將放棄采用英偉達(dá)(Nvidia)的GPU,轉(zhuǎn)而選擇英特爾Gaudi 3加速器。
    的頭像 發(fā)表于 10-10 17:21 ?510次閱讀

    Inflection AI攜手英特爾推出企業(yè)級AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi
    的頭像 發(fā)表于 10-09 16:40 ?460次閱讀

    英特爾調(diào)降明年AI服務(wù)器芯片出貨目標(biāo)

    近日,有消息稱英特爾為應(yīng)對內(nèi)部策略調(diào)整及終端需求變化,已對其旗下AI服務(wù)器芯片Gaudi 3的明年出貨目標(biāo)進(jìn)行了大幅調(diào)整。
    的頭像 發(fā)表于 10-08 15:38 ?296次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號H100與H200 GPU,但英特爾巧妙
    的頭像 發(fā)表于 09-26 16:16 ?855次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項(xiàng)重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI
    的頭像 發(fā)表于 09-03 15:52 ?411次閱讀

    英特爾3nm制程工藝“Intel 3”投入大批量生產(chǎn)

    據(jù)外媒最新報道,全球知名的處理器大廠英特爾在周三宣布了一個重要的里程碑:其先進(jìn)的3nm級制程工藝技術(shù)“Intel 3”已在兩個工廠正式投入大批量生產(chǎn)。這一技術(shù)的突破,無疑將為
    的頭像 發(fā)表于 06-21 09:31 ?571次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?565次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾特供芯片性能暴降92%!

    英特爾針對中國市場推出的特供版Gaudi 3芯片在性能上確實(shí)存在大幅下降的情況,這主要是由于美國對于AI
    的頭像 發(fā)表于 04-17 16:57 ?843次閱讀

    英特爾擬推出中國市場“特供版芯片Gaudi 3

    英特爾計劃在中國市場推出“特供版”Gaudi 3 AI芯片,這一決策主要是基于美國對于AI
    的頭像 發(fā)表于 04-16 14:48 ?606次閱讀

    英特爾的最強(qiáng)AI芯片要來了,聲稱性能完勝英偉達(dá)H100

    美國東部時間4月9日凌晨,英特爾發(fā)布了其最新的人工智能芯片Gaudi3,預(yù)計將在第三季度大范圍上市。 在當(dāng)天舉辦的Intel Vision 2024大會上,英特爾CEO帕特·基辛格(P
    的頭像 發(fā)表于 04-11 23:36 ?493次閱讀

    英特爾進(jìn)軍AI芯片市場:推出Gaudi 3 AI加速卡與Xeon 6處理器

    Gaudi 3作為英特爾AI領(lǐng)域的最新力作,旨在與英偉達(dá)等市場領(lǐng)導(dǎo)者展開競爭。據(jù)英特爾透露,這款芯片
    的頭像 發(fā)表于 04-10 15:37 ?828次閱讀

    英特爾發(fā)布人工智能芯片新版,對標(biāo)Nvidia

    為應(yīng)對AI行業(yè)對高性能芯片的巨大需求,英特爾推出了全新Gaudi 3芯片,據(jù)稱這一款
    的頭像 發(fā)表于 04-10 09:26 ?381次閱讀

    臺積電擴(kuò)增3nm產(chǎn)能,部分5nm產(chǎn)能轉(zhuǎn)向該節(jié)點(diǎn)

    目前,蘋果、高通、聯(lián)發(fā)科等世界知名廠商已與臺積電能達(dá)成緊密合作,預(yù)示臺積電將繼續(xù)增加 5nm產(chǎn)能至該節(jié)點(diǎn)以滿足客戶需求,這標(biāo)志著其在3nm制程領(lǐng)域已經(jīng)超越競爭對手三星及英特爾。
    的頭像 發(fā)表于 03-19 14:09 ?690次閱讀