0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾推出AI加速器性價(jià)比產(chǎn)品Gaudi2

IT葡萄皮 ? 來(lái)源:IT葡萄皮 ? 2023-07-14 16:42 ? 次閱讀

日前,英特爾面向中國(guó)市場(chǎng)發(fā)布了HabanaGaudi2深度學(xué)習(xí)加速卡器。

新的Gaudi2直接給到了24個(gè)Tensor處理核心(TPC),是上代產(chǎn)品的三倍;而在對(duì)大模型應(yīng)用至關(guān)重要的顯存方面,Gaudi2也大方的配置了96GBHBM2e,顯存帶寬直接達(dá)到了2.4TB/s。而在連接方式上,Gaudi2則采用了OCPOAM接口形式,可擴(kuò)展出21個(gè)100G以太網(wǎng)連接,并支持RoCE(RDMAover Converged Ethernet)v2。同時(shí),Gaudi2還集成了多媒體處理器引擎和48MB片上SRAM作為高速緩存。

在系統(tǒng)層面,英特爾則提供能夠同時(shí)安裝8塊Gaudi2的夾層基板,同樣遵循OCP標(biāo)準(zhǔn),可擴(kuò)展出24個(gè)100GRoCE網(wǎng)絡(luò)接口。

性能更好的新選擇

Gaudi2搭載的96GBHBM顯存的確令人眼前一亮,但真正能夠影響用戶購(gòu)買(mǎi)行為的仍舊似乎加速卡本身的計(jì)算性能。

在HuggingFace工程師RégisPierrard去年底進(jìn)行的Gaudi2測(cè)試中,Gaudi2不僅在與前代產(chǎn)品的對(duì)比中表現(xiàn)出了近乎線性的性能提升,更大幅超越了對(duì)標(biāo)的A100加速卡。

5261f29a-2220-11ee-962d-dac502259ad0.png

BERT預(yù)訓(xùn)練,8卡

Gaudi2使用bf16/fp32混合精度,A100使用fp16精度

526f3b26-2220-11ee-962d-dac502259ad0.png

StableDiffusion測(cè)試,單卡

從RégisPierrard使用IntelDeveloper Cloud進(jìn)行的兩輪測(cè)試中我們不難發(fā)現(xiàn),無(wú)論是在BERT這樣的大模型應(yīng)用中,還是在StableDiffusion這樣的“傳統(tǒng)”AIGC應(yīng)用中,Gaudi2的性能表現(xiàn)均相當(dāng)亮眼;相對(duì)于前代產(chǎn)品展現(xiàn)出了至少3倍的性能優(yōu)勢(shì)(Gaudi2的TPC數(shù)量是前代的3倍),且比對(duì)標(biāo)的A100產(chǎn)品更具性能優(yōu)勢(shì)。

在兩項(xiàng)測(cè)試中,Gaudi2均使用了英特爾推出的SynapseAI1.10套件和OptimumHabana1.6;其中前者是面向Gaudi系列加速卡的SDK開(kāi)發(fā)套件,能夠?qū)?a href="http://wenjunhu.com/tags/tensorflow/" target="_blank">TensorFlow和Pytorch等流行框架提供支持,而后者則是專門(mén)面向Transformers和Diffusers優(yōu)化的運(yùn)行庫(kù)。

同時(shí),在發(fā)布會(huì)的現(xiàn)場(chǎng)演示環(huán)節(jié),英特爾工作人員展示了StableDiffusion應(yīng)用中1至64張卡的計(jì)算性能,并實(shí)現(xiàn)了99%的近線性性能擴(kuò)展。換而言之,在更大規(guī)模的業(yè)務(wù)部署當(dāng)中,Gaudi2也能通過(guò)集群橫向擴(kuò)展獲得更加線性的性能增長(zhǎng)。

目前,Gaudi系列AI加速器已經(jīng)在AWS的EC2DL1主機(jī)中進(jìn)行了實(shí)際的商業(yè)部署。AWS表示,相對(duì)于傳統(tǒng)GPU,Gaudi能夠在深度學(xué)習(xí)應(yīng)用中帶來(lái)40%的性價(jià)比提升。

在走量的市場(chǎng)做走心的產(chǎn)品

誠(chéng)然,Gaudi2的競(jìng)品并非性能無(wú)兩的H100,更無(wú)法對(duì)即將面市的H100NVL構(gòu)成性能威脅。但對(duì)于更加“走量”的A100而言,Gaudi2所展現(xiàn)出的性價(jià)比則對(duì)大多數(shù)用戶而言更有價(jià)值。

近兩年,“從中端入局”似乎已經(jīng)成為英特爾的慣用手段,消費(fèi)級(jí)的Arc770顯卡和如今的Gaudi2均如此。

走量的中端市場(chǎng)對(duì)英特爾有足夠的吸引力,也更容易幫助英特爾用一兩款產(chǎn)品就建立口碑、站穩(wěn)腳跟;同時(shí),能在中端市場(chǎng)為用戶提供先進(jìn)技術(shù)和優(yōu)勢(shì)性價(jià)比也證明英特爾對(duì)目標(biāo)用戶足夠走心,愿意把真正的實(shí)惠帶給最廣闊的用戶市場(chǎng)。

在走量的市場(chǎng)做走心的產(chǎn)品,這樣的英特爾令人喜聞樂(lè)見(jiàn)。

為Ai加速器市場(chǎng)打開(kāi)一扇窗

近兩年,以AIGC為代表的AI應(yīng)用快速崛起,吸引了科技圈和投資界的廣泛關(guān)注,其中的語(yǔ)言類大模型更有望大幅降低企業(yè)在營(yíng)銷、客服和售后方面的成本,實(shí)現(xiàn)生產(chǎn)效率的大幅提升。

在科技企業(yè)爭(zhēng)相進(jìn)行大模型“軍備競(jìng)賽”的背后,GPU的需求也水漲船高。在GPU市場(chǎng)格局高度固化的當(dāng)下,這一現(xiàn)象很容易帶來(lái)終端市場(chǎng)的價(jià)格起伏,導(dǎo)致GPU價(jià)格畸高,進(jìn)而推高企業(yè)投身AI業(yè)務(wù)的成本并導(dǎo)致基礎(chǔ)架構(gòu)被綁定。

而英特爾Gaudi2加速卡的出現(xiàn)則意味著企業(yè)有了全新選擇。一方面,Gaudi2在絕對(duì)性能、顯存容量、集群性能等方面都比對(duì)標(biāo)產(chǎn)品有優(yōu)勢(shì),能夠承接現(xiàn)有的市場(chǎng)需求;另一方面,伴隨oneAPI等算力調(diào)用工具的不斷成熟和完善,用戶也能在開(kāi)發(fā)和應(yīng)用層面實(shí)現(xiàn)基礎(chǔ)架構(gòu)的透明化,更輕松的調(diào)用多元算力,繼而獲得算力和基礎(chǔ)架構(gòu)層面的靈活性。

528258aa-2220-11ee-962d-dac502259ad0.png

作為AI加速器市場(chǎng)的“追趕者”,Gaudi2證明英特爾能夠?yàn)橛脩籼峁┯懈?jìng)爭(zhēng)力的先進(jìn)產(chǎn)品。當(dāng)然,這還僅是在“獨(dú)立AI加速器”這一條賽道中。

在更廣闊的數(shù)據(jù)中心賽道中,英特爾還有并行的DataCenter Max和DataCenterFlex兩條產(chǎn)品線,以及更加獨(dú)立的FPGA賽道。此外,英特爾也在積極推動(dòng)AI能力與傳統(tǒng)CPU的結(jié)合。從最初的AVX-512指令集和DLBoost到如今AMX-512指令集,英特爾正在為用戶構(gòu)建一條“用CPU靈活處理AI推理業(yè)務(wù)”的全新路徑。

很顯然,在英特爾的眼中,用戶在未來(lái)應(yīng)該針對(duì)不同場(chǎng)景和不同業(yè)務(wù)負(fù)載來(lái)規(guī)劃不同的基礎(chǔ)架構(gòu),用不同算力來(lái)滿足業(yè)務(wù)需求。而伴隨oneAPI的逐步成熟,底層算力的區(qū)別將被抹除,模型訓(xùn)練和多端部署不再需要特別調(diào)優(yōu)就能實(shí)現(xiàn)無(wú)縫遷移和高效調(diào)優(yōu)。

在產(chǎn)品層面,英特爾最新推出的Gaudi2對(duì)用戶而言有足夠的吸引力;在戰(zhàn)略層面,Gaud2則是英特爾站穩(wěn)獨(dú)立AI加速器市場(chǎng)并構(gòu)筑多元算力體系的重要一步。而在AI研究快速推進(jìn),技術(shù)落地如火如荼的當(dāng)下,Gaudi2的出現(xiàn)無(wú)疑為用戶帶來(lái)了全新選擇;而奮力前行的英特爾更有望為市場(chǎng)帶來(lái)AI與算力需求之間的全新平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9974

    瀏覽量

    171823
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    799

    瀏覽量

    37897
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269213
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    107

原文標(biāo)題:先得走心,才能走量!英特爾推出AI加速器性價(jià)比產(chǎn)品Gaudi2

文章出處:【微信號(hào):IT葡萄皮,微信公眾號(hào):IT葡萄皮】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理英特爾
    的頭像 發(fā)表于 12-03 11:20 ?233次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    近日,英特爾正式推出了其全新的企業(yè)AI一體化解決方案,這一方案旨在為企業(yè)提供更加開(kāi)放、可擴(kuò)展且高效的端到端服務(wù)。 該方案的核心在于其全棧硬件的支撐,包括英特爾至強(qiáng)處理
    的頭像 發(fā)表于 12-02 10:48 ?513次閱讀

    Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉達(dá)GPU

    近日,人工智能技術(shù)公司Inflection AI宣布了一項(xiàng)重要決策,其最新的企業(yè)平臺(tái)將放棄采用英偉達(dá)(Nvidia)的GPU,轉(zhuǎn)而選擇英特爾Gaudi 3加速器。
    的頭像 發(fā)表于 10-10 17:21 ?498次閱讀

    Inflection AI攜手英特爾推出企業(yè)級(jí)AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi
    的頭像 發(fā)表于 10-09 16:40 ?450次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢(shì)挑戰(zhàn)市場(chǎng)

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門(mén)型號(hào)H100與H200 GPU,但英特爾巧妙
    的頭像 發(fā)表于 09-26 16:16 ?833次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項(xiàng)重大合作計(jì)劃,雙方將共同在IBM Cloud平臺(tái)上部署英特爾最新的Gaudi 3 AI芯片,預(yù)計(jì)該服務(wù)將于2025年初正式上線。此次合作標(biāo)志著兩家
    的頭像 發(fā)表于 09-03 15:52 ?394次閱讀

    從運(yùn)動(dòng)員到開(kāi)發(fā)者: 英特爾以開(kāi)放式AI系統(tǒng)應(yīng)對(duì)多重挑戰(zhàn)

    打造的生成式AI(GenAI)檢索增強(qiáng)生成(RAG)解決方案。該成果深度展示了英特爾如何通過(guò)基于英特爾?至強(qiáng)?處理英特爾??
    的頭像 發(fā)表于 07-25 09:28 ?290次閱讀
    從運(yùn)動(dòng)員到開(kāi)發(fā)者: <b class='flag-5'>英特爾</b>以開(kāi)放式<b class='flag-5'>AI</b>系統(tǒng)應(yīng)對(duì)多重挑戰(zhàn)

    英特爾發(fā)布新一代Lunar Lake處理

    在近期舉辦的中國(guó)臺(tái)北國(guó)際電腦展(Computex)上,英特爾CEO蓋爾辛格向全球展示了其最新的技術(shù)成果。他發(fā)布了第六代至強(qiáng)處理,并重點(diǎn)強(qiáng)調(diào)了Gaudi AI
    的頭像 發(fā)表于 06-05 11:23 ?942次閱讀

    英特爾確認(rèn)Ponte Vecchio GPU將以云服務(wù)形式推出

    英特爾在公告中強(qiáng)調(diào),隨著AI技術(shù)需求的不斷增加,公司重點(diǎn)利用Gaudi AI加速器的性能優(yōu)勢(shì)及有競(jìng)爭(zhēng)力的價(jià)格,實(shí)現(xiàn)其迅速拓展。同時(shí),至強(qiáng)系列
    的頭像 發(fā)表于 05-18 17:14 ?1063次閱讀

    英特爾推出中國(guó)市場(chǎng)“特供版芯片”Gaudi 3

    英特爾計(jì)劃在中國(guó)市場(chǎng)推出“特供版”Gaudi 3 AI芯片,這一決策主要是基于美國(guó)對(duì)于AI芯片的出口管制政策。
    的頭像 發(fā)表于 04-16 14:48 ?578次閱讀

    英特爾公布Gaudi 3 AI加速器中國(guó)特供版計(jì)劃

    這兩款專供版加速卡,分別被命名為HL-328和HL-388,它們代表了英特爾AI加速領(lǐng)域的最新技術(shù)成果。
    的頭像 發(fā)表于 04-15 15:19 ?753次閱讀

    Intel Vision 2024大會(huì): 英特爾發(fā)布全新軟硬件平臺(tái),全速助力企業(yè)推進(jìn)AI創(chuàng)新

    的下一代英特爾?至強(qiáng)?6處理的全新品牌。 ?推出英特爾?Gaudi 3 AI
    的頭像 發(fā)表于 04-12 14:52 ?551次閱讀
    Intel Vision 2024大會(huì): <b class='flag-5'>英特爾</b>發(fā)布全新軟硬件平臺(tái),全速助力企業(yè)推進(jìn)<b class='flag-5'>AI</b>創(chuàng)新

    英特爾的最強(qiáng)AI芯片要來(lái)了,聲稱性能完勝英偉達(dá)H100

    美國(guó)東部時(shí)間4月9日凌晨,英特爾發(fā)布了其最新的人工智能芯片Gaudi3,預(yù)計(jì)將在第三季度大范圍上市。 在當(dāng)天舉辦的Intel Vision 2024大會(huì)上,英特爾CEO帕特·基辛格(Pat
    的頭像 發(fā)表于 04-11 23:36 ?471次閱讀

    英特爾進(jìn)軍AI芯片市場(chǎng):推出Gaudi 3 AI加速卡與Xeon 6處理

    Gaudi 3作為英特爾AI領(lǐng)域的最新力作,旨在與英偉達(dá)等市場(chǎng)領(lǐng)導(dǎo)者展開(kāi)競(jìng)爭(zhēng)。據(jù)英特爾透露,這款芯片在能效和AI模型運(yùn)行速度方面均表現(xiàn)出色
    的頭像 發(fā)表于 04-10 15:37 ?799次閱讀

    英特爾升級(jí)AI PC加速計(jì)劃

    近日,英特爾公司正式推出AI PC加速計(jì)劃”,旨在通過(guò)兩大新舉措進(jìn)一步推動(dòng)人工智能技術(shù)在個(gè)人電腦領(lǐng)域的應(yīng)用與發(fā)展。
    的頭像 發(fā)表于 03-28 11:46 ?686次閱讀