0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

第五代英特爾至強(qiáng)處理器,AI特化的通用服務(wù)器CPU

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-03-18 08:14 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI已經(jīng)成了數(shù)據(jù)中心與服務(wù)器市場(chǎng)的主流應(yīng)用,就連通用服務(wù)器CPU,也開(kāi)始著重加強(qiáng)AI計(jì)算能力。為此,英特爾于去年年底發(fā)布了第五代至強(qiáng)處理器,進(jìn)一步提升通用計(jì)算性能的同時(shí),也新增了AI相關(guān)的新指令集,諸如AXM、AVX等。

第五代至強(qiáng)可擴(kuò)展處理器架構(gòu)剖析

2023年年底發(fā)布的第五代至強(qiáng),雖然和第四代至強(qiáng)一樣都是基于Intel 7制程打造的,并采用了Dual-poly-pitch SuperFin晶體管技術(shù),但英特爾依然在關(guān)鍵的技術(shù)指標(biāo)上做了改進(jìn),比如系統(tǒng)的漏電流控制和動(dòng)態(tài)電容等。在這些改進(jìn)下,整體上第五代至強(qiáng)在同等功耗下的頻率可以提升3%,其中有2.5%是由漏電流控制貢獻(xiàn)的,動(dòng)態(tài)電容下降貢獻(xiàn)了0.5%。

wKgZomX2-7OAaSdfAAMY-mbGl1w468.png

除此之外,第五代至強(qiáng)的多芯片封裝方式有所改變,第四代至強(qiáng)就是把芯片分為四個(gè)部分,這四個(gè)部分是相對(duì)對(duì)稱的。而第五代至強(qiáng)的切分方式則做了調(diào)整,把切四份的做法變成了切兩份。過(guò)去每?jī)善g相互進(jìn)行通信時(shí),需要有一些芯片互連之間的接口,不僅占用了額外的芯片面積,也額外增加了功耗。如今隨著芯片質(zhì)量控制得到進(jìn)一步改進(jìn),英特爾可以在相對(duì)較大的面積下依舊獲得很好的良率,所以通過(guò)將四芯片改為兩芯片的方式,芯片的面積得到了更好的控制。

此外第五代至強(qiáng)的處理核心升級(jí)到了Raptor Cove核心,核心數(shù)從最多的60核升級(jí)到64核。在I/O速度上,DDR速度從4800MT/s提升到了5600MT/s,UPI速度從16GT/s提升到20GT/s。而最大的升級(jí)之一當(dāng)屬LLC大小,單個(gè)模塊的LLC容量從1.875MB增加到了5MB。這樣如果處理規(guī)模較小的數(shù)據(jù)集時(shí),甚至可以將主要數(shù)據(jù)放在LLC緩存中,從而大量減少內(nèi)存訪問(wèn),進(jìn)而大幅提高性能。這些架構(gòu)上的改進(jìn),也使其在生成式AI和LLM等AI應(yīng)用上的性能得到了提升。

通用服務(wù)器上跑AI

除了傳統(tǒng)的CPU計(jì)算核心外,英特爾也增加了AMX加速器,專門針對(duì)矩陣運(yùn)算。根據(jù)測(cè)試,AI推理的性能與上一代相比提升了至多42%。針對(duì)非大模型類的AI應(yīng)用,英特爾始終致力于在CPU上部署AI,并結(jié)合其OpenVINO生態(tài)進(jìn)行優(yōu)化,比如推薦、語(yǔ)音識(shí)別、圖像識(shí)別等。

而面對(duì)推薦系統(tǒng),尤其是面對(duì)GPU也無(wú)法單獨(dú)處理的大模型時(shí),CPU反而更快。因?yàn)镚PU不夠用的時(shí)候,玩玩需要跨GPU計(jì)算,或者需要和CPU頻繁交互,如此一來(lái)CPU效率更高。

對(duì)于通用的AI工作負(fù)載,英特爾采用AMX和AVX-512兩個(gè)指令集,基于OpenVINO進(jìn)行優(yōu)化。在推理的過(guò)程中,指令集上可以進(jìn)行切分,通過(guò)加速器定向加速某一部分,甚至可以替代傳統(tǒng)的基于GPU的AI模型。

除此之外,還有成本上的考量,在模型調(diào)優(yōu)、推理、應(yīng)用上,使用通用服務(wù)器有非常大的性價(jià)比提升。尤其是當(dāng)企業(yè)并不需要24小時(shí)都要跑大模型,大模型只是對(duì)業(yè)務(wù)的輔助時(shí),比如聊天機(jī)器人、或是內(nèi)容生成、提綱分析等,這些只是幫助企業(yè)業(yè)務(wù)的生產(chǎn)力提高,尤其是在私有云上,就沒(méi)有必要再重新部署一個(gè)新的GPU的平臺(tái)。因?yàn)橐粋€(gè)新的平臺(tái)意味著需要考慮開(kāi)發(fā)、運(yùn)維等因素,成本有可能增加,而這對(duì)于企業(yè)來(lái)說(shuō)也可能會(huì)成為負(fù)擔(dān)。

以合作伙伴舉例,比如百度云也有基于第五代至強(qiáng)的服務(wù)器,提供了可以在CPU上運(yùn)行的大型計(jì)算模型的服務(wù);在京東基于第五代至強(qiáng)的應(yīng)用中可以看到,和前一代的處理器相比,在Llama2 13B的模型上,看到有50%的性能提升。所以第五代至強(qiáng)在AI上應(yīng)用的性能提升是比較明顯的。

再者就是編解碼上的應(yīng)用,目前主流客戶為了達(dá)到更好的圖像質(zhì)量,反而會(huì)采用CPU做編解碼。GPU在擁有硬件加速的情況下,其特點(diǎn)是快,但視頻編解碼質(zhì)量往往略差于CPU。通過(guò)第五代至強(qiáng)處理器AMX-INT8的加持,已經(jīng)把吞吐從原來(lái)的1.5FPS增強(qiáng)到了33FPS,基本可以滿足實(shí)時(shí)編碼的需求。


下一代至強(qiáng)路線圖

從路線圖上來(lái)看,2024年英特爾還會(huì)發(fā)布新一代英特爾至強(qiáng)可擴(kuò)展處理器,而且有一個(gè)非常豐富的產(chǎn)品組合,同時(shí)滿足對(duì)性能和能耗的要求?;诂F(xiàn)在的第五代至強(qiáng),英特爾也會(huì)發(fā)布下一代的性能核,就是高主頻、高性能的CPU核架構(gòu),為主流和復(fù)雜的數(shù)據(jù)中心的應(yīng)用進(jìn)行性能優(yōu)化,尤其是目前有很多程序是跑在虛擬機(jī)上,之前寫(xiě)的非常大的程序要跑在性能核上的,才能看到一個(gè)非常好的性能提升。


同時(shí)對(duì)新興的,尤其是基于云原生的設(shè)計(jì),英特爾還提供基于能效核打造的至強(qiáng)處理器,每瓦性能可以做到相對(duì)極致,而且因?yàn)樗暮诵脑O(shè)計(jì)比較精簡(jiǎn),可以放更多高密度的核數(shù)到每一款的CPU和服務(wù)器,從而支持面向云的高密度超高能效的運(yùn)算進(jìn)行能效的優(yōu)化。在近期對(duì)于產(chǎn)品淘汰換新的要求中,有一個(gè)重要考量因素就是能效比,這同樣也是符合國(guó)家對(duì)設(shè)備淘汰換新的要求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19286

    瀏覽量

    229811
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9964

    瀏覽量

    171763
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10863

    瀏覽量

    211746
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269063
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    聯(lián)想發(fā)布基于第五代AMD EPYC處理器服務(wù)器產(chǎn)品

    近日,聯(lián)想攜手AMD共同舉辦“異構(gòu)智算,穩(wěn)定高效——聯(lián)想算力基礎(chǔ)設(shè)施新品發(fā)布會(huì)”。本次發(fā)布會(huì)上,聯(lián)想重磅發(fā)布8款基于第五代AMD EPYC處理器服務(wù)器產(chǎn)品——聯(lián)想問(wèn)天、ThinkSystem V3
    的頭像 發(fā)表于 12-16 16:23 ?246次閱讀

    面向科學(xué)計(jì)算,第五代英特爾至強(qiáng)可擴(kuò)展處理器優(yōu)勢(shì)何在

    與上一產(chǎn)品相比:第五代英特爾?至強(qiáng)?處理器的平均科學(xué)計(jì)算性能提升高達(dá)1.22倍,可以幫助企業(yè)顯著提升基礎(chǔ)設(shè)施的價(jià)值1;平均每瓦性能提升高達(dá)
    的頭像 發(fā)表于 12-07 10:56 ?469次閱讀

    第五代AMD EPYC處理器預(yù)計(jì)下半年發(fā)布

    近日,在Computex 2024上,AMD董事會(huì)主席及首席執(zhí)行官Lisa Su博士向大家預(yù)覽了具有超強(qiáng)性能的下一 EPYC 處理器——第五代 AMD EPYC 處理器(代號(hào)“Tur
    的頭像 發(fā)表于 09-18 11:06 ?635次閱讀

    開(kāi)箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)器系統(tǒng)性能測(cè)試規(guī)范》(征求意見(jiàn)稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展
    的頭像 發(fā)表于 09-06 15:33 ?342次閱讀
    開(kāi)箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b><b class='flag-5'>處理器</b>的卓越推理性能

    浪潮信息元腦?服務(wù)器率先支持英特爾?至強(qiáng)?6處理器

    北京2024年6月7日?/美通社/ -- 6月6日,英特爾在全球范圍內(nèi)發(fā)布了英特爾?至強(qiáng)?6處理器,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥受邀參會(huì)并
    的頭像 發(fā)表于 06-07 15:36 ?397次閱讀
    浪潮信息元腦?<b class='flag-5'>服務(wù)器</b>率先支持<b class='flag-5'>英特爾</b>?<b class='flag-5'>至強(qiáng)</b>?6<b class='flag-5'>處理器</b>

    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

    “基于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器,可以在滿足大量AI推理
    的頭像 發(fā)表于 05-27 11:46 ?827次閱讀
    寧暢B5000 G5多節(jié)點(diǎn)<b class='flag-5'>服務(wù)器</b>采用<b class='flag-5'>第五代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b>可擴(kuò)展<b class='flag-5'>處理器</b>

    騰訊云正式上線第八服務(wù)器標(biāo)準(zhǔn)型實(shí)例S8和內(nèi)存型實(shí)例M8

    4月15日,騰訊云正式上線第八服務(wù)器標(biāo)準(zhǔn)型實(shí)例 S8和內(nèi)存型實(shí)例M8?;谧匝?b class='flag-5'>服務(wù)器的高密設(shè)計(jì)與硬件升級(jí),搭載第五代英特爾
    的頭像 發(fā)表于 04-30 17:16 ?2042次閱讀
    騰訊云正式上線第八<b class='flag-5'>代</b>云<b class='flag-5'>服務(wù)器</b>標(biāo)準(zhǔn)型實(shí)例S8和內(nèi)存型實(shí)例M8

    借助英特爾? QAT從而顯著提升網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用的性能

    全新第四第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器內(nèi)置英特爾? 數(shù)據(jù)保護(hù)與壓縮加速技術(shù)(
    的頭像 發(fā)表于 03-18 16:25 ?1005次閱讀
    借助<b class='flag-5'>英特爾</b>? QAT從而顯著提升網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用的性能

    新升級(jí) 浪潮信息邊緣服務(wù)器支持英特爾第五代至強(qiáng)處理器

    北京2024年3月5日 /美通社/ -- 近日,浪潮信息邊緣服務(wù)器NE5260G7完成第五代英特爾?至強(qiáng)?處理器適配,實(shí)現(xiàn)平均性能提升 21
    的頭像 發(fā)表于 03-06 14:34 ?377次閱讀
    新升級(jí) 浪潮信息邊緣<b class='flag-5'>服務(wù)器</b>支持<b class='flag-5'>英特爾</b><b class='flag-5'>第五代</b><b class='flag-5'>至強(qiáng)</b><b class='flag-5'>處理器</b>

    浪潮信息NE5260G7服務(wù)器適配第五代英特爾至強(qiáng)處理器

    浪潮信息近日宣布,其邊緣服務(wù)器NE5260G7已成功適配第五代英特爾至強(qiáng)處理器,實(shí)現(xiàn)了平均性能21%的提升。這一創(chuàng)新產(chǎn)品不僅針對(duì)邊緣
    的頭像 發(fā)表于 03-06 09:29 ?902次閱讀

    第五代英特爾至強(qiáng),以卓越性能為多元化工作負(fù)載“保駕護(hù)航”

    第五代英特爾至強(qiáng)鉑金?8592+處理器憑借更優(yōu)化的SoC,三倍更大緩存和更快內(nèi)存,在運(yùn)行諸多工作負(fù)載時(shí)具備與眾不同的優(yōu)勢(shì),尤其是AI工作負(fù)載
    的頭像 發(fā)表于 02-28 09:50 ?490次閱讀

    英特爾至強(qiáng)處理器優(yōu)化升級(jí),助力打造未來(lái)高能效數(shù)據(jù)中心

    %。與此同時(shí),英特爾還對(duì)該處理器進(jìn)行了大量?jī)?yōu)化,以滿足日益增長(zhǎng)的AI算力需求。 該適用于企業(yè)級(jí)服務(wù)器英特爾高端
    的頭像 發(fā)表于 02-26 17:39 ?715次閱讀

    第五代英特爾至強(qiáng)可擴(kuò)展處理器以強(qiáng)勁性能,打造更“全能”的計(jì)算

    ? ? ? ?隨著第五代英特爾至強(qiáng)可擴(kuò)展處理器(以下簡(jiǎn)稱“第五代至強(qiáng)”)的問(wèn)世,其也成為了多年來(lái)
    的頭像 發(fā)表于 01-19 15:40 ?662次閱讀

    阿里云第八企業(yè)級(jí)實(shí)例g8i搭載第五代英特爾至強(qiáng)可擴(kuò)展處理器

    全球領(lǐng)先的云計(jì)算廠商阿里云宣布第八企業(yè)級(jí)通用計(jì)算實(shí)例 ECS g8i 算力再升級(jí),國(guó)內(nèi)首發(fā)搭載代號(hào) Emerald Rapids 的第五代英特爾
    的頭像 發(fā)表于 01-15 11:28 ?950次閱讀
    阿里云第八<b class='flag-5'>代</b>企業(yè)級(jí)實(shí)例g8i搭載<b class='flag-5'>第五代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b>可擴(kuò)展<b class='flag-5'>處理器</b>

    H3C UIS超融合方案采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

    超融合是軟件定義時(shí)代,企業(yè)構(gòu)建基礎(chǔ)設(shè)施的卓越選擇。受益于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的性能優(yōu)勢(shì),我們?cè)鰪?qiáng)了 H3C UIS 超融合方案在數(shù)據(jù)庫(kù)等關(guān)鍵業(yè)務(wù)中的表現(xiàn),實(shí)現(xiàn)了顯著的代際性
    的頭像 發(fā)表于 01-13 10:54 ?1380次閱讀
    H3C UIS超融合方案采用<b class='flag-5'>第五代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b>可擴(kuò)展<b class='flag-5'>處理器</b>