0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百核千核,服務(wù)器芯片多核才是王道?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-06-01 00:05 ? 次閱讀

要說造芯這件事,不僅手機(jī)和汽車廠商熱衷于此,如今服務(wù)器廠商也紛紛投入自研大軍中來,無論是國內(nèi)的阿里云,還是國外的亞馬遜,在收購一大批芯片設(shè)計(jì)廠商網(wǎng)羅了一眾芯片設(shè)計(jì)精銳后,也開始推出基于自己芯片的服務(wù)器,所用工藝也已經(jīng)升級(jí)到了7nm和5nm。

此外,第三方服務(wù)器芯片廠商也順勢(shì)發(fā)力,打算為這些云服務(wù)廠商提供更高的吸引力,而不是讓他們整天想著節(jié)省成本用自研方案替換掉自己的產(chǎn)品。好在大部分云服務(wù)廠商自研的芯片主要還是集中在AI加速芯片和網(wǎng)絡(luò)芯片這一塊,CPU很大一部分仍是第三方的地盤。而在第三方的CPU設(shè)計(jì)中,我們可以看到多核已經(jīng)成了當(dāng)下的主流方案。

多核云端更吃香?

首先我們來看最常見也最直接的一種提升性能方式,堆核心。這種操作我們已經(jīng)在消費(fèi)芯片或是各個(gè)電子產(chǎn)品的宣傳術(shù)語中聽得耳朵生繭了,且向來都是一種相當(dāng)有效的性能提升方式。盡管則對(duì)芯片的面積限制較大,但不可否認(rèn)的是,在對(duì)面積沒那么看重的服務(wù)器市場(chǎng)上,走多核路線的芯片廠商越來越多。

AmpereComputing的AmpereAltra應(yīng)該是國內(nèi)出貨量最高的Arm服務(wù)器CPU系列了,這款最高128核的處理器已經(jīng)在不少云服務(wù)的實(shí)例上亮相。AmpereComputing與微軟Azure和OracleCloud達(dá)成了合作,在中國不僅擁有阿里云、騰訊云、京東云和UCloud這些公有云客戶,百度、美團(tuán)和字節(jié)跳動(dòng)等公司也在使用其產(chǎn)品。

AmpereAltraMax封裝 / AmpereComputing


再來看看英偉達(dá)的ArmCPU Grace,雖然采用了Arm的Neoverse參考設(shè)計(jì),但英偉達(dá)同樣選了144核的多核心設(shè)計(jì),那么為何多核在服務(wù)器上如此吃香呢?我們上面也提到了AmpereAltra在中國收獲了不小的市場(chǎng),其實(shí)歸根結(jié)底就是其多核心數(shù)的功勞。

國內(nèi)使用公有云的用戶數(shù)遠(yuǎn)超國外,對(duì)于云服務(wù)廠商來說,這種多核處理器意味著可以將單服務(wù)器切分為更多的vCPU,也就意味著更多的可用實(shí)例。這還沒完,以AmpereAltra為例,每個(gè)核心上只運(yùn)行單個(gè)線程,這樣即便多用戶同時(shí)使用下,依然能夠維持穩(wěn)定的性能。

Ampere處理器路線圖 / AmpereComputing


值得一提的是,Ampere近期發(fā)布了自研5nm處理器,AmpereOne,一個(gè)基于自研Arm核心的服務(wù)器處理器。這對(duì)于其他廠商來說或許無法實(shí)現(xiàn),但Ampere作為Arm架構(gòu)的授權(quán)商,是可以像高通、華為和蘋果等廠商一樣,開發(fā)定制自己的Arm核心的。

也或許是因?yàn)檫@次終于沒有繼續(xù)沿用ArmNeoverseN1或N2這樣的參考設(shè)計(jì),Ampere才將這一產(chǎn)品命名為AmpereOne。Ampere并沒有公布這一產(chǎn)品的核心數(shù),但從現(xiàn)有產(chǎn)品最小核心數(shù)也有32核的設(shè)計(jì),以及AmpereOne實(shí)物圖與AmpereAltraMax近似的封裝來推斷,這一新品追求的必然是更高性能的云原生應(yīng)用,而不是面向只需較低核心數(shù)就能滿足需求的邊緣計(jì)算市場(chǎng)。

服務(wù)器AI芯片靠數(shù)量和能耗制勝

與處理器芯片處理通用計(jì)算的多核策略不同,AI芯片的多核主要還是提高AI計(jì)算效率,而且單核能效比和單位面積效率往往高于傳統(tǒng)的處理器架構(gòu),導(dǎo)致核心數(shù)更多。以打造千核RISC-V AI芯片的Esperanto為例,其ET-SoC-1芯片基于臺(tái)積電7nm打造,集成了1092個(gè)RISC-V核心。

ET-SoC-1芯片 / Esperanto


但就是這樣一個(gè)千核芯片,卻可以做到20W以內(nèi)的功耗和570mm2的diesize。正因如此,即便單個(gè)ET-SoC-1的算力不及英偉達(dá)A100這類GPU,也可以憑借多塊芯片組成的AI加速器板卡來實(shí)現(xiàn)同等的性能,甚至低上一大截的功耗。

對(duì)于依賴陣列乘法器這類專用硬件和少量CPU核心的芯片,一旦問題不能完全由專用硬件解決,就會(huì)把任務(wù)交給有限的通用CPU核心。而Esperanto的ET-SoC-1方案中,上千顆通用RISC-V核心帶來的完全并行可以顯著加快執(zhí)行速度。何況哪怕相較于5nm而言,7nm的能效比也還是非常優(yōu)異的,所以更適合這類超多核心數(shù)的設(shè)計(jì),也更符合數(shù)字中心的低碳設(shè)計(jì)理念。

結(jié)語

有的讀者可能會(huì)有疑惑,既然多核能給服務(wù)器芯片帶來顯著的提升,為何英特爾AMD這些x86服務(wù)器芯片廠商不設(shè)計(jì)百核以上的架構(gòu)呢?這就與CISC與RISC架構(gòu)的差異有關(guān)了,哪怕在同等工藝和同等核心數(shù)下,x86芯片的diesize也絕對(duì)要大于Arm和RISC-V芯片,而隨著diesize的增加,芯片的良率也會(huì)一并減少。再者就是多核下的并行問題了,一些通用計(jì)算任務(wù)在多核下的并行執(zhí)行效率并不高,而且會(huì)大幅提升復(fù)雜性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51019

    瀏覽量

    425339
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9253

    瀏覽量

    85743
  • 服務(wù)器芯片
    +關(guān)注

    關(guān)注

    2

    文章

    123

    瀏覽量

    19266
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    景銳51芯片ISP燒錄工具

    景銳51芯片ISP燒錄工具
    發(fā)表于 01-12 09:50 ?0次下載

    高斯濾波的卷積怎么確定

    N為一個(gè)奇數(shù),如3、5、7等。奇數(shù)大小的卷積有助于確定一個(gè)中心像素點(diǎn),便于計(jì)算。 大小選擇 :卷積的大小決定了濾波的范圍。較大的卷積核可以覆蓋更多的像素點(diǎn),從而更好地平滑圖像,但也可能導(dǎo)致圖像細(xì)節(jié)丟失過多。因此,在
    的頭像 發(fā)表于 09-29 09:29 ?669次閱讀

    龍芯中科胡偉武:3B6600 八桌面 CPU 性能將達(dá)到英特爾中高端酷睿 12~13 代水平

    推出的桌面端 CPU 龍芯 3A6000,實(shí)測(cè)性能相當(dāng)于英特爾公司 2020 年上市的第十代酷睿四處理;龍芯今年研制成功的16 及 32 版龍芯 3C6000
    發(fā)表于 08-13 11:16

    集特雙路服務(wù)器GDC-2001介紹

    處理的峰值性能已經(jīng)能與典型 ARM 64 處理的峰值性能相當(dāng) 下面要給大家介紹的集特家族長江系列服務(wù)器新成員——GDC-2001服務(wù)器
    的頭像 發(fā)表于 07-04 11:45 ?356次閱讀
    集特雙路<b class='flag-5'>服務(wù)器</b>GDC-2001介紹

    FPGA的IP軟使用技巧

    的IP軟 : 根據(jù)項(xiàng)目需求選擇合適的IP軟,如FIFO、RAM、FIR濾波、SDRAM控制、PCIE接口等。確保所選IP軟核能夠滿足項(xiàng)目的功能需求。 注意IP軟
    發(fā)表于 05-27 16:13

    RISC-V在服務(wù)器方面應(yīng)用與發(fā)展前景

    RISC-V在服務(wù)器方面的應(yīng)用與發(fā)展前景十分廣闊。作為一種開源、開放、簡潔、靈活的指令集,RISC-V近年來在芯片產(chǎn)業(yè)中發(fā)展迅速,并逐漸引領(lǐng)新一輪處理芯片技術(shù)與產(chǎn)業(yè)的變革浪潮。 在
    發(fā)表于 04-28 09:04

    多核架構(gòu)高性能電機(jī)控制芯片

    基于傳統(tǒng)單核架構(gòu)的電機(jī)控制芯片已無法應(yīng)對(duì)新出現(xiàn)的嚴(yán)峻挑戰(zhàn),多核架構(gòu)的控制芯片應(yīng)運(yùn)而生。雙架構(gòu)芯片已在許多領(lǐng)域成功應(yīng)用,并顯示出其獨(dú)特的優(yōu)勢(shì)
    的頭像 發(fā)表于 04-19 14:46 ?8443次閱讀
    <b class='flag-5'>多核</b>架構(gòu)高性能電機(jī)控制<b class='flag-5'>芯片</b>

    配置一個(gè)邊緣IO服務(wù)器,服務(wù)器共有1-8個(gè)COM口,怎樣的分配才是最高效的呢?

    在配置一個(gè)邊緣IO服務(wù)器,此服務(wù)器共有1-8個(gè)COM口,將每兩個(gè)COM口用來插DO板和DI板,共為四組,比如COM-1口可以和COM-2口為一組。本設(shè)備希望用DO板來控制DI板,故希望DO在發(fā)送數(shù)據(jù)時(shí)跟DI收到的數(shù)據(jù)一致,請(qǐng)問應(yīng)該怎樣以怎樣的分配
    發(fā)表于 04-02 06:19

    linux服務(wù)器和windows服務(wù)器

    應(yīng)用和企業(yè)環(huán)境中使用,那么Win dows服務(wù)器可能更適合你的需求。 綜上所述,Linux服務(wù)器和Windows服務(wù)器各有優(yōu)劣,選擇適合自己需求的服務(wù)器操作系統(tǒng)是確保
    發(fā)表于 02-22 15:46

    TC275 TC1.6P 鎖步(Checker)的功耗是非鎖步分之多少呀?

    TC275 TC1.6P 鎖步(Checker)的功耗是非鎖步分之多少呀?
    發(fā)表于 02-06 07:36

    多核單片機(jī)中,靜態(tài)局部變量需要?jiǎng)澐址侄涡畔??如何放到函?shù)對(duì)應(yīng)的ram中?

    請(qǐng)問在多核單片機(jī)中,靜態(tài)局部變量需要?jiǎng)澐址侄涡畔??如何放到函?shù)對(duì)應(yīng)的ram中?
    發(fā)表于 02-06 06:29

    求助,在TASKING軟件里如何建立多核工程并能實(shí)現(xiàn)3個(gè)運(yùn)行?

    論壇里看到有基于BaseFramework框架的多核工程,但是怎么在TASKING里直接創(chuàng)建工程?我在TASKING里新建多核工程,并通過SoftwarePlatform插件代碼生成來生成完整的各種
    發(fā)表于 02-05 09:09

    龍芯3C6000芯片流片交付,IO接口改進(jìn)顯著,支持32、64服務(wù)器

     據(jù)悉,龍芯 3C6000 已完成交付并開始量產(chǎn)。數(shù)據(jù)顯示,該款芯片相較于現(xiàn)有的龍芯 3C5000 服務(wù)器產(chǎn)品,IO 接口有大幅度的改良與提升,通過龍鏈技術(shù)實(shí)現(xiàn)了“片間互聯(lián)”,打破了處理
    的頭像 發(fā)表于 02-03 10:12 ?1346次閱讀
    龍芯3C6000<b class='flag-5'>芯片</b>流片交付,IO接口改進(jìn)顯著,支持32<b class='flag-5'>核</b>、64<b class='flag-5'>核</b><b class='flag-5'>服務(wù)器</b>

    芯互聯(lián)發(fā)布高性能時(shí)鐘發(fā)生CLG440

    芯互聯(lián)近日發(fā)布了一款專為高性能服務(wù)器和計(jì)算中心應(yīng)用打造的支持PCIe 6.0的高性能時(shí)鐘發(fā)生——CLG440。這款產(chǎn)品符合CK440Q標(biāo)準(zhǔn),旨在滿足下一代服務(wù)器和數(shù)據(jù)中心的需求。
    的頭像 發(fā)表于 01-16 16:09 ?1292次閱讀

    芯互聯(lián)推出支持PCIe Gen 6的時(shí)鐘發(fā)生CLG440

    芯互聯(lián)CLG440是一顆專為高性能服務(wù)器、計(jì)算中心應(yīng)用推出的支持PCIe 6.0、符合CK440Q標(biāo)準(zhǔn)的高性能時(shí)鐘發(fā)生。
    的頭像 發(fā)表于 01-16 15:57 ?1023次閱讀
    <b class='flag-5'>核</b>芯互聯(lián)推出支持PCIe Gen 6的時(shí)鐘發(fā)生<b class='flag-5'>器</b>CLG440