0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

千核RISC-V處理器,通往AI之路的完全體

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-07-20 09:53 ? 次閱讀
談到如何設(shè)計AI加速器,許多工程師都會給出不同的答案,但歸根結(jié)底仍是在一顆先進制程的芯片上排列組合數(shù)十億個晶體管。然而當前超大規(guī)模的AI推理依然面臨著不少挑戰(zhàn),比如成本和復(fù)雜度高居不下,傳統(tǒng)架構(gòu)下的性能、功耗和可編程性無法滿足超大規(guī)模的要求等。初創(chuàng)公司Esperanto作為去年才開始冒頭的初創(chuàng)企業(yè),卻打算用RISC-V來解決這一問題。

Esperanto創(chuàng)立于2014年,其董事長Dave Ditzel曾在英特爾負責下一代微處理器架構(gòu)的設(shè)計。Esperanto的工作方向是基于RISC-V這一開放架構(gòu),開發(fā)高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發(fā)的首個AI加速器。

ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統(tǒng)的SoC,而是面向超大規(guī)模數(shù)據(jù)中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓(xùn)練加速器。

據(jù)CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務(wù)上,能耗效率提高可至100倍。ET-SoC-1在其他關(guān)鍵工作任務(wù)上,性能提升要遠高于傳統(tǒng)的CPUGPU方案。比如在模擬測試中,用于推薦網(wǎng)絡(luò)時,其性能提升高達50倍,在圖像分類上,性能提升高達30倍。雖然這些暫時只是紙面測試參數(shù),但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。

據(jù)了解,這一芯片直至2021年第二季度才正式流片,預(yù)計2022年早期才會開始量產(chǎn)。這是因為Esperanto花了很多時間在驗證上,作為一家初創(chuàng)公司,Esperanto采用了架構(gòu)、硬件和軟件聯(lián)合設(shè)計的方式,這樣一來雖然節(jié)省了時間,卻也讓規(guī)格一直在持續(xù)變動。因此Esperanto在驗證團隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。

ET-SoC-1芯片架構(gòu) / Esperanto

ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機器學(xué)習(xí)數(shù)據(jù)處理。

ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學(xué)Boom V2開源核心的的分支,但Esperanto對此進行了大刀闊斧的改進。在SPEC2006測試下,其性能已經(jīng)超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。

雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內(nèi),32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務(wù)處理器。Esperanto用這一千多個ET-Minion做到了強大的浮點性能,某些傳統(tǒng)加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現(xiàn)出不俗的優(yōu)勢。


搭載6個ET-SoC-1的Glacier Point v2 / Esperanto

Art Swift提到,F(xiàn)acebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設(shè)備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達822GB/s的同時還擁有較低的功耗。據(jù)估計,這一設(shè)計的板卡峰值性能可達800 TOPS(INT8)以上。

在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機器學(xué)習(xí)框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機器學(xué)習(xí)模型。

結(jié)語

RISC-V雖然在傳統(tǒng)的CPU與GPU市場還未徹底崛起,但在AI加速上,已經(jīng)以其獨到的優(yōu)勢迅速攻城略地。這種千核式的設(shè)計其實已經(jīng)應(yīng)用于Arm等架構(gòu),不少數(shù)據(jù)中心、超算卻依然在嘗試用RISC-V作為加速器。

RISC-V憑借其開放性、擴展性和自主性,并沒有像Arm那樣由低至高地發(fā)展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態(tài),那時的RISC-V就有與Arm全市場爭霸的希望了。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269625
  • RISC-V
    +關(guān)注

    關(guān)注

    45

    文章

    2307

    瀏覽量

    46295
收藏 人收藏

    評論

    相關(guān)推薦

    Imagination放棄RISC-V處理器內(nèi)核開發(fā)

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)根據(jù)外媒的最新報道,半導(dǎo)體IP大廠Imagination Technology已經(jīng)停止了RISC-V處理器內(nèi)核的開發(fā),轉(zhuǎn)而更加專注于其核心的GPU和AI產(chǎn)品
    的頭像 發(fā)表于 01-10 00:15 ?1440次閱讀

    Andes晶心科技推出D45-SE RISC-V處理器

    Andes晶心科技(TWSE:6533; SIN US03420C2089; ISIN:US03420C1099)是全球高效能、低功耗 32/64 位 RISC-V 處理器的領(lǐng)導(dǎo)廠商,也是
    的頭像 發(fā)表于 12-26 10:54 ?224次閱讀

    Rivos全新產(chǎn)品采用Andes晶心科技NX45 RISC-V處理器

    專注于加速數(shù)據(jù)分析和生成式AI工作負載的RISC-V主要會員公司Rivos與32/64位RISC-V處理器內(nèi)核的領(lǐng)先供貨商、RISC-V創(chuàng)始
    的頭像 發(fā)表于 12-04 10:37 ?303次閱讀

    RISC-V能否復(fù)制Linux 的成功?》

    ,創(chuàng)建實現(xiàn)自有加速算法的自定義異構(gòu)集群。RISC-V作為一種ISA,我們一開始是在處理器內(nèi)核中采用吸引人的通用構(gòu)建塊,然后在此基礎(chǔ)上進行構(gòu)建,同時還利用最好的商業(yè)工具增強使用者的信心。所以,IP
    發(fā)表于 11-26 20:20

    RISC-V,即將進入應(yīng)用的爆發(fā)期

    計算機由控制整體的CPU(中央處理器)和加速兩部分構(gòu)成。在AI計算中,功耗和效率是兩個關(guān)鍵因素。RISC-V架構(gòu)通過其簡潔的設(shè)計和定制化的擴展,可以實現(xiàn)高效的能量使用。該架構(gòu)能夠通過
    發(fā)表于 10-31 16:06

    RISC-V擁有巨大市場潛力的原因

    旬發(fā)布了第三代“香山”開源高性能RISC-V處理器,其性能水平已進入全球第一梯隊,可廣泛應(yīng)用于服務(wù)芯片、AI芯片、GPU、DPU等高端芯
    發(fā)表于 09-30 14:20

    淺談國產(chǎn)異構(gòu)雙RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

    關(guān)于國產(chǎn)異構(gòu)雙RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應(yīng)用場景淺談如下: 優(yōu)勢 異構(gòu)計算能力 : 異構(gòu)雙設(shè)計結(jié)合了RISC-V
    發(fā)表于 08-31 08:32

    萬物智聯(lián)時代,RISC-VAI的融合之路該如何走?

    人工智能與機器學(xué)習(xí)專委會主席謝濤發(fā)表了《萬物智聯(lián)時代RISC-V+AI之路》演講,分析了RISC-VAI技術(shù)的結(jié)合及其發(fā)展路徑探索。他在發(fā)言中,盡管國產(chǎn)
    的頭像 發(fā)表于 08-31 08:06 ?684次閱讀
    萬物智聯(lián)時代,<b class='flag-5'>RISC-V</b>與<b class='flag-5'>AI</b>的融合<b class='flag-5'>之路</b>該如何走?

    RISC-V適合什么樣的應(yīng)用場景

    設(shè)計使得開發(fā)者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統(tǒng)的各種性能要求。 3. 人工智能(AI)和機器學(xué)習(xí)(ML) 高性能計算:RISC-V結(jié)合AI加速或協(xié)
    發(fā)表于 07-29 17:16

    RISC-V在中國的發(fā)展機遇有哪些場景?

    。RISC-V結(jié)合AI加速,可以在AI領(lǐng)域提供高效的計算解決方案。 定制化需求:RISC-V允許添加專門的加速
    發(fā)表于 07-29 17:14

    risc-v多核芯片在AI方面的應(yīng)用

    RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片的性能和效率,降低成本,使AI邊緣計算晶片更具競爭力。 再者,RISC-V的多核設(shè)計可以進
    發(fā)表于 04-28 09:20

    第三代“香山”RISC-V 開源高性能處理器性能進入全球第一梯隊

    中科院計算技術(shù)研究所、北京開源芯片研究院共同創(chuàng)新,成功推出第三代“香山”開源高性能RISC-V處理器,這也是首個基于開源模式、采用敏捷開發(fā)方法、多方協(xié)作開發(fā)的處理器
    的頭像 發(fā)表于 04-25 15:37 ?1671次閱讀

    fpga和risc-v處理器的區(qū)別

    FPGA(現(xiàn)場可編程門陣列)和RISC-V處理器在多個方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-27 14:21 ?1199次閱讀

    芯來科技正式發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案

    本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案,提供專業(yè)有效的信息安全保護以及加解密功能。
    的頭像 發(fā)表于 03-11 11:01 ?1460次閱讀
    芯來科技正式發(fā)布基于<b class='flag-5'>RISC-V</b><b class='flag-5'>處理器</b>的HSM子系統(tǒng)解決方案

    芯來科技發(fā)布AI專用RISC-V處理器內(nèi)核NI900系列

    AI技術(shù)迅速發(fā)展的當下,RISC-V CPU IP領(lǐng)域的領(lǐng)軍企業(yè)芯來科技,正式發(fā)布了針對人工智能應(yīng)用的專用處理器產(chǎn)品線——Nuclei Intelligence (NI)系列。作為該系列的首款產(chǎn)品,NI900系列內(nèi)核,專為
    的頭像 發(fā)表于 02-26 09:36 ?834次閱讀