0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ReRAM存算一體AI大算力芯片的獨(dú)特優(yōu)勢

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-06-20 08:00 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/李彎彎)近幾年,隨著傳統(tǒng)馮·諾依曼結(jié)構(gòu)的瓶頸逐漸顯現(xiàn),越來越多企業(yè)投身于存算一體芯片研發(fā)的浪潮中,試圖打破“存算墻”、“能耗墻”和“編譯墻”對AI應(yīng)用進(jìn)一步發(fā)展帶來的掣肘,在 “超摩爾時代”走出新的道路。盡管有著相似的目標(biāo),但各企業(yè)采取的技術(shù)路線卻不盡相同。

早期有企業(yè)基于Flash做模擬的存算一體芯片,例如美國的Mythic等,已實(shí)現(xiàn)產(chǎn)品量產(chǎn)。同時還有一些奮斗在存算一體架構(gòu)道路上的創(chuàng)業(yè)伙伴選擇了SRAM,不同的存儲介質(zhì)都有各自的屬性特點(diǎn),針對不同應(yīng)用場景的要求存在不同的優(yōu)劣勢。比如基于Flash做的存算一體芯片,介質(zhì)和工藝比較成熟,功耗低,但精度較低、算力較小,可以滿足語音識別智能穿戴等場景的要求,卻難以滿足高精度、大算力場景的要求;SRAM因?yàn)槊娣e(密度)、成本以及漏電流等自身屬性,更加適合于對待機(jī)功耗不敏感、對算力要求在中小算力范疇的場景。

ReRAM(RRAM)是近年來被產(chǎn)學(xué)界均寄予厚望的新型非易失性憶阻器,為此,電子發(fā)燒友采訪到億鑄科技創(chuàng)始人、董事長兼 CEO熊大鵬博士,就基于ReRAM存算一體芯片的技術(shù)優(yōu)勢、ReRAM目前的工藝進(jìn)展、存算一體未來的市場機(jī)會等多個問題進(jìn)行了探討。


ReRAM存算一體的獨(dú)特優(yōu)勢


億鑄科技是基于ReRAM這種新型憶阻器設(shè)計存算一體AI大算力芯片的企業(yè)。

ReRAM存儲介質(zhì)的優(yōu)勢:

存儲介質(zhì)是實(shí)現(xiàn)存算一體的底層物理器件,不同存儲介質(zhì)的選擇,會對存算結(jié)果產(chǎn)生重大影響。ReRAM全稱是電阻式隨機(jī)存取存儲器,是以非導(dǎo)性材料的電阻在外加電場作用下,在高阻態(tài)和低阻態(tài)之間實(shí)現(xiàn)可逆轉(zhuǎn)換為基礎(chǔ)的非易失性存儲器。

ReRAM的核心優(yōu)勢:

非易失性和低功耗:ReRAM不用的時候不需要上電,靜態(tài)功耗為零,讀寫之外的功耗為0;

面積小、密度高:ReRAM的單元面積極小,可做到4F2,理論上不需要晶體管,一般是加一個選擇管,所以就是1TnR,面積上成倍縮?。?br />
微縮化發(fā)展:可以持續(xù)利用先進(jìn)制程升級迭代,目前最先進(jìn)的量產(chǎn)工藝為28nm,未來持續(xù)演進(jìn)的空間很大;目前已經(jīng)能做到幾百M(fèi)B的存儲容量,大大超過了前主流AI算力芯片的片上存儲容量,未來ReRAM存算一體芯片的存儲容量可以做到幾個GB,甚至更高。

讀寫速度:讀寫速度比NAND Flash提升了2~3個數(shù)量級,明顯優(yōu)于Flash;

高精度和大算力:億鑄和ReRAM工藝foundry聯(lián)合研發(fā)基于ReRAM的全數(shù)字化存算一體MACRO,具有支持高精度和大算力的優(yōu)勢和潛力;

穩(wěn)定性強(qiáng):對工藝制程上一些微小的差異和干擾不敏感,具有很強(qiáng)的魯棒性。溫度適應(yīng)范圍廣(-40~125℃),同時還具有良好的抗電磁干擾能力(EMC);

兼容性(工程實(shí)現(xiàn)相對容易):ReRAM本身對CMOS工藝兼容性很好。
因?yàn)樯鲜龇N種優(yōu)勢,ReRAM被認(rèn)為是實(shí)現(xiàn)存算一體的最佳憶阻器選擇。

存算一體架構(gòu)的優(yōu)勢

存算一體架構(gòu),打破了傳統(tǒng)馮·諾依曼架構(gòu)下存在的存儲墻。在異構(gòu)架構(gòu)下,存儲墻導(dǎo)致了大量數(shù)據(jù)在計算單元和存儲單元間頻繁移動,使60-90%的能耗用于數(shù)據(jù)搬運(yùn)而非數(shù)據(jù)計算,這也是導(dǎo)致了能耗墻的問題主要原因。

為解決存儲墻問題,業(yè)界采用了很多架構(gòu)上的設(shè)計優(yōu)化方案,比如多級緩存和非常復(fù)雜與精巧的數(shù)據(jù)流動態(tài)實(shí)時控制和管理。但是這些“方案”從理論上來說無法由編譯器自動“理解”,無法自動優(yōu)化芯片的執(zhí)行程序代碼,必須投入大量成本去做手動優(yōu)化。而存算一體架構(gòu)解決了存儲墻問題,無需特別考慮數(shù)據(jù)流動態(tài)實(shí)時控制和優(yōu)化問題,其計算資源、存儲資源和輸入/輸出接口帶寬資源等資源分配是靜態(tài)的,可以通過工具實(shí)現(xiàn)合理優(yōu)化,這對將來產(chǎn)品的部署非常有利,也大大降低了平臺的遷移難度和成本。

全數(shù)字化實(shí)現(xiàn)存算一體大算力AI芯片優(yōu)勢

目前業(yè)內(nèi)大多采用的是模擬計算做存算一體芯片,而億鑄科技提出以全數(shù)字化的方式實(shí)現(xiàn)ReRAM存算一體AI大算力芯片技術(shù)路線。那么,全數(shù)字方式有什么優(yōu)勢呢?

在著墨全數(shù)字方式之前,不妨先來看看模擬的方式的優(yōu)缺點(diǎn)。模擬計算方式做存算一體特別適合于低功耗、小算力、低精度的應(yīng)用場景,比如語音關(guān)鍵詞識別、智能穿戴、AIOT等。
由于采用非易失性憶阻器,無論斷電與否,寫入憶阻器的計算參數(shù)均不會丟失。利用憶阻器的這個特點(diǎn),把計算系數(shù)(比如向量或矩陣的系數(shù)、神經(jīng)網(wǎng)絡(luò)的系數(shù))寫進(jìn)憶阻器(好比可編程電阻),將輸入的數(shù)據(jù)進(jìn)行數(shù)模轉(zhuǎn)換變成電壓值,電壓值通過電阻產(chǎn)生電流,再將電流進(jìn)行模數(shù)轉(zhuǎn)換成計算結(jié)果。如此,根據(jù)歐姆定律和基爾霍夫定律實(shí)現(xiàn)了乘積累加計算,完成模擬計算過程。也就是說,由一個電阻實(shí)現(xiàn)乘法和加法計算,這個電阻替代了傳統(tǒng)數(shù)字電路的一個乘法器和加法器。在數(shù)字電路里,乘法器和加法器往往需要幾百個晶體管,而現(xiàn)在只需要一個電阻,也就是若干個晶體管就能實(shí)現(xiàn)。這意味著,它的電路簡單了幾百倍,能耗也節(jié)省了幾百上千倍,這是模擬計算跟傳統(tǒng)的數(shù)字電路相比所擁有的一個巨大優(yōu)勢。

然而,模擬計算存在幾個問題。

第一,如何保證電阻的精度?熊大鵬博士向電子發(fā)燒友介紹,業(yè)界采取了從工藝、硬件電路設(shè)計到軟件等多種方式,試圖對精度進(jìn)行補(bǔ)償,最后發(fā)現(xiàn)模擬存算一體存在明確的天花板,做到8位或者16位的精度難度很大。

第二,模擬計算必須從數(shù)字域轉(zhuǎn)換到模擬域來做計算,再把計算結(jié)果轉(zhuǎn)回到數(shù)字域,這就需要數(shù)模/模數(shù)(AD/DA)轉(zhuǎn)換,而這本身就帶來了性能、能耗還有電路復(fù)雜度等問題。

所以盡管模擬存算一體能夠省面積、功耗低、電路簡單(相對于傳統(tǒng)數(shù)字電路而言),但因其仍然存在模數(shù)和數(shù)模轉(zhuǎn)化的部分以及精度補(bǔ)償?shù)仍O(shè)計,仍然有其電路設(shè)計的復(fù)雜性,同時還有精度不夠、算力不高等問題。

熊大鵬博士表示,業(yè)界也嘗試過不同的方法來解決這兩個問題,比如,有不少企業(yè)選擇了混合式設(shè)計的路線——也就是采取部分模擬、部分?jǐn)?shù)字的方式,通過數(shù)字的部分來改善精度和AD/DA帶來性能限制的問題,同時兼具模擬在性能、功耗上等方面的優(yōu)勢。但這仍然無法給AI算力密度和能效比的提升帶來一條可持續(xù)發(fā)展的技術(shù)路徑。

億鑄團(tuán)隊和一家國際ReRAM新型存儲技術(shù)領(lǐng)軍企業(yè)的技術(shù)專家團(tuán)隊以及公司內(nèi)部的核心研發(fā)團(tuán)隊聯(lián)合就這兩個問題進(jìn)行了深入分析和解決方案探索,結(jié)合ReRAM存儲介質(zhì)各項屬性的比較優(yōu)勢,億鑄科技認(rèn)為全數(shù)字化方式是當(dāng)前實(shí)現(xiàn)存算一體AI大算力芯片的最佳路徑。

ReRAM工藝28nm/22nm已經(jīng)成熟量產(chǎn)


ReRAM作為一種新型憶阻器,目前的工藝進(jìn)展情況如何呢?

據(jù)熊大鵬博士介紹,目前在全球范圍內(nèi),不管是ReRAMIP還是ReRAM先進(jìn)工藝制程,比較成熟的兩家公司為臺積電和昕原半導(dǎo)體。業(yè)內(nèi)已有知名頭部企業(yè)采用ReRAM設(shè)計下一代芯片,因此,2021年被業(yè)內(nèi)稱為“ReRAM元年”。

而億鑄科技更是和該國際ReRAM領(lǐng)軍企業(yè)構(gòu)建了緊密的合作伙伴關(guān)系,二者珠聯(lián)璧合,強(qiáng)有力地推動了存算一體芯片的研發(fā)和商業(yè)化落地及生態(tài)構(gòu)建。

存算一體大算力AI芯片的市場機(jī)會


從應(yīng)用場景來看,存算一體大算力AI芯片主要面向數(shù)據(jù)中心自動駕駛等對算力密度、能效比需求很高的領(lǐng)域。在這領(lǐng)域,相比于傳統(tǒng)的AI芯片或者GPU,存算一體芯片在PPA(PPA即Performance性能、Power功耗、Area尺寸)的表現(xiàn)將會非常亮眼。換言之,存算一體大算力AI芯片在單位面積相同的情況下,在計算性能、能效比等方面均會有數(shù)量級的提升。比如,同在75W功耗的前提下,億鑄ReRAM存算一體大算力芯片算力可達(dá)1POPS(INT8)以上。據(jù)熊大鵬博士介紹,基于ReRAM的存算一體28nm工藝相對于7nm 的GPU,算力可以提升十倍左右。這意味著對于終端用戶來說,可以在不增加物理空間的前提下,大大提升算力密度,大幅度降低能耗,減少采購和運(yùn)維成本。

如今在大算力AI推理計算的解決方案里,算力和能效比的提升主要依賴工藝制程的演進(jìn)。而當(dāng)演進(jìn)之路逐漸達(dá)到物理極限,上層的算法日益復(fù)雜、迭代加速,AI大算力芯片處于兩者剪刀差中,其發(fā)展破局之路被越來越多地寄希望于創(chuàng)新架構(gòu),從根本上跳出馮·諾依曼架構(gòu)體系,解決存儲墻以及存儲墻帶來的能耗墻和編譯墻(軟件生態(tài)依賴)問題。根據(jù)熊大鵬博士所述,不管是中心側(cè)還是邊緣側(cè)的潛在客戶對億鑄ReRAM存算一體大算力芯片都非常期待,而億鑄團(tuán)隊對于產(chǎn)品的成功落地有著必勝的信心。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • reram
    +關(guān)注

    關(guān)注

    1

    文章

    52

    瀏覽量

    25626
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1969

    瀏覽量

    35696
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    106

    瀏覽量

    4596
收藏 0人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這背景下,
    的頭像 發(fā)表于 05-06 17:01 ?295次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側(cè) <b class='flag-5'>AI</b> 新征程

    芯片的生態(tài)突圍與革命

    據(jù)的爆發(fā)式增長,大芯片已成為科技競爭的核心領(lǐng)域之。 ? 大
    的頭像 發(fā)表于 04-13 00:02 ?1494次閱讀

    接棒,慧榮科技以主控技術(shù)突破AI存儲極限

    電子發(fā)燒友網(wǎng)報道(文/黃山明)在AI的高速增長下,尤其是以DeepSeek為代表的AI大模型推動存儲需求激增,增長倒逼
    的頭像 發(fā)表于 03-19 01:29 ?1614次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>力</b>接棒<b class='flag-5'>算</b><b class='flag-5'>力</b>,慧榮科技以主控技術(shù)突破<b class='flag-5'>AI</b>存儲極限

    濟(jì)南市中區(qū)一體化智中心上線DeepSeek

    濟(jì)南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)一體化智中心(國家大學(xué)科技園節(jié)點(diǎn))昇騰
    的頭像 發(fā)表于 02-19 10:38 ?585次閱讀

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術(shù)的迅猛發(fā)展成為人工智能領(lǐng)域的核心驅(qū)動力,其對硬件和存儲效率的極致需求,促使一體技術(shù)在全球范圍內(nèi)迎來前所未有的關(guān)
    的頭像 發(fā)表于 01-23 11:24 ?918次閱讀

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對智中心算衡量的詳細(xì)闡述:、
    的頭像 發(fā)表于 01-16 14:03 ?1916次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    于芯 · 智啟未來 — 2024蘋芯科技產(chǎn)品發(fā)布會盛大召開

    8月8日,國際領(lǐng)先的一體芯片開拓者——蘋芯科技在北京召開“于芯智啟未來——2024蘋芯科
    的頭像 發(fā)表于 12-18 15:31 ?1292次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b>于芯 · 智啟未來 — 2024蘋芯科技產(chǎn)品發(fā)布會盛大召開

    開源芯片系列講座第24期:基于SRAM的高效計算架構(gòu)

    鷺島論壇開源芯片系列講座第24期「基于SRAM的高效計算架構(gòu)」明晚(27日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目基于SRAM
    的頭像 發(fā)表于 11-27 01:05 ?735次閱讀
    開源<b class='flag-5'>芯片</b>系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算架構(gòu)

    直播預(yù)約 |開源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計算

    鷺島論壇開源芯片系列講座第24期「SRAM一體:賦能高能效RISC-V計算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目SRAM
    的頭像 發(fā)表于 11-16 01:10 ?616次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    、人工智能(AI)等技術(shù)的發(fā)展,數(shù)據(jù)量的分布性、實(shí)時性需求增加,邊緣計算也逐漸從概念走向落地。本文將介紹一體化與邊緣計算的核心思想及其發(fā)展趨勢,探討兩者在智能
    的頭像 發(fā)表于 11-12 01:05 ?706次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計算:重新定義智能計算的未來

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?770次閱讀

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款
    發(fā)表于 09-26 13:51 ?627次閱讀
    科技新突破:首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>成功問世

    蘋芯科技引領(lǐng)存一體技術(shù)革新 PIMCHIP系列芯片重塑AI計算新格局

    一體NPU和PIMCHIP-S300多模態(tài)智能感知芯片,以前沿技術(shù)加持AI與大模型推理加速等各類計算任務(wù)場景,為高能效應(yīng)用開啟新紀(jì)元。?
    發(fā)表于 08-08 17:21 ?371次閱讀
    蘋芯科技引領(lǐng)存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑<b class='flag-5'>AI</b>計算新格局

    后摩智能推出邊端大模型AI芯片M30,展現(xiàn)出一體架構(gòu)優(yōu)勢

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,后摩智能推出基于一體架構(gòu)的邊端大模型AI芯片——后摩漫界??M30,最高
    的頭像 發(fā)表于 07-03 00:58 ?5019次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品