0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

存算一體化芯片簡(jiǎn)史介紹 在DRAM上的各種嘗試

SSDFans ? 2019-07-04 16:02 ? 次閱讀

之前的幾篇基本都是在講,復(fù)興的深度學(xué)習(xí)技術(shù)讓內(nèi)存和計(jì)算單元之間的GAP變得更大了,這個(gè)問(wèn)題已經(jīng)從傳統(tǒng)的Memory Wall的討論打了PIM的時(shí)代。說(shuō)道PIM, Porcessor in Memory, 筆者在2014年的時(shí)候參加過(guò)一個(gè)Intel的高逼格的會(huì)議,當(dāng)時(shí)3DXP已經(jīng)在開(kāi)發(fā),Intel的同學(xué)講,未來(lái)的CPU會(huì)坐在一個(gè)巨大的內(nèi)存結(jié)構(gòu)上,當(dāng)時(shí)剛剛普及的NAND Flash技術(shù)只是個(gè)臨時(shí)方案。因?yàn)镹AND Flash和CPU之間的連接總是有一種,茶壺倒餃子的感覺(jué)。2014年的時(shí)候,深度學(xué)習(xí)應(yīng)該是剛剛開(kāi)始,大家都在糾結(jié)如何把數(shù)據(jù)從CPU傳遞到GPU,(其實(shí),現(xiàn)在大家還在糾結(jié))。

之后,借著大數(shù)據(jù)和深度學(xué)習(xí)的東風(fēng),PIM一下子流行起來(lái)。其實(shí),PIM并不是一個(gè)新概念, 每一個(gè)很靠譜的PIM的綜述文章都會(huì)講那個(gè)開(kāi)始-The Berkeley IRAM Project。

和他的親兄弟RISC-V不一樣,IRAM的命運(yùn)不濟(jì),沒(méi)有走到工業(yè)化這條路上。對(duì)于這個(gè)項(xiàng)目,David Patterson 大神在他的《Microprocessors in 2020》都講過(guò)這個(gè)。大神就是大神,如果你現(xiàn)在看看這篇文章,會(huì)發(fā)現(xiàn)這個(gè)世界上的預(yù)言并不總像《滬市一萬(wàn)點(diǎn)不是夢(mèng)》一樣不靠譜。

文章的內(nèi)容總結(jié)如下:

  1. 晶體管的集成度是驚人的,他們之前在1980年的預(yù)測(cè)過(guò)于保守,按那時(shí)的預(yù)測(cè),在1995年,他們已經(jīng)用上了2000年的電腦。

  2. 馮氏體系的優(yōu)點(diǎn)是比較適合通用計(jì)算,但是未來(lái)更需要SIMD和并行的支持。

  3. 從1995年來(lái)看,2020年的電腦并不會(huì)有多大的不同。

  4. 最后,他安利了IRAM這個(gè)項(xiàng)目,認(rèn)為計(jì)算和存儲(chǔ)的結(jié)合會(huì)帶來(lái)架構(gòu)上的收益.

存算一體化芯片簡(jiǎn)史介紹 在DRAM上的各種嘗試

一句話,IRAM并沒(méi)有像大神的RISC和RAID一樣被工業(yè)屆買單,但是Intel目前對(duì)于DeepLearning的看家吃法的家伙AVX-512就是加專用向量處理器的例子。【1】

另一個(gè)比較有代表意義的就是寒武紀(jì)的大電腦了。上一節(jié)的IRAM只是加了一個(gè)向量處理器在哪里,當(dāng)時(shí)主要的想法是做并行計(jì)算,但是一直到現(xiàn)在,并行計(jì)算依然對(duì)于廣大的程序猿來(lái)講還是比較困難的。在IRAM的指令集的角度上,對(duì)比了標(biāo)量和向量實(shí)現(xiàn)并行的對(duì)比。

存算一體化芯片簡(jiǎn)史介紹 在DRAM上的各種嘗試

看到這個(gè),做芯片的同學(xué)是不是想到了SPARC,"While slower then recent Intel offerings, architecturally UltraSparc remains a very interesting microprocessor with unique (and very compiler friendly) organization of registers. And as we mentioned before it is a big Endean microprocessor, which is actually the only right way to build microprocessors :-)."[2]

因此,DaDianNao的創(chuàng)新就在從計(jì)算機(jī)體系結(jié)構(gòu)的角度,把一個(gè)NFU和內(nèi)存結(jié)合。如何說(shuō)IRAM是一個(gè)通用方案的話,Dadiannao就是一個(gè)專用的方案了。要知道,在2014年,大部分用戶還在忙著調(diào)整GPGPU的參數(shù),而DaDiannao類似于一個(gè)AI加速器的開(kāi)山祖師,創(chuàng)建了RAM+NFU的流派。

存算一體化芯片簡(jiǎn)史介紹 在DRAM上的各種嘗試

SSDFans的同學(xué)們都知道,早在1985年,Toshiba就發(fā)明了NAND Flash,最近幾年NAND Flash的大事就是蓋樓,從平面到了立體,本來(lái)大家在15nm(1Y)之后,還要接著想辦法挖溝。用了3D技術(shù)之后,一下子回到了40nm的幸福時(shí)光,每家都在大干快上,最高記錄目前是512層。[3]

其實(shí),DRAM也在搞同樣的事情,和NAND Flash不同,NAND Flash是摩天大樓,而DRAM則是6層的板樓。

存算一體化芯片簡(jiǎn)史介紹 在DRAM上的各種嘗試

對(duì)的,HMC和HBM所用的Memory還是普通的DRAM芯片,只是用新的芯片封裝工藝和計(jì)算芯片集成。HBM的使用和DRAM的使用并沒(méi)有大的區(qū)別。這個(gè)和最新AMD的ZEN2 Rome的CPU類似,7nm的計(jì)算die和14nm的IOdie合封。目前在hyerpscale,特別是OCP里面,一個(gè)chiplet的概念特別流行chiplet[4]. 這里不得不說(shuō)一下我的老東家Avago就特立獨(dú)行。人家整了一個(gè)比V100還大的獨(dú)立片子[5],21,000,000,000的晶體管,7nm一句話,俺能賣出去,管什么良率問(wèn)題。

因此,很自然,通過(guò)牛逼的工藝,把memory和計(jì)算單元合體,大家都在做,包括筆者供職的Xilinx也在搞AICore和HBM。現(xiàn)在的AI芯片,如果沒(méi)有HBM的配置,估計(jì)都不好意思出門了。

不知道為什么,段教授選了一個(gè)這個(gè)例子。

存算一體化芯片簡(jiǎn)史介紹 在DRAM上的各種嘗試

如果有懂行的同學(xué)可以評(píng)論一下。好了,這個(gè)段落主要是將講了在DRAM上的各種嘗試,2D和3D都有,但是基本上memory和xPU之間的界限還是明顯的,雖然在一張床上,還是沒(méi)有水乳交融。比較關(guān)心業(yè)界動(dòng)態(tài)的,這一節(jié)基本上是靠譜的技術(shù),都可以實(shí)現(xiàn)的。下一節(jié)應(yīng)該都是腦洞了。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DRAM
    +關(guān)注

    關(guān)注

    40

    文章

    2315

    瀏覽量

    183504
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121174
  • RISC-V
    +關(guān)注

    關(guān)注

    45

    文章

    2277

    瀏覽量

    46162
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    102

    瀏覽量

    4302

原文標(biāo)題:存算一體化芯片簡(jiǎn)史

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一體力AI芯片將逐漸走向落地應(yīng)用

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)前不久,后摩智能宣布,其自主研發(fā)的業(yè)內(nèi)首款一體力AI芯片成功點(diǎn)亮,并成功跑通智能駕駛算法模型。 ? 這
    的頭像 發(fā)表于 05-31 00:03 ?4995次閱讀

    一體更進(jìn)步,“感一體化”前景如何?

    一體芯片是為了打破馮諾依曼存儲(chǔ)計(jì)算分離的計(jì)算架構(gòu)所造成的“內(nèi)存墻”的系統(tǒng)限制,而“感一體化
    的頭像 發(fā)表于 06-08 00:01 ?5460次閱讀

    一體技術(shù)路線如何選

    ,或是直接進(jìn)行大一體芯片的研究,有的是采用模擬的
    的頭像 發(fā)表于 06-21 09:27 ?4331次閱讀

    一體技術(shù)發(fā)展現(xiàn)狀和未來(lái)趨勢(shì)

    一體
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2023年04月25日 17:21:41

    什么是機(jī)電一體化

    產(chǎn)品的例子。裝有微型計(jì)算機(jī)的電視機(jī)和電飯煲等因?yàn)槠涔ぷ髟磔d本質(zhì)是無(wú)運(yùn)動(dòng)的,所以補(bǔ)屬于機(jī)電一體化產(chǎn)品。5) 控制工程學(xué)控制工程學(xué)及控制技術(shù)于機(jī)電一體化技術(shù)的目標(biāo)使致的,機(jī)電
    發(fā)表于 08-29 09:06

    機(jī)電一體化系統(tǒng)

    容易由上訴5個(gè)要素與人體相對(duì)應(yīng)。對(duì)于其它的機(jī)電一體化系統(tǒng),如微機(jī)控制型縫紉機(jī)、自動(dòng)變焦照相機(jī)、自動(dòng)變焦防顫型攝像機(jī)等,只要存在機(jī)械運(yùn)動(dòng)就必然也包含著5個(gè)要素。 3.機(jī)電一體化系統(tǒng)的組成機(jī)電
    發(fā)表于 08-29 09:11

    如何實(shí)現(xiàn)機(jī)電一體化設(shè)計(jì)?

    用戶總是要求我們提高所設(shè)計(jì)的機(jī)械的性能,同時(shí)減少資金成本。為了達(dá)到這兩個(gè)矛盾的目標(biāo),我們將注意力放到機(jī)械設(shè)計(jì)方面有巨大潛力的機(jī)電一體化。本文著重展示了使用嵌入式分析工具的現(xiàn)代計(jì)算機(jī)輔助設(shè)計(jì)(CAD)系統(tǒng),告訴大家,如何才能實(shí)
    發(fā)表于 08-07 06:48

    機(jī)電一體化綜合實(shí)訓(xùn)考核

    各種控制和工程實(shí)踐能力。ZN-01MES機(jī)電一體化綜合實(shí)訓(xùn)考核裝置由五個(gè)單元組成,分別為:料檢測(cè)單元、搬運(yùn)
    發(fā)表于 07-02 07:36

    或讓功耗降低1000倍,一體芯片正在突破

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)為什么一體化越來(lái)越受到關(guān)注?今年1月,阿里達(dá)摩院發(fā)布的2020十大科技趨勢(shì)中,其中個(gè)是,計(jì)算存儲(chǔ)
    的頭像 發(fā)表于 12-22 08:29 ?5934次閱讀

    基于RISC-V開(kāi)放架構(gòu)的一體化芯片解決方案

    RISC-V優(yōu)勢(shì)多多,RISC-V可以同時(shí)滿足三種的需求并且具有友好的軟件開(kāi)發(fā)環(huán)境。本文主要介紹了由英韌科技的ceo介紹的基于RISC-V開(kāi)放架構(gòu)的
    的頭像 發(fā)表于 06-23 09:50 ?2612次閱讀
    基于RISC-V開(kāi)放架構(gòu)的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體化</b><b class='flag-5'>芯片</b>解決方案

    億鑄科技發(fā)布基于ReRAM的全數(shù)字一體AI大芯片技術(shù)

    剛剛結(jié)束的GTIC 2022全球AI芯片峰會(huì)存一體專題論壇,億鑄科技創(chuàng)始人、董事長(zhǎng)兼CEO熊大鵬博士發(fā)表了題為“
    的頭像 發(fā)表于 09-01 11:50 ?2666次閱讀

    一體芯片新突破!清華大學(xué)研制出首顆一體芯片

    集成電路學(xué)院教授吳華強(qiáng)副教授高濱團(tuán)隊(duì)基于一體計(jì)算范式研制出的全球首顆全系統(tǒng)集成支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶阻器
    的頭像 發(fā)表于 10-11 14:39 ?1143次閱讀

    什么是一體芯片?一體芯片的優(yōu)勢(shì)和應(yīng)用領(lǐng)域

    一體片上學(xué)習(xí)實(shí)現(xiàn)更低延遲和更小能耗的同時(shí),能夠有效保護(hù)用戶隱私和數(shù)據(jù)。該芯片參照仿生類腦處理方式,可實(shí)現(xiàn)不同任務(wù)的快速“片
    的頭像 發(fā)表于 10-23 14:15 ?5319次閱讀
    什么是<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>?<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>的優(yōu)勢(shì)和應(yīng)用領(lǐng)域

    什么是通感一體化?通感一體化的應(yīng)用場(chǎng)景

    通感一體化可廣泛應(yīng)用于智能家居、智慧城市、智慧交通、醫(yī)療健康等方面。文檔君為大家搜集了些典型的應(yīng)用場(chǎng)景。 智能家居 通感一體化利用基站
    發(fā)表于 01-18 16:12 ?1.1w次閱讀
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一體化</b>?通感<b class='flag-5'>算</b><b class='flag-5'>一體化</b>的應(yīng)用場(chǎng)景

    一體化與邊緣計(jì)算:重新定義智能計(jì)算的未來(lái)

    、人工智能(AI)等技術(shù)的發(fā)展,數(shù)據(jù)量的分布性、實(shí)時(shí)性需求增加,邊緣計(jì)算也逐漸從概念走向落地。本文將介紹一體化與邊緣計(jì)算的核心思想及其發(fā)展趨勢(shì),探討兩者
    的頭像 發(fā)表于 11-12 01:05 ?225次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體化</b>與邊緣計(jì)算:重新定義智能計(jì)算的未來(lái)