0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華開發(fā)出超高性能計(jì)算芯片:速度比高端GPU提升3000倍,能效提升400萬(wàn)倍!

旺材芯片 ? 來(lái)源:NATURE ? 2023-11-24 17:04 ? 次閱讀

隨著各類大模型和深度神經(jīng)網(wǎng)絡(luò)涌現(xiàn),如何制造出滿足人工智能發(fā)展、兼具大算力和高能效的下一代AI芯片,已成為國(guó)際前沿?zé)狳c(diǎn)。中國(guó)科協(xié)發(fā)布的2023重大科學(xué)問題中“如何實(shí)現(xiàn)低能耗人工智能”被排在首位。

2023年10月25日,清華大學(xué)團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得新突破。相關(guān)成果以“All-analog photo-electronic chip for high-speed vision tasks”為題發(fā)表在Nature上。這枚芯片基于純模擬光電融合計(jì)算架構(gòu),在包括ImageNet等智能視覺任務(wù)實(shí)測(cè)中,相同準(zhǔn)確率下,比現(xiàn)有高性能GPU算力提升3000倍,能效提升400萬(wàn)倍。

f09e5e20-7898-11ee-939d-92fbcf53809c.png

圖1 相關(guān)論文(來(lái)源Nature)

未來(lái)已來(lái)?光為載體的計(jì)算芯片

實(shí)現(xiàn)算力飛躍并非易事,特別是當(dāng)前傳統(tǒng)的芯片架構(gòu),受限于電子晶體管大小逼近物理極限。全新計(jì)算架構(gòu)成為破局的關(guān)鍵。光計(jì)算以其超高的并行度和速度,被認(rèn)為是未來(lái)顛覆性計(jì)算架構(gòu)的最有力競(jìng)爭(zhēng)方案之一。光計(jì)算,顧名思義是將計(jì)算載體從電變?yōu)楣?,利用光在芯片中的傳播進(jìn)行計(jì)算。面對(duì)以光速計(jì)算的誘人前景,數(shù)年來(lái)海內(nèi)外知名科研團(tuán)隊(duì)相繼提出多種設(shè)計(jì),但要替代現(xiàn)有電子器件實(shí)現(xiàn)系統(tǒng)級(jí)應(yīng)用,仍面臨重大瓶頸:一是如何在一枚芯片上集成大規(guī)模的計(jì)算單元(可控神經(jīng)元),且約束誤差累計(jì)程度;二是實(shí)現(xiàn)高速高效的片上非線性;三是為兼容目前以電子信號(hào)為主體的信息社會(huì),如何提供光計(jì)算與電子信號(hào)計(jì)算的高效接口。當(dāng)前常見的模數(shù)轉(zhuǎn)換功耗,較光計(jì)算每步乘加運(yùn)算高出多個(gè)數(shù)量級(jí),掩蓋了光計(jì)算本身的性能優(yōu)勢(shì),導(dǎo)致光芯片難以在實(shí)際應(yīng)用中體現(xiàn)出優(yōu)越性。

系統(tǒng)級(jí)算力和能效,超現(xiàn)有芯片萬(wàn)倍

為解決這一國(guó)際難題,清華大學(xué)團(tuán)隊(duì)創(chuàng)造性地提出了模擬電融合模擬光的計(jì)算框架,構(gòu)建可見光下的大規(guī)模多層衍射神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)視覺特征提取,利用光電流直接進(jìn)行基于基爾霍夫定律的純模擬電子計(jì)算,兩者集成在同一枚芯片框架內(nèi),完成了“傳感前 傳感中 近傳感”的新型計(jì)算系統(tǒng)。極大地降低了對(duì)于高精度ADC的需求,消除傳統(tǒng)計(jì)算機(jī)視覺處理范式在模數(shù)轉(zhuǎn)換過程中速度、精度與功耗相互制約的物理瓶頸,在一枚芯片上突破大規(guī)模集成、高效非線性、高速光電接口三個(gè)關(guān)鍵瓶頸。

f0a20246-7898-11ee-939d-92fbcf53809c.png

圖2. 光電計(jì)算芯片ACCEL的計(jì)算原理和芯片架構(gòu)(來(lái)源Nature)

實(shí)測(cè)表現(xiàn)下,ACCEL芯片的系統(tǒng)級(jí)算力達(dá)到現(xiàn)有高性能芯片的數(shù)千倍。同時(shí)系統(tǒng)級(jí)能效達(dá)74.8 Peta-OPS/W,較現(xiàn)有的高性能GPU、TPU、光計(jì)算和模擬電計(jì)算架構(gòu),提升了兩千到數(shù)百萬(wàn)倍。

在超低功耗下運(yùn)行的ACCEL將有助于大幅度改善發(fā)熱問題,對(duì)于芯片的未來(lái)設(shè)計(jì)帶來(lái)全方位突破,并為超高速物理觀測(cè)提供算力基礎(chǔ)。同時(shí)對(duì)無(wú)人系統(tǒng)、自動(dòng)駕駛等續(xù)航能力要求高的場(chǎng)景帶來(lái)重大利好。

f0c45e36-7898-11ee-939d-92fbcf53809c.png

表1. ACCEL和現(xiàn)有高性能芯片的系統(tǒng)級(jí)實(shí)測(cè)性能指標(biāo)對(duì)比 (來(lái)源:Nature)非相干光直接計(jì)算

更進(jìn)一步,ACCEL芯片還支持非相干光視覺場(chǎng)景的直接計(jì)算,如論文中演示的交通場(chǎng)景實(shí)驗(yàn)。顯著拓展了ACCEL的應(yīng)用領(lǐng)域,有望顛覆目前自動(dòng)駕駛、機(jī)器人視覺、移動(dòng)設(shè)備等領(lǐng)域先將圖片拍攝并保存在內(nèi)存中后進(jìn)行計(jì)算的思路,避免傳輸和ADC帶寬限制,在傳感過程中完成計(jì)算。

f0cdfc20-7898-11ee-939d-92fbcf53809c.gif

圖3. ACCEL可用于電子設(shè)備超低功耗人臉喚醒示意動(dòng)圖(來(lái)源:清華大學(xué))

開辟新路徑:顛覆性架構(gòu)有望真正落地

清華攻關(guān)團(tuán)隊(duì)提出的新型計(jì)算架構(gòu)不僅對(duì)于光計(jì)算技術(shù)的應(yīng)用部署意義重大,對(duì)未來(lái)其他高效能計(jì)算技術(shù)與當(dāng)前電子信息系統(tǒng)的融合,亦深有啟發(fā)。

論文通訊作者之一,清華大學(xué)戴瓊海院士介紹道,“采用全新原理研發(fā)出計(jì)算系統(tǒng)是一座大山,而將新一代計(jì)算架構(gòu)真正落地到現(xiàn)實(shí)生活,解決國(guó)計(jì)民生的重大需求,是攀過高峰后更重要的攻關(guān)?!盢ature雜志特邀在Research Briefing發(fā)表的該研究專題評(píng)述也指出,“或許這項(xiàng)工作的出現(xiàn),會(huì)讓新一代計(jì)算架構(gòu),比預(yù)想中早得多地進(jìn)入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。

清華大學(xué)戴瓊海院士、方璐副教授、喬飛副研究員、吳嘉敏助理教授為本文的共同通訊作者;博士生陳一彤、博士生麥麥提·那扎買提、許晗博士為共同一作;孟瑤博士、周天貺助理研究員、博士生李廣普、范靜濤研究員、魏琦副研究員共同參與了這項(xiàng)研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9698

    瀏覽量

    138259
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47314

    瀏覽量

    238662
  • 智能視覺
    +關(guān)注

    關(guān)注

    0

    文章

    101

    瀏覽量

    9213

原文標(biāo)題:清華開發(fā)出超高性能計(jì)算芯片:速度比高端GPU提升3000倍,能效提升400萬(wàn)倍!

文章出處:【微信號(hào):wc_ysj,微信公眾號(hào):旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    中國(guó)成功研發(fā)出世界首臺(tái)擬態(tài)計(jì)算機(jī) 效能提升數(shù)百

    擬態(tài)計(jì)算機(jī)的最大特點(diǎn)是高效能。測(cè)試表明,針對(duì)特定運(yùn)算任務(wù)的比可提升數(shù)十到數(shù)百。盡管擁有巨
    發(fā)表于 09-22 10:05 ?1310次閱讀

    麻省理工新神經(jīng)網(wǎng)絡(luò)芯片速度增6 功耗少94%

    麻省理工學(xué)院(MIT)的研究人員開發(fā)出了一種可用于神經(jīng)網(wǎng)絡(luò)計(jì)算高性能芯片,該芯片的處理速度可達(dá)
    的頭像 發(fā)表于 03-19 15:20 ?3668次閱讀
    麻省理工新神經(jīng)網(wǎng)絡(luò)<b class='flag-5'>芯片</b><b class='flag-5'>速度</b>增6<b class='flag-5'>倍</b> 功耗少94%

     華為云MongoDB彈性伸縮能力提升100

    高性能并非一蹴而就,這與華為云深厚的技術(shù)積累息息相關(guān)。   10數(shù)據(jù)重構(gòu)性能提升,得益于將數(shù)據(jù)復(fù)制功能卸載到分布式共享存儲(chǔ)。分布式存儲(chǔ)采用基于分區(qū)的并行復(fù)制方式;任意盤或節(jié)點(diǎn)故障
    發(fā)表于 08-03 13:00

    愛知制鋼開發(fā)出比MR 靈敏度高100 萬(wàn)倍的微型地磁傳感器

    愛知制鋼開發(fā)出比MR 靈敏度高100 萬(wàn)倍的微型地磁傳感器 豐田集團(tuán)傘下的愛知制鋼日前開發(fā)出了外形為4.6mm × 5.3mm × 0.8mm 的微型雙軸地磁
    發(fā)表于 06-08 21:00 ?711次閱讀

    麻省理工研發(fā)新神經(jīng)網(wǎng)絡(luò)芯片速度提升6,功耗減少94%!

    據(jù)MIT News報(bào)道,麻省理工學(xué)院(MIT)的研究人員開發(fā)出了一種可用于神經(jīng)網(wǎng)絡(luò)計(jì)算高性能芯片,該芯片的處理
    的頭像 發(fā)表于 03-15 16:47 ?3472次閱讀

    研究人員開發(fā)出半導(dǎo)體測(cè)量新技術(shù),靈敏度比以往測(cè)量技術(shù)提升了10萬(wàn)倍!

    UT(德州大學(xué),University of Texas)研究人員開發(fā)出一種半導(dǎo)體測(cè)量新技術(shù),這項(xiàng)技術(shù)的靈敏度比以往測(cè)量技術(shù)提升了10萬(wàn)倍。
    的頭像 發(fā)表于 05-05 15:38 ?3156次閱讀

    德州大學(xué)開發(fā)出半導(dǎo)體測(cè)量新技術(shù) 比以往提升10萬(wàn)倍

    UT(德州大學(xué),University of Texas)研究人員開發(fā)出一種半導(dǎo)體測(cè)量新技術(shù),這項(xiàng)技術(shù)的靈敏度比以往測(cè)量技術(shù)提升了10萬(wàn)倍。 UT電氣與計(jì)算機(jī)工程專業(yè)的研究生Sukrit
    的頭像 發(fā)表于 05-14 10:01 ?1456次閱讀

    MIT設(shè)計(jì)新型光子芯片 效率比電子芯片高1000萬(wàn)倍

    MIT的研究人員開發(fā)出一種新型 “光子” 芯片,它使用光而不是電,并且在此過程中消耗相對(duì)較少的功率。該芯片用于處理大規(guī)模神經(jīng)網(wǎng)絡(luò)的效率比現(xiàn)有的計(jì)算機(jī)高出數(shù)百
    的頭像 發(fā)表于 06-12 14:04 ?4161次閱讀

    Imagination推出全新A系列GPU,性能提升2.5

    Imagination公司發(fā)布了全新的A系列GPU,該系列分為AXE、AXM、AXT三款。據(jù)悉,全新的A系列GPU相較之前的GPU,提升幅度巨大,其中的AXT
    的頭像 發(fā)表于 12-03 14:29 ?3444次閱讀

    AMD:用于AI訓(xùn)練及高性能計(jì)算將在2025年提高30

    高性能AMD EPYC(霄龍)處理器及AMD Instinct加速器致力于為人工智能訓(xùn)練和超級(jí)計(jì)算應(yīng)用帶來(lái)前所未有的提升 加利福尼亞州圣
    發(fā)表于 10-08 13:49 ?892次閱讀

    清華大學(xué)團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得新突破

    清華大學(xué)團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得新突破,相關(guān)研究發(fā)表在Nature上。
    的頭像 發(fā)表于 10-29 09:20 ?1051次閱讀
    <b class='flag-5'>清華</b>大學(xué)團(tuán)隊(duì)在<b class='flag-5'>超高性能</b><b class='flag-5'>計(jì)算</b><b class='flag-5'>芯片</b>領(lǐng)域取得新突破

    清華大學(xué)開發(fā)出超高速光電計(jì)算芯片,性能是商用芯片3000

    針對(duì)這一難題,清華大學(xué)自動(dòng)化系戴瓊海院士、吳嘉敏助理教授與電子工程系方璐副教授、喬飛副研究員聯(lián)合攻關(guān),提出了一種“掙脫”摩爾定律的全新計(jì)算架構(gòu):光電模擬芯片,算力達(dá)到目前高性能商用
    的頭像 發(fā)表于 10-31 18:00 ?1355次閱讀
    <b class='flag-5'>清華</b>大學(xué)<b class='flag-5'>開發(fā)出超高</b>速光電<b class='flag-5'>計(jì)算</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>是商用<b class='flag-5'>芯片</b>的<b class='flag-5'>3000</b><b class='flag-5'>倍</b>!

    中國(guó)開發(fā)芯片,算力提升3000

    據(jù)了解ACCEL芯片的光學(xué)芯片部分只要采用百納米級(jí)別工藝,而電路部分更是可以采用180納米CMOS工藝就能生產(chǎn)這種芯片,用如此落后的工藝卻能將芯片
    的頭像 發(fā)表于 11-03 16:29 ?810次閱讀
    中國(guó)<b class='flag-5'>開發(fā)</b>新<b class='flag-5'>芯片</b>,算力<b class='flag-5'>提升</b><b class='flag-5'>3000</b><b class='flag-5'>倍</b>!

    國(guó)際首個(gè)全模擬光電智能計(jì)算芯片的算力可提升3000

    據(jù)團(tuán)隊(duì)介紹,實(shí)測(cè)結(jié)果顯示,該芯片在智能視覺目標(biāo)識(shí)別任務(wù)方面的算力可超過目前高性能商用芯片3000,為
    的頭像 發(fā)表于 11-08 18:23 ?1501次閱讀
    國(guó)際首個(gè)全模擬光電智能<b class='flag-5'>計(jì)算</b><b class='flag-5'>芯片</b>的算力可<b class='flag-5'>提升</b><b class='flag-5'>3000</b><b class='flag-5'>倍</b>

    AMD披露高效數(shù)據(jù)中心策略,預(yù)計(jì)至2027年提升超百

    會(huì)議期間,蘇姿豐談?wù)摿薃MD如何通過實(shí)施30x25戰(zhàn)略推動(dòng)2025年計(jì)算節(jié)點(diǎn)提升30的目標(biāo)。她進(jìn)一步透露,AMD已找到2026年至20
    的頭像 發(fā)表于 05-24 17:37 ?1027次閱讀