0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

20exaflops算力只有鞋盒大小,靠CMOS技術就能實現(xiàn)的超導處理器

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-05-29 01:14 ? 次閱讀

電子發(fā)燒友網報道(文/周凱揚)隨著摩爾定律失效,高性能計算芯片的規(guī)模進一步擴大,數(shù)據(jù)中心集群龐大的功耗已經成為我們不得不面臨的問題。早在2015年SIA的預測中,到2040年全球計算資源的能源供給就不再具有可持續(xù)性,而如今隨著人工智能的爆發(fā),計算資源的需求更是猛漲。

以用于訓練AI大模型的計算資源為例,每六個月翻倍的速度已經遠超高性能計算集群的組建速度。無需等到2040年,到了2030年訓練單個大模型所需的資源就將超過TOP500所有超算的算力總和,而所需要的電力供應也將達到國家級。解決能源可持續(xù)的問題已經避無可避了,但除非我們放緩發(fā)展速度,或是顛覆計算方式,是很難實現(xiàn)這一目標的。

對于應用層還沒進入商業(yè)模式成熟和完全盈利的人工智能來說,放緩發(fā)展速度自然是不可取的。那么也就只剩下顛覆計算方式一途,而大幅降低能耗的超導計算,也就理所當然地成了多數(shù)研究的重點方向。

顯著降低功耗,最大開銷成為冷卻

2020年,日本國立橫濱大學的一個研究小組就展示了一個超導CPU,并成功實現(xiàn)了流片。該處理器主要采用約瑟夫森結架構打造,這是一種經典的超導三層器件架構,也是超導邏輯單元中取代晶體管的基礎元件。因為其獨特的物理特性,該器件工作時的開關功耗只有10-21J左右,這樣一來動態(tài)功耗相比傳統(tǒng)CMOS器件極大降低,加之超導體無電阻的特性,靜態(tài)功耗無限趨近于零。

超導體的出現(xiàn)為降低功耗提供了最大的可能性,因為其在通過電流時并不會消耗能量。最大的能耗開支莫過于需要在低溫下工作的冷卻方案供電,比如超導芯片的處理單元,往往需要低至4K的冷卻溫度。但即便如此,幾乎零電阻的互聯(lián)、基于超短脈沖構建的數(shù)字邏輯,都為現(xiàn)代計算資源大規(guī)模擴展提供了足夠的優(yōu)勢。

而且隨著計算資源規(guī)模的擴大,冷卻方案開銷的邊際成本也會越小,據(jù)imec研究表明,一旦達到數(shù)十petaflops,超導計算機相比傳統(tǒng)的計算機就要節(jié)能了,而這樣的算力要求,TOP500中排名前30的超算已經可以做到了。

而Imec近期發(fā)布了他們采用標準CMOS工藝制造的超導計算單元,基于該技術打造的處理器能效將是當下最高效芯片的100倍,甚至可以將一個數(shù)據(jù)中心級別的計算資源塞進鞋盒大小的系統(tǒng)中。

將超導帶出實驗室的方法——兼容現(xiàn)有的CMOS制造技術

盡管超導可以降低功耗提高計算密度,但對于目前的大部分研究來說,都只停留在實驗室階段,要想真正實現(xiàn)大規(guī)模量產無異于癡人說夢。比如上文提到的橫濱國立大學超導CPU,就是基于超導鈮實現(xiàn)的,這種材料在可預測的實驗室環(huán)境中表現(xiàn)良好,但要想用于制造工藝中就存在不少難題了。

鈮對傳統(tǒng)半導體加工溫度及其周圍材料都很敏感,一加熱就會失去超導能力,因此與標準CMOS工藝流程不兼容。為此,imec改用了氮化鈮鈦作為基礎超導材料。氮化鈮鈦可以承受CMOS制造工藝所用的溫度,而且與周圍層的反應較少。

同時imec還為約瑟夫森結的勢壘層選擇了一個新材料,無定形硅。傳統(tǒng)的約瑟夫森結勢壘層材料,比如氧化鋁等,可以在可控的條件下生長,但為了達到遠高于CMOS工藝芯片的密度,就必須進一步壓縮其厚度,可這么薄的氧化物已經到了無法制造的程度。無定形硅的出現(xiàn),則允許使用更厚的勢壘層,實現(xiàn)210nm這樣的臨界尺寸。

在電路層面,同樣需要對邏輯和存儲結構重新設計。Imec設計出了一種全新的邏輯架構,名為脈沖守恒邏輯,輸入和輸出的數(shù)量保持一致,且SFQ(單通量量子)的總數(shù)保持守恒。通過不同約瑟夫森結和電容的組合將SFQ引導至不同輸出,從而產生我們常見的邏輯OR和AND。在Imec的設計中,SRAM也是基于約瑟夫森結重新設計的,不過DRAM還是采用傳統(tǒng)的硅工藝,但也需要從室溫降低至77K的低溫環(huán)境,用于提高效率。

鞋盒大小的數(shù)據(jù)中心,也需要3D堆疊實現(xiàn)

在基于CMOS工藝打造的數(shù)字芯片上,隨著縮小晶體管變得越來越困難,我們已經開始廣泛利用3D堆疊技術提高性能。但由于芯片內部的超大功率和熱量,堆疊方案已經逐漸面臨更大的挑戰(zhàn),如何做好散熱成了多數(shù)3D堆疊方案必須解決的首要問題。

對于基于超導體的芯片設計而言,同樣可以借助3D堆疊來實現(xiàn)更高的密度。結合硅中介層和玻璃基板這樣的先進封裝技術,將超導處理單元與嵌入式超導SRAM和DRAM堆疊在一起。芯片的大部分都將浸沒在液氮中,冷卻至4K。

在imec的模擬中,他們將100塊超導體芯片板打造堆疊在一起,中間只留出極小的空間,整個系統(tǒng)的體積大小只有20x20x12厘米,與一個鞋盒大小近似。但正是這樣一個鞋盒大小的系統(tǒng),總功耗只有500kW,卻可以提供將近20exaflops(BF16)的算力。

而這僅僅是Imec路線圖中第一套方案,在后續(xù)的產品中,會進一步縮小約瑟夫森結和互聯(lián)的尺寸。未來通過進一步提高邏輯芯片的密度,芯片板的數(shù)量也會隨之減少,這樣提高性能的同時,也會降低工藝復雜性和成本。

寫在最后

盡管超導計算讓我們看到了可行的技術路線,但即便是imec也不認為超導數(shù)據(jù)技術會取代傳統(tǒng)的CMOS計算,而只是作為部分特定應用補充。這一技術的主要應用場景還是在大型的數(shù)據(jù)中心,為人工智能和機器學習處理提供基于云端的訓練推理等,因為只有這樣的環(huán)境內才能有條件實現(xiàn)超導所需的冷卻技術。在消費電子領域,傳統(tǒng)的CMOS硅工藝依然不可取代。

值得一提的是,這一技術與Imec基于CMOS制造工藝的超導量子比特技術同樣可以做到無縫集成,可以說是電子計算與量子計算的完美結合。但即便搞定了基礎材料工程設計,以及架構的設計,還有電路開發(fā)設計這一環(huán)目前沒有打通,需要EDA廠商為其開發(fā)特定的流程工具。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19404

    瀏覽量

    230908
  • CMOS
    +關注

    關注

    58

    文章

    5735

    瀏覽量

    235962
  • 算力
    +關注

    關注

    1

    文章

    1012

    瀏覽量

    14927
收藏 人收藏

    評論

    相關推薦

    中心的如何衡量?

    作為當下科技發(fā)展的重要基礎設施,其的衡量關乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應用的運行。以下是對智中心算衡量的詳細闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?371次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    走進北大 | 能RISC-V通用處理器設計成功開課

    芯片設計》是涉及到多個異構硬件子系統(tǒng)的體系架構設計和集成的系統(tǒng)性工程,該課程圍繞現(xiàn)代SoC芯片的體系架構和微架構實現(xiàn)技術,特別是高性能通用處理器、加速子系統(tǒng)、互聯(lián)等
    的頭像 發(fā)表于 12-06 01:06 ?397次閱讀
    走進北大 | <b class='flag-5'>算</b>能RISC-V通用<b class='flag-5'>處理器</b>設計成功開課

    基礎篇:從零開始了解

    即計算能力(Computing Power),狹義上指對數(shù)字問題的運算能力,而廣義上指對輸入信息處理實現(xiàn)結果輸出的一種能力。雖然處理
    的頭像 發(fā)表于 11-15 14:22 ?992次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎篇:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者能更好理解芯片。 全書共11章,
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    社會資源和資本力量關注芯片的發(fā)展,希望我們的國家能夠更獨立自主地設計制造高性能芯片。 內容簡介: 本書介紹了超級計算機
    發(fā)表于 09-02 10:09

    的分類與現(xiàn)代生活

    的提升使得用戶能夠享受到更加流暢和豐富的數(shù)字體驗。 個人通常指的是個人使用的計算設備,如智能手機、個人電腦、平板電腦等。這些設備通過中央處理器(CPU)和圖形
    的頭像 發(fā)表于 08-26 15:05 ?253次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>的分類與現(xiàn)代生活

    用ARMxy ARM工業(yè)控制自帶的1Tops實現(xiàn)高性能圖像處理

    ARMxy ARM工業(yè)控制憑借其強大的性能、靈活的配置和高度集成的特性,尤其是其內置的1TopsNPU(神經網絡處理單元),在圖像識別領域展現(xiàn)出了良好的
    的頭像 發(fā)表于 08-20 11:55 ?497次閱讀
    用ARMxy ARM工業(yè)控制<b class='flag-5'>器</b>自帶的1Tops<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>實現(xiàn)</b>高性能圖像<b class='flag-5'>處理</b>

    服務為什么選擇GPU

    隨著人工智能技術的快速普及,需求日益增長。智中心的服務作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心
    的頭像 發(fā)表于 07-25 08:28 ?771次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服務<b class='flag-5'>器</b>為什么選擇GPU

    IaaS+on+DPU(IoD)+下一代高性能底座技術白皮書

    、VMware、Palo Alto 等公司紛紛推出相關解決方案。這些方案背后共同的本質思想是:將云計算的 IaaS 層組件從服務側卸載后圍繞 DPU 構筑高性能底座,與 AWS、阿里云的
    發(fā)表于 07-24 15:32

    imec推出超導處理器,基于現(xiàn)有的CMOS制造工具

    近日,IEEE Spectrum刊文指出,比利時imec微電子研究所在現(xiàn)有的CMOS制造工具基礎上,成功研發(fā)出超導處理器。該超導處理器主要借
    的頭像 發(fā)表于 05-27 17:52 ?831次閱讀

    中國第三代自主超導量子計算機“本源悟空”入駐國家超互聯(lián)網

    中國第三代自主超導量子計算機“本源悟空”日前正式入駐國家超互聯(lián)網平臺,中國最先進的量子、超級
    的頭像 發(fā)表于 04-04 08:21 ?361次閱讀
    中國第三代自主<b class='flag-5'>超導</b>量子計算機“本源悟空”入駐國家超<b class='flag-5'>算</b>互聯(lián)網

    256Tops!CSA1-N8S1684X服務

    (基于BM1684X的高服務)高AI處理器BM1684X搭載了BM1684AI
    的頭像 發(fā)表于 03-23 08:02 ?1739次閱讀
    256Tops<b class='flag-5'>算</b><b class='flag-5'>力</b>!CSA1-N8S1684X<b class='flag-5'>算</b><b class='flag-5'>力</b>服務<b class='flag-5'>器</b>

    iBeLink KS MAX 10.5T大領跑KAS新領域

    有8G的顯存,可以處理復雜的算法,提高挖掘穩(wěn)定性。iBeLink ks max10.5T的超大特點是它的高效節(jié)能,它采用了先進的“存一體”高通量芯片,專為“大型復雜”的區(qū)的塊的鏈
    發(fā)表于 02-20 16:11

    智能規(guī)模超通用,大模型對智能提出高要求

    電子發(fā)燒友網報道(文/李彎彎)是設備通過處理數(shù)據(jù),實現(xiàn)特定結果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per S
    的頭像 發(fā)表于 02-06 00:08 ?6509次閱讀