0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3D芯片堆疊是如何完成的

中科院半導(dǎo)體所 ? 來源:悅智網(wǎng) ? 作者:Samuel K. Moore ? 2022-08-31 10:46 ? 次閱讀

高端計算的解決方案是堆疊硅片。

一批高性能處理器表明,延續(xù)摩爾定律的新方向是向上發(fā)展。每一代處理器都要比上一代性能更好,究其根本,這意味著要在硅片上集成更多的邏輯。但其中存在兩個問題。首先,我們縮小晶體管及其組成的邏輯和內(nèi)存塊的能力正在放緩。其次,單塊芯片已經(jīng)達到了尺寸極限。光刻工具可以在850平方毫米的面積內(nèi)繪制圖案,這大約是一個現(xiàn)代服務(wù)器圖形處理單元(GPU)的大小。

有一種解決辦法是將兩塊或多塊硅片并排放置在同一個封裝中,并使用幾毫米長的密集互連將它們縫合在一起,這樣它們就可以作為一個單元有效地運行。這種所謂的2.5D方案由先進的封裝技術(shù)實現(xiàn),已經(jīng)落后于幾個頂級處理器,這些處理器現(xiàn)在由多個功能性“芯粒”組成,而不是單個集成電路。 但是,要像在同一塊芯片上一樣傳輸大量數(shù)據(jù),我們需要更短、更密集的連接,而這只能通過將一塊芯片堆疊在另一塊芯片上來實現(xiàn)。在3D方案中面對面連接兩塊芯片可能意味著每平方毫米要有數(shù)百甚至數(shù)千微米長的連接。通過這些短而密集的連接,只需很少的能量就能將數(shù)據(jù)從一塊硅片快速傳輸?shù)搅硪粔K,就好像兩塊硅片是一塊芯片一樣。

要做到這一點需要很多創(chuàng)新。工程師們必須想辦法防止堆棧中一塊芯片的熱量破壞另一塊芯片,決定哪些功能應(yīng)該放在哪里、這些功能如何實現(xiàn),防止偶爾出現(xiàn)的壞芯片造成大量昂貴的無用系統(tǒng),以及應(yīng)對一次完成這一切所增加的復(fù)雜性。

以下3個示例不僅展示了3D芯片堆疊是如何完成的,還介紹了其優(yōu)勢。

采用3D V-Cache緩存技術(shù)的AMD Zen 3

長期以來,個人計算機都可以選擇增加內(nèi)存,以便提高處理超大應(yīng)用和大數(shù)據(jù)量工作的速度。由于3D芯片堆疊的出現(xiàn),超微半導(dǎo)體公司(AMD)的下一代CPU芯粒也有了這個選擇。當(dāng)然,這不是售后市場的擴展組件,但如果你想打造一臺更具魅力的計算機,那么訂購一款有超大緩存的處理器可能是正確的選擇。

新款Zen 3計算芯粒及其前代版本均采用了相同的臺積電(TSMC)制造工藝,因此其晶體管大小、互連和其他屬性均相同。但是AMD對Zen 3做了很多架構(gòu)修改,因此即使沒有額外的高速緩存,其時鐘運行速度也提高了6%,平均性能也提高了19%。在這些架構(gòu)瑰寶之上,還有一組硅通孔(TSV),即直接穿透大部分硅的垂直互連。硅通孔構(gòu)建在Zen 3的最后一級緩存中,也就是名為L3的靜態(tài)隨機存取存儲器(SRAM)塊中。緩存位于計算芯粒的中間,并由其全部8個內(nèi)核共享。 在處理大量數(shù)據(jù)工作負載的處理器中,Zen 3晶圓的背面被減薄,使得硅通孔暴露出來。

然后,使用混合鍵合(參見補充介紹“3D技術(shù)”)將64MB的SRAM芯粒連接到這些暴露出來的硅通孔上。后一種技術(shù)可以每隔9微米在CPU內(nèi)核和高速緩存之間形成連接。最后,為了結(jié)構(gòu)穩(wěn)定性和便于熱傳導(dǎo),附加上空白硅芯粒以覆蓋Zen 3 CPU裸片的其余部分。 以2.5D排列形式在CPU 裸片旁額外添加緩存并不可取,因為數(shù)據(jù)要花很長時間才能到達處理器內(nèi)核。AMD高級研究員、設(shè)計工程師約翰?吳(John Wuu)在今年2月舉行的IEEE國際固態(tài)電路會議(ISSCC)上對虛擬參會者說:“雖然L3(緩存)的尺寸增加了兩倍,但3D V-cache只增加了4個(時鐘)周期的延遲,這只有通過3D堆疊才能實現(xiàn)。”
7b373856-2870-11ed-ba43-dac502259ad0.jpg

更高的緩存在高端游戲中有了用武之地。使用臺式銳龍CPU和3D V-Cache可將1080p渲染的游戲速度平均提高15%。這也適用于霄龍服務(wù)器中央處理機(CPU)所處理的更重要的工作,可將困難的半導(dǎo)體設(shè)計驗證工作的運行時間縮短66%。

吳指出,與縮小邏輯的能力相比,業(yè)界縮小SRAM的能力正在放緩。因此,未來的SRAM擴展包可能會繼續(xù)使用更成熟的制造工藝,而計算芯粒將被推到摩爾定律的最前沿。

Graphcore的Bow AI處理器

即使堆棧中的一塊芯片上沒有晶體管,3D集成也可以加快計算速度??偛课挥谟?a target="_blank">人工智能(AI)計算機公司Graphcore僅通過在其AI處理器上安裝一塊功率傳輸芯片,就大幅提高了其系統(tǒng)的性能。增加功率傳輸硅片意味著名為Bow的組合芯片可以運行得更快,為1.85而非1.325千兆赫,且電壓低于其前一代。與上一代相比,這相當(dāng)于通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)使計算機的速度提高了40%,而能耗降低了16%。重要的是,用戶無須更改其軟件便能獲得這種提升。 功率管理裸片由電容器和硅通孔組合而成。后者只是向處理器芯片供電和提供數(shù)據(jù)。真正起作用的是電容器。

與動態(tài)RAM中的位存儲組件一樣,這些電容器位于硅片中深窄的溝槽中。由于這些電荷儲存器離處理器晶體管非常近,因此功率可以順暢地傳輸,從而能使處理器內(nèi)核在較低電壓下更快地運行。如果沒有功率傳輸芯片,處理器必須將其工作電壓提高到標(biāo)稱水平以上,才能在1.85千兆赫下工作,因此耗電量更高。有了功率芯片,它可以實現(xiàn)更高的時鐘頻率,并且功耗也更低。 Bow的制造工藝獨一無二,但不太可能一直保持這種方式。

大多數(shù)3D堆疊是在其中一塊芯片仍在晶圓上時將一塊芯片鍵合到另一塊芯片上完成的,稱為“晶圓上芯片”(chip-on-wafer)。相反,Bow采用了臺積電的堆疊晶圓(wafer-on-wafer)技術(shù),將一種類型的整片晶圓與另一種類型的整片晶圓鍵合起來,然后切割成芯片。

Graphcore首席技術(shù)官兼聯(lián)合創(chuàng)始人西蒙?諾爾斯(Simon Knowles)表示,Bow是市場上第一款使用這種技術(shù)的芯片,它使兩塊裸片之間的連接密度高于使用晶圓上芯片工藝所能達到的密度。 雖然目前Graphcore的功率傳輸芯片沒有晶體管,但未來可能會有。諾爾斯說,將這種技術(shù)用于功率傳輸“只是我們的第一步,在不久的將來,它會走得更遠”。

英特爾的Ponte Vecchio超級計算機芯片

極光超級計算機旨在成為美國首批突破exaflop屏障(每秒百億億次高精度浮點運算)的高性能計算機之一。為了讓極光達到這種高度,英特爾的Ponte Vecchio在47塊硅片上封裝了1000多億個晶體管,構(gòu)成了一臺處理器。英特爾使用2.5D和3D技術(shù)將3100平方毫米的硅片塞進了2330平方毫米的空間中,大約相當(dāng)于4塊英偉達A100 GPU。

英特爾院士威爾弗雷德?戈麥斯(Wilfred Gomes)在ISSCC上對各位工程師說,這款處理器將英特爾的2D和3D集成技術(shù)推向了極限。 每個Ponte Vecchio實際上是兩組使用英特爾2.5D集成技術(shù)Co-EMIB連接在一起的鏡像芯粒。Co-EMIB是“共嵌式多裸片互連橋接”的縮寫,它在兩個3D芯粒堆棧之間形成了高密度互連硅橋。Co-EMIB裸片還將高帶寬內(nèi)存和一個I/O芯粒連接到了其余芯粒堆疊的“基底磁貼”上。

基底磁貼采用了英特爾的3D集成技術(shù)Foveros,將計算和緩存芯粒堆疊其上。Foveros使用微凸塊(每根頂部有一個微米寬焊球的短銅柱)使垂直連接相隔幾十微米。信號電源通過硅通孔進入該堆棧。 8個計算磁貼、4個緩存磁貼和8個給處理器散熱的空白“熱”磁貼都連接到了基底磁貼上?;状刨N本身具備高速緩存和允許任何計算磁貼訪問任何存儲元件的網(wǎng)絡(luò)。 7b7b9ac8-2870-11ed-ba43-dac502259ad0.jpg ?

無需多言,這一切都不容易。戈麥斯對與會者說,這項技術(shù)在收益管理、時鐘電路、熱調(diào)節(jié)和功率傳輸方面進行了創(chuàng)新。例如,英特爾工程師選擇為處理器提供高于正常值(1.8伏)的電壓,以便電流足夠低,從而簡化封裝?;状刨N中的電路將電壓降低到了近0.7伏,以便在計算磁貼上使用,并且每個計算磁貼必須在基底磁貼上有自己的功率域。這項能力的關(guān)鍵是一種名為“同軸磁集成電感器”的新型高效組件。因為這些組件都內(nèi)置在封裝基板中,所以在向計算磁貼提供電壓之前,電路實際上在基底磁貼和封裝之間來回蜿蜒。

戈麥斯表示,從2008年第一臺千萬億次浮點運算超級計算機發(fā)展到今年的百億億次浮點運算超級計算機花了14年。他預(yù)測,借助3D堆疊等先進封裝技術(shù),下次將計算速度提高千倍所需的時間可能會縮短到6年。

3D技術(shù)

混合鍵合將芯片互連堆棧頂部的銅焊盤與另一塊芯片上的銅焊盤直接鍵合在一起。在混合鍵合中,焊盤位于被氧化物絕緣體包圍的小凹槽中。絕緣體被化學(xué)激活,在室溫下被反向按壓時會立即結(jié)合。然后,在退火步驟中,銅焊盤會膨脹并橋接間隙,形成低阻抗鏈路。 混合鍵合的連接密度高達每平方毫米1萬個鍵合,遠高于微凸塊技術(shù)每平方毫米400至1600個鍵合的連接密度(見圖表)。 7b8faa0e-2870-11ed-ba43-dac502259ad0.jpg

如今可以實現(xiàn)的間距(從一個互連的邊緣到下一個互連最邊緣的距離)約為9微米,更緊密的幾何結(jié)構(gòu)正在研究中。封裝技術(shù)公司ASE集團的工程和技術(shù)營銷總監(jiān)曹麗紅(Lihong Cao,音)表示,這項技術(shù)的極限間距可能在3微米左右。她說,改進混合鍵合最關(guān)鍵的步驟是防止晶圓翹曲,并將每一面的表面粗糙度降低到納米級。 7bb7b382-2870-11ed-ba43-dac502259ad0.jpg

微凸塊本質(zhì)上是一種叫做“倒裝芯片”的標(biāo)準(zhǔn)封裝技術(shù)的縮小版。在倒裝芯片中,焊料凸塊被添加到了芯片頂部(表面)的互連端點。然后將芯片翻轉(zhuǎn)到具有一組匹配互連的封裝基板上,并熔化焊料形成鍵合。要用這種技術(shù)堆疊兩塊芯片,其中一塊芯片的表面必須有短銅柱。然后用一個“微凸塊”焊料蓋住這些芯片,通過熔化焊料將兩塊芯片面對面連接起來。

使用微凸塊時,從一個連接的起點到下一個連接最邊緣的最短距離(也就是間距)可以小于50微米。英特爾在Ponte Vecchio超級計算機芯片中使用了36微米間距版本的Foveros 3D集成技術(shù)。三星表示,其名為3D X-Cube的微凸塊技術(shù)可以實現(xiàn)30微米的間距。該技術(shù)達不到(上述)混合鍵合的密度。然而,它對對齊和平面化的要求并不像混合鍵合那樣嚴格,因此更容易將采用不同制造技術(shù)制造的多塊芯片堆疊到單個基極芯片上。 7be28328-2870-11ed-ba43-dac502259ad0.jpg

硅通孔(TSV)是垂直向下穿過芯片硅的互連。它們不會貫穿整個晶圓,因此必須將硅片的背面磨平,直至硅通孔暴露出來。這在3D堆疊芯片中通常是必要的,因為要將芯片鍵合在一起使其互連面對面。在這種情況下,硅通孔可為堆棧供電并提供數(shù)據(jù)。多年來,它們在垂直堆疊多塊內(nèi)存芯片的高帶寬動態(tài)RAM中得到了廣泛應(yīng)用。但隨著3D芯片堆疊技術(shù)的發(fā)展,這項技術(shù)也應(yīng)用到了邏輯芯片中。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19376

    瀏覽量

    230441
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4760

    瀏覽量

    129128
  • sram
    +關(guān)注

    關(guān)注

    6

    文章

    768

    瀏覽量

    114750
  • 3D芯片
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    18440

原文標(biāo)題:3D處理器的3種制造方法

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    預(yù)期提前,鎧俠再次加速,3D NAND準(zhǔn)備沖擊1000層

    電子發(fā)燒友網(wǎng)報道(文/黃山明)近日,鎧俠再次宣布,將在2027年實現(xiàn)3D NAND的1000層堆疊,而此前鎧俠計劃是在2031年批量生產(chǎn)超1000層的3D NAND存儲器。三星也在此前表示,將在
    的頭像 發(fā)表于 06-29 00:03 ?4586次閱讀

    2.5D3D封裝技術(shù)介紹

    。 2.5D封裝將die拉近,并通過硅中介連接。3D封裝實際上采用2.5D封裝,進一步垂直堆疊die,使die之間的連接更短。通過這種方式直接集成IC,IC間通信接口通??梢詼p少或完全
    的頭像 發(fā)表于 01-14 10:41 ?132次閱讀
    2.5<b class='flag-5'>D</b>和<b class='flag-5'>3D</b>封裝技術(shù)介紹

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,并增加Condition層 此層為局部摩擦的層,所以要注意區(qū)域的設(shè)置; 設(shè)置完成后要生成mesh文件 2.2在TechWiz LCD 3D軟件中將Local Mask的頂部以及底部配向角度添加進來 3. 結(jié)果查看 3.1
    發(fā)表于 01-03 08:58

    TechWiz LCD 3D應(yīng)用:撓曲電效用仿真

    完成后在TechWiz LCD 3D中加載并進行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中開啟應(yīng)用撓曲電效應(yīng)的功能 2.3其它設(shè)置 液晶設(shè)置 電壓條件設(shè)置 光學(xué)分析部分,添加偏振片 結(jié)果查看 3.1 V-T
    發(fā)表于 12-10 13:43

    DMD芯片3D打印中的創(chuàng)新應(yīng)用

    隨著科技的不斷進步,3D打印技術(shù)已經(jīng)從最初的原型制造,逐漸擴展到工業(yè)制造、醫(yī)療、教育等多個領(lǐng)域。DMD芯片作為一種高精度的光控制設(shè)備,其在3D打印技術(shù)中的應(yīng)用,為這一領(lǐng)域帶來了革命性的變化。 DMD
    的頭像 發(fā)表于 12-05 10:55 ?331次閱讀

    3D集成電路的結(jié)構(gòu)和優(yōu)勢

    3D 集成電路的優(yōu)勢有目共睹,因此現(xiàn)代芯片中也使用了 3D 結(jié)構(gòu),以提供現(xiàn)代高速計算設(shè)備所需的特征密度和互連密度。隨著越來越多的設(shè)計集成了廣泛的功能,并需要一系列不同的特征,3D 集成
    的頭像 發(fā)表于 12-03 16:39 ?877次閱讀
    <b class='flag-5'>3D</b>集成電路的結(jié)構(gòu)和優(yōu)勢

    3D堆疊像素探測器芯片技術(shù)詳解(72頁PPT)

    3D堆疊像素探測器芯片技術(shù)詳解
    的頭像 發(fā)表于 11-01 11:08 ?2827次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>堆疊</b>像素探測器<b class='flag-5'>芯片</b>技術(shù)詳解(72頁PPT)

    3D堆疊發(fā)展過程中面臨的挑戰(zhàn)

    3D堆疊將不斷發(fā)展,以實現(xiàn)更復(fù)雜和集成的設(shè)備——從平面到立方體
    的頭像 發(fā)表于 09-19 18:27 ?1298次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>堆疊</b>發(fā)展過程中面臨的挑戰(zhàn)

    安寶特產(chǎn)品 3D Evolution : 基于特征實現(xiàn)無損CAD格式轉(zhuǎn)換

    安寶特3D Evolution具有強大的3D CAD模型轉(zhuǎn)換功能,可在保留模型特征參數(shù)、注釋、約束的前提下,完成不同格式3D CAD模型的無損轉(zhuǎn)換
    的頭像 發(fā)表于 08-06 17:26 ?356次閱讀
    安寶特產(chǎn)品   <b class='flag-5'>3D</b> Evolution : 基于特征實現(xiàn)無損CAD格式轉(zhuǎn)換

    3D封裝熱設(shè)計:挑戰(zhàn)與機遇并存

    隨著半導(dǎo)體技術(shù)的不斷發(fā)展,芯片封裝技術(shù)也在持續(xù)進步。目前,2D封裝和3D封裝是兩種主流的封裝技術(shù)。這兩種封裝技術(shù)在散熱路徑和熱設(shè)計方面有著各自的特點和挑戰(zhàn)。本文將深入探討2D封裝和
    的頭像 發(fā)表于 07-25 09:46 ?1476次閱讀
    <b class='flag-5'>3D</b>封裝熱設(shè)計:挑戰(zhàn)與機遇并存

    裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)

    隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D模型設(shè)計師,還是希望在視頻播放和模型展示中體驗逼真
    的頭像 發(fā)表于 07-16 10:04 ?595次閱讀

    SK海力士5層堆疊3D DRAM制造良率已達56.1%

    在全球半導(dǎo)體技術(shù)的激烈競爭中,SK海力士再次展示了其卓越的研發(fā)實力與創(chuàng)新能力。近日,在美國夏威夷舉行的VLSI 2024峰會上,SK海力士宣布了其在3D DRAM技術(shù)領(lǐng)域的最新研究成果,其中5層堆疊3D DRAM良品率已高達5
    的頭像 發(fā)表于 06-27 10:50 ?664次閱讀

    3D動畫原理:電阻

    電阻3D
    深圳崧皓電子
    發(fā)布于 :2024年03月19日 06:49:19

    2張圖2秒鐘完成3D建模!3D內(nèi)容生成工具DUSt3R爆火,國產(chǎn)廠商有哪些機會?

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)近日,一款名為DUSt3R的AI新工具在GitHub上爆火。DUSt3R能夠在短短2秒鐘內(nèi)通過僅有2張圖片完成3D 重建,讓許多網(wǎng)友大呼驚奇,甚至認為這比
    的頭像 發(fā)表于 03-06 00:10 ?4138次閱讀
    2張圖2秒鐘<b class='flag-5'>完成</b><b class='flag-5'>3D</b>建模!<b class='flag-5'>3D</b>內(nèi)容生成工具DUSt<b class='flag-5'>3</b>R爆火,國產(chǎn)廠商有哪些機會?

    三星將推出GDDR7產(chǎn)品及280層堆疊3D QLC NAND技術(shù)

    三星將在IEEE國際固態(tài)電路研討會上展示其GDDR7產(chǎn)品以及280層堆疊3D QLC NAND技術(shù)。
    的頭像 發(fā)表于 02-01 10:35 ?815次閱讀