0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCM正在潛移默化地改變芯片設(shè)計(jì)

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:凱揚(yáng) ? 2022-05-09 08:32 ? 次閱讀

多芯片模塊(MCM)技術(shù)的應(yīng)用在半導(dǎo)體業(yè)界已經(jīng)不是什么新鮮事了,但隨著Chiplet、2.5D/3D封裝技術(shù)日趨火熱,MCM正在滲透進(jìn)更多的芯片設(shè)計(jì)中,無論是GPU、光模塊還是AI芯片,都在慢慢引入這類封裝技術(shù)。

MCM GPU成為趨勢

以去年AMD發(fā)布的首個(gè)MCM GPU Instinct MI250X為例,這款GPU集成了兩個(gè)GPU Chiplet和128GB的超大HBM2e內(nèi)存,在算力和帶寬上都做到了極致,實(shí)現(xiàn)了383TFLOPS(FP16)和3.2TB/s的可怕成績,無疑是專注AI的各大超算中心夢(mèng)寐以求的加速器了。同樣,英特爾也在其Ponte Vecchio GPU上采用了MCM。

Instinct MI250X GPU / AMD

雖然MCM已經(jīng)由AMD和英特爾兩家GPU廠商開始推進(jìn)了,但目前來看英偉達(dá)的動(dòng)作比較小,雖然有相關(guān)的研究,但還未拿出商用的MCM產(chǎn)品。不過以上都是面向HPC/AI市場的GPU,消費(fèi)級(jí)的GPU是否也會(huì)迎來MCM的GPU呢?據(jù)現(xiàn)在的傳聞,AMD極有可能在下一代RDNA3架構(gòu)的高端GPU中用上MCM。

但消費(fèi)級(jí)應(yīng)用與HPC/AI應(yīng)用又屬于截然不同的場景,后者使用多個(gè)GPU跑負(fù)載是很常見的情況。但消費(fèi)場景中多GPU已經(jīng)相當(dāng)少見了,在兼容性上肯定會(huì)大打折扣,所以邁出這一步很可能會(huì)帶來一定的風(fēng)險(xiǎn)。

IP公司眼中的MCM

MCM不僅為GPU公司帶來了更多設(shè)計(jì)靈活性,也讓一眾IP公司找到了新的商業(yè)模式。比如IP公司Credo就提供混合信號(hào)DSP IP,用于客戶的ASIC設(shè)計(jì),以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。隨著數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)慢慢趨向于400G以上,芯片連接性的要求也在逐步升高。為此,Credo在去年底推出了全新的3.2Tbps BlueJay重定時(shí)器chiplet,通過64通道56Gbps PAM4 LR的DSP,提供了強(qiáng)大的系統(tǒng)級(jí)連接性。

BlueJay Chiplet / Credo

BlueJay雖然只是以臺(tái)積電28nm工藝打造,但保證了性能和功耗的要求,與其先進(jìn)工藝方案Nutcracker相比也降低了成本。此外,由于BlueJay與主機(jī)端MCM中SoC核心的通信是通過超低功耗的BoW D2D接口實(shí)現(xiàn)的,其接口已經(jīng)針對(duì)臺(tái)積電的CoWoS封裝技術(shù)做了優(yōu)化。這種將SerDes功能從片上(on-die)轉(zhuǎn)向片外(off-chip)的做法,顯著增加了ASIC的可使用面積,設(shè)計(jì)者可以將這一部分多出來的面積用于實(shí)現(xiàn)更高的計(jì)算性能。

AI在MCM上的創(chuàng)新

同樣,AI也在MCM上找到了新的解決方案。我們已經(jīng)看到了大的機(jī)器學(xué)習(xí)模型通過訓(xùn)練大數(shù)據(jù)在多個(gè)領(lǐng)域展示了驚人的成果,比如計(jì)算機(jī)視覺、語音識(shí)別和自然語言處理等。為了減少機(jī)器學(xué)習(xí)加速器的成本,業(yè)界引入了不少設(shè)計(jì)創(chuàng)新,其中之一就是MCM。

Coral TPU / 谷歌

英偉達(dá)的Simba,谷歌的TPU,都用到了MCM的設(shè)計(jì)。谷歌的Coral TPU是一個(gè)用于邊緣端的機(jī)器學(xué)習(xí)推理加速器,在極小的占用面積下可以實(shí)現(xiàn)4 TOPS(INT8)的峰值性能,能效比可達(dá)2 TOPS/W。英偉達(dá)的Simba同樣是一個(gè)用于推理的芯片,但規(guī)模比谷歌的Coral更大,整個(gè)MCM由36個(gè)Chiplet組成,每個(gè)都能實(shí)現(xiàn)4 TOPS的峰值性能,將整個(gè)芯片算力提升至最高128 TOPS,能效比更是高達(dá)6.1 TOPS/W。

一來在設(shè)計(jì)上,設(shè)計(jì)小芯片的難度比一整塊芯片要低,二來小芯片由于面積較小,生產(chǎn)良率也更高。這都證明了這種方案既可以減少設(shè)計(jì)和生產(chǎn)成本,也能達(dá)到與單個(gè)大芯片近似的性能與能效。

但正如我們上文提到的MCM GPU兼容問題一樣,機(jī)器學(xué)習(xí)中MCM也并非毫無痛點(diǎn)。由于MCM中單個(gè)Chiplet的內(nèi)存遠(yuǎn)比單個(gè)大芯片要小,所以大型機(jī)器學(xué)習(xí)模型的訓(xùn)練與推理都需要將矢量計(jì)算的數(shù)據(jù)流圖在Chiplet上進(jìn)行劃分。多芯片進(jìn)行劃分就是為了將運(yùn)算分配給Chiplet,從而將某個(gè)性能指標(biāo)最大化,比如說吞吐量。但與單芯片不一樣,MCM中小芯片的數(shù)量以及神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量增加,都會(huì)讓搜索空間成指數(shù)級(jí)增長,從而降低效率,更不用說因?yàn)镸CM的硬件特性,可用的劃分方案并不多。所以這種劃分的質(zhì)量,直接影響到了MCM芯片設(shè)計(jì)的優(yōu)化。

為了解決這個(gè)問題,谷歌的研究員們開發(fā)了一種深度強(qiáng)化學(xué)習(xí)的劃分方案,同時(shí)利用一個(gè)約束求解器來專門解決MCM封裝的機(jī)器學(xué)習(xí)模型劃分問題。他們的方案可以通過預(yù)訓(xùn)練來普及到未知的輸入圖,通過對(duì)生產(chǎn)級(jí)BERT模型的硬件評(píng)估,他們得到了超過隨機(jī)搜索和模擬退火等現(xiàn)有方案5%以上的吞吐量。更重要的是,這種方案具備極佳的遷移學(xué)習(xí)性能,使用預(yù)訓(xùn)練的模型可以有效提升樣本效率,將搜索時(shí)間從3個(gè)小時(shí)減少到了9分鐘。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52145

    瀏覽量

    435895
  • 芯片設(shè)計(jì)
    +關(guān)注

    關(guān)注

    15

    文章

    1062

    瀏覽量

    55455
  • MCM
    MCM
    +關(guān)注

    關(guān)注

    1

    文章

    68

    瀏覽量

    22548
收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問改變電源管理芯片參考點(diǎn)電壓就會(huì)改變芯片輸出電壓的原理是什么?

    在線性穩(wěn)壓芯片LM7815電源管理芯片,在輸出端并聯(lián)電阻分壓網(wǎng)絡(luò)R1和R2,并將分壓點(diǎn)接在參考端,這樣做為什么會(huì)將輸出電壓增大為(1+R2/R1)*Ue,Ue為電源管理芯片額定輸出電壓; 這里假設(shè)
    發(fā)表于 04-17 06:28

    谷東AR+AI智能眼鏡如何改變生活

    這不是科幻電影,而是一副AR+AI眼鏡正在發(fā)生的“魔法”。今天,我們帶大家走進(jìn)這款即將改變生活的未來科技——谷東AR+AI智能眼鏡。
    的頭像 發(fā)表于 04-14 12:50 ?398次閱讀

    生物傳感器:解鎖生命密碼的“芯片”,正在改變世界的感知方式

    當(dāng)你用智能手表監(jiān)測心率,用血糖儀檢測健康,甚至喝下一杯經(jīng)過微生物檢測的牛奶時(shí),或許不曾想到,這些日常場景背后都藏著同一項(xiàng)前沿技術(shù)——生物傳感器。這個(gè)將生物學(xué)與電子技術(shù)融合的“魔法工具”,正在
    的頭像 發(fā)表于 03-26 18:19 ?271次閱讀

    AI在芯片上的應(yīng)用:革新設(shè)計(jì)與功能

    AI在芯片上的應(yīng)用正在深刻改變芯片設(shè)計(jì)、制造和應(yīng)用的全過程。未來,隨著AI技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,AI芯片將成為推動(dòng)科技發(fā)展的
    的頭像 發(fā)表于 02-17 16:09 ?449次閱讀

    EE-70:ADSP-2106x SPORT DTx引腳:不同SHARC之間是否存在潛在的MCM數(shù)據(jù)爭用

    電子發(fā)燒友網(wǎng)站提供《EE-70:ADSP-2106x SPORT DTx引腳:不同SHARC之間是否存在潛在的MCM數(shù)據(jù)爭用.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 15:11 ?0次下載
    EE-70:ADSP-2106x SPORT DTx引腳:不同SHARC之間是否存在潛在的<b class='flag-5'>MCM</b>數(shù)據(jù)爭用

    Chiplet或改變半導(dǎo)體設(shè)計(jì)和制造

    在快速發(fā)展的半導(dǎo)體領(lǐng)域,小芯片技術(shù)正在成為一種開創(chuàng)性的方法,解決傳統(tǒng)單片系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)面臨的許多挑戰(zhàn)。隨著摩爾定律的放緩,半導(dǎo)體行業(yè)正在尋求創(chuàng)新的解決方案,以提高性能和功能,
    的頭像 發(fā)表于 12-05 10:03 ?535次閱讀
    Chiplet或<b class='flag-5'>改變</b>半導(dǎo)體設(shè)計(jì)和制造

    Chiplet將徹底改變半導(dǎo)體設(shè)計(jì)和制造

    本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自IDTechEx全球Chiplet市場正在經(jīng)歷顯著增長,預(yù)計(jì)到2035年將達(dá)到4110億美元。 在快速發(fā)展的半導(dǎo)體領(lǐng)域,小芯片技術(shù)正在成為一種開創(chuàng)性
    的頭像 發(fā)表于 11-25 09:50 ?373次閱讀
    Chiplet將徹底<b class='flag-5'>改變</b>半導(dǎo)體設(shè)計(jì)和制造

    數(shù)字孿生如何改變傳統(tǒng)行業(yè)

    數(shù)字孿生作為一種前沿技術(shù),正在深刻改變傳統(tǒng)行業(yè),其影響力和變革能力在各個(gè)領(lǐng)域中日益顯現(xiàn)。以下是數(shù)字孿生如何改變傳統(tǒng)行業(yè)的具體分析: 一、數(shù)字孿生的定義與特點(diǎn) 數(shù)字孿生是一種通過數(shù)字手段模擬和還原實(shí)體
    的頭像 發(fā)表于 10-25 15:06 ?548次閱讀

    正在使用的芯片停產(chǎn),而您又不想改變PCB布局時(shí),該怎么辦?

    我們的一位客戶遇到了一個(gè)棘手的問題,正在使用的芯片停產(chǎn),而客戶又不想改變PCB布局,找到瑞蘇盈科,要求我們?yōu)橥.a(chǎn)的鍵盤編碼器IC開發(fā)一種無須更換的替代品。面臨的挑戰(zhàn)如何用無須改動(dòng)的替代品取代已停產(chǎn)
    的頭像 發(fā)表于 10-25 08:03 ?463次閱讀
    <b class='flag-5'>正在</b>使用的<b class='flag-5'>芯片</b>停產(chǎn),而您又不想<b class='flag-5'>改變</b>PCB布局時(shí),該怎么辦?

    ASML CEO傅恪禮:亞洲將繼續(xù)主導(dǎo)芯片行業(yè)

    ASML總裁兼CEO傅恪禮近日在接受外媒采訪時(shí)指出,盡管西方國家正在積極增加芯片生產(chǎn),但亞洲在芯片行業(yè)中的主導(dǎo)地位不太可能發(fā)生改變。
    的頭像 發(fā)表于 10-10 15:13 ?766次閱讀

    芯片封裝是什么?芯片封裝中芯片環(huán)氧膠的應(yīng)用有哪些?

    通過導(dǎo)線連接芯片與外部電路,實(shí)現(xiàn)信號(hào)傳輸,并幫助散熱。封裝層次:零級(jí)封裝:芯片互連,連接芯片焊區(qū)與封裝。一級(jí)封裝(SCM/MCM):單或多芯片
    的頭像 發(fā)表于 09-20 10:15 ?920次閱讀
    <b class='flag-5'>芯片</b>封裝是什么?<b class='flag-5'>芯片</b>封裝中<b class='flag-5'>芯片</b>環(huán)氧膠的應(yīng)用有哪些?

    請(qǐng)問固定增益芯片是否意味著不能通過改變外圍參數(shù)來改變增益?

    固定增益芯片是否意味著我不能通過改變外圍參數(shù)來改變增益?
    發(fā)表于 09-11 07:13

    Tidal正在改變其音頻格式

    對(duì)于發(fā)燒友來說,大新聞是:Tidal正在改變其音頻格式。從7月24日開始,Tidal將放棄對(duì)Master Quality Authenticated(MQA)和360 Reality Audio格式
    的頭像 發(fā)表于 06-24 16:51 ?982次閱讀

    聯(lián)發(fā)科正在開發(fā)Arm架構(gòu)Windows PC芯片

    據(jù)權(quán)威媒體援引三位知情人士的消息報(bào)道,聯(lián)發(fā)科正在緊鑼密鼓地開發(fā)一款基于Arm架構(gòu)的個(gè)人電腦芯片。這款芯片將成為推動(dòng)Windows操作系統(tǒng)在新型電腦設(shè)備上運(yùn)行的重要力量。
    的頭像 發(fā)表于 06-13 09:16 ?946次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品