0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在小芯片CPU嘗到甜頭,AMD向Chiplet GPU進發(fā)!

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:周凱揚 ? 2021-01-07 08:21 ? 次閱讀

電子發(fā)燒友報道(文/周凱揚)在HPC應(yīng)用上,對突破性能的追求是從未停歇的,尤其是在人工智能、機器學習和大數(shù)據(jù)分析等新興應(yīng)用提出更高的性能要求后。但制程突破的速度已經(jīng)逐漸放緩,每個工藝節(jié)點帶來的頻率紅利也在慢慢變小。而為了減少生產(chǎn)和開發(fā)成本,提高良率,不少CPU制造商都開始看向小芯片。

2020年的最后一天,AMD公布了自己在小芯片GPU上的專利,引起了不少熱議。大家都在猜測,小芯片是否能成為后摩爾時代芯片設(shè)計創(chuàng)新的利器呢?

AMD:從小芯片CPU走向小芯片GPU

AMD從很早開始就在小芯片上發(fā)力了,不管是EPYC服務(wù)器CPU還是線程撕裂者桌面CPU,都大量運用了小芯片設(shè)計。在AMD看來,傳統(tǒng)的單片處理器將一個或多個CPU核心放置在單個裸片上,以此加速時鐘頻率和緩存讀取,雖然這種策略對于需要重度CPU使用的工作來說非常合理,但仍有其限制。而小芯片設(shè)計可以帶來更快的架構(gòu)創(chuàng)新,尤其是在數(shù)據(jù)中心等應(yīng)用上。

在去年的ISSCC 2020上,AMD重點提到了小芯片在第二代EPYC服務(wù)器CPU上帶來的優(yōu)勢。運用Zen 2架構(gòu)的EPYC服務(wù)器CPU上,AMD在CPU核心上運用了臺積電代工的7nm小芯片,IOD仍然采用Global Foundries的14nm制程。AMD提到這種設(shè)計實現(xiàn)了更高的核心數(shù)和更高的性能,而且顯著降低了成本。

而AMD近期公布的小芯片GPU專利同樣掀起了不小的浪花,該專利展示了一種使用高帶寬交聯(lián)的小芯片GPU設(shè)計方案。

pIYBAF_2VEeAUAtDAADgZQmUmD4446.png

小芯片GPU / AMD


在該專利中,AMD提到,由于多數(shù)應(yīng)用是以單個GPU為前提寫就的,所以為了保留現(xiàn)有的應(yīng)用編程模型,將小芯片設(shè)計實現(xiàn)在GPU上向來都是一大挑戰(zhàn)。而該專利利用一根總線將第一個GPU小芯片與CPU相連,余下的GPU用被動交聯(lián)連接。

如今許多架構(gòu)至少擁有一級緩存連貫分布在整個GPU裸片上,比如L3或其他最后一級緩存(LLC)。而這種設(shè)計中,這些物理資源被放置在不同的裸片上,并提供通信連接以保證其緩存連貫性。在工作過程中,內(nèi)存地址請求從CPU發(fā)往一個GPU小芯片,后者與高帶寬被動交聯(lián)溝通以定位所需數(shù)據(jù),因此從CPU的角度來看,仍然是在一個單獨的GPU上尋址。

Intel:以小芯片打造客戶2.0的芯片

芯片方案演化 / Intel

Intel在去年的架構(gòu)日上給出了他們在IP/SOC上的策略改變,在過去整合的單片SOC中,開發(fā)周期長達3到4年,而且在投入使用后,制造商和用戶會在芯片上發(fā)現(xiàn)上百個Bug。而演化至多裸片的基本小芯片結(jié)構(gòu)后,將GPU、CPU和IO放置在不同的裸片上,開發(fā)周期縮減至2-3年,Bug數(shù)目縮減至十數(shù)個,不僅如此,小芯片設(shè)計還可以重復使用。最后則是Intel對未來小芯片結(jié)構(gòu)的展望,將不同的IP放在最優(yōu)制程的小芯片上,比如內(nèi)存、I/O或圖形等,從IP或小芯片層面上來做驗證,因此Bug數(shù)目不足十個,開發(fā)周期僅需1年。

客戶2.0方案 / Intel

這樣的設(shè)計也讓Intel對芯片定位有了更多的自由,比如游戲玩家需要更多的圖形性能,而開發(fā)者則更渴求高算力的和強大的AI性能等。這也就是Intel設(shè)想的客戶2.0愿景,通過智能感知帶給消費者無縫的高性能體驗。

盡管GPU一直是Intel的弱項之一,但這并不代表Intel沒有在顯示領(lǐng)域上發(fā)力。自從Intel從AMD的圖形部門挖走首席架構(gòu)師Raja Koduri以來,Intel就開始在獨立顯卡上發(fā)力。Intel于2019年末公布了超算級別的GPU,代號名為Ponte Vecchio,該GPU基于7nm工藝和小芯片技術(shù),將于2021年年內(nèi)安裝在Aurora超級計算機上作為圖形加速器使用。

小芯片的后盾:新的互聯(lián)與封裝技術(shù)

如果沒有創(chuàng)新的互聯(lián)與封裝技術(shù),小芯片設(shè)計同樣是無法立足的。在小芯片的封裝上,Intel已經(jīng)規(guī)劃好了詳細的封裝路線圖。

處理器封裝路線圖 / Intel

在Kaby Lake G處理器和Agilex FPGA上,Intel已經(jīng)實現(xiàn)了EMIB這種2.5D的封裝方式。而Intel在Lakefield系列處理器上使用的Foveros 3D封裝技術(shù)則是對EMIB的進一步補充,該技術(shù)可將凸起高度進一步降低至50-25um,并實現(xiàn)接近1000 IO/mm2的密度。

Infinity架構(gòu) / AMD

但要想分解后的小芯片也能保持聯(lián)通,這就是互聯(lián)技術(shù)派上用場的地方,比如AMD在Zen架構(gòu)CPU中引入的Infinity Fabric。AMD將Infinity Fabric視為連接各大產(chǎn)品線的基石,通過第三代Infinity框架,AMD得以為CPU與GPU之間提供大帶寬和低延遲的連接、統(tǒng)一的內(nèi)存訪問,提升AMD產(chǎn)品的結(jié)合性能并簡化編程。

小結(jié)

去年的全球硬科技創(chuàng)新大會上,芯動科技、紫光存儲等成立了中國Chiplet產(chǎn)業(yè)聯(lián)盟,推動國內(nèi)的小芯片發(fā)展。芯動科技在2020年推出了國產(chǎn)自主Chiplet標準INNOLINK,讓龐大的數(shù)據(jù)在小芯片之間低延遲傳輸。

INNOLINK解決方案 / 芯動科技


至于AMD的小芯片GPU,其實如此架構(gòu)可能更有可能用于未來的CDNA數(shù)據(jù)中心GPU,而不是下一代RDNA消費級GPU。因為對于消費級GPU來說,很大一部分場景是對延遲極度敏感的游戲應(yīng)用,這正是小芯片GPU必須要先突破的限制,如果小芯片GPU有著SLI和CrossFire一樣大的延遲的話,無疑也會淡出人們的視野。

本文由電子發(fā)燒友網(wǎng)原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。如需轉(zhuǎn)載,請?zhí)砑游?a target="_blank">信號elecfans999。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5484

    瀏覽量

    134351
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10889

    瀏覽量

    212384
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4760

    瀏覽量

    129131
收藏 人收藏

    評論

    相關(guān)推薦

    Chiplet技術(shù)有哪些優(yōu)勢

    Chiplet技術(shù),就像用樂高積木拼搭玩具一樣,將芯片的不同功能模塊,例如CPUGPU、內(nèi)存等,分別制造成獨立的小芯片。
    的頭像 發(fā)表于 11-27 15:53 ?411次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    封裝到一個超長的指令字中,然后CPU中有對應(yīng)寬度的 ALU 來完成相應(yīng)的指令操作。這是一種非常經(jīng)濟的硬件設(shè)計方式,它的核心邏輯是通過簡單的硬件構(gòu)造,實現(xiàn)盡可能高的指令并行度。 總的來說,GPU圖形
    發(fā)表于 11-03 12:55

    AMD與NVIDIA GPU優(yōu)缺點

    圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產(chǎn)品性能、功耗、價格等方面都有著不同的特點和優(yōu)勢。 一、性能
    的頭像 發(fā)表于 10-27 11:15 ?861次閱讀

    2031年全球Chiplet市場預測

    發(fā)布了“2031年全球Chiplet市場、趨勢、行業(yè)競爭分析、收入和預測”的市場評估報告。市場分為: 按處理器: 現(xiàn)場可編程門陣列(FPGA)、圖形處理單元(GPU)、中央處理單元(CPU)、應(yīng)用處
    的頭像 發(fā)表于 09-12 19:09 ?314次閱讀
    2031年全球<b class='flag-5'>Chiplet</b>市場預測

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    和像素統(tǒng)一的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn);中國的高性能計算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU
    發(fā)表于 09-02 10:09

    突破與解耦:Chiplet技術(shù)讓AMD實現(xiàn)高性能計算與服務(wù)器領(lǐng)域復興

    的前沿技術(shù)時,AMD 才會越來越好。 ——AMD 董事會主席及首席執(zhí)行官 Lisa Su 博士 開端:Why Chiplet? 2017年對于AMD公司來說是一個非常關(guān)鍵的轉(zhuǎn)折點。在那
    的頭像 發(fā)表于 08-21 18:33 ?2029次閱讀
    突破與解耦:<b class='flag-5'>Chiplet</b>技術(shù)讓<b class='flag-5'>AMD</b>實現(xiàn)高性能計算與服務(wù)器領(lǐng)域復興

    CPU渲染和GPU渲染優(yōu)劣分析

    GPU的出現(xiàn),基于GPU的渲染獲得了很大的普及。這些GPU是特定用途的芯片,某些情況下提供與CPU
    的頭像 發(fā)表于 05-23 08:27 ?638次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

    AMD采用Chiplet架構(gòu),每年減排數(shù)萬噸溫室氣體

    AMD的低碳策略并非來自CPU性能優(yōu)于競爭對手,更得益于Chiplet提升芯片良率,減少浪費,降低碳排放。較小的芯片面積利于提高晶圓良率,降
    的頭像 發(fā)表于 04-25 09:48 ?350次閱讀

    AMD Chiplet芯片架構(gòu)年減排數(shù)萬噸溫室氣體

    AMD公司的企業(yè)責任總監(jiān)Justin Murrill介紹,在生產(chǎn)第四代EPYC(霄龍) CPU時,AMD采用了8個獨立的計算芯片CCD,而非整塊單
    的頭像 發(fā)表于 04-24 16:05 ?521次閱讀

    X-Silicon發(fā)布RISC-V新架構(gòu) 實現(xiàn)CPU/GPU一體化

    X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計將 CPUGPU 的功能整合到單核架構(gòu)中。這與英特爾和 AMD 的典型設(shè)計不同,前者有獨立的
    發(fā)表于 04-08 11:34 ?619次閱讀
    X-Silicon發(fā)布RISC-V新架構(gòu) 實現(xiàn)<b class='flag-5'>CPU</b>/<b class='flag-5'>GPU</b>一體化

    RISC-V芯片新突破:CPUGPU一體化核心設(shè)計

    X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計將 CPUGPU 的功能結(jié)合到單核架構(gòu)中。這與 Intel 和 AMD 的典型設(shè)計不同,后者有獨立的
    發(fā)表于 04-07 10:41 ?766次閱讀
    RISC-V<b class='flag-5'>芯片</b>新突破:<b class='flag-5'>CPU</b>與<b class='flag-5'>GPU</b>一體化核心設(shè)計

    Nvidia與AMD芯片,突破PCIe瓶頸

    AMD 和 Nvidia 的 GPU 都依賴 PCI 總線與 CPU 進行通信。CPUGPU 有兩個不同的內(nèi)存域,數(shù)據(jù)必須通過 PCI
    的頭像 發(fā)表于 03-08 14:15 ?718次閱讀
    Nvidia與<b class='flag-5'>AMD</b>新<b class='flag-5'>芯片</b>,突破PCIe瓶頸

    gpu是什么和cpu的區(qū)別

    GPUCPU是兩種常見的計算機處理器,它們結(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU的區(qū)別,并詳細介紹它們的原理、
    的頭像 發(fā)表于 02-20 11:24 ?1.9w次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項任務(wù)。這是因為GPU的架構(gòu)使得它可以同時
    的頭像 發(fā)表于 01-26 08:30 ?2489次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    什么是Chiplet技術(shù)?

    什么是Chiplet技術(shù)?Chiplet技術(shù)是一種半導體設(shè)計和制造中將大型芯片的不同功能分解并分散實現(xiàn)在多個較小和專用的芯片(Chiple
    的頭像 發(fā)表于 01-25 10:43 ?2267次閱讀
    什么是<b class='flag-5'>Chiplet</b>技術(shù)?