換掉幾個(gè)硅部件,瞧,你有一個(gè)全新的芯片,不需要太多的設(shè)計(jì)工作。
這就是 AMD 的首席執(zhí)行官 Lisa Su 描述公司制造其新的 MI300X GPU 和代號(hào)為 Bergamo 的 128 核 Epyc CPU 的方式,該 CPU 的目標(biāo)是密集的服務(wù)器環(huán)境。
Su 出人意料地深入探討了如何使用該公司多年來一直使用的小芯片來構(gòu)建這些芯片。所有芯片均使用提供小芯片和封裝技術(shù)的臺(tái)積電制造。
這也是 AMD 吹噓自己領(lǐng)先于英特爾的一種方式,后者正在大肆宣傳在 PC 和服務(wù)器芯片中實(shí)施小芯片的更廣泛戰(zhàn)略。Intel 的 Ponte Vecchio GPU 基于 chiplet 方法,在 Intel 中使用 47 個(gè)“tile”。
針對(duì) AI 應(yīng)用程序的純 GPU MI300X 是通過從其具有 GPU 和 CPU 的 MI300A 超級(jí)計(jì)算芯片中配置 CPU 小芯片并用 GPU 小芯片替換它們而制成的。
MI300X 直接定位為 Nvidia 的 H100 GPU 的競(jìng)爭(zhēng)對(duì)手。MI300A 將用于即將推出的 El Capitan 超級(jí)計(jì)算機(jī),預(yù)計(jì)其性能將超過 2 exaflops。
“我們?cè)谖覀兊?a target="_blank">產(chǎn)品中使用小芯片引領(lǐng)了行業(yè),我們?cè)谶@個(gè)產(chǎn)品中使用小芯片實(shí)際上非常非常具有戰(zhàn)略意義。我們創(chuàng)造了一系列產(chǎn)品,”Su 說。
AMD 采用了 MI300A 超級(jí)計(jì)算芯片,移除了三個(gè) Zen 4 CPU 芯片,并保留了 GPU 芯片。然后 MI300X 在公司在 Mi300A 繼承的芯片之上再插入兩個(gè) CDNA 3 GPU 芯片后誕生。
MI300X 擁有 1530 億個(gè)晶體管,12 個(gè) 5 納米和 6 納米小芯片,包括新增的兩個(gè) GPU 小芯片。MI300A 超級(jí)計(jì)算芯片有 13 個(gè)小芯片,三個(gè) Zen 4 CPU 內(nèi)核。AMD 在 MI300X 中堆疊了更多的 HBM3 內(nèi)存,使其總?cè)萘窟_(dá)到 192GB。
“為了 MI300X 解決大型語言模型的更大內(nèi)存需求,我們實(shí)際上增加了額外的 64 GB HBM3 內(nèi)存,”Su 說。
AMD 還推出了 Bergamo 芯片,該芯片擁有 128 個(gè)內(nèi)核,更像是亞馬遜和 Ampere Computing 開發(fā)的基于 Arm 的低功耗芯片的 x86 版本。這是該公司的第一款專為通過云為網(wǎng)絡(luò)應(yīng)用程序提供服務(wù)的應(yīng)用程序而設(shè)計(jì)的芯片。
AMD 移除了 Genoa 芯片(基于 Zen 4 架構(gòu))并換入了 Bergamo 芯片。Bergamo 芯片基于 Zen 4c 內(nèi)核,這是 Zen 4 架構(gòu)的功率優(yōu)化版本。
Bergamo 擁有 820 億個(gè)晶體管,每個(gè)插槽支持 128 個(gè)內(nèi)核。它有八個(gè)計(jì)算芯片和 16 個(gè) Zen 4c 內(nèi)核,這是 Zen 4 的變體,針對(duì)功率和性能進(jìn)行了優(yōu)化
真正的工作是設(shè)計(jì) Zen 4c 內(nèi)核,以確保它與 Genoa 芯片的插槽兼容。
芯片設(shè)計(jì)從與Zen 4相同的RTL設(shè)計(jì)開始,帶來了插座和軟件的兼容性。然后,該公司針對(duì)功率和面積優(yōu)化了 Zen 4c 的物理實(shí)現(xiàn),并重新設(shè)計(jì)了 L3 緩存層次結(jié)構(gòu)以獲得更大的吞吐量。
“如果將所有這些放在一起,結(jié)果是設(shè)計(jì)面積縮小 35%,每瓦性能顯著提高,”Su 說。
Meta 將在其數(shù)據(jù)中心部署 Bergamo,為 WhatsApp、Instagram 和 Facebook 等網(wǎng)絡(luò)應(yīng)用程序提供服務(wù)。這家社交媒體公司正在重新設(shè)計(jì)其數(shù)據(jù)中心以服務(wù)于人工智能和網(wǎng)絡(luò)應(yīng)用程序,并且似乎在貝加莫的設(shè)計(jì)中擁有很大的發(fā)言權(quán)。
Meta 與 AMD 合作,針對(duì)他們的工作負(fù)載優(yōu)化 Bergamo,包括“密集計(jì)算小芯片、核心與緩存比率、電源管理和制造優(yōu)化,幫助我們將大量此類服務(wù)器裝入機(jī)架,”副總裁 Alexis Black Bjorlin 說Meta 的基礎(chǔ)設(shè)施。
Black Bjorlin 說:“憑借 Bergamo 小芯片策略的靈活性,我們也很高興擁有一個(gè) IO 密集型服務(wù)器選項(xiàng),我們可以將其用于 HDD 和閃存存儲(chǔ)平臺(tái)?!?/p>
頂級(jí) Bergamo 芯片稱為 Epyc 9754,擁有 128 個(gè)內(nèi)核,運(yùn)行 256 個(gè)線程,功率高達(dá) 360W。該芯片擁有 256MB 的三級(jí)緩存,運(yùn)行頻率高達(dá) 3.10GHz。中端 9754S 每個(gè)代碼僅運(yùn)行一個(gè)線程。該系列中的第三款芯片 Epyc 9734 擁有 112 個(gè)內(nèi)核,每個(gè)內(nèi)核運(yùn)行兩個(gè)線程,功耗為 320 瓦。
Bergamo 將面臨來自英特爾名為 Sierra Forest 的高密度服務(wù)器芯片的競(jìng)爭(zhēng),該芯片將于明年上市。Sierra Forest 擁有英特爾的 e-cores,也稱為效率核心。
-
芯片
+關(guān)注
關(guān)注
456文章
51010瀏覽量
425278 -
gpu
+關(guān)注
關(guān)注
28文章
4760瀏覽量
129128 -
chiplet
+關(guān)注
關(guān)注
6文章
434瀏覽量
12609
原文標(biāo)題:關(guān)于Chiplet,Lisa Su罕見分享
文章出處:【微信號(hào):TenOne_TSMC,微信公眾號(hào):芯片半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論