眾所周知,隨著最近生成式AI浪潮的席卷全球,NVIDIA無(wú)論影響力還是股價(jià)都已一息千里;
但可能令黃仁勛也想不到的是:僅僅在就在本月初,在NVIDIA推出被稱作“巨型GPU”的GH200超級(jí)芯片后,作為表外甥女的AMD總裁蘇姿豐也放出了其“終極武器”——MI300X。
6月14日凌晨一點(diǎn),AMD舉行了最新直播活動(dòng),這一次,蘇媽帶來多款重磅產(chǎn)品:
圖片來自:AMD
蘇姿豐率先公布了Instinct MI300A,她稱之為全球首個(gè)為AI和HPC(高性能計(jì)算)打造的APU加速器,擁有多達(dá)13顆小芯片,總共包含1460億個(gè)晶體管;
該加速器采用CDNA 3 GPU架構(gòu)和24個(gè)Zen 4 CPU內(nèi)核,配置128GB的HBM3內(nèi)存,相比前代MI250,MI300的性能提高八倍,效率提高五倍。
而全場(chǎng)發(fā)布會(huì)的重頭戲,則是一款全新的純GPU產(chǎn)品 ——“Instinct MI300X”;
圖片來自:AMD
據(jù)蘇姿豐介紹:Instinct MI300X內(nèi)存達(dá)到了192GB,內(nèi)存帶寬為5.2TB/s,Infinity Fabric帶寬為896GB/s,晶體管達(dá)到嘆為觀止的1530億個(gè)。
這與NVIDIAH100芯片相比,MI300X提供的HBM密度最高是前者的2.4倍,HBM帶寬最高則是1.6倍。這意味著,AMD的芯片可以運(yùn)行比NVIDIA芯片更大的模型;蘇姿豐強(qiáng)調(diào),生成式AI模型可能不再需要數(shù)目那么龐大的GPU,由此可為用戶節(jié)省成本。
當(dāng)然,我們這里所說的二者的關(guān)系問題,并不是道聽途說而來:
這兩人不僅都出生在臺(tái)南,且還有親戚關(guān)系,蘇姿豐的外公與黃仁勛的母親是兄妹;相當(dāng)于,蘇姿豐是黃仁勛的外甥女,換言之,黃仁勛是蘇姿豐的表舅
更有意思的是,黃仁勛職業(yè)生涯早期還曾在AMD工作過,他也曾提起自己很喜歡當(dāng)時(shí)的工作。
回到正題,或許你和我一樣,在本場(chǎng)發(fā)布會(huì)之前都認(rèn)為:
蘇姿豐和她的AMD技術(shù)團(tuán)隊(duì)是否可以生產(chǎn)出足夠強(qiáng)大的芯片,以打破NVIDIA對(duì)GPU市場(chǎng)幾乎壟斷的地位呢?
答案就在本次發(fā)布會(huì)蘇姿豐的驚人話語(yǔ)中:“隨著模型尺寸變得越來越大,你需要多個(gè) GPU 來運(yùn)行最新的大型語(yǔ)言模型;且,隨著 AMD 芯片上內(nèi)存增加,開發(fā)者將不需要那么多 GPU?!?/p>
圖片來自:AMD
其理由是:AMD 的 Instinct MI300 系列以及NVIDIA的 H100 / H800 系列 GPU 都在采用臺(tái)積電先進(jìn)的后端 3D 封裝方法 CoWoS,導(dǎo)致臺(tái)積電 CoWoS 產(chǎn)能短缺將持續(xù)存在;臺(tái)積電目前有能力每月處理大約 8000 片 CoWoS 晶圓,其中NVIDIA和 AMD 合計(jì)占了大約 70% 到 80%。
尤其,用于CoWoS和其他先進(jìn)封裝技術(shù)的封裝設(shè)備需要專門的生產(chǎn)工具,它們的交貨時(shí)間在3到6個(gè)月之間;這意味著臺(tái)積電迅速擴(kuò)大其CoWoS產(chǎn)能的能力是有限的。
特別值得一提的是:這張集成了1530億晶體管的怪獸芯片也是AMD Chiplet技術(shù)生態(tài)的集大成者:
AMD本次發(fā)布的MI300A被蘇姿豐稱作“面向 AI 和高性能計(jì)算的全球首款 APU 加速器”,將多個(gè) CPU、GPU 和高帶寬內(nèi)存封在一起,在 13 個(gè) Chiplets 上擁有1460 億顆晶體管。
AMD Instinct MI 300X和AMD Instinct MI 300A不同點(diǎn)在于,AMD Instinct MI 300X并沒有集成CPU內(nèi)核,而是采用了8 個(gè) GPU Chiplet(基于CDNA 3架構(gòu))和另外 4 個(gè) IO 內(nèi)存Chiplet的設(shè)計(jì),這讓其集成的晶體管數(shù)量達(dá)到了驚人的1530億。
與此同時(shí),Chiplet技術(shù)在AI芯片中具有提高芯片集成度、降低生成本、提高性能、降低性能和提高芯片可能依賴等技術(shù)作用;隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷擴(kuò)大,Chiplet技術(shù)在AI芯片中的應(yīng)用前景將會(huì)更加廣泛。
圖片來自:AMD
尤其,作為一款對(duì)標(biāo)NVIDIA H100的產(chǎn)品,AMD Instinct MI 300X的HMB密度是前者的2.4倍,帶寬則為前者的1.6倍;這讓AMD的這顆產(chǎn)品在當(dāng)前的AI時(shí)代競(jìng)爭(zhēng)力大增。
同時(shí),基于帶寬高達(dá)896GB/s的AMD Infinity架構(gòu),AMD可以將八個(gè) M1300X 加速器組合在一個(gè)系統(tǒng)中,這樣就能為開發(fā)帶來更強(qiáng)大的計(jì)算能力,為 AI 推理和訓(xùn)練提供不一樣的解決方案。
綜上所述,毋庸置疑,這是一場(chǎng)攸關(guān)未來的半導(dǎo)體競(jìng)賽;全球數(shù)據(jù)中心 GPU 和 CPU 的頭部企業(yè)NVIDIA和Intel均在強(qiáng)調(diào)其加速 AI 的實(shí)力。
但,作為這兩條賽道“萬(wàn)年老二”的 AMD,也在競(jìng)相滿足對(duì) AI 計(jì)算日益增長(zhǎng)的需求,并通過推出適應(yīng)最新需求的數(shù)據(jù)中心 GPU 來挑戰(zhàn)NVIDIA在新興市場(chǎng)的主導(dǎo)地位。
-
amd
+關(guān)注
關(guān)注
25文章
5520瀏覽量
135045 -
AI
+關(guān)注
關(guān)注
87文章
32504瀏覽量
271716 -
chiplet
+關(guān)注
關(guān)注
6文章
438瀏覽量
12688
原文標(biāo)題:在AI浪潮的推動(dòng)下,AMD再用Chiplet技術(shù)交出階段性答卷!
文章出處:【微信號(hào):奇普樂芯片技術(shù),微信公眾號(hào):奇普樂芯片技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
Banana Pi 與瑞薩電子攜手共同推動(dòng)開源創(chuàng)新:BPI-AI2N
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......
AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
解鎖Chiplet潛力:封裝技術(shù)是關(guān)鍵

AMD發(fā)布10億參數(shù)開源AI模型OLMo
浪潮信息AI存儲(chǔ)性能測(cè)試的領(lǐng)先之道

IMEC組建汽車Chiplet聯(lián)盟

AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得
AMD發(fā)布新版Instinct MI325X
突破與解耦:Chiplet技術(shù)讓AMD實(shí)現(xiàn)高性能計(jì)算與服務(wù)器領(lǐng)域復(fù)興

評(píng)論