AMD祭出殺手锏,首個(gè)百億億級(jí)GPU
在不久前結(jié)束的 “加速數(shù)據(jù)中心”發(fā)布會(huì)上,AMD正式公開了下一代服務(wù)器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產(chǎn)品系列不僅面向數(shù)據(jù)中心,也將面向一系列HPC和超算應(yīng)用,把通用計(jì)算和AI性能推向極致。Instinct MI200作為GPU加速卡,更是成為超級(jí)計(jì)算機(jī)百億億級(jí)(Exascale)的算力的基本構(gòu)成單元。
在市場(chǎng)合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯(lián)合發(fā)布了星星海服務(wù)器產(chǎn)品后,如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務(wù)器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣布將在其數(shù)據(jù)中心部署AMD的服務(wù)器產(chǎn)品。
Milan-X:6nm的大緩存怪獸
繼上一代Milan處理器推出后不到一年,AMD就發(fā)布了該芯片的6nm改進(jìn)版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術(shù),在Ryzen桌面處理器上做了3D Chiplet架構(gòu)的演示。如今第三代Epyc處理器Milan-X,將成為首個(gè)使用該技術(shù)的服務(wù)器產(chǎn)品。通過在Chiplet上堆疊緩存,Milan-X的L3緩存是Milan的三倍,達(dá)到了可怕的768MB。
MilanX / AMD
與英特爾一樣,AMD在正式發(fā)售前并沒有公布Milan-X的具體性能細(xì)節(jié),而是通過合作伙伴的測(cè)試來展示了Milan-X在EDA和公有云應(yīng)用中表現(xiàn)。在新思的VCS功能驗(yàn)證中,Milan-X在1小時(shí)內(nèi)完成了40.6項(xiàng)任務(wù),而同樣核心數(shù)的Milan僅完成了24.4項(xiàng)。微軟在基于Milan-X的Azure服務(wù)器中進(jìn)行了早期測(cè)試,無論是在航天模擬,還是在汽車碰撞測(cè)試建模中,Milan-X都做到了50%以上的性能提升。
除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報(bào)?;赯en 4架構(gòu)的Genoa將具備2倍的晶體管密度和2倍的能效,性能可以達(dá)到上一代的1.25倍以上。Genoa最高支持96個(gè)Zen 4核心,同時(shí)也將加入一系列新標(biāo)準(zhǔn)的支持,比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo,專門針對(duì)要求多核多線程的云原生計(jì)算,最高核心數(shù)將達(dá)到128核,晚于Genoa發(fā)布。
Genoa計(jì)劃在2022年量產(chǎn)和發(fā)布,屆時(shí)很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計(jì)算領(lǐng)域爭(zhēng)雄了。
Instinct MI200:GPU終于迎來MCM時(shí)代了?
除了Milan-X之外,發(fā)布會(huì)的最大亮點(diǎn)其實(shí)是全球首個(gè)MCM GPU,Instinct MI200。同樣基于臺(tái)積電的6nm工藝,Instinct MI200系列單芯片的晶體管數(shù)目達(dá)到580億,最高集成了220個(gè)計(jì)算單元。作為首個(gè)采用AMD CDNA2架構(gòu)的服務(wù)器GPU,Instinct MI200的目標(biāo)很明確,那就是將計(jì)算能力推向ExaScale級(jí)。
在CDN2架構(gòu)和第二代HPC&AI專用矩陣核心的支持下,Instinct MI200實(shí)現(xiàn)了遠(yuǎn)超競(jìng)品的性能表現(xiàn)。數(shù)據(jù)對(duì)比環(huán)節(jié),AMD選擇拿Nvidia目前最強(qiáng)的A100加速卡開刀。MI250X的FP64向量計(jì)算能力達(dá)到47.9TF,F(xiàn)P64矩陣計(jì)算能力達(dá)到95.7TF,均為A100的4.9倍。而在AI領(lǐng)域常用的FP16和BF16矩陣計(jì)算中,MI250X的算力也達(dá)到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的內(nèi)存帶寬也達(dá)到了3.2TB/s,遠(yuǎn)超A100的2TB/s。不過MI250X的功耗確實(shí)要高出不少,峰值狀態(tài)下的功耗可以達(dá)到560W,而A100的峰值功耗為300W。
與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺(tái)積電合作帶來的技術(shù)紅利,尤其是臺(tái)積電的3D Fabric封裝技術(shù)集合,而Instinct MI200則是這些技術(shù)的集大成之作。作為首個(gè)采用多Die設(shè)計(jì)的GPU,Instinct MI200選用了兩個(gè)SoC+8個(gè)HBM2E的方案,AMD在發(fā)布會(huì)上宣稱這一設(shè)計(jì)的實(shí)現(xiàn)要?dú)w功于2.5D的Elevated Fanout Bridge(EFB)架構(gòu)。
從圖解上來看,AMD的EFB與臺(tái)積電的InFO-L 2.5D封裝技術(shù)可以說是從一個(gè)模子里刻出來的。在專門用于HBM集成的方案,目前可以做到這種規(guī)模的異構(gòu)似乎也只有臺(tái)積電的InFO-L和CoWoS-L,利用LSI(本地硅互聯(lián))芯片,為SoC到SoC與SoC到HBM提供高布線密度的互聯(lián)。
其實(shí)英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內(nèi)放入一個(gè)硅橋die。而反觀AMD的EFB和臺(tái)積電的LSI方案則是將其至于基板的模具中,模具內(nèi)分布著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對(duì)于基板的加工提出了很高的要求,這也是為何只有英特爾這個(gè)基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的制程、IP和封裝技術(shù),未來也許會(huì)有其他廠商的芯片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰(zhàn),但為了使用標(biāo)準(zhǔn)的基板降低成本,EFB和LSI明顯是最優(yōu)解。
在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計(jì)算項(xiàng)目(OCP)定下的通用加速器模組標(biāo)準(zhǔn),對(duì)于想要規(guī)?;渴餑PU或其他加速器來說,OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標(biāo)準(zhǔn),OAM已經(jīng)在服務(wù)器領(lǐng)域有了不小的規(guī)模,不僅是英特爾、AMD和英偉達(dá)這些半導(dǎo)體廠商,浪潮、聯(lián)想、百度和阿里巴巴等其他服務(wù)器與公有云廠商也開始支持這一標(biāo)準(zhǔn)。
目前OAM的MI250和MI250X已經(jīng)進(jìn)入可交付階段,從今年第三季度起,AMD就已經(jīng)在為美國能源部的橡樹嶺國家實(shí)驗(yàn)室持續(xù)交付MI250X GPU了,用于組成美國首個(gè)ExaScale級(jí)別的超級(jí)計(jì)算機(jī)Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用于非密集運(yùn)算的場(chǎng)景。
結(jié)語
隨著英特爾、三星和臺(tái)積電在2.5D/3D封裝技術(shù)上的逐漸成熟,服務(wù)器芯片將成為受益最大的產(chǎn)品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達(dá)、AMD與英特爾三家在服務(wù)器/數(shù)據(jù)中心市場(chǎng)上的動(dòng)向,也側(cè)面體現(xiàn)了IDM與Fabless廠商之間在技術(shù)選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺(tái)積電這樣的晶圓代工廠,在服務(wù)器市場(chǎng)的優(yōu)勢(shì)可能會(huì)越來越小。
在不久前結(jié)束的 “加速數(shù)據(jù)中心”發(fā)布會(huì)上,AMD正式公開了下一代服務(wù)器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產(chǎn)品系列不僅面向數(shù)據(jù)中心,也將面向一系列HPC和超算應(yīng)用,把通用計(jì)算和AI性能推向極致。Instinct MI200作為GPU加速卡,更是成為超級(jí)計(jì)算機(jī)百億億級(jí)(Exascale)的算力的基本構(gòu)成單元。
在市場(chǎng)合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯(lián)合發(fā)布了星星海服務(wù)器產(chǎn)品后,如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務(wù)器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣布將在其數(shù)據(jù)中心部署AMD的服務(wù)器產(chǎn)品。
Milan-X:6nm的大緩存怪獸
繼上一代Milan處理器推出后不到一年,AMD就發(fā)布了該芯片的6nm改進(jìn)版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術(shù),在Ryzen桌面處理器上做了3D Chiplet架構(gòu)的演示。如今第三代Epyc處理器Milan-X,將成為首個(gè)使用該技術(shù)的服務(wù)器產(chǎn)品。通過在Chiplet上堆疊緩存,Milan-X的L3緩存是Milan的三倍,達(dá)到了可怕的768MB。
MilanX / AMD
與英特爾一樣,AMD在正式發(fā)售前并沒有公布Milan-X的具體性能細(xì)節(jié),而是通過合作伙伴的測(cè)試來展示了Milan-X在EDA和公有云應(yīng)用中表現(xiàn)。在新思的VCS功能驗(yàn)證中,Milan-X在1小時(shí)內(nèi)完成了40.6項(xiàng)任務(wù),而同樣核心數(shù)的Milan僅完成了24.4項(xiàng)。微軟在基于Milan-X的Azure服務(wù)器中進(jìn)行了早期測(cè)試,無論是在航天模擬,還是在汽車碰撞測(cè)試建模中,Milan-X都做到了50%以上的性能提升。
除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報(bào)?;赯en 4架構(gòu)的Genoa將具備2倍的晶體管密度和2倍的能效,性能可以達(dá)到上一代的1.25倍以上。Genoa最高支持96個(gè)Zen 4核心,同時(shí)也將加入一系列新標(biāo)準(zhǔn)的支持,比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo,專門針對(duì)要求多核多線程的云原生計(jì)算,最高核心數(shù)將達(dá)到128核,晚于Genoa發(fā)布。
Genoa計(jì)劃在2022年量產(chǎn)和發(fā)布,屆時(shí)很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計(jì)算領(lǐng)域爭(zhēng)雄了。
Instinct MI200:GPU終于迎來MCM時(shí)代了?
除了Milan-X之外,發(fā)布會(huì)的最大亮點(diǎn)其實(shí)是全球首個(gè)MCM GPU,Instinct MI200。同樣基于臺(tái)積電的6nm工藝,Instinct MI200系列單芯片的晶體管數(shù)目達(dá)到580億,最高集成了220個(gè)計(jì)算單元。作為首個(gè)采用AMD CDNA2架構(gòu)的服務(wù)器GPU,Instinct MI200的目標(biāo)很明確,那就是將計(jì)算能力推向ExaScale級(jí)。
在CDN2架構(gòu)和第二代HPC&AI專用矩陣核心的支持下,Instinct MI200實(shí)現(xiàn)了遠(yuǎn)超競(jìng)品的性能表現(xiàn)。數(shù)據(jù)對(duì)比環(huán)節(jié),AMD選擇拿Nvidia目前最強(qiáng)的A100加速卡開刀。MI250X的FP64向量計(jì)算能力達(dá)到47.9TF,F(xiàn)P64矩陣計(jì)算能力達(dá)到95.7TF,均為A100的4.9倍。而在AI領(lǐng)域常用的FP16和BF16矩陣計(jì)算中,MI250X的算力也達(dá)到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的內(nèi)存帶寬也達(dá)到了3.2TB/s,遠(yuǎn)超A100的2TB/s。不過MI250X的功耗確實(shí)要高出不少,峰值狀態(tài)下的功耗可以達(dá)到560W,而A100的峰值功耗為300W。
與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺(tái)積電合作帶來的技術(shù)紅利,尤其是臺(tái)積電的3D Fabric封裝技術(shù)集合,而Instinct MI200則是這些技術(shù)的集大成之作。作為首個(gè)采用多Die設(shè)計(jì)的GPU,Instinct MI200選用了兩個(gè)SoC+8個(gè)HBM2E的方案,AMD在發(fā)布會(huì)上宣稱這一設(shè)計(jì)的實(shí)現(xiàn)要?dú)w功于2.5D的Elevated Fanout Bridge(EFB)架構(gòu)。
從圖解上來看,AMD的EFB與臺(tái)積電的InFO-L 2.5D封裝技術(shù)可以說是從一個(gè)模子里刻出來的。在專門用于HBM集成的方案,目前可以做到這種規(guī)模的異構(gòu)似乎也只有臺(tái)積電的InFO-L和CoWoS-L,利用LSI(本地硅互聯(lián))芯片,為SoC到SoC與SoC到HBM提供高布線密度的互聯(lián)。
其實(shí)英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內(nèi)放入一個(gè)硅橋die。而反觀AMD的EFB和臺(tái)積電的LSI方案則是將其至于基板的模具中,模具內(nèi)分布著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對(duì)于基板的加工提出了很高的要求,這也是為何只有英特爾這個(gè)基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的制程、IP和封裝技術(shù),未來也許會(huì)有其他廠商的芯片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰(zhàn),但為了使用標(biāo)準(zhǔn)的基板降低成本,EFB和LSI明顯是最優(yōu)解。
在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計(jì)算項(xiàng)目(OCP)定下的通用加速器模組標(biāo)準(zhǔn),對(duì)于想要規(guī)?;渴餑PU或其他加速器來說,OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標(biāo)準(zhǔn),OAM已經(jīng)在服務(wù)器領(lǐng)域有了不小的規(guī)模,不僅是英特爾、AMD和英偉達(dá)這些半導(dǎo)體廠商,浪潮、聯(lián)想、百度和阿里巴巴等其他服務(wù)器與公有云廠商也開始支持這一標(biāo)準(zhǔn)。
目前OAM的MI250和MI250X已經(jīng)進(jìn)入可交付階段,從今年第三季度起,AMD就已經(jīng)在為美國能源部的橡樹嶺國家實(shí)驗(yàn)室持續(xù)交付MI250X GPU了,用于組成美國首個(gè)ExaScale級(jí)別的超級(jí)計(jì)算機(jī)Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用于非密集運(yùn)算的場(chǎng)景。
結(jié)語
隨著英特爾、三星和臺(tái)積電在2.5D/3D封裝技術(shù)上的逐漸成熟,服務(wù)器芯片將成為受益最大的產(chǎn)品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達(dá)、AMD與英特爾三家在服務(wù)器/數(shù)據(jù)中心市場(chǎng)上的動(dòng)向,也側(cè)面體現(xiàn)了IDM與Fabless廠商之間在技術(shù)選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺(tái)積電這樣的晶圓代工廠,在服務(wù)器市場(chǎng)的優(yōu)勢(shì)可能會(huì)越來越小。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
amd
+關(guān)注
關(guān)注
25文章
5470瀏覽量
134239 -
cpu
+關(guān)注
關(guān)注
68文章
10873瀏覽量
212023 -
gpu
+關(guān)注
關(guān)注
28文章
4743瀏覽量
128997
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
《CST Studio Suite 2024 GPU加速計(jì)算指南》
的各個(gè)方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計(jì)算的啟用、NVIDIA和AMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。
1. 硬件支持
- NVIDIA GPU
發(fā)表于 12-16 14:25
基站和雷達(dá)知識(shí)介紹
前文說到5G-A相比5G初期版本最大的殺手锏是新增的通感一體(ISAC,integrated sensing and communication)能力。
之所以被稱為殺手锏,是因?yàn)橥ǜ幸惑w第一次在通信基站上,實(shí)現(xiàn)了非通信的能力——感知,通感一體的感字即來源于此。
AMD發(fā)布10億參數(shù)開源AI模型OLMo
AMD公司近日宣布了一項(xiàng)重大進(jìn)展,推出了首個(gè)完全開放的10億參數(shù)語言模型系列——AMD OLMo。這一舉措為開發(fā)者和研究人員提供了強(qiáng)大的AI研究工具,有助于推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展。
軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU
達(dá)Ampere GPU。通過新增的4000顆Hopper GPU,該平臺(tái)的總計(jì)算性能已躍升至每秒約4.7百億億次。
AMD與NVIDIA GPU優(yōu)缺點(diǎn)
在圖形處理單元(GPU)市場(chǎng),AMD和NVIDIA是兩大主要的競(jìng)爭(zhēng)者,它們各自推出的產(chǎn)品在性能、功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢(shì)。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。在高端市場(chǎng)
三星首度引入AMD MI300X,緩解AI GPU短缺
三星電子近日斥資約270億韓元(約合1.42億元人民幣),購買了AMD Instinct MI300X加速器。這一舉措標(biāo)志著三星電子首次引入非英偉達(dá)品牌的AI GPU,以應(yīng)對(duì)企業(yè)內(nèi)部算
英國公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運(yùn)行
7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無縫遷移與運(yùn)行,標(biāo)志著在GPU計(jì)算領(lǐng)域,NVIDI
AMD雄心勃勃:計(jì)劃構(gòu)建百萬級(jí)GPU超級(jí)計(jì)算機(jī)集群
在全球科技競(jìng)賽的舞臺(tái)上,AMD近日宣布了一項(xiàng)令人矚目的計(jì)劃——打造一個(gè)包含多達(dá)120萬顆GPU的超級(jí)計(jì)算機(jī)集群。這一宏大的舉措立即引發(fā)了業(yè)界的廣泛關(guān)注,許多人認(rèn)為,這是AMD為了與英偉達(dá)等競(jìng)爭(zhēng)對(duì)手一較高下而邁出的重要一步。
AMD發(fā)布ROCm更新,新增RX 8000系列GPU的Navi 44命名
首款Navi 48芯片以Gfx1201之名現(xiàn)身,而Navi 44則以Gfx1200之名亮相。這兩款GPU的出現(xiàn),至少暗示了AMD正在逐步完善RDNA 4 GPU的研發(fā)工作。
英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總
主導(dǎo)地位,其銷售額預(yù)計(jì)將達(dá)到400億美元,遠(yuǎn)超過競(jìng)爭(zhēng)對(duì)手AMD和英特爾。那么這三家公司都有哪些GPU產(chǎn)品,各自的產(chǎn)品有何優(yōu)勢(shì)呢? ? 英偉達(dá)????????????????????????????????????????????
AMD市值首次突破3000億美元
AMD的市值首次突破了3000億美元,這一里程碑式的成就得益于該公司股價(jià)的大幅上漲。上周四,AMD的股價(jià)上漲了9.1%,使得其市值首次突破了3000億美元。相較于去年10月的低點(diǎn),
AMD收盤市值站上3100億美元
AMD收盤市值站上3100億美元 受益人工智能的熱炒,相關(guān)的科技股股價(jià)大幅上漲,周四晚間美股AMD股價(jià)大幅上漲9%,AMD收盤時(shí)市值站上3100億
AMD將推新GPU,效能媲美英偉達(dá)RTX 4080
據(jù)悉,AMD正努力研制新品級(jí)GPU,性能堪比英偉達(dá)的RTX 4080,而售價(jià)卻只有后者的一半。據(jù)多個(gè)在線社區(qū)反映,AMD即將發(fā)布的Radeon RX 8000系列GPU效能與NVIDI
深入解讀AMD最新GPU架構(gòu)
GCN 取代了 Terascale,并強(qiáng)調(diào) GPGPU 和圖形應(yīng)用程序的一致性能。然后,AMD 將其 GPU 架構(gòu)開發(fā)分為單獨(dú)的 CDNA 和 RDNA 線路,分別專門用于計(jì)算和圖形。
發(fā)表于 01-08 10:12
?1238次閱讀
AMD的GPU架構(gòu)GCN現(xiàn)代化解讀
隨著HD 5000和6000系列的發(fā)展,AMD的Terascale(萬億級(jí))架構(gòu)變得非常具有競(jìng)爭(zhēng)力。
評(píng)論