自從2.5D/3D封裝、Chiplet、異構(gòu)集成等技術(shù)出現(xiàn)以來(lái),CPU、GPU和內(nèi)存之間的界限就已經(jīng)變得逐漸模糊。單個(gè)SoC究竟集成了哪些邏輯單元和存儲(chǔ)單元,全憑借廠商自己的設(shè)計(jì)路線。這樣的設(shè)計(jì)其實(shí)為單芯片的能效比帶來(lái)了一輪新的攀升,但也極大地增加了開(kāi)發(fā)難度。即便如此,還是有不少?gòu)S商在不遺余力地朝這個(gè)方向發(fā)展,最典型的莫過(guò)于AMD。
AMD的存儲(chǔ)堆疊之路
要說(shuō)玩堆疊存儲(chǔ),AMD確實(shí)是走得最靠前的一位,例如AMD如今在消費(fèi)級(jí)和數(shù)據(jù)中心級(jí)別CPU上逐漸使用的3D V-Cache技術(shù),就是直接將SRAM緩存堆疊至CPU上。將在今年正式落地的第四代EPYC服務(wù)器處理器,就采用了13個(gè)5nm/6nm Chiplet混用的方案,最高將L3緩存堆疊至了可怕的384MB。
在消費(fèi)端,AMD的Ryzen 7 5800X3D同樣也以驚人的姿態(tài)出世,以超大緩存帶來(lái)了極大的游戲性能提升。即將正式發(fā)售的Ryzen 9 7950X3D也打出了128MB三級(jí)緩存的夸張參數(shù),這些產(chǎn)品的出現(xiàn)可謂打破了過(guò)去CPU廠商拼時(shí)鐘頻率、拼核心數(shù)的僵局,讓消費(fèi)者真切地感受到了額外的體驗(yàn)提升。
MI300 APU / AMD
GPU也不例外,雖然AMD如今的消費(fèi)級(jí)GPU基本已經(jīng)放棄了HBM堆疊方案,但是在AMD的數(shù)據(jù)中心GPU,例如Instinct MI250X,卻依然靠著堆疊做到了128GB的HBM2e顯存,做到了3276.8GB/s的峰值內(nèi)存帶寬。而下一代MI300,AMD則選擇了轉(zhuǎn)向APU方案,將CPU、GPU和HBM全部整合在一起,以新的架構(gòu)沖擊Exascale級(jí)的AI世代。
其實(shí)這也是AMD收購(gòu)Xilinx最大的收獲之一,早在十多年前Xilinx的3DIC技術(shù)也已經(jīng)為多Die堆疊打下了基礎(chǔ)。在收購(gòu)Xilinx之際,AMD也提到這次交易會(huì)擴(kuò)張AMD在die堆疊、封裝、Chiplet和互聯(lián)技術(shù)上的開(kāi)發(fā)能力。在完成Xilinx的收購(gòu)后,也可以看出AMD在架構(gòu)上的創(chuàng)新有了很大的飛躍。
在近期的ISSCC 2023上,AMD CEO蘇姿豐透露了他們的下一步野心,那就是直接將DRAM堆疊至CPU上。這里的堆疊并非硅中介層互聯(lián)、存儲(chǔ)單元垂直堆疊在一起的2.5D封裝方案,也就是如今常見(jiàn)的HBM統(tǒng)一內(nèi)存方案,AMD提出的是直接將計(jì)算單元與存儲(chǔ)單元垂直堆疊在一起的3D混合鍵封裝方案。
CPU與DRAM垂直堆疊
主流服務(wù)器性能的提升速度,已經(jīng)快要趕上過(guò)去的摩爾定律了。根據(jù)AMD統(tǒng)計(jì)的CPU供應(yīng)商數(shù)據(jù),每過(guò)2.4年主流服務(wù)器性能就會(huì)翻一倍??上拗破淅^續(xù)發(fā)展的不再只是放緩的摩爾定律,還有內(nèi)存上帶來(lái)的限制。內(nèi)存墻這樣的性能瓶頸,不僅在限制CPU的性能發(fā)揮,同樣限制了GPU的性能發(fā)揮。
考慮到明面上解決這個(gè)問(wèn)題的主力軍是存儲(chǔ)廠商,所以提出的大部分創(chuàng)新方案,例如存內(nèi)計(jì)算等等,也都是創(chuàng)造算力更高的存儲(chǔ)器產(chǎn)品。蘇姿豐博士也指出,從她這個(gè)處理器從業(yè)者的角度來(lái)說(shuō),這一路線有些反常理,但從系統(tǒng)層面來(lái)說(shuō),她也可以理解該需求存在的意義。而AMD這次提出的方案,則是從計(jì)算芯片出發(fā),將存儲(chǔ)器堆疊整合進(jìn)去。
CPU與DRAM垂直堆疊 / AMD
從AMD給出的能量效率分析來(lái)看,DIMM這樣的片外內(nèi)存訪問(wèn)能量效率在12pj/bit左右,2.5D的HBM方案在3.5pj/bit左右,而3D垂直堆疊的鍵合方案卻可以做到0.2pj/bit,從而利用更低的功耗來(lái)做到大帶寬。況且由于計(jì)算單元和存儲(chǔ)單元的集成度更高了,傳輸?shù)难舆t必然也會(huì)有顯著的降低。
這套方案的出現(xiàn)意味著至少堆疊的內(nèi)存容量足夠大,服務(wù)器CPU甚至可以省去DIMM內(nèi)存插槽,進(jìn)一步減小空間占用。但這套方案具體能做堆疊多少內(nèi)存,AMD并沒(méi)有給出具體的數(shù)字,如果可堆疊的內(nèi)存數(shù)量與如今的L3緩存一樣僅有數(shù)百兆的話,那帶來(lái)的性能提升很可能不值一提。
另外就是散熱問(wèn)題,從AMD給出的示意圖來(lái)看,他們選擇了內(nèi)存單元在上,計(jì)算單元在下的方案,這種3D架構(gòu)很可能會(huì)對(duì)散熱產(chǎn)生一定負(fù)面作用,但性能損失會(huì)相對(duì)較少一些。比如MI300方案中,AMD就換成了CPU和GPU單元在上,緩存和互聯(lián)在下的方案。
捆綁銷售嫌疑?
在消費(fèi)級(jí)領(lǐng)域,其實(shí)CPU與內(nèi)存捆綁銷售已經(jīng)不是什么新鮮事了,就拿蘋(píng)果的M系列芯片為例。自打蘋(píng)果轉(zhuǎn)向Arm陣營(yíng),推出M系列芯片后,Mac生態(tài)的定制空間就基本只存在于購(gòu)買(mǎi)前了,雖然華強(qiáng)北的大神們依然能夠找到一些方式來(lái)擴(kuò)展固態(tài)硬盤(pán)閃存,但內(nèi)存基本就與SoC徹底綁定了,用戶只能忍受高昂的容量定價(jià),才不會(huì)在高負(fù)載工作時(shí)出現(xiàn)內(nèi)存不夠用的窘境。
可在服務(wù)器市場(chǎng),已經(jīng)有了相當(dāng)成熟的DIMM內(nèi)存生態(tài),甚至未來(lái)還有CXL內(nèi)存虎視眈眈,AMD這套“捆綁銷售”的方案究竟能否收獲良好的市場(chǎng)反響我們無(wú)從得知,很明顯這對(duì)內(nèi)存模組廠商是存在一定威脅的。但話又說(shuō)回來(lái),AMD這套方案并沒(méi)有徹底斷絕擴(kuò)展內(nèi)存的可能性,在需要超大容量的內(nèi)存池時(shí),依然可以選擇傳統(tǒng)的擴(kuò)展方案,而不是死磕堆疊內(nèi)存的方案。
AMD的方案更像是給到了一個(gè)片上高速方案,從當(dāng)下的工藝來(lái)看,應(yīng)該還難以實(shí)現(xiàn)大容量的堆疊。所以在CPU上垂直堆疊DRAM,更像是AMD的另一套負(fù)載加速方案。畢竟根據(jù)蘇姿豐博士的說(shuō)法,AMD也很清楚現(xiàn)有的3D V-Cache SRAM堆疊方案只能提高特定負(fù)載的性能,DRAM堆疊方案的性能加速覆蓋面無(wú)疑要更廣一些。
寫(xiě)在最后
其實(shí)ChatGPT這樣的應(yīng)用出現(xiàn),不僅帶動(dòng)了一波GPU訂單量的狂飆,也讓HBM、DDR5這些大帶寬的內(nèi)存有了用武之地,讓人們終于看到了打破內(nèi)存墻的應(yīng)用價(jià)值,而不只是將其視為一個(gè)徒增成本的性能瓶頸。
而AMD雖然提出了將內(nèi)存堆疊至CPU上的技術(shù)路線,也并沒(méi)有放棄對(duì)其他方案的考量,比如他們也在和三星展開(kāi)HBM2上的存算一體研究。如果AMD選擇將CPU堆疊內(nèi)存與存算一體結(jié)合在一起的話,或許會(huì)給其數(shù)據(jù)中心產(chǎn)品帶來(lái)更大的優(yōu)勢(shì)。
審核編輯 :李倩
-
amd
+關(guān)注
關(guān)注
25文章
5470瀏覽量
134211 -
DRAM
+關(guān)注
關(guān)注
40文章
2316瀏覽量
183540 -
cpu
+關(guān)注
關(guān)注
68文章
10870瀏覽量
211901
原文標(biāo)題:AMD要在CPU上堆疊DRAM內(nèi)存,新一代捆綁銷售誕生?
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論