電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)摩爾定律是由英特爾創(chuàng)始人之一戈登·摩爾提出的經(jīng)驗(yàn)規(guī)律,描述了集成電路上的晶體管數(shù)量和性能隨時(shí)間的增長趨勢。根據(jù)摩爾定律,集成電路上可容納的晶體管數(shù)目約每隔18個(gè)月便會增加一倍,性能也將提升一倍。過去很長一段時(shí)間,摩爾定律被認(rèn)為是全球半導(dǎo)體產(chǎn)業(yè)進(jìn)步的基石。如今,這一定律已經(jīng)逐漸失效,延續(xù)摩爾和超越摩爾路線紛紛出現(xiàn)。
6月2日晚間,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在臺北國際電腦展(COMPUTEX)開幕前發(fā)表主題演講。他直言,英偉達(dá)承諾將以“一年一代”的節(jié)奏推出新的AI芯片。這一速度將明顯超越摩爾定律,因?yàn)橛ミ_(dá)每一代AI芯片的發(fā)布,相較于上一代,都能夠帶來數(shù)倍的性能提升。
隨后在6月3日,AMD首席執(zhí)行官蘇姿豐在主題演講中同樣表示,AMD將于2025年推出MI350系列,再過一年會推出MI400。大約一年發(fā)布一款的速度與英偉達(dá)的計(jì)劃看齊。
一年一平臺,一年一產(chǎn)品
在演講中,黃仁勛透露了英偉達(dá)后續(xù)兩年的平臺路線,2025年英偉達(dá)AI芯片將基于Blackwell Ultra平臺,2026年是Rubin平臺,2027年則是Rubin Ultra平臺。
今年GTC大會上,英偉達(dá)發(fā)布了新一代的GPU架構(gòu)平臺Blackwell和B200芯片產(chǎn)品。從架構(gòu)來看,Blackwell架構(gòu)用于數(shù)據(jù)中心,針對當(dāng)前火爆的AI大模型優(yōu)化,訓(xùn)練、推理性能和能效均大幅提升。基于Blackwell架構(gòu),英偉達(dá)B200芯片由兩個(gè)超大型Die封裝而成,內(nèi)含超過2080億個(gè)晶體管,是前一代800億個(gè)晶體管的兩倍以上,推理速度提升30倍以上,成本和能耗降低高達(dá)25倍。
黃仁勛表示,“Blackwell計(jì)算能力的增長是驚人的。但更重要的是,每當(dāng)我們的計(jì)算能力提高時(shí),成本卻在不斷下降?;贐lackwell平臺的芯片,用于訓(xùn)練GPT-4模型(2萬億參數(shù)和8萬億Token)的能量下降了350倍?!?br />
同時(shí),黃仁勛稱,Blackwell芯片現(xiàn)已開始生產(chǎn)。不過,根據(jù)產(chǎn)業(yè)界的消息,量產(chǎn)上市的Blackwell芯片并不便宜,匯豐銀行分析師透露的數(shù)據(jù)顯示,GB200 NVL36/NVL72計(jì)算平臺的定價(jià)分別為180萬美元和300萬美元,GB200的定價(jià)為6萬至7萬美元,B100的定價(jià)為3萬至3.5萬美元。
不過,黃仁勛依舊是相同的觀點(diǎn):英偉達(dá)的芯片,買得越多就會越便宜!
按照英偉達(dá)的規(guī)劃,2025年該公司將推出Blackwell Ultra AI芯片,將繼續(xù)引領(lǐng)全球AI 芯片的發(fā)展。和Blackwell Ultra平臺一起發(fā)布的還有下一代頻譜交換機(jī)。
然后到2026年,英偉達(dá)將推出Rubin架構(gòu),2027年推出Rubin Ultra AI芯片。雖然Ultra可能只是擴(kuò)展,不過就像這個(gè)詞所代表的意思,預(yù)計(jì)英偉達(dá)將會在Ultra代上顯著增加芯片的規(guī)模和能力。
和英偉達(dá)一樣,AMD雖然加快了創(chuàng)新速度,但是創(chuàng)新質(zhì)量卻很有保障。AMD將于今年推出采用第四代高帶寬內(nèi)存(HBM)HBM3E的MI 325X芯片,內(nèi)存帶寬提高一倍,效能提升1.3倍。明年推出的MI 350X將會采用3nm工藝基于CDNA 4架構(gòu),預(yù)計(jì)同系列性能增幅將創(chuàng)造AMD歷史之最。
HBM芯片和先進(jìn)封裝成為革新要點(diǎn)
既然英偉達(dá)和AMD的AI芯片迭代已經(jīng)在速度上超越了摩爾定律,也就代表著先進(jìn)制程對于英偉達(dá)AI芯片有用,但又不是那么有用。能夠?qū)崿F(xiàn)如此巨大的性能飛躍,有兩點(diǎn)是非常重要的:HBM顯存和先進(jìn)封裝,前者突破了傳輸?shù)南拗疲笳咦屝酒?guī)模超越了制程。無論是黃仁勛和蘇姿豐的演講,還是兩家公司近來的動作都體現(xiàn)了這一點(diǎn)。
上文提到,AMD將會在MI 325X芯片中使用HBM3E。根據(jù)黃仁勛的描述,英偉達(dá)將會在Rubin架構(gòu)產(chǎn)品上首次支持8層HBM4高帶寬存儲,隨后在Rubin Ultra AI芯片上升級為12層HBM4。SK海力士總裁兼AI基礎(chǔ)設(shè)施負(fù)責(zé)人Justin Kim表示,該公司計(jì)劃和臺積電合作,采用臺積電的先進(jìn)封裝技術(shù),以打造出業(yè)界性能最佳的HBM4。
此前,作為AI芯片里HBM內(nèi)存的主要供應(yīng)商,SK海力士基本是采用專有的技術(shù)。據(jù)悉,SK海力士已使用專有技術(shù)制造高達(dá)HBM3E的基礎(chǔ)芯片。從技術(shù)細(xì)節(jié)來看,以硅通孔技術(shù)(TSV:Through Silicon Via)、批量回流模制底部填充(MR-MUF:Mass Reflow-Molded Underfill)先進(jìn)封裝工藝作為核心技術(shù),通過MR-MUF技術(shù),SK海力士能打造出性能穩(wěn)定且層數(shù)領(lǐng)先的HBM內(nèi)存。
如果SK海力士也采用臺積電的先進(jìn)封裝,那么將有助于英偉達(dá)和AMD的AI芯片更好地融合HBM4內(nèi)存。根據(jù)臺灣媒體此前的報(bào)道,英偉達(dá)、AMD 兩家公司包下臺積電今明兩年CoWoS與SoIC先進(jìn)封裝產(chǎn)能。英偉達(dá)目前的主力產(chǎn)品H100芯片主要采用臺積電4納米制程和CoWoS先進(jìn)封裝,與SK海力士的高帶寬內(nèi)存(HBM)以2.5D封裝形式提供給客戶。目前,英偉達(dá)芯片主要采用的CoWoS技術(shù)具備提供更高的存儲容量和帶寬的優(yōu)勢,是目前高端先進(jìn)封裝的主流方案。
將InfiniBand的性能帶到以太網(wǎng)架構(gòu)中
除了平臺和芯片的劇透以外,此次英偉達(dá)黃仁勛演講還有一則值得關(guān)注的消息,那就是InfiniBand和以太網(wǎng)的融合。從生態(tài)來說,CUDA、NVLink和InfiniBand等多項(xiàng)私有方案的存在,也是英偉達(dá)和AMD等其他公司最明顯的不同,如今看來InfiniBand將率先擁抱開放。
英偉達(dá)的InfiniBand是一種高速網(wǎng)絡(luò)和輸入/輸出(I/O)技術(shù),旨在連接數(shù)據(jù)中心和高性能計(jì)算(HPC)環(huán)境中的服務(wù)器、存儲系統(tǒng)和其他計(jì)算設(shè)備,具有低延遲、高帶寬、可擴(kuò)展和高可靠等優(yōu)勢。以太網(wǎng)則是一種廣泛用于局域網(wǎng)(LAN)的技術(shù),基于IEEE 802.3以太網(wǎng)網(wǎng)絡(luò)標(biāo)準(zhǔn),具有簡單性、靈活性和可擴(kuò)展性。
可以說InfiniBand是英偉達(dá)專門為機(jī)器間信息傳輸打造的私有協(xié)議,屬于三類RDMA網(wǎng)絡(luò)其中之一,另外兩個(gè)是RoCE、iWARP。目前,英偉達(dá)已經(jīng)在先進(jìn)的芯片、超級計(jì)算架構(gòu)和復(fù)雜的交換機(jī)方面形成產(chǎn)品體系,因此InfiniBand具有很高的價(jià)值。英偉達(dá)的InfiniBand技術(shù)來自邁絡(luò)思(Mellanox ),后者于2020年4月被英偉達(dá)收購。目前,英偉達(dá)提供全面的InfiniBand系統(tǒng),包括InfiniBand交換機(jī)、InfiniBand網(wǎng)卡、InfiniBand以太網(wǎng)網(wǎng)關(guān)、InfiniBand線纜和光模塊、InfiniBand遙測和軟件管理以及InfiniBand加速軟件。目前,QUANTUM QM8700交換機(jī)單通道速度可達(dá)200Gb/s,整機(jī)的傳輸速度可達(dá)16Tb/s。
雖然InfiniBand技術(shù)性能強(qiáng)大,但是其兼容性并不好,以英偉達(dá)AI設(shè)備為主體的計(jì)算平臺很難融入其他的設(shè)備,這讓高性能計(jì)算的用戶很困擾,他們希望英偉達(dá)能夠支持更通用的協(xié)議——以太網(wǎng)。
目前,以太網(wǎng)技術(shù)已經(jīng)支持RDMA,但是只限于RoCE和iWARP。就像黃仁勛所言,InfiniBand想要和以太網(wǎng)融合并不容易。在協(xié)議棧方面,InfiniBand 擁有自己定義的1-4層格式(物理層、鏈路層、傳輸層和網(wǎng)絡(luò)層),是一個(gè)完整的網(wǎng)絡(luò)協(xié)議,這些核心底層和以太網(wǎng)存在很大的差異,兩者的融合確實(shí)不易。
不過,受迫于客戶方的壓力,英偉達(dá)也在努力推進(jìn)支持InfiniBand的以太網(wǎng)技術(shù)的發(fā)展,比如 Spectrum X。英偉達(dá)Spectrum以太網(wǎng)是一個(gè)端到端平臺,包括交換機(jī)、DPU、SmartNIC、線纜、收發(fā)器和網(wǎng)絡(luò)軟件。目前,英偉達(dá)以太網(wǎng)交換機(jī)系列包括涵蓋1GbE至800GbE的全面交換機(jī)和軟件產(chǎn)品組合。英偉達(dá)首席財(cái)務(wù)官Collette Kress此前表示,“Spectrum-X的銷量正在不斷增長,客戶包括多個(gè)客戶,其中包括一個(gè)擁有100,000個(gè)GPU的大型集群,Spectrum-X為英偉達(dá)網(wǎng)絡(luò)開辟了一個(gè)全新的市場,并使以太網(wǎng)數(shù)據(jù)中心能夠容納大規(guī)模 AI。我們預(yù)計(jì)Spectrum-X將在一年內(nèi)躍升至數(shù)十億美元的產(chǎn)品線。”
對于InfiniBand和以太網(wǎng)的融合,黃仁勛介紹稱,英偉達(dá)的策略是將InfiniBand的性能帶到以太網(wǎng)架構(gòu)中,“我們關(guān)注的焦點(diǎn)并非平均吞吐量,而是確保最后一個(gè)數(shù)據(jù)包能夠準(zhǔn)時(shí)、無誤地抵達(dá)。然而,傳統(tǒng)的以太網(wǎng)并未針對這種高度同步化、低延遲的需求進(jìn)行優(yōu)化。為了滿足這一需求,我們創(chuàng)造性地設(shè)計(jì)了一個(gè)端到端的架構(gòu),使NIC(網(wǎng)絡(luò)接口卡)和交換機(jī)能夠通信?!?br />
結(jié)語
過去很多年,摩爾定律都是芯片性能提升的主要手段,最新的工藝也會和頂級的芯片產(chǎn)品掛鉤。然而,隨著摩爾定律逐漸放緩和失效,目前英偉達(dá)和AMD等頭部廠商已經(jīng)摸索出一條自己的更新路徑,這條路徑里工藝制程只是助力之一,更多源于HBM技術(shù)和異構(gòu)集成的系統(tǒng)級創(chuàng)新。
-
amd
+關(guān)注
關(guān)注
25文章
5468瀏覽量
134147 -
摩爾定律
+關(guān)注
關(guān)注
4文章
634瀏覽量
79026 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91079 -
HBM
+關(guān)注
關(guān)注
0文章
380瀏覽量
14755 -
先進(jìn)封裝
+關(guān)注
關(guān)注
2文章
404瀏覽量
246
發(fā)布評論請先 登錄
相關(guān)推薦
評論