隨著以大模型為代表的AIGC迅速崛起,數(shù)據(jù)到算力需求的持續(xù)暴漲,為數(shù)據(jù)中心帶來了巨大的考驗(yàn)。為填補(bǔ)算力鴻溝,下一代數(shù)據(jù)中心必須要具備更高的算力密度、更大的網(wǎng)絡(luò)規(guī)模,并能夠靈活地部署和更新海量新應(yīng)用。
在這一輪新的技術(shù)方向中,異構(gòu)計(jì)算架構(gòu)和Chiplet技術(shù)因能有效提升復(fù)雜場景計(jì)算效率,算力密度和網(wǎng)絡(luò)規(guī)模,被普遍視為通往數(shù)據(jù)中心未來的能效之路。
AIGC或?qū)⑺洪_數(shù)據(jù)中心算力缺口
在AI大模型飛速發(fā)展之下,單個(gè)大語言訓(xùn)練驅(qū)動(dòng)AI訓(xùn)練服務(wù)器需求約2億美元,AI推理服務(wù)器方面,如ChatGPT在初期便可帶動(dòng)推理服務(wù)器需求約45億美元。
據(jù)中國信通院,2021年國內(nèi)IDC市場規(guī)模1500.2億元,同比增長28.5%。據(jù)信通院預(yù)計(jì),隨著我國各地區(qū)、各行業(yè)數(shù)字化轉(zhuǎn)型深入推進(jìn)、AI訓(xùn)練需求持續(xù)增長、智能終端實(shí)時(shí)計(jì)算需求增長,2022年國內(nèi)市場規(guī)模將達(dá)1900.7億元,同增26.7%。
算力作為大模型的核心引擎,計(jì)算方式簡單粗暴,即實(shí)際擁有多少的GPU芯片,將直接決定其算力的大小。以ChatGPT為例,其模型計(jì)算主要基于微軟的Azure云服務(wù)進(jìn)行,本質(zhì)上是借助微軟自有的IDC資源,在云端完成計(jì)算過程后,再將結(jié)果返回給OpenAI。
AIGC所需的算力不是固定的,而是逐次遞增的。數(shù)據(jù)中心是承接AI計(jì)算需求的直接形式,其算力需求為AIGC的能力所驅(qū)動(dòng),也就是AIGC越聰明,其背后所需要的算力就越多,而供需雙方存在的現(xiàn)實(shí)差距,則讓數(shù)據(jù)中心的算力缺口變得愈加嚴(yán)重。
互聯(lián)網(wǎng)廠商布局ChatGPT同類產(chǎn)品,或?qū)⒓哟蠛诵某鞘蠭DC算力供給缺口。艾瑞咨詢數(shù)據(jù)顯示,2021年國內(nèi)IDC行業(yè)下游客戶占比中,互聯(lián)網(wǎng)廠商居首位,占比為60%,國內(nèi)核心城市IDC算力供給缺口或?qū)⒓哟蟆?/p>
AIGC時(shí)代,智能算力崛起
隨著人工智能進(jìn)入新的發(fā)展周期,以及大模型的興起,傳統(tǒng)的芯片需求結(jié)構(gòu)發(fā)生了變化。盡管總體算力仍在增長,但通用計(jì)算力由CPU主導(dǎo)的比例正在下降,而智能計(jì)算力由GPU主導(dǎo)的比例逐漸增加。
目前,GPU在AI芯片市場的占比約為90%。根據(jù)VMR的數(shù)據(jù),2021年全球GPU行業(yè)市場規(guī)模為334.7億美元,隨著大型模型訓(xùn)練的成熟,預(yù)計(jì)到2030年將達(dá)到4773.7億美元,年均增長率為34.35%。
新華三集團(tuán)副總裁、計(jì)算存儲(chǔ)產(chǎn)品線總裁徐潤安在接受媒體采訪時(shí)表示,智能算力占比變大原因在于,x86架構(gòu)CPU單核性能強(qiáng)、通用性好。但AI場景需要多核、高并發(fā)、高帶寬芯片。綜合考慮成本、效率,GPU、DPU、NPU通常表現(xiàn)更好。CPU部分職能被其他專用芯片分擔(dān)。在他看來,大模型會(huì)帶來巨大的智能算力消耗。
Chiplet:破局數(shù)據(jù)中心未來
近20年中,單一的制程微縮已被證明無法趕上對(duì)性能需求的步伐。尤其是在數(shù)據(jù)中心,情況遠(yuǎn)比客戶端產(chǎn)品更為復(fù)雜,一個(gè)非常典型的情況是多個(gè)客戶端在同一產(chǎn)品上運(yùn)行工作負(fù)載,如多核CPU或GPU。于是,人們開始將未來依托在將計(jì)算單元、內(nèi)存等和其他模塊成在同一封裝上的Chiplet異構(gòu)集成路線之上。
Chiplet架構(gòu)對(duì)于服務(wù)器處理器而言意義非凡,大大降低了處理器的開發(fā)門檻和成本,起到了巨大的推動(dòng)作用。正如AMD開創(chuàng)性的chiplet產(chǎn)品所證明的那樣,轉(zhuǎn)向chiplet技術(shù)可以顯著改善數(shù)據(jù)中心的計(jì)算成本,并提高互連效率。迄今,全球主流服務(wù)器芯片廠商都開始將chiplet納入自身產(chǎn)品的主要路徑之一。
就此,英特爾 IO 技術(shù)解決方案團(tuán)隊(duì)?wèi)?zhàn)略家Kurt Lender 總結(jié)了 chiplet 技術(shù)的影響“有合理的預(yù)期,未來 10 年的 HPC 采購將利用 chiplet 技術(shù)更好地支持他們的科學(xué)工作負(fù)載。” AMD 的 CEO Lisa Su也表現(xiàn)出了同樣的期待,當(dāng)被問及她是否認(rèn)為未來 10 年的 HPC 采購指定定制chiplet設(shè)計(jì)的計(jì)算芯片而不是現(xiàn)成的商品時(shí),她回答“是”。
Kurt Lender 表示,創(chuàng)建基于 UCIe 的chiplet 設(shè)計(jì)在成本方面具有顯著的優(yōu)勢,“有各種縱向擴(kuò)展和橫向擴(kuò)展的成本優(yōu)勢,包括由于與單片硅設(shè)計(jì)相比占地面積更小而導(dǎo)致chiplet的高良率而節(jié)省的成本,以及能夠指定可以利用 HPC 冷卻功能的高密度、高功率封裝。在其最完整的表達(dá)中,基于chiplet 的架構(gòu)使設(shè)計(jì)人員能夠?qū)碜远鄠€(gè)供應(yīng)商的 IP 和不同職稱工藝技術(shù)的芯??焖偌傻揭粋€(gè)封裝中?!?/p>
關(guān)于隨著以大模型為代表的人工智能大規(guī)模計(jì)算的迅速崛起,數(shù)據(jù)中心的算力難題不斷加劇。而異構(gòu)和Chiplet會(huì)將數(shù)據(jù)中心的未來引向何處,還讓我們拭目以待。???????
審核編輯:劉清
-
GPU芯片
+關(guān)注
關(guān)注
1文章
303瀏覽量
5813 -
OpenAI
+關(guān)注
關(guān)注
9文章
1089瀏覽量
6516 -
chiplet
+關(guān)注
關(guān)注
6文章
432瀏覽量
12595 -
奇異摩爾
+關(guān)注
關(guān)注
0文章
49瀏覽量
3414 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1561瀏覽量
7673 -
先進(jìn)封裝
+關(guān)注
關(guān)注
2文章
404瀏覽量
246 -
芯粒
+關(guān)注
關(guān)注
0文章
59瀏覽量
135
原文標(biāo)題:異構(gòu)+Chiplet,通往數(shù)據(jù)中心的能效之路
文章出處:【微信號(hào):奇異摩爾,微信公眾號(hào):奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論