當前各種AI大模型如火如荼,推動全球算力需求呈現(xiàn)爆炸式增長,伴隨著算力需求的增長,全球電力、功耗方面的成本不斷增加。據(jù)相關(guān)統(tǒng)計,AI算力下主流芯片功耗正不斷增加,如Intel的多款CPU芯片的TDP已突破350W,NVIDIA的H100系列GPU芯片TDP更是達到700W,B100 TDP或?qū)⑦_到1000W左右。英偉達GTC大會上,英偉達CEO黃仁勛發(fā)布了更高性能的GPU芯片——基于Blackwell架構(gòu)的B200以及超級芯片GB200。由于功耗太高,液冷的散熱方式成為系統(tǒng)的標配。
英偉達還推出了超級計算機機柜DGX GB200 NVL72,擁有18個GB200節(jié)點機架,每個節(jié)點搭配2個GB200 GPU。黃仁勛表示,一個DGX GB200 NVL72機柜可以訓(xùn)練27萬億參數(shù)的模型。但由于功耗過大,所以也必須要采用液冷的方式進行冷卻。
(圖片來源于網(wǎng)絡(luò))
目前PC行業(yè)應(yīng)用水冷技術(shù)越來越多,高端電腦基本上都是采用水冷散熱,相比普通的風冷散熱,散熱效率上最大提升50%-60%,噪音也比普通風冷要低。
液冷以接觸方式劃分的話可分為接觸式液冷和非接觸式液冷,其中浸沒式、噴淋式液冷等終端和載冷液直接接觸的為接觸式液冷,而通過冷板間接和終端連接,利用換熱冷板和終端的熱交換帶走熱量的稱為非接觸式液冷,我們在PC機上應(yīng)用最多的就是這種非接觸式液冷,冷頭固定接觸在CPU表面,通過水的流動,在冷頭內(nèi)部跟CPU進行熱交換,帶走CPU產(chǎn)生的熱量。
目前市場上幾乎所有的PC的液冷散熱系統(tǒng)都是被動式的散熱,即散熱系統(tǒng)本身不產(chǎn)生冷量,而是通過冷排端的翅片冷凝器將系統(tǒng)的熱量排出去從而形成散熱,簡單有效,散熱效果比風冷強,但是也強不了太多,因為該系統(tǒng)不能主動產(chǎn)生冷量,當電腦進行超頻時,CPU功率快速增加,發(fā)熱量也同步增加被動式散熱很難及時將熱量帶走,一般被動液冷極限也就到300-400W。
為了解決此問題,針對AI芯片開發(fā)了壓縮機制冷系統(tǒng),冷量從300W-2000W,并采用靜音降噪技術(shù),壓縮機可以實現(xiàn)變頻和低冷量運行,適用于各種狀態(tài)和模式下工作的CPU或是GPU,保證CPU和GPU長時間處于合理、穩(wěn)定和最佳工作狀態(tài)。
下圖為Q520系列,如圖所示:
外置主機散熱系統(tǒng)Q520圖
基礎(chǔ)版冷量達到500W,進階版冷量達到600W,后續(xù)陸續(xù)推出1000W以上的機器和設(shè)備,用于超頻或是CPU、GPU同時穩(wěn)定運行。
下圖為1600W的主動降溫系統(tǒng),實測可以滿足目前最新的CPU(如i9-14900KS)和GPU(如RTX4090)以最佳狀態(tài)運行,而噪音也不大,55dB以內(nèi),滿足民用的使用環(huán)境。
1600W主動降溫系統(tǒng)圖
液冷行業(yè)在蓬勃發(fā)展的同時也存在一些挑戰(zhàn),液冷技術(shù)在國內(nèi)外發(fā)展已有十余年,但當前生態(tài)不完善,各家產(chǎn)品形態(tài)各異,產(chǎn)品規(guī)范化程度較低。目前業(yè)內(nèi)尚無PC系統(tǒng)一接口規(guī)范標準,機柜與服務(wù)器深度耦合,各家PC設(shè)備、冷卻液、制冷管路、供配電等產(chǎn)品形態(tài)各異,不同廠家產(chǎn)品接口不同、不能互相兼容,勢必限制競爭,影響產(chǎn)業(yè)高質(zhì)量發(fā)展。
因此,液冷技術(shù)標準、產(chǎn)業(yè)鏈生態(tài)仍有待更進一步的建立與規(guī)范,酷凌時代積極參與液冷技術(shù)規(guī)范的編寫,利用自身在液冷行業(yè)的豐富經(jīng)驗和應(yīng)用案例,推動液冷行業(yè)快速、高效、規(guī)范發(fā)展。
-
AI芯片
+關(guān)注
關(guān)注
17文章
1887瀏覽量
35029 -
液冷
+關(guān)注
關(guān)注
4文章
102瀏覽量
5057 -
AI大模型
+關(guān)注
關(guān)注
0文章
316瀏覽量
310
發(fā)布評論請先 登錄
相關(guān)推薦
評論