2023年度液冷基礎(chǔ)設(shè)施市場(chǎng)份額達(dá)到61.3%,連續(xù)3年蟬聯(lián)行業(yè)榜首,根據(jù)《液冷數(shù)據(jù)中心白皮書》,曙光數(shù)創(chuàng)再次交出亮眼成績(jī)單。
智算快速發(fā)展環(huán)境下,其實(shí)不止曙光數(shù)創(chuàng),整個(gè)行業(yè)的液冷正呈現(xiàn)高速發(fā)展態(tài)勢(shì)。曙光數(shù)創(chuàng)副總裁兼CTO張鵬博士在接受采訪時(shí)預(yù)測(cè): “ 液冷整體滲透率目前并不高,不超過 10%,但未來3到5年這個(gè)比例將快速提高,有望達(dá)到30%甚至40% 。” 《中國(guó)液冷數(shù)據(jù)中 心市場(chǎng)深度研究報(bào)告》也顯示,目前中國(guó)液冷數(shù)據(jù)中心市場(chǎng)快速發(fā)展,預(yù)計(jì)到2027年, 液冷市場(chǎng)將以60%的復(fù)合增長(zhǎng)率,突破千億規(guī)模。
液冷的兩種主要技術(shù)路線——冷板式與浸沒式的發(fā)展趨勢(shì)如何,目前挑戰(zhàn)是什么,如何 應(yīng)對(duì)等成為行業(yè)熱議話題。
液冷是高效散熱必需
真正價(jià)值是激活芯片計(jì)算潛能
大模型等人工智能快速發(fā)展下,智算產(chǎn)業(yè)迅速拓展,據(jù)中國(guó)信通院統(tǒng)計(jì),截至2023年底,我國(guó) 智算規(guī)模約69 EFLOPS,相較于2023年6月的50EFLOPS,半年時(shí)間規(guī)模增加38%,但在推動(dòng) 數(shù)據(jù)中心產(chǎn)業(yè)的同時(shí),也給數(shù)據(jù)中心散熱帶來巨大挑戰(zhàn)。
GPU芯片功率不斷提升,高密度成為發(fā)展趨勢(shì)。風(fēng)冷有其制冷極限,無法滿足服務(wù)器及數(shù)據(jù)中心 的散熱要求,而同體積液體帶走的熱量是同體積空氣的3000倍以上,能夠高效降溫,保證芯片 的安全運(yùn)行。因此, 液冷被公認(rèn)為是算力基礎(chǔ)設(shè)施的標(biāo)配與必然選擇。
在此基礎(chǔ)上,液冷應(yīng)用的成本不斷降低 。張鵬表示, 經(jīng)過測(cè)算,當(dāng)數(shù)據(jù)中心機(jī)架部署密度超過 10kW后,冷板式液冷系統(tǒng)的初始投資已經(jīng)低于風(fēng)冷,并且隨著運(yùn)行時(shí)間的增長(zhǎng), TCO (總體擁 有成本)優(yōu)勢(shì)會(huì)更為明顯 。液冷還能夠促進(jìn)節(jié)能減碳,其高效率制冷的能力可大幅度減少散熱的 電能消耗,讓數(shù)據(jù)中心實(shí)現(xiàn)低PUE,符合政策要求與綠色化發(fā)展趨勢(shì)。
尤為值得注意的是, 液冷能夠激活計(jì)算的潛能,這也是其真正價(jià)值所在 。張鵬指出, GPU頻率是 可變的,如果制冷能力不足,為了安全穩(wěn)定的運(yùn)行, GPU就需要降頻,而這就影響了計(jì)算能力。 換句話說, 散熱能力差束縛了芯片算力的輸出。液冷可高效地解決這-問題,確保芯片計(jì)算能力 的全火力輸出 ?!?以某國(guó)產(chǎn)CPU芯片為例,風(fēng)冷條件下2.4GHz的CPU在相變浸沒液冷環(huán)境下主 頻可達(dá)到3.2GHz,處理速度提升超過30%! ” 張鵬說。
這些均推動(dòng)了液冷應(yīng)用的快速發(fā)展,行業(yè)客戶逐步增多,包括互聯(lián)網(wǎng)、運(yùn)營(yíng)商、金融等,同時(shí), 相較于改造,目前液冷的使用主要以新增的數(shù)據(jù)中心為主 。張鵬表示,改造面臨很多現(xiàn)實(shí)問題, 如維保需要結(jié)合數(shù)據(jù)中心現(xiàn)有情況提供更完善的方案,可靠性需進(jìn)行綜合考量;如服務(wù)器有著 — 定的使用年限,改造投入后,企業(yè)收益能否覆蓋成本、滿足商業(yè)需要也存在—定疑慮。
冷板式是當(dāng)前主流
浸沒式未來將廣泛應(yīng)用
面向大模型的智算需求,為釋放芯片算力,液冷已經(jīng)成為大趨勢(shì)。從目前應(yīng)用情況來看,冷板式 是液冷主流。張鵬指出, 目前冷板式在液冷市場(chǎng)約占大概80%到90%, 這是因?yàn)槔浒迨降某杀?更低,產(chǎn)業(yè)鏈也更為成熟,同時(shí),冷板式與風(fēng)冷在運(yùn)維上差異較小,使用習(xí)慣—致,市場(chǎng)接受程 度更高。
與之相對(duì)應(yīng)的,浸沒式的運(yùn)維邏輯不同,比如風(fēng)冷中沒有換液等運(yùn)維步驟,考慮到浸沒式的成本 與后續(xù)運(yùn)維,張鵬直言,目前小型數(shù)據(jù)中心不推薦上浸沒式,大型數(shù)據(jù)中心可以承擔(dān)較多的成本 壓力,還可配置專門的液冷運(yùn)維操作間,更適宜使用浸沒式。
不過這并不代表浸沒式 “ 止步于此 ” , 伴隨著芯片功率的提升,冷卻效率還要進(jìn)-步提升,這將推 動(dòng)浸沒式,準(zhǔn)確地說是加快相變浸沒式的廣泛應(yīng)用。
據(jù)了解,國(guó)內(nèi)CPU芯片功率已經(jīng)達(dá)到400W,而英偉達(dá)2024年3月最新推出的B200芯片相比 H100雖然算力能源效率提升了約25倍,但芯片功耗也將超過1000W。張鵬表示, 相變浸沒式的 冷卻效率要高于冷板式與單相浸沒式,更適合高功率的芯片散熱需求,或是終極液冷出路。
不僅如此,相較于冷板式,浸沒式還有多項(xiàng)優(yōu)勢(shì)。如浸沒式是-站式解決方案,可靠性高,對(duì)環(huán) 境的依賴性小,能夠很好的防潮防塵。同時(shí),在服務(wù)器更新的時(shí)候,強(qiáng)耦合的冷板式也會(huì)被替 換,浸沒式則只需要替換冷媒,這使得在成本方面浸沒式也會(huì)逐步顯示出優(yōu)勢(shì)。
浸沒式應(yīng)用推廣面臨多項(xiàng)挑戰(zhàn)
需要從技術(shù)、生產(chǎn)等方面優(yōu)化
技術(shù)的大規(guī)模應(yīng)用轉(zhuǎn)化需要成熟的技術(shù)與產(chǎn)業(yè)鏈的支撐,液冷同樣如此。
具體來看, 冷板式在技術(shù)上已經(jīng)實(shí)現(xiàn)了多項(xiàng)突破,目前面臨的挑戰(zhàn)主要是產(chǎn)業(yè)鏈方面的,包括如 何推動(dòng)產(chǎn)品的成熟,更好的降本增效,提升可靠性等,這意味著整個(gè)行業(yè)的發(fā)展,也是挑戰(zhàn)。 浸 沒式則處于技術(shù)創(chuàng)新突破的時(shí)期,其技術(shù)門檻極高,目前依舊有多項(xiàng)技術(shù)問題沒有解決,且并非 短時(shí)間內(nèi)就可以解決。
這點(diǎn)從曙光數(shù)創(chuàng)的發(fā)展便能體現(xiàn)出來, 自2011年提出液冷技術(shù)路線并啟動(dòng)相關(guān)技術(shù)研究,到 2017年浸沒式液冷才對(duì)外應(yīng)用,曙光數(shù)創(chuàng)歷經(jīng)6年才實(shí)現(xiàn)了浸沒技術(shù)的商用化,這其中有多項(xiàng)關(guān) 鍵技術(shù)的突破。
以浸沒冷媒為例,經(jīng)過長(zhǎng)期自主研發(fā), 曙光浸沒相變液冷計(jì)算機(jī)所使用的冷媒——電子氟化液已 經(jīng)迭代到第三代,實(shí)現(xiàn)了諸多創(chuàng)新,具有高絕緣、低沸點(diǎn)、大潛熱、穩(wěn)定性高、低粘度、安全 性、以及環(huán)境友好(無臭氧破壞、溫室效應(yīng)低)等特性,可支持浸沒相變液冷系統(tǒng)生命周期內(nèi)可 靠穩(wěn)定運(yùn)行。
也正是依托技術(shù)上的長(zhǎng)期研發(fā)突破, 曙光數(shù)創(chuàng)的相變浸沒液冷才能夠不斷應(yīng)用推廣,成為目前國(guó) 內(nèi)唯-實(shí)現(xiàn)全浸式液體相變冷卻大規(guī)模商業(yè)化部署的企業(yè),在重慶和多個(gè)東部-二線城市均有相 變浸沒式數(shù)據(jù)中心的建設(shè)實(shí)踐。
面對(duì)未來更高功率的散熱要求,針對(duì)不同產(chǎn)業(yè)的差異化需求, 浸沒式技術(shù)還要進(jìn)行更深入的發(fā) 展,需要企業(yè)從多方面來進(jìn)行優(yōu)化。
首先,需要大量的研發(fā)投入。以曙光數(shù)創(chuàng)為例,其以技術(shù)為導(dǎo)向,持續(xù)研發(fā)投入,根據(jù)財(cái)報(bào)來 看, 2023年研發(fā)投入共計(jì)6825.33萬元, 2024年第一季度研發(fā)費(fèi)用總額超1440萬元,相較于 2023年第一季度同比增長(zhǎng)超過4%。通過大量的研發(fā)投入,曙光數(shù)創(chuàng)有效優(yōu)化了液冷散熱技術(shù), 實(shí)現(xiàn)了高效可靠的全棧基礎(chǔ)設(shè)施解決方案全場(chǎng)景覆蓋。截至2023年末,曙光數(shù)創(chuàng)擁有已授權(quán)相 關(guān)專利135項(xiàng),包含發(fā)明專利38項(xiàng),軟著45項(xiàng),其中與液冷相關(guān)的專利104項(xiàng),軟著27項(xiàng),在審 發(fā)明專利31項(xiàng)。
其次,需要為生產(chǎn)做好準(zhǔn)備。如曙光數(shù)創(chuàng)在山東青島建設(shè)了目前我國(guó)規(guī)模最大的液冷數(shù)據(jù)中心全 鏈條產(chǎn)業(yè)創(chuàng)新基地,且已正式投產(chǎn)。該基地囊括研發(fā)、生產(chǎn)和保障三大功能區(qū),擁有七大研發(fā)創(chuàng) 新實(shí)驗(yàn)室和四條先進(jìn)生產(chǎn)線,實(shí)現(xiàn)專業(yè)的全鏈條、 一站式系統(tǒng)解決方案的創(chuàng)新研發(fā)和生產(chǎn),能夠 有效降本增效,提升交付能力,提高保密性,推動(dòng)生產(chǎn)發(fā)展。
最后,需要時(shí)刻跟隨客戶需求。不同的企業(yè)在應(yīng)用液冷的過程中有差異化需求,如金融業(yè)對(duì)安全 性的高要求,要求液冷廠商能夠依托自身技術(shù)與產(chǎn)品持續(xù)優(yōu)化發(fā)展,以更契合客戶的發(fā)展需要, 促進(jìn)算力的有效供給。
綜合來看,液冷是智算快速發(fā)展趨勢(shì)下散熱的標(biāo)配與必需品,能夠有效釋放芯片的計(jì)算能力,并 且伴隨芯片功率的持續(xù)提升,液冷未來的發(fā)展方向是浸沒式,但浸沒式目前在技術(shù)與產(chǎn)業(yè)發(fā)展上 依舊存在諸多挑戰(zhàn),需要圍繞客戶需求,加大研發(fā)投入,完善產(chǎn)業(yè)鏈做好生產(chǎn)準(zhǔn)備,最終滿足不 同客戶對(duì)液冷的差異化需求,推動(dòng)算力建設(shè),加快智能化、數(shù)字化發(fā)展。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
455文章
50816瀏覽量
423672 -
液冷
+關(guān)注
關(guān)注
4文章
102瀏覽量
5053
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論