AI時(shí)代,數(shù)據(jù)是驅(qū)動(dòng)智能的關(guān)鍵引擎。作為存儲(chǔ)和處理這些數(shù)據(jù)的核心基礎(chǔ)設(shè)施,數(shù)據(jù)中心持續(xù)滋養(yǎng)著我們的數(shù)字世界——
對(duì)大眾生活而言,AI大模型的參與,讓搜索和內(nèi)容生成進(jìn)入一個(gè)全新階段;
對(duì)企業(yè)而言,要實(shí)現(xiàn)工業(yè)自動(dòng)化,需要基于AI分析優(yōu)化改進(jìn)控制流程;
對(duì)政府機(jī)構(gòu)亦是如此,更多、更廣泛的數(shù)據(jù)將促進(jìn)決策和政策制定......
據(jù)施耐德電氣估算,到2028年,人工智能電力消耗將占數(shù)據(jù)中心總電力消耗的15%-20%。AI需要愈加澎湃的算力助其不斷演進(jìn),也為數(shù)據(jù)中心的設(shè)計(jì)和運(yùn)營帶來顛覆性的變革。
急需“重塑根骨”的數(shù)據(jù)中心將何去何從?
施耐德電氣通過分析人工智能工作負(fù)載的相關(guān)屬性和趨勢(shì),針對(duì)數(shù)據(jù)中心多個(gè)物理基礎(chǔ)設(shè)施類別提供應(yīng)對(duì)指南,幫助大家尋獲破局之法。
4個(gè)根本原因驅(qū)動(dòng)數(shù)據(jù)中心革新
當(dāng)前數(shù)據(jù)中心相關(guān)企業(yè)主要面臨三個(gè)挑戰(zhàn):
首先是如何在確保計(jì)算與存儲(chǔ)能力提升的同時(shí),建設(shè)可持續(xù)發(fā)展的數(shù)據(jù)中心;
第二個(gè)挑戰(zhàn)是在數(shù)字化基礎(chǔ)設(shè)施方面,如何更好地利用覆蓋全生命周期的數(shù)字化軟件,貫穿設(shè)計(jì)、建造和運(yùn)營維護(hù),從而提升速度、準(zhǔn)確性和可持續(xù)性;
第三個(gè)挑戰(zhàn)是如何實(shí)現(xiàn)由傳統(tǒng)基礎(chǔ)設(shè)施建設(shè)向智能、數(shù)字化的基礎(chǔ)設(shè)施轉(zhuǎn)變。
其中,傳統(tǒng)的基礎(chǔ)設(shè)施之所以面臨挑戰(zhàn),與生成式人工智能(如ChatGPT)的涌現(xiàn)和AI相關(guān)的數(shù)據(jù)需求激增密切相關(guān)。
為了更好地實(shí)現(xiàn)大規(guī)模的高性能計(jì)算,數(shù)據(jù)中心需要解決由人工智能工作負(fù)載、GPU的熱設(shè)計(jì)功耗(TDP)、網(wǎng)絡(luò)延遲、人工智能集群規(guī)模所帶來的一系列問題。因此,擁有更智能與數(shù)字化的物理基礎(chǔ)設(shè)施,將成為AI席卷下數(shù)據(jù)中心升級(jí)過程中的重要發(fā)力點(diǎn)。
錨定關(guān)鍵挑戰(zhàn)重塑高性能數(shù)據(jù)中心
數(shù)據(jù)中心基礎(chǔ)設(shè)施演變涉及供配電、制冷、機(jī)柜等多個(gè)方面。依托前沿的行業(yè)洞察和豐富實(shí)踐經(jīng)驗(yàn),施家基于創(chuàng)新技術(shù)與解決方案,融合數(shù)字化服務(wù)與創(chuàng)新型服務(wù),為數(shù)據(jù)中心的重塑提供四個(gè)可靠思路。
01優(yōu)化供配電系統(tǒng),提高數(shù)據(jù)中心韌性
AI工作負(fù)載主要分為訓(xùn)練和推理。訓(xùn)練所需的大規(guī)模機(jī)柜陣列,組成了“人工智能集群”,增加了供電壓力。而推理所需工作負(fù)載通常為業(yè)務(wù)關(guān)鍵型負(fù)載,需要具備更高韌性。因此,我們可采取以下5點(diǎn)措施,對(duì)供配電系統(tǒng)進(jìn)行優(yōu)化:
加大配電模塊的規(guī)格,滿足高密度集群的需求。
改用多個(gè)現(xiàn)成的標(biāo)準(zhǔn)rPDU,或采用額定電流大于60A和63A的定制化rPDU增加容量。
通過弧閃風(fēng)險(xiǎn)評(píng)估和負(fù)載分析,使用適當(dāng)?shù)?a target="_blank">連接器、插座和rPDU,以減少弧閃危害。
人工智能負(fù)載缺乏變化,易增加上游斷路器脫扣的風(fēng)險(xiǎn)。需確保主斷路器與負(fù)載總和匹配,不建議過載使用。
分析人工智能集群內(nèi)的所有負(fù)載,以確保使用適當(dāng)?shù)倪B接器和插座。避免機(jī)柜溫度過高,增加故障風(fēng)險(xiǎn)和安全隱患。
02改變傳統(tǒng)的制冷方式,從風(fēng)冷轉(zhuǎn)向液冷
盡管風(fēng)冷一直是IT行業(yè)的主流選擇,但大型人工智能集群中的服務(wù)器難以分散放置等諸多因素,正迫使數(shù)據(jù)中心逐漸從風(fēng)冷向液冷轉(zhuǎn)變。
然而,液冷的應(yīng)用也存在很多的挑戰(zhàn),如缺乏標(biāo)準(zhǔn)化設(shè)計(jì)、缺乏運(yùn)維經(jīng)驗(yàn)等。數(shù)據(jù)中心需采取以下6點(diǎn)針對(duì)性措施,應(yīng)對(duì)制冷挑戰(zhàn):
機(jī)柜功率密度20kW以下可采用風(fēng)冷,人工智能集群機(jī)柜功率密度超過20kW,推薦采用液冷服務(wù)器。
部署液冷技術(shù)之前,需要對(duì)液冷負(fù)載和設(shè)施的現(xiàn)有條件進(jìn)行設(shè)計(jì)評(píng)估。
由于不確定的未來TDP增加了制冷設(shè)計(jì)淘汰的風(fēng)險(xiǎn),建議在設(shè)計(jì)制冷系統(tǒng)時(shí)要考慮到風(fēng)冷和液冷技術(shù)的兼容性。
由專家對(duì)液冷設(shè)計(jì)進(jìn)行全面評(píng)估,并制定詳細(xì)規(guī)劃,減少操作失誤和故障風(fēng)險(xiǎn)。
選擇可靠的供應(yīng)商,并應(yīng)制定應(yīng)急操作流程(EOP),減少IT機(jī)柜內(nèi)漏液的風(fēng)險(xiǎn)。
為實(shí)現(xiàn)可持續(xù)發(fā)展,建議使用采用水作為冷卻液的冷板式液冷。
03升級(jí)所需機(jī)柜,實(shí)現(xiàn)量體裁衣
由于人工智能服務(wù)器深度和重量不斷增加,因此,機(jī)柜也需要針對(duì)性變化,以適配優(yōu)化后的機(jī)群。
建議至少采用750毫米寬的機(jī)柜,以容納所需的配電和制冷裝置安裝空間。
為IT機(jī)柜配有可調(diào)節(jié)的安裝軌道,以適應(yīng)不同IT設(shè)備深度。
建議將人工智能訓(xùn)練集群部署在48U或高度更高的機(jī)柜上。
建議指定機(jī)柜的靜態(tài)承重能力大于1,800kg,動(dòng)態(tài)承重能力大于1,200kg,并評(píng)估數(shù)據(jù)中心地板,確保其滿足承重需求。
04應(yīng)用軟件工具,賦能運(yùn)營管理
在管理人工智能集群時(shí),應(yīng)用軟件工具可降低復(fù)雜電氣網(wǎng)絡(luò)出現(xiàn)意外故障的風(fēng)險(xiǎn),并為布局的決策提供依據(jù)。其中,EPMS和DCIM能準(zhǔn)確查看當(dāng)前的配電能力及其趨勢(shì),包括IT空間內(nèi)的大容量電力和配電級(jí)別,電氣設(shè)計(jì)(又稱電力系統(tǒng)工程)軟件工具可簡化數(shù)據(jù)收集和計(jì)算工作,數(shù)字化單線圖(iSLD)優(yōu)化安全評(píng)估過程,更是讓維護(hù)工作的復(fù)雜性大大降低。
通過軟件工具,對(duì)整個(gè)IT空間(包括機(jī)柜中的設(shè)備和虛擬機(jī))創(chuàng)建數(shù)字孿生,實(shí)現(xiàn)數(shù)據(jù)中心可視化,也能盡可能增大動(dòng)態(tài)環(huán)境中的容錯(cuò)裕量,降低運(yùn)營風(fēng)險(xiǎn),解鎖數(shù)據(jù)中心運(yùn)維的“新境界”。
凡事預(yù)則立,無論是“東數(shù)西算”工程,還是“算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)”等,都在進(jìn)一步明確數(shù)據(jù)中心產(chǎn)業(yè)變革在加速推進(jìn)。面對(duì)“萬物皆可AI”的智算浪潮,施家正積極從產(chǎn)品、技術(shù)到服務(wù)多方面,持續(xù)賦能數(shù)據(jù)中心的升級(jí)迭代。
未來
以創(chuàng)新為引擎的施耐德電氣
將持續(xù)以行業(yè)前沿理念為基礎(chǔ),推動(dòng)面向未來的數(shù)字化基礎(chǔ)設(shè)施建設(shè),助力數(shù)據(jù)中心提升能效、提高可用性和實(shí)現(xiàn)可持續(xù)發(fā)展,幫助更多企業(yè)共贏數(shù)智未來。
審核編輯:湯梓紅
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4794瀏覽量
72191 -
AI
+關(guān)注
關(guān)注
87文章
31028瀏覽量
269366 -
施耐德電氣
+關(guān)注
關(guān)注
0文章
163瀏覽量
15281
原文標(biāo)題:重磅白皮書 | AI驅(qū)動(dòng)數(shù)據(jù)中心重塑根骨,升級(jí)煥新!
文章出處:【微信號(hào):施耐德電氣,微信公眾號(hào):施耐德電氣】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論