電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)人工智能的基座包括數(shù)據(jù)、算力和算法。其中算力更是數(shù)據(jù)和算法的支撐。各類模型基于數(shù)據(jù)量、算法的訓(xùn)練和推理推動(dòng)了算力需求。
根據(jù)OpenAI的測(cè)算數(shù)據(jù),AI訓(xùn)練運(yùn)行所使用的算力每3-4個(gè)月增長(zhǎng)一倍。AI訓(xùn)練運(yùn)行所使用的算力已增長(zhǎng)超30萬倍。IDC數(shù)據(jù)顯示,2022年我國(guó)智能算力規(guī)模達(dá)到268百億億次/秒(EFLOPS),超過通用算力規(guī)模;預(yù)計(jì)未來5年我國(guó)智能算力規(guī)模的年復(fù)合增長(zhǎng)率將達(dá)52.3%。
構(gòu)筑算力必然離不開服務(wù)器的建設(shè)。作為全球頂級(jí)的人工智能/高性能計(jì)算服務(wù)器制造商和解決方案提供商,Supermicro公司日前向電子發(fā)燒友網(wǎng)表示,新業(yè)務(wù)合約有很大一部分來自人工智能/高性能計(jì)算領(lǐng)域,而且許多與ChatGPT有關(guān)。
Supermicro高管表示,人工智能界并不知道未來還會(huì)遇到多少計(jì)算密集型問題。以GPT-3為例,它需要323 Zetta FLOPS的算力和1750億個(gè)參數(shù)來訓(xùn)練模型,更需要龐大的算力來執(zhí)行推理工作。更加智能的GPT-4將會(huì)有更多的參數(shù),有可能達(dá)到一萬億甚至更多。
為了運(yùn)轉(zhuǎn)這樣的大模型和大規(guī)模參數(shù),如何有效運(yùn)用服務(wù)器顯得十分重要,這關(guān)乎服務(wù)器的性價(jià)比選擇。Supermicro公司高管說到,當(dāng)大量的GPU服務(wù)器集群起來時(shí),人工智能/高性能計(jì)算應(yīng)用的每一微秒都很重要。Supermicro設(shè)計(jì)開發(fā)了各種不同架構(gòu)的GPU服務(wù)器,提升了CPU和GPU之間或從GPU到GPU的數(shù)據(jù)傳輸速度。通過合理選擇系統(tǒng)SKU,解決方案的設(shè)計(jì)可以將每個(gè)CPU/GPU核心利用到極致。從邊緣到云,從訓(xùn)練到推理,當(dāng)前市面上所需的人工智能/高性能計(jì)算應(yīng)用,Supermicro都可以提供全方位的GPU服務(wù)器,能讓客戶充分利用計(jì)算資源上花費(fèi)的每一分錢。
更大的服務(wù)器存儲(chǔ)空間
隨著CPU、GPU和內(nèi)存技術(shù)的發(fā)展,現(xiàn)代計(jì)算集群處理數(shù)據(jù)的速度和數(shù)量不斷增加,因此有必要增強(qiáng)存儲(chǔ)性能,以便將數(shù)據(jù)饋送給應(yīng)用時(shí)不會(huì)形成減緩整個(gè)系統(tǒng)的速度的瓶頸。
最近,Supermicro推出了超高性能、高密度PB級(jí)All-Flash NVMe服務(wù)器新機(jī)型。更新產(chǎn)品系列中初步推出的產(chǎn)品將在1U 16槽機(jī)架式安裝系統(tǒng)中支持高達(dá)1/2 PB的儲(chǔ)存空間,隨后的產(chǎn)品則將在2U 32槽機(jī)架式安裝系統(tǒng)中為Intel和AMD PCIe Gen5平臺(tái)提供1 PB儲(chǔ)存空間。
Supermicro高管表示,Supermicro的Petascale All-Flash服務(wù)器提供業(yè)界領(lǐng)先的存儲(chǔ)性能和容量,可以減少滿足熱存儲(chǔ)和溫存儲(chǔ)要求所需的機(jī)架式系統(tǒng)數(shù)量,并通過諸多功能特點(diǎn)降低總體擁有成本。
具體來說,容量擴(kuò)展,更廣泛的PCB有助于實(shí)現(xiàn)更靈活的NAND芯片布局;性能擴(kuò)展,可擴(kuò)展連接器設(shè)計(jì),多鏈路寬度(x4、x8、x16),支持不同電源配置;熱效率,散熱和制冷管理改進(jìn);面向未來,通用連接器適用于各種尺寸規(guī)格,可以為未來幾代PCIe提供更加強(qiáng)大的信號(hào)完整性;解決方案范圍,各種功率配置(20W-70W),適用于更高容量/性能的固態(tài)硬盤。
“安裝了速度更快的固態(tài)硬盤之后,系統(tǒng)的平衡就變得更加重要。Supermicro擁有全新的NUMA平衡對(duì)稱架構(gòu),可以提供到驅(qū)動(dòng)器的最短信號(hào)路徑、到存儲(chǔ)器的帶寬平衡和靈活的網(wǎng)絡(luò)選項(xiàng),從而降低時(shí)延。最重要的是,對(duì)稱設(shè)計(jì)還有助于確保整個(gè)系統(tǒng)的氣流暢通無阻,因此可以使用更加強(qiáng)大的處理器?!盨upermicro高管說道。
桌面型GPU兼顧AI與液冷散熱
CPU/GUP/xPU也構(gòu)成了系統(tǒng)設(shè)計(jì)的熱量挑戰(zhàn),各種處理器消耗的功率不斷攀升,另一方面,科研/醫(yī)療設(shè)施/金融/石油和天然氣企業(yè)需要人工智能/高性能計(jì)算來提高其專業(yè)競(jìng)爭(zhēng)力。在這些企業(yè)中,有很多需要在員工工作的地點(diǎn)設(shè)置工作站或本地服務(wù)器。
基于這樣的需求,Supermicro推出功能強(qiáng)大、安靜且節(jié)能的NVIDIA加速人工智能(AI)開發(fā)平臺(tái)系列當(dāng)中的首款裝置。全新的AI開發(fā)平臺(tái)SYS-751GE-TNRT-NV1是一款應(yīng)用優(yōu)化的系統(tǒng),在開發(fā)及運(yùn)行AI軟件時(shí)表現(xiàn)尤其出色。此外,這個(gè)性能強(qiáng)大的系統(tǒng)可以支持小團(tuán)隊(duì)里的用戶同步運(yùn)行訓(xùn)練、推理和分析等工作負(fù)載。
獨(dú)立的液冷功能可滿足四個(gè)NVIDIA? A100 Tensor Core GPU和兩個(gè)第4代Intel Xeon可擴(kuò)展處理器的散熱需求,在發(fā)揮完整性能的同時(shí)提高整體系統(tǒng)效率,并實(shí)現(xiàn)了在辦公環(huán)境下的安靜(約30dB)運(yùn)行。
對(duì)于散熱的考量,Supermicro高管認(rèn)為搭載NVIDIA A800等強(qiáng)大的協(xié)加速器、且聲壓級(jí)介于30~45分貝的工作站,必須采用液冷解決方案才能滿足這一需求。冷板式液冷在市場(chǎng)上經(jīng)過了十多年的考驗(yàn),目前其成熟度和可靠性已經(jīng)達(dá)到了數(shù)據(jù)中心大規(guī)模部署的水平。
創(chuàng)新技術(shù)驅(qū)動(dòng)成長(zhǎng)
早前,Supermicro就提出了觀察到的七大創(chuàng)新技術(shù),他們包括高性能350W CPU和700W GPU、處理速度更快的DDR5內(nèi)存、第五代PCI-E 5.0技術(shù)、Compute Express Link(CXL,開放式互聯(lián)標(biāo)準(zhǔn))、400G高速網(wǎng)絡(luò)、新型固態(tài)硬盤和液冷技術(shù)。
簡(jiǎn)言之就是更高的功耗和更快的數(shù)據(jù)傳輸速度。這就需要優(yōu)化功率效率、解決熱量挑戰(zhàn)、加強(qiáng)第五代PCIe、DDR5、高速網(wǎng)絡(luò)、無阻塞系統(tǒng)架構(gòu)設(shè)計(jì)和部署等。
Supermicro高管指出,這些創(chuàng)新技術(shù)背后的一個(gè)共同點(diǎn)是熱量調(diào)度。更快的處理器頻率、更多的計(jì)算核心、更高速的網(wǎng)絡(luò)都會(huì)產(chǎn)生更多的熱量,這些熱量必須輸送到數(shù)據(jù)中心之外。他表示,正如我們預(yù)計(jì)的技術(shù)趨勢(shì)和產(chǎn)品路線圖所示,當(dāng)前和新一代人工智能/高性能計(jì)算服務(wù)器采用的熱量解決方案必須比目前的空氣冷卻更加高效。
展望已經(jīng)到來的AI爆發(fā)的時(shí)代,ChatGPT的需求日益增長(zhǎng),不僅推高了服務(wù)器的銷量,而且還推動(dòng)新技術(shù)通過大規(guī)模部署而被普遍接納的機(jī)會(huì)。GPT提供的服務(wù)包括語言翻譯、聊天機(jī)器人、內(nèi)容生成、語言分析、語音輔助等等。
要實(shí)現(xiàn)人工智能系統(tǒng)的所有關(guān)鍵技術(shù),就需要足夠快速的服務(wù)器,并通過復(fù)雜的架構(gòu)、用于維護(hù)工作的液冷管布置等將其聯(lián)網(wǎng)。這些專業(yè)技術(shù)知識(shí)意味著解決方案將不再作為一個(gè)個(gè)的服務(wù)器提供。完整的解決方案部署更像是一個(gè)具有機(jī)架級(jí)就緒水平的即插即用解決方案。
Supermicro將ChatGPT視為服務(wù)器市場(chǎng)增長(zhǎng)的關(guān)鍵驅(qū)動(dòng)力,未來我們會(huì)看到GPT服務(wù)的更多創(chuàng)新型用例。Supermicro已準(zhǔn)備好面對(duì)這個(gè)趨勢(shì),始終保持在AI服務(wù)器技術(shù)前沿,并提供創(chuàng)新的解決方案,使得客戶能夠加速他們的AI應(yīng)用規(guī)劃,同時(shí)優(yōu)化總體擁有成本并通過綠色計(jì)算最大限度地減少對(duì)環(huán)境的影響。
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9160瀏覽量
85415 -
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269062 -
Supermicro
+關(guān)注
關(guān)注
0文章
29瀏覽量
9308
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論