8月24日,在青島舉行的全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)大會(huì)(CCF HPC China 2023)上,由北京大學(xué)和華為技術(shù)有限公司聯(lián)合申報(bào)的超融合以太網(wǎng)絡(luò)榮獲解決方案創(chuàng)新獎(jiǎng)。CCF是中國(guó)計(jì)算機(jī)學(xué)會(huì)的簡(jiǎn)稱,CCF HPC China是高性能計(jì)算領(lǐng)域全球最具影響力的三大超算盛會(huì)之一,有著“中國(guó)超算風(fēng)向標(biāo)”的稱號(hào)。
如果說計(jì)算機(jī)領(lǐng)域,國(guó)際上的最高獎(jiǎng)項(xiàng)是圖靈獎(jiǎng),那么國(guó)內(nèi)最高獎(jiǎng)就是CCF頒發(fā)的獎(jiǎng)項(xiàng)。知情人士介紹,能獲得CCF頒發(fā)的獎(jiǎng)項(xiàng),無疑是一個(gè)計(jì)算機(jī)學(xué)科的極高榮譽(yù)和實(shí)力體現(xiàn)。CCF創(chuàng)新獎(jiǎng)旨在表彰在計(jì)算機(jī)科學(xué)、技術(shù)或網(wǎng)絡(luò)工程領(lǐng)域具有重要發(fā)現(xiàn)、發(fā)明、創(chuàng)新,在相關(guān)領(lǐng)域有國(guó)際影響的優(yōu)秀成果。獲得此獎(jiǎng)項(xiàng)不僅代表著中國(guó)科技力量有能力創(chuàng)新性地解決算力落地中的實(shí)際問題,而且意味著未來我們可以將此類創(chuàng)新成果更好地分享給世界。
CCF副理事長(zhǎng)金海頒獎(jiǎng)(中)北京大學(xué)計(jì)算中心付振新(左)、華為數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域副總裁張白領(lǐng)獎(jiǎng)(右)
那么,此次北大和華為聯(lián)合獲得的創(chuàng)新成果到底有何含金量呢?讓我們仔細(xì)道來。
算力落地面臨擁堵難題
近年來,算力已經(jīng)像水、電一樣,滲透到生產(chǎn)生活的各個(gè)領(lǐng)域,成為經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的重要驅(qū)動(dòng)力。目前,我國(guó)算力總規(guī)模居全球第二,保持30%左右的年增長(zhǎng)率,新增算力設(shè)施中智能算力占比過半,成為算力增長(zhǎng)的新引擎。一系列顯著增長(zhǎng)點(diǎn)都讓人看到了屬于“中國(guó)算力”的勃勃生機(jī)。
從去年年底以來,ChatGPT引發(fā)了全球?qū)τ诖竽P偷年P(guān)注,由此點(diǎn)燃了千行百業(yè)對(duì)于AI訓(xùn)練的需求。各大高校和科研院所的計(jì)算平臺(tái)使用人數(shù)激增,用戶的作業(yè)量逐漸超過了平臺(tái)承受能力,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的業(yè)務(wù)吞吐量和復(fù)雜性都大大增加。如何破解擁堵難題,讓算力更好地服務(wù)高質(zhì)量發(fā)展已經(jīng)成為當(dāng)務(wù)之急。
北京大學(xué)選中華為超融合以太網(wǎng)絡(luò)解決方案
北京大學(xué)早在2018年就建成了高性能計(jì)算校級(jí)公共平臺(tái),先后建成投用了“未名一號(hào)”“未名二號(hào)”“未名生科一號(hào)”等5套集群,共有732個(gè)節(jié)點(diǎn)、31000多個(gè)核心,計(jì)算峰值3.65PFLOPS,配備存儲(chǔ)14PB。
高性能計(jì)算校級(jí)公共平臺(tái)從整體上提升了北京大學(xué)的科研服務(wù)能力,降低了科研成本。截至2023年5月12日,該平臺(tái)為來自數(shù)學(xué)、力學(xué)、物理、化學(xué)、生物、地球科學(xué)等96個(gè)院系的5000多名師生提供了高性能計(jì)算服務(wù),支撐了545項(xiàng)科研課題,1400多篇科研論文,并支撐了2020年戈登貝爾獎(jiǎng)的發(fā)布。
不過隨著平臺(tái)使用人數(shù)、計(jì)算任務(wù)的增加,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的吞吐量和復(fù)雜性都大大增加,年均節(jié)點(diǎn)占用率都在80%以上,“未名生科一號(hào)”的節(jié)點(diǎn)占用率甚至長(zhǎng)期處于95%以上,作業(yè)時(shí)間和排隊(duì)時(shí)間變得越來越漫長(zhǎng)。
不能讓科研攻關(guān)任務(wù)堵在“臨門一腳”!為了提升高性能計(jì)算的效率,降低科研成本,北京大學(xué)高性能計(jì)算校級(jí)公共平臺(tái)組織了一次廠家“考核”,意在選出智能時(shí)代最優(yōu)的高性能計(jì)算網(wǎng)絡(luò)。通過嚴(yán)格測(cè)試,北京大學(xué)高性能計(jì)算校級(jí)公共平臺(tái)選擇采用華為超融合以太網(wǎng)絡(luò)解決方案,基于智能無損高性能計(jì)算網(wǎng)絡(luò)搭建高性能計(jì)算集群,100%釋放算力,縮短作業(yè)運(yùn)行時(shí)間和排隊(duì)時(shí)間。
華為超融合以太網(wǎng)絡(luò)解決方案為何能脫穎而出
針對(duì)熱門大型公共計(jì)算平臺(tái)排隊(duì)和作業(yè)時(shí)間過長(zhǎng)的問題,各廠商先后提出IB(Infiniband)、RoCEv1、RoCEv2等無損網(wǎng)絡(luò)技術(shù)。但是,通用計(jì)算區(qū)部署的傳統(tǒng)以太網(wǎng)、高性能計(jì)算區(qū)部署的IB網(wǎng)、存儲(chǔ)區(qū)部署的FC網(wǎng),是三張異構(gòu)網(wǎng)絡(luò),他們協(xié)議各異、架構(gòu)割裂,帶來了運(yùn)維困難、專網(wǎng)生態(tài)封閉、成本高、無法實(shí)現(xiàn)全生命周期管理等問題。
華為超融合以太網(wǎng)絡(luò)解決方案獨(dú)家實(shí)現(xiàn)以太網(wǎng)0丟包,與傳統(tǒng)以太網(wǎng)相比,可實(shí)現(xiàn)服務(wù)器規(guī)模不變,算力翻番;可構(gòu)建10E級(jí)的超大規(guī)模算力集群;獨(dú)家實(shí)現(xiàn)網(wǎng)算一體,網(wǎng)絡(luò)協(xié)助計(jì)算,經(jīng)第三方權(quán)威測(cè)試機(jī)構(gòu)Tolly認(rèn)證,任務(wù)完成時(shí)間(JCT)對(duì)比IB 縮短17%。
此次北京大學(xué)和華為的聯(lián)合獲獎(jiǎng)絕非偶然,這證明了超算行業(yè)技術(shù)圈對(duì)華為超融合以太網(wǎng)絡(luò)解決方案的充分認(rèn)可。
隨著數(shù)字產(chǎn)業(yè)智能化向智能世界發(fā)展,未來數(shù)據(jù)中心將朝著多云異構(gòu)算力演進(jìn),要構(gòu)建強(qiáng)大的算力,需要各類資源高度協(xié)同,深度融合。一張開放、自主的超融合以太網(wǎng)絡(luò)將多維度與各類算力資源協(xié)同,全面提升網(wǎng)絡(luò)性能,釋放更高算力,從而助力“高算力、高安全、高效能、高可靠”的新型算力中心建設(shè)。華為超融合以太網(wǎng)絡(luò)解決方案有望在國(guó)家科學(xué)計(jì)算、工程技術(shù)創(chuàng)新、高精尖科研算力使用和建設(shè)大潮中大顯身手,為“中國(guó)算力”的高質(zhì)量發(fā)展添薪續(xù)力。
點(diǎn)擊“閱讀原文”,了解更多華為數(shù)據(jù)通信資訊!
原文標(biāo)題:CCF HPC China 2023 | 華為超融合以太網(wǎng)絡(luò)解決方案榮獲CCF創(chuàng)新獎(jiǎng),助“中國(guó)算力”高質(zhì)量發(fā)展
文章出處:【微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
華為
+關(guān)注
關(guān)注
216文章
34437瀏覽量
251754
原文標(biāo)題:CCF HPC China 2023 | 華為超融合以太網(wǎng)絡(luò)解決方案榮獲CCF創(chuàng)新獎(jiǎng),助“中國(guó)算力”高質(zhì)量發(fā)展
文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論