0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CCF HPC China 2023 | 超融合以太加持:北京大學(xué)高性能計(jì)算平臺(tái)將迎來大提速

華為數(shù)據(jù)通信 ? 來源:未知 ? 2023-08-25 18:10 ? 次閱讀

wKgZomToju-APKHNAABYb2B4C6Q259.png

8月25日,在青島舉行的全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)大會(huì)(CCF HPC China 2023)上,2023華為高性能計(jì)算解決方案分論壇同步舉辦。來自北京大學(xué)計(jì)算中心工程師付振新分享了“北京大學(xué)高性能計(jì)算平臺(tái)超融合以太數(shù)據(jù)中心網(wǎng)絡(luò)解決方案實(shí)踐”。

wKgZomToju-Aaw42AADGekqd3fA526.jpg

北京大學(xué)計(jì)算中心工程師 付振新 現(xiàn)場(chǎng)分享

為滿足校內(nèi)的教學(xué)科研計(jì)算需求,北京大學(xué)從2018年起陸續(xù)建設(shè)了“未名一號(hào)”、“未名生科一號(hào)”、“未名教學(xué)二號(hào)”等高性能計(jì)算集群,有力地提升了校內(nèi)的算力供應(yīng)能力。隨著承載的用戶、計(jì)算任務(wù)和數(shù)據(jù)量不斷增加,原有平臺(tái)的網(wǎng)絡(luò)基礎(chǔ)設(shè)施性能逐漸不敷使用,因此北京大學(xué)在2023年進(jìn)行了高性能計(jì)算平臺(tái)的系統(tǒng)及網(wǎng)絡(luò)改造項(xiàng)目。經(jīng)過全方位的綜合評(píng)估,北京大學(xué)最終選擇了華為超融合以太數(shù)據(jù)中心網(wǎng)絡(luò)解決方案,實(shí)現(xiàn)高性能計(jì)算平臺(tái)的大提速,真正釋放算力基礎(chǔ)設(shè)施的全部潛力。

科研創(chuàng)新迎來算力時(shí)代

進(jìn)入二十一世紀(jì)以來,人類的科學(xué)探索逐漸深入高度復(fù)雜、高度不確定性的新環(huán)境,大量龐大而復(fù)雜的科學(xué)問題需要借助超級(jí)計(jì)算機(jī)來進(jìn)行模擬、仿真、預(yù)測(cè)。從傳統(tǒng)的化學(xué)化工、生物制藥、高能物理、金融工程、社會(huì)治理,到新興的大數(shù)據(jù)、人工智能、網(wǎng)絡(luò)信息安全等等,都因強(qiáng)大算力的加持而取得了超出以往的全新進(jìn)展和成果。

北京大學(xué)早在2018年就建成了高性能計(jì)算校級(jí)公共平臺(tái),先后建成投用了“未名一號(hào)”、“未名教學(xué)二號(hào)”、“未名生科一號(hào)”等5套集群。不過隨著平臺(tái)使用人數(shù)、計(jì)算任務(wù)的增加,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的流量吞吐量和復(fù)雜性都大大增加,年均節(jié)點(diǎn)占用率都在80%以上,“未名生科一號(hào)”的節(jié)點(diǎn)占用率甚至長(zhǎng)期處于95%以上,作業(yè)時(shí)間和排隊(duì)時(shí)間變得越來越漫長(zhǎng)。針對(duì)這一問題,幾家供應(yīng)商分別提出了基于IB、RoCEv1、RoCEv2等技術(shù)打造的網(wǎng)絡(luò)方案。在北京大學(xué)組織的基準(zhǔn)測(cè)試和通用地球系統(tǒng)模式CESM、分子動(dòng)力學(xué)軟件VASP等應(yīng)用場(chǎng)景測(cè)試中,華為提供的基于RoCEv2的超融合以太數(shù)據(jù)中心網(wǎng)絡(luò)解決方案表現(xiàn)出了優(yōu)異性能,能夠有效縮短作業(yè)運(yùn)行時(shí)間和排隊(duì)時(shí)間,于是成功入選北京大學(xué)高性能計(jì)算平臺(tái)的改造項(xiàng)目。

生態(tài)開放、性能優(yōu)異:RoCE前景看好

為適應(yīng)用戶對(duì)計(jì)算效率、時(shí)延、擴(kuò)展性等方面的苛刻要求,高性能計(jì)算需要在不同節(jié)點(diǎn)之間實(shí)時(shí)高速傳遞海量數(shù)據(jù),這對(duì)服務(wù)器互連方案的要求非常高。目前業(yè)界主流的計(jì)算互聯(lián)協(xié)議有RoCE和IB兩種,其中IB具有高吞吐、低時(shí)延、高可靠性等特點(diǎn),技術(shù)先進(jìn),不過主要掌握在英特爾、IBM、英偉達(dá)等企業(yè)手中,技術(shù)和產(chǎn)品生態(tài)都比較封閉,成本高昂。RoCE則是一種基于以太網(wǎng)絡(luò)的RDMA網(wǎng)絡(luò)協(xié)議,生態(tài)相對(duì)開放,而且著力于實(shí)現(xiàn)網(wǎng)絡(luò)的無損傳輸,深受各國(guó)高性能計(jì)算和AI等產(chǎn)業(yè)歡迎,被認(rèn)為是未來全球數(shù)字化的重要路徑。

華為基于RoCE的超融合以太技術(shù),具有完善的流量控制、擁塞控制、流量調(diào)度和應(yīng)用加速功能,獨(dú)家實(shí)現(xiàn)了以太網(wǎng)0丟包。此外,華為還開發(fā)了在網(wǎng)計(jì)算(INC)技術(shù)有效提高集合通信效率、降低總的任務(wù)完成時(shí)間,在時(shí)延方面比IB略勝一籌。

在北京大學(xué)組織的測(cè)試中,共有TCP/IP、IB、RoCEv2三種方案,分別用基準(zhǔn)測(cè)試工具Linpack和地球系統(tǒng)模式CESM、分子動(dòng)力學(xué)軟件VASP等應(yīng)用進(jìn)行實(shí)驗(yàn)。結(jié)果表明,承載VASP應(yīng)用時(shí),華為100GE RoCEv2略優(yōu)于IB;承載Linpack和CESM時(shí),華為方案與IB性能表現(xiàn)基本一致。此前權(quán)威評(píng)測(cè)機(jī)構(gòu)Tolly也曾做過測(cè)試,在擁塞條件下的帶寬和時(shí)延等基礎(chǔ)性能測(cè)試、MPI計(jì)算性能基準(zhǔn)測(cè)試以及HPC應(yīng)用測(cè)試中,華為方案的性能都優(yōu)于其它廠商的IB組網(wǎng)方案。這些實(shí)測(cè)結(jié)果都表明,華為超融合以太網(wǎng)絡(luò)解決方案可完全可以代替IB方案。

wKgZomTojvCAATpjAAGCrMSf09s160.png

支持算力建設(shè),服務(wù)數(shù)字未來

近年來,華為超融合以太網(wǎng)絡(luò)解決方案已經(jīng)在國(guó)內(nèi)外多個(gè)高性能計(jì)算平臺(tái)項(xiàng)目中落地應(yīng)用。比如在2022年,華為超融合以太網(wǎng)絡(luò)解決方案還在武漢超算中心、阿聯(lián)酋高級(jí)國(guó)家研究和教育網(wǎng)絡(luò)Ankabut項(xiàng)目中投入了應(yīng)用,因其卓越性能而得到了客戶的高度評(píng)價(jià)。

在北京大學(xué)高性能計(jì)算平臺(tái)的前期項(xiàng)目中,“未名二號(hào)”集群就采用了華為100GE RoCE無損以太網(wǎng)絡(luò)方案?!拔疵?hào)”由240臺(tái)CPU計(jì)算節(jié)點(diǎn)和30臺(tái)GPU計(jì)算節(jié)點(diǎn)組成,后續(xù)可擴(kuò)容至340臺(tái)CPU計(jì)算節(jié)點(diǎn)。與IB方案相比,北京大學(xué)高性能計(jì)算平臺(tái)管理人員發(fā)現(xiàn)華為RoCE方案無需用戶改變使用習(xí)慣,以太網(wǎng)帶寬增加更快,性能也超出預(yù)期。

隨著HPC和AI應(yīng)用的快速發(fā)展,對(duì)網(wǎng)絡(luò)帶寬吞吐的需求將不斷增長(zhǎng),從100GE、200GE、400GE到800GE等更高速率不斷演進(jìn)的以太網(wǎng)絡(luò)無疑是最佳的承載技術(shù)。與此同時(shí),RoCE無損以太網(wǎng)絡(luò)在時(shí)延、吞吐量、可靠性、編解碼和調(diào)制技術(shù)等方面也在不斷進(jìn)步,使得無損以太網(wǎng)絡(luò)的總體性能不斷提高,未來有望在自動(dòng)駕駛、智能制造、生物科技、金融等更多行業(yè)和領(lǐng)域投入應(yīng)用。

wKgZomTojvGAOb8aAAEeyHFS5w4874.png

wKgZomTojvGAUssyAABH79rerUY727.gif 點(diǎn)擊“閱讀原文”,了解更多華為數(shù)據(jù)通信資訊!


原文標(biāo)題:CCF HPC China 2023 | 超融合以太加持:北京大學(xué)高性能計(jì)算平臺(tái)將迎來大提速

文章出處:【微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    34440

    瀏覽量

    251770

原文標(biāo)題:CCF HPC China 2023 | 超融合以太加持:北京大學(xué)高性能計(jì)算平臺(tái)將迎來大提速

文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    維諦技術(shù)(Vertiv):未來HPC,你想象不到的酷炫變革!

    隨著AI技術(shù)的迅猛發(fā)展,高性能計(jì)算HPC)也迎來了新的變革浪潮。在2024全球超級(jí)計(jì)算機(jī)Green500排行榜上,位列前三的
    的頭像 發(fā)表于 10-30 11:12 ?255次閱讀
    維諦技術(shù)(Vertiv):未來<b class='flag-5'>HPC</b>,你想象不到的酷炫變革!

    科研計(jì)算HPC平臺(tái)是什么

    高性能計(jì)算平臺(tái)HPC平臺(tái))是一個(gè)利用由成千上萬個(gè)處理器核心組成的超級(jí)計(jì)算機(jī)或
    的頭像 發(fā)表于 10-21 10:43 ?187次閱讀

    RISC-V AI技術(shù)正式納入北京大學(xué)研究生課程

    課堂此次合作是產(chǎn)學(xué)研結(jié)合的一次重要實(shí)踐。基于北京大學(xué)集成電路學(xué)院開設(shè)的研究生課程《現(xiàn)代SoC芯片架構(gòu)設(shè)計(jì)》,希姆計(jì)算北京大學(xué)達(dá)成課程合作,RISC-VAI核心
    的頭像 發(fā)表于 10-18 08:09 ?389次閱讀
    RISC-V AI技術(shù)正式納入<b class='flag-5'>北京大學(xué)</b>研究生課程

    北京大學(xué)謝濤:基于RISC-V構(gòu)建AI算力的優(yōu)勢(shì)和兩種模式

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)第四屆滴水湖中國(guó)RISC-V產(chǎn)業(yè)論壇上,北京大學(xué)講席教授、RISC-V國(guó)際基金會(huì)人工智能與機(jī)器學(xué)習(xí)專委會(huì)主席謝濤教授進(jìn)行了題為《萬物智聯(lián)時(shí)代的RISC-V+AI算力之路
    的頭像 發(fā)表于 08-19 10:41 ?1233次閱讀

    帶你了解什么是高性能計(jì)算HPC

    受益于HPC更高的速度處理大量數(shù)據(jù)的能力,全球正在進(jìn)入HPC大周期,高性能計(jì)算的發(fā)展水平已經(jīng)成為衡量一個(gè)國(guó)家綜合實(shí)力和高科技發(fā)展水平的重要標(biāo)志,美國(guó)、歐盟、日本、英國(guó)都高度重視
    的頭像 發(fā)表于 07-20 08:28 ?592次閱讀
    帶你了解什么是<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>(<b class='flag-5'>HPC</b>)

    超高“質(zhì)”量——CCF HPC China 2024主題論壇正式公布

    積蓄點(diǎn)點(diǎn)星火,以待磅礴進(jìn)發(fā),第 20 屆 CCF 全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)(以下簡(jiǎn)稱“CCF HPC Ch
    的頭像 發(fā)表于 07-19 09:55 ?327次閱讀
    超高“質(zhì)”量——<b class='flag-5'>CCF</b> <b class='flag-5'>HPC</b> <b class='flag-5'>China</b> 2024主題論壇正式公布

    引領(lǐng)高校原生人才新生態(tài) 北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

    6月22日,北京大學(xué)與華為技術(shù)有限公司在北京簽署合作協(xié)議,“北京大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心”(以下簡(jiǎn)稱“卓越中心”)正式成立揭牌。雙方圍繞卓越中心著力推動(dòng)科研
    的頭像 發(fā)表于 06-25 16:23 ?414次閱讀
    引領(lǐng)高校原生人才新生態(tài) <b class='flag-5'>北京大學(xué)</b>鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

    潤(rùn)石科技董事長(zhǎng)參加北京大學(xué)集成電路學(xué)院“未名·芯”論壇

    2024年5月5日,在紀(jì)念五四運(yùn)動(dòng)105周年,也是北京大學(xué)建校126周年之際,潤(rùn)石科技董事長(zhǎng)張明先生受北京大學(xué)集成電路學(xué)院校友返校、共敘情誼活動(dòng)邀請(qǐng)
    的頭像 發(fā)表于 05-11 14:06 ?1138次閱讀

    北京大學(xué)講座 | 大模型時(shí)代的軟件研發(fā):技術(shù)、范式與工具

    3 月 10 日,華為云與北京大學(xué)合作在軟件和微電子學(xué)院舉辦了此次關(guān)于研發(fā)大模型的講座,這不僅是華為云與北大第一次在 AI 大模型上進(jìn)行產(chǎn)教融合,更是雙方對(duì)于推動(dòng)大模型研發(fā)與應(yīng)用,培養(yǎng)相關(guān)技術(shù)人才
    的頭像 發(fā)表于 05-09 23:00 ?522次閱讀
    <b class='flag-5'>北京大學(xué)</b>講座 | 大模型時(shí)代的軟件研發(fā):技術(shù)、范式與工具

    北京大學(xué)-知存科技存算一體聯(lián)合實(shí)驗(yàn)室揭牌,開啟知存科技產(chǎn)學(xué)研融合戰(zhàn)略新升級(jí)

    、知存科技首席科學(xué)家郭昕婕博士及企業(yè)研發(fā)相關(guān)負(fù)責(zé)人參加了現(xiàn)場(chǎng)揭牌儀式。面向多模態(tài)大模型時(shí)代產(chǎn)業(yè)發(fā)展新需求,雙方攜手踏上探索存算一體技術(shù)前沿發(fā)展和應(yīng)用的新征程。 ? ? 北京大學(xué)集成電路學(xué)院院長(zhǎng)蔡一茂(左二)、北京大學(xué)
    的頭像 發(fā)表于 05-07 19:31 ?1432次閱讀
    <b class='flag-5'>北京大學(xué)</b>-知存科技存算一體聯(lián)合實(shí)驗(yàn)室揭牌,開啟知存科技產(chǎn)學(xué)研<b class='flag-5'>融合</b>戰(zhàn)略新升級(jí)

    北京大學(xué)問世世界最薄光學(xué)晶體:氮化硼晶體

    據(jù)悉,光學(xué)晶體被譽(yù)為激光技術(shù)的核心部件,廣泛運(yùn)用于微納加工、量子光源及生物檢測(cè)等領(lǐng)域。北京大學(xué)科研團(tuán)隊(duì)通過不斷嘗試,最終確定氮化硼作為最適合研發(fā)新型激光器的材料。
    的頭像 發(fā)表于 04-26 10:41 ?727次閱讀

    北京大學(xué)高性能計(jì)算綜合能力競(jìng)賽圓滿結(jié)束

    近日,第一屆北京大學(xué)高性能計(jì)算綜合能力競(jìng)賽(HPCGame)舉辦了閉幕式暨頒獎(jiǎng)典禮。在全體參賽選手的積極參與和精彩角逐下,本屆共有來自87所高校,890名選手報(bào)名參賽。RISC-V新架構(gòu)獎(jiǎng)獲獎(jiǎng)選手共
    的頭像 發(fā)表于 04-14 08:34 ?788次閱讀
    <b class='flag-5'>北京大學(xué)</b><b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>綜合能力競(jìng)賽圓滿結(jié)束

    百川智能與北京大學(xué)共建通用人工智能聯(lián)合實(shí)驗(yàn)室

    近日,百川智能與北京大學(xué)攜手合作,共同簽署了“北大——百川通用人工智能聯(lián)合實(shí)驗(yàn)室”的共建協(xié)議,標(biāo)志著雙方在人工智能領(lǐng)域邁出了堅(jiān)實(shí)的合作步伐。
    的頭像 發(fā)表于 03-21 11:45 ?907次閱讀

    北京大學(xué)首次硬件實(shí)現(xiàn)電容耦合的VO2相變振蕩動(dòng)力學(xué)計(jì)算系統(tǒng)

    北京大學(xué)集成電路學(xué)院楊玉教授課題組首次硬件實(shí)現(xiàn)了電容耦合的VO2相變振蕩動(dòng)力學(xué)計(jì)算系統(tǒng)。
    的頭像 發(fā)表于 02-28 11:28 ?985次閱讀
    <b class='flag-5'>北京大學(xué)</b>首次硬件實(shí)現(xiàn)電容耦合的VO2相變振蕩動(dòng)力學(xué)<b class='flag-5'>計(jì)算</b>系統(tǒng)

    什么是HPC高性能計(jì)算

    高性能計(jì)算(HighPerformanceComputing,簡(jiǎn)稱HPC),是指利用集群、網(wǎng)格、算等計(jì)算機(jī)技術(shù),通過合理地組織
    的頭像 發(fā)表于 02-19 13:27 ?861次閱讀
    什么是<b class='flag-5'>HPC</b><b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>