0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

InfiniBand網(wǎng)絡(luò)在企業(yè)級(jí)數(shù)據(jù)中心和公有云上被廣泛使用

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-06-16 16:24 ? 次閱讀

最新發(fā)布的全球最強(qiáng)超級(jí)計(jì)算機(jī)排名 Top500 的榜單中,InfiniBand 網(wǎng)絡(luò)再次以絕對(duì)的數(shù)量和性能優(yōu)勢蟬聯(lián)超級(jí)計(jì)算機(jī)互連設(shè)備數(shù)量榜首,比上次排行榜的數(shù)量又有了大幅度的增長。縱觀這次的榜單,可以歸納出以下三個(gè)趨勢。

基于 InfiniBand 網(wǎng)絡(luò)的超級(jí)計(jì)算機(jī)以 197 臺(tái)的數(shù)量大幅領(lǐng)先于其它網(wǎng)絡(luò)技術(shù)。特別在 Top100 的系統(tǒng)中,基于 InfiniBand 網(wǎng)絡(luò)的超級(jí)計(jì)算機(jī)更是遙遙領(lǐng)先,InfiniBand 網(wǎng)絡(luò)已經(jīng)成為了追求性能的超級(jí)計(jì)算機(jī)的標(biāo)配。

NVIDIA 網(wǎng)絡(luò)產(chǎn)品成為 Top500 系統(tǒng)中的主流互連設(shè)備,其中超過三分之二的超級(jí)計(jì)算機(jī)在使用 NVIDIA 網(wǎng)絡(luò)互連,NVIDIA 網(wǎng)絡(luò)的性能和技術(shù)領(lǐng)先性已經(jīng)得到了廣泛認(rèn)可。

還值得一提的是,InfiniBand 網(wǎng)絡(luò)不僅在傳統(tǒng)的 HPC 業(yè)務(wù),在企業(yè)級(jí)數(shù)據(jù)中心和公有云上也已被廣泛使用。目前性能第一的企業(yè)級(jí)超級(jí)計(jì)算機(jī) NVIDIA Selene 和微軟公司的 Azure 公有云都在利用 InfiniBand 網(wǎng)絡(luò)來發(fā)揮其超高的業(yè)務(wù)性能。

網(wǎng)絡(luò)計(jì)算技術(shù)成就性能優(yōu)勢

為什么 InfiniBand 網(wǎng)絡(luò)在 Top500 中受到了如此的重視?

其性能優(yōu)勢起到了決定性的作用。

InfiniBand 網(wǎng)絡(luò)率先實(shí)現(xiàn)了通信和計(jì)算在網(wǎng)絡(luò)中的融合,是業(yè)界第一款會(huì)計(jì)算的網(wǎng)絡(luò),其先進(jìn)的網(wǎng)絡(luò)計(jì)算技術(shù),不僅大幅提升了計(jì)算性能,還通過計(jì)算的手段解決了困擾通信領(lǐng)域數(shù)十年的問題,如 Reduce 、Allreduce 、Barrier 等通信操作帶來的網(wǎng)絡(luò)擁塞問題。

這些操作會(huì)在網(wǎng)絡(luò)中產(chǎn)生瞬間的網(wǎng)絡(luò)流量突發(fā),對(duì)于無損網(wǎng)絡(luò)來說,會(huì)通過擁塞控制技術(shù)來強(qiáng)迫網(wǎng)絡(luò)降速以緩解擁塞問題;對(duì)于有損網(wǎng)絡(luò)來說,就會(huì)造成網(wǎng)絡(luò)中的大量丟包,從而導(dǎo)致網(wǎng)絡(luò)重傳數(shù)據(jù),這兩種情形都會(huì)造成業(yè)務(wù)的性能下降。

由于這些通信操作是很多業(yè)務(wù)中頻繁使用的通信方式,在過去幾十年的時(shí)間里,眾多的科研人員都在致力于優(yōu)化擁塞控制的算法和優(yōu)化通信法則來解決這個(gè)問題,但是一直沒能有突破性的進(jìn)展。

InfiniBand 網(wǎng)絡(luò)的 SHARP 網(wǎng)絡(luò)計(jì)算技術(shù)(In-Network Computing)的出現(xiàn),為業(yè)界提供了新的思路,利用計(jì)算的手段從根本上可以解決這些通信模型造成的擁塞問題,讓您的網(wǎng)絡(luò)不必再降速或者丟包,在全線速的狀態(tài)下完成數(shù)據(jù)的傳輸。

這項(xiàng)技術(shù)已經(jīng)被廣泛用到 Top500 的眾多的機(jī)器當(dāng)中。

性能隔離技術(shù)解決企業(yè)級(jí)數(shù)據(jù)中心

和云市場難題

為什么 InfiniBand 網(wǎng)絡(luò)進(jìn)入了企業(yè)級(jí)數(shù)據(jù)中心和云的市場?

InfiniBand 網(wǎng)絡(luò)帶來的性能隔離技術(shù)為其叩開了這些市場的大門。

對(duì)于業(yè)務(wù)來進(jìn)行性能隔離也是困擾網(wǎng)絡(luò)界和計(jì)算界很久的問題,現(xiàn)在我們已經(jīng)實(shí)現(xiàn)了租戶之間的安全隔離,租戶業(yè)務(wù)和業(yè)務(wù)之間的隔離,但是當(dāng)很多的租戶在同時(shí)運(yùn)行多個(gè)應(yīng)用的時(shí)候,卻無法實(shí)現(xiàn)應(yīng)用之間的性能隔離。

即使我們通過一些先進(jìn)的 QoS 技術(shù)來將計(jì)算資源和通信資源隔離開來,但卻無法實(shí)現(xiàn)業(yè)務(wù)運(yùn)行在 Bare Metal 系統(tǒng)上的性能。

InfiniBand 網(wǎng)絡(luò)極先進(jìn)的性能隔離技術(shù),除了實(shí)現(xiàn)業(yè)務(wù)的隔離之外,更是保障了業(yè)務(wù)在云上多租戶、多任務(wù)的狀態(tài)下,實(shí)現(xiàn)和在 Bare Metal 環(huán)境下一樣的性能。

這項(xiàng)技術(shù)已經(jīng)在微軟的 Azure 公有云上開始向用戶提供服務(wù)。

在當(dāng)前的算力成為服務(wù),數(shù)據(jù)中心成為計(jì)算單元的新型計(jì)算平臺(tái)下,網(wǎng)絡(luò)成為決定算力性能的關(guān)鍵因素。

單機(jī)的性能已無法滿足算力的需求,數(shù)據(jù)中心的性能以及多數(shù)據(jù)中心的綜合性能才是算力保障的基礎(chǔ)。

作為連接數(shù)據(jù)中心內(nèi)的計(jì)算單元、存儲(chǔ)單元以及各個(gè)數(shù)據(jù)中心之間的網(wǎng)絡(luò),成為算力保障的核心。

InfiniBand 網(wǎng)絡(luò)憑借其極致的性能,不斷創(chuàng)新的技術(shù)架構(gòu),在更低功耗、更少硬件設(shè)備的前提下幫助用戶實(shí)現(xiàn)了業(yè)務(wù)性能的最大化,其進(jìn)入越來越多的使用場景自是大勢所趨。

原文標(biāo)題:算力時(shí)代,網(wǎng)絡(luò)決定性能

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4986

    瀏覽量

    103046
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4778

    瀏覽量

    72123
  • InfiniBand
    +關(guān)注

    關(guān)注

    1

    文章

    29

    瀏覽量

    9197
  • 公有云
    +關(guān)注

    關(guān)注

    1

    文章

    95

    瀏覽量

    17414

原文標(biāo)題:算力時(shí)代,網(wǎng)絡(luò)決定性能

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    亞馬遜科技發(fā)布全新數(shù)據(jù)中心組件

    設(shè)計(jì)等多個(gè)方面進(jìn)行深度優(yōu)化和創(chuàng)新,成功構(gòu)建了一個(gè)更加高效節(jié)能的數(shù)據(jù)中心。這些創(chuàng)新不僅提升了數(shù)據(jù)中心的運(yùn)行效率,更為客戶AI等領(lǐng)域的進(jìn)一步創(chuàng)新提供了堅(jiān)實(shí)的基礎(chǔ)。 據(jù)悉,亞馬遜科技將在
    的頭像 發(fā)表于 12-24 15:05 ?175次閱讀

    NIDA發(fā)布《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》

    Alliance,以下簡稱 “NIDA”)攜手中國信息通信研究院等9家組織成員共同發(fā)布了《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》(以下簡稱 “技術(shù)要求”)。該技術(shù)要求明確了智算場景下數(shù)據(jù)中心網(wǎng)絡(luò)
    的頭像 發(fā)表于 12-04 11:13 ?347次閱讀

    Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片

    構(gòu)建更加靈活、可擴(kuò)展和高效的新系統(tǒng)。 自2011年幫助創(chuàng)建OCP以來,我們分享了數(shù)據(jù)中心和組件設(shè)計(jì),并開源了網(wǎng)絡(luò)編排軟件,以激發(fā)自己的數(shù)據(jù)中心和整個(gè)行業(yè)的新想法。這些想法使Meta的數(shù)據(jù)中心
    的頭像 發(fā)表于 11-25 10:05 ?377次閱讀
    Meta AI<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>用了哪家的芯片

    計(jì)算與數(shù)據(jù)中心的關(guān)系

    設(shè)備,以及冗余的數(shù)據(jù)通信連接、環(huán)境控制設(shè)備、監(jiān)控設(shè)備和各種安全裝置。數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),基于互聯(lián)網(wǎng)的相關(guān)服務(wù)增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動(dòng)態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源。
    的頭像 發(fā)表于 10-24 16:15 ?431次閱讀

    企業(yè)級(jí)數(shù)據(jù)庫的配置和管理要求匯總

    企業(yè)級(jí)數(shù)據(jù)庫配置需高性能硬件支撐,包括服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)及電源冗余,選用穩(wěn)定DBMS與操作系統(tǒng),注重索引與查詢優(yōu)化。管理上,強(qiáng)調(diào)數(shù)據(jù)安全,實(shí)施加密、訪問控制與審計(jì);確保高可用,配置容錯(cuò)機(jī)制與備份恢復(fù);監(jiān)控調(diào)優(yōu)性能,規(guī)劃容量與擴(kuò)展
    的頭像 發(fā)表于 09-27 10:50 ?197次閱讀

    一文詳解企業(yè)數(shù)據(jù)庫是干嘛的

    業(yè)數(shù)據(jù)庫是企業(yè)將其數(shù)據(jù)庫系統(tǒng)從傳統(tǒng)的本地數(shù)據(jù)中心遷移到由第三方
    的頭像 發(fā)表于 09-13 11:49 ?335次閱讀

    數(shù)據(jù)中心5G網(wǎng)絡(luò)中的演進(jìn)與發(fā)展

    幾十年來,數(shù)據(jù)中心一直位于或靠近網(wǎng)絡(luò)中心。對(duì)于企業(yè)、電信運(yùn)營商、有線電視運(yùn)營商以及近來的Google和Facebook等服務(wù)提供商而言,數(shù)據(jù)中心是IT的心臟和肌肉。
    的頭像 發(fā)表于 08-16 16:02 ?410次閱讀

    戴爾科技如何幫助巴克利改造升級(jí)數(shù)據(jù)中心

    近年來,隨著人工智能技術(shù)與企業(yè)的集成加深,一些早年建設(shè)的數(shù)據(jù)中心從能源效率、運(yùn)維管理、安全防護(hù)、網(wǎng)絡(luò)性能到技術(shù)兼容與業(yè)務(wù)支撐,均出現(xiàn)了不同程度的問題,已然無法滿足企業(yè)當(dāng)今的各種需求。于
    的頭像 發(fā)表于 07-19 10:54 ?506次閱讀

    數(shù)據(jù)中心、智算中心、超算中心,有何區(qū)別?

    模式,旨在為用戶提供高效、靈活、安全的計(jì)算服務(wù)。數(shù)據(jù)中心通過網(wǎng)絡(luò)提供彈性、可擴(kuò)展的計(jì)算、存儲(chǔ)和應(yīng)用服務(wù),其最大的特點(diǎn)是資源池化、按需服務(wù)、快速部署和靈活管理。用戶
    的頭像 發(fā)表于 06-22 08:27 ?5353次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>數(shù)據(jù)中心</b>、智算<b class='flag-5'>中心</b>、超算<b class='flag-5'>中心</b>,有何區(qū)別?

    HNS 2024:星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能

    華為數(shù)據(jù)通信創(chuàng)新峰會(huì)2024巴庫隆重舉辦,“星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能”主題論壇中,華為面向中東中亞地區(qū)發(fā)布星河AI
    的頭像 發(fā)表于 05-15 09:15 ?657次閱讀
    HNS 2024:星河AI<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>,賦AI時(shí)代新動(dòng)能

    CXL技術(shù):全面升級(jí)數(shù)據(jù)中心架構(gòu)

    達(dá)到 21.2%,并在2022年至2026年期間增加一倍多。而中國的數(shù)據(jù)規(guī)模將從2022年的23.88ZB增長至2027年的76.6ZB,復(fù)合年增長率達(dá)到26.3%,成為全球生產(chǎn)數(shù)據(jù)最多的國家。這給當(dāng)今的現(xiàn)代數(shù)據(jù)中心帶來了更多的
    發(fā)表于 04-17 16:32 ?283次閱讀

    #mpo極性 #數(shù)據(jù)中心mpo

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年04月07日 10:05:13

    介紹一種高性能計(jì)算和數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu):InfiniBand(IB)

    InfiniBand(IB)是一種高性能計(jì)算和數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu),其設(shè)計(jì)目標(biāo)是通過提供低延遲、高帶寬以及可擴(kuò)展性來滿足大規(guī)模計(jì)算和數(shù)據(jù)傳輸?shù)男枨?。讓我們深入了?/div>
    的頭像 發(fā)表于 03-13 17:14 ?1556次閱讀

    亞馬遜AWS將投資超50億美元墨西哥建立數(shù)據(jù)中心集群

    亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)墨西哥公司近日宣布,隨著企業(yè)對(duì)新技術(shù)的廣泛采用和服務(wù)需求的日益增長,公司計(jì)劃投資超過50億美元墨西哥建立一個(gè)全新
    的頭像 發(fā)表于 02-28 10:31 ?469次閱讀

    多業(yè)務(wù)光端機(jī)在數(shù)據(jù)中心的應(yīng)用:提升網(wǎng)絡(luò)效率的關(guān)鍵

    隨著計(jì)算、大數(shù)據(jù)等技術(shù)的迅猛發(fā)展,數(shù)據(jù)中心已成為現(xiàn)代社會(huì)不可或缺的基礎(chǔ)設(shè)施。數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)的高效、穩(wěn)定運(yùn)行對(duì)于整個(gè)數(shù)據(jù)中心的性能至關(guān)重要
    的頭像 發(fā)表于 02-23 14:09 ?658次閱讀