0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)中心加速網(wǎng)絡(luò)技術(shù)優(yōu)勢(shì)與實(shí)施策略

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-03-07 14:37 ? 次閱讀

加速網(wǎng)絡(luò)CPU、GPU、DPU(數(shù)據(jù)處理器)或 SuperNIC 組合到專為設(shè)計(jì)用于優(yōu)化網(wǎng)絡(luò)工作負(fù)載的加速計(jì)算網(wǎng)絡(luò)架構(gòu)。它使用專用硬件來卸載要求嚴(yán)苛的任務(wù),以增強(qiáng)服務(wù)器功能。隨著 AI 和其他新工作負(fù)載的復(fù)雜性和規(guī)模不斷增加,對(duì)加速網(wǎng)絡(luò)的需求變得至關(guān)重要。

數(shù)據(jù)中心作為新的計(jì)算單元,隨著網(wǎng)絡(luò)服務(wù)對(duì) CPU 壓力的增加,現(xiàn)代工作負(fù)載對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施提出了新的挑戰(zhàn)。網(wǎng)絡(luò)基礎(chǔ)設(shè)施需要具備敏捷性、自動(dòng)化和可編程性的框架,并配備加速器和卸載功能,這些是充分發(fā)揮人工智能技術(shù)潛力和推動(dòng)創(chuàng)新的關(guān)鍵。

本文將探討加速網(wǎng)絡(luò)技術(shù)在數(shù)據(jù)中心中的優(yōu)勢(shì)和實(shí)施策略,并重點(diǎn)介紹其在提升性能、可擴(kuò)展性和效率方面的作用。

加速您的網(wǎng)絡(luò)

網(wǎng)絡(luò)加速需要優(yōu)化網(wǎng)絡(luò)的各個(gè)方面,包括處理器、網(wǎng)卡(NIC)、交換機(jī)、線纜、光纖通信和網(wǎng)絡(luò)加速軟件。利用無損網(wǎng)絡(luò)、遠(yuǎn)程直接內(nèi)存訪問(RDMA)、動(dòng)態(tài)路由、擁塞控制、性能隔離和網(wǎng)絡(luò)計(jì)算,將幫助企業(yè)充分發(fā)揮現(xiàn)代應(yīng)用程序(包括 AI)的潛力。

通過合理控制數(shù)據(jù)注入速率,可以顯著提高共享網(wǎng)絡(luò)的效率。在處理大規(guī)模數(shù)據(jù)流時(shí),實(shí)施動(dòng)態(tài)路由算法以太網(wǎng)交換機(jī)能夠動(dòng)態(tài)負(fù)載均衡整個(gè)網(wǎng)絡(luò)中的數(shù)據(jù),避免擁塞并降低延遲。交換機(jī)的多路徑和數(shù)據(jù)包分發(fā)技術(shù)可以進(jìn)一步提升網(wǎng)絡(luò)效率,確保數(shù)據(jù)及時(shí)到達(dá),并最大程度減少瓶頸。這些技術(shù)有助于防止交換機(jī)與 NIC 或 DPU 之間的數(shù)據(jù)沖突,而流量隔離技術(shù)通過防止一個(gè)數(shù)據(jù)流對(duì)其他數(shù)據(jù)流產(chǎn)生負(fù)面影響,從而確保數(shù)據(jù)的及時(shí)交付。

另一種優(yōu)化技術(shù)是部署 SuperNIC 和 DPU。SuperNIC 是一種適用于 AI 云數(shù)據(jù)中心的網(wǎng)絡(luò)加速器,可在 GPU 服務(wù)器之間提供可靠、無縫的連接。DPU 是一種新興的處理器類別,可實(shí)現(xiàn)增強(qiáng)、加速的網(wǎng)絡(luò)。在 SuperNIC 和 DPU 的幫助下,可以從主機(jī)處理器中卸載工作負(fù)載,以加速通信,從而使數(shù)據(jù)中心能夠應(yīng)對(duì)不斷增長的數(shù)據(jù)移動(dòng)需求。

要實(shí)現(xiàn)加速網(wǎng)絡(luò),請(qǐng)考慮以下技術(shù)。

加速服務(wù)

工作負(fù)載經(jīng)歷了重大的范式轉(zhuǎn)變,過渡到去中心化,通過容器和微分段分割工作負(fù)載。這導(dǎo)致服務(wù)器之間的網(wǎng)絡(luò)帶寬(東西向流量)大幅增加。

AI 工作負(fù)載是一個(gè)分布式計(jì)算問題,需要使用多個(gè)互連的服務(wù)器或節(jié)點(diǎn)。這會(huì)給網(wǎng)絡(luò)和 CPU 帶來巨大壓力。工作負(fù)載的去中心化需要重新檢查網(wǎng)絡(luò)基礎(chǔ)設(shè)施,從而通過添加加速器使 CPU 和 GPU 擺脫處理網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù)的負(fù)擔(dān)。這使得 CPU 能夠?qū)W⒂趹?yīng)用程序工作負(fù)載。加速可確保這些節(jié)點(diǎn)之間的高速、低時(shí)延數(shù)據(jù)傳輸,并實(shí)現(xiàn)高效的工作負(fù)載分配和更快的模型訓(xùn)練。

網(wǎng)絡(luò)抽象

向高度虛擬化數(shù)據(jù)中心和云模型的轉(zhuǎn)變正在給傳統(tǒng)網(wǎng)絡(luò)帶來壓力。傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)的設(shè)計(jì)并不是為了支持當(dāng)今虛擬化工作負(fù)載的動(dòng)態(tài)特性。網(wǎng)絡(luò)抽象(包括網(wǎng)絡(luò)疊加)可以在物理網(wǎng)絡(luò)之上運(yùn)行多個(gè)獨(dú)立的、分離的虛擬化網(wǎng)絡(luò)層。這些對(duì)于提供靈活性、擴(kuò)展性和加速至關(guān)重要。但是,如果實(shí)施不當(dāng),它們可能會(huì)阻礙網(wǎng)絡(luò)流量。

網(wǎng)絡(luò)優(yōu)化

收集和處理的大量數(shù)據(jù)已將工作負(fù)載推向以數(shù)據(jù)為中心的時(shí)代。大型數(shù)據(jù)集的可用性與機(jī)器學(xué)習(xí)和生成式 AI 等技術(shù)進(jìn)步相結(jié)合,增加了對(duì)更多數(shù)據(jù)的需求,以滿足學(xué)習(xí)算法的需求。這種數(shù)據(jù)爆炸式增長的后果是需要移動(dòng)、處理、檢索和存儲(chǔ)大型數(shù)據(jù)集。

無損網(wǎng)絡(luò)可以保證準(zhǔn)確的數(shù)據(jù)傳輸,而不會(huì)造成任何丟失或損壞,對(duì)于移動(dòng)、處理、檢索和存儲(chǔ)這些大型數(shù)據(jù)集至關(guān)重要。RDMA 技術(shù)通過在不涉及 CPU 的情況下實(shí)現(xiàn)內(nèi)存位置之間的直接數(shù)據(jù)傳輸來提高網(wǎng)絡(luò)性能。無損網(wǎng)絡(luò)和 RDMA 的結(jié)合可以優(yōu)化數(shù)據(jù)傳輸效率,減少 CPU 和 GPU 空閑時(shí)間,從而實(shí)現(xiàn)高效的數(shù)據(jù)移動(dòng),以滿足現(xiàn)代應(yīng)用程序的需求。

端到端堆棧優(yōu)化

現(xiàn)代工作負(fù)載具有獨(dú)特的網(wǎng)絡(luò)流量模式。傳統(tǒng)工作負(fù)載生成的流量模式具有多流、小數(shù)據(jù)包和低方差?,F(xiàn)代應(yīng)用程序的流量涉及大數(shù)據(jù)包、少量流和高方差,包括大象流和流量模式的頻繁變化。

動(dòng)態(tài)路由算法用于動(dòng)態(tài)負(fù)載均衡在整個(gè)網(wǎng)絡(luò)中的數(shù)據(jù),從而防止這些新流量模式的擁塞和高時(shí)延。顯式擁塞通知(ECN)等擁塞控制機(jī)制還可確保高效的數(shù)據(jù)流并最大限度地減少性能下降。為此,必須使用優(yōu)化的端到端堆棧來構(gòu)建網(wǎng)絡(luò),以加速新的流量模式。

網(wǎng)絡(luò)計(jì)算

現(xiàn)代工作負(fù)載的大型數(shù)據(jù)集需要對(duì)高度并行化的算法進(jìn)行超快速處理,這使其更加復(fù)雜。隨著計(jì)算需求的增加,網(wǎng)絡(luò)計(jì)算通過提供基于硬件的集合通信操作加速,有效地將集合操作從 CPU 卸載到網(wǎng)絡(luò)。這一功能顯著提高了分布式 AI 模型訓(xùn)練的性能,減少了通信開銷,并加速了模型收斂。從而消除了在端點(diǎn)之間多次發(fā)送數(shù)據(jù)的需求,并加速了網(wǎng)絡(luò)性能。

網(wǎng)絡(luò)加速可降低 CPU 利用率,為 CPU 處理應(yīng)用程序工作負(fù)載留出更多容量。它還可以減少抖動(dòng)以改善數(shù)據(jù)流,并提供更高的整體吞吐量,從而更快地處理更多數(shù)據(jù)。

總 結(jié)

網(wǎng)絡(luò)加速技術(shù)不斷發(fā)展,并變得更加專業(yè)。最新的演進(jìn)將解決 AI 工作負(fù)載問題,這些工作負(fù)載需要一致、可預(yù)測的性能以及能夠運(yùn)行多租戶環(huán)境的計(jì)算和能效。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10878

    瀏覽量

    212162
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    21

    文章

    2645

    瀏覽量

    99785
  • 光纖通信
    +關(guān)注

    關(guān)注

    20

    文章

    492

    瀏覽量

    44769
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4806

    瀏覽量

    72208
  • 數(shù)據(jù)處理器

    關(guān)注

    0

    文章

    26

    瀏覽量

    8668

原文標(biāo)題:借助加速網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)中心現(xiàn)代化

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NIDA發(fā)布《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》

    Alliance,以下簡稱 “NIDA”)攜手中國信息通信研究院等9家組織成員共同發(fā)布了《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》(以下簡稱 “技術(shù)要求”)。該
    的頭像 發(fā)表于 12-04 11:13 ?380次閱讀

    Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片

    ? 在Meta,我們相信開放的硬件會(huì)推動(dòng)創(chuàng)新。在當(dāng)今世界,越來越多的數(shù)據(jù)中心基礎(chǔ)設(shè)施致力于支持新興的AI技術(shù),開放硬件在協(xié)助分解方面發(fā)揮著重要作用。通過將傳統(tǒng)數(shù)據(jù)中心技術(shù)分解為其核心組
    的頭像 發(fā)表于 11-25 10:05 ?424次閱讀
    Meta AI<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>用了哪家的芯片

    當(dāng)今數(shù)據(jù)中心技術(shù)趨勢(shì)

    計(jì)算 數(shù)據(jù)中心的首要趨勢(shì)是追求更高的效能和性能。隨著數(shù)字化轉(zhuǎn)型的深入推進(jìn),各行業(yè)對(duì)數(shù)據(jù)中心的處理能力和存儲(chǔ)容量提出了更高要求。為了滿足這些需求,數(shù)據(jù)中心正不斷引入新技術(shù),如高性能計(jì)算(
    的頭像 發(fā)表于 10-24 15:15 ?492次閱讀

    簡述數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的演變

    隨著全球?qū)θ斯ぶ悄埽ˋI)的需求不斷增長,數(shù)據(jù)中心作為AI計(jì)算的重要基礎(chǔ)設(shè)施,其網(wǎng)絡(luò)架構(gòu)與連接技術(shù)的發(fā)展變得尤為關(guān)鍵。
    的頭像 發(fā)表于 10-22 16:23 ?331次閱讀

    數(shù)據(jù)中心液冷需求、技術(shù)及實(shí)際應(yīng)用

    夏日炎炎,數(shù)據(jù)中心制冷技術(shù)全新升級(jí),液冷散熱,讓服務(wù)器清涼一夏。本文將帶您一起探索數(shù)據(jù)中心液冷需求、技術(shù)及實(shí)際應(yīng)用。 1 數(shù)據(jù)中心液冷需求
    的頭像 發(fā)表于 06-19 11:12 ?1099次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>液冷需求、<b class='flag-5'>技術(shù)</b>及實(shí)際應(yīng)用

    HNS 2024:星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能

    華為數(shù)據(jù)通信創(chuàng)新峰會(huì)2024在巴庫隆重舉辦,在“星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能”主題論壇中,華為面向中東中亞地區(qū)發(fā)布星河AI數(shù)據(jù)中心網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-15 09:15 ?674次閱讀
    HNS 2024:星河AI<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>,賦AI時(shí)代新動(dòng)能

    #mpo極性 #數(shù)據(jù)中心mpo

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年04月07日 10:05:13

    #mpo光纖跳線 #數(shù)據(jù)中心光纖跳線

    光纖數(shù)據(jù)中心
    jf_51241005
    發(fā)布于 :2024年03月22日 10:18:31

    模塊化機(jī)房:數(shù)據(jù)中心的未來

    隨著數(shù)字化轉(zhuǎn)型加速,數(shù)據(jù)中心已成為企業(yè)運(yùn)營的核心。傳統(tǒng)的數(shù)據(jù)中心面臨空間利用不足、能源效率低下、擴(kuò)展性差和維護(hù)成本高等問題。模塊化機(jī)房應(yīng)運(yùn)而生,它不僅克服了傳統(tǒng)設(shè)計(jì)的局限,還為數(shù)據(jù)中心
    的頭像 發(fā)表于 03-12 17:26 ?939次閱讀

    數(shù)據(jù)中心配電能效精細(xì)化建設(shè)策略研究與趨勢(shì)分析

    數(shù)據(jù)中心配電能效精細(xì)化建設(shè)策略研究與趨勢(shì)分析 張穎姣 安科瑞電氣股份有限公司? 上海嘉定? 201801 摘要:通過分析用戶需求、建設(shè)和運(yùn)維等多方對(duì)數(shù)據(jù)中心建設(shè)的要求;結(jié)合國家政策、數(shù)據(jù)中心
    的頭像 發(fā)表于 03-11 17:00 ?377次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>配電能效精細(xì)化建設(shè)<b class='flag-5'>策略</b>研究與趨勢(shì)分析

    #MPO預(yù)端接 #數(shù)據(jù)中心機(jī)房 #機(jī)房布線

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年03月01日 11:12:47

    #永久鏈路 #信道測試 #數(shù)據(jù)中心

    數(shù)據(jù)中心
    jf_51241005
    發(fā)布于 :2024年02月23日 10:17:58

    #緊套光纜 #松套光纜 #數(shù)據(jù)中心

    數(shù)據(jù)中心光纜
    jf_51241005
    發(fā)布于 :2024年01月26日 09:44:11

    微模塊數(shù)據(jù)中心優(yōu)勢(shì)

    微模塊數(shù)據(jù)中心是以模塊化、標(biāo)準(zhǔn)化的架構(gòu)和高效高可靠的UPS、精密空調(diào)等靈活組合于一體打造的模塊化數(shù)據(jù)中心基礎(chǔ)設(shè)施,可實(shí)現(xiàn)靈活快速部署、高效節(jié)省、智能管理等優(yōu)點(diǎn)成為企業(yè)未來數(shù)據(jù)中心建設(shè)的關(guān)注焦點(diǎn)。
    的頭像 發(fā)表于 01-19 13:53 ?680次閱讀

    #光纜水峰 #綜合布線光纜 #數(shù)據(jù)中心

    數(shù)據(jù)中心光纜
    jf_51241005
    發(fā)布于 :2024年01月15日 09:43:26