0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)述數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的演變

汽車電子設(shè)計(jì) ? 來源:芝能科技 ? 2024-10-22 16:23 ? 次閱讀

芝能科技出品

隨著全球?qū)?a target="_blank">人工智能AI)的需求不斷增長(zhǎng),數(shù)據(jù)中心作為AI計(jì)算的重要基礎(chǔ)設(shè)施,其網(wǎng)絡(luò)架構(gòu)與連接技術(shù)的發(fā)展變得尤為關(guān)鍵。

本文將簡(jiǎn)述數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的演變及其在AI應(yīng)用中的重要性,并探討兩種主流網(wǎng)絡(luò)架構(gòu)——InfiniBand和RoCEv2。

3001c69c-9049-11ef-a511-92fbcf53809c.png

AI生成內(nèi)容(AIGC)市場(chǎng)在2024年迎來了爆發(fā)式增長(zhǎng)。OpenAI發(fā)布的Sora和國(guó)內(nèi)的Kimi大模型引領(lǐng)了這一潮流。

預(yù)計(jì)到2024年,全球?qū)IGC解決方案的投資將達(dá)到200億美元,并在2027年超過1400億美元。這種增長(zhǎng)對(duì)AI網(wǎng)絡(luò)架構(gòu)提出了更高的要求,因其需要支撐大規(guī)模AI模型的訓(xùn)練和推理。

01 傳統(tǒng)云計(jì)算與AI智算中心網(wǎng)絡(luò)架構(gòu)對(duì)比

302f3e88-9049-11ef-a511-92fbcf53809c.png

●傳統(tǒng)云計(jì)算數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)

傳統(tǒng)云計(jì)算數(shù)據(jù)中心主要基于南北向流量模型設(shè)計(jì),即對(duì)外提供服務(wù)的流量較大,而內(nèi)部東西向流量較小。

這種架構(gòu)存在一些不足,例如高帶寬收斂比、較高的互訪時(shí)延和網(wǎng)卡帶寬低。這些問題導(dǎo)致傳統(tǒng)架構(gòu)無(wú)法滿足AI計(jì)算對(duì)高帶寬和低時(shí)延的要求。

304aa448-9049-11ef-a511-92fbcf53809c.png

●AI智算中心網(wǎng)絡(luò)架構(gòu)

AI智算中心通常采用Fat-Tree(胖樹)架構(gòu),通過1:1的無(wú)收斂配置,確保了高性能和無(wú)阻塞傳輸。此架構(gòu)能夠有效降低時(shí)延,并支持大規(guī)模GPU集群。

此外,AI網(wǎng)絡(luò)架構(gòu)中常用的RDMA技術(shù),允許主機(jī)之間直接內(nèi)存訪問,顯著降低了同集群內(nèi)部的時(shí)延,提高了網(wǎng)絡(luò)性能。

30863bc0-9049-11ef-a511-92fbcf53809c.png

02 AI智算網(wǎng)絡(luò)的兩大主流架構(gòu)

●InfiniBand網(wǎng)絡(luò)架構(gòu)

InfiniBand網(wǎng)絡(luò)通過子網(wǎng)管理器(SM)進(jìn)行集中管理,使用信用令牌機(jī)制確保數(shù)據(jù)在有足夠緩沖區(qū)時(shí)才發(fā)送,從而避免數(shù)據(jù)丟包。其自適應(yīng)路由技術(shù)能夠根據(jù)數(shù)據(jù)包情況動(dòng)態(tài)選擇路徑,實(shí)現(xiàn)最佳負(fù)載均衡。

30c33f02-9049-11ef-a511-92fbcf53809c.png

●RoCEv2網(wǎng)絡(luò)架構(gòu)

RoCEv2(RDMA over Converged Ethernet)采用以太網(wǎng)和UDP傳輸層,具有更好的可擴(kuò)展性和部署靈活性。其流控機(jī)制包括優(yōu)先流控制(PFC)和顯式擁塞通知(ECN),結(jié)合數(shù)據(jù)中心量化擁塞通知(DCQCN),能夠在保持網(wǎng)絡(luò)高效運(yùn)行的同時(shí)避免數(shù)據(jù)丟失。

30e7a2fc-9049-11ef-a511-92fbcf53809c.png

隨著AI計(jì)算需求的增加,800G和1.6T的主流傳輸方案逐漸成為市場(chǎng)熱點(diǎn)。

這些方案在實(shí)際應(yīng)用中,尤其是單模傳輸和預(yù)端接技術(shù)方面,提供了創(chuàng)新的解決方案。

同時(shí),為應(yīng)對(duì)高能耗高熱量問題,液冷解決方案也在AI數(shù)據(jù)中心得到廣泛應(yīng)用。

310dcf7c-9049-11ef-a511-92fbcf53809c.png

隨著光模塊技術(shù)向 400G 及更高速率邁進(jìn),挑戰(zhàn)不單是提升數(shù)據(jù)傳輸速度,還包括功耗和成本。

從 2007 年的 10G 光模塊僅需 1W 功率,到如今 400G 及 800G光模塊功耗接近 30W,隨著速率的每一次迭代,功耗也相應(yīng)攀升。

在滿載狀態(tài)下,一個(gè)交換機(jī)可能搭載多達(dá)數(shù)十個(gè)光模塊,48 個(gè)光模塊的總功耗可達(dá) 1440W,而光模塊通常占整機(jī)功耗的 40%以上,導(dǎo)致整個(gè)智算中心的能耗可能超過 3000W。

液冷技術(shù)因其高導(dǎo)熱性能和高效散熱能力,已成為降低網(wǎng)絡(luò)系統(tǒng)能源功耗的廣泛認(rèn)可解決方案,特別適用于高功率密度數(shù)據(jù)中心,但需解決冷卻液腐蝕性和壓強(qiáng)差等挑戰(zhàn)以確保系統(tǒng)安全。

313455ac-9049-11ef-a511-92fbcf53809c.png

小結(jié)

AI智算數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)和連接技術(shù)正朝著更高效、更低時(shí)延和更高帶寬的方向發(fā)展。無(wú)論是InfiniBand還是RoCEv2,這些技術(shù)的進(jìn)步都在為AI的發(fā)展提供堅(jiān)實(shí)的基礎(chǔ)。

在未來,隨著技術(shù)的不斷創(chuàng)新,AI智算網(wǎng)絡(luò)架構(gòu)將進(jìn)一步優(yōu)化,推動(dòng)AI應(yīng)用的廣泛普及和深入發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4826

    瀏覽量

    72238
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31225

    瀏覽量

    269579
  • 網(wǎng)絡(luò)架構(gòu)

    關(guān)注

    1

    文章

    94

    瀏覽量

    12602

原文標(biāo)題:數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)及連接技術(shù)

文章出處:【微信號(hào):QCDZSJ,微信公眾號(hào):汽車電子設(shè)計(jì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    銳捷網(wǎng)絡(luò)中標(biāo)中國(guó)聯(lián)通數(shù)據(jù)中心集采項(xiàng)目

      近日,來自中國(guó)聯(lián)通的官方信息顯示,2016~2017年中國(guó)聯(lián)通數(shù)據(jù)中心交換機(jī)設(shè)備采購(gòu)招標(biāo)工作已經(jīng)完成。針對(duì)不同規(guī)模的數(shù)據(jù)中心場(chǎng)景,本次招標(biāo)共分為3個(gè)標(biāo)段,銳捷網(wǎng)絡(luò)憑借雄厚的技術(shù)積累和創(chuàng)新能力,在
    發(fā)表于 01-24 10:14

    銳捷助互聯(lián)網(wǎng)數(shù)據(jù)中心網(wǎng)絡(luò)自動(dòng)化、可視化運(yùn)維

    設(shè)計(jì)模式等各個(gè)方面上,國(guó)內(nèi)廠商已獲得相應(yīng)的重要突破,逐步從技術(shù)跟隨者轉(zhuǎn)變?yōu)榧夹g(shù)引領(lǐng)者。銳捷網(wǎng)絡(luò)互聯(lián)網(wǎng)系統(tǒng)部總經(jīng)理吳吉朋指出,以銳捷為例,前幾年在互聯(lián)網(wǎng)數(shù)據(jù)中心IT架構(gòu)中,銳捷還是以CDN場(chǎng)景和IDC里面
    發(fā)表于 01-25 09:42

    光模塊將如何演變以適應(yīng)未來數(shù)據(jù)中心需求?

    。那么,數(shù)據(jù)中心應(yīng)用將會(huì)給光模塊帶來哪些挑戰(zhàn)呢?光模塊自身又是如何演變以適應(yīng)未來數(shù)據(jù)中心? 光模塊成本的挑戰(zhàn) 在大型數(shù)據(jù)中心中有成千上萬(wàn)種設(shè)備在運(yùn)行。假設(shè)在一個(gè)
    發(fā)表于 03-01 11:28

    網(wǎng)絡(luò)發(fā)展怎么改變企業(yè)數(shù)據(jù)中心的面貌的

    云和網(wǎng)絡(luò)規(guī)模提供商已經(jīng)實(shí)施了軟件定義存儲(chǔ)、融合架構(gòu)和超融合架構(gòu)。以太網(wǎng)存儲(chǔ)結(jié)構(gòu)(ESF)技術(shù)已經(jīng)成為數(shù)據(jù)中心轉(zhuǎn)型不可或缺的一部分,使那些具有前瞻性思維的企業(yè)級(jí)存儲(chǔ)
    發(fā)表于 08-16 15:08

    數(shù)據(jù)中心的建設(shè)也看重風(fēng)水

    相比中國(guó)傳統(tǒng)的風(fēng)水理論,數(shù)據(jù)中心所看重的風(fēng)水則更加貼合實(shí)際。以整體架構(gòu)來劃分,目前的主流的數(shù)據(jù)中心已經(jīng)進(jìn)入第三代,并開始向第四代演進(jìn)。第一代和第二代數(shù)據(jù)中心分別誕生于20世紀(jì)40和70
    發(fā)表于 08-07 06:22

    40G數(shù)據(jù)中心之銅纜布線

    網(wǎng)絡(luò)的互連,其中使用較多的是高速線纜(DAC,Direct Attach Copper Cable),尤其是無(wú)源銅纜(PCC)。無(wú)源銅纜因成本低和傳輸速度快的優(yōu)點(diǎn)一直被視為數(shù)據(jù)中心短距離傳輸?shù)淖顑?yōu)
    發(fā)表于 11-18 15:00

    數(shù)據(jù)中心太耗電怎么辦

    !》,原文作者:?jiǎn)⒚?。一、3 年電費(fèi)消耗,可再建造一個(gè)數(shù)據(jù)中心!1.1 科技驅(qū)動(dòng),推動(dòng)數(shù)據(jù)中心市場(chǎng)持續(xù)高速發(fā)展國(guó)際慣例,先介(bai)紹(du)一(bai)下(ke)“數(shù)據(jù)中心”:數(shù)據(jù)中心
    發(fā)表于 06-30 06:27

    數(shù)據(jù)中心是什么

    數(shù)據(jù)中心是什么:數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),用來在因特網(wǎng)絡(luò)基礎(chǔ)設(shè)施上傳遞、加速、展示、計(jì)算、存儲(chǔ)數(shù)據(jù)信息。
    發(fā)表于 07-12 07:10

    什么是數(shù)據(jù)中心

    數(shù)據(jù)中心是企業(yè)用來容納其關(guān)鍵業(yè)務(wù)應(yīng)用程序和信息的物理設(shè)施。隨著它們的發(fā)展,重要的是要長(zhǎng)期考慮如何保持它們的可靠性和安全性。什么是數(shù)據(jù)中心?數(shù)據(jù)中心通常被稱為單個(gè)事物,但實(shí)際上它們由許多技...
    發(fā)表于 09-15 06:46

    數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的HA測(cè)試[圖]

    設(shè)計(jì)是最基本最普遍的要求,而區(qū)別主要在于網(wǎng)絡(luò)故障對(duì)業(yè)務(wù)恢復(fù)的快慢影響。對(duì)數(shù)據(jù)中心而言,高可用性涉及到網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、電力、制冷等多個(gè)方面的因素,本文主要闡述數(shù)據(jù)中心
    發(fā)表于 01-17 18:17 ?1080次閱讀

    為什么5G網(wǎng)絡(luò)離不開數(shù)據(jù)中心網(wǎng)絡(luò)

    5G網(wǎng)絡(luò)采用以數(shù)據(jù)中心為基礎(chǔ)的云化架構(gòu),承載在數(shù)據(jù)中心內(nèi)獨(dú)立的電信云網(wǎng)絡(luò)上,通過SDN/NFV技術(shù)部署核心網(wǎng)等虛擬化網(wǎng)元。
    發(fā)表于 12-04 10:34 ?1405次閱讀

    數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)

    通常來說,如果一個(gè)數(shù)據(jù)中心服務(wù)器規(guī)模超過10萬(wàn)臺(tái),就可以稱large-scale datacenter,也就是常說的大規(guī)模數(shù)據(jù)中心。大規(guī)模數(shù)據(jù)中心對(duì)于網(wǎng)絡(luò)的要求有很多,但是突出的就在于
    的頭像 發(fā)表于 09-08 13:58 ?1084次閱讀

    淺談數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)技術(shù)

    Clos Spine/Leaf兩層結(jié)構(gòu) 圖3 常見的數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)結(jié)構(gòu) 2008年,美國(guó)加州大學(xué)圣迭戈分校的研究學(xué)者提出了將Clos架構(gòu)用于數(shù)據(jù)中心中。
    發(fā)表于 11-07 11:42 ?1018次閱讀

    超融合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的典型特征與價(jià)值

    結(jié)合業(yè)界在超融合數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)中的實(shí)踐與探索,對(duì)超融合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的未來發(fā)展進(jìn)行了展望。數(shù)據(jù)中心
    的頭像 發(fā)表于 12-19 10:53 ?1805次閱讀

    現(xiàn)代數(shù)據(jù)中心SmartNIC/DPU的演變過程

    隨著傳統(tǒng)IDC向云數(shù)據(jù)中心轉(zhuǎn)型,數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)開始不斷演進(jìn),三層架構(gòu)正過渡到Spine - Leaf
    的頭像 發(fā)表于 07-19 16:11 ?918次閱讀
    現(xiàn)代<b class='flag-5'>數(shù)據(jù)中心</b>SmartNIC/DPU的<b class='flag-5'>演變</b>過程