0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)單認(rèn)識(shí)全調(diào)度以太網(wǎng)技術(shù)

中興文檔 ? 來(lái)源:中興文檔 ? 2025-01-15 14:31 ? 次閱讀

今日和文檔君一起學(xué)習(xí)技術(shù)名詞:

全調(diào)度以太網(wǎng)技術(shù)(Global Scheduling Ethernet,GSE)——基于報(bào)文容器PKTC轉(zhuǎn)發(fā)和負(fù)載均衡,并實(shí)現(xiàn)全局調(diào)度。

什么是全調(diào)度以太網(wǎng)GSE?

GSE(Global Scheduling Ethernet),即全調(diào)度以太網(wǎng)技術(shù)。GSE是由中國(guó)移動(dòng)聯(lián)合產(chǎn)業(yè)合作伙伴共同提出的一種以太網(wǎng)技術(shù)架構(gòu),是在現(xiàn)有以太網(wǎng)的基礎(chǔ)上進(jìn)行了優(yōu)化和創(chuàng)新,以滿足智算中心高性能網(wǎng)絡(luò)技術(shù),旨在突破傳統(tǒng)以太網(wǎng)的技術(shù)瓶頸,打造無(wú)阻塞、高帶寬、低時(shí)延的新型智算中心網(wǎng)絡(luò)。

為什么需要GSE?

AI訓(xùn)練中,我們常用RDMA協(xié)議來(lái)高速傳輸數(shù)據(jù)。但RDMA對(duì)丟包非常敏感,哪怕只丟了一點(diǎn)點(diǎn)數(shù)據(jù)包,網(wǎng)絡(luò)的有效傳輸速度就會(huì)大幅下降。

而AI大模型訓(xùn)練需要多個(gè)計(jì)算設(shè)備一起工作,它們之間需要頻繁通信和同步,這對(duì)網(wǎng)絡(luò)的要求就特別高?,F(xiàn)在AI模型越來(lái)越大,智算中心的網(wǎng)絡(luò)性能就得更強(qiáng)才行,需要無(wú)阻塞、“0”丟包、低延遲。

傳統(tǒng)的以太網(wǎng)在大規(guī)模、高速度的數(shù)據(jù)傳輸時(shí),容易出現(xiàn)網(wǎng)絡(luò)擁塞等問(wèn)題。這就像是一條高速公路,車一多就容易堵。

智算中心的網(wǎng)絡(luò)中數(shù)據(jù)流雖然不多,但每個(gè)流的數(shù)據(jù)量都很大,傳統(tǒng)的負(fù)載均衡方式就容易出問(wèn)題,導(dǎo)致數(shù)據(jù)包丟失,動(dòng)態(tài)時(shí)延增大等問(wèn)題,從而影響AI訓(xùn)練的效率。

GSE技術(shù)就像是給去往某個(gè)目的地的多條高速公路裝上了智能導(dǎo)航系統(tǒng),它能主動(dòng)控制車流選擇最優(yōu)路徑,避免堵車,更高效地轉(zhuǎn)發(fā)數(shù)據(jù)包。這樣一來(lái),丟包就少了,網(wǎng)絡(luò)延遲也低了,整體傳輸速度就更高了,AI訓(xùn)練效率也就提升了。

GSE技術(shù)特點(diǎn)

1. 從“流”分發(fā)轉(zhuǎn)變?yōu)椤皥?bào)文”分發(fā)。傳統(tǒng)ECMP 負(fù)載均衡會(huì)導(dǎo)致鏈路負(fù)載不均以及哈希極化,可能引起擁塞和丟包。

GSE設(shè)備會(huì)將數(shù)據(jù)包進(jìn)行邏輯分組,組裝成長(zhǎng)度較長(zhǎng)的“定長(zhǎng)”容器,并基于報(bào)文容器轉(zhuǎn)發(fā)和動(dòng)態(tài)負(fù)載均衡,實(shí)現(xiàn)單條流在多路徑上均勻地負(fù)載分擔(dān),提升有效帶寬。

如果把報(bào)文當(dāng)作貨物,報(bào)文容器就好像載貨能力一樣的貨車,每輛貨車?yán)瑯又亓康呢浳?數(shù)量可以不一樣),大量貨車被均勻地調(diào)度到去往同個(gè)目的地的多條高速路上,可以最大程度利用道路資源。

490495f8-d2dd-11ef-9310-92fbcf53809c.png

2. 從被動(dòng)擁塞控制到主動(dòng)流控,引入“授權(quán)請(qǐng)求”和“全局調(diào)度機(jī)制”,通過(guò)構(gòu)建基于全局動(dòng)態(tài)調(diào)度隊(duì)列(DGSQ)的擁塞控制機(jī)制,本設(shè)備發(fā)送流量速率由最終的設(shè)備出口、途經(jīng)的設(shè)備統(tǒng)一進(jìn)行全網(wǎng)端到端授權(quán),確保了流量負(fù)載不超過(guò)網(wǎng)絡(luò)的承載能力,有效避免了網(wǎng)絡(luò)擁塞而丟包。

這就好像貨車在出發(fā)前先詢問(wèn)了目的地的庫(kù)房是否具備接收能力,根據(jù)目的地的收貨能力以及沿途路況來(lái)決定發(fā)出多少貨物,確保貨物能準(zhǔn)確送達(dá)并接收。

4910fe74-d2dd-11ef-9310-92fbcf53809c.png

由于AI大模型訓(xùn)練時(shí)任意一輪計(jì)算的結(jié)束均依賴最后一個(gè)結(jié)果的返回,降低網(wǎng)絡(luò)長(zhǎng)尾時(shí)延可有效提升訓(xùn)練完成時(shí)間。

交換網(wǎng)絡(luò)整體轉(zhuǎn)發(fā)時(shí)延和轉(zhuǎn)發(fā)路徑上中間節(jié)點(diǎn)的擁塞情況正相關(guān),消除中間節(jié)點(diǎn)的擁塞就可消除長(zhǎng)尾時(shí)延。GSE技術(shù)實(shí)現(xiàn)了精細(xì)化調(diào)度和和高負(fù)載均衡,可有效降低長(zhǎng)尾時(shí)延,提升訓(xùn)練效率。

GSE支持GSE-N2N和GSE-E2E兩大技術(shù)場(chǎng)景,GSE-N2N通過(guò)網(wǎng)絡(luò)設(shè)備實(shí)現(xiàn)全部GSE功能,支持計(jì)算與網(wǎng)絡(luò)設(shè)備的解耦;GSE-E2E將部分GSE能力延伸至服務(wù)器網(wǎng)卡,借助端網(wǎng)協(xié)同實(shí)現(xiàn)高性能集群互聯(lián)。QGSE vs RoCEv2 vs InfiniBand

GSE RoCEv2 InfiniBand
網(wǎng)絡(luò)設(shè)備 GSE交換機(jī) 以太交換機(jī) IB交換機(jī)
性能 組網(wǎng)性能相較傳統(tǒng)RoCEv2可提升40%已上 經(jīng)過(guò)調(diào)優(yōu)可接近IB 優(yōu)
兼容性 優(yōu),基于以太網(wǎng)改造,有開(kāi)放標(biāo)準(zhǔn) 優(yōu),增強(qiáng)以太網(wǎng) 封閉,不兼容以太網(wǎng)
產(chǎn)業(yè)生態(tài) 中國(guó)移動(dòng)攜手國(guó)內(nèi)智算生態(tài)企業(yè)共同發(fā)布產(chǎn)品及標(biāo)準(zhǔn)。 多種芯片方案,大量網(wǎng)絡(luò)設(shè)備廠家 Nvidia為主等少量海外廠商
易用性 無(wú)需復(fù)雜的網(wǎng)絡(luò)參數(shù)配置 需要調(diào)節(jié)各種網(wǎng)絡(luò)參數(shù),較復(fù)雜,自動(dòng)化部署正在完善中 集中式管理機(jī)制,由子網(wǎng)管理器負(fù)責(zé)整個(gè)網(wǎng)絡(luò)轉(zhuǎn)發(fā)表的計(jì)算與分發(fā)等工作
成熟度 新技術(shù),持續(xù)完善中 成熟,還在持續(xù)演進(jìn)完善 成熟

注:RoCEv2(RDMA over Converged Ethernet,融合以太網(wǎng)承載RDMA)

GSE有哪些應(yīng)用場(chǎng)景?

GSE主要面向無(wú)損、高帶寬、低時(shí)延等高性能網(wǎng)絡(luò)需求業(yè)務(wù)場(chǎng)景,如AI大模型訓(xùn)練的智算中心網(wǎng)絡(luò)。

GSE業(yè)界應(yīng)用進(jìn)展

在2023年9月的中國(guó)網(wǎng)絡(luò)大會(huì)上,中國(guó)移動(dòng)研究院攜手合作伙伴發(fā)布業(yè)界首款“全調(diào)度以太網(wǎng)(GSE)”樣機(jī)。

在2023年11月21日的開(kāi)放數(shù)據(jù)中心委員會(huì)(ODCC)冬季全會(huì)會(huì)議上,正式成立全調(diào)度以太網(wǎng)(GSE)技術(shù)特設(shè)組并召開(kāi)第一次工作組會(huì)議。

在2024年9月27日的中國(guó)算力大會(huì)上,中國(guó)移動(dòng)攜手國(guó)內(nèi)智算生態(tài)企業(yè)共同發(fā)布了全調(diào)度以太網(wǎng)(GSE)全套技術(shù)標(biāo)準(zhǔn)及首套商用產(chǎn)品。

2024.11,中國(guó)移動(dòng)聯(lián)合云豹智能共同研發(fā)首顆GSE DPU芯片--“智算琢光”。

2024.12,中國(guó)移動(dòng)聯(lián)合中興共同研發(fā)首顆可完整支持GSE功能的大容量高性能交換芯片

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5449

    瀏覽量

    172167
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269616
  • 容器
    +關(guān)注

    關(guān)注

    0

    文章

    498

    瀏覽量

    22086
  • 負(fù)載均衡
    +關(guān)注

    關(guān)注

    0

    文章

    113

    瀏覽量

    12373

原文標(biāo)題:【秒懂承載】熱點(diǎn)技術(shù)名詞 -“全調(diào)度以太網(wǎng)GSE”

文章出處:【微信號(hào):ztedoc,微信公眾號(hào):中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    工業(yè)以太網(wǎng)技術(shù)說(shuō)明

    工業(yè)以太網(wǎng)技術(shù)說(shuō)明工業(yè)以太網(wǎng)技術(shù)上它與IEEE802.3 及IEEE802.3U 兼容, 但在產(chǎn)品設(shè)計(jì)制造充分考慮到并滿足工業(yè)網(wǎng)絡(luò)應(yīng)用的需求。工業(yè)現(xiàn)場(chǎng)對(duì)工業(yè)以太網(wǎng)產(chǎn)品的要求如下:n
    發(fā)表于 10-20 08:57

    以太網(wǎng)技術(shù)基本原理

    通常我們所說(shuō)的以太網(wǎng)主要是指以下三種不同的局域網(wǎng)技術(shù)以太網(wǎng)/IEEE 802.3:采用同軸電纜作為網(wǎng)絡(luò)媒體,傳輸速率達(dá)到10Mbps; 100Mbps以太網(wǎng):又稱為快速
    發(fā)表于 12-03 19:07

    探討工業(yè)以太網(wǎng)技術(shù)(一)

    所謂工業(yè)以太網(wǎng)就是在以太網(wǎng)技術(shù)和TCP/IP技術(shù)的基礎(chǔ)上開(kāi)發(fā)出來(lái)的一種現(xiàn)場(chǎng)總線。作為現(xiàn)場(chǎng)總線的工業(yè)以太網(wǎng)與一般的商用以太網(wǎng)有很大不同。 必須
    發(fā)表于 12-15 14:28

    探討工業(yè)以太網(wǎng)技術(shù)~(二)

    所謂工業(yè)以太網(wǎng)就是在以太網(wǎng)技術(shù)和TCP/IP技術(shù)的基礎(chǔ)上開(kāi)發(fā)出來(lái)的一種現(xiàn)場(chǎng)總線。作為現(xiàn)場(chǎng)總線的工業(yè)以太網(wǎng)與一般的商用以太網(wǎng)有很大不同。 必須
    發(fā)表于 12-15 14:29

    以太網(wǎng)技術(shù)開(kāi)發(fā)資料精選》

    的數(shù)據(jù),因此工業(yè)自動(dòng)化組件供應(yīng)商越來(lái)越多的把以太網(wǎng)協(xié)議作為他們產(chǎn)品的標(biāo)準(zhǔn)規(guī)范,許多廠商也直接把以太網(wǎng)技術(shù)作為新產(chǎn)品的網(wǎng)絡(luò)連接手段。由于這些供應(yīng)商的推動(dòng),這也就需要機(jī)械制造商和終端客戶將觀念從舊的現(xiàn)場(chǎng)總線
    發(fā)表于 01-24 15:09

    工業(yè)以太網(wǎng)技術(shù)手冊(cè)

    工業(yè)以太網(wǎng)技術(shù)說(shuō)明,工業(yè)以太網(wǎng)技術(shù)上它與IEEE802.3 及IEEE802.3U 兼容, 但在產(chǎn)品設(shè)計(jì)制造充分考慮到并滿足工業(yè)網(wǎng)絡(luò)應(yīng)用的需求。工業(yè)現(xiàn)場(chǎng)對(duì)工業(yè)以太網(wǎng)產(chǎn)品的要求如下:n
    發(fā)表于 10-20 08:55 ?20次下載

    工業(yè)以太網(wǎng)技術(shù)及其發(fā)展

    工業(yè)以太網(wǎng)技術(shù)及其發(fā)展:本文介紹了以太網(wǎng)進(jìn)人工業(yè)控制領(lǐng)域的必然性及其優(yōu)勢(shì);分析了工業(yè)以太網(wǎng)在控制領(lǐng)域應(yīng)用中存在的問(wèn)題及其改進(jìn)措施;闡述了工業(yè)以太網(wǎng)的應(yīng)用方式和
    發(fā)表于 01-12 17:12 ?20次下載

    以太網(wǎng)技術(shù)基本原理

    以太網(wǎng)技術(shù)基本原理 通常我們所說(shuō)的以太網(wǎng)主要是指以下三種不同的局域網(wǎng)技術(shù):  
    發(fā)表于 07-24 08:10 ?5444次閱讀
    <b class='flag-5'>以太網(wǎng)技術(shù)</b>基本原理

    以太網(wǎng)(Etherner).以太網(wǎng)技術(shù)標(biāo)準(zhǔn)有哪些?

    以太網(wǎng)(Etherner).以太網(wǎng)技術(shù)標(biāo)準(zhǔn)有哪些? 以太網(wǎng)(Ethernet)指的是由Xerox公司創(chuàng)建并由Xerox,Intel和DEC公司聯(lián)合開(kāi)發(fā)的基帶局域網(wǎng)規(guī)范。是
    發(fā)表于 03-22 09:52 ?9768次閱讀

    以太網(wǎng)技術(shù)聯(lián)盟發(fā)布了800千兆位以太網(wǎng)的規(guī)范

    以太網(wǎng)技術(shù)聯(lián)盟(EthernetTechnologyConsortium)提出了800千兆位以太網(wǎng)的規(guī)范,該行業(yè)聯(lián)盟包括Arista、Broadcom、Cisco、Dell、Google、Mellanox和Microsoft。
    的頭像 發(fā)表于 05-18 16:03 ?3485次閱讀

    千兆以太網(wǎng)發(fā)展現(xiàn)狀 千兆以太網(wǎng)技術(shù)優(yōu)勢(shì)

    以太網(wǎng)其實(shí)是我們?nèi)粘I钪卸紩?huì)用到的,比如大家小區(qū)里的千兆以太網(wǎng)等。為增進(jìn)大家對(duì)以太網(wǎng)的了解,本文講對(duì)千兆以太網(wǎng)的發(fā)展現(xiàn)狀、千兆以太網(wǎng)技術(shù)優(yōu)
    的頭像 發(fā)表于 03-21 11:30 ?7860次閱讀
    千兆<b class='flag-5'>以太網(wǎng)</b>發(fā)展現(xiàn)狀 千兆<b class='flag-5'>以太網(wǎng)技術(shù)</b>優(yōu)勢(shì)

    工業(yè)以太網(wǎng)技術(shù)優(yōu)勢(shì)

    工業(yè)以太網(wǎng)技術(shù)源于以太網(wǎng)技術(shù),但其本身卻不同于一般以太網(wǎng)技術(shù)。工業(yè)以太網(wǎng)技術(shù)本身在適應(yīng)性上進(jìn)行了調(diào)整,同時(shí)根據(jù)工業(yè)生產(chǎn)安全穩(wěn)定的需要,增加了相應(yīng)的控制應(yīng)用功能,提出了滿足特定工業(yè)應(yīng)用場(chǎng)
    發(fā)表于 08-30 18:16 ?1579次閱讀

    工業(yè)以太網(wǎng)技術(shù)特點(diǎn)

    通信速率高,隨著企業(yè)信息系統(tǒng)規(guī)模的擴(kuò)大和復(fù)雜程度的提高,對(duì)信息量的需求也越來(lái)越大,有時(shí)甚至需要音頻、視頻數(shù)據(jù)的傳輸,當(dāng)前以太網(wǎng)的通信速率為10M、100M的快速以太網(wǎng)開(kāi)始廣泛應(yīng)用,千兆以太網(wǎng)技術(shù)也逐漸成熟,10G
    發(fā)表于 05-17 16:12 ?979次閱讀

    單對(duì)以太網(wǎng)技術(shù)的介紹 單對(duì)以太網(wǎng)技術(shù)的優(yōu)勢(shì) 單對(duì)以太網(wǎng)技術(shù)的應(yīng)用

    單對(duì)以太網(wǎng)技術(shù)的介紹 單對(duì)以太網(wǎng)技術(shù)的優(yōu)勢(shì) 單對(duì)以太網(wǎng)技術(shù)的應(yīng)用? 以太網(wǎng)技術(shù)是一種局域網(wǎng)傳輸協(xié)議,通常用于連接局域網(wǎng)內(nèi)的多臺(tái)計(jì)算機(jī)和網(wǎng)絡(luò)設(shè)備。它是最常用的局域
    的頭像 發(fā)表于 11-28 15:45 ?781次閱讀

    簡(jiǎn)單認(rèn)識(shí)以太網(wǎng)技術(shù)

    以太網(wǎng)(Ethernet)是一種常見(jiàn)的局域網(wǎng)(LAN)技術(shù),它使用多種協(xié)議來(lái)實(shí)現(xiàn)數(shù)據(jù)通信。Ethernet的協(xié)議分為多層,其中二層協(xié)議主要涉及數(shù)據(jù)鏈路層。在Ethernet中,數(shù)據(jù)鏈路層使用幀(frame)來(lái)傳輸數(shù)據(jù),而幀的結(jié)構(gòu)由多個(gè)字段組成。
    的頭像 發(fā)表于 01-07 09:52 ?878次閱讀