0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深入解讀新思科技UALink和超以太網(wǎng)IP解決方案

新思科技 ? 來源:新思科技 ? 2025-03-26 10:08 ? 次閱讀

AI工作負載正顯著推動接口IP市場的創(chuàng)新。AI模型參數(shù)量呈指數(shù)級增長,大約每4至6個月翻一番,這與摩爾定律所描繪的硬件發(fā)展速度(周期長達18個月)形成了鮮明對比。此差距要求硬件創(chuàng)新來支持人工智能(AI)工作負載,并且需要更強的計算能力、更豐富的資源和更高帶寬的互連技術。

更重要的是,硬件性能已經(jīng)超越了標準掩膜尺寸的限制。由于計算單元和相關內(nèi)存越來越多,CPUGPU設計正在不斷突破掩膜尺寸。AI加速器和GPU現(xiàn)在需要一種全新的超高效網(wǎng)絡基礎設施,突破單個芯片的性能限制,同時實現(xiàn)低延遲、高密度連接的芯片間通信,優(yōu)化能效。

本文從技術角度深入探討了橫向、縱向擴展為何成為HPC和AI芯片開發(fā)商的關鍵需求,以及超以太網(wǎng)和UALink等新標準如何應對高帶寬、低延遲連接和高效資源管理的挑戰(zhàn)。

新標準的崛起

在AI工作負載需求的推動下,芯片到芯片架構的橫向、縱向擴展至關重要。從單芯片過渡到Multi-Die系統(tǒng),并融合HBM和UCIe等并行接口已成為必然趨勢。這些解決方案支持同構和異構計算架構,借助PCIe和CXL的傳統(tǒng)連接進一步擴展內(nèi)存,并利用以太網(wǎng)實現(xiàn)更廣泛的網(wǎng)絡架構。

6ab15be4-089a-11f0-9310-92fbcf53809c.png

▲點擊查看詳細信息

為了滿足AI擴展需求,兩項新標準應運而生:

適用于橫向擴展的超以太網(wǎng)

適用于縱向擴展的UALink

超以太網(wǎng)是一種開放、可互操作的高性能架構,專為AI而設計,得到了交換機、網(wǎng)絡、半導體和系統(tǒng)供應等領域的知名企業(yè)以及超大規(guī)模用戶的支持。另一方面,UALink則通過特定的內(nèi)存共享功能,使加速器能夠直接運行,得到了半導體行業(yè)重要參與者的廣泛認可。

超以太網(wǎng):橫向擴展AI工作負載

隨著AI和HPC流量的增長,使用RoCE或?qū)S薪鉀Q方案的傳統(tǒng)網(wǎng)絡逐漸顯露出其局限性。這包括嚴格的按序數(shù)據(jù)包傳送、基于流的低效負載平衡,以及數(shù)據(jù)包丟失時在RDMA操作中繁瑣的重新傳輸。而這些對于AI操作來說成本非常高昂。超以太網(wǎng)聯(lián)盟(UEC)技術通過提供更高效、可擴展且強大的網(wǎng)絡解決方案來解決這些問題,能夠針對性地滿足AI和HPC工作負載的高性能需求。

超以太網(wǎng)的工作原理

6ac97b3e-089a-11f0-9310-92fbcf53809c.png

▲點擊查看詳細信息

圖1:超以太網(wǎng)集群圖

超以太網(wǎng)系統(tǒng)由多個集群組成,每個集群都包含節(jié)點和基礎設施。節(jié)點通過結構接口(網(wǎng)卡)連接到網(wǎng)絡,該接口可以承載多個邏輯結構端點(FEP)。網(wǎng)絡分為多個平面,每個平面包含多個通過交換機互連的FEP。

集群主要采用兩種模式來處理不同的任務。

并行作業(yè)模式:系統(tǒng)運行任務直至完成,并允許多個節(jié)點同時進行通信。對于需要大量并行處理的高性能計算任務來說,這是理想的作業(yè)模式。

客戶端/服務器模式:系統(tǒng)專為存儲任務而設置。在這種情況下,服務器持續(xù)處理來自多個客戶端的請求,并在特定的節(jié)點對之間進行通信,非常適合用于可靠且一致的數(shù)據(jù)訪問和管理工作。

超以太網(wǎng)的關鍵技術特點

6ade93e8-089a-11f0-9310-92fbcf53809c.png

▲點擊查看詳細信息

圖2:超以太網(wǎng)使用專為AI和HPC應用而設計的下一代傳輸協(xié)議重新定義了以太網(wǎng)。(圖片來源:超以太網(wǎng)聯(lián)盟)

1. 物理層:與IEEE 802.3標準以太網(wǎng)兼容,具有基于FEC(前向糾錯)碼字的可選性能監(jiān)控功能。UCR(不可糾正碼字率)和MTBPE(平均數(shù)據(jù)包錯誤間隔時間)等指標有助于深入分析傳輸性能以及可靠性表現(xiàn)。

2. 鏈路層:引入LLR(鏈路層重傳)協(xié)議,可實現(xiàn)無損傳輸,而無需依賴優(yōu)先級流量控制(PFC)機制。這可確保更快的錯誤恢復,避免不必要的端到端重傳,并減少尾部延遲。

3. 數(shù)據(jù)包速率改進(PRI):通過壓縮以太網(wǎng)和IP報頭提高數(shù)據(jù)包速率,解決由傳統(tǒng)功能和冗余協(xié)議字段導致的效率低下問題。

4.鏈路協(xié)商協(xié)議:通過協(xié)商功能擴展LLDP,以檢測并啟用LLR和PRI等受支持功能。

5.傳輸層:旨在解決傳統(tǒng)RDMA網(wǎng)絡的局限性,支持選擇性重傳、無序傳送、數(shù)據(jù)包噴射和高級擁塞控制機制。提供多種傳輸模式,包括可靠有序交付(ROD)、可靠無序交付(RUD)和不可靠無序交付(UUD)。

6.擁塞控制:實現(xiàn)了incast管理、加速速率調(diào)整、基于遙測的控制和通過數(shù)據(jù)包噴射進行自適應路由等功能,以盡可能地減少尾部延遲并增強網(wǎng)絡性能。

7.安全:在傳輸層整合基于作業(yè)的安全性,利用IPSec和PSP功能進一步減少加密開銷并支持硬件卸載。

UALink:縱向擴展AI工作負載

AI模型的規(guī)模越來越大,相關市場對算力和內(nèi)存資源的需求顯著增加。傳統(tǒng)的互連技術并非專為AI工作負載網(wǎng)絡設計,難以滿足其需求。UALink作為一種可擴展結構,可在數(shù)十到數(shù)百個專用AI加速器之間建立基于標準的超高帶寬連接網(wǎng)絡。這一技術的出現(xiàn)標志著市場的重大進步,縱向擴展網(wǎng)絡從臨時配置轉(zhuǎn)向更標準化的網(wǎng)絡,支持更高基數(shù)的系統(tǒng),并配備專用的UALink交換機。

UALink的工作原理

6b12eb0c-089a-11f0-9310-92fbcf53809c.png

▲點擊查看詳細信息

圖3:UALink為縱向擴展網(wǎng)絡和AI加速器交換機營造了開放的生態(tài)系統(tǒng)。摘自:MICRO-2024 HiPChips研討會

UALink創(chuàng)建了一個高速、低延遲的網(wǎng)絡,可以連接一個Pod內(nèi)的多個加速器(例如GPU)。這讓每個加速器能夠直接訪問其他加速器的內(nèi)存,整個Pod可以像單個巨大的GPU一樣運行。這使得每個GPU可以直接訪問和修改同一擴展網(wǎng)絡內(nèi)其他任何GPU的內(nèi)存。從軟件角度來看,這組相互連接的GPU看起來就像一整個大型GPU。

UALink的工作原理超加速器鏈路(UALink)的關鍵技術特點

1.高帶寬:UALink每通道的速度高達200 Gbps,有助于在加速器之間高效傳輸數(shù)據(jù)。

2.輕量級協(xié)議:該協(xié)議設計輕量,可減少開銷并確保高效通信。

3.效率:亞微秒級延遲提高了推理性能,并支持在不劃分工作負載的情況下擴展到八個GPU以上。

4. 開放標準:UALink是一個開放的行業(yè)標準,可改善互操作性,減少供應商鎖定。

5. 內(nèi)存共享:特定的內(nèi)存共享功能讓加速器可以有效地訪問共享內(nèi)存資源,支持數(shù)百個GPU之間的加載、存儲和原子操作,減少端到端延遲并降低功耗。

6.同步功能:UALink包含同步功能,有助于確保多個加速器之間的一致性,促進高效運行。

7. 與UEC相輔相成:可以與超以太網(wǎng)聯(lián)盟成員的前沿技術良好協(xié)作,實現(xiàn)更廣泛的可擴展性。

利用業(yè)界首發(fā)的超以太網(wǎng)和UALink IP解決方案實現(xiàn)大規(guī)模AI集群

新思科技搶先推出業(yè)內(nèi)首款UALink和超以太網(wǎng)IP解決方案,致力于連接海量AI加速器集群。

6b25c628-089a-11f0-9310-92fbcf53809c.png

▲點擊查看詳細信息

新思科技超以太網(wǎng)IP解決方案的速度高達1.6Tb/s,可支持多達一百萬個端點。此外,新思科技UALink IP每通道的速度高達200Gb/s,可連接一千多個加速器。這些解決方案針對AI的橫向、縱向擴展進行了優(yōu)化,提供了AI通信所必需的高帶寬和輕量級協(xié)議。

結語

隨著AI領域的不斷擴大,采用標準化接口對于推動創(chuàng)新、降低復雜性和提高整體系統(tǒng)性能至關重要。AI基礎結構的未來在于這些能夠促進行業(yè)增長、提高效率的協(xié)作性開放標準解決方案。新思科技正處于AI和HPC設計創(chuàng)新的前沿,提供廣泛的高速接口IP組合。新思科技為PCIe 7.0、1.6T以太網(wǎng)、CXL、HBM、UCIe以及最新的超以太網(wǎng)和UALink提供完整且安全的IP解決方案,從而推動AI和HPC在性能、可擴展性、效率和互操作性等方面達到新的高度,幫助客戶實現(xiàn)一次性流片成功。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)

    關注

    40

    文章

    5505

    瀏覽量

    173553
  • 交換機
    +關注

    關注

    21

    文章

    2684

    瀏覽量

    100649
  • AI
    AI
    +關注

    關注

    87

    文章

    32905

    瀏覽量

    272521
  • 新思科技
    +關注

    關注

    5

    文章

    833

    瀏覽量

    50680
  • HPC
    HPC
    +關注

    關注

    0

    文章

    331

    瀏覽量

    24001

原文標題:業(yè)內(nèi)首款UALink和超以太網(wǎng)IP解決方案,重塑高性能AI網(wǎng)絡

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    思科技推出業(yè)界首款連接大規(guī)模AI加速器集群的以太網(wǎng)UALink IP 解決方案

    加州桑尼維爾,2024 年 12 月 11 日 ——新思科技 (Synopsys, Inc.,納斯達克股票代碼:SNPS)近日宣布,推出業(yè)界首款以太網(wǎng)IP
    發(fā)表于 12-20 11:47 ?511次閱讀

    設計坊第三期:靈活的工業(yè)以太網(wǎng)解決方案

    、EtherNet/IP 和 EtherCAT以太網(wǎng)標準各自有哪些優(yōu)缺點呢?大家來比較下 3. 隨著市場上標準數(shù)量的增多,以及標準的不斷發(fā)展,采用多塊電路板的解決方案怎樣才能最有效,同時迅速支持新功能和其他協(xié)議
    發(fā)表于 12-25 11:17

    自動化行業(yè)中的全廠自動化中的以太網(wǎng)/IP

    在本系列第一部分中,我們探討了以太網(wǎng)在自動化行業(yè)中的重要性,談到了其相對于傳統(tǒng)現(xiàn)場總線的優(yōu)勢。對于初創(chuàng)企業(yè)來說,以太網(wǎng)解決方案具有卓越的優(yōu)勢、能效比和設備選擇自由性,這些優(yōu)勢全部來自其底層技術
    發(fā)表于 10-22 16:45

    基于以太網(wǎng)接口的TCP/IP 實驗

    基于以太網(wǎng)接口的TCP/IP 實驗 一. 實驗目的進行一次TCP/IP 的通訊實驗,使用戶初步了解以太網(wǎng)、IP、ARP、ICMP 等協(xié)議。
    發(fā)表于 09-26 16:51 ?2117次閱讀
    基于<b class='flag-5'>以太網(wǎng)</b>接口的TCP/<b class='flag-5'>IP</b> 實驗

    工業(yè)以太網(wǎng)方案選擇指南

    針對工業(yè)以太網(wǎng)方案選擇,ARC咨詢集團的專家給大家的建議是,終端用戶需要從2個方面考慮工業(yè)以太網(wǎng):平臺導向的解決方案和應用導向的解決方案。
    發(fā)表于 07-09 17:41 ?917次閱讀

    Linux以太網(wǎng)解決方案的介紹

    本課程將回顧高性能以太網(wǎng)解決方案所需的系統(tǒng)功能。 將審查Xilinx以太網(wǎng)IP內(nèi)核和相關設備驅(qū)動程序,包括設備樹綁定。 還討論了與Petalinux的聯(lián)網(wǎng)。
    的頭像 發(fā)表于 11-27 06:38 ?3383次閱讀

    萬兆以太網(wǎng)IP SAN的融合

    IP SAN存儲網(wǎng)融合到萬兆以太網(wǎng)絡中,將大大增加了IP SAN網(wǎng)絡的通信帶寬,提高主機訪問存儲的速度,同時由于以太網(wǎng)靈活易實施的特點,萬兆
    的頭像 發(fā)表于 01-24 15:16 ?3344次閱讀

    思科技收購MorethanIP,進一步擴展DesignWare以太網(wǎng)IP產(chǎn)品組合

    借助此項收購,新思科技將能提供 完整的以太網(wǎng)IP解決方案,包括應用于200G/400G和800G高性能計算SoC的MAC、PCS和112G PHY。
    發(fā)表于 04-20 09:52 ?1998次閱讀

    以太網(wǎng)供電解決方案

    以太網(wǎng)供電解決方案
    發(fā)表于 05-18 13:45 ?15次下載
    <b class='flag-5'>以太網(wǎng)</b>供電<b class='flag-5'>解決方案</b>

    思科技推出業(yè)界首個1.6T高速以太網(wǎng)解決方案

    思科技(Synopsys)近日在數(shù)據(jù)中心領域取得了重大突破,推出了業(yè)界首個1.6T高速以太網(wǎng)解決方案,為日益增長的人工智能(AI)計算需求提供了強有力的網(wǎng)絡支持。這一創(chuàng)新解決方案相較
    的頭像 發(fā)表于 03-08 11:06 ?729次閱讀

    數(shù)據(jù)中心市場的關鍵以太網(wǎng)解決方案

    了解數(shù)據(jù)中心市場動態(tài)的關鍵在于以太網(wǎng)解決方案。Synopsys負責產(chǎn)品管理和高性能計算IP的副總裁Michael Posner說:“以太網(wǎng)在數(shù)據(jù)中心中根深蒂固……雖然它并不廣為人知,但
    發(fā)表于 03-12 09:53 ?572次閱讀
    數(shù)據(jù)中心市場的關鍵<b class='flag-5'>以太網(wǎng)</b><b class='flag-5'>解決方案</b>

    思科技正式推出業(yè)界首個1.6T以太網(wǎng)IP整體解決方案

    思科技1.6T以太網(wǎng)IP整體解決方案現(xiàn)已上市并被多家客戶用,與現(xiàn)有實現(xiàn)方案相比,其互連功耗最多可降低50%
    的頭像 發(fā)表于 03-19 10:23 ?614次閱讀

    思科技推出業(yè)界首個1.6T以太網(wǎng)IP整體解決方案

    思科技(Synopsys)日前重磅推出了業(yè)界首個1.6T以太網(wǎng)IP整體解決方案,這一創(chuàng)新性的方案在數(shù)據(jù)密集型人工智能(AI)工作負載的處理
    的頭像 發(fā)表于 03-19 10:24 ?538次閱讀

    解讀工業(yè)以太網(wǎng)標準:Profinet與EtherNet/IP

    隨著工業(yè)自動化技術的飛速發(fā)展,工業(yè)以太網(wǎng)標準作為連接各種自動化設備、控制系統(tǒng)和信息系統(tǒng)的重要橋梁,其重要性日益凸顯。在眾多工業(yè)以太網(wǎng)標準中,Profinet和EtherNet/IP憑借其各自的特點
    的頭像 發(fā)表于 06-28 16:34 ?2823次閱讀

    思科技推出超以太網(wǎng)UALink IP解決方案

    近日,全球領先的電子設計自動化(EDA)和半導體IP供應商新思科技(Synopsys, Inc.)宣布了一項重大技術創(chuàng)新——推出業(yè)界首款以太網(wǎng)IP
    的頭像 發(fā)表于 12-25 11:12 ?490次閱讀