0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

單芯片性能不抵拓展性,數(shù)據(jù)中心的交換矩陣

842221752 ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-04-04 00:51 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)在現(xiàn)代數(shù)據(jù)中心架構(gòu)中,網(wǎng)絡(luò)和計算設(shè)備都部署在兩層甚至三層的互聯(lián)矩陣中,與傳統(tǒng)的多層架構(gòu)不同,數(shù)據(jù)中心的交換矩陣促成了服務(wù)器架構(gòu)的扁平化,進(jìn)一步縮短了數(shù)據(jù)中心內(nèi)不同端點之間的距離,提高效率的同時,也降低了延遲。

可以說交換矩陣技術(shù)決定了數(shù)據(jù)中心的擴(kuò)展性,相較傳統(tǒng)的網(wǎng)絡(luò)交換矩陣而言,如今的復(fù)雜計算交換矩陣,也就是我們所說的芯片外互聯(lián)技術(shù),更是提高算力的重要解決方案之一。

英偉達(dá)NVLink和NV Switch

與其他公司采用的通用交換矩陣技術(shù)不同,英偉達(dá)憑借其在互聯(lián)交換技術(shù)上的積累,再結(jié)合收購Mellanox獲得的技術(shù),為其GPU產(chǎn)品打造并迭代了NVLink和NVSwitch技術(shù)。

以目前的英偉達(dá)GPU服務(wù)器集群為例,集群內(nèi)的GPU通過NVSwitch交換機(jī),以NVLink來實現(xiàn)互相通信。如今NVLink技術(shù)已經(jīng)發(fā)展至第五代,NVSwitch也已經(jīng)發(fā)展至第四代NVLink Switch。

隨著GB200的出現(xiàn),英偉達(dá)已經(jīng)實現(xiàn)了單Blackwell GPU支持18個NVLink連接的可拓展性,也使得總帶寬達(dá)到了1.8TB/s,是第四代NVLink技術(shù)的兩倍,更是遠(yuǎn)超PCIe 5.0。

單個GB200 NVL72服務(wù)器更是可以集成72個GB200 GPU,依靠NVLink Switch實現(xiàn)130TB/s的總帶寬,這樣的可拓展性對于提高現(xiàn)在的大模型訓(xùn)練規(guī)模和速度來說尤為重要,NVL72就可以普遍用于訓(xùn)練萬億參數(shù)級別的大模型。

AMD Infinity Fabric

雖然很多AI加速器初創(chuàng)企業(yè)或英偉達(dá)的競爭對手,都會鼓吹單個GPU或加速器的性能本身,但如果不能從擴(kuò)展性上縮短差距,也很難被云服務(wù)廠商和數(shù)據(jù)中心大規(guī)模商用。以英偉達(dá)的老對手AMD為例,他們的MI300系列在交換矩陣的支持上由128鏈路組成,其中64個支持PCIe 5.0和自研的Infinity Fabric,另外64個則僅支持Infinity Fabric。

在單芯片或單個服務(wù)器上的性能可能會更加優(yōu)異,但一旦擴(kuò)展至數(shù)百個服務(wù)器的規(guī)模下,就很難繼續(xù)保持優(yōu)勢了。AMD也很清楚自己需要縮小這一差距,但僅僅依靠自身在Infinity Fabric交換矩陣上的積累,很難打通整個生態(tài),所以AMD選擇了合作開放一途。

早在去年AMD的Advancing AI大會上,AMD就宣布向生態(tài)合作伙伴開放自己的Infinity Fabric IP(XGMI),呼吁別的交換芯片廠商對Infinity Fabric加以支持。比如博通就表示,其下一代PCIe交換芯片,除了支持PCIe、CXL之外,也將支持AMD的Infinity Fabric。

然而這里指的并不是今年下半年才送樣的PCIe 6.0交換芯片,Atlas 3系列,而是PCIe 7.0的Atlas 4系列。由此看來,要想真正見到第三方交換矩陣方案支持AMD的Infinity Fabric,還得等到PCIe 7.0正式面世。

寫在最后

對于市面上其他的AI加速器而言,開放標(biāo)準(zhǔn)或已有的商用標(biāo)準(zhǔn)是他們的最好選擇,比如PCIe、CXL等等。除此之外,據(jù)了解一些與緩存一致性相關(guān)的專利即將過期,或許對于一些初創(chuàng)公司來說,未來會有開源的高端交換互聯(lián)方案供他們選擇。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)中心對MOS管性能的要求

    數(shù)據(jù)中心作為現(xiàn)代信息技術(shù)的核心基礎(chǔ)設(shè)施,承載著數(shù)據(jù)存儲、處理和傳輸?shù)闹匾蝿?wù)。在這些任務(wù)中,MOS管(金屬氧化物半導(dǎo)體場效應(yīng)晶體管)作為關(guān)鍵的電子元件,其性能對數(shù)據(jù)中心的整體效率和穩(wěn)定性起著至關(guān)重要的作用。本文將詳細(xì)探討
    的頭像 發(fā)表于 10-11 11:22 ?312次閱讀

    園區(qū)交換機(jī) VS 數(shù)據(jù)中心交換機(jī)

    園區(qū)交換機(jī)和數(shù)據(jù)中心交換機(jī)是交換機(jī)領(lǐng)域的兩大類別,很多人都很熟悉。但是,這兩者之間的區(qū)別并不是很清楚。在本文中,我們將對園區(qū)交換機(jī)和
    的頭像 發(fā)表于 06-24 15:33 ?646次閱讀
    園區(qū)<b class='flag-5'>交換</b>機(jī) VS <b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>交換</b>機(jī)

    數(shù)據(jù)中心布線標(biāo)準(zhǔn)有什么

    布線標(biāo)準(zhǔn)為設(shè)計、構(gòu)建和維護(hù)數(shù)據(jù)中心基礎(chǔ)設(shè)施提供了指導(dǎo)方針。它們涵蓋了電纜類型、連接器、安裝實踐等,以確保一致性、可靠性和可擴(kuò)展性。這些標(biāo)準(zhǔn)由TIA、ISO和BICSI等組織制定,規(guī)范布線并影響整個數(shù)據(jù)中心的設(shè)計、建設(shè)和運營,以
    的頭像 發(fā)表于 06-14 10:51 ?538次閱讀

    數(shù)據(jù)中心交換機(jī)購買指南

    由于數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)設(shè)施變得更加分散,數(shù)據(jù)中心交換機(jī)正在成為一種新型交換機(jī)。與傳統(tǒng)的三層架構(gòu)網(wǎng)絡(luò)的交換機(jī)不同,
    的頭像 發(fā)表于 06-11 16:37 ?585次閱讀

    管理數(shù)據(jù)中心電纜的技巧

    一個愚蠢的字符串戰(zhàn)場。更糟糕的是,可能不知道哪些電纜用于何處,這使得難以確保最佳設(shè)備性能并排除問題。 為了確保它看起來不像老鼠在電纜上筑巢,請考慮以下數(shù)據(jù)中心布線最佳實踐: 減少電纜 首先也是最重要的是,運行
    的頭像 發(fā)表于 04-12 10:21 ?441次閱讀

    #mpo極性 #數(shù)據(jù)中心mpo

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年04月07日 10:05:13

    數(shù)據(jù)中心交換機(jī)高速率發(fā)展,需要哪些電感與電容元件?

    了大功率數(shù)據(jù)機(jī)架和更高效的數(shù)據(jù)中心建設(shè),云計算數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)也在持續(xù)升級演進(jìn),市場對數(shù)據(jù)中心光互聯(lián)技術(shù)提出了更高速率、更低功耗、更低成本等需求。 ?
    的頭像 發(fā)表于 04-05 00:03 ?3384次閱讀

    #mpo光纖跳線 #數(shù)據(jù)中心光纖跳線

    光纖數(shù)據(jù)中心
    jf_51241005
    發(fā)布于 :2024年03月22日 10:18:31

    交換機(jī)分布緩存_述說數(shù)據(jù)中心交換機(jī)的重要性能指標(biāo)——緩存

    交換機(jī)是數(shù)據(jù)中心不可缺少的網(wǎng)絡(luò)設(shè)備,在數(shù)據(jù)中心里發(fā)揮著重要作用。在平時使用和采購時,大多數(shù)都關(guān)注交換機(jī)的背板帶寬、端口密度、端口速度、協(xié)議
    的頭像 發(fā)表于 03-15 17:39 ?884次閱讀

    #MPO預(yù)端接 #數(shù)據(jù)中心機(jī)房 #機(jī)房布線

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年03月01日 11:12:47

    #永久鏈路 #信道測試 #數(shù)據(jù)中心

    數(shù)據(jù)中心
    jf_51241005
    發(fā)布于 :2024年02月23日 10:17:58

    KVM矩陣數(shù)據(jù)中心虛擬化管理的關(guān)鍵組件

    隨著信息技術(shù)的快速發(fā)展,數(shù)據(jù)中心已經(jīng)成為企業(yè)IT基礎(chǔ)設(shè)施的核心。在數(shù)據(jù)中心中,虛擬化技術(shù)是提高資源利用率、降低運營成本的關(guān)鍵。而KVM矩陣作為數(shù)據(jù)中心虛擬化管理的關(guān)鍵組件,發(fā)揮著至關(guān)重
    的頭像 發(fā)表于 02-18 14:38 ?568次閱讀

    KVM矩陣:打造無縫的數(shù)據(jù)中心管理體驗

    在信息技術(shù)日新月異的時代,數(shù)據(jù)中心的管理效率與安全性已成為企業(yè)競爭力的重要組成部分。KVM矩陣,作為一種創(chuàng)新的遠(yuǎn)程管理解決方案,正在逐漸嶄露頭角,它以其獨特的功能和優(yōu)勢,為打造無縫的數(shù)據(jù)中心管理
    的頭像 發(fā)表于 02-18 14:36 ?457次閱讀
    KVM<b class='flag-5'>矩陣</b>:打造無縫的<b class='flag-5'>數(shù)據(jù)中心</b>管理體驗

    KVM矩陣技術(shù)的未來趨勢:融合新興科技,引領(lǐng)數(shù)據(jù)中心管理新潮流

    隨著信息技術(shù)的持續(xù)進(jìn)步,KVM矩陣技術(shù)作為數(shù)據(jù)中心管理的核心組件,正不斷融合新興科技,以應(yīng)對日益增長的數(shù)據(jù)中心復(fù)雜性和需求。本文將探討KVM矩陣技術(shù)的未來趨勢,以及它如何引領(lǐng)
    的頭像 發(fā)表于 02-18 14:34 ?530次閱讀
    KVM<b class='flag-5'>矩陣</b>技術(shù)的未來趨勢:融合新興科技,引領(lǐng)<b class='flag-5'>數(shù)據(jù)中心</b>管理新潮流

    #緊套光纜 #松套光纜 #數(shù)據(jù)中心

    數(shù)據(jù)中心光纜
    jf_51241005
    發(fā)布于 :2024年01月26日 09:44:11