InfiniBand作為一種先進的內(nèi)網(wǎng)計算平臺,已成為驅動高性能計算(HPC)、人工智能(AI)以及超大規(guī)模云基礎設施演進的核心力量,其展現(xiàn)出無可比擬的性能優(yōu)勢。專為滿足服務器級連接需求而設計,InfiniBand在服務器間的高速通信、存儲設備與網(wǎng)絡設施之間的高效互聯(lián)中扮演著至關重要的角色。這一技術憑借其卓越性能和可靠表現(xiàn),不僅被InfiniBand行業(yè)協(xié)會廣泛接納并積極推廣,更是在全球超級計算機500強榜單(TOP500 list)中占據(jù)了主導地位,成為首選互連解決方案。
值得注意的是,在TOP500系統(tǒng)列表中,有44.4%的系統(tǒng)采用了InfiniBand作為關鍵的互連技術手段,遠超過采用以太網(wǎng)技術的40.4%份額。接下來,我們將深入剖析InfiniBand相較于以太網(wǎng)的獨特之處及其在高性能網(wǎng)絡環(huán)境中的差異化應用價值。
InfiniBand與以太網(wǎng)的對比分析
InfiniBand技術概述
作為一種由InfiniBand貿(mào)易協(xié)會(IBTA)指導制定的標準化通信規(guī)范,InfiniBand專注于設計一種適用于數(shù)據(jù)中心內(nèi)部服務器、通訊基礎設施設備、存儲解決方案以及嵌入式系統(tǒng)之間互連的交換結構體系。其對標準化的高度關注確保了在高性能計算網(wǎng)絡環(huán)境中各組件間實現(xiàn)無縫集成和高效信息傳遞。
InfiniBand憑借其顯著的高帶寬及低延遲特性而聞名遐邇,目前支持諸如FDR 56Gbps、EDR 100Gbps、HDR 200Gbps乃至NDR 400Gbps/800Gbps(通過4x鏈路寬度連接時的數(shù)據(jù)傳輸速率),并有望在未來進一步提升速度閾值。此外,InfiniBand具備出色的可擴展性,可在單個子網(wǎng)內(nèi)輕松支持數(shù)萬個節(jié)點,因此成為高性能計算(HPC)環(huán)境的理想選擇。同時,借助服務質量(QoS)和故障轉移功能,InfiniBand成為了非易失性內(nèi)存快速結構化接口(NVMe-oF)存儲協(xié)議以及包括以太網(wǎng)、光纖通道(FC)和TCP/IP在內(nèi)的多種網(wǎng)絡架構中的關鍵組件。對于追求卓越性能與極致擴展性的數(shù)據(jù)中心而言,采用InfiniBand無疑是明智之舉。
以太網(wǎng)技術概述
源自施樂公司、英特爾公司和DEC共同構思的以太網(wǎng)標準,已經(jīng)成為全球范圍內(nèi)使用最為廣泛的局域網(wǎng)(LAN)數(shù)據(jù)傳輸通信協(xié)議。自20世紀70年代起,以太網(wǎng)作為一種有線通信技術被開創(chuàng)出來,用于連接各種局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)內(nèi)的設備。得益于其極高的適應性,無論是打印機還是筆記本電腦等不同類型的設備都能夠通過以太網(wǎng)實現(xiàn)相互連接,應用場景廣泛覆蓋建筑樓宇、居民住宅乃至小型社區(qū)。用戶友好的配置方式使得只需通過路由器和以太網(wǎng)連線即可簡便構建LAN網(wǎng)絡,進而整合各類如交換機、路由器和個人計算機等設備。
盡管無線網(wǎng)絡在許多場合得到廣泛應用,但以太網(wǎng)仍憑借其卓越的可靠性和抗干擾能力,在有線網(wǎng)絡領域保持著首選地位。歷經(jīng)多年的發(fā)展與修訂,以太網(wǎng)不斷提升和完善自身功能。如今,IEEE旗下802.3標準組織已經(jīng)發(fā)布了包括100GE、200GE、400GE和800GE在內(nèi)的多個以太網(wǎng)接口標準,這體現(xiàn)了業(yè)界持續(xù)推動和優(yōu)化以太網(wǎng)技術的決心與努力。
InfiniBand與以太網(wǎng)在高性能網(wǎng)絡環(huán)境中的對比分析
InfiniBand技術最初旨在解決高性能計算環(huán)境中集群間數(shù)據(jù)傳輸?shù)钠款i問題,隨著時間推移,已逐漸演變?yōu)橐环N廣泛應用的互連標準,并成功適應了現(xiàn)代多樣化的需求。相較于以太網(wǎng),InfiniBand在帶寬、延遲、網(wǎng)絡可靠性和網(wǎng)絡架構等方面表現(xiàn)出顯著差異。
網(wǎng)絡帶寬
InfiniBand的發(fā)展速度較快,尤其體現(xiàn)在其對高性能計算場景的高度優(yōu)化和降低CPU處理負載的能力上。而以太網(wǎng)盡管廣泛應用于各類終端設備間的連接,但在高帶寬需求層面并不像InfiniBand那樣迫切。
網(wǎng)絡延遲性
InfiniBand采用Cut-Through交換技術,在轉發(fā)數(shù)據(jù)時能將延時降至100納秒以內(nèi),大大提升了網(wǎng)絡響應速度。相比之下,以太網(wǎng)由于在其交換機中引入了諸如IP、MPLS、QinQ等服務所帶來的額外處理流程,導致轉發(fā)延時相對較高。
網(wǎng)絡可靠性
InfiniBand憑借明確的第1層至第4層協(xié)議格式設計以及端到端流控制機制,確保了無損網(wǎng)絡通信,為高性能計算領域提供了卓越的可靠性保障。而以太網(wǎng)則缺乏類似的基于調度的流控制機制,依賴于芯片更大的緩存區(qū)域臨時存儲消息,這不僅增加了成本,還加劇了功耗。
網(wǎng)絡管理
InfiniBand借鑒了軟件定義網(wǎng)絡(SDN)理念,使其網(wǎng)絡架構更為簡潔高效。每個第二層網(wǎng)絡內(nèi)部都配備了一個子網(wǎng)管理器,用于配置節(jié)點并智能計算轉發(fā)路徑信息。與此相反,以太網(wǎng)需要依賴MAC地址條目、IP協(xié)議以及ARP協(xié)議等多個層次實現(xiàn)網(wǎng)絡互聯(lián),從而增加了網(wǎng)絡管理的復雜性。此外,以太網(wǎng)依靠定期發(fā)送更新包來維護路由表,并通過VLAN機制劃分虛擬網(wǎng)絡邊界,限制網(wǎng)絡規(guī)模;然而這種機制可能導致環(huán)路等問題出現(xiàn),因此通常還需要STP等額外協(xié)議來進行環(huán)路避免。
深入解析InfiniBand產(chǎn)品系列
InfiniBand 交換機和光纖網(wǎng)卡
對比分析表明,相較于以太網(wǎng),InfiniBand網(wǎng)絡在高性能計算領域展現(xiàn)出了無可比擬的優(yōu)勢。對于計劃在高級數(shù)據(jù)中心部署InfiniBand交換機的用戶而言,有必要深入了解其詳細性能特點和迭代歷程。歷經(jīng)多年快速發(fā)展,InfiniBand標準已從最初的SDR 10Gbps、DDR 20Gbps、QDR 40Gbps,逐步演進到FDR 56Gbps、EDR 100Gbps,并進一步發(fā)展為HDR 200Gbps及NDR 400Gbps/800Gbps等更高速率規(guī)格,這些重大突破得益于RDMA(遠程直接內(nèi)存訪問)技術的集成應用。
飛速(FS)為此提供了一系列先進InfiniBand解決方案,其中包括NVIDIA Quantum-2 NDR InfiniBand 400G數(shù)據(jù)中心交換機以及NVIDIA Quantum HDR InfiniBand 200G數(shù)據(jù)中心交換機,這兩款產(chǎn)品均支持管理型和非管理型兩種配置模式,以滿足不同客戶對靈活性的需求。此外,為了確保全方位服務支持,針對400G交換機,飛速(FS)還提供了為期一年、三年或五年的服務選項,旨在幫助用戶實現(xiàn)高效穩(wěn)定的數(shù)據(jù)中心運行環(huán)境。
InfiniBand光模塊
InfiniBand DAC高速線纜
InfiniBand AOC有源光纜
InfiniBand技術標準概覽及優(yōu)勢分析
InfiniBand NDR(下一代數(shù)據(jù)速率)
InfiniBand NDR系列包括了適用于400Gbase/800Gbase傳輸速率的光收發(fā)器與直連銅纜(DAC),旨在兼容Mellanox NDR 400Gb交換機,如MQM9700/MQM9790系列。這些組件在GPU加速計算場景中提供了高性能連接,并有望節(jié)省高達50%的成本。它們特別適合于高性能計算(HPC)、云計算、模型渲染和基于InfiniBand 400Gb/800Gb網(wǎng)絡的存儲應用。
InfiniBand HDR(高數(shù)據(jù)速率)
飛速(FS)推出的InfiniBand HDR產(chǎn)品線涵蓋了多樣化的高速互聯(lián)產(chǎn)品,例如200Gb/s和400Gb/s QSFP56 IB HDR多模光纖(MMF)有源/無源光纜(AOC)、有源/無源直連銅纜(DAC)、光學收發(fā)器路由器以及200G交換機等。這些模塊和電纜能夠無縫銜接MQM8700/MQM8790等交換機與NVIDIA GPU(如A100/H100/A30)和CPU服務器,以及ConnectX-5/6/7 VPI等存儲網(wǎng)絡適配器。此類解決方案不僅可實現(xiàn)最高達50%的成本節(jié)約,而且在涉及GPU加速的高性能計算(HPC)集群應用——包括模型渲染、人工智能(AI)、深度學習(DL)以及InfiniBand HDR環(huán)境下的NVIDIA應用網(wǎng)絡通信時表現(xiàn)出卓越性能。
InfiniBand EDR(增強數(shù)據(jù)速率)
InfiniBand EDR產(chǎn)品系列提供了一系列100Gbase QSFP28 EDR AOC、EDR DAC、AOC及光收發(fā)器,專為GPU加速計算設計,具有成本效益高且性能優(yōu)越的特點。
InfiniBand FDR(十四倍數(shù)據(jù)速率)
InfiniBand FDR產(chǎn)品范圍包括了40Gbase QSFP+ FDR10 AOC、DAC及光收發(fā)器,以及56Gbase QSFP+ FDR DAC和AOC。所有這些產(chǎn)品均可無縫整合到Mellanox EDR交換機之中。
InfiniBand在網(wǎng)絡高效能計算中的顯著優(yōu)勢
隨著數(shù)據(jù)通信、互聯(lián)網(wǎng)技術和可視化展現(xiàn)需求的不斷提升,對計算能力、存儲容量以及網(wǎng)絡效率的需求也隨之增長。在此背景下,InfiniBand網(wǎng)絡憑借其提供的高帶寬服務、低延遲特性以及將協(xié)議處理和數(shù)據(jù)移動從CPU轉移到互連層以減少計算資源消耗的獨特優(yōu)勢,成為了高性能計算數(shù)據(jù)中心的理想選擇。此技術廣泛應用于Web 2.0、云計算、大數(shù)據(jù)處理、金融服務、虛擬化數(shù)據(jù)中心以及存儲應用等領域,帶來了顯著的性能提升效果。
速度方面,InfiniBand已超越100G以太網(wǎng),目前支持從100G/200G到400G/800G不等的InfiniBand交換機配置,完美契合HPC架構的高性能要求。InfiniBand交換機通過高帶寬、高速度與低延遲的有效結合,有力提升了服務器效能和應用運行效率。
擴展性是InfiniBand另一項突出優(yōu)點,單個子網(wǎng)能夠在網(wǎng)絡層2上支持多達48,000個節(jié)點,相比以太網(wǎng),它減少了對ARP廣播機制的依賴,有效避免了廣播風暴并減輕了額外帶寬浪費。此外,多個子網(wǎng)可以靈活地關聯(lián)至交換機,進一步增強了網(wǎng)絡的靈活性。
飛速(FS)深刻認識到高性能計算的重要性,因此提供了一系列基于Quantum InfiniBand交換設備構建的InfiniBand產(chǎn)品。這些產(chǎn)品支持高達16Tb/s的無阻塞帶寬,并擁有低于130ns的端口間延遲,確保為HPC數(shù)據(jù)中心提供高可用性和多服務支持。盡管以太網(wǎng)網(wǎng)絡通過跨多個設備分配工作負載仍不失為有效的數(shù)據(jù)傳輸選項,但FS同樣供應一系列多速率以太網(wǎng)交換機,協(xié)助客戶構建既靈活又高效的網(wǎng)絡環(huán)境。
選擇合適的網(wǎng)絡
在選擇合適的網(wǎng)絡技術時,InfiniBand與以太網(wǎng)各自在不同應用場景中展現(xiàn)出獨特優(yōu)勢。當聚焦于顯著提升數(shù)據(jù)傳輸速率、優(yōu)化網(wǎng)絡資源利用率并有效減輕CPU在網(wǎng)絡數(shù)據(jù)處理方面的負擔時,InfiniBand網(wǎng)絡憑借其核心技術優(yōu)勢,在高性能計算領域脫穎而出,成為關鍵的解決方案。
然而,在數(shù)據(jù)中心環(huán)境中,若節(jié)點間通信延遲并非首要考量因素,且更加重視網(wǎng)絡接入的靈活性與擴展性,則以太網(wǎng)網(wǎng)絡能夠提供一種長期穩(wěn)定且適應性強的基礎設施支持。
InfiniBand網(wǎng)絡憑借其卓越性能和創(chuàng)新架構設計,為HPC數(shù)據(jù)中心用戶帶來了前所未有的業(yè)務效能優(yōu)化潛力。通過消除多層級結構所導致的延遲問題,并確保關鍵計算節(jié)點能無縫升級接入帶寬,InfiniBand技術對于整體運營效率的提升起到了決定性作用。隨著其應用范圍不斷擴大和技術認可度持續(xù)攀升,預計未來InfiniBand網(wǎng)絡將在更多復雜且要求嚴苛的應用場景中得到廣泛應用和部署。
-
以太網(wǎng)
+關注
關注
40文章
5447瀏覽量
172134 -
計算機
+關注
關注
19文章
7522瀏覽量
88290 -
AI
+關注
關注
87文章
31225瀏覽量
269579 -
InfiniBand
+關注
關注
1文章
29瀏覽量
9197
原文標題:InfiniBand:賦能高性能計算網(wǎng)絡的卓越引擎
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論