服務(wù)器網(wǎng)卡(NIC)的主要功能是管理和處理網(wǎng)絡(luò)流量。與日常生活中接觸到的計(jì)算機(jī)網(wǎng)卡相比,服務(wù)器網(wǎng)卡通常要求更高的數(shù)據(jù)傳輸速度,如10G、25G、40G、100G甚至200G、400G。
現(xiàn)如今,在數(shù)據(jù)中心和云計(jì)算領(lǐng)域,25G以太網(wǎng)憑借其高性能帶寬、低成本、低功耗、增強(qiáng)計(jì)算和存儲(chǔ)效率等優(yōu)勢(shì)正迅速成為下一代數(shù)據(jù)中心主流趨勢(shì)。
目前市場(chǎng)上主流的25G光纖網(wǎng)卡包括Intel英特爾XXV710系列,NVIDIA ConnectX-5 EN、ConnectX-6 Lx系列,和新增的Intel英特爾E810系列等。本文將會(huì)就Intel和NVIDIA這幾個(gè)系列中4款熱門的以太網(wǎng)卡型號(hào):英特爾 XXV710-DA2、NVIDIA MCX512A-ACAT、英特爾 E810-XXVDA2、NVIDIA MCX631102AN-ADAT一一進(jìn)行對(duì)比分析。
25G網(wǎng)卡對(duì)比:NVIDIA vs Intel
同樣作為25G雙口光纖網(wǎng)卡,這4款網(wǎng)卡在光纖端口、速率、總線、主要功能上有很大的相似性。通過下面的表格我們可以詳細(xì)看到英特爾XXV710-DA2 vs. NVIDIA MCX512A-ACAT,英特爾E810-XXVDA2 vs. NVIDIA MCX631102AN-ADAT的差異點(diǎn)在哪里。
4款25G光纖網(wǎng)卡常見功能解讀
在高性能計(jì)算領(lǐng)域,光纖網(wǎng)卡作為服務(wù)器和網(wǎng)絡(luò)設(shè)備連接的重要媒介之一擁有著眾多復(fù)雜且必要的功能。這里我們將解釋上文對(duì)比的4款25G網(wǎng)卡具有的一些常用功能。
RoCE:基于以太網(wǎng)的RDMA技術(shù)(RDMA over Converged Ethernet),目前有三種RDMA(遠(yuǎn)程直接內(nèi)存訪問)網(wǎng)絡(luò),分別是InfiniBand、RoCE、iWARP。
RoCE 和 iWARP都是基于以太網(wǎng)的RDMA技術(shù),這使高速、超低延時(shí)、極低CPU使用率的RDMA技術(shù)得以部署在目前使用最廣泛的以太網(wǎng)上。
RoCE是在InfiniBand Trade Association(IBTA)標(biāo)準(zhǔn)中定義的網(wǎng)絡(luò)協(xié)議,允許通過以太網(wǎng)使用遠(yuǎn)程直接內(nèi)存訪問(RDMA)。它可以看作是RDMA技術(shù)在數(shù)據(jù)中心、云、存儲(chǔ)和虛擬化環(huán)境中的應(yīng)用。RoCE協(xié)議有RoCEv1和RoCEv2兩個(gè)版本,RoCEv1是基于以太網(wǎng)鏈路層實(shí)現(xiàn)的RDMA協(xié)議(交換機(jī)需要支持PFC等流控技術(shù),在物理層保證可靠傳輸),只允許在同一個(gè)二層網(wǎng)絡(luò)中的主機(jī)進(jìn)行通信,目前已使用較少。RoCEv2提供了基于三層網(wǎng)絡(luò)的RDMA能力,數(shù)據(jù)包封裝包含IP和UDP報(bào)文頭,解決了擴(kuò)展性問題,RoCE v2可以適配更多地通用網(wǎng)絡(luò)場(chǎng)景。
iWARP:同樣是允許通過以太網(wǎng)使用遠(yuǎn)程直接內(nèi)存訪問(RDMA)進(jìn)行數(shù)據(jù)傳輸?shù)木W(wǎng)絡(luò)協(xié)議?;赥CP的RDMA網(wǎng)絡(luò),利用TCP達(dá)到可靠傳輸。相比RoCE,在大型組網(wǎng)的情況下,iWARP的大量TCP連接會(huì)占用大量的內(nèi)存資源,對(duì)系統(tǒng)規(guī)格要求更高??梢允褂闷胀ǖ囊蕴W(wǎng)交換機(jī),但是需要支持iWARP的網(wǎng)卡。
NVIDIA ZTR(Zero Touch RoCE):NVIDIA開發(fā)的ZTR技術(shù),是一種具有往返時(shí)間擁塞控制的縮放零接觸RoCE技術(shù),能使數(shù)據(jù)中心無縫部署聚合以太網(wǎng)上的RDMA,而無需任何配置。數(shù)據(jù)中心運(yùn)營(yíng)商可以在無需任何交換機(jī)配置的情況下,享受部署和操作的便利性,以及大規(guī)模遠(yuǎn)程直接內(nèi)存訪問的卓越性能。實(shí)現(xiàn)了更具可擴(kuò)展性、彈性且易于部署的RoCE解決方案。
Selective Repeat:選擇性重傳,RoCE Selective Repeat 在RoCE 中引入了一種新的QP重傳模式,其中丟棄的數(shù)據(jù)包恢復(fù)是通過重新發(fā)送數(shù)據(jù)包而不是重新發(fā)送PSN窗口來完成的(Go-Back-N 協(xié)議)。這個(gè)功能在NVIDIAConnectX6Dx/Lx系列產(chǎn)品中默認(rèn)支持。
動(dòng)態(tài)傳輸連接(DCT):是一種通信模式,動(dòng)態(tài)連接的傳輸服務(wù)是對(duì)傳輸服務(wù)的擴(kuò)展,可實(shí)現(xiàn)RoCE網(wǎng)絡(luò)更高程度的可擴(kuò)展性,同時(shí)保持稀疏流量的高性能。
GPUDirectRDMA加速技術(shù):NVIDIA PeerDirect 通信通過消除 PCIe 總線上組件之間不必要的內(nèi)部數(shù)據(jù)復(fù)制(例如,從 GPU 到 CPU)提供了高效的 RDMA 訪問,因此顯著減少了應(yīng)用程序運(yùn)行時(shí)間。
OVS Offload(ASAP2,Accelerated Switching And Packet Processing):Open vSwitch (OVS)是一個(gè)高質(zhì)量、多層的虛擬交換軟件,允許虛擬機(jī) (VM) 相互通信并與外部世界通信。Offload數(shù)據(jù)平面到網(wǎng)卡芯片的eswitch,從而實(shí)現(xiàn)性能提升,并降低CPU開銷。使用ASAP2的開放式 vSwitch (OVS) 卸載,靈活的匹配動(dòng)作流表,隧道封裝/解封裝。
SR-IOV:SR-IOV技術(shù)是一種基于硬件的虛擬化解決方案,可提高性能和可伸縮性。SR-IOV 規(guī)范定義了新的標(biāo)準(zhǔn),根據(jù)該標(biāo)準(zhǔn),創(chuàng)建的新設(shè)備可允許將虛擬機(jī)直接連接到 I/O 設(shè)備,越過了hypervisor與虛擬交換機(jī)層,這樣可以帶來低延遲和接近物理網(wǎng)卡的吞吐性能。SR-IOV是虛擬化的一個(gè)重要功能。啟用SR-IOV的這個(gè)功能,將提高網(wǎng)絡(luò)性能,降低網(wǎng)絡(luò)時(shí)延等,為服務(wù)器內(nèi)的虛擬機(jī)(VM) 提供專用的適配器資源和有保證的隔離和保護(hù)。
VirtIOAcceleration:VirtIO是一種 I/O 半虛擬化解決方案,是一套通用 I/O 設(shè)備虛擬化的程序。virtIO Acceleration是網(wǎng)卡基于標(biāo)準(zhǔn)的virtIO驅(qū)動(dòng),基于硬件實(shí)現(xiàn)性能的優(yōu)化提升。
VMDq:虛擬機(jī)設(shè)備隊(duì)列(VMDq)是一項(xiàng)芯片級(jí)的技術(shù),可以為基于軟件的NIC共享創(chuàng)建并行隊(duì)列,可以將網(wǎng)絡(luò)I/O管理負(fù)擔(dān)從hypervisor上卸載掉。
iSCSI:Internet小型計(jì)算機(jī)系統(tǒng)接口(Internet Small Computer System Interface),是一種基于IP的存儲(chǔ)網(wǎng)絡(luò)標(biāo)準(zhǔn),在TCP/IP網(wǎng)絡(luò)上通過發(fā)送SCSI命令來訪問塊存儲(chǔ)服務(wù)。常用于內(nèi)部網(wǎng)絡(luò)的數(shù)據(jù)傳輸和遠(yuǎn)距離管理存儲(chǔ)。
NVMe over Fabric(NVMe-oF):是一個(gè)相對(duì)較新的協(xié)議規(guī)范,旨在使用NVMe通過網(wǎng)絡(luò)結(jié)構(gòu)將主機(jī)連接到存儲(chǔ),支持對(duì)數(shù)據(jù)中心的計(jì)算和存儲(chǔ)進(jìn)行分解。NVMe over Fabric支持把NVMe映射到多種Fabrics的傳輸選項(xiàng),包括前面提到的InfiniBand、RoCE和iWARP這三大支持RDMA的理想Fabrics。標(biāo)準(zhǔn)數(shù)據(jù)塊和文件訪問協(xié)議可以利用RDMA用于高性能存儲(chǔ)訪問以及用于目標(biāo)機(jī)器的NVMe over Fabric卸載。
Data Integrity Validation (T10-DIF):是用戶數(shù)據(jù)的一種端到端的保護(hù)機(jī)制,提供一種方法檢查從主機(jī)總線適配器通過存儲(chǔ)網(wǎng)絡(luò)寫到磁盤和讀取回的數(shù)據(jù)的完整性。這種檢查通過T10標(biāo)準(zhǔn)中定義的數(shù)據(jù)完整性字段來實(shí)現(xiàn)。
Intelligent Offloads(智能卸載):通過VMDq和靈活的端口分區(qū)等智能卸載,可以減少I/O瓶頸。將SR-IOV(單根I/O虛擬化)用于每個(gè)虛擬機(jī)(VM)的網(wǎng)絡(luò)流量,從而實(shí)現(xiàn)接近本機(jī)的性能和VM可伸縮性。
FCoE:以太網(wǎng)光纖通道,是一種計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)。通過以太網(wǎng)網(wǎng)絡(luò)封裝光纖通道幀,允許光纖通道在保留其協(xié)議的同時(shí)使用10/25/40GbE以太網(wǎng)。
Secure boot(HW RoT):通過HW RoT提供供應(yīng)鏈保護(hù),用于安全啟動(dòng)以及使用 RSA 加密和克隆保護(hù)的安全固件更新,通過設(shè)備唯一密鑰,以保證固件的真實(shí)性。
總結(jié)
通過上述兩大主流品牌4款25G光纖網(wǎng)卡的對(duì)比,可以看出NVIDIA ConnecX-5 EN,ConnectX-6 Lx 在RoCE功能、虛擬化和容器化技術(shù)、儲(chǔ)存協(xié)議、可支持的操作系統(tǒng)等能力上有更優(yōu)的表現(xiàn)。NVMe over Fabrics存儲(chǔ)卸載技術(shù)、加速交換和數(shù)據(jù)包處理(ASAP2)等等保障了高性能的可擴(kuò)展網(wǎng)絡(luò),并兼容所有NVIDIA SmartNIC軟件協(xié)議棧。結(jié)合ZTR(Zero Touch Roce),還可幫助用戶在無需交換機(jī)配置情況下,快速實(shí)現(xiàn)零接觸RoCE 部署,達(dá)到與傳統(tǒng)無損RoCE解決方案相當(dāng)?shù)男阅堋?/p>
尤其是ConnectX-6 Lx,在25G網(wǎng)卡市場(chǎng)上,它延續(xù)了NVIDIA在網(wǎng)絡(luò)方面的一貫創(chuàng)新,充分利用了軟件定義和硬件加速等先進(jìn)技術(shù),將更多的安全和網(wǎng)絡(luò)處理工作從CPU卸載到網(wǎng)卡上來,可在各種規(guī)模上提供強(qiáng)大的敏捷性和更高效率。ConnectX-6 Lx行業(yè)領(lǐng)先的RoCE和SDN加速功能為數(shù)據(jù)中心提供尖端的25GbE性能和安全性,是NVIDIA高性能以太網(wǎng)卡產(chǎn)品ConnectX網(wǎng)絡(luò)適配器系列的成員。
審核編輯 黃昊宇
-
英特爾
+關(guān)注
關(guān)注
61文章
9967瀏覽量
171795 -
網(wǎng)卡
+關(guān)注
關(guān)注
4文章
311瀏覽量
27386 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91115
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論