0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹一種具備RDMA功能的FPGA網(wǎng)卡實現(xiàn)方案—RNIC

網(wǎng)絡(luò)交換FPGA ? 來源:網(wǎng)絡(luò)交換FPGA ? 2023-10-22 09:42 ? 次閱讀

傳統(tǒng)TCP/IP技術(shù)處理數(shù)據(jù)包需通過操作系統(tǒng)和其他軟件層,導(dǎo)致數(shù)據(jù)在系統(tǒng)內(nèi)存、處理器緩存和網(wǎng)絡(luò)控制器緩存間頻繁復(fù)制,增加了服務(wù)器CPU和內(nèi)存的負擔(dān),特別是在網(wǎng)絡(luò)帶寬、處理器速度與內(nèi)存帶寬不匹配時,網(wǎng)絡(luò)延遲會進一步加劇。RDMA技術(shù)通過將數(shù)據(jù)處理從CPU旁路并卸載到硬件上來實現(xiàn)低時延和高帶寬特性。

基于這一研究背景,介紹一種具備RDMA功能的FPGA網(wǎng)卡實現(xiàn)方案—RNIC 。本方案以Corundum開源高性能原型平臺為基礎(chǔ), 實現(xiàn)了100Gbps的RoCE v2網(wǎng)絡(luò)協(xié)議棧卸載加速;在保留Corundum原生PCIe DMA引擎等組件的基礎(chǔ)上,通過精準的拆分設(shè)計、邏輯耦合和路徑復(fù)用,將RoCE v2網(wǎng)絡(luò)協(xié)議棧嵌入以太網(wǎng)網(wǎng)卡設(shè)計。方案支持單邊RDMA READ和RDMA WRITE操作、雙邊SEND/RECV操作以及立即數(shù)操作,提供Back-to-N的重傳機制保障數(shù)據(jù)傳輸完整性的同時提供了可達256的Outstanding能力, 并支持基于DCQCN算法的擁塞控制機制為本方案在數(shù)據(jù)中心等場景的大規(guī)模部署提供保障。實測RNIC能夠?qū)崿F(xiàn)低至4us左右的硬件端到端延遲以及高達96Gbps的吞吐量。

c9de27e4-7004-11ee-939d-92fbcf53809c.png

c9f20796-7004-11ee-939d-92fbcf53809c.png

我們實現(xiàn)的100G RDMA網(wǎng)卡具體指標和性能如下:

ca08de44-7004-11ee-939d-92fbcf53809c.png

ca17efb0-7004-11ee-939d-92fbcf53809c.png

測試場景及拓撲連接圖如下。

ca26297c-7004-11ee-939d-92fbcf53809c.png

ca436622-7004-11ee-939d-92fbcf53809c.png

TCP測試結(jié)果如下。

ca51fe6c-7004-11ee-939d-92fbcf53809c.png

TCP性能表現(xiàn):實測在Linux系統(tǒng)環(huán)境下,端到端連接拓撲,當(dāng)MTU=9214B,不進行多核優(yōu)化時,本方案的iperf TCP帶寬可達59.7G bps;CPU占用率為12%左右 ; TCP/IP協(xié)議普遍延遲在100–200微秒之間。

TCP測試分析:性能開銷集中在內(nèi)核協(xié)議棧的系統(tǒng)調(diào)用、內(nèi)存拷貝、協(xié)議處理與中斷處理等方面。這些開銷占用了大量的CPU 資源,增加了數(shù)據(jù)延遲。

RDMA測試結(jié)果如下。

ca651ff6-7004-11ee-939d-92fbcf53809c.png

ca822600-7004-11ee-939d-92fbcf53809c.png

RDMA性能表現(xiàn):在Linux系統(tǒng)環(huán)境下,相同測試拓撲,使用配套驅(qū)動程序和應(yīng)用程序發(fā)送RDMA命令進行測試。本方案的RDMA網(wǎng)卡實測單邊RDMA語義讀寫帶寬可達96.28G bps;CPU占用率不超過0.3%;硬件端到端讀寫延遲低至4us左右。

RDMA測試分析:當(dāng)消息大小大于8KB時,系統(tǒng)吞吐量可以逼近滿帶寬,當(dāng)消息較小時,吞吐量會顯著降低。原因一方面是數(shù)據(jù)幀幀頭開銷占比上升導(dǎo)致有效帶寬下降,另一方面在于硬件設(shè)計無法支撐更高的消息速率。時延會隨消息大小出現(xiàn)近似線性的增長,最大的延遲花費在PCIe鏈路和網(wǎng)絡(luò)鏈路上,硬件的處理開銷占比很小。

對比以太網(wǎng)和RDMA的測試結(jié)果可知,在相同的硬件條件下,使用RDMA技術(shù)的網(wǎng)卡可以擁有更高的網(wǎng)絡(luò)帶寬和更低的傳輸時延,對于云服務(wù)、數(shù)據(jù)中心等具有高吞吐量的網(wǎng)絡(luò)業(yè)務(wù)需求場景,RDMA技術(shù)更能滿足實際需要,能充分解放處理器資源,提高帶寬,降低成本。

下面視頻詳細介紹實際測試情況:

我們未來有很多工作要做,如添加我們之前做的P4可編程的工作(【Verilog開源】一種用于智能網(wǎng)卡或可編程交換機的,支持P4語言的高性能開源解析器的設(shè)計),突破Corundum架構(gòu)限制支持百萬QP對和提升小包性能,進一步優(yōu)化流量控制、擁塞管理和負載均衡等問題,進一步的提高數(shù)據(jù)中心網(wǎng)絡(luò)的數(shù)據(jù)傳輸速率和穩(wěn)定性。

ca95e032-7004-11ee-939d-92fbcf53809c.png ?








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1640

    文章

    21903

    瀏覽量

    611451
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5541

    瀏覽量

    174030
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    9156
  • PCIe接口
    +關(guān)注

    關(guān)注

    0

    文章

    121

    瀏覽量

    9978
  • TCP通信
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    4394

原文標題:【實測】基于Corundum架構(gòu)的100G RDMA網(wǎng)卡

文章出處:【微信號:gh_cb8502189068,微信公眾號:網(wǎng)絡(luò)交換FPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    RDMA RNIC虛擬化方案

    主要包括Inifiband、RoCE以及iWARP。實現(xiàn)RDMA協(xié)議的I/O設(shè)備被稱為RNIC。主流云服務(wù)提供商已經(jīng)開始廣泛部署RNIC,例如亞馬遜云推出的彈性網(wǎng)絡(luò)適配器(Elasti
    的頭像 發(fā)表于 01-23 17:23 ?2626次閱讀
    <b class='flag-5'>RDMA</b> <b class='flag-5'>RNIC</b>虛擬化<b class='flag-5'>方案</b>

    一種基于FPGA的多通道頻率測量系統(tǒng)的實現(xiàn)方法介紹

    設(shè)計了一種多通道頻率測量系統(tǒng)。系統(tǒng)由模擬開關(guān)、信號調(diào)理電路、FPGA、總線驅(qū)動電路構(gòu)成,實現(xiàn)對頻率信號的分壓、放大、濾波、比較、測量,具備回路自測試
    發(fā)表于 06-27 07:23

    一種復(fù)數(shù)浮點協(xié)方差矩陣的實現(xiàn)方案

    本文介紹一種基于FPGA的復(fù)數(shù)浮點協(xié)方差矩陣實現(xiàn)方案
    發(fā)表于 04-29 06:01

    如何利用FPGA芯片去實現(xiàn)SEC功能?

    本文介紹一種采用單片現(xiàn)場可編程門陣列(FPGA)芯片實現(xiàn)SEC功能方案。
    發(fā)表于 04-29 06:21

    分享一種FPGA的動態(tài)配置方案

    本文提出了一種基于嵌入式系統(tǒng)和Internet的FPGA動態(tài)配置方案。
    發(fā)表于 05-27 06:38

    RT-thread實現(xiàn)U盤升級的一種OTA方案

    我前面介紹過RT-thread的一種OTA方案,可以通過串口或者網(wǎng)絡(luò)進行遠程升級,那今天在原來的這套方案的基礎(chǔ)上做些修改,
    發(fā)表于 01-20 06:17

    分享一種智能網(wǎng)卡對熱遷移支持的新思路

    正因為它對VM呈現(xiàn)的是虛擬設(shè)備,即virtio設(shè)備,它可以很容易的支持熱遷移的特性。對于智能網(wǎng)卡廠商,尤其面對人力資源投入有限的情況下,通過遵循vDPA的規(guī)范可以達到一種快速有效的支持熱遷移的方案
    發(fā)表于 07-05 14:46

    一種基于FPGA的誤碼性能測試方案

    摘要:提出了一種基于FPGA的誤碼測試方案,并簡要介紹了該方案的設(shè)計思想。 關(guān)鍵詞:誤碼儀 數(shù)字微波傳輸 ACEX1K系列
    發(fā)表于 06-20 15:09 ?1008次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>FPGA</b>的誤碼性能測試<b class='flag-5'>方案</b>

    一種通用SPI接口的FPGA設(shè)計與實現(xiàn)

    SPI 串行總線是一種常用的標準接口,其使用簡單方便而且占用系統(tǒng)資源少,應(yīng)用相當(dāng)廣泛。本文將介紹一種新的通用的SPI 總線的FPGA 實現(xiàn)
    發(fā)表于 09-09 11:58 ?67次下載
    <b class='flag-5'>一種</b>通用SPI接口的<b class='flag-5'>FPGA</b>設(shè)計與<b class='flag-5'>實現(xiàn)</b>

    一種基于FPGA的ZigBee物理層發(fā)射機的數(shù)字基帶實現(xiàn)方案_陳

    一種基于FPGA的ZigBee物理層發(fā)射機的數(shù)字基帶實現(xiàn)方案_陳迪平
    發(fā)表于 03-14 16:54 ?6次下載

    如何選擇最適合自己的RDMA網(wǎng)卡

    近些年來,RDMA網(wǎng)卡的技術(shù)應(yīng)用在全球以太網(wǎng)通訊市場上刮起股旋風(fēng),特別是阿里、騰訊、浪潮、超微、聯(lián)想等些互聯(lián)網(wǎng)巨頭企業(yè)在服務(wù)器上大量部署RDMA
    發(fā)表于 10-21 15:35 ?846次閱讀

    RDMA是什么?RDMA網(wǎng)卡有什么作用?

    近幾年RDMA這個詞在行業(yè)內(nèi)炒的如火如荼,但是很多人表示RDMA具體是什么?主要應(yīng)用在哪些領(lǐng)域,有什么作用?RDMA都有哪幾種協(xié)議?今天小編就這幾個問題給大家科普下。
    發(fā)表于 12-27 17:15 ?1.3w次閱讀

    RDMA技術(shù)有助于實現(xiàn)網(wǎng)絡(luò)和設(shè)備的性能提升

    RDMA作為一種遠程直接內(nèi)存訪問技術(shù),可以使數(shù)據(jù)通過應(yīng)用程序繞過CPU直達網(wǎng)卡實現(xiàn)低延遲、低負載、高效率的數(shù)據(jù)傳輸。從而提升網(wǎng)絡(luò)和設(shè)備性能。
    發(fā)表于 03-28 15:03 ?743次閱讀

    NVIDIA ConnectX智能網(wǎng)卡驅(qū)動RDMA通訊技術(shù)在分布式存儲的應(yīng)用

    NVIDIA ConnectX 智能網(wǎng)卡及開源 UCX 框架幫助網(wǎng)易高性能 RDMA 網(wǎng)絡(luò)通訊功能實現(xiàn)更優(yōu)表現(xiàn),助力網(wǎng)易通過 Curve 開源項目為 Apache BRPC 自主
    的頭像 發(fā)表于 11-03 09:48 ?1246次閱讀

    RDMA網(wǎng)卡相比以太網(wǎng)卡的優(yōu)勢在哪里呢?

    不過,相對于以太網(wǎng)方案RDMA 方案網(wǎng)卡提出了新的要求,主要有兩點。
    的頭像 發(fā)表于 04-11 10:36 ?4064次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品