0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RDMA網(wǎng)卡相比以太網(wǎng)卡的優(yōu)勢(shì)在哪里呢?

Linux閱碼場 ? 來源:Linux閱碼場 ? 2023-04-11 10:36 ? 次閱讀

RDMA 技術(shù)簡介

不過,相對(duì)于以太網(wǎng)方案,RDMA 方案對(duì)網(wǎng)卡提出了新的要求,主要有兩點(diǎn)。

? 能夠解析頁表:由于應(yīng)用程序申請(qǐng)的數(shù)據(jù)緩存一般都是虛擬地址連續(xù)而物理地址不連續(xù)的,因此要求硬件有解析頁表的能力,能夠訪問物理地址不連續(xù)的緩存。注意,此處所說的頁表是軟件專門為 RDMA 網(wǎng)卡建立的,不是 MMU 訪問的頁表。

? 能夠封裝和解析數(shù)據(jù)包:網(wǎng)卡需要按照協(xié)議,在發(fā)送數(shù)據(jù)前加上協(xié)議報(bào)頭與校驗(yàn)和,并在接收數(shù)據(jù)后將其剝離。

13.2 RDMA 的優(yōu)勢(shì)

人們經(jīng)常用 100M、1G、10G、25G、100G(單位為 bit/s)等描述網(wǎng)卡支持的最大帶寬(常被稱為速率),無論是以太網(wǎng)卡和 RDMA 網(wǎng)卡都是如此。但如果同為 100G 帶寬,除了降低了 CPU 的工作負(fù)載,單純從網(wǎng)絡(luò)性能方面考慮,RDMA 網(wǎng)卡相比以太網(wǎng)卡的優(yōu)勢(shì)在哪里呢?

先考慮使用以太網(wǎng)卡的情況。假設(shè)應(yīng)用程序從時(shí)刻 0 開始產(chǎn)生數(shù)據(jù)(Data),之后每 1ns(納秒)持續(xù)產(chǎn)生 1 個(gè) Data(100 位),每個(gè) Data 產(chǎn)生之后的每個(gè)操作步驟都花費(fèi) 1ns,可以得到如圖 13-4 所示的數(shù)據(jù)流水線模型。

edfaf3d2-d810-11ed-bfe3-dac502259ad0.jpg

對(duì)應(yīng)圖 13-4 中的編號(hào),每個(gè) Data 的操作步驟如下。

① 應(yīng)用程序申請(qǐng)用戶空間緩存并寫入數(shù)據(jù)。

② 內(nèi)核協(xié)議棧申請(qǐng)內(nèi)核空間緩存,并將數(shù)據(jù)從用戶空間緩存復(fù)制到內(nèi)核空間緩存。

③ 驅(qū)動(dòng)程序操作網(wǎng)卡把數(shù)據(jù)從內(nèi)核空間緩存通過 DMA 復(fù)制到網(wǎng)卡內(nèi)部緩存。

④ 網(wǎng)卡把數(shù)據(jù)發(fā)送到對(duì)端網(wǎng)卡。

理論上只要滿足如下三個(gè)條件就可以實(shí)現(xiàn) 100Gbit/s 的發(fā)送速率。

? ①②③④每一步的操作時(shí)長都小于 1ns(實(shí)際應(yīng)該是 0.93ns,但不影響理解數(shù)據(jù)流水線模型的概念),即每一步都足夠快。

? 每隔 1ns 就有新的數(shù)據(jù)產(chǎn)生,即有源源不斷的數(shù)據(jù)。

? 從第一個(gè) Data 處理的最后一步(第 4ns)之后開始計(jì)算帶寬,即合適的計(jì)算時(shí)機(jī)。

需要注意的是,這種模式下每個(gè) Data 需要 4ns 發(fā)送到對(duì)端網(wǎng)卡,也就是說對(duì)端網(wǎng)卡當(dāng)前接收到的是 4ns 之前產(chǎn)生的數(shù)據(jù)。

基于同樣的假設(shè),可以得到 RDMA 網(wǎng)卡的數(shù)據(jù)流水線模型,如圖 13-5 所示。

對(duì)應(yīng)圖 13-5 中的編號(hào),每個(gè) Data 的操作步驟如下:

② 應(yīng)用程序向用戶空間緩存寫入數(shù)據(jù)。

② 驅(qū)動(dòng)程序操作網(wǎng)卡把數(shù)據(jù)從用戶空間緩存通過 DMA 復(fù)制到網(wǎng)卡內(nèi)部緩存。

③ 網(wǎng)卡把數(shù)據(jù)發(fā)送到對(duì)端網(wǎng)卡。

ee029df8-d810-11ed-bfe3-dac502259ad0.jpg

同樣地,只要滿足前文提到的三個(gè)條件,就可以實(shí)現(xiàn) 100Gbit/s 的發(fā)送速率。只是最后一個(gè)條件的計(jì)算時(shí)間可以提前 1ns,從第 3ns 開始算。在此可以看出 RDMA 方案的優(yōu)勢(shì):每個(gè)Data 只需要 3 ns 就可以到達(dá)對(duì)端網(wǎng)卡(即具有更低的時(shí)延)。

通信領(lǐng)域出現(xiàn)率最高的性能指標(biāo)就是帶寬和時(shí)延。簡單來說,所謂帶寬是指單位時(shí)間內(nèi)能夠傳輸?shù)臄?shù)據(jù)量(比如 100Gbit/s),而時(shí)延指的是數(shù)據(jù)從本端發(fā)出到被對(duì)端接收所消耗的時(shí)間。

相比傳統(tǒng)以太網(wǎng),RDMA 技術(shù)實(shí)現(xiàn)了更低的時(shí)延,所以 RDMA 能夠在很多對(duì)時(shí)延要求較高的場景中(比如分布式神經(jīng)網(wǎng)絡(luò)多個(gè)計(jì)算節(jié)點(diǎn)間的數(shù)據(jù)同步)得以發(fā)揮作用。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5426

    瀏覽量

    171740
  • dma
    dma
    +關(guān)注

    關(guān)注

    3

    文章

    561

    瀏覽量

    100593
  • MMU
    MMU
    +關(guān)注

    關(guān)注

    0

    文章

    91

    瀏覽量

    18292
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    77

    瀏覽量

    8949

原文標(biāo)題:好書連載 | RDMA 技術(shù)簡介(2)

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    千兆以太網(wǎng)卡芯片時(shí)鐘產(chǎn)生電路設(shè)計(jì)方案

    千兆以太網(wǎng)卡芯片時(shí)鐘產(chǎn)生電路的設(shè)計(jì)與實(shí)現(xiàn)
    發(fā)表于 04-28 07:33

    為什么初始化以太網(wǎng)卡ENC28J60會(huì)出現(xiàn)錯(cuò)誤?

    做52實(shí)驗(yàn)的時(shí)候,初始化以太網(wǎng)卡 ENC28J60偶爾出現(xiàn)初始化錯(cuò)誤。當(dāng)我把中斷加入后(就是把實(shí)驗(yàn)5 外部中斷)的代碼移植過去后,編譯沒報(bào)錯(cuò),也沒什么警告燒進(jìn)程序后運(yùn)行,就卡在初始化網(wǎng)卡這了
    發(fā)表于 07-30 04:17

    高效的以太網(wǎng)卡電路怎么實(shí)現(xiàn)?

    要求不高的場合使用。而VESA、EISA網(wǎng)卡速度雖然快,但價(jià)格較貴,市場很少見。目前市場上的主流網(wǎng)卡是PCI總線的網(wǎng)卡。CPCI技術(shù)是在PCI技術(shù)基礎(chǔ)之上經(jīng)過改造而成,基于CPCI以太網(wǎng)卡
    發(fā)表于 09-18 07:42

    請(qǐng)問有synopsys三速以太網(wǎng)卡的驅(qū)動(dòng)文件嗎?

    各位大佬,我做畢設(shè)需要用到synopsys的DesignWare Core Ethernet MAC這款三速以太網(wǎng)卡,但是現(xiàn)在苦于沒有網(wǎng)卡驅(qū)動(dòng)文件,導(dǎo)致我的lwip移植一直停滯不前,求問誰有三速的驅(qū)動(dòng)文件,.c/.h都需要?萬分感謝
    發(fā)表于 03-12 04:36

    Android系統(tǒng)啟動(dòng)以太網(wǎng)卡及支持雙網(wǎng)卡共存的操作流程

    1.啟動(dòng)以太網(wǎng)卡Android系統(tǒng)中對(duì)系統(tǒng)支持的feature都放在frameworks/base/data/etc/platform.xml中,以太網(wǎng)也屬于其中一個(gè)feature。如果系統(tǒng)需要支持
    發(fā)表于 05-25 10:29

    基于CPCI總線10/100 Mb/s以太網(wǎng)卡的設(shè)計(jì)與實(shí)現(xiàn)

    基于CPCI總線10/100 Mb/s以太網(wǎng)卡的設(shè)計(jì)與實(shí)現(xiàn) 0 引 言??? 基于PCI總線的以太網(wǎng)控制器是現(xiàn)在以致將來網(wǎng)絡(luò)應(yīng)用方面的一個(gè)主要發(fā)展方向。8位ISA網(wǎng)卡目前已
    發(fā)表于 11-11 16:42 ?1235次閱讀
    基于CPCI總線10/100 Mb/s<b class='flag-5'>以太網(wǎng)卡</b>的設(shè)計(jì)與實(shí)現(xiàn)

    圖解以太網(wǎng)卡功能與用料

    圖解以太網(wǎng)卡功能與用料 網(wǎng)絡(luò)中最基礎(chǔ)的部件是什么?不是交換機(jī)也不是路由器,而是小小的不起眼但又無處不在的網(wǎng)卡。如
    發(fā)表于 12-26 13:44 ?2096次閱讀

    Intel發(fā)布業(yè)界首款雙網(wǎng)口10Gb以太網(wǎng)卡

    Intel發(fā)布業(yè)界首款雙網(wǎng)口10Gb以太網(wǎng)卡  Intel今天發(fā)布了第三代基于10GBase-T 10Gbps以太網(wǎng)標(biāo)準(zhǔn)的服務(wù)器網(wǎng)卡“X520-T2”,并首次配備了
    發(fā)表于 01-29 09:17 ?1045次閱讀

    SFN5122F低功耗低延遲10G以太網(wǎng)卡

    SFN5122F低功耗低延遲10G以太網(wǎng)卡 Solarflare推出低功耗低延遲10G以太網(wǎng)卡,SFN5122F雙端口SFP+ 10Gb以太網(wǎng)服務(wù)器適配器提供業(yè)界最低功率和最低延時(shí)。該卡
    發(fā)表于 05-05 09:00 ?1678次閱讀

    基于DSP的以太網(wǎng)卡的接口技術(shù)分析

    以太網(wǎng)是當(dāng)今最受歡迎的局域網(wǎng)之一,它包括了OSI七層模型的物理層和數(shù)據(jù)鏈路層的全部內(nèi)容1。在以太網(wǎng)中,網(wǎng)卡用于實(shí)現(xiàn)802.3規(guī)程,其代表是NOVELL公司的NE2000和3COM公司的3C503
    發(fā)表于 10-24 15:28 ?1次下載
    基于DSP的<b class='flag-5'>以太網(wǎng)卡</b>的接口技術(shù)分析

    網(wǎng)卡的分類

    根據(jù)網(wǎng)卡所支持的物理層標(biāo)準(zhǔn)與主機(jī)接口的不同,網(wǎng)卡可以分為不同的類型,如以太網(wǎng)卡和令牌環(huán)網(wǎng)卡等。根據(jù)網(wǎng)卡與主板上總線的連接方式、
    的頭像 發(fā)表于 01-04 15:58 ?3w次閱讀

    如何選擇最適合自己的RDMA網(wǎng)卡

    近些年來,RDMA網(wǎng)卡的技術(shù)應(yīng)用在全球以太網(wǎng)通訊市場上刮起一股旋風(fēng),特別是阿里、騰訊、浪潮、超微、聯(lián)想等一些互聯(lián)網(wǎng)巨頭企業(yè)在服務(wù)器上大量部署RDMA
    發(fā)表于 10-21 15:35 ?720次閱讀

    什么是以太網(wǎng)卡 以太網(wǎng)卡的未來

    以太網(wǎng)卡是一種網(wǎng)絡(luò)適配器。這些適配器支持使用電纜連接的高速網(wǎng)絡(luò)連接的以太網(wǎng)標(biāo)準(zhǔn)。 盡管它們?cè)?jīng)無處不在,但有線以太網(wǎng)端口正逐漸被計(jì)算機(jī)中的 Wi-Fi 網(wǎng)絡(luò)功能所取代,Wi-Fi 網(wǎng)絡(luò)功能提供了相對(duì)于
    發(fā)表于 12-13 13:36 ?1701次閱讀

    以太網(wǎng)卡、IB網(wǎng)卡的詳細(xì)介紹以及區(qū)別分析

    以及技術(shù)能力的提升,也出現(xiàn)了各種類型的網(wǎng)卡,如以太網(wǎng)卡和IB網(wǎng)卡等。本文也將著重介紹以太網(wǎng)卡和IB網(wǎng)卡的區(qū)別,希望能幫助到您選擇最合適的
    的頭像 發(fā)表于 10-28 17:09 ?8539次閱讀
    <b class='flag-5'>以太網(wǎng)卡</b>、IB<b class='flag-5'>網(wǎng)卡</b>的詳細(xì)介紹以及區(qū)別分析

    PXIe40G以太網(wǎng)卡資料文件

    產(chǎn)品介紹PXIe730440G以太網(wǎng)卡具有局域網(wǎng)性能加速、網(wǎng)絡(luò)安全、網(wǎng)絡(luò)融合、網(wǎng)絡(luò)虛擬化、數(shù)據(jù)中心橋接等多項(xiàng)功能,通訊帶寬為40Gbps,支持PCIE3.0串行總線接口。
    發(fā)表于 11-30 15:04 ?7次下載