0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA BlueField-2 DPU性能測試方法

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-01-04 14:25 ? 次閱讀

查看文末海報,免費注冊成為 DOCA 開發(fā)者!

DPU(數(shù)據(jù)處理器)將服務器和存儲之間的 IOPS 性能提升至 4100 萬以上,超過之前世界紀錄的四倍。

數(shù)據(jù)中心需要超高速存儲訪問,而目前還沒有哪個 DPU 的速度能比 NVIDIA BlueField-2 更快。

NVIDIA 近期測試顯示,兩個 BlueField-2 DPU(數(shù)據(jù)處理器)的每秒輸入/輸出(IOPS)性能達到 4150 萬次,超過任何其他 DPU 性能的 4 倍。

BlueField-2 DPU 使用標準網絡協(xié)議和開源軟件打破性能紀錄,使用業(yè)界常用的存儲介質訪問方法 NVMe over Fabrics(NVMe-oF)以及最通用的互聯(lián)網協(xié)議之一 TCP 網絡,其 4KB IOPS 性能超過 500 多萬,而 512B IOPS 則達到 700 萬至 2000 萬以上。

為了加速 AI、大數(shù)據(jù)和高性能計算應用,BlueField 還支持流行的 RoCE 網絡傳輸選項以提供更高的存儲性能。

在測試中,initiator 端和 target 端都部署了 BlueField,使用不同類型的存儲軟件庫和不同的應用來模擬真實世界的存儲配置,都展現(xiàn)出超強的性能。BlueField 在 InfiniBand 網絡上還支持快速存儲連接,而 InfiniBand 是許多 HPC 和 AI 應用的首選網絡架構。

測試方法

BlueField 所達到的 4150 萬 IOPS,是之前使用專有存儲產品創(chuàng)造的 1000 萬 IOPS 世界紀錄的 4 倍多。這一性能是通過連接兩臺快速 Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus 服務器實現(xiàn)的,其中的一臺作為應用服務器(存儲 initiator),另一臺作為存儲系統(tǒng)(存儲 target)。

每臺服務器均配備兩個英特爾Ice Lake” 至強白金 2.3GHz 8380 處理器,支持 160 個超線程核以及 512GB 的 DRAM、120MB 的 L3 緩存(每個處理器60MB)和 PCIe Gen4 總線。

為了加速網絡和 NVMe-oF,每臺服務器均配備了兩塊 NVIDIA BlueField-2 P系列 DPU 卡,每塊卡帶有兩個 100Gb 以太網端口,在 initiator 和 target 之間有四個網絡端口合計 400Gb/s 線速帶寬,并通過 NVIDIA LinkX 100GbE Direct-Attach Copper(DAC)無源電纜背對背連接。兩臺服務器均安裝 Red Hat Enterprise Linux(RHEL)8.3 版本。

對于存儲系統(tǒng)軟件,測試 SPDK 和標準 upstream Linux 內核 target,使用默認內核 4.18 和最新內核之一 5.15。對三種不同的存儲 initiator 進行了基準測試,分別為 SPDK、標準內核存儲 initiator 和 SPDK FIO 插件。使用 FIO 和 SPDK 生成負載并進行測量,使用 4KB 和 512B 這兩種常見的中型和小型存儲 I/O 大小來測試。

在網絡傳輸層使用了 TCP 和 RoCE 兩種協(xié)議來測試 NVMe-oF 存儲,每種配置都在全雙向網絡的條件下以 100% 讀取、100% 寫入和 50/50 讀取/寫入負載模型進行測試。

測試顯示 BlueField DPU 還具有以下性能特點:

用較小的 512B I/O 大小測試,結果顯示 IOPS 更高,但吞吐量低于端口線速,而用 4KB I/O大小測試,結果顯示吞吐量很高,而 IOPS 有所降低。

100% 讀取和100% 寫入兩種負載的 IOPS 和吞吐量性能類似,而 50/50 讀/寫混合負載由于充分使用網絡連接的兩個方向產生了更高的性能。

使用 SPDK 測試,得出的性能高于內核軟件性能,但同時帶來了更高的服務器 CPU 利用率,這是因為 SPDK 在用戶空間中運行并不斷進行輪詢,因此這一情況在預期之內。

由于 Linux 社區(qū)會定期加入存儲改進,因此較新的 Linux 5.15 內核比 4.18 內核表現(xiàn)更好。

創(chuàng)紀錄的 DPU 存儲性能

為存儲安全提供了性能保障

在如今的存儲領域,絕大多數(shù)云和企業(yè)部署都需要快速、分布式、通過以太網或 InfiniBand 訪問的網絡閃存。更快的服務器、GPU、網絡和存儲介質都要求服務器的 CPU 能夠跟上,而最好的方法就是部署具有存儲功能的 DPU。

BlueField-2 DPU 所展現(xiàn)的驚人存儲性能,使整個數(shù)據(jù)中心的應用服務器和存儲設備都具有更高的性能和效率。

在快速存儲訪問的基礎上,BlueField 還支持對以太網存儲流量和存儲介質本身的硬件加速加密和解密,這有助于防止數(shù)據(jù)被盜或外泄。

它能以高達 100Gb/s 的速度卸載 IPsec(線上數(shù)據(jù)),以及高達 200Gb/s 的速度卸載 256 位 AES-XTS(靜態(tài)數(shù)據(jù)),能夠在對手入侵存儲網絡或者物理存儲驅動器被盜、被出售或被不當處置的情況下,減少數(shù)據(jù)被盜的風險。

客戶和領先的安全軟件廠商正在使用最近更新的 BlueField 的 NVIDIA DOCA 框架,以在 DPU 上運行分布式防火墻,或提供微分段的安全組等網絡安全應用,來進一步提高計算服務器的應用和網絡安全,降低服務器存儲的不當訪問或數(shù)據(jù)修改風險。

NVIDIA BlueField-2 DPU 測試結果細節(jié)如下圖:

使用 NMe-oF on TCP 測試 NVIDIA BlueField-2 DPU。測試結果是配置了兩個 BlueField-2 DPU 的合并性能。

使用 NVMe-oF RoCE 測試 NVIDIA BlueField-2 DPU。測試結果是配置了兩個 BlueField-2 DPU 的合并性能。

NVIDIA DOCA 現(xiàn)已開放接受申請,掃描下方海報二維碼,或點擊“閱讀原文”,即可注冊加入,搶先體驗,走在技術前沿!

原文標題:NVIDIA BlueField 再創(chuàng) DPU 性能世界紀錄

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4996

    瀏覽量

    103216
  • DPU
    DPU
    +關注

    關注

    0

    文章

    364

    瀏覽量

    24207
  • 性能
    +關注

    關注

    0

    文章

    271

    瀏覽量

    19009

原文標題:NVIDIA BlueField 再創(chuàng) DPU 性能世界紀錄

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電鍍膜的性能測試方法

    電鍍膜性能測試的幾種主要方法。 1. 外觀檢查 外觀檢查是電鍍膜性能測試的第一步,主要檢查電鍍膜的表面是否光滑、有無缺陷等。 表面粗糙度
    的頭像 發(fā)表于 11-28 14:21 ?293次閱讀

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 軟件平臺釋放了 NVIDIA BlueField 網絡平臺的潛力,并為NVIDIA BlueField和Connec
    的頭像 發(fā)表于 11-09 13:50 ?285次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

    數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網絡、存儲、安全等處理性能,助力服務器運行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設時,圍繞 DPU 構建數(shù)據(jù)中心網絡的基礎設施
    發(fā)表于 07-24 15:32

    NVIDIA BlueField-3 DPU助力思科提高工作負載安全性和運營效率

    、位置和外形尺寸的應用程序工作負載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,將企業(yè)的安全性和運營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentation)提供了更大的靈活性。它現(xiàn)在還擴展到NVIDIA
    的頭像 發(fā)表于 06-27 17:31 ?777次閱讀

    中科馭數(shù)發(fā)布高性能DPU芯片K2-Pro

    在信息技術領域,每一次芯片技術的突破都代表著行業(yè)的一次飛躍。近日,DPU領域的領軍企業(yè)中科馭數(shù)宣布,成功研發(fā)并發(fā)布了其第三代DPU芯片——“K2-Pro”。這款芯片的發(fā)布,標志著中科馭數(shù)在DP
    的頭像 發(fā)表于 06-21 11:41 ?791次閱讀

    性能測試的實現(xiàn)方法是什么

    性能測試是一種評估軟件系統(tǒng)在不同負載下性能表現(xiàn)的測試方法。它可以幫助開發(fā)團隊發(fā)現(xiàn)性能瓶頸,優(yōu)化系
    的頭像 發(fā)表于 05-29 15:44 ?637次閱讀

    借助NVIDIA DOCA 2.7增強AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高
    的頭像 發(fā)表于 05-29 09:22 ?507次閱讀

    NVIDIA DPU編程入門開課儀式在澳門科技大學成功舉辦

    5 月 24 日,NVIDIA DPU 編程入門開課儀式在澳門科技大學成功舉辦。作為首個在中國開設 NVIDIA DPU 編程相關課程的高校,來自澳門科技大學不同院系的師生共同見證了本
    的頭像 發(fā)表于 05-28 09:40 ?404次閱讀

    Nvidia的AI芯片路線圖分析與解讀

    SmartNIC智能網卡/DPU數(shù)據(jù)處理引擎的下一跳ConnectX-8/BlueField-4目標速率為 800G,與1.6T Quantum和Spectrum-X配套的SmartNIC和DPU的路標仍不明晰,NVLink5.
    發(fā)表于 04-29 09:59 ?1024次閱讀
    <b class='flag-5'>Nvidia</b>的AI芯片路線圖分析與解讀

    明天線上見!DPU構建高性能云算力底座——DPU技術開放日最新議程公布!

    技術在不同行業(yè)中的應用解決方案有哪些?能帶來怎樣的業(yè)務效果? 3月29日本周五,中科馭數(shù)集結產品大咖及解決方案專家團,誠邀您參加以“DPU構建高性能云算力底座”為主題的線上DPU技術開放日! 他們將逐一與您分享中科馭數(shù)系列
    的頭像 發(fā)表于 04-03 18:12 ?1011次閱讀

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎設施

    NVIDIA 軟件實現(xiàn)了跨 ?Blackwell GPU、新交換機和 BlueField-3 SuperNIC 的分布式計算,大幅提升了 AI、數(shù)據(jù)處理、高性能計算和云工作負載的性能
    發(fā)表于 03-19 10:05 ?355次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎設施

    深度解讀Nvidia AI芯片路線圖

    Nvidia是一個同時擁有 GPU、CPU和DPU的計算芯片和系統(tǒng)公司。Nvidia通過NVLink、NVSwitch和NVLink C2C技術將CPU、GPU進行靈活連接組合形成統(tǒng)一
    發(fā)表于 03-13 09:25 ?981次閱讀
    深度解讀<b class='flag-5'>Nvidia</b> AI芯片路線圖

    DC電源模塊的安全性能評估與測試方法

    BOSHIDA DC電源模塊的安全性能評估與測試方法 DC電源模塊的安全性能評估與測試方法應包括
    的頭像 發(fā)表于 03-08 11:15 ?712次閱讀
    DC電源模塊的安全<b class='flag-5'>性能</b>評估與<b class='flag-5'>測試</b><b class='flag-5'>方法</b>

    URAT測試性能測試方法

    Technology,非授權無線接入技術)測試作為確保無線通信設備性能的關鍵步驟,具有不可或缺的重要性。 URAT測試是一種針對非授權頻譜中無線通信設備的性能
    的頭像 發(fā)表于 03-06 10:29 ?524次閱讀
    URAT<b class='flag-5'>測試</b>的<b class='flag-5'>性能</b><b class='flag-5'>測試</b><b class='flag-5'>方法</b>

    基于NVIDIA DOCA 2.6實現(xiàn)高性能和安全的AI云設計

    網絡平臺上快速創(chuàng)建應用程序和服務,并啟用 NVIDIA BlueField DPUNVIDIA BlueField SuperNIC
    的頭像 發(fā)表于 02-23 10:02 ?482次閱讀