0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優(yōu)勢

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-01-07 09:43 ? 次閱讀

WEKA是可擴展軟件定義數(shù)據(jù)平臺的先驅(qū),NVIDIA 正在與其合作,將 WEKA 先進的數(shù)據(jù)平臺解決方案與功能強大的NVIDIA BlueField DPU相結(jié)合。

WEKA 數(shù)據(jù)平臺的高級存儲軟件可充分發(fā)揮 AI 和性能密集型工作負載的潛力,而 NVIDIA BlueField DPU 則徹底改變了數(shù)據(jù)的訪問、移動和安全性。這些前沿技術(shù)的集成將開創(chuàng)前所未有的數(shù)據(jù)管理效率和速度的新時代,并有望重塑高性能數(shù)據(jù)訪問的格局。

解決高效的 AI 工作流程

AI 的迅速崛起推動了計算能力和網(wǎng)絡速度的指數(shù)級增長,對存儲資源提出了非常高的需求。雖然 NVIDIA GPU 提供了令人驚嘆的可擴展、高效的計算能力,但是它們還需要高速的數(shù)據(jù)訪問。

WEKA 與 NVIDIA 的合作解決了這一挑戰(zhàn)。它們共同滿足了模型訓練和推理任務(包括檢索增強生成,RAG)對 PB 級數(shù)據(jù)進行高帶寬網(wǎng)絡訪問的關(guān)鍵需求。

關(guān)于 RAG 的用例,可閱讀以下文章:

借助加速以太網(wǎng)網(wǎng)絡和網(wǎng)絡存儲擴展企業(yè) RAG

該聯(lián)合解決方案專為處理豐富的圖像和視頻數(shù)據(jù)、向量數(shù)據(jù)庫以及大量元數(shù)據(jù)保存的復雜性而設計。這確保了無縫且高效的 AI 工作流程,使集成變得及時,并成為未來數(shù)據(jù)驅(qū)動創(chuàng)新的關(guān)鍵。

提高吞吐量和安全性 降低延遲

此次合作的核心是集成 WEKA 客戶端,并通過使用Virtio-FS 代碼來完成。它直接在 BlueField DPU 上運行,而不是在主機服務器的 CPU 上運行。這種創(chuàng)新方法具有以下關(guān)鍵優(yōu)勢:

提高吞吐量:BlueField 硬件加速功能可實現(xiàn)更快的數(shù)據(jù)傳輸速率。

降低延遲:通過在 BlueField DPU 上運行 WEKA 客戶端,數(shù)據(jù)訪問操作可以繞過主機 CPU,從而顯著降低延遲。

CPU 卸載:通過將 WEKA 客戶端遷移到 DPU,可以釋放寶貴的主機 CPU 資源用于應用程序處理,從而有可能提高整體系統(tǒng)性能和效率。

增強安全性:將存儲操作卸載到 DPU 可創(chuàng)建額外的隔離層,從而增強整體系統(tǒng)安全性。

Virtio-FS 代碼的實現(xiàn)有助于主機系統(tǒng)與網(wǎng)絡數(shù)據(jù)之間的無縫通信,在不犧牲性能的情況下實現(xiàn)高效的文件系統(tǒng)操作。通過在 BlueField DPU 上運行 WEKA 客戶端,可以從 CPU 卸載文件系統(tǒng)任務,從而減少開銷,并釋放高達 20% 的 CPU 資源以用于應用程序。

這種方法還可確保虛擬化環(huán)境中的本地文件系統(tǒng)效率和跨平臺兼容性。此外,Virtio-FS 旨在適應不斷發(fā)展的 DPU 技術(shù),采用NVIDIA DOCA 軟件框架來簡化未來的開發(fā)流程,并兼容新一代 NVIDIA BlueField DPU。

將 Virtio-FS 與 NVIDIA BlueField DPU 結(jié)合使用,可將高效、直接的文件共享與強大的卸載和加速功能的優(yōu)勢結(jié)合起來。這種協(xié)同作用可提高性能、降低系統(tǒng)復雜性,并支持適合 AI 工作負載的現(xiàn)代可擴展架構(gòu)。

45e61ea4-cc17-11ef-9310-92fbcf53809c.png

圖 1:在 NVIDIA BlueField-3 DPU 上運行 WEKA 客戶端可提高吞吐量、延遲和安全

硬件加速數(shù)據(jù)處理

AI 訓練和推理對存儲提出了獨特的挑戰(zhàn),每個挑戰(zhàn)都有不同的要求。訓練需要高吞吐量來處理大型數(shù)據(jù)集和寫入密集型操作,而推理需要出色的讀取性能和低延遲來實現(xiàn)實時響應。這兩種情況通常都依賴于共享文件系統(tǒng)。NVIDIA BlueField DPU 通過提供硬件加速數(shù)據(jù)處理來優(yōu)化訓練和推理工作負載。

優(yōu)化 AI 模型訓練

AI 模型訓練對存儲提出了很高的要求,需要快速訪問龐大的數(shù)據(jù)池來支持 GPU 的生產(chǎn)力。訓練過程包括定期讀取大型數(shù)據(jù)池,以及頻繁的持續(xù)寫入操作,例如記錄日志、保存檢查點和記錄指標。BlueField DPU 提供強大的寫入性能和優(yōu)化的讀/寫平衡,并有效提供高 IOPS。

適用于推理的低延遲和高讀取性能

AI 推理具有不同的存儲需求,需要快速訪問來自多個來源的少量數(shù)據(jù),以保持較低的用戶響應時間。低延遲對于實時或近乎實時的處理至關(guān)重要,因為延遲會影響應用程序的響應能力和有效性。推理通常需要使用多個經(jīng)過訓練的模型和其他數(shù)據(jù)源來快速做出預測或決策。BlueField DPU 提供快速讀取性能,這對于保持數(shù)據(jù)流暢運行至關(guān)重要,從而為時間敏感型 AI 應用程序提供準確的輸出。

平衡訓練和推理以提高 AI 性能和效率

訓練和推理之間的特定壓力略有不同。平衡這些需求對于構(gòu)建高效且富有彈性的 AI 存儲架構(gòu)至關(guān)重要,對于創(chuàng)建有效且強大的 AI 存儲解決方案也至關(guān)重要。將 WEKA 數(shù)據(jù)平臺客戶端與 NVIDIA BlueField DPU 集成,可提高訓練和推理工作負載的存儲性能,并提高解決方案的效率和安全性。

總結(jié)

在 NVIDIA BlueField DPU 上運行 WEKA 客戶端有助于從 WEKA 文件系統(tǒng)訪問文件,從而充分發(fā)揮性能密集型工作負載的潛力,并有利于數(shù)據(jù)訪問、移動和安全性。

在 SC 2024 大會上,WEKA 和 NVIDIA 通過現(xiàn)場演示展示了集成解決方案的實際優(yōu)勢。與會者見證了通過提高數(shù)據(jù)訪問速度和高效工作負載處理來加速 AI 數(shù)據(jù)處理。我們的專家團隊隨時可為您解答問題,并就此解決方案如何改變您的數(shù)據(jù)中心運營提供見解。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5439

    瀏覽量

    171971
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5013

    瀏覽量

    103243
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269423
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    365

    瀏覽量

    24213

原文標題:NVIDIA BlueField DPU 與 WEKA 客戶端的集成提高了 AI 工作負載的效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NTP網(wǎng)絡時間服務器能帶同步多少客戶端

    NTP網(wǎng)絡時間服務器能帶同步多少客戶端
    的頭像 發(fā)表于 09-04 10:43 ?470次閱讀
    NTP網(wǎng)絡時間服務器能帶同步多少<b class='flag-5'>客戶端</b>?

    esp_iot_sdk_v0.9.6_b1客戶端斷開連接導致WDT重置怎么解決?

    客戶端斷開連接,服務器一定不會掛起。實際上,由于客戶端啟動了連接,因此客戶端理所當然地應該能夠斷開連接,而不會對服務器造成任何問題。 IPD,0,80:GET /測試 HTTP/1.
    發(fā)表于 07-18 06:33

    如果ESP的TCP客戶端與服務器斷開連接,如何啟用自動重連?

    ESP - TCP 客戶端 嵌入式 Linux 服務器 - TCP 服務器 如果ESP的TCP客戶端與服務器斷開連接,如何啟用自動重連?
    發(fā)表于 07-17 06:25

    如何同時ESP8266運行TCP客戶端和TCP服務?

    客戶端無法連接到 TCP 服務器。如果不將 TCP 客戶端從 ESP 連接到云服務器,則 ESP 的 TCP 服務器可以很好地接受 TCP 客戶端連接。 TCP
    發(fā)表于 07-08 08:26

    NVIDIA BlueField-3 DPU助力思科提高工作負載安全性和運營效率

    、位置和外形尺寸的應用程序工作負載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,將企業(yè)的安全性和運營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentation)提供了更大的靈活性。它現(xiàn)在還擴展到NVIDIA
    的頭像 發(fā)表于 06-27 17:31 ?780次閱讀

    求助,關(guān)于ESP32C3 TCP客戶端連接斷線問題求解

    ESP32C3開啟AP模式做TCP服務器,手機做客戶端連接服務器;超過默認最大連接數(shù)(5)以后,即使有部分客戶端斷開了,也無法再發(fā)起連接連接不。一定需要服務器給
    發(fā)表于 06-27 07:54

    請問esp32能支持多個客戶端同時連接嗎?

    根據(jù)我現(xiàn)在的測試結(jié)果,esp32作為ble server時同時支持一個客戶端連接,前一個客戶端必須斷開藍牙連接,后一個才能連接。實際esp32能支持多個客戶端同時連接嗎?有沒有相關(guān)例程
    發(fā)表于 06-11 06:25

    服務測試和客戶端測試區(qū)別在哪

    服務測試和客戶端測試是軟件開發(fā)過程中的兩個重要環(huán)節(jié),它們分別針對服務器客戶端的軟件進行測試。本文將詳細介紹服務測試和
    的頭像 發(fā)表于 05-30 15:27 ?3208次閱讀

    借助NVIDIA DOCA 2.7增強AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應用程序和服務。
    的頭像 發(fā)表于 05-29 09:22 ?510次閱讀

    AIROC客戶端控制應用程序不起作用的原因?

    正常,但當啟動客戶端控制應用程序并打開串行端口時,卻什么也沒發(fā)生--所有控件都是灰色的。 然后,我還按照說明中的建議從 Windows 10 PC 運行 BTSpy 并進行連接 - 客戶端
    發(fā)表于 05-21 06:56

    使用FreeRTOS+LwIP開發(fā)版做客戶端斷開后不能夠重新連接?

    請教下, 使用FreeRTOS+LwIP 開發(fā)版做客戶端斷開后不能夠重新連接 ? 具體描述如下: 1、開發(fā)版作為客戶端使用 2、初次電能夠正常通訊,也就是 開發(fā)板可以發(fā)送數(shù)據(jù)到服務器
    發(fā)表于 04-30 07:48

    stm32 +lwip1.3.1客戶端異常導致網(wǎng)絡ping不通怎么解決?

    stm32運行lwip作為服務器,如果客戶端異常了,發(fā)現(xiàn)在客戶端再也ping不通 網(wǎng)絡如果異常,交換機掛了,重啟后,客戶端怎么都ping
    發(fā)表于 04-22 07:30

    HarmonyOS開發(fā)實例:【分布式新聞客戶端

    基于柵格布局、設備管理和多端協(xié)同,實現(xiàn)一次開發(fā),多端部署的分布式新聞客戶端頁面。
    的頭像 發(fā)表于 04-17 15:57 ?889次閱讀
    HarmonyOS開發(fā)實例:【分布式新聞<b class='flag-5'>客戶端</b>】

    基于NVIDIA DOCA 2.6實現(xiàn)高性能和安全的AI云設計

    作為專為 NVIDIA? BlueField? 網(wǎng)絡平臺而設計的數(shù)據(jù)中心基礎(chǔ)設施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標準 API
    的頭像 發(fā)表于 02-23 10:02 ?484次閱讀

    配電網(wǎng)架空線路故障精確定位裝置:Web客戶端和手機客戶端樣式

    接下來,深圳鼎信智慧科技跟大家科普配電網(wǎng)架空線路故障精確定位裝置的Web客戶端和手機客戶端樣式: 實際應用中,行波雙測距原理具有較高的精
    的頭像 發(fā)表于 01-30 17:47 ?796次閱讀