0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用 NVIDIA DOCA 2.2 加速數(shù)據(jù)中心工作負(fù)載和 AI 應(yīng)用程序

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-09-05 19:40 ? 次閱讀

NVIDIA DOCA SDK 和加速框架為開發(fā)者提供了豐富的庫、驅(qū)動(dòng)程序和 API,以便為 NVIDIA BlueField DPU 和 ConnectX 智能網(wǎng)卡創(chuàng)建高性能應(yīng)用程序和服務(wù)。它推動(dòng)了數(shù)據(jù)中心的創(chuàng)新,實(shí)現(xiàn)了應(yīng)用程序的快速部署。

憑借全面的功能,NVIDIA DOCA 可為基于 BlueField DPU 進(jìn)行開發(fā)的開發(fā)人員提供大規(guī)模加速數(shù)據(jù)中心工作負(fù)載和人工智能應(yīng)用程序的一站式服務(wù)。

NVIDIA DOCA 現(xiàn)已普遍可用,已使超過 10,000 名開發(fā)者從中受益,并使更廣泛的開發(fā)者社區(qū)利用 BlueField DPU 平臺(tái)實(shí)現(xiàn)創(chuàng)新的人工智能和云服務(wù)。

NVIDIA DOCA 2.2 的新增和增強(qiáng)功能

NVIDIA DOCA 2.2 引入了新增功能和增強(qiáng)功能,用于卸載、加速和隔離數(shù)據(jù)中心內(nèi)的網(wǎng)絡(luò)、存儲(chǔ)、安全和基礎(chǔ)設(shè)施管理。

視頻 1:觀看 NVIDIA DOCA 軟件框架簡(jiǎn)介

編程

NVIDIA BlueField-3 DPU 與其板載專用數(shù)據(jù)路徑加速器(DPA)和 DOCA SDK 框架相結(jié)合,提供了一個(gè)無與倫比的平臺(tái)。現(xiàn)在,開發(fā)者可以創(chuàng)建需要高吞吐量和低延遲的高性能且可擴(kuò)展的網(wǎng)絡(luò)應(yīng)用程序。

數(shù)據(jù)路徑加速器

為利用 BlueField-3 DPA 編程子系統(tǒng),NVIDIA DOCA 2.2 提供了幾項(xiàng)增強(qiáng)功能。DOCA DPA 是 DOCA SDK 開發(fā)包的一個(gè)新計(jì)算子系統(tǒng)部分,它提供了一個(gè)編程模型,用于卸載在 DPA 處理器上運(yùn)行的以通信為中心的用戶代碼。DOCA DPA 有助于卸載 CPU 流量,并通過 DPU 加速提高性能。

wKgaomT3FMmAF382AADXPghwo8w893.jpg

圖 1:NVIDIA BlueField-3 DPU 流入和流出流量

DOCA DPA 還提供了顯著的開發(fā)優(yōu)勢(shì),包括在創(chuàng)建自定義模擬和擁塞控制時(shí)具有更高的靈活性。定制的擁塞控制對(duì)于人工智能工作流至關(guān)重要,可以實(shí)現(xiàn)性能隔離、提高公平性,并防止在有損網(wǎng)絡(luò)上的丟包。

DOCA 2.2 版本引入了以下 SDK:

  • DOCA-FlexIO:這是一個(gè)用于 DPA 編程的低級(jí)別 SDK。具體來說,DOCA FlexIO 驅(qū)動(dòng)程序提供了用于通過 DPA 管理和運(yùn)行代碼的 API。

  • DOCA-PCC:這是一個(gè)用于擁塞控制開發(fā)的 SDK,它使 CSP 和企業(yè)客戶能夠創(chuàng)建自己的擁塞控制算法,從而通過更高的帶寬和更低的延遲來提高網(wǎng)絡(luò)運(yùn)營(yíng)的穩(wěn)定性和效率。

NVIDIA 還提供必要的工具鏈、示例和輔助資料,以加快和支持開發(fā)工作。請(qǐng)注意,NVIDIA DOCA DPA 可在 DPU 模式和 NIC 模式下使用。

wKgaomT3FMmAQydyAAGP1lgfmaA045.png

圖 2:DOCA-PCC 提供更高的帶寬和更低的延遲

網(wǎng)絡(luò)

NVIDIA DOCA 和 BlueField-3 DPU 通過一個(gè)全面、開放的開發(fā)平臺(tái),共同開發(fā)出具有突破性網(wǎng)絡(luò)性能的應(yīng)用程序。NVIDIA DOCA 包括一系列驅(qū)動(dòng)程序、庫、工具和示例應(yīng)用程序,并在不斷發(fā)展。此版本提供了以下其他功能,以支持網(wǎng)絡(luò)應(yīng)用程序的開發(fā)。

NVIDIA DOCA Flow

借助 NVIDIA DOCA Flow,用戶可以定義和控制網(wǎng)絡(luò)流量,實(shí)現(xiàn)網(wǎng)絡(luò)策略,并以編程方式管理網(wǎng)絡(luò)資源。它提供網(wǎng)絡(luò)虛擬化、遙測(cè)、負(fù)載平衡、安全強(qiáng)制和流量監(jiān)控等功能。這些功能有助于以低延遲處理高數(shù)據(jù)包工作負(fù)載,節(jié)省 CPU 資源并降低功耗。

此版本包括以下新功能,可為云部署帶來即時(shí)優(yōu)勢(shì):

  • 支持隧道卸載 - GENEVE 和 GRE:提供增強(qiáng)的安全性、可見性、可擴(kuò)展性、靈活性和可擴(kuò)展性,是站點(diǎn)通信、網(wǎng)絡(luò)隔離和多租戶的構(gòu)建塊。具體而言,GRE 隧道用于連接單獨(dú)的網(wǎng)絡(luò)并建立安全的 VPN 通信,支持 Overlay 網(wǎng)絡(luò),提供協(xié)議靈活性,并實(shí)現(xiàn)流量工程。

  • 支持具有 bps / pps 選項(xiàng)的每個(gè)流計(jì)量:在云環(huán)境中,監(jiān)控 / 分析流量(即測(cè)量帶寬或數(shù)據(jù)包速率)、管理 QoS(即執(zhí)行限制)或增強(qiáng)安全性(即阻止拒絕服務(wù)攻擊)都至關(guān)重要。

  • 增強(qiáng)的鏡像功能(FDB / 交換機(jī)域):這項(xiàng)新增功能不僅用于監(jiān)控、故障排除、安全分析和性能優(yōu)化,還能為鏡像工作負(fù)載提供更高的 CPU 利用率。

OVS-DOCA (Beta 版)

OVS-DOCA 是適用于 NVIDIA 網(wǎng)絡(luò)服務(wù)的高度優(yōu)化虛擬交換機(jī)。其極其高效的設(shè)計(jì)通過 NVIDIA 網(wǎng)卡或 DPU 提升了下一代性能和規(guī)模?,F(xiàn)在,OVS-DOCA 可以在 DOCA 中用于 DPU,也可以在 DOCA 中用于主機(jī)(二進(jìn)制文件和源代碼)。

wKgaomT3FMqAcILHAACNw5-YgMM335.png

圖 3:OVS- DOCA 針對(duì) NVIDIA 網(wǎng)絡(luò)服務(wù)進(jìn)行了優(yōu)化

基于 Open vSwitch,OVS-DOCA 提供了相同的北向 API、OpenFlow、CLI 和數(shù)據(jù)接口,為 OVS 提供了一種替代方案。使用 OVS-DOCA 可以更快地實(shí)現(xiàn)未來 NVIDIA 創(chuàng)新的網(wǎng)絡(luò)功能。

BlueField-3(增強(qiáng)的)NIC 模式(Beta 版)

此版本受益于增強(qiáng)的 BlueField-3 NIC 模式,目前處于 Beta 版。與卸載、加速和隔離都可用的 BlueField-3 DPU 模式不同,BlueField-3 NIC 模式僅提供加速功能。

wKgaomT3FMuAPItjAAIbmHs5-Uo009.png

圖 4:BlueField-3(增強(qiáng)的)NIC 模式

在繼續(xù)利用 BlueField 低功耗和低計(jì)算密集型 SKU 的同時(shí),增強(qiáng)的 BlueField-3 NIC 模式比當(dāng)前的 ConnectX BlueField-2 NIC 模式具有許多優(yōu)勢(shì),包括:

  • 使用本地 DPU 內(nèi)存大規(guī)模實(shí)現(xiàn)更高的性能和更低的延遲

  • 采用可編程擁塞控制(PCC)的高性能 RDMA

  • 利用 DPA 和其他 BlueField 加速器實(shí)現(xiàn)可編程性

  • 通過設(shè)備認(rèn)證和卡載 BMC 實(shí)現(xiàn)強(qiáng)大平臺(tái)安全性

請(qǐng)注意,BlueField-3 NIC 模式將作為一種軟件模式進(jìn)行產(chǎn)品化,而非單獨(dú)的 SKU,以實(shí)現(xiàn)未來使用 DPU 模式。因此,BlueField-3 NIC 模式是所有 BlueField-3 SKU 上都可以使用的且完全支持的軟件功能。對(duì)于在 NIC 模式下運(yùn)行的任何 BlueField-3 DPU,DPA 可編程性要求在主機(jī)上安裝 DOCA 和活躍的基于主機(jī)服務(wù)。

服務(wù)

NVIDIA DOCA 服務(wù)是一種基于容器化 DOCA 程序,為特定用例提供端到端解決方案。這些服務(wù)可以通過 NVIDIA NGC 獲得,從而可以輕松地將它們直接部署到 DPU。DOCA 2.2 提供了更好的控制能力,現(xiàn)在可以離線安裝 DOCA 服務(wù)。

NGC 離線服務(wù)安裝

從 NGC 安裝 DOCA 服務(wù)需要互聯(lián)網(wǎng)連接。然而,許多客戶在沒有互聯(lián)網(wǎng)接入的安全生產(chǎn)環(huán)境中運(yùn)營(yíng)。因此,我們提供了“非連接”部署選項(xiàng),可以在完全安全的生產(chǎn)環(huán)境中安裝服務(wù),從而簡(jiǎn)化流程,并避免了每臺(tái)服務(wù)器都需要連接才能完成安裝過程的情況。

例如,考慮在生產(chǎn)環(huán)境中安裝 DOCA 遙測(cè)服務(wù)(DTS)以支持計(jì)量收集。整個(gè)安裝過程只需兩個(gè)步驟即可完成:

  • 步驟 1:在已連接的服務(wù)器上下載 NGC

  • 步驟 2:使用內(nèi)部安全交付進(jìn)行離線安裝

總結(jié)

NVIDIA DOCA 2.2 在推動(dòng)數(shù)據(jù)中心創(chuàng)新以及為人工智能應(yīng)用而改造云和企業(yè)數(shù)據(jù)中心網(wǎng)絡(luò)方面發(fā)揮著關(guān)鍵和不可或缺的作用。通過為 BlueField DPU 提供全面的 SDK 和加速框架,DOCA 為開發(fā)者提供了強(qiáng)大的庫、驅(qū)動(dòng)程序和 API,從而能夠創(chuàng)建高性能的應(yīng)用程序和服務(wù)。

DOCA 2.2 有了一些新增功能和增強(qiáng)功能,可以立即獲得許多優(yōu)勢(shì)。除了通過 DPU 加速實(shí)現(xiàn)的性能提升外,DOCA-FlexIO 和 DOCA-PCC SDK 的加入為開發(fā)者提供了以人工智能為中心的加速計(jì)算優(yōu)勢(shì)。這些 SDK 能夠創(chuàng)建自定義模擬和算法,縮短上市時(shí)間,并顯著改善整體開發(fā)體驗(yàn)。

此外,NVIDIA DOCA FLOW 和 OVS-DOCA 的網(wǎng)絡(luò)特定更新為軟件定義的網(wǎng)絡(luò)和安全解決方案提供了簡(jiǎn)化的交付途徑。這些功能提高了效率,增強(qiáng)了可見性、可擴(kuò)展性和靈活性,對(duì)于構(gòu)建復(fù)雜而安全的基礎(chǔ)架構(gòu)至關(guān)重要。

DOCA 為數(shù)據(jù)中心創(chuàng)新、人工智能應(yīng)用加速和強(qiáng)大的網(wǎng)絡(luò)基礎(chǔ)設(shè)施做出了廣泛貢獻(xiàn),是 NVIDIA 人工智能云服務(wù)的重要組成部分。隨著行業(yè)朝著更復(fù)雜、更苛刻的計(jì)算需求發(fā)展,DOCA 的不斷發(fā)展以及與尖端技術(shù)的集成將進(jìn)一步鞏固其作為開創(chuàng)性平臺(tái)的地位,為數(shù)據(jù)中心和人工智能驅(qū)動(dòng)的解決方案的未來賦能。

掃描下方二維碼,立即訪問 DOCA。

wKgaomT3FMuAcjGYAAADAXCvQCE658.png


wKgaomT3FMuAA6QWAABAFFJlyZc514.gif ?

更多精彩內(nèi)容 利用 NVIDIA DOCA Flow 實(shí)現(xiàn) DPU 加速數(shù)據(jù)包轉(zhuǎn)向邏輯
使用 NVIDIA DOCA GPUNetIO 實(shí)現(xiàn)實(shí)時(shí)網(wǎng)絡(luò)處理功能
利用 NVIDIA DOCA 2.0 改變 IPsec 的部署


原文標(biāo)題:使用 NVIDIA DOCA 2.2 加速數(shù)據(jù)中心工作負(fù)載和 AI 應(yīng)用程序

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3786

    瀏覽量

    91277

原文標(biāo)題:使用 NVIDIA DOCA 2.2 加速數(shù)據(jù)中心工作負(fù)載和 AI 應(yīng)用程序

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AmpereOne如何滿足現(xiàn)代數(shù)據(jù)中心需求

    在當(dāng)今要求苛刻的技術(shù)環(huán)境中,數(shù)據(jù)中心和企業(yè)面臨著嚴(yán)峻的挑戰(zhàn)。不斷上升的能源成本促使公司尋求更節(jié)能的解決方案,以滿足可持續(xù)性和成本目標(biāo)。對(duì)可擴(kuò)展計(jì)算密度的需求也在增長(zhǎng),以跟上日益復(fù)雜的應(yīng)用程序和云原生
    的頭像 發(fā)表于 12-09 17:33 ?353次閱讀

    NVIDIA DOCA 2.9版本的亮點(diǎn)解析

    NVIDIA DOCA通過為開發(fā)者提供全面的軟件框架以利用硬件加速來增強(qiáng) NVIDIA 網(wǎng)絡(luò)平臺(tái)的功能,從而提高性能、安全性和效率。其 API、庫和工具生態(tài)系統(tǒng)簡(jiǎn)化了
    的頭像 發(fā)表于 11-27 11:15 ?340次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.9版本的亮點(diǎn)解析

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 軟件平臺(tái)釋放了 NVIDIA BlueField 網(wǎng)絡(luò)平臺(tái)的潛力,并為NVIDIA BlueField和ConnectX設(shè)備提供了所需的所有主機(jī)驅(qū)動(dòng)
    的頭像 發(fā)表于 11-09 13:50 ?288次閱讀

    NVIDIA NIM在搭載RTX技術(shù)的AI工作站上的應(yīng)用

    模型和應(yīng)用程序。數(shù)據(jù)中心和云服務(wù)提供商 (CSP) 對(duì) AI 加速硬件的需求超過供應(yīng)。當(dāng)前的桌面計(jì)算資源可能不適合 AI 增強(qiáng)型
    的頭像 發(fā)表于 11-09 11:47 ?364次閱讀

    NVIDIA SuperNIC推進(jìn)現(xiàn)代AI基礎(chǔ)設(shè)施發(fā)展

    在生成式 AI 時(shí)代,加速網(wǎng)絡(luò)對(duì)于為大規(guī)模分布式 AI 工作負(fù)載構(gòu)建高性能計(jì)算平臺(tái)至關(guān)重要。NVIDIA
    的頭像 發(fā)表于 11-06 13:59 ?255次閱讀

    IB Verbs和NVIDIA DOCA GPUNetIO性能測(cè)試

    Async 等技術(shù),能夠創(chuàng)建以 GPU 為中心應(yīng)用程序,其中 CUDA 內(nèi)核可以直接與網(wǎng)卡(NIC)通信,從而繞過 CPU 發(fā)送和接收數(shù)據(jù)包,并將 CPU 排除在關(guān)鍵路徑之外。
    的頭像 發(fā)表于 08-23 17:03 ?637次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> GPUNetIO性能測(cè)試

    數(shù)據(jù)中心使用智能負(fù)載組是個(gè)好主意#負(fù)載 #負(fù)載

    數(shù)據(jù)中心
    深圳崧皓電子
    發(fā)布于 :2024年08月19日 07:43:30

    數(shù)據(jù)中心AI時(shí)代轉(zhuǎn)型:挑戰(zhàn)與機(jī)遇

    隨著人工智能(AI)的迅速發(fā)展和廣泛應(yīng)用,數(shù)據(jù)中心作為AI技術(shù)的基石,也面臨著前所未有的挑戰(zhàn)和機(jī)遇。為了滿足AI的高性能和低延遲要求,數(shù)據(jù)中心
    的頭像 發(fā)表于 07-24 08:28 ?507次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>的<b class='flag-5'>AI</b>時(shí)代轉(zhuǎn)型:挑戰(zhàn)與機(jī)遇

    美光MRDIMM內(nèi)存發(fā)布,加速數(shù)據(jù)中心工作負(fù)載

    需要每個(gè) DIMM 插槽內(nèi)存超過 128GB 的應(yīng)用,美光 MRDIMM 提供最高帶寬、最大容量、最低延遲以及更高的每瓦性能,在加速內(nèi)存密集型虛擬化多租戶、高性能計(jì)算和 AI 數(shù)據(jù)中心工作負(fù)載
    的頭像 發(fā)表于 07-22 14:06 ?580次閱讀

    八大科技巨頭攜手推進(jìn)UALink,加速數(shù)據(jù)中心AI互聯(lián)

    近日,英特爾、Google、微軟、Meta等八家科技巨頭宣布共同成立超加速器鏈接(UALink)推廣小組,致力于推動(dòng)數(shù)據(jù)中心內(nèi)AI加速器芯片的連接組件發(fā)展。UALink旨在優(yōu)化
    的頭像 發(fā)表于 05-31 10:59 ?856次閱讀

    借助NVIDIA DOCA 2.7增強(qiáng)AI數(shù)據(jù)中心NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動(dòng)和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的
    的頭像 發(fā)表于 05-29 09:22 ?507次閱讀

    HNS 2024:星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能

    華為數(shù)據(jù)通信創(chuàng)新峰會(huì)2024在巴庫隆重舉辦,在“星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能”主題論壇中,華為面向中東中亞地區(qū)發(fā)布星河AI
    的頭像 發(fā)表于 05-15 09:15 ?673次閱讀
    HNS 2024:星河<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>網(wǎng)絡(luò),賦<b class='flag-5'>AI</b>時(shí)代新動(dòng)能

    NVIDIA數(shù)字人技術(shù)加速部署生成式AI驅(qū)動(dòng)的游戲角色

    NVIDIA 在 GDC 2024 大會(huì)上宣布,Inworld AI 等領(lǐng)先的 AI 應(yīng)用程序開發(fā)者,正在使用 NVIDIA 數(shù)字人技術(shù)
    的頭像 發(fā)表于 04-09 10:08 ?686次閱讀
    <b class='flag-5'>NVIDIA</b>數(shù)字人技術(shù)<b class='flag-5'>加速</b>部署生成式<b class='flag-5'>AI</b>驅(qū)動(dòng)的游戲角色

    是德科技推出AI數(shù)據(jù)中心測(cè)試平臺(tái)旨在加速AI/ML網(wǎng)絡(luò)驗(yàn)證和優(yōu)化的創(chuàng)新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,針對(duì)人工智能(AI)和機(jī)器學(xué)習(xí)(ML)基礎(chǔ)設(shè)施生態(tài)系統(tǒng),推出了 AI數(shù)據(jù)中心測(cè)試平臺(tái),旨在加速
    的頭像 發(fā)表于 02-29 09:32 ?649次閱讀
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>測(cè)試平臺(tái)旨在<b class='flag-5'>加速</b><b class='flag-5'>AI</b>/ML網(wǎng)絡(luò)驗(yàn)證和優(yōu)化的創(chuàng)新

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計(jì)

    作為專為 NVIDIA? BlueField? 網(wǎng)絡(luò)平臺(tái)而設(shè)計(jì)的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標(biāo)準(zhǔn) API 在
    的頭像 發(fā)表于 02-23 10:02 ?484次閱讀