0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton的概念、特性及主要功能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-18 10:11 ? 次閱讀

NVIDIA Triton 推理服務(wù)器是 NVIDIA AI 平臺(tái)的一部分,它是一款開源推理服務(wù)軟件,可助力標(biāo)準(zhǔn)化模型的部署和執(zhí)行,并在生產(chǎn)環(huán)境中提供快速且可擴(kuò)展的 AI。

什么是 NVIDIA Triton?

NVIDIA Triton 推理服務(wù)器可助力團(tuán)隊(duì)在任意基于 GPUCPU 的基礎(chǔ)設(shè)施上部署、運(yùn)行和擴(kuò)展任意框架中經(jīng)過(guò)訓(xùn)練的 AI 模型,進(jìn)而精簡(jiǎn) AI 推理。同時(shí),AI 研究人員和數(shù)據(jù)科學(xué)家可在不影響生產(chǎn)部署的情況下,針對(duì)其項(xiàng)目自由選擇合適的框架。它還幫助開發(fā)者跨云、本地、邊緣和嵌入式設(shè)備提供高性能推理。

NVIDIA Triton特性

支持多個(gè)框架

NVIDIA Triton 推理服務(wù)器支持所有主流框架,例如 TensorFlow、NVIDIA TensorRT、PyTorch、MXNet、Python、ONNX、RAPIDS FIL(用于XGBoost、scikit-learn 等)、OpenVINO、自定義 C++ 等。

高性能推理

NVIDIA Triton 支持所有基于 NVIDIA GPU、x86 和 ArmCPU 的推理。它具有動(dòng)態(tài)批處理、并發(fā)執(zhí)行、最優(yōu)模型配置、模型集成和串流輸入等功能,可更大限度地提高吞吐量和利用率。

專為 DevOps 和 MLOps 設(shè)計(jì)

Triton 與 Kubernetes 集成,可用于編排和擴(kuò)展,導(dǎo)出 Prometheus 指標(biāo)進(jìn)行監(jiān)控,支持實(shí)時(shí)模型更新,并可用于所有主流的公有云 AI 和 Kubernetes 平臺(tái)。它還與許多 MLOps 軟件解決方案集成。

各項(xiàng)應(yīng)用中快速且可擴(kuò)展的AI

高推理吞吐量

0f9e53ee-0431-11ed-ba43-dac502259ad0.jpg

NVIDIA Triton 可在單個(gè) GPU 或 CPU 上并行指定相同或不同框架下的多個(gè)模型。在多 GPU 服務(wù)器中,NVIDIA Triton 會(huì)自動(dòng)為基于每個(gè) GPU 的每個(gè)模型創(chuàng)建一個(gè)實(shí)例,以提高利用率。

它還可在嚴(yán)格的延遲限制條件下優(yōu)化實(shí)時(shí)推理服務(wù),通過(guò)支持批量推理來(lái)更大限度地提高 GPU 和 CPU 利用率,并內(nèi)置對(duì)音頻視頻流輸入的支持。對(duì)于需要使用多個(gè)模型來(lái)執(zhí)行端到端推理(例如對(duì)話式 AI)的用例,Triton 支持模型集成。

模型可在生產(chǎn)環(huán)境中實(shí)時(shí)更新,無(wú)需重啟 Triton 或應(yīng)用。Triton 支持對(duì)單個(gè) GPU 顯存無(wú)法容納的超大模型進(jìn)行多 GPU 以及多節(jié)點(diǎn)推理。

高度可擴(kuò)展的推理

0faecbe8-0431-11ed-ba43-dac502259ad0.jpg

作為一個(gè) Docker 容器,Triton 與 Kubernetes 集成,用于編排、指標(biāo)和自動(dòng)縮放。Triton 還與 Kubeflow 和 Kubeflow 工作流集成,實(shí)現(xiàn)端到端的 AI 工作流,并導(dǎo)出 Prometheus 指標(biāo),用于監(jiān)控 GPU 利用率、延遲、內(nèi)存使用率和推理吞吐量。它支持標(biāo)準(zhǔn)的 HTTP / gRPC 接口,可與 load balancer 等其他應(yīng)用連接,并可輕松擴(kuò)展到任意數(shù)量的服務(wù)器,以為任意模型處理日益增長(zhǎng)的推理負(fù)載。

Triton 可通過(guò)一個(gè)模型控制 API 來(lái)服務(wù)于數(shù)十或數(shù)百個(gè)模型。您可基于為適應(yīng) GPU 或 CPU 顯存而進(jìn)行的改動(dòng),將模型加載到推理服務(wù)器中或從推理服務(wù)器中卸載。支持兼具 GPU 和 CPU 的異構(gòu)集群有助于跨平臺(tái)實(shí)現(xiàn)推理標(biāo)準(zhǔn)化,并動(dòng)態(tài)擴(kuò)展到任意 CPU 或 GPU 以處理峰值負(fù)載。

NVIDIA Triton的主要功能

Triton Forest Inference Library (FIL) 后端

新的 Forest Inference Library (FIL) 后端支持在 CPU 和 GPU 上對(duì)基于樹的模型進(jìn)行具有可解釋性(Shapley 值)的高性能推理。它支持來(lái)自 XGBoost、LightGBM、scikit-learn RandomForest、RAPIDS cuML RandomForest 以及其他 Treelite 格式的模型。

Triton 模型分析器

Triton 模型分析器是一種自動(dòng)評(píng)估 Triton 部署配置(例如目標(biāo)處理器上的批量大小、精度和并發(fā)執(zhí)行實(shí)例)的工具。它有助于選擇優(yōu)化配置,以滿足應(yīng)用的服務(wù)質(zhì)量(QoS)限制(延遲、吞吐量和內(nèi)存要求),并且可以將找到優(yōu)化配置所需的時(shí)間從數(shù)周縮短到數(shù)小時(shí)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5013

    瀏覽量

    103243
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9231

    瀏覽量

    85625
  • Triton
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    7045

原文標(biāo)題:DevZone | NVIDIA Triton推理服務(wù)器

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    數(shù)字化智能工廠的主要功能組成

    數(shù)字化智能工廠是一種基于數(shù)字化技術(shù)和智能化系統(tǒng)的現(xiàn)代制造工廠,主要功能包括自動(dòng)化生產(chǎn)設(shè)備、信息技術(shù)基礎(chǔ)設(shè)施、數(shù)據(jù)采集與分析系統(tǒng)、互聯(lián)互通技術(shù)、人工智能與機(jī)器學(xué)習(xí)、虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)、安全防護(hù)體系和綠色制造。
    的頭像 發(fā)表于 10-08 11:40 ?475次閱讀
    數(shù)字化智能工廠的<b class='flag-5'>主要功能</b>組成

    FPD link主要功能模塊

    電子發(fā)燒友網(wǎng)站提供《FPD link主要功能模塊.pdf》資料免費(fèi)下載
    發(fā)表于 09-27 11:38 ?0次下載
    FPD link<b class='flag-5'>主要功能</b>模塊

    漏洞掃描的主要功能是什么

    漏洞掃描是一種網(wǎng)絡(luò)安全技術(shù),用于識(shí)別計(jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)或應(yīng)用程序中的安全漏洞。這些漏洞可能被惡意用戶利用來(lái)獲取未授權(quán)訪問(wèn)、數(shù)據(jù)泄露或其他形式的攻擊。漏洞掃描的主要功能是幫助組織及時(shí)發(fā)現(xiàn)并修復(fù)這些安全
    的頭像 發(fā)表于 09-25 10:25 ?440次閱讀

    電子地圖的主要功能與應(yīng)用

    電子地圖,即數(shù)字地圖,是利用計(jì)算機(jī)技術(shù),以數(shù)字方式存儲(chǔ)和查閱的地圖。它不僅繼承了傳統(tǒng)紙質(zhì)地圖的基本功能,還通過(guò)現(xiàn)代科技手段實(shí)現(xiàn)了諸多創(chuàng)新應(yīng)用。以下是電子地圖的主要功能與應(yīng)用: 一、主要功能 快速存取
    的頭像 發(fā)表于 09-12 11:18 ?2105次閱讀
    電子地圖的<b class='flag-5'>主要功能</b>與應(yīng)用

    GUTOR不間斷電源的主要功能是什么?

    GUTOR不間斷電源的主要功能是什么?
    發(fā)表于 09-06 17:44

    微處理器的主要功能是什么

    微處理器(Microprocessor),作為計(jì)算機(jī)系統(tǒng)的核心部件,其主要功能對(duì)于整個(gè)計(jì)算機(jī)系統(tǒng)的運(yùn)行至關(guān)重要。
    的頭像 發(fā)表于 08-22 11:48 ?2062次閱讀

    RFID天線的工作原理和主要功能

    RFID(Radio Frequency Identification,無(wú)線射頻識(shí)別)天線作為RFID系統(tǒng)中的關(guān)鍵組件,其工作原理和主要功能對(duì)于整個(gè)系統(tǒng)的性能和穩(wěn)定性至關(guān)重要。以下是對(duì)RFID天線工作原理和主要功能的詳細(xì)闡述。
    的頭像 發(fā)表于 08-09 15:38 ?1404次閱讀

    opencv的主要功能有哪些

    OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺庫(kù),提供了大量的計(jì)算機(jī)視覺算法和工具。以下是OpenCV的主要功能: 圖像處理
    的頭像 發(fā)表于 07-16 10:35 ?1603次閱讀

    連接器的主要功能是什么

    連接器的主要功能是實(shí)現(xiàn)電子設(shè)備之間的電氣連接和信號(hào)傳輸。連接器的種類繁多,應(yīng)用領(lǐng)域廣泛,其主要功能可以歸納為以下幾點(diǎn): 電氣連接:連接器的主要功能是實(shí)現(xiàn)電子設(shè)備之間的電氣連接。連接器通過(guò)其金屬接觸件
    的頭像 發(fā)表于 06-20 09:22 ?1060次閱讀

    接地電阻柜的主要功能是控制和限制接地電流

    中性點(diǎn)接地電阻柜的主要功能是控制和限制接地電流
    的頭像 發(fā)表于 05-09 15:16 ?451次閱讀
    接地電阻柜的<b class='flag-5'>主要功能</b>是控制和限制接地電流

    SMD電感器的主要功能是什么?

    SMD電感器的主要功能是什么? SMD電感器的主要功能是用于電路中的電感元件,主要用于儲(chǔ)存能量、傳輸信號(hào)、濾波和產(chǎn)生磁場(chǎng)等。 一、能量?jī)?chǔ)存和傳輸: SMD電感器可以儲(chǔ)存電能并將其傳輸?shù)诫娐返钠渌糠?/div>
    的頭像 發(fā)表于 02-03 15:07 ?1225次閱讀

    TC397的VDDP3引腳的主要功能是什么?

    1.TC397的VDDP3引腳的主要功能是什么?用來(lái)給類似外部FLASH供電使用的嗎? 2.我是否可以不使用VDDP3引腳,講VDDP3引腳串聯(lián)一個(gè)100nf電容到GND? 3.TC3X系列是否有硬件設(shè)計(jì)指導(dǎo)手冊(cè)?
    發(fā)表于 02-01 08:28

    傳感器的主要功能是什么

    傳感器是一種能夠感知外界環(huán)境并將這些信息轉(zhuǎn)化為可用信號(hào)的裝置。它們?cè)诟餍懈鳂I(yè)和領(lǐng)域中起到關(guān)鍵作用,被廣泛應(yīng)用于科學(xué)研究、醫(yī)療診斷、工業(yè)控制、農(nóng)業(yè)生產(chǎn)等眾多領(lǐng)域。傳感器的主要功能包括測(cè)量和監(jiān)測(cè)、控制和反饋、安全和監(jiān)控、診斷和檢測(cè)以及位置和導(dǎo)航,本文將詳細(xì)介紹傳感器的主要功能
    的頭像 發(fā)表于 01-27 17:10 ?3304次閱讀
    傳感器的<b class='flag-5'>主要功能</b>是什么

    濾波器的主要功能和作用科普

    濾波器是一種用于處理信號(hào)的電路或系統(tǒng),其主要功能和作用包括
    的頭像 發(fā)表于 01-25 18:10 ?7755次閱讀

    示波器的主要功能和作用 示波器可以測(cè)量哪些參數(shù)

    的應(yīng)用。 一、示波器的主要功能和作用: 1.波形顯示:示波器最基本的功能是將電信號(hào)波形轉(zhuǎn)換為圖形顯示,通過(guò)圖像可以直觀地分析和判斷信號(hào)的特性。示波器的屏幕通常是一個(gè)矩形的光柵,通過(guò)在上面繪制圖形和標(biāo)記,可以清楚地觀察信號(hào)
    的頭像 發(fā)表于 01-19 15:50 ?1.3w次閱讀