0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NIO的自動(dòng)駕駛AI推理工作流

jf_pJlTbmA9 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2023-07-05 16:30 ? 次閱讀

自動(dòng)駕駛汽車必須能夠快速準(zhǔn)確地檢測(cè)物體,以確保其駕駛員和道路上其他駕駛員的安全。由于自動(dòng)駕駛( AD )和視覺(jué)檢查用例中對(duì)實(shí)時(shí)處理的需求,具有預(yù)處理和后處理邏輯的多個(gè) AI 模型 組合在流水線中,并用于 機(jī)器學(xué)習(xí)( ML )推理。

流水線的每一步都需要加速,以確保低延遲工作流。延遲是獲取推理響應(yīng)所需的時(shí)間。更快地處理 AD 數(shù)據(jù)將能夠更有效地分析和使用信息,創(chuàng)造更安全的駕駛環(huán)境。任何一個(gè)方面的延遲都會(huì)降低整個(gè)管道的速度。

為了實(shí)現(xiàn)低延遲推理工作流,電動(dòng)汽車制造商 NIO 將 NVIDIA Triton 推理服務(wù)器集成到其 AD 推理管道中。 NVIDIA Triton 推理服務(wù)器是一個(gè)開源的多幀推理服務(wù)軟件。

這篇文章解釋了 NIO 如何在 GPU 上使用 NVIDIA Triton 協(xié)調(diào)其圖像預(yù)處理、后處理和 AI 模型的管道。它還展示了 NIO 如何減少網(wǎng)絡(luò)傳輸,以成功加快 AD 用例的 AI 推理工作流。

用于實(shí)時(shí)響應(yīng)的更快 AI 推理

NIO 設(shè)計(jì)、開發(fā)、聯(lián)合制造和銷售高級(jí)智能電動(dòng)汽車,推動(dòng)自動(dòng)駕駛、數(shù)字技術(shù)、電動(dòng)動(dòng)力系統(tǒng)和電池等新一代技術(shù)的創(chuàng)新。 NIO 自動(dòng)駕駛開發(fā)平臺(tái)( NADP )是一個(gè)致力于 NIO 核心自動(dòng)駕駛服務(wù)的研發(fā)平臺(tái)。

NIO 選擇 NVIDIA Triton Inference Server 是因?yàn)閹讉€(gè)關(guān)鍵的技術(shù)和操作原因,包括:

NVIDIA Triton 支持基于 DAG 的多種模型編排,以及預(yù)處理或后處理模塊

NVIDIA Triton 的云原生部署實(shí)現(xiàn)了多 GPU 、多節(jié)點(diǎn)的輕量級(jí)擴(kuò)展

高質(zhì)量的文檔和學(xué)習(xí)資源有助于輕松遷移到 NVIDIA Triton

NVIDIA Triton 的穩(wěn)定性和強(qiáng)大功能是 AD 用例所必需的

NIO 的自動(dòng)駕駛 AI 推理工作流

數(shù)百個(gè)人工智能模型用于從自動(dòng)駕駛汽車中挖掘數(shù)據(jù)。在自動(dòng)駕駛這樣的用例中,推理工作流由多個(gè) AI 模型組成,其中預(yù)處理和后處理邏輯在流水線中拼接在一起。

NIO 將管道的預(yù)處理和后處理從運(yùn)行在 CPU 上的客戶端移動(dòng)到運(yùn)行在 GPU 上的 NVIDIA Triton 。 NVIDIA Triton 的業(yè)務(wù)邏輯腳本( BLS )功能用于協(xié)調(diào)管道,以優(yōu)化 AD 使用。

通過(guò)將預(yù)處理從 CPU 移動(dòng)到 GPU 并利用高效的管道編排, NIO 在一些核心管道中實(shí)現(xiàn)了 6 倍的延遲減少,將總吞吐量提高了 5 倍。

工作流管道之前和之后如圖 1 所示。

image3-6.png

圖 1. NVIDIA Triton 推理服務(wù)器推出之前(左)和之后(右) NIO AI 推理工作流的比較

NVIDIA Triton 的模型管道編排優(yōu)勢(shì)

本節(jié)探討了 NIO 通過(guò)集成 NVIDIA Triton 實(shí)現(xiàn)的每一項(xiàng)好處。

GPU 加速預(yù)處理

NVIDIA Triton 使用 nvJPEG 和 NVIDIA DALI 在 GPU 上加速了解碼、調(diào)整大小和換位等預(yù)處理任務(wù)。這顯著減輕了客戶端 CPU 的計(jì)算工作量,并減少了預(yù)處理延遲。

升級(jí)模型而無(wú)需修改客戶端應(yīng)用程序

通過(guò)將模型的預(yù)處理和后處理移至 NVIDIA Triton ,每次升級(jí)模型時(shí),客戶端不需要任何修改。這實(shí)質(zhì)上加快了模型的推出,幫助其更快地達(dá)到生產(chǎn)。

使用單個(gè) GPU 節(jié)點(diǎn)減少網(wǎng)絡(luò)數(shù)據(jù)傳輸開銷

統(tǒng)一的預(yù)處理使輸入的多個(gè)副本能夠與多個(gè)后端識(shí)別模型共享。該過(guò)程在服務(wù)器端使用 GPU 共享內(nèi)存,無(wú)需數(shù)據(jù)傳輸開銷。

圖 2 顯示了該管道可以使用 NVIDIA Triton 業(yè)務(wù)邏輯腳本功能連接多達(dá)九個(gè)模型。

image2-7.png

圖 2. NVIDIA Triton 業(yè)務(wù)邏輯腳本的模型管道編排

對(duì)于 2K 分辨率的輸入圖像,每幀的大小為 1920 x 1080 x 3 x 8 = 47 Mb 。假設(shè)全幀速率為 60 fps ,每秒輸入的數(shù)據(jù)量為 1920 x 1080 x 3 x 8 x 60 = 2847 Mb 。在前一個(gè)工作流中,每個(gè)圖像通過(guò)網(wǎng)絡(luò)依次發(fā)送給九個(gè)模型。每秒傳輸?shù)臄?shù)據(jù)為 1920 x 1080 x 3 x 8 x 60 x 9 = 25 Gb = 3 Gb 。

在新的工作流程中,九個(gè)模型與 NVIDIA Triton 業(yè)務(wù)邏輯腳本配合。這意味著模型可以訪問(wèn) GPU 共享存儲(chǔ)器中的圖像,并且圖像不必通過(guò)網(wǎng)絡(luò)發(fā)送。假設(shè) PCIe 帶寬為 160 Gb =每秒 20 Gb ,理論上,如果通過(guò) PCIe 傳輸數(shù)據(jù),每秒生成的數(shù)據(jù)可以節(jié)省 150 毫秒的數(shù)據(jù)傳輸時(shí)間。

假設(shè)可用帶寬為 16 Gb =每秒 2 Gb ,理論上,如果數(shù)據(jù)通過(guò)網(wǎng)絡(luò)傳輸,每秒生成的數(shù)據(jù)可以節(jié)省 1500 毫秒的數(shù)據(jù)傳輸時(shí)間。所有這些都會(huì)加快工作流程。

使用圖像壓縮節(jié)省網(wǎng)絡(luò)傳輸

為了進(jìn)行準(zhǔn)確的模型預(yù)測(cè),輸入圖像必須為 1920 x 1080 x 3 x 8 字節(jié),并且必須通過(guò)網(wǎng)絡(luò)傳輸。在引入服務(wù)器端預(yù)處理之后,可以在允許的精度損失范圍內(nèi)將原始圖像更改為壓縮的三通道 720 像素圖像( 1280 x 720 x 3 )。

因此,只需幾百 KB 即可傳輸壓縮圖像的字節(jié),并在服務(wù)器上以最小的精度損失將大小調(diào)整為 1920 x 1080 x 3 x 8 字節(jié)。這導(dǎo)致了額外的網(wǎng)絡(luò)傳輸節(jié)省,加快了工作流程。

NADP 推理平臺(tái)中的易集成性

NIO 目前基于 NVIDIA Triton 的推理平臺(tái)是其自動(dòng)駕駛開發(fā)平臺(tái)( NADP )的關(guān)鍵組件,用于其自動(dòng)駕駛解決方案。

由于 NIO 平臺(tái)構(gòu)建在 Kubernetes ( K8s )上, NVIDIA Triton 必須與 Kubernete 良好集成。工作流程的組件圍繞 NVIDIA Triton 實(shí)現(xiàn)為 K8s CRD (本地和自定義)。

image4-5.png

圖 3.NIO 在 Kubernetes 中的機(jī)器學(xué)習(xí)工作流

持續(xù)集成/持續(xù)交付( CI / CD )

Argo 是 Kubernetes 中用于協(xié)調(diào)工作流的引擎。它有助于開發(fā)、量化、訪問(wèn)、云部署、壓力測(cè)試和發(fā)布中涉及的所有組件的 CI / CD 。 NVIDIA Triton 通過(guò)在加載模型時(shí)觸發(fā)工作流中的下一步來(lái)幫助 CI / CD 。

此外, NVIDIA Triton Docker 容器的使用有助于在開發(fā)、測(cè)試和部署環(huán)境中實(shí)現(xiàn)一致的功能。

將 Jupyter 環(huán)境無(wú)縫集成到 NVIDIA Triton 圖像中。 Jupyter 為需要在線調(diào)試或離線復(fù)制的復(fù)雜問(wèn)題提供了一個(gè)方便的開發(fā)環(huán)境。

易用 Istio 部署

NVIDIA Triton 本機(jī)支持與應(yīng)用程序通信的 gRPC 協(xié)議。然而,由于 Kubernetes 本地服務(wù)無(wú)法為 gRPC 提供有效的請(qǐng)求級(jí)負(fù)載平衡, NVIDIA Triton 與 Istio 服務(wù)網(wǎng)格集成。 Istio 用于對(duì) NVIDIA Triton 推理服務(wù)器的流量進(jìn)行負(fù)載平衡,并通過(guò) NVIDIA Triton 的活躍度/就緒性探針監(jiān)測(cè)服務(wù)的運(yùn)行狀況。

阿波羅配置管理易于使用

阿波羅配置中心用于基于模型名稱的服務(wù)發(fā)現(xiàn)。用戶可以訪問(wèn)模型,而不知道模型部署的特定域名。結(jié)合 NVIDIA Triton 模型存儲(chǔ)庫(kù),用戶可以直接觸發(fā)模型的部署。

普羅米修斯和格拉法納的指標(biāo)

NVIDIA Triton 基于模型維度提供了一整套模型服務(wù)指標(biāo)。例如, NVIDIA Triton 可以區(qū)分推理請(qǐng)求排隊(duì)時(shí)間和 GPU 計(jì)算時(shí)間,從而實(shí)現(xiàn)在線模型服務(wù)性能的細(xì)粒度診斷和分析,而無(wú)需進(jìn)入調(diào)試模式。

由于 NVIDIA Triton 支持云原生主流 Prometheus / Grafana ,用戶可以輕松配置每個(gè)維度的儀表板和警報(bào),為高服務(wù)可用性提供指標(biāo)支持。

關(guān)鍵要點(diǎn)

NIO 的優(yōu)化工作流程集成了 NVIDIA Triton 推理服務(wù)器,使一些核心管道的延遲減少了 6 倍。這將總吞吐量提高了 5 倍。

通過(guò)使用 NVIDIA Triton 管道編排功能將預(yù)處理邏輯移至 GPU , NIO 實(shí)現(xiàn)了:

更快的圖像處理

釋放 CPU 容量

減少網(wǎng)絡(luò)傳輸開銷

更高的推理吞吐量

NIO 使用 NVIDIA Triton 推理服務(wù)器實(shí)現(xiàn)了 AI 推理工作流加速。 NVIDIA Triton 也很容易集成到基于 Kubernetes 的強(qiáng)大可擴(kuò)展解決方案中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4986

    瀏覽量

    103066
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30896

    瀏覽量

    269108
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13812

    瀏覽量

    166461
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于工作流技術(shù)的廣州電信本地計(jì)費(fèi)系統(tǒng)改造

    【作者】:龍欣庭【來(lái)源】:《華南理工大學(xué)》2009年【摘要】:工作流指業(yè)務(wù)過(guò)程的部分或整體在計(jì)算機(jī)應(yīng)用環(huán)境下的自動(dòng)化,使多個(gè)參與者之間傳遞信息或任務(wù)的過(guò)程按照某種預(yù)定義的規(guī)則自動(dòng)進(jìn)行。
    發(fā)表于 04-24 09:20

    基于Notes的OA工作流引擎的設(shè)計(jì)和實(shí)現(xiàn)

    到了更高層次的發(fā)展,成為企業(yè)管理現(xiàn)代化的重要標(biāo)志。目前,辦公自動(dòng)化技術(shù)越來(lái)越普遍地被應(yīng)用到***機(jī)關(guān)、金融機(jī)構(gòu)和企事業(yè)單位的日常管理中,成為提高工作效率、優(yōu)化管理流程的重要手段。工作流技術(shù)的使用,使得
    發(fā)表于 04-24 09:22

    【話題】特斯拉首起自動(dòng)駕駛致命車禍,自動(dòng)駕駛的冬天來(lái)了?

    自動(dòng)駕駛技術(shù)已經(jīng)有足夠積累,雖然還不完美無(wú)缺,但是可以投入商用,科技都是在使用中完善的,不能一遭被蛇咬,十年怕井繩,難道發(fā)生一次空難之后,以后飛機(jī)就停飛啦?技術(shù)朋友,更加關(guān)注問(wèn)題本身,有什么技術(shù)手段可以解決此類問(wèn)題?對(duì)于這個(gè)問(wèn)題,公說(shuō)公有理婆說(shuō)婆有理,元芳,你怎么看?
    發(fā)表于 07-05 11:14

    自動(dòng)駕駛真的會(huì)來(lái)嗎?

    自動(dòng)駕駛原理示意GIF圖  特斯拉自動(dòng)駕駛死亡事故給全世界帶來(lái)了極大的震驚,但這并不意味著基于壞消息之上的關(guān)注全然沒(méi)有正面意義?! ≡诮邮苄吕丝萍疾稍L中,多位硅谷相關(guān)人士告訴新浪科技:一方面是對(duì)于
    發(fā)表于 07-21 09:00

    自動(dòng)駕駛的到來(lái)

      傳統(tǒng)汽車廠商更趨向于通過(guò)技術(shù)的不斷積累,場(chǎng)景的不斷豐富,逐步從輔助駕駛過(guò)渡到半自動(dòng)駕駛,進(jìn)而在將來(lái)最終實(shí)現(xiàn)無(wú)人駕駛;某些高科技公司則希望通過(guò)各種外部傳感器實(shí)時(shí)采集海量數(shù)據(jù),處理器經(jīng)過(guò)數(shù)據(jù)分析然后
    發(fā)表于 06-08 15:25

    AI/自動(dòng)駕駛領(lǐng)域的巔峰會(huì)議—國(guó)際AI自動(dòng)駕駛高峰論壇

    由南德意志出版及活動(dòng)有限公司舉辦的 國(guó)際AI自動(dòng)駕駛高峰論壇 將于 2017年11月28/29日 在 德國(guó)慕尼黑 舉辦,中德聯(lián)合股份公司作為中國(guó)獨(dú)家合作伙伴,誠(chéng)邀您撥冗蒞臨!【活動(dòng)背景】AI
    發(fā)表于 09-13 13:59

    如何讓自動(dòng)駕駛更加安全?

    最近,國(guó)內(nèi)多個(gè)城市開始發(fā)放自動(dòng)駕駛的開放道路測(cè)試牌照,意味著自動(dòng)駕駛的汽車可以在公共道路上進(jìn)行測(cè)試。不過(guò),駕駛安全性仍是社會(huì)關(guān)注的焦點(diǎn),美國(guó)優(yōu)步公司進(jìn)行自動(dòng)駕駛技術(shù)測(cè)試發(fā)生致命撞擊事故
    發(fā)表于 05-13 00:26

    自動(dòng)駕駛汽車的處理能力怎么樣?

    作在未來(lái)20 - 30年中,自動(dòng)駕駛汽車(AV)將改變我們的駕駛習(xí)慣、運(yùn)輸行業(yè)并更廣泛地影響社會(huì)。 我們不僅能夠?qū)⑵囌賳镜轿覀兊募议T口并在使用后將其送走,自動(dòng)駕駛汽車還將挑戰(zhàn)個(gè)人擁有汽車的想法,并
    發(fā)表于 08-07 07:13

    自動(dòng)駕駛系列報(bào)告大放送了涉及傳感器,芯片,執(zhí)行控制等

    ` 本帖最后由 AI汽車人 于 2019-8-9 17:18 編輯 自動(dòng)駕駛系列報(bào)告,總共五部, 自動(dòng)駕駛系列報(bào)告之一:綜合篇:自動(dòng)駕駛的時(shí)代已經(jīng)開始到來(lái),
    發(fā)表于 08-09 17:14

    如何保證自動(dòng)駕駛的安全?

    美好未來(lái)到來(lái)的更快。AI還在路測(cè),黑客們的自動(dòng)駕駛已經(jīng)成熟了這一點(diǎn)并不是危言聳聽(tīng),在自動(dòng)駕駛汽車還處在路測(cè)階段時(shí),汽車黑客就已經(jīng)能在地球另一端把你家汽車開走了。早在2015年的一場(chǎng)BlackHat大會(huì)上,就有
    發(fā)表于 10-22 07:45

    自動(dòng)駕駛AI芯片現(xiàn)狀分析

    自動(dòng)駕駛AI芯片到位了么?
    發(fā)表于 12-04 06:13

    自動(dòng)駕駛車輛中AI面臨的挑戰(zhàn)

    自動(dòng)駕駛車輛中采用的AI算法自動(dòng)駕駛車輛中AI面臨的挑戰(zhàn)
    發(fā)表于 02-22 06:39

    自動(dòng)駕駛系統(tǒng)設(shè)計(jì)及應(yīng)用的相關(guān)資料分享

    作者:余貴珍、周彬、王陽(yáng)、周亦威、白宇目錄第一章 自動(dòng)駕駛系統(tǒng)概述1.1 自動(dòng)駕駛系統(tǒng)架構(gòu)1.1.1 自動(dòng)駕駛系統(tǒng)的三個(gè)層級(jí)1.1.2 自動(dòng)駕駛系統(tǒng)的基本技術(shù)架構(gòu)1.2
    發(fā)表于 08-30 08:36

    【KV260視覺(jué)入門套件試用體驗(yàn)】八、VITis AI自動(dòng)駕駛多任務(wù)執(zhí)行MultiTask V3

    是一種模型,旨在同時(shí)執(zhí)行自動(dòng)駕駛場(chǎng)景中的不同任務(wù),同時(shí)實(shí)現(xiàn)優(yōu)異的性能和效率。這些任務(wù)包括對(duì)象檢測(cè)、分割、車道檢測(cè)、可行駛區(qū)域分割和深度估算,這些都是自動(dòng)駕駛感知模塊的重要組成部分。 三、代碼實(shí)現(xiàn)
    發(fā)表于 09-26 16:43

    基于案例推理工作流異常處理研究

    對(duì)工作流的異常和案例推理(Case - Based Reasoning,簡(jiǎn)稱CBR)的機(jī)制進(jìn)行了介紹,給出了一個(gè)應(yīng)用CBR 技術(shù)進(jìn)行異常處理的工作流模型,并研究了應(yīng)用CBR 方法處理工作流
    發(fā)表于 06-15 10:20 ?14次下載