0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【AIBOX應(yīng)用】通過 NVIDIA TensorRT 實(shí)現(xiàn)實(shí)時(shí)快速的語義分割

Firefly開源團(tuán)隊(duì) ? 2024-12-18 16:33 ? 次閱讀

NVIDIA 系列 AIBOX

AIBOX-OrinNano 和 AIBOX-OrinNX 均搭載 NVIDIA 原裝 Jetson Orin 核心板模組,標(biāo)配工業(yè)級全金屬外殼,鋁合金結(jié)構(gòu)導(dǎo)熱,頂蓋外殼側(cè)面采用條幅格柵設(shè)計(jì),高效散熱,保障在高溫運(yùn)行狀態(tài)下的運(yùn)算性能和穩(wěn)定性,滿足各種工業(yè)級的應(yīng)用需求。

c56dde2a-bd1a-11ef-8084-92fbcf53809c.png

NVIDIA TensorRT

NVIDIA系列 AIBOX 支持深度學(xué)習(xí)框架TensorRT,TensorRT是用于高性能深度學(xué)習(xí)推理的 API 生態(tài)系統(tǒng),其包括推理運(yùn)行時(shí)和模型優(yōu)化,可為生產(chǎn)應(yīng)用提供低延遲和高吞吐量。

TensorRT 生態(tài)系統(tǒng)包括 TensorRT、TensorRT-LLM、TensorRT 模型優(yōu)化器和 TensorRT Cloud。

NVIDIA TensorRT 的優(yōu)勢

推理速度提升 36 倍

優(yōu)化推理性能

加速各種工作負(fù)載

使用 Triton 進(jìn)行部署、運(yùn)行和擴(kuò)展

應(yīng)用案例—語義分割

語義分割基于圖像識別,但分類是在像素級別進(jìn)行的,而不是在整個(gè)圖像上進(jìn)行。這是通過將預(yù)訓(xùn)練的圖像識別骨干網(wǎng)絡(luò)進(jìn)行卷積化來實(shí)現(xiàn)的,將模型轉(zhuǎn)換為能夠進(jìn)行逐像素標(biāo)注的全卷積網(wǎng)絡(luò)(FCN)。語義分割對于環(huán)境感知特別有用,它能夠?qū)γ總€(gè)場景中的許多不同潛在對象(包括前景和背景)進(jìn)行密集的逐像素分類。

c58caad0-bd1a-11ef-8084-92fbcf53809c.png

SegNet 模型

SegNet 的新穎之處在于解碼器對其較低分辨率的輸入特征圖進(jìn)行上采樣的方式。具體地說,解碼器使用了在相應(yīng)編碼器的最大池化步驟中計(jì)算的池化索引來執(zhí)行非線性上采樣。經(jīng)上采樣后的特征圖是稀疏的,因此隨后使用可訓(xùn)練的卷積核進(jìn)行卷積操作,生成密集的特征圖。SegNet 的架構(gòu)與廣泛采用的 FCN 以及眾所周知的 DeepLab-LargeFOV,DeconvNet 架構(gòu)進(jìn)行比較。比較的結(jié)果揭示了在實(shí)現(xiàn)良好的分割性能時(shí)所涉及的內(nèi)存與精度之間的權(quán)衡。

c5978d06-bd1a-11ef-8084-92fbcf53809c.png

下載源碼

$ git clone --recursive --depth=1 https://github.com/dusty-nv/jetson-inference

編譯 / 安裝

參考:https://github.com/dusty-nv/jetson-inference/blob/master/docs/building-repo-2.md

運(yùn)行示例

$ ./segnet.py --network=fcn-resnet18-cityscapes city_0.jpg output_city_0.jpgc5bc22c4-bd1a-11ef-8084-92fbcf53809c.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1144

    瀏覽量

    40822
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5045

    瀏覽量

    103326
  • 核心板
    +關(guān)注

    關(guān)注

    5

    文章

    1024

    瀏覽量

    29816
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA技術(shù)助力Pantheon Lab數(shù)字人實(shí)時(shí)交互解決方案

    本案例中,Pantheon Lab(萬想科技)專注于數(shù)字人技術(shù)解決方案,通過 NVIDIA 技術(shù)實(shí)現(xiàn)數(shù)字人實(shí)時(shí)對話與客戶互動(dòng)交流。借助 NVIDIA
    的頭像 發(fā)表于 01-14 11:19 ?124次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發(fā)并開源的一種新型推測解碼技術(shù),該技術(shù)現(xiàn)在可與 NVIDIA TensorRT-LLM 一起使用。
    的頭像 發(fā)表于 12-25 17:31 ?197次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個(gè)專為優(yōu)化大語言模型 (LLM) 推理而設(shè)計(jì)的庫。它提供了多種先進(jìn)的優(yōu)化技術(shù),包括自定義 Attention Kernel、Inflight
    的頭像 發(fā)表于 12-17 17:47 ?222次閱讀

    NVIDIA生態(tài)】具有100 TOPS強(qiáng)勁算力的AIBOX!

    近年來,AI正在通過自動(dòng)化、改進(jìn)數(shù)據(jù)分析以及提升參與度來推動(dòng)企業(yè)變革。借助強(qiáng)大的嵌入式AI計(jì)算機(jī),為生成式AI、計(jì)算機(jī)視覺和高級機(jī)器人技術(shù)打造新一代產(chǎn)品。Firefly推出搭載NVIDIA原裝
    的頭像 發(fā)表于 12-05 03:00 ?533次閱讀
    【<b class='flag-5'>NVIDIA</b>生態(tài)】具有100 TOPS強(qiáng)勁算力的<b class='flag-5'>AIBOX</b>!

    NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub上公開發(fā)布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現(xiàn)已在 GitHub 上公開發(fā)布!
    的頭像 發(fā)表于 11-28 10:43 ?308次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM Roadmap現(xiàn)已在GitHub上公開發(fā)布

    TensorRT-LLM低精度推理優(yōu)化

    本文將分享 TensorRT-LLM 中低精度量化內(nèi)容,并從精度和速度角度對比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具 NVIDIA TensorRT Model
    的頭像 發(fā)表于 11-19 14:29 ?354次閱讀
    <b class='flag-5'>TensorRT</b>-LLM低精度推理優(yōu)化

    語義分割25種損失函數(shù)綜述和展望

    語義圖像分割,即將圖像中的每個(gè)像素分類到特定的類別中,是許多視覺理解系統(tǒng)中的重要組成部分。作為評估統(tǒng)計(jì)模型性能的主要標(biāo)準(zhǔn),損失函數(shù)對于塑造基于深度學(xué)習(xí)的分割算法的發(fā)
    的頭像 發(fā)表于 10-22 08:04 ?700次閱讀
    <b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數(shù)綜述和展望

    使用OpenVINO C# API部署YOLO-World實(shí)現(xiàn)實(shí)時(shí)開放詞匯對象檢測

    快速準(zhǔn)確識別,并通過AR技術(shù)將虛擬元素與真實(shí)場景相結(jié)合,為用戶帶來沉浸式的交互體驗(yàn)。在本文中,我們將結(jié)合OpenVINO C# API使用最新發(fā)布的OpenVINO 2024.0部署 YOLO-World實(shí)現(xiàn)實(shí)時(shí)開放詞匯對象檢
    的頭像 發(fā)表于 08-30 16:27 ?765次閱讀
    使用OpenVINO C# API部署YOLO-World<b class='flag-5'>實(shí)現(xiàn)實(shí)時(shí)</b>開放詞匯對象檢測

    AIBOX旗艦版:內(nèi)置NVIDIA核心模組

    AIBOX-OrinNano和AIBOX-OrinNX均搭載NVIDIA原裝JetsonOrin核心板模組,該系列可提供40~100TOPS的AI計(jì)算能力、大容量統(tǒng)一內(nèi)存和全面的軟件堆棧,能夠以超高
    的頭像 發(fā)表于 08-30 11:51 ?413次閱讀
    <b class='flag-5'>AIBOX</b>旗艦版:內(nèi)置<b class='flag-5'>NVIDIA</b>核心模組

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響力的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗(yàn)。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應(yīng)用部署,提高了大模型產(chǎn)業(yè)應(yīng)用效率,更大規(guī)模地釋放大模型的應(yīng)用價(jià)值。”
    的頭像 發(fā)表于 08-23 15:48 ?476次閱讀

    圖像語義分割的實(shí)用性是什么

    圖像語義分割是一種重要的計(jì)算機(jī)視覺任務(wù),它旨在將圖像中的每個(gè)像素分配到相應(yīng)的語義類別中。這項(xiàng)技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)學(xué)圖像分析、機(jī)器人導(dǎo)航等。 一、圖像語義
    的頭像 發(fā)表于 07-17 09:56 ?469次閱讀

    圖像分割語義分割的區(qū)別與聯(lián)系

    圖像分割語義分割是計(jì)算機(jī)視覺領(lǐng)域中兩個(gè)重要的概念,它們在圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個(gè)區(qū)
    的頭像 發(fā)表于 07-17 09:55 ?1079次閱讀

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計(jì)算機(jī)視覺領(lǐng)域的重要任務(wù),旨在將圖像劃分為多個(gè)具有特定語義含義的區(qū)域或?qū)ο蟆>矸e神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的一種核心模型,在圖像
    的頭像 發(fā)表于 07-09 11:51 ?1033次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

    NVIDIA Holoscan 的 NVIDIA AI Enterprise-IGX 軟件現(xiàn)已在 NVIDIA IGX 平臺上正式可用,以滿足工業(yè)邊緣對實(shí)時(shí) AI 計(jì)算日益增長的需求
    發(fā)表于 06-03 09:48 ?327次閱讀
      <b class='flag-5'>NVIDIA</b> <b class='flag-5'>通過</b> Holoscan 為 <b class='flag-5'>NVIDIA</b> IGX 提供企業(yè)軟件支持,<b class='flag-5'>實(shí)現(xiàn)</b>邊緣<b class='flag-5'>實(shí)時(shí)</b>醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個(gè)開源庫,用于優(yōu)化從 PC 到云端的
    的頭像 發(fā)表于 04-28 10:36 ?595次閱讀