0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson Orin深度學(xué)習(xí)加速器入門

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:John Welsh ? 2022-10-10 15:46 ? 次閱讀

如果你是一個(gè)活躍的 Jetson 開發(fā)者,你知道 NVIDIA ISAAC 的一個(gè)關(guān)鍵優(yōu)點(diǎn)是它將 CPUGPU 組合成一個(gè)單一的模塊,在一個(gè)可以部署在邊緣的小、低功耗軟件包中為你提供擴(kuò)展的 NVIDIA 軟件堆棧。

Jetson 還具有多種其他處理器,包括硬件加速編碼器和解碼器、圖像信號處理器和深度學(xué)習(xí)加速器( DLA )。

DLA 可在 Jetson AGX Xavier, Xavier NX, Jetson AGX Orin 和 Jetson Orin-NX 模塊上使用。最近的 NVIDIA DRIVE Xavier 和基于 Orin 的平臺也有 DLA 核心。

深度學(xué)習(xí)加速器概述

DLA 是一種特定于應(yīng)用的集成電路,能夠有效地執(zhí)行固定操作,如卷積和池,這在現(xiàn)代神經(jīng)網(wǎng)絡(luò)架構(gòu)中很常見。雖然 DLA 沒有那么多 支持的層 作為 GPU ,它仍然支持許多流行的神經(jīng)網(wǎng)絡(luò)架構(gòu)中使用的各種層。

在許多情況下,層支持可能涵蓋模型的需求。例如, NVIDIA TAO 工具包 包括 DLA 支持的各種預(yù)訓(xùn)練模型,從目標(biāo)檢測到動(dòng)作識別。

雖然需要注意的是, DLA 吞吐量通常低于 GPU 的吞吐量,但它具有能效,允許您卸載深度學(xué)習(xí)工作負(fù)載,將 GPU 釋放出來用于其他任務(wù)?;蛘撸鶕?jù)您的應(yīng)用程序,您可以在 GPU 和 DLA 上同時(shí)運(yùn)行相同的模型,以實(shí)現(xiàn)更高的凈吞吐量。

許多 NVIDIA Jetson 開發(fā)者已經(jīng)在使用 DLA 成功優(yōu)化他們的應(yīng)用程序。 Postmates 利用 DLA 和 GPU 優(yōu)化了 Jetson AGX Xavier 上的交付機(jī)器人應(yīng)用。這個(gè) 菜鳥實(shí)驗(yàn)室 使用 DLA 優(yōu)化其物流車輛。如果您希望充分優(yōu)化應(yīng)用程序, DLA 是 Jetson 系列中需要考慮的一個(gè)重要部分。

如何使用深度學(xué)習(xí)加速器

poYBAGNDzceAYkrUAAB96VlOq1o207.png

圖 1.Jetson Orin 上深度學(xué)習(xí)加速器的粗略架構(gòu)圖

要使用 DLA ,首先需要使用深度學(xué)習(xí)框架(如 PyTorch 或 TensorFlow )來訓(xùn)練模型。接下來,您需要使用 NVIDIA TensorRT 導(dǎo)入并優(yōu)化您的模型。 TensorRT 負(fù)責(zé)生成 DLA 引擎,也可以用作執(zhí)行這些引擎的運(yùn)行時(shí)。最后,您應(yīng)該分析您的模式,并盡可能進(jìn)行優(yōu)化,以最大限度地提高 DLA 兼容性。

開始使用深度學(xué)習(xí)加速器

準(zhǔn)備好潛水了嗎?這個(gè) Jetson_dla_tutorial GitHub 項(xiàng)目演示了一個(gè)基本的 DLA 工作流,可以幫助您優(yōu)化 Jetson 的應(yīng)用程序。

通過本教程,您可以學(xué)習(xí)如何在 PyTorch 中定義模型,使用 TensorRT 導(dǎo)入模型,使用 NVIDIA Nsight System profiler 分析性能,修改模型以獲得更好的 DLA 兼容性,以及為 INT8 執(zhí)行進(jìn)行校準(zhǔn)。請注意, CIFAR10 數(shù)據(jù)集用作玩具示例,以便于再現(xiàn)步驟。

關(guān)于作者

John Welsh 是 NVIDIA 自治機(jī)器的開發(fā)技術(shù)工程師,他與 NVIDIA Jetson 一起開發(fā)加速應(yīng)用程序。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1144

    瀏覽量

    40848
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3656

    瀏覽量

    134969
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5511

    瀏覽量

    121372
收藏 人收藏

    評論

    相關(guān)推薦

    英偉達(dá)推出Jetson Orin Nano模組最高40TOPS性能,為機(jī)器人和邊緣AI提供強(qiáng)動(dòng)力

    。具體參數(shù)方面,Jetson Orin具有NVIDIA Ampere架構(gòu)GPU、基于Arm Cortex-A78架構(gòu)的CPU、高達(dá)8GB的內(nèi)存、新一代深度
    的頭像 發(fā)表于 09-21 09:44 ?7849次閱讀

    NVIDIA Jetson的相關(guān)資料分享

    。Jetson是以機(jī)器學(xué)習(xí)應(yīng)用為目的而設(shè)計(jì)的,具有GPU的并行處理用的嵌入式計(jì)算板,用于高速執(zhí)行圖像識別、機(jī)器學(xué)習(xí)和自動(dòng)駕駛等。爆炸式增長的AI模型的復(fù)雜性近年來,由于傳感技術(shù)的革新
    發(fā)表于 11-09 08:26

    NVIDIA Jetson介紹

    首發(fā)極術(shù)社區(qū)如對Arm相關(guān)技術(shù)感興趣,歡迎私信 aijishu20加入技術(shù)微信群。分享內(nèi)容NVIDIA Jetson是嵌入式計(jì)算平臺,具有低功耗、高性能和小體積等特點(diǎn),可加速各行業(yè)的AI應(yīng)用落地
    發(fā)表于 12-14 08:05

    NVIDIA Jetson AGX Orin提升邊緣AI標(biāo)桿

    最新發(fā)布的 NVIDIA Jetson AGX Orin 提升邊緣 AI 標(biāo)桿,使我們在最新一輪行業(yè)推理基準(zhǔn)測試中的領(lǐng)先優(yōu)勢更加明顯。
    的頭像 發(fā)表于 04-09 08:24 ?1434次閱讀

    NVIDIA推出全新Jetson Orin Nano系統(tǒng)級模組

    NVIDIA 推出全新Jetson Orin Nano 系統(tǒng)級模組,擴(kuò)充了NVIDIA Jetson產(chǎn)品陣容。全新
    的頭像 發(fā)表于 09-22 09:54 ?1276次閱讀

    NVIDIA Nova Orin平臺助力AMR的構(gòu)建和部署

    基于兩個(gè) Orin 模組。Jetson AGX Orin 通過 GPU 加速框架運(yùn)行 NVIDIA Isaac 機(jī)器人堆棧和機(jī)器人操作系統(tǒng)
    的頭像 發(fā)表于 09-26 09:45 ?1301次閱讀

    Jetson AGX Orin開發(fā)者套件轉(zhuǎn)化為任何Jetson Orin模塊

    隨著 Jetson Orin Nano 在本次 GTC 大會(huì)的發(fā)布,整個(gè) Jetson Orin 模塊陣容現(xiàn)已揭曉。憑借高達(dá) 40 TOPS 的 AI 性能,
    的頭像 發(fā)表于 09-30 11:03 ?2114次閱讀

    使用NVIDIA Jetson Orin Nano解決入門級邊緣人工智能挑戰(zhàn)

    2022 年 GTC , NVIDIA 宣布 Jetson Orin Nano 系列系統(tǒng)模塊( SoM )。它們的 AI 性能是 NVIDIA Je
    的頭像 發(fā)表于 10-11 14:47 ?2573次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>Orin</b> Nano解決<b class='flag-5'>入門</b>級邊緣人工智能挑戰(zhàn)

    NVIDIA Jetson Orin Nano的性能基準(zhǔn)

    在本次 GTC 大會(huì)上,NVIDIA 發(fā)布了Jetson Orin Nano系列的系統(tǒng)級模組(SoM)。其 AI 性能是 NVIDIA Jetson
    的頭像 發(fā)表于 10-12 09:55 ?2984次閱讀

    基于AdderNet的深度學(xué)習(xí)推理加速器

    電子發(fā)燒友網(wǎng)站提供《基于AdderNet的深度學(xué)習(xí)推理加速器.zip》資料免費(fèi)下載
    發(fā)表于 10-31 11:12 ?0次下載
    基于AdderNet的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>推理<b class='flag-5'>加速器</b>

    GTC23 | 使用 NVIDIA Jetson Orin Nano 開發(fā)套件開發(fā) AI 機(jī)器人及智能視覺系統(tǒng)

    NVIDIA Jetson Orin Nano Developer Kit? 為創(chuàng)建入門級 AI 機(jī)器人、智能無人機(jī)和智能視覺系統(tǒng)設(shè)定了一個(gè)新標(biāo)準(zhǔn),同時(shí)簡化了?
    的頭像 發(fā)表于 03-29 03:40 ?1619次閱讀

    NVIDIA 推出 Jetson AGX Orin 工業(yè)級模塊助力邊緣 AI

    Jetson 邊緣 AI 和機(jī)器人平臺 ,您可以在此類復(fù)雜的環(huán)境中部署 AI 和傳感融合算法。 NVIDIA 在 COMPUTEX 2023 上發(fā)布了全新 Jetson AGX
    的頭像 發(fā)表于 06-05 10:45 ?1249次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Jetson</b> AGX <b class='flag-5'>Orin</b> 工業(yè)級模塊助力邊緣 AI

    利用 NVIDIA Jetson 將 AI 學(xué)習(xí)延展至邊緣

    .com/zh-cn/jetson/edu/ )。自從 10 年前首次發(fā)布以來, NVIDIA Jetson 平臺 已經(jīng)為全球嵌入式計(jì)算和邊緣 AI 設(shè)立了標(biāo)準(zhǔn)。這些用于深度
    的頭像 發(fā)表于 06-13 20:55 ?679次閱讀
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> 將 AI <b class='flag-5'>學(xué)習(xí)</b>延展至邊緣

    使用 DLA 在 NVIDIA Jetson Orin 上最大限度地提高深度學(xué)習(xí)性能

    深度學(xué)習(xí)加速器(DLA)中用于深度學(xué)習(xí)工作負(fù)載的專用深度
    的頭像 發(fā)表于 08-22 19:20 ?1259次閱讀
    使用 DLA 在 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>Orin</b> 上最大限度地提高<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>性能

    Orin芯片在汽車行業(yè)的應(yīng)用

    Orin芯片概述 Orin芯片是NVIDIA推出的一款系統(tǒng)級芯片(SoC),專為自動(dòng)駕駛汽車設(shè)計(jì)。它基于ARM架構(gòu),集成了NVIDIA的GPU、
    的頭像 發(fā)表于 10-27 15:55 ?874次閱讀