中文字幕日韩理论在线,大伊香蕉精品一区在线

如果你是一個(gè)活躍的 Jetson 開發(fā)者，你知道 NVIDIA ISAAC 的一個(gè)關(guān)鍵優(yōu)點(diǎn)是它將 CPU 和 GPU 組合成一個(gè)單一的模塊，在一個(gè)可以部署在邊緣的小、低功耗軟件包中為你提供擴(kuò)展的 NVIDIA 軟件堆棧。

Jetson 還具有多種其他處理器，包括硬件加速編碼器和解碼器、圖像信號處理器和深度學(xué)習(xí)加速器（ DLA ）。

DLA 可在 Jetson AGX Xavier， Xavier NX， Jetson AGX Orin 和 Jetson Orin-NX 模塊上使用。最近的 NVIDIA DRIVE Xavier 和基于 Orin 的平臺也有 DLA 核心。

深度學(xué)習(xí)加速器概述

DLA 是一種特定于應(yīng)用的集成電路，能夠有效地執(zhí)行固定操作，如卷積和池，這在現(xiàn)代神經(jīng)網(wǎng)絡(luò)架構(gòu)中很常見。雖然 DLA 沒有那么多支持的層作為 GPU ，它仍然支持許多流行的神經(jīng)網(wǎng)絡(luò)架構(gòu)中使用的各種層。

在許多情況下，層支持可能涵蓋模型的需求。例如， NVIDIA TAO 工具包包括 DLA 支持的各種預(yù)訓(xùn)練模型，從目標(biāo)檢測到動(dòng)作識別。

雖然需要注意的是， DLA 吞吐量通常低于 GPU 的吞吐量，但它具有能效，允許您卸載深度學(xué)習(xí)工作負(fù)載，將 GPU 釋放出來用于其他任務(wù)?；蛘撸鶕?jù)您的應(yīng)用程序，您可以在 GPU 和 DLA 上同時(shí)運(yùn)行相同的模型，以實(shí)現(xiàn)更高的凈吞吐量。

許多 NVIDIA Jetson 開發(fā)者已經(jīng)在使用 DLA 成功優(yōu)化他們的應(yīng)用程序。 Postmates 利用 DLA 和 GPU 優(yōu)化了 Jetson AGX Xavier 上的交付機(jī)器人應(yīng)用。這個(gè) 菜鳥實(shí)驗(yàn)室使用 DLA 優(yōu)化其物流車輛。如果您希望充分優(yōu)化應(yīng)用程序， DLA 是 Jetson 系列中需要考慮的一個(gè)重要部分。

如何使用深度學(xué)習(xí)加速器

圖 1.Jetson Orin 上深度學(xué)習(xí)加速器的粗略架構(gòu)圖

要使用 DLA ，首先需要使用深度學(xué)習(xí)框架（如 PyTorch 或 TensorFlow ）來訓(xùn)練模型。接下來，您需要使用 NVIDIA TensorRT 導(dǎo)入并優(yōu)化您的模型。 TensorRT 負(fù)責(zé)生成 DLA 引擎，也可以用作執(zhí)行這些引擎的運(yùn)行時(shí)。最后，您應(yīng)該分析您的模式，并盡可能進(jìn)行優(yōu)化，以最大限度地提高 DLA 兼容性。

開始使用深度學(xué)習(xí)加速器

準(zhǔn)備好潛水了嗎？這個(gè) Jetson_dla_tutorial GitHub 項(xiàng)目演示了一個(gè)基本的 DLA 工作流，可以幫助您優(yōu)化 Jetson 的應(yīng)用程序。

通過本教程，您可以學(xué)習(xí)如何在 PyTorch 中定義模型，使用 TensorRT 導(dǎo)入模型，使用 NVIDIA Nsight System profiler 分析性能，修改模型以獲得更好的 DLA 兼容性，以及為 INT8 執(zhí)行進(jìn)行校準(zhǔn)。請注意， CIFAR10 數(shù)據(jù)集用作玩具示例，以便于再現(xiàn)步驟。

關(guān)于作者

John Welsh 是 NVIDIA 自治機(jī)器的開發(fā)技術(shù)工程師，他與 NVIDIA Jetson 一起開發(fā)加速應(yīng)用程序。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

解碼器

解碼器

+關(guān)注

關(guān)注
9

文章
1144

瀏覽量
40848
編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3656

瀏覽量
134969
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5511

瀏覽量
121372

英偉達(dá)推出Jetson Orin Nano模組最高40TOPS性能，為機(jī)器人和邊緣AI提供強(qiáng)動(dòng)力

。具體參數(shù)方面，Jetson Orin具有NVIDIA Ampere架構(gòu)GPU、基于Arm Cortex-A78架構(gòu)的CPU、高達(dá)8GB的內(nèi)存、新一代深度

發(fā)表于 09-21 09:44 ?7849次閱讀

NVIDIA Jetson的相關(guān)資料分享

。Jetson是以機(jī)器學(xué)習(xí)應(yīng)用為目的而設(shè)計(jì)的，具有GPU的并行處理用的嵌入式計(jì)算板，用于高速執(zhí)行圖像識別、機(jī)器學(xué)習(xí)和自動(dòng)駕駛等。爆炸式增長的AI模型的復(fù)雜性近年來，由于傳感器技術(shù)的革新

發(fā)表于 11-09 08:26

NVIDIA Jetson介紹

首發(fā)極術(shù)社區(qū)如對Arm相關(guān)技術(shù)感興趣，歡迎私信 aijishu20加入技術(shù)微信群。分享內(nèi)容NVIDIA Jetson是嵌入式計(jì)算平臺，具有低功耗、高性能和小體積等特點(diǎn)，可加速各行業(yè)的AI應(yīng)用落地

發(fā)表于 12-14 08:05

NVIDIA Jetson AGX Orin提升邊緣AI標(biāo)桿

最新發(fā)布的 NVIDIA Jetson AGX Orin 提升邊緣 AI 標(biāo)桿，使我們在最新一輪行業(yè)推理基準(zhǔn)測試中的領(lǐng)先優(yōu)勢更加明顯。

發(fā)表于 04-09 08:24 ?1434次閱讀

NVIDIA推出全新Jetson Orin Nano系統(tǒng)級模組

NVIDIA 推出全新Jetson Orin Nano 系統(tǒng)級模組，擴(kuò)充了NVIDIA Jetson產(chǎn)品陣容。全新

發(fā)表于 09-22 09:54 ?1276次閱讀

NVIDIA Nova Orin平臺助力AMR的構(gòu)建和部署

基于兩個(gè) Orin 模組。Jetson AGX Orin 通過 GPU 加速框架運(yùn)行 NVIDIA Isaac 機(jī)器人堆棧和機(jī)器人操作系統(tǒng)

發(fā)表于 09-26 09:45 ?1301次閱讀

將Jetson AGX Orin開發(fā)者套件轉(zhuǎn)化為任何Jetson Orin模塊

隨著 Jetson Orin Nano 在本次 GTC 大會(huì)的發(fā)布，整個(gè) Jetson Orin 模塊陣容現(xiàn)已揭曉。憑借高達(dá) 40 TOPS 的 AI 性能，

發(fā)表于 09-30 11:03 ?2114次閱讀

使用NVIDIA Jetson Orin Nano解決入門級邊緣人工智能挑戰(zhàn)

2022 年 GTC ， NVIDIA 宣布 Jetson Orin Nano 系列系統(tǒng)模塊（ SoM ）。它們的 AI 性能是 NVIDIA Je

發(fā)表于 10-11 14:47 ?2573次閱讀

NVIDIA Jetson Orin Nano的性能基準(zhǔn)

在本次 GTC 大會(huì)上，NVIDIA 發(fā)布了Jetson Orin Nano系列的系統(tǒng)級模組（SoM）。其 AI 性能是 NVIDIA Jetson

發(fā)表于 10-12 09:55 ?2984次閱讀

基于AdderNet的深度學(xué)習(xí)推理加速器

電子發(fā)燒友網(wǎng)站提供《基于AdderNet的深度學(xué)習(xí)推理加速器.zip》資料免費(fèi)下載

發(fā)表于 10-31 11:12 ?0次下載

GTC23 | 使用 NVIDIA Jetson Orin Nano 開發(fā)套件開發(fā) AI 機(jī)器人及智能視覺系統(tǒng)

NVIDIA Jetson Orin Nano Developer Kit? 為創(chuàng)建入門級 AI 機(jī)器人、智能無人機(jī)和智能視覺系統(tǒng)設(shè)定了一個(gè)新標(biāo)準(zhǔn)，同時(shí)簡化了?

發(fā)表于 03-29 03:40 ?1619次閱讀

NVIDIA 推出 Jetson AGX Orin 工業(yè)級模塊助力邊緣 AI

Jetson 邊緣 AI 和機(jī)器人平臺，您可以在此類復(fù)雜的環(huán)境中部署 AI 和傳感器融合算法。 NVIDIA 在 COMPUTEX 2023 上發(fā)布了全新 Jetson AGX

發(fā)表于 06-05 10:45 ?1249次閱讀

利用 NVIDIA Jetson 將 AI 學(xué)習(xí)延展至邊緣

.com/zh-cn/jetson/edu/ ）。自從 10 年前首次發(fā)布以來， NVIDIA Jetson 平臺已經(jīng)為全球嵌入式計(jì)算和邊緣 AI 設(shè)立了標(biāo)準(zhǔn)。這些用于深度

發(fā)表于 06-13 20:55 ?679次閱讀

使用 DLA 在 NVIDIA Jetson Orin 上最大限度地提高深度學(xué)習(xí)性能

：深度學(xué)習(xí)加速器（DLA）中用于深度學(xué)習(xí)工作負(fù)載的專用深度

發(fā)表于 08-22 19:20 ?1259次閱讀

Orin芯片在汽車行業(yè)的應(yīng)用

。 Orin芯片概述 Orin芯片是NVIDIA推出的一款系統(tǒng)級芯片（SoC），專為自動(dòng)駕駛汽車設(shè)計(jì)。它基于ARM架構(gòu)，集成了NVIDIA的GPU、

發(fā)表于 10-27 15:55 ?874次閱讀