0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson AGX Xavier應(yīng)用在AI和

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Dustin ? 2022-04-18 10:26 ? 次閱讀

面向 AI 開發(fā)人員的全球終極嵌入式解決方案JetsonAGXXavier現(xiàn)已作為 NVIDIA 的獨立生產(chǎn)模塊發(fā)貨。英偉達 AGX 系統(tǒng)的成員對于自主機器,Jetson AGX Xavier 非常適合將先進的 AI 和計算機視覺部署到邊緣,使現(xiàn)場機器人平臺具有工作站級性能,并能夠在不依賴人工干預(yù)和云連接的情況下完全自主運行。由 Jetson AGX Xavier 提供支持的智能機器可以自由地在其環(huán)境中進行交互和安全導(dǎo)航,不受復(fù)雜地形和動態(tài)障礙物的阻礙,完全自主地完成現(xiàn)實世界的任務(wù)。這包括需要高級實時感知和推理才能執(zhí)行的包裹遞送和工業(yè)檢查。作為世界上第一臺專為機器人和邊緣計算設(shè)計的計算機,Jetson AGX Xavier 的高性能可以處理視覺里程計、傳感器融合、定位和映射,障礙物檢測和對下一代機器人至關(guān)重要的路徑規(guī)劃算法。圖 1 顯示了現(xiàn)在全球可用的生產(chǎn)計算模塊。開發(fā)人員現(xiàn)在可以開始批量部署新的自主機器。

最新一代 NVIDIA 業(yè)界領(lǐng)先的Jetson AGX系列嵌入式 Linux 高性能計算機,Jetson AGX Xavier 提供 GPU 工作站級性能,具有無與倫比的 32 TeraOPS (TOPS) 峰值計算和 750Gbps 的高速 I/O,體積小巧100x87mm 外形尺寸。用戶可以根據(jù)應(yīng)用需要配置 10W、15W 和 30W 的工作模式。Jetson AGX Xavier 為可部署到邊緣的計算密度、能源效率和 AI 推理功能樹立了新的標桿,使具有端到端自主能力的下一級智能機器成為可能。

Jetson 使用深度學(xué)習(xí)和計算機視覺為世界上許多最先進的機器人和自主機器背后的 AI 提供動力,同時專注于性能、效率和可編程性。Jetson AGX Xavier,如圖 2 所示,由超過 90 億個晶體管組成,基于有史以來最復(fù)雜的片上系統(tǒng) (SoC)。該平臺包含一個集成的 512 核 NVIDIA Volta GPU,包括 64 個張量核心、8 核 NVIDIA Carmel ARMv8.2 64 位 CPU、16GB 256 位 LPDDR4x、雙 NVIDIA深度學(xué)習(xí)加速器(DLA) 引擎、NVIDIA Vision Accelerator 引擎、高清視頻編解碼器、128Gbps 的專用攝像頭攝取和 16 通道 PCIe Gen 4 擴展。256 位接口上的內(nèi)存帶寬為 137GB/s,而 DLA 引擎卸載了深度神經(jīng)網(wǎng)絡(luò) (DNN) 的推理。NVIDIA 用于 Jetson AGX Xavier 的 JetPack SDK 4.1.1 包括 CUDA 10.0、cuDNN 7.3 和 TensorRT 5.0,提供完整的 AI 軟件堆棧。

poYBAGJczEyAIdLjAAOMQVqB1b0776.png

圖 2. Jetson AGX Xavier 提供一組豐富的高速 I/O

這使開發(fā)人員能夠在機器人、智能視頻分析、醫(yī)療儀器、嵌入式物聯(lián)網(wǎng)邊緣設(shè)備等應(yīng)用中部署加速 AI。與其前身 Jetson TX1 和 TX2 一樣,Jetson AGX Xavier 使用系統(tǒng)級模塊 (SoM) 范例。所有處理都包含在計算模塊上,高速 I/O 位于通過高密度板對板連接器提供的分線載體或外殼上。以這種方式在模塊上封裝功能使開發(fā)人員可以輕松地將 Jetson Xavier 集成到他們自己的設(shè)計中。NVIDIA 發(fā)布了全面的文檔和參考設(shè)計文件,可供嵌入式設(shè)計人員下載,以使用 Jetson AGX Xavier 創(chuàng)建自己的設(shè)備和平臺。請務(wù)必咨詢JetsonAGXXavier 模塊數(shù)據(jù)表和JetsonAGXXavier OEM 產(chǎn)品設(shè)計指南,了解表 1 中列出的全部產(chǎn)品功能,以及機電規(guī)格、模塊引腳排列、電源排序和信號路由指南。

poYBAGJczNOAZfpmAAC3OMUs6vY543.png

Jetson AGX Xavier 包括超過 750Gbps 的高速 I/O,為流式傳感器和高速外圍設(shè)備提供了非凡的帶寬。它是首批支持 PCIe Gen 4 的嵌入式設(shè)備之一,在五個 PCIe Gen 4 控制器上提供 16 個通道,其中三個可以在根端口或端點模式下運行。16 個 MIPI CSI-2 通道可連接到四個 4 通道攝像頭、六個 2 通道攝像頭、六個 1 通道攝像頭或這些配置的組合,最多六個攝像頭,36 個虛擬通道允許同時連接更多攝像頭使用流聚合。其他高速 I/O 包括三個 USB 3.1 端口、SLVS-EC、UFS 和用于千兆以太網(wǎng)的 RGMII。開發(fā)者現(xiàn)在可以訪問 NVIDIA 的JetPack 4.1.1 開發(fā)者預(yù)覽版Jetson AGX Xavier 的軟件,列于表 2。開發(fā)者預(yù)覽版包括 Linux For Tegra (L4T) R31.1 板級支持包 (BSP),支持 Linux 內(nèi)核 4.9 和目標上的 Ubuntu 18.04。在主機 PC 端,JetPack 4.1.1 支持 Ubuntu 16.04 和 Ubuntu 18.04。

poYBAGJczNyAE7GMAAAq_GUV5u0939.png

JetPack 4.1.1 開發(fā)人員預(yù)覽版允許開發(fā)人員立即開始使用 Jetson AGX Xavier 對產(chǎn)品和應(yīng)用程序進行原型設(shè)計,為生產(chǎn)部署做準備。NVIDIA 將繼續(xù)通過額外的功能增強和性能優(yōu)化來改進 JetPack。請閱讀發(fā)行說明以了解此版本的亮點和軟件狀態(tài)。

伏特顯卡

Jetson AGX Xavier 集成 Volta GPU,如圖 3 所示,提供 512 個 CUDA 內(nèi)核和 64 個 Tensor 內(nèi)核,可實現(xiàn)高達 11 TFLOPS FP16 或 22 TOPS 的 INT8 計算,最大時鐘頻率為 1.37GHz。它支持計算能力為 sm_72 的 CUDA 10。GPU 包括 8 個 Volta 流式多處理器 (SM),每個 Volta SM 有 64 個 CUDA 核心和 8 個張量核心。每個 Volta SM 都包含一個 128KB L1 緩存,比前幾代產(chǎn)品大 8 倍。SM 共享一個 512KB L2 緩存,提供比前幾代快 4 倍的訪問速度。

Volta_GPU-625x414.png

圖 3. Jetson AGX Xavier Volta GPU 框圖

每個 SM 由 4 個獨立的處理塊組成,稱為 SMP(流式多處理器分區(qū)),每個處理塊都包括自己的 L0 指令緩存、warp 調(diào)度程序、調(diào)度單元和寄存器文件,以及 CUDA 核心和張量核心。每個 SM 的 SMP 數(shù)量是 Pascal 的兩倍,Volta SM 具有改進的并發(fā)性,并支持更多的線程、warp 和運行中的線程塊。

張量核心

NVIDIA 張量核心是可編程的融合矩陣乘法和累加單元,可與 CUDA 核心同時執(zhí)行。張量核心實現(xiàn)了新的浮點 HMMA(半精度矩陣乘法和累加)和 IMMA(整數(shù)矩陣乘法和累加)指令,用于加速密集線性代數(shù)計算、信號處理和深度學(xué)習(xí)推理。

Tensor-Core-Matrix-1-1024x276.png

圖 4. Tensor Core HMMA/IMMA 4x4x4 矩陣乘法和累加

矩陣乘法輸入A和B是 HMMA 指令的 FP16 矩陣,而累加矩陣C和D可以是 FP16 或 FP32 矩陣。對于 IMMA,矩陣乘法輸入A是有符號或無符號 INT8 或 INT16 矩陣,B是有符號或無符號 INT8 矩陣,C和D累加器矩陣都是有符號 INT32。因此,精度和計算范圍足以避免內(nèi)部累加期間的上溢和下溢情況。

包括 cuBLAS、cuDNN 和 TensorRT 在內(nèi)的 NVIDIA 庫已更新為在內(nèi)部使用 HMMA 和 IMMA,使程序員能夠輕松利用 Tensor Core 固有的性能提升。用戶還可以通過 CUDA 10 中包含的 wmma 命名空間和 mma.h 標頭中公開的新 API 直接在 warp 級別訪問 Tensor Core 操作。warp 級接口映射 16×16、32×8 和 8×32 大小每個扭曲的所有 32 個線程的矩陣。

深度學(xué)習(xí)加速器

Jetson AGX Xavier 具有兩個 NVIDIA深度學(xué)習(xí)加速器(DLA) 引擎,如圖 5 所示,可卸載固定功能卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的推理。這些引擎提高了能源效率并釋放了 GPU 來運行用戶實現(xiàn)的更復(fù)雜的網(wǎng)絡(luò)和動態(tài)任務(wù)。NVIDIA DLA 硬件架構(gòu)是開源的,可從NVDLA.org 獲得。每個 DLA 具有高達 5 TOPS INT8 或 2.5 TFLOPS FP16 的性能,功耗僅為 0.5-1.5W。DLA 支持加速 CNN 層,例如卷積、反卷積、激活函數(shù)、最小/最大/均值池、局部響應(yīng)歸一化和全連接層。

poYBAGJczGOAJ_7UAACk6ipVyT4846.png

圖 5. 深度學(xué)習(xí)加速器 (DLA) 架構(gòu)框圖

DLA 硬件由以下組件組成:

Convolution Core – 優(yōu)化的高性能卷積引擎。

單數(shù)據(jù)處理器——用于激活功能的單點查找引擎。

平面數(shù)據(jù)處理器——用于池化的平面平均引擎。

通道數(shù)據(jù)處理器——用于高級標準化功能的多通道平均引擎。

專用內(nèi)存和數(shù)據(jù)重塑引擎——用于張量重塑和復(fù)制操作的內(nèi)存到內(nèi)存轉(zhuǎn)換加速。

開發(fā)人員使用 TensorRT 5.0 對 DLA 引擎進行編程,以在網(wǎng)絡(luò)上執(zhí)行推理,包括對 AlexNet、GoogleNet 和 ResNet-50 的支持。對于使用 DLA 不支持的層配置的網(wǎng)絡(luò),TensorRT 為無法在 DLA 上運行的層提供 GPU 回退。JetPack 4.0 開發(fā)者預(yù)覽版最初將 DLA 精度限制為 FP16 模式,未來 JetPack 版本中將提供 INT8 精度和更高的 DLA 性能。

TensorRT 5.0 將以下 API 添加到其 IBuilder 接口以啟用 DLA:

setDeviceType()以及setDefaultDeviceType()默認選擇 GPU、DLA_0 或 DLA_1 來執(zhí)行特定層或網(wǎng)絡(luò)中的所有層。

canRunOnDLA()檢查層是否可以按照配置在 DLA 上運行。

getMaxDLABatchSize()用于檢索 DLA 可以支持的最大批量大小。

allowGPUFallback()使 GPU 能夠執(zhí)行 DLA 不支持的層。

請參閱TensorRT 5.0 開發(fā)人員指南的第 6 章,了解支持的層配置的完整列表以及在 TensorRT 中使用 DLA 的代碼示例。

深度學(xué)習(xí)推理基準

我們已經(jīng)發(fā)布了 Jetson AGX Xavier 在常見 DNN(例如 ResNet、GoogleNet 和 VGG 的變體)上的深度學(xué)習(xí)推理基準測試結(jié)果。我們在 Jetson AGX Xavier 的 GPU 和 DLA 引擎上使用帶有 TensorRT 5.0 的 JetPack 4.1.1 開發(fā)者預(yù)覽版為 Jetson AGX Xavier 運行這些基準測試。GPU 和兩個 DLA 分別以 INT8 和 FP16 精度同時運行相同的網(wǎng)絡(luò)架構(gòu),并報告每種配置的總體性能。GPU 和 DLA 可以在實際用例中同時運行不同的網(wǎng)絡(luò)或網(wǎng)絡(luò)模型,并行或在處理管道中提供獨特的功能。在 TensorRT 中使用 INT8 與完整的 FP32 精度會導(dǎo)致精度損失 1% 或更少。

首先,讓我們考慮 ResNet-18 FCN (Fully Convolutional Network) 的結(jié)果,這是一個用于語義分割的 2048×1024 分辨率的全高清模型。分割為自由空間檢測和占用映射等任務(wù)提供每像素分類,并代表由自主機器計算的用于感知、路徑規(guī)劃和導(dǎo)航的深度學(xué)習(xí)工作負載。圖 6 顯示了在 Jetson AGX Xavier 與 Jetson TX2 上運行 ResNet-18 FCN 的測量吞吐量。

pYYBAGJczGWAXst7AABt6EedXBs772.png

圖 6. Jetson AGX Xavier 和 Jetson TX2 的 ResNet-18 FCN 推理吞吐量

與 Jetson TX2 相比,Jetson AGX Xavier 目前在 ResNet-18 FCN 推理中的性能高達 13 倍。NVIDIA 將繼續(xù)在 JetPack 中發(fā)布軟件優(yōu)化和功能增強,隨著時間的推移將進一步提高性能和功率特性。請注意,基準結(jié)果的完整列表報告了 Jetson AGX Xavier 的 ResNet-18 FCN 的性能,批次大小為 32,但是在圖 7 中,我們僅繪制了 16 的批次大小,因為 Jetson TX2 能夠運行 ResNet -18 FCN,最大批量為 16。

pYYBAGJczG6AIiAeAAB31N90LDU064.png

圖 7. ResNet-18 FCN 推理 Jetson AGX Xavier 和 Jetson TX2 的能效

在考慮使用每秒每瓦特處理圖像的能效時,Jetson AGX Xavier 目前在 ResNet-18 FCN 上的能效比 Jetson TX2 高 6 倍。我們通過使用板載 INA 電壓和電流監(jiān)視器測量總模塊功耗來計算效率,包括 CPU、GPU、DLA、內(nèi)存、其他 SoC 電源、I/O 和所有軌上的穩(wěn)壓器效率損失。兩臺 Jetson 均在 15W 功率模式下運行。Jetson AGX Xavier 和 JetPack 附帶 10W、15W 和 30W 的可配置預(yù)設(shè)功率配置文件,可在運行時使用 nvpmodel 電源管理工具進行切換。用戶還可以使用不同的時鐘和 DVFS(動態(tài)電壓和頻率縮放)調(diào)節(jié)器設(shè)置來定義自己的自定義配置文件,這些配置文件已經(jīng)過定制,以實現(xiàn)單個應(yīng)用程序的最佳性能。

接下來,讓我們比較 Jetson AGX Xavier 基準在圖像識別網(wǎng)絡(luò) ResNet-50 和 VGG19 上的批量大小 1 到 128 與 Jetson TX2。這些模型對分辨率為 224×224 的圖像塊進行分類,并經(jīng)常用作各種對象檢測網(wǎng)絡(luò)中的編碼器主干。在較低分辨率下使用 8 或更高的批大小可用于近似在更高分辨率下批大小為 1 的性能和延遲。機器人平臺和自主機器通常包含多個相機和傳感器,這些相機和傳感器可以進行批處理以提高性能,此外還可以執(zhí)行感興趣區(qū)域 (ROI) 的檢測,然后分批對 ROI 進行進一步分類。圖 8 還包括對 Jetson AGX Xavier 未來性能的估計,

poYBAGJczHCAWVpoAACLxCLzCMY324.png

圖 8. INT8 支持 DLA 和其他 GPU 優(yōu)化后的估計性能

Jetson AGX Xavier 目前在 VGG19 上的吞吐量是 Jetson TX2 的 18 倍,在 ResNet-50 上的吞吐量是在 JetPack 4.1.1 上測量的 14 倍,如圖 9 所示。ResNet-50 的延遲低至 1.5 毫秒或更高650FPS,批量大小為 1。隨著未來的軟件改進,Jetson AGX Xavier 估計比 Jetson TX2 快 24 倍。請注意,對于舊版比較,我們還在完整的性能列表中提供了 GoogleNet 和 AlexNet 的數(shù)據(jù)。

pYYBAGJczHOAZ5s4AACDi5Pgu8A488.png

圖 9. Jetson Xavier 和 Jetson TX2 的 ResNet-50 和 VGG19 能效

Jetson AGX Xavier 目前在 VGG19 推理方面的效率是 Jetson TX2 的 7 倍以上,在 ResNet-50 方面的效率提高了 5 倍,在考慮未來的軟件優(yōu)化和增強時效率提高了 10 倍。有關(guān)推理基準的更多數(shù)據(jù)和詳細信息,請參閱完整的性能結(jié)果。我們還將在下一節(jié)中對 CPU 性能進行基準測試。

卡梅爾 CPU 復(fù)合體

Jetson AGX Xavier 的 CPU 復(fù)合體如圖 10 所示,由四個基于 ARMv8.2 的異構(gòu)雙核 NVIDIA Carmel CPU 集群組成,最大時鐘頻率為 2.26GHz。每個內(nèi)核包括 128KB 指令和 64KB 數(shù)據(jù) L1 緩存以及兩個內(nèi)核之間共享的 2MB L2 緩存。CPU 集群共享一個 4MB L3 緩存。

pYYBAGJczHaABCAzAACYuXpdFeM880.png

圖 10. 帶有 NVIDIA Carmel 集群的 Jetson Xavier CPU 復(fù)合體的框圖

Carmel CPU 內(nèi)核具有 NVIDIA 的動態(tài)代碼優(yōu)化、10 路超標量架構(gòu)以及 ARMv8.2 的完整實現(xiàn),包括完整的高級 SIMD、VFP(矢量浮點)和 ARMv8.2-FP16。

SPECint_rate 基準測量多核系統(tǒng)的 CPU 吞吐量??傮w性能得分平均了幾個密集的子測試,包括壓縮、向量和圖形操作、代碼編譯以及為國際象棋和圍棋等游戲執(zhí)行 AI。圖 11 顯示了幾代 CPU 性能提升超過 2.5 倍的基準測試結(jié)果。

poYBAGJczHeAfdRfAAAcmuA86xw627.png

圖 11. SPECInt2K_rate 8x* 基準測試中 Jetson AGX Xavier 與 Jetson TX2 的 CPU 性能 *Jetson AGX Xavier / Jetson TX2 SPECint 基準測試尚未正式提交給 SPEC,在發(fā)布時被視為估計值。

同時運行了 8 個 SPECint_rate 測試副本,保持 CPU 滿載。Jetson AGX Xavier 自然擁有八個 CPU 核心;Jetson TX2 的架構(gòu)使用四個 Arm Cortex-A57 內(nèi)核和兩個 NVIDIA Denver D15 內(nèi)核。每個 Denver 核心運行兩個副本會產(chǎn)生更高的性能。

視覺加速器

Jetson AGX Xavier 具有兩個視覺加速器引擎,如圖 12 所示。每個引擎都包括一個雙 7 路 VLIW(超長指令字)矢量處理器,用于卸載計算機視覺算法,例如特征檢測和匹配、光流、立體視差塊匹配、以及低延遲和低功耗的點云處理。卷積、形態(tài)算子、直方圖、色彩空間轉(zhuǎn)換和扭曲等成像過濾器也是加速的理想選擇。

poYBAGJczHqABy36AACIu3wCwP0299.png

圖 12. Jetson AGX Xavier VLIW 視覺加速器架構(gòu)框圖

每個視覺加速器包括一個用于命令和控制的 Cortex-R5 內(nèi)核、兩個矢量處理單元(每個都有 192KB 的片上矢量存儲器)和兩個用于數(shù)據(jù)移動的 DMA 單元。7 路向量處理單元包含用于每條指令的兩個向量、兩個標量和三個內(nèi)存操作的插槽。Early Access 軟件版本不支持 Vision Accelerator,但將在 JetPack 的未來版本中啟用。

NVIDIA Jetson AGX Xavier 開發(fā)者套件

JetsonAGXXavier 開發(fā)套件包含開發(fā)人員快速啟動和運行所需的一切該套件包括JetsonAGX Xavier 計算模塊、參考開源載板、電源和 JetPack SDK,使用戶能夠快速開始開發(fā)應(yīng)用程序。Jetson AGX Xavier 開發(fā)者套件只需 1,299 美元即可購買。

Jetson AGX Xavier 開發(fā)工具包的尺寸為 105mm2,明顯小于 Jetson TX1 和 TX2 開發(fā)工具包,同時改進了可用的 I/O。I/O 功能包括兩個 USB3.1 端口(支持 DisplayPort 和 Power Delivery)、一個混合 eSATAp + USB3.0 端口、一個 PCIe x16 插槽(x8 電氣)、M.2 Key-M NVMe 和 M.2 Key 站點-E WLAN 夾層、千兆以太網(wǎng)、HDMI 2.0 和 8 攝像頭 MIPI CSI 連接器。有關(guān)通過開發(fā)工具包參考載板提供的 I/O 的完整列表,請參見下面的表 3。

pYYBAGJczO-ARFk8AABF1qXkA6Y809.png

我們?yōu)?Jetson AGX Xavier 整理了一個開源的為期兩天的深度學(xué)習(xí)演示教程,該教程指導(dǎo)開發(fā)人員通過訓(xùn)練和部署 DNN 推理來執(zhí)行圖像識別、對象檢測和分割,使您能夠快速開始創(chuàng)建自己的 AI應(yīng)用程序。兩天演示使用云端的 NVIDIA DIGITS 交互式訓(xùn)練系統(tǒng)或 GPU 加速的 PC,并使用 TensorRT 對 Jetson 上的圖像或?qū)崟r攝像頭饋送執(zhí)行加速推理。GitHub 上的為期兩天的演示代碼存儲庫已更新,包括對 Xavier DLA 和 GPU INT8 精度的支持。

智能視頻分析 (IVA)

人工智能和深度學(xué)習(xí)能夠有效利用大量數(shù)據(jù),讓城市更安全、更方便,包括交通管理、智能停車和零售店的簡化結(jié)賬體驗等應(yīng)用。NVIDIA Jetson 和 NVIDIADeepStream SDK使分布式智能攝像頭能夠在邊緣實時執(zhí)行智能視頻分析,從而減少傳輸基礎(chǔ)設(shè)施上的大量帶寬負載,并提高安全性和匿名性。

在 Jetson AGX Xavier 上運行的 IVA 演示視頻捕獲,具有 30 個并發(fā)高清流

Jetson TX2 可以同時處理兩個高清流以及對象檢測和跟蹤。如上面的視頻所示,Jetson AGX Xavier 能夠以 1080p30 同時處理 30 個獨立的高清視頻流——提高了 15 倍。Jetson AGX Xavier 提供超過 1850MP/s 的總吞吐量,使其能夠解碼、預(yù)處理、使用基于 ResNet 的檢測執(zhí)行推理,并在超過 1 毫秒的時間內(nèi)可視化每一幀。Jetson AGX Xavier 的功能大大提高了邊緣視頻分析的性能和可擴展性。

自治的新時代

Jetson AGX Xavier 提供前所未有的機載機器人和智能機器性能水平。這些系統(tǒng)需要對人工智能驅(qū)動的感知、導(dǎo)航和操作具有苛刻的計算能力,以提供強大的自主操作。應(yīng)用包括制造、工業(yè)檢測、精準農(nóng)業(yè)和家庭服務(wù)。向最終消費者遞送包裹并支持倉庫、商店和工廠物流的自主遞送機器人代表了一類應(yīng)用。

全自動交付和物流的典型處理流程需要多個階段的視覺和感知任務(wù),如圖 14 所示。移動交付機器人通常具有多個外圍高清攝像頭,除了激光雷達和其他測距傳感器之外,還提供 360° 態(tài)勢感知。與慣性傳感器一起融合在軟件中。經(jīng)常使用前向立體驅(qū)動攝像頭,需要預(yù)處理和立體深度映射。NVIDIA 創(chuàng)建了Stereo DNN模型,其準確性高于傳統(tǒng)的塊匹配方法來支持這一點。

delivery_pipeline-625x283.png

圖 14. 自主配送和物流機器人的 AI 處理流程示例

SSD 或 Faster-RCNN 等對象檢測模型和基于特征的跟蹤通常會告知行人、車輛和地標的避障。對于倉庫和店面機器人,這些對象檢測模型可以定位感興趣的物品,例如產(chǎn)品、貨架和條形碼。面部識別、姿勢估計和自動語音識別 (ASR) 促進了人機交互 (HMI),使機器人能夠與人類進行有效協(xié)調(diào)和交流。

高幀率同步定位和映射 (SLAM) 對于保持機器人在 3D 中準確定位至關(guān)重要。GPS 本身缺乏亞米級定位的精度,并且在室內(nèi)無法使用。SLAM 將最新的傳感器數(shù)據(jù)與系統(tǒng)在其點云中積累的先前數(shù)據(jù)進行配準和對齊。經(jīng)常有噪聲的傳感器數(shù)據(jù)需要大量過濾才能正確定位,尤其是來自移動平臺的數(shù)據(jù)。

路徑規(guī)劃階段通常使用 ResNet-18 FCN、SegNet 或 DeepLab 等語義分割網(wǎng)絡(luò)來執(zhí)行自由空間檢測,告訴機器人在哪里行駛而不被遮擋。現(xiàn)實世界中經(jīng)常存在太多需要單獨檢測和跟蹤的通用障礙物類型,因此基于分割的方法用其分類標記每個像素或體素。與管道的前幾個階段一起,這會通知規(guī)劃者和控制回路它可以采取的安全路線。

Jetson AGX Xavier 的性能和效率使得這些機器人能夠?qū)崟r處理所有需要的組件,以實現(xiàn)完全自主的安全運行,包括用于實時感知、導(dǎo)航和操作的高性能視覺算法。隨著獨立的 Jetson AGX Xavier 模塊現(xiàn)已投入生產(chǎn),開發(fā)人員可以將這些 AI 解決方案部署到下一代自主機器。

立即開始構(gòu)建下一波自主機器

Jetson AGX Xavier 為機器人和邊緣設(shè)備帶來了改變游戲規(guī)則的計算水平,為針對尺寸、重量和功率進行了優(yōu)化的嵌入式平臺帶來了高端工作站性能。

關(guān)于作者

Dustin 是 NVIDIA Jetson 團隊的一名開發(fā)人員推廣員。Dustin 擁有機器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開展項目。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28582

    瀏覽量

    207814
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103444
收藏 人收藏

    評論

    相關(guān)推薦

    交通運輸領(lǐng)先企業(yè)率先采用NVIDIA Cosmos平臺

    支撐自動駕駛汽車開發(fā)有三個關(guān)鍵計算平臺:NVIDIA DGX 平臺用于在數(shù)據(jù)中心訓(xùn)練基于 AI 的堆棧;運行在NVIDIA OVX 平臺上的NVIDIA Omniverse 平臺,用于
    的頭像 發(fā)表于 01-09 16:02 ?140次閱讀

    NVIDIA發(fā)布小巧高性價比的Jetson Orin Nano Super開發(fā)者套件

    NVIDIA近期推出了一款全新的生成式AI超級計算機——Jetson Orin Nano Super開發(fā)者套件。這款開發(fā)者套件以其小巧的尺寸和高性價比吸引了廣泛關(guān)注。 Jetson O
    的頭像 發(fā)表于 12-19 11:28 ?500次閱讀

    NVIDIA 推出高性價比的生成式 AI 超級計算機

    Jetson Orin Nano Super 可將生成式 AI 性能提升至1.7 倍,支持科技愛好者、開發(fā)者和學(xué)生使用的主流模型。 ? ? NVIDIA 推出了一款全新的尺寸小巧的生成式 AI
    發(fā)表于 12-18 17:01 ?454次閱讀
    <b class='flag-5'>NVIDIA</b> 推出高性價比的生成式 <b class='flag-5'>AI</b> 超級計算機

    u-blox深化與NVIDIA JetsonNVIDIA DRIVE Hyperion平臺合作

    近日,作為提供定位和無線通信技術(shù)及服務(wù)的全球領(lǐng)先供應(yīng)商u-blox(SIX:UBXN)宣布,作為在工業(yè)和汽車市場高精度定位領(lǐng)域的戰(zhàn)略增長計劃的關(guān)鍵一環(huán),u-blox公司現(xiàn)已加強對NVIDIA JetsonNVIDIA DRIV
    的頭像 發(fā)表于 12-09 14:08 ?269次閱讀

    使用NVIDIA AI平臺確保醫(yī)療數(shù)據(jù)安全

    三井物產(chǎn)株式會社子公司借助 NVIDIA AI 平臺實現(xiàn)數(shù)據(jù)集的安全共享并使用在這些數(shù)據(jù)集上建立的強大模型加速藥物研發(fā)。
    的頭像 發(fā)表于 11-20 09:37 ?210次閱讀

    初創(chuàng)公司借助NVIDIA Metropolis和Jetson提高生產(chǎn)線效率

    初創(chuàng)公司使用 NVIDIA Metropolis 視覺 AIJetson 邊緣 AI 平臺提高生產(chǎn)線效率。
    的頭像 發(fā)表于 11-19 14:39 ?228次閱讀

    使用NVIDIA Jetson打造機器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學(xué)習(xí)和 NVIDIA Jetson邊緣 AI 和機器人平臺,為視障人士打造了機器人導(dǎo)盲犬。
    的頭像 發(fā)表于 11-09 13:51 ?292次閱讀

    使用機器學(xué)習(xí)和NVIDIA Jetson邊緣AI和機器人平臺打造機器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學(xué)習(xí)和 NVIDIA Jetson 邊緣 AI 和機器人平臺,為視障人士打造了機器人導(dǎo)盲犬。 該項目名為 IC4U
    的頭像 發(fā)表于 11-08 10:05 ?431次閱讀

    GPU計算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號

    GPU計算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號
    的頭像 發(fā)表于 10-23 10:09 ?296次閱讀
    GPU計算主板學(xué)習(xí)資料第735篇:基于3U VPX的<b class='flag-5'>AGX</b> <b class='flag-5'>Xavier</b> GPU計算主板 信號計算主板 視頻處理 相機信號

    差動放大器通常是應(yīng)用在什么場合?

    請問下差動放大器通常是應(yīng)用在什么場合?
    發(fā)表于 09-19 06:35

    fx3系列的硬件主要由什么組成

    FX3系列是索尼(Sony)推出的一款高性能計算平臺,它基于NVIDIAJetson AGX Xavier模塊,專為需要高性能計算、機器學(xué)習(xí)、計算機視覺和實時數(shù)據(jù)處理的嵌入式系統(tǒng)設(shè)計
    的頭像 發(fā)表于 09-18 11:14 ?578次閱讀

    NVIDIA JetPack 6.0版本的關(guān)鍵功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構(gòu)建端到端加速 AI 應(yīng)用提供全面的解決方案。JetPack 6 通過微服務(wù)和一系列新功能,擴展了
    的頭像 發(fā)表于 09-09 10:18 ?480次閱讀
    <b class='flag-5'>NVIDIA</b> JetPack 6.0版本的關(guān)鍵功能

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    同發(fā)布“NVIDIA AI Computing by HPE”。 作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA
    的頭像 發(fā)表于 06-21 14:39 ?402次閱讀

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理器管理Wi-Fi如何解決?

    我們使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,請參閱 Nvidia Jetson 與英飛凌 AIROC Wi-Fi 6
    發(fā)表于 05-23 06:47

    NVIDIA Jetson為嵌入式計算領(lǐng)域探索AI可能

    自動化業(yè)務(wù)流程、通過數(shù)據(jù)分析獲得洞察力、與客戶和員工互動……如今 AI 正在大幅提高生產(chǎn)力,推動競爭優(yōu)勢。NVIDIA Jetson 是適用于自主機器和其他嵌入式應(yīng)用的先進平臺,具有出色的 A
    的頭像 發(fā)表于 01-25 17:03 ?568次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>為嵌入式計算領(lǐng)域探索<b class='flag-5'>AI</b>可能