0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson TK1輕松集成傳感器和支持高帶寬流媒體

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Dustin ? 2022-04-18 14:44 ? 次閱讀

NVIDIA 的 Tegra K1 (TK1) 是首款集成 CUDA 的 Arm 片上系統(tǒng) (SoC)。TK1 擁有 192 個 Kepler GPU 內(nèi)核和 4 個 Arm Cortex-A15 內(nèi)核,提供總計 327 GFLOPS 的計算性能,能夠使用 CUDA 處理大量數(shù)據(jù),同時通常消耗不到 6W 的功率(包括 SoC 和 DRAM)。這為低于 10W 域中的低 SWaP(尺寸、重量和功率)和小型 (SFF) 應(yīng)用程序帶來了改變游戲規(guī)則的性能,同時支持開發(fā)人員友好的 Ubuntu Linux 軟件環(huán)境,提供更像這樣的體驗臺式機而不是嵌入式 SoC。

Tegra K1 即插即用,可通過內(nèi)置 USB 3.0 和 PCIe gen2 x4/x1 端口傳輸高帶寬外圍設(shè)備、傳感器網(wǎng)絡(luò)接口。TK1 適用于傳感器處理,并提供與 CUDA 異步的附加硬件加速功能,例如 H.264 編碼和解碼引擎以及雙 MIPI CSI-2 攝像頭接口和圖像服務(wù)處理器 (ISP)。TK1 有許多令人興奮的嵌入式應(yīng)用程序,它們利用其作為媒體處理器和低功耗平臺的自然能力來快速集成設(shè)備和傳感器。

由于 GPU 加速特別適合成像、信號處理、自治和機器學(xué)習(xí)等數(shù)據(jù)并行任務(wù),Tegra K1 將這些功能擴展到 10W 以下的領(lǐng)域。現(xiàn)在,從 NVIDIA 的高端Tesla HPC 加速器以及GeForce和Quadro獨立 GPU 一直到低功耗 TK1,代碼可移植性得以保持??捎糜?TK1的 CUDA 6工具包的完整版本,包括示例、數(shù)學(xué)庫,例如cuFFT、cuBLAS和NPP,以及 NVIDIA 的 NVCC 編譯器。開發(fā)人員可以在 TK1 上本地編譯 CUDA 代碼,也可以從 Linux 開發(fā)機器進行交叉編譯。CUDA 庫和開發(fā)工具的可用性確保了在離散 GPU 和 Tegra 上部署 CUDA 應(yīng)用程序之間的無縫且輕松的可擴展性。還有可用的OpenCV4Tegra以及 NVIDIA 的VisionWorks 工具包.此外,Ubuntu 14.04 存儲庫包含豐富的用于 Arm 架構(gòu)的預(yù)構(gòu)建包,可最大限度地減少跟蹤和構(gòu)建依賴項所花費的時間。在許多情況下,只要源代碼可用并且沒有顯式調(diào)用 x86 特定指令(如 SSE、AVX 或 x86-ASM),只需稍加修改即可為 Arm 重新編譯應(yīng)用程序。NEON 是 Arm 針對 Cortex-A 系列 CPUSIMD 擴展版本。

借助 NVIDIA 的Jetson TK1 devkit,每個人都可以使用 TK1。Jetson TK1 支持相同的桌面式用戶環(huán)境,被用作部署堅固、擴展溫度 SFF 模塊的嵌入式應(yīng)用程序的有效開發(fā)平臺。通過 PCIe x4 gen2,模塊可以與各種 I/O 夾層集成,為 Tegra 提供許多可能的接口。此外,還有用于流式聯(lián)網(wǎng)傳感器或互連多個 Tegra 的本機板載千兆以太網(wǎng)。讓我們考慮一個案例研究,該案例研究突出了 TK1 輕松集成傳感器和支持高帶寬流媒體的能力。

案例研究#1:機器人/無人駕駛車輛平臺

嵌入式應(yīng)用程序通常需要視頻處理、數(shù)字信號處理 (DSP)、命令和控制等元素。在這個帶有 Tegra K1 的示例架構(gòu)中,我們使用 CUDA 處理來自高清 GigEVision 千兆位相機的圖像,并同時在 180° 光探測和測距 (LIDAR) 掃描測距儀上執(zhí)行世界地圖繪制和障礙物探測操作。此外,我們還集成了 GPS 接收器、慣性測量單元 (IMU)、電機控制器和其他傳感器等設(shè)備,以演示如何使用 TK1 對移動平臺(如機器人或無人機)進行自主導(dǎo)航和運動控制。通過將 Tegra 的硬件加速 H.264 壓縮應(yīng)用于視頻和通過 WiFi、3G/4G、或衛(wèi)星下行鏈路到遠程地面站或其他聯(lián)網(wǎng)機器人。該架構(gòu)使用 TK1 作為系統(tǒng)的中央處理器和傳感器接口,為感知建模和無人駕駛提供了一個示例框架。

pYYBAGJdCOqAGkxFAAXJ3csTylI980.png

圖 2:使用 Tegra K1 實現(xiàn)的用于自主導(dǎo)航的傳感器處理管道。

我們使用的掃描激光雷達在 180 度范圍內(nèi)每 0.5° 產(chǎn)生一次距離樣本,這些樣本被分組為集群檢測到運動時使用均值偏移和跟蹤。CUDA 用于同時處理所有范圍樣本,并與從以前的地理參考 LIDAR 掃描構(gòu)建的八叉樹分區(qū) 3D 點云進行變化檢測,生成靜態(tài)和移動障礙物列表,實時刷新以進行碰撞檢測和避免。然后在 OpenGL 端渲染類似雷達的平面位置指示器 (PPI)。這個特殊的激光雷達通過 RS232 連接到 Jetson TK1 的串行端口;其他激光雷達也支持千兆以太網(wǎng)。我們使用開源 SICK Toolbox 庫連接到傳感器,該庫在 TK1 上編譯并開箱即用。輕松訪問 LIDAR 傳感器為 TK1 提供了亞毫米級精確讀數(shù),可利用 CUDA 進行實時 3D 環(huán)境映射和并行路徑規(guī)劃。

poYBAGJdCOyAQZCxAACRKc54KtE405.jpg

圖 3:LIDAR 驅(qū)動的 PPI 顯示器可視化平臺環(huán)境中的靜態(tài)和移動障礙物。

在成像方面,Tegra K1 擁有多個接口用于流式傳輸高清視頻,例如 CSI-2、USB 3.0 和千兆以太網(wǎng)。適用于 HD-SDI、CameraLink、LVDS 等其他媒體的圖像采集卡可以通過其 PCIe gen2 x4 端口與 TK1 集成。在本案例研究中,我們使用來自 GigEVision 兼容供應(yīng)商的多臺千兆以太網(wǎng)攝像機進行了測試,分辨率從 1920×1080 到 2448×2048 不等,發(fā)現(xiàn)每個千兆以太網(wǎng)端口都有一個單獨的 Arm CPU 內(nèi)核,足以處理網(wǎng)絡(luò)協(xié)議和數(shù)據(jù)包使用套接字 API。使用 cudaMallocManaged()統(tǒng)一內(nèi)存CUDA 6 的新功能,視頻流由 CPU 解包到與 GPU 共享的緩沖區(qū)中,需要零副本才能將視頻“放入 GPU 內(nèi)存”(在 TK1 的情況下,它在物理上都是相同的內(nèi)存)。

使用 OpenCV、NVIDIA NPP 和 VisionWorks 等免費提供的庫,用戶可以在旅途中運行無數(shù) CUDA 加速的視頻過濾器,包括光流、SLAM、立體視差、穩(wěn)健的特征提取和匹配、鑲嵌、和多個移動目標(biāo)指示器(MMTI)。

可訓(xùn)練的行人和車輛檢測器可以使用可用的方向梯度直方圖(HoG) 實現(xiàn)在 TK1 上實時運行。有許多現(xiàn)有的 CUDA 代碼可用,它們以前在離散 GPU 上運行,現(xiàn)在可以部署在 Tegra 上。

除了激光雷達設(shè)備和攝像頭,TK1 還支持 GPS 和 IMU 等導(dǎo)航傳感器,以提高自主性。這些通常以 USB 或串行設(shè)備的形式提供,并且可以輕松地與 TK1 集成。制作支持 GPS 的應(yīng)用程序的一種快速方法是使用 libgps/gpsd,它為各種 NMEA 兼容設(shè)備提供通用軟件接口和 GPS 數(shù)據(jù)報。同時集成了 IMU 傳感器,以提供高達 100Hz 或更高刷新率的加速度計、陀螺儀和磁力計讀數(shù)。TK1 使用高質(zhì)量卡爾曼濾波融合快速 IMU 和 GPS 數(shù)據(jù),以提供 3 空間中的實時插值平臺位置,然后使用這些插值從光流中進一步細化視覺里程計。雖然比遵守 NMEA 的 GPS 單元標(biāo)準(zhǔn)化程度低,IMU 設(shè)備通常附帶供應(yīng)商提供的 C/C++ 代碼,旨在與 libusb 鏈接,這是一個標(biāo)準(zhǔn)用戶空間驅(qū)動程序接口,用于在 Linux 上訪問 USB 設(shè)備。此類利用 libusb 的用戶空間驅(qū)動程序無需付出任何努力即可從 x86 遷移到 Arm,并使開發(fā)人員能夠快速將各種設(shè)備與 TK1 集成,例如用于驅(qū)動伺服器和執(zhí)行器的 MOSFET 或 PWM 電機控制器、用于監(jiān)控電池壽命的電壓和電流傳感器、氣體/大氣傳感器、 ADC / DAC 等等,具體取決于手頭的應(yīng)用。Tegra K1 還具有六個用于驅(qū)動離散信號的 GPIO 端口,可用于連接開關(guān)、按鈕、繼電器和 LED。此類利用 libusb 的用戶空間驅(qū)動程序無需付出任何努力即可從 x86 遷移到 Arm,并使開發(fā)人員能夠快速將各種設(shè)備與 TK1 集成,例如用于驅(qū)動伺服器和執(zhí)行器的 MOSFET 或 PWM 電機控制器、用于監(jiān)控電池壽命的電壓和電流傳感器、氣體/大氣傳感器、 ADC / DAC 等等,具體取決于手頭的應(yīng)用。Tegra K1 還具有六個用于驅(qū)動離散信號的 GPIO 端口,可用于連接開關(guān)、按鈕、繼電器和 LED。此類利用 libusb 的用戶空間驅(qū)動程序無需付出任何努力即可從 x86 遷移到 Arm,并使開發(fā)人員能夠快速將各種設(shè)備與 TK1 集成,例如用于驅(qū)動伺服器和執(zhí)行器的 MOSFET 或 PWM 電機控制器、用于監(jiān)控電池壽命的電壓和電流傳感器、氣體/大氣傳感器、 ADC / DAC 等等,具體取決于手頭的應(yīng)用。Tegra K1 還具有六個用于驅(qū)動離散信號的 GPIO 端口,可用于連接開關(guān)、按鈕、繼電器和 LED。

本案例研究說明了機器人、機器視覺、遙感等常見的感官和計算方面。TK1 提供了一個對開發(fā)人員友好的環(huán)境,它消除了集成的繁瑣工作,使嵌入式 CUDA 應(yīng)用程序的部署變得容易,同時提供了卓越的性能。

案例研究 #2:平鋪 Tegra

某些應(yīng)用程序可能需要多個 Tegras 協(xié)同工作才能滿足其要求。Tegra K1 SoC 集群可以平鋪并與 PCIe 或以太網(wǎng)互連。從實施這種平鋪架構(gòu)中獲得的尺寸、重量和功率優(yōu)勢是巨大的,并將 TK1 的適用性擴展到數(shù)據(jù)中心和高性能計算 (HPC)。每塊板上平鋪 4、6、8 或更多 K1 SoC 的密集分布式拓?fù)涫强赡艿?,并提供有利于嵌入式?yīng)用程序和 HPC 等的可擴展性??紤]這個基于現(xiàn)有嵌入式系統(tǒng)的示例,采用六個 Tegra K1:

poYBAGJdCO6AInP9AACFwSkjfIg001.png

圖 5:SWaP 優(yōu)化的平鋪架構(gòu),六個 Tegra K1 與非透明 PCIe 交換和 RDMA 互連。

六個 TK1 通過 PCIe gen2 x4 和一個具有非透明 (NT) 橋接和 DMA 卸載引擎的 32 通道 PCIe 交換機互連。這與輕量級用戶空間 RDMA 庫一起提供了 TK1 之間的低開銷處理器間通信。同時,傳感器接口由連接到每個 Tegra 的 PCIe gen2 x1 端口的千兆以太網(wǎng) NIC/PHY 提供。PCIe 交換機還提供了一個備用 PCIe x8 擴展,用于與用戶確定的 I/O 接口的高達 4GB/s 的板外連接。

pYYBAGJdCQqAew_UAAAi0_Z1NEI852.png

像這樣的平鋪解決方案能夠在消耗不到 50W 的同時實現(xiàn)近 2 TFLOPS 的計算性能,并且與使用更高功率分立元件的架構(gòu)相比,低功耗集群 SoC 的效率有了很大提高。功率的降低使我們能夠在板上放置和布線所有組件,從而實現(xiàn)無連接器的相互通信并提高信號完整性和堅固性。對于大數(shù)據(jù)分析、多通道視頻和信號處理以及機器學(xué)習(xí),具有 TK1 的分布式架構(gòu)為那些需要計算密度同時最小化 SWAP 的真正資源密集型應(yīng)用程序提供了顯著的性能提升。

不可能的高級

Tegra K1 突破性的計算性能由 NVIDIA 的低功耗優(yōu)化和集成 CUDA 的引入推動,引領(lǐng)新一代嵌入式設(shè)備和平臺利用 TK1 的 SWaP 密度來提供高級特性和功能。NVIDIA 和 GE 合作將由 TK1 驅(qū)動的堅固 SFF 模塊和系統(tǒng)帶入嵌入式領(lǐng)域。機器人、醫(yī)療和可穿戴設(shè)備、軟件無線電、安全、監(jiān)控等領(lǐng)域的應(yīng)用是使用 Tegra K1 進行加速的主要候選者。更重要的是,TK1 的易用性促進了可擴展、可移植的嵌入式系統(tǒng),縮短了開發(fā)周期,而現(xiàn)在在 Tegra 上運行的大量現(xiàn)有 CUDA 庫和軟件進一步促進了這一點。您今天將使用 TK1 構(gòu)建什么?

關(guān)于作者

Dustin 是 NVIDIA Jetson 團隊的一名開發(fā)人員推廣員。Dustin 擁有機器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開展項目。您可以在NVIDIA 開發(fā)者論壇或GitHub 上找到他。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5089

    文章

    19160

    瀏覽量

    306613
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28578

    瀏覽量

    207795
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103430
收藏 人收藏

    評論

    相關(guān)推薦

    u-blox深化與NVIDIA JetsonNVIDIA DRIVE Hyperion平臺合作

    近日,作為提供定位和無線通信技術(shù)及服務(wù)的全球領(lǐng)先供應(yīng)商u-blox(SIX:UBXN)宣布,作為在工業(yè)和汽車市場高精度定位領(lǐng)域的戰(zhàn)略增長計劃的關(guān)鍵一環(huán),u-blox公司現(xiàn)已加強對NVIDIA JetsonNVIDIA DRIV
    的頭像 發(fā)表于 12-09 14:08 ?267次閱讀

    集成式電流傳感器NSM211x:從工業(yè)到汽車,應(yīng)用廣泛,性能卓越

    納芯微宣布推出全新的車規(guī)級帶寬集成式電流傳感器NSM211x系列,該系列是完全集成隔離電流
    的頭像 發(fā)表于 11-12 09:40 ?375次閱讀
    <b class='flag-5'>集成</b>式電流<b class='flag-5'>傳感器</b>NSM211x:從工業(yè)到汽車,應(yīng)用廣泛,性能卓越

    使用NVIDIA Jetson打造機器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學(xué)習(xí)和 NVIDIA Jetson邊緣 AI 和機器人平臺,為視障人士打造了機器人導(dǎo)盲犬。
    的頭像 發(fā)表于 11-09 13:51 ?291次閱讀

    帶寬云服務(wù)有什么用處?這幾種用處要知道

    帶寬云服務(wù)的主要用途包括提供更快的網(wǎng)絡(luò)連接速度、支持并發(fā)訪問和大規(guī)模數(shù)據(jù)傳輸、提高應(yīng)用程序的性能和用戶體驗等。在當(dāng)今數(shù)字化時代,隨著大
    的頭像 發(fā)表于 08-30 11:17 ?171次閱讀

    ElfBoard技術(shù)貼|如何在ELF 1開發(fā)板上搭建流媒體服務(wù)

    流媒體服務(wù)是一種專門用于傳輸實時數(shù)據(jù)流的服務(wù)軟件,廣泛用于視頻直播、視頻會議、音頻播放等應(yīng)用場景。在嵌入式開發(fā)領(lǐng)域,將流媒體服務(wù)部署到
    的頭像 發(fā)表于 08-20 14:48 ?601次閱讀
    ElfBoard技術(shù)貼|如何在ELF <b class='flag-5'>1</b>開發(fā)板上搭建<b class='flag-5'>流媒體</b>服務(wù)<b class='flag-5'>器</b>

    NVIDIA Holoscan SDK中使用OpenCV構(gòu)建零拷貝AI傳感器處理管線

    NVIDIA Holoscan 是 NVIDIA 的跨領(lǐng)域多模態(tài)實時 AI 傳感器處理平臺,為開發(fā)者構(gòu)建端到端傳感器處理管線奠定了基礎(chǔ)。
    的頭像 發(fā)表于 07-02 11:50 ?555次閱讀
    在<b class='flag-5'>NVIDIA</b> Holoscan SDK中使用OpenCV構(gòu)建零拷貝AI<b class='flag-5'>傳感器</b>處理管線

    霍爾電流傳感器AH810在電機控制中的應(yīng)用,帶寬65kHz

    霍爾電流傳感器AH810在電機控制中的應(yīng)用,帶寬65kHz
    的頭像 發(fā)表于 06-05 10:16 ?666次閱讀
    霍爾電流<b class='flag-5'>傳感器</b>AH810在電機控制中的應(yīng)用,<b class='flag-5'>高</b><b class='flag-5'>帶寬</b>65kHz

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理管理Wi-Fi如何解決?

    我們使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,請參閱 Nvidia Jetson 與英飛凌 AIROC Wi-Fi 6
    發(fā)表于 05-23 06:47

    納芯微發(fā)布車規(guī)級帶寬集成式電流傳感器NSM211x系列

    納芯微近日重磅推出了一款革新性的車規(guī)級帶寬集成式電流傳感器——NSM211x系列。這款電流傳感器以其全
    的頭像 發(fā)表于 05-13 15:23 ?706次閱讀

    納芯微推出車規(guī)級帶寬集成式電流傳感器NSM211x系列

    納芯微最新推出的NSM211x系列車規(guī)級帶寬集成式電流傳感器,徹底革新了電流測量技術(shù)。這款傳感器解決方案高度
    的頭像 發(fā)表于 05-06 15:29 ?582次閱讀

    NVIDIA AI賦能水面自動駕駛技術(shù),實現(xiàn)多種標(biāo)準(zhǔn)落地應(yīng)用

    本案例中,歐卡智舶在無人船系統(tǒng)中搭載了多種傳感器,并選擇了 NVIDIA Jetson 系列產(chǎn)品作為邊緣計算硬件。
    的頭像 發(fā)表于 04-30 16:46 ?1331次閱讀
    <b class='flag-5'>NVIDIA</b> AI賦能水面自動駕駛技術(shù),實現(xiàn)多種標(biāo)準(zhǔn)落地應(yīng)用

    納芯微推出全新的車規(guī)級帶寬集成式電流傳感器NSM211x系列

    納芯微宣布推出全新的車規(guī)級帶寬集成式電流傳感器NSM211x系列,該系列是完全集成隔離電流
    的頭像 發(fā)表于 04-14 09:10 ?603次閱讀
    納芯微推出全新的車規(guī)級<b class='flag-5'>高</b><b class='flag-5'>帶寬</b><b class='flag-5'>集成</b>式電流<b class='flag-5'>傳感器</b>NSM211x系列

    納芯微宣布推出全新的車規(guī)級帶寬集成式電流傳感器NSM211x系列

    納芯微宣布推出全新的車規(guī)級帶寬集成式電流傳感器NSM211x系列,該系列是完全集成隔離電流
    的頭像 發(fā)表于 04-08 14:33 ?613次閱讀
    納芯微宣布推出全新的車規(guī)級<b class='flag-5'>高</b><b class='flag-5'>帶寬</b><b class='flag-5'>集成</b>式電流<b class='flag-5'>傳感器</b>NSM211x系列

    Allegro推出帶寬電流傳感器技術(shù),幫助實現(xiàn)高性能電源轉(zhuǎn)換

    為幫助業(yè)界更好地利用GaN和SiC等寬帶隙技術(shù),在電動汽車、清潔能源解決方案和數(shù)據(jù)中心等應(yīng)用中實現(xiàn)更高性能電源轉(zhuǎn)換,Allegro宣布推出新型帶寬電流傳感器 ACS37030和ACS37032,這些全新高功率密度
    的頭像 發(fā)表于 03-04 16:50 ?729次閱讀

    音視頻解碼生成與流媒體傳輸?shù)慕Y(jié)合

    音視頻解碼生成與流媒體傳輸是現(xiàn)代數(shù)字媒體技術(shù)中兩個不可或缺的部分,它們的結(jié)合為用戶提供了高質(zhì)量、實時性的多媒體體驗。 1. 解碼生成與流媒體
    的頭像 發(fā)表于 02-21 14:36 ?427次閱讀