0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導員 ? 來源:嵌入式計算設(shè)計 ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀

工業(yè)物聯(lián)網(wǎng)架構(gòu)師花了數(shù)年時間才得出結(jié)論,邊緣需要數(shù)據(jù)中心級的性能,以實現(xiàn)高效分析、提高安全性和降低網(wǎng)絡成本。在人工智能機器學習領(lǐng)域,傳感器設(shè)備內(nèi)部或附近對高端處理能力的需求從一開始就很明顯。

考慮到即使是簡單的自主機器(我知道這是矛盾的說法)也需要大量的計算能力來運行神經(jīng)網(wǎng)絡來執(zhí)行障礙物檢測、識別和避免等功能。例如,京東和菜鳥等公司生產(chǎn)的自動送貨車需要大約每秒 30 兆次運算 (TOPS) 的處理性能,而雅馬哈正在開發(fā)的自動駕駛檢查無人機需要大約 20 兆次運算 (TOPS) 的處理性能。

當然,這對嵌入式和工業(yè)工程師提出了一個經(jīng)典的設(shè)計挑戰(zhàn):平衡每瓦性能。性能太低,應用程序失敗。功耗太大,自主機器必須連接到持續(xù)的電源。

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務器級性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構(gòu)處理性能,適用于人工智能驅(qū)動的機器人應用程序,包括:

512 核 Volta GPU,帶有 64 個 TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學習加速器)引擎

雙 7 路 VLIW 視覺加速器引擎

這代表 Jetson AGX 模塊的性能高達 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負載相關(guān)的頻繁讀寫。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務器級性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺式風扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報告稱每瓦性能 (PPW) 的最佳點在 15W 左右。即使在那個水平(大約相當于藍光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項功能可實現(xiàn)這種類型的每瓦性能,從基礎(chǔ)芯片架構(gòu)開始。雖然 SoC 上的每個內(nèi)核都有自己的內(nèi)存,但內(nèi)存是離散 SoC 模塊之間的零內(nèi)存復制。雖然 AGX Xavier 模塊確實通過外部 16 GB LPDDR4X DRAM 提供共享內(nèi)存,但片上數(shù)據(jù)只是通過管道傳遞到必要的處理核心。

架構(gòu)的異構(gòu)性也提高了效率,因為工作負載可以在最適合任務的架構(gòu)上執(zhí)行。這方面的一個例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復雜或用戶定義的任務。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡 (CNN) 時,NVDLA 引擎可提供高達 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時,功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時,Carmel CPU 內(nèi)核可以保留用于通用計算任務。

JetPack 簡化了深度學習編程的復雜性

Jetson AGX 系列運行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開發(fā)人員可能不太熟悉的是對 GPU 和/或深度學習加速器進行編程。幸運的是,NVIDIA JetPack 4.1.1 軟件開發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫以及與常用語言的集成,因此您無需了解如何編程 GPU對 GPU 進行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機 API

TensorRT 5.0 包中提供的 API 也簡化了對 DLA 進行編程以執(zhí)行神經(jīng)網(wǎng)絡工作負載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡層或?qū)樱?_allowGPUFallback() 這樣的命令可讓工作負載在 DLA 不支持的情況下恢復到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來加速視頻分析應用程序的開發(fā)。

當然,低級 CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4772

    瀏覽量

    100845
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4994

    瀏覽量

    103165
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4743

    瀏覽量

    128995
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA發(fā)布小巧高性價比的Jetson Orin Nano Super開發(fā)者套件

    NVIDIA近期推出了一款全新的生成式AI超級計算機——Jetson Orin Nano Super開發(fā)者套件。這款開發(fā)者套件以其小巧的尺寸和高性價比吸引了廣泛關(guān)注。 Jetson Orin
    的頭像 發(fā)表于 12-19 11:28 ?391次閱讀

    初創(chuàng)公司借助NVIDIA Metropolis和Jetson提高生產(chǎn)線效率

    初創(chuàng)公司使用 NVIDIA Metropolis 視覺 AIJetson 邊緣 AI 平臺提高生產(chǎn)線效率。
    的頭像 發(fā)表于 11-19 14:39 ?198次閱讀

    使用NVIDIA Jetson打造機器人導盲犬

    Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學習和 NVIDIA Jetson邊緣 AI 和機器人平臺,為視障人士打造了機器人導盲犬。
    的頭像 發(fā)表于 11-09 13:51 ?268次閱讀

    用于工業(yè)以太網(wǎng)PHY的AM2x評估模塊附加板用戶指南

    電子發(fā)燒友網(wǎng)站提供《用于工業(yè)以太網(wǎng)PHY的AM2x評估模塊附加板用戶指南.pdf》資料免費下載
    發(fā)表于 11-05 09:20 ?0次下載
    <b class='flag-5'>用于</b><b class='flag-5'>工業(yè)</b>以太網(wǎng)PHY的AM2x評估<b class='flag-5'>模塊</b>附加板用戶指南

    GPU計算主板學習資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號

    GPU計算主板學習資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號
    的頭像 發(fā)表于 10-23 10:09 ?281次閱讀
    GPU計算主板學習資料第735篇:基于3U VPX的<b class='flag-5'>AGX</b> <b class='flag-5'>Xavier</b> GPU計算主板 信號計算主板 視頻處理 相機信號

    fx3系列的硬件主要由什么組成

    FX3系列是索尼(Sony)推出的一款高性能計算平臺,它基于NVIDIA的Jetson AGX Xavier模塊,專為需要高性能計算、機器學習、計算機視覺和實時數(shù)據(jù)處理的嵌入式系統(tǒng)設(shè)計
    的頭像 發(fā)表于 09-18 11:14 ?511次閱讀

    新品發(fā)布 | 合眾恒躍發(fā)布多款無人機智能飛控產(chǎn)品搭載英偉達Jetson模塊,賦能低空經(jīng)濟新質(zhì)生產(chǎn)力

    控產(chǎn)品搭載英偉達Jetson模塊系列產(chǎn)品,為低空經(jīng)濟注入新的活力。01HZHY-AI529Compact采用NVIDIA高性能AI處理器,是自主機器和其他嵌入式應用的
    的頭像 發(fā)表于 07-27 08:46 ?468次閱讀
    新品發(fā)布 | 合眾恒躍發(fā)布多款無人機智能飛控產(chǎn)品搭載英偉達<b class='flag-5'>Jetson</b><b class='flag-5'>模塊</b>,賦能低空經(jīng)濟新質(zhì)生產(chǎn)力

    瑞薩電子推出Reality AI Explorer Tier,用于開發(fā)AI與TinyML解決方案

    全球半導體解決方案供應商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費版本,可用于開發(fā)工業(yè)、汽車
    的頭像 發(fā)表于 07-19 10:03 ?444次閱讀

    AC/DC電源模塊:應用于工業(yè)自動化領(lǐng)域

    BOSHIDA ? AC/DC電源模塊:應用于工業(yè)自動化領(lǐng)域 AC/DC電源模塊是一種用來將交流電轉(zhuǎn)換為直流電的電源模塊。它在
    的頭像 發(fā)表于 05-31 13:45 ?395次閱讀
    AC/DC電源<b class='flag-5'>模塊</b>:應<b class='flag-5'>用于</b><b class='flag-5'>工業(yè)</b>自動化領(lǐng)域

    除英偉達Jetson系列外,AI邊緣計算盒子還能搭載哪些算力芯片

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去幾年,隨著英偉達推出Jetson系列開始,搭載各種AI算力芯片的邊緣設(shè)備相繼問世。因為外觀形似盒子,具備算法推理能力,為區(qū)分一般傳統(tǒng)工控機,行業(yè)多稱之為邊緣盒子
    的頭像 發(fā)表于 05-06 09:21 ?4183次閱讀

    研華:AI視覺檢測+AMR精準控制,激發(fā)智能制造新動力

    研華提供出色的AI+AOI服務,可配合AIR-030 AGX OrinAI系統(tǒng)(用于推理)、AIR-520 4UAI工作站出色運行。
    的頭像 發(fā)表于 04-18 10:58 ?634次閱讀
    研華:<b class='flag-5'>AI</b>視覺檢測+AMR精準控制,激發(fā)智能制造新動力

    人形機器人主板:jetson orin nx核心模塊與SOM-7583核心模塊結(jié)合在一塊主板上

    ERUN_7583_ORIN_NX嵌入式人工智能計算機底板,專為滿足人形機器人的實際需求而設(shè)計,他具備jetson orin nx核心模塊與SOM-7583核心模塊,可以實現(xiàn)核心模塊
    的頭像 發(fā)表于 03-26 11:17 ?923次閱讀
    人形機器人主板:<b class='flag-5'>jetson</b> orin nx核心<b class='flag-5'>模塊</b>與SOM-7583核心<b class='flag-5'>模塊</b>結(jié)合在一塊主板上

    AIDI工業(yè)AI視覺檢測軟件介紹

    AIDI是一款基于深度學習的智能工業(yè)視覺平臺應用于多種工業(yè)應用場景,有效解決復雜缺陷的定位識別、分類定級及字符識別等問題,具有強大的兼容性。AIDI 內(nèi)置多種應用模塊,無需編程,幫助用
    發(fā)表于 03-25 21:52

    NanoEdge AI的技術(shù)原理、應用場景及優(yōu)勢

    硬件設(shè)計則是為了確保設(shè)備在執(zhí)行這些任務時能夠保持低能耗,從而提高其續(xù)航能力。 2、應用場景 NanoEdge AI 可以廣泛應用于各種物聯(lián)網(wǎng)設(shè)備和傳感器,如智能家居、工業(yè)自動化、智能交通、醫(yī)療健康
    發(fā)表于 03-12 08:09

    NVIDIA Jetson為嵌入式計算領(lǐng)域探索AI可能

    自動化業(yè)務流程、通過數(shù)據(jù)分析獲得洞察力、與客戶和員工互動……如今 AI 正在大幅提高生產(chǎn)力,推動競爭優(yōu)勢。NVIDIA Jetson 是適用于自主機器和其他嵌入式應用的先進平臺,具有出色的 A
    的頭像 發(fā)表于 01-25 17:03 ?546次閱讀
    NVIDIA <b class='flag-5'>Jetson</b>為嵌入式計算領(lǐng)域探索<b class='flag-5'>AI</b>可能