0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何快速設計和部署智能機器視覺系統(tǒng)

海闊天空的專欄 ? 來源:Jeff Shepard ? 作者:Jeff Shepard ? 2023-10-03 14:31 ? 次閱讀

作者:Jeff Shepard

許多應用對機器視覺的需求在不斷增長,包括安防、交通和城市攝像頭、零售分析、自動檢測、過程控制和視覺引導機器人技術。實現(xiàn)機器視覺是一個復雜的過程,需要整合不同的技術和子系統(tǒng),包括高性能硬件和先進的人工智能/機器學習AI/ML) 軟件。機器視覺從優(yōu)化視頻采集技術和視覺 I/O以滿足應用需求開始,并延伸到多個圖像處理管道以實現(xiàn)高效連接。機器視覺最終取決于嵌入式視覺系統(tǒng)是否能夠通過高性能硬件執(zhí)行基于視覺的實時分析。這些硬件如現(xiàn)場可編程門陣列(FPGA)、系統(tǒng)級模塊 (SOM)、系統(tǒng)級芯片 (SoC),甚至是運行所需的 AI/ML 圖像處理和識別軟件的系統(tǒng)級芯片上多處理器系統(tǒng)(MPSoC)。這可能是一個復雜、昂貴且耗時的過程,可能會頻繁導致成本超支、進度延誤。

與其從頭開始,設計者還不如采用一種經(jīng)過精心策劃的高性能開發(fā)平臺,從而在加快上市時間、控制成本并降低開發(fā)風險的同時,支持應用實現(xiàn)高度靈活性和高性能。基于SOM 的開發(fā)平臺可以提供集成硬件和軟件環(huán)境,讓開發(fā)人員專注于應用定制并節(jié)省多達九個月的開發(fā)時間。除了開發(fā)環(huán)境外,同樣的 SOM架構還可用于商業(yè)和工業(yè)環(huán)境下的生產優(yōu)化配置,以提高應用的可靠性和質量,進一步降低風險并加快上市時間。

本文首先回顧與開發(fā)高性能機器視覺系統(tǒng)有關的挑戰(zhàn),然后介紹 AMD Xilinx 的 Kria KV260 視覺 AI入門套件提供的全面開發(fā)環(huán)境,最后以基于 Kira 26 平臺設計的即用型 SOM 為例進行介紹。該平臺用于插入帶有特定解決方案外設的載板。

該開發(fā)板從數(shù)據(jù)類型優(yōu)化開始

深度學習算法的需求在不斷增加。不是每個應用都需要高精度計算。目前正在使用的較低精度數(shù)據(jù)類型如 INT8,或者使用自定義數(shù)據(jù)格式。基于 GPU的系統(tǒng)可能面臨這樣的挑戰(zhàn),即試圖修改為高精度數(shù)據(jù)優(yōu)化的架構,以有效地適應低精度數(shù)據(jù)格式。Kria K26 SOM 可重新配置,使其能夠支持從 FP32 到INT8 等多種數(shù)據(jù)類型??芍貜团渲靡灿兄趯崿F(xiàn)較低總體能耗。例如,與 FP32 運行相比,針對 INT8 優(yōu)化的運行所消耗的能量會少一個數(shù)量級(圖 1)。

1.png

最優(yōu)架構帶來最小功耗

根據(jù)典型的電源使用模式,基于多核 GPU 或 CPU 架構的設計可能功耗大。

內核部分能耗占 30%

內部存儲器 (L1, L2, L3) 能耗占 30%

外部存儲器(如 DDR)能耗為 40%

GPU 需要頻繁地訪問低效率 DDR 內存以支持可編程性,這是高帶寬計算需求的瓶頸。Kria K26 SOM 中使用的 Zynq MPSoC架構支持開發(fā)只需少量訪問或不訪問外部存儲器的應用。例如,在典型的汽車應用中,GPU 和各種模塊之間的通信需要多次訪問外部 DDR 存儲器來完成,而基于 ZynqMPSoC 的解決方案包含了一個旨在避免大多數(shù) DDR 訪問的管道(圖 2)。

2.png

修剪的優(yōu)勢

可以通過人工智能優(yōu)化工具來增強 K26 SOM
上的神經(jīng)網(wǎng)絡性能,這種工具可以實現(xiàn)數(shù)據(jù)優(yōu)化和修剪。神經(jīng)網(wǎng)絡被過度參數(shù)化的情況非常常見,從而導致了高水平冗余。這種情況可通過數(shù)據(jù)修剪和模型壓縮來進行優(yōu)化。使用Xilinx 的人工智能優(yōu)化器可使模型復雜度降低至原來的 1/50,而對模型精度的影響卻微乎其微。例如,一個單次檢測器 (SSD) 加上一個 VGG 卷積神經(jīng)網(wǎng)(CNN) 架構且具有 117 千兆運算 (Gops) 能力,使用人工智能優(yōu)化器經(jīng)過 11 次迭代修剪后得到了改進。優(yōu)化前,該模型在 ZynqUltraScale+ MPSoC 上每秒運行 18 幀 (FPS)。經(jīng)過 11 次迭代——該模型的第 12 次運行,其復雜性從 117 Gops 降低至11.6Gops(約前者的 1/10),性能從 18 FPS 提升至 103 FPS(前者的 5 倍),物體檢測準確性從 61.55 平均精度 (mAP)下降到 60.4 mAP(僅降低 1%)(圖 3)。

3.png

基于 Uncanny Vision 的視覺分析軟件,開發(fā)出用于汽車車牌檢測、識別的機器學習應用,也稱為汽車車牌識別 (ANPR) 應用。ANPR用于自動收費系統(tǒng)、高速公路監(jiān)控、安全門和停車場入口以及其他應用。這種車牌識別應用包括一個基于人工智能的信息管道,對視頻進行解碼并預處理圖像,然后進行 ML檢測和 OCR 字符識別(圖 4)。

4.png

實現(xiàn)車牌識別需要一個或多個 H.264 或 H.265 編碼的實時流媒體協(xié)議 (RTSP)饋送,這些饋送經(jīng)過解碼或未經(jīng)過壓縮。解碼后的視頻幀經(jīng)過縮放、裁剪、色彩空間轉換和標準化(預處理),然后發(fā)送至 ML 檢測算法。實現(xiàn)高性能車牌識別需要多階段 AI信息管道。在第一階段中,檢測并定位圖像中的車輛,創(chuàng)建關注區(qū)域 (ROI)。同時,其他算法優(yōu)化圖像質量,供 OCR字符識別算法隨后使用,并以跨多幀的方式追蹤車輛運動。車輛 ROI 會被進一步裁剪,生成供 OCR 算法處理的號牌 ROI,以確定號牌中的字符。與其他基于 GPU或 CPU 的商業(yè) SOM 相比,Uncanny Vision 的 ANPR 應用在 Kira KV260 SOM 上的運行速度快 2 到 3 倍,每個RTSP feed 的成本不到 100 美元。

智能視覺開發(fā)環(huán)境

對于交通和城市攝像頭、零售分析、安防、工業(yè)自動化和機器人等智能視覺應用的設計者來說,他們可以采用 Kria K26 SOM AI Starter開發(fā)環(huán)境。這種開發(fā)環(huán)境采用 Zynq? UltraScale+? MPSoC 架構建立,并有一個不斷增長的策劃應用軟件包庫(圖 5)。AI StarterSOM 包括一個四核 Arm Cortex-A53 處理器,超過 25 萬個邏輯單元以及一個 H.264/265 視頻編解碼器。SOM 還具有 4GB DDR4存儲器、245 個 IO 和 1.4 tera-ops人工智能計算,以支持創(chuàng)建高性能視覺人工智能應用,進而實現(xiàn)了與其他硬件方法相比,能以更低延遲、更低功耗提供超 3倍的性能。預構建應用可使初始設計在不到一小時內即可開始運行。

5.png

為了幫助快速啟動采用 Kria K26 SOM 的開發(fā)過程,AMD Xilinx 提供了 KV260 視覺 AI入門套件,其中包括電源適配器、以太網(wǎng)線、microSD 卡、USB 線、HDMI 線和攝像頭模塊(圖 6)。如果不需要整個入門套件,開發(fā)人員可以簡單地購買可選的電源適配器,以開始使用 Kira K26 SOM。

6.png

能夠加速開發(fā)的另一個原因是功能全面,包括豐富的 1.8 V、3.3 V 單端和差分 I/O、四個 6 Gb/s 收發(fā)器和四個 12.5 Gb/s收發(fā)器。有了這些功能,就能夠開發(fā)這樣的應用——即在這些應用中每個 SOM 具有更多的圖像傳感器且這些應用配備如 MIPI、LVDS、SLVS 和 SLVS-EC等各種傳感器接口。對于這些接口來說,其支持設備并不總限于應用特定型標準產品 (ASSP) 或 GPU。開發(fā)人員還可以通過嵌入式可編程邏輯實現(xiàn)DisplayPort、HDMI、PCIe、USB2.0/3.0 和用戶定義的標準。

最后,通過將 K26 SOM 廣泛的硬件能力、軟件環(huán)境與生產就緒型視覺應用相結合,簡化人工智能應用的開發(fā)并使其變得更加容易。這些視覺應用可以在不需要FPGA 硬件設計的情況下實現(xiàn),并使軟件開發(fā)人員能夠快速集成定制的 AI 模型和應用代碼,甚至修改視覺管道。Xilinx 的 Vitis統(tǒng)一軟件開發(fā)平臺和庫支持常見的設計環(huán)境,如 TensorFlow、Pytorch 和 Café 框架以及多種編程語言,包括 C、C++、OpenCL? 和Python。還有一個嵌入式應用商店,用于使用來自 Xilinx 及其生態(tài)系統(tǒng)合作伙伴的 Kria SOM 的邊緣應用。Xilinx產品免費、開源,包括智能攝像頭跟蹤和人臉檢測、帶有智能視覺的自然語言處理功能等。

生產優(yōu)化型 Kira 26 SOM

一旦開發(fā)過程完成,就可以提供 K26 SOM 的生產就緒型版本,該版本用于插入配有特定解決方案外設的載板,可以加速向制造過渡(圖 7)?;镜?K26SOM 是商業(yè)級器件,其溫度等級為 0℃ 至 +85℃ 結溫(通過內部溫度傳感器測量)。還可提供 工業(yè)級版本 K26 SOM,其額定工作溫度為 -40°C 至+100°C。

工業(yè)市場要求在惡劣的環(huán)境下具有更長的運行壽命。工業(yè)級 Kria SOM 在 100°C 結溫和 80% 相對濕度下可運行 10 年,并可承受高達 40 g的沖擊和 5 g 的均方根 (RMS) 振動。該版本還具有最短十年的生產可用性,以支持長的產品生命周期。

7.png

結語

諸如安全、交通和城市攝像頭、零售分析、自動檢測、過程控制和視覺引導的機器人等機器視覺應用設計者,可以采用 Kria K26 SOM AI啟動器,以加快上市時間,協(xié)助控制成本并降低開發(fā)風險。這種基于 SOM的開發(fā)平臺提供了一個軟硬件集成環(huán)境,讓開發(fā)者能專注于應用定制并節(jié)省多達九個月的開發(fā)時間。同樣的 SOM架構可用于商業(yè)和工業(yè)環(huán)境中的生產優(yōu)化配置,進一步加快上市時間。工業(yè)版的最低生產可用性為 10 年,可支持很長的產品生命周期。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5082

    文章

    19126

    瀏覽量

    305242
  • 機器視覺
    +關注

    關注

    162

    文章

    4372

    瀏覽量

    120325
  • AI
    AI
    +關注

    關注

    87

    文章

    30896

    瀏覽量

    269108
  • SOM
    SOM
    +關注

    關注

    0

    文章

    59

    瀏覽量

    15721
收藏 人收藏

    評論

    相關推薦

    機器視覺系統(tǒng)在注塑行業(yè)的應用

    機器視覺是通過采用非接觸式的光學感知設備自動接收和解析真實場景的影像,以獲取信息和控制機器或工藝過程。機器視覺系統(tǒng)基本配置包含工業(yè)相機與鏡頭
    發(fā)表于 06-09 14:55

    機器視覺系統(tǒng)應用于標簽外觀視覺檢查!

    `機器視覺系統(tǒng)可以快速獲取大量信息,而且易于自動處理,也易于同設計信息以及加工控制信息集成,因此,在現(xiàn)代自動化生產過程中,人們將機器視覺系統(tǒng)
    發(fā)表于 11-18 16:13

    服務機器人的視覺系統(tǒng)怎么設計?

    隨著計算機科學和自動控制技術的發(fā)展,越來越多的不同種類的智能機器人出現(xiàn)在工廠、生活當中,機器視覺系統(tǒng)作為智能
    發(fā)表于 04-07 07:27

    工業(yè)機器人與智能視覺系統(tǒng)應用實訓平臺介紹

    ZNAI-1工業(yè)機器人與智能視覺系統(tǒng)應用實訓平臺一、產品概述工業(yè)機器人與智能視覺系統(tǒng)應用實訓平臺
    發(fā)表于 07-01 11:48

    ZN-1AI工業(yè)機器人與智能視覺系統(tǒng)應用實訓平臺介紹

    ZN-1AI工業(yè)機器人與智能視覺系統(tǒng)應用實訓平臺一、產品概述 ZN-1AI以工業(yè)機器人與機器視覺
    發(fā)表于 07-01 10:07

    機器視覺系統(tǒng)是指什么? 機器視覺系統(tǒng)的工作原理是什么?

    機器視覺系統(tǒng)是指什么?機器視覺系統(tǒng)的工作原理是什么?影響機器視覺系統(tǒng)輸入的重要因素有哪些?
    發(fā)表于 07-16 11:23

    機器視覺系統(tǒng)有何應用

    隨著越來越多的制造商采用工業(yè)4.0模型,工業(yè)市場對視覺系統(tǒng)的需求也將增長。在這個新時代,制造商將集成先進的機器人技術、機器學習、 3D深度測繪和工業(yè)物聯(lián)網(wǎng),以提高組織和生產能力。機器
    發(fā)表于 12-20 06:04

    機器視覺系統(tǒng)原理及基礎知識

    機器視覺系統(tǒng)的目的就是給機器或自動生產線添加一套視覺系統(tǒng),其原理是由計算機或圖像處理器以及相關設備來模擬人的視覺行為,完成得到人的
    發(fā)表于 12-16 14:40 ?0次下載
    <b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>原理及基礎知識

    機器視覺_ni機器視覺系統(tǒng)-技術專輯

    在現(xiàn)代自動化生產過程中,人們將機器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗和質量控制等領域。本專題內容涉及機器視覺是什么,ni機器
    發(fā)表于 08-03 11:33
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>_ni<b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>-技術專輯

    如何使用NI快速構建機器視覺系統(tǒng)

    本演示介紹如何使用NI 交互式的機器視覺開發(fā)軟件環(huán)境VBAI,快速構建機器視覺系統(tǒng)。無需編程,配合NI新款
    的頭像 發(fā)表于 06-25 03:06 ?4150次閱讀
    如何使用NI<b class='flag-5'>快速</b>構建<b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>

    機器視覺系統(tǒng)詳解

    機器視覺系統(tǒng)詳解說明。
    發(fā)表于 04-19 15:16 ?21次下載

    機器視覺系統(tǒng)概述

    機器視覺系統(tǒng)概述說明。
    發(fā)表于 04-21 10:07 ?12次下載

    機器視覺系統(tǒng)的經(jīng)典應用

    機器視覺系統(tǒng)的經(jīng)典應用。
    發(fā)表于 05-28 10:25 ?15次下載

    機器視覺系統(tǒng)的組成及應用

    且精度不高,用機器視覺檢測方法可以大大提高生產效率和生產的自動化程度。而且機器視覺易于實現(xiàn)信息集成,是實現(xiàn)計算機集成制造的基礎技術。正是由于機器
    發(fā)表于 08-09 18:02 ?2822次閱讀

    機器視覺系統(tǒng)包括哪些

    機器視覺系統(tǒng)包括哪些 機器視覺系統(tǒng)就是利用機器代替人眼來作各種測量和判斷。它是計算機學科的一個重要分支,它綜合了光學、機械、電子、計算機軟硬
    發(fā)表于 06-29 11:33 ?898次閱讀