0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

恩智浦i.MX 8M Plus幫助實現(xiàn)并行機器學習推理網(wǎng)絡

NXP客棧 ? 來源:NXP客棧 ? 作者:NXP客棧 ? 2021-05-18 13:44 ? 次閱讀

當下,大多數(shù)研究與論文都側重于針對特定任務的機器學習(ML)模型,分析在執(zhí)行該模型時達到的精度以及處理架構的效率,但在現(xiàn)場部署實際解決方案時,還有其他諸多需要考慮的因素。恩智浦i.MX 8M Plus應用處理器中集成的,能夠提供高達2.3 TOPS加速性能的專用神經(jīng)網(wǎng)絡處理單元(NPU),為用戶應用的開發(fā)提供更好的選擇和靈活性,幫助他們使用機器學習和視覺技術來實現(xiàn)廣泛的應用。

Arcturus Networks就開發(fā)了一種用于監(jiān)控銀行ATM機網(wǎng)點情況的應用,充分體現(xiàn)了在網(wǎng)絡邊緣的設備安全相關應用中需要的多功能和技術。恩智浦也非常榮幸邀請到我們的伙伴,Arcturus創(chuàng)新總監(jiān)David Steele,分享關于該項目及其開發(fā)方法的詳細信息。

Arcturus團隊最近與某家銀行合作開展了一個項目,幫助他們監(jiān)控ATM機網(wǎng)點。該銀行希望防止ATM機區(qū)域出現(xiàn)擁擠現(xiàn)象,并限制佩戴面罩或頭盔者進入。這一應用就是一個很好的邊緣人工智能示例,因為網(wǎng)絡邊緣既是數(shù)據(jù)源所在的位置,也是需要執(zhí)行本地操作的位置。同時它也帶來了一些非常有趣的挑戰(zhàn)。

設計需求與挑戰(zhàn)

對采樣數(shù)據(jù)的分析表明,在狹小封閉的ATM空間內(nèi),攝像頭通常呈俯拍角度,由于它明顯呈現(xiàn)自上而下的拍攝角度(圖1),會導致檢測可信度降低。

另外,該應用還需要區(qū)分佩戴和未佩戴面罩的人。這并非只是改進現(xiàn)有類別的檢測,使其包括佩戴面罩者那么簡單。由于實際操作中頭盔或其他面部遮蓋物也被視為個人防護裝備(PPE),因而需要創(chuàng)建多個新的檢測類別(圖2)。

此外,該銀行還希望擴展分析功能,以便檢測可疑行為,包括來回游蕩等。

為了提高檢測可信度,在網(wǎng)絡中增加新檢測類別,我們需要使用特定域數(shù)據(jù),并進行模型微調(diào)或重復的訓練。這個過程是從邊緣離線完成的,其結果將與正確標記數(shù)據(jù)集進行對照。此過程迭代進行,但通過使用特定域的數(shù)據(jù),其結果可提供非常關鍵的模型改進。

模型經(jīng)過訓練、微調(diào)和驗證之后,可將其轉移至基于集成專用2.3 TOPS NPU的i.MX 8M Plus應用處理器作主控的設備。另外為了高效利用NPU,模型必須從本地32位浮點(FP32)精度轉換為8位整數(shù)(INT8)精度。這個量化過程可能會導致一些精度損失,可能需要多次驗證。

我們需要通過運行時推理引擎將模型加載到i.MX 8M Plus。恩智浦eIQ機器學習(ML)軟件開發(fā)環(huán)境支持經(jīng)過移植和驗證的Arm NN和TensorFlow Lite推理引擎。不過,邊緣運行庫版本并不支持所有類型網(wǎng)絡需要的所有層——比較新的模型和不太流行的模型通常沒有得到廣泛支持。

為幫助減少訓練和部署邊緣人工智能系統(tǒng)所需的時間,Arcturus提供了一個目錄,其中包含使用不同精度的預構建模型。這些模型經(jīng)過預先驗證,可支持所有主要邊緣運行庫;包括支持在CPU、GPU、NPU上運行的Arm NN、TensorFlow Lite和TensorRT。他們還提供工具,用于訓練或微調(diào)模型,以及數(shù)據(jù)集管理、圖像抓取和增強。與運行相同模型的其他公開發(fā)布的系統(tǒng)相比,通過將優(yōu)化運行庫、量化模型和NPU硬件組合在一起,可以提供40倍性能提升(圖3)。

提高分析精度

一旦模型在邊緣高效運行,就需要具備對輸出進行分析的能力。如果對靜態(tài)圖像執(zhí)行分析,二進制分類可以確定是否存在PPE。如果對實時視頻執(zhí)行分析,可能要困難一點,因為局部遮擋和身體姿勢將導致檢測結果的差異。為了提高精度,我們需要對多個幀進行更智能的判定。為了達到這個目標,我們需要對每個人進行跟蹤,以獲得更大的樣本。運動模型跟蹤是一種簡單輕量級方法,適合完成此任務,但它依賴于連續(xù)檢測。如果存在遮擋和障礙物,或者人員離開并重新進入視場,都會導致跟蹤丟失。因此,要檢測來回游蕩的人員,就需要更強大的跟蹤方法,能夠進行重新識別,而不受時間或空間的影響。

重新識別是通過使用生成視覺外觀嵌入的網(wǎng)絡來實現(xiàn)的。這個工作流程要求目標識別與分類網(wǎng)絡將定位、幀和分類信息傳遞到嵌入網(wǎng)絡(圖4)。網(wǎng)絡和數(shù)據(jù)流之間的同步至關重要,因為任何時間偏差都可能導致推理錯誤。將輸出與運動模型數(shù)據(jù)進行比較,確定身份分配。嵌入可在多個攝像頭系統(tǒng)之間共享,它們可用于存檔搜索,以創(chuàng)建活動觀察列表,甚至通過應用集群技術,進一步進行后期處理。

多目標追蹤

要將視覺外觀嵌入添加到運動模型跟蹤,就需要對每個檢測目標進行處理。因此,更多的目標意味著需要更多的處理。在我們的應用中,人數(shù)本身受到了物理空間的限制。但是,在視場較大的情況下,這可能帶來嚴重的瓶頸。

為了解決這個問題,Arcturus開發(fā)了視覺管道架構,其中不同的處理階段由節(jié)點表示,例如推理、算法、數(shù)據(jù)或外部服務。每個節(jié)點的作用類似于一項微服務,通過緊密同步的序列化數(shù)據(jù)流來互連。這些節(jié)點共同構成了完整的視覺管道,從圖像采集一直到本地操作。對于基本應用,各個管道節(jié)點可在同一物理硬件上運行。比較復雜的管道的節(jié)點可能分布在各個硬件上,例如在CPU、GPU、NPU上,甚至在云端。各個管道在運行時進行協(xié)調(diào),使其具有出色的靈活性和可擴展性,有助于確保邊緣計算投資能夠經(jīng)受未來考驗。每個節(jié)點都嚴謹?shù)啬K化,從而可以輕松替換系統(tǒng)的某一部分,例如,即便模型時序發(fā)生變化,也可以在不影響系統(tǒng)其余部分的情況下更新推理模型。

這種管道架構是Arcturus Brinq Edge Creator SDK的核心,使我們能夠擴展人工智能的性能,進一步講單一應用處理器的處理能力發(fā)揮到極致。例如,在一個基于i.MX 8M Plus設備執(zhí)行檢測的同時,讓第二個基于i.MX 8M Plus設備生成嵌入。這些器件可以使用網(wǎng)絡結構來輕松進行互連,每個處理器使用兩個專用以太網(wǎng)MAC中的一個MAC。如果更進一步,可以將這種軟件與Arcturus Atlas硬件平臺結合使用,該硬件平臺使用包括i.MX 8M Plus的多種硬件配置,可擴展到187fps(圖5).

3f29d430-b4d2-11eb-bf61-12bb97331649.png

圖5 :Arcturus Atlas硬件平臺性能(使用具有加速選項的恩智浦i.MX 8M Plus)

總結一下,進行應用整體設計時,應該考慮到您的需求可能會發(fā)生變化?;陬悇e的檢測可能需要利用算法或其他網(wǎng)絡來增強。要讓您的邊緣人工智能經(jīng)受未來考驗,可以基于可擴展管道架構(例如Brinq Edge Creator SDK)進行構建,并且充分利用可擴展的硬件性能,例如采用恩智浦i.MX 8M Plus處理器和NPU加速器的Atlas平臺。

原文標題:實現(xiàn)并行機器學習推理網(wǎng)絡:i.MX 8M Plus原來可以這么用!

文章出處:【微信公眾號:NXP客?!繗g迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡
    +關注

    關注

    14

    文章

    7597

    瀏覽量

    89140
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132969

原文標題:實現(xiàn)并行機器學習推理網(wǎng)絡:i.MX 8M Plus原來可以這么用!

文章出處:【微信號:NXP客棧,微信公眾號:NXP客棧】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2.3T算力,真的強!1分鐘學會NPU開發(fā),基于NXP i.MX 8MP平臺!

    科技飛速發(fā)展,人工智能與工業(yè)領域的融合日益深入。NXP旗下的i.MX 8M Plus作為一款高端工業(yè)處理器,NPU算力高達2.3TOPS,正引領著工業(yè)智能化的浪潮,為眾多工業(yè)場景帶來了前所未有的變革
    的頭像 發(fā)表于 01-24 10:21 ?68次閱讀
    2.3T算力,真的強!1分鐘學會NPU開發(fā),基于NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>8</b>MP平臺!

    i.MX 94應用處理器如何變革工業(yè)和汽車連接

    半導體發(fā)布i.MX 94系列應用處理器,為工業(yè)和汽車連接設定了新的標準。作為i.MX 9系列應用處理器的最新成員,i.MX 94旨在提
    的頭像 發(fā)表于 01-17 10:51 ?200次閱讀

    基于i.MX95的邊緣計算人工智能解決方案

    、集成式eIQ?Neutron神經(jīng)處理單元(NPU),可實現(xiàn)機器學習和先進邊緣應用,其應用領域涵蓋汽車、工業(yè)和物聯(lián)網(wǎng)。 作為
    的頭像 發(fā)表于 12-26 09:57 ?1055次閱讀
    基于<b class='flag-5'>i.MX</b>95的<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>邊緣計算人工智能解決方案

    i.MX 91生態(tài)合作伙伴最新開發(fā)板資源

    i.MX 91應用處理器系列能夠快速實現(xiàn)基于Linux的經(jīng)濟高效的邊緣應用程序。i.MX 91處理器在保持實惠價格的同時,融合了高性能
    的頭像 發(fā)表于 12-20 17:00 ?670次閱讀

    i.MX RT700系列MCU的優(yōu)勢

    作為邊緣智能時代的嵌入式工程師,你對一款理想的MCU有何期待?高性能、高集成、低功耗、更安全,以及出眾的AI推理能力……半導體新近發(fā)布的i.MX RT700跨界MCU系列,就是你
    的頭像 發(fā)表于 12-09 09:16 ?605次閱讀

    發(fā)布i.MX 94系列應用處理器

    半導體發(fā)布i.MX 9系列應用處理器的新成員i.MX 94系列。該系列旨在用于工業(yè)控制、可編程邏輯控制器(PLC)、遠程信息處理、工業(yè)和汽車網(wǎng)關以及樓宇和能量控制。
    的頭像 發(fā)表于 11-26 17:48 ?786次閱讀

    采用TPS65023的i.MX 6電源設計

    電子發(fā)燒友網(wǎng)站提供《采用TPS65023的i.MX 6電源設計.pdf》資料免費下載
    發(fā)表于 09-29 10:00 ?0次下載
    采用TPS65023的<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> 6電源設計

    i.MX8處理器的集成電源設計

    電子發(fā)燒友網(wǎng)站提供《i.MX8處理器的集成電源設計.pdf》資料免費下載
    發(fā)表于 09-18 14:25 ?0次下載
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX8</b>處理器的集成電源設計

    使用TPS6521825和LP873347 PMIC為NXP i.MX 8M Mini和Nano供電

    電子發(fā)燒友網(wǎng)站提供《使用TPS6521825和LP873347 PMIC為NXP i.MX 8M Mini和Nano供電.pdf》資料免費下載
    發(fā)表于 09-13 09:42 ?0次下載
    使用TPS6521825和LP873347 PMIC為NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>8M</b> Mini和Nano供電

    使用TPS65219為i.MX 8M Plus供電

    電子發(fā)燒友網(wǎng)站提供《使用TPS65219為i.MX 8M Plus供電.pdf》資料免費下載
    發(fā)表于 08-31 10:15 ?0次下載
    使用TPS65219為<b class='flag-5'>i.MX</b> <b class='flag-5'>8M</b> <b class='flag-5'>Plus</b>供電

    i.MX RT1170 uSDHC eMMC啟動時間

    大家好,我是痞子衡,是正經(jīng)搞技術的痞子。今天痞子衡給大家介紹的是i.MX RT1170 uSDHC eMMC啟動時間。
    的頭像 發(fā)表于 08-08 15:32 ?651次閱讀
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> RT1170 uSDHC eMMC啟動時間

    i.MX 8M Plus中的ISP圖像信號處理模塊特性概述

    日常生活中,人類約80%的信息來自于視覺信息,而視覺信息的載體是數(shù)以億萬計的圖片和視頻流,因此如何打造高效而智能的視覺處理解決方案,是擺在開發(fā)者面前的重要課題。 推出的i.MX 8M
    的頭像 發(fā)表于 08-02 11:39 ?1357次閱讀

    德國康佳特攜手,推出基于i.MX 95處理器的計算模塊

    在2024年7月16日的中國上海,嵌入式與邊緣計算技術的領軍者德國康佳特公司,正式發(fā)布了其最新力作——一款搭載(NXP)i.MX 95處理器的尖端高性能計算模塊(COM)。這一創(chuàng)新舉措不僅豐富了康佳特基于低功耗
    的頭像 發(fā)表于 07-17 14:39 ?1319次閱讀

    康佳特推出基于i.MX 95系列處理器的新款SMARC模塊

    (COM),擴展了基于低功耗i.MX Arm處理器的模塊產(chǎn)品組合??导烟匾惨虼思訌娏伺c的緊密合作關系。客戶將受益于標準模塊的可擴
    發(fā)表于 07-16 14:55 ?1048次閱讀
    康佳特推出基于<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> 95系列處理器的新款SMARC模塊

    適用于 NXP i.MX 8M Mini 的 TPS6521825 電源管理IC TPS6521825數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《適用于 NXP i.MX 8M Mini 的 TPS6521825 電源管理IC TPS6521825數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 03-01 09:09 ?0次下載
    適用于 NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>8M</b> Mini 的 TPS6521825 電源管理IC TPS6521825數(shù)據(jù)表