0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

還不錯!裝有移動設備和嵌入式設備的神經(jīng)網(wǎng)絡機器學習軟件

電子工程師 ? 來源:未知 ? 作者:李建兵 ? 2018-03-06 09:26 ? 次閱讀

Arm NN

最近,Arm宣布推出神經(jīng)網(wǎng)絡機器學習(ML) 軟件 Arm NN。這項關鍵性技術,可在基于 Arm 的高能效平臺上輕松構建和運行機器學習應用程序。

實際上,該軟件橋接了現(xiàn)有神經(jīng)網(wǎng)絡框架(例如 TensorFlow 或 Caffe)與在嵌入式 Linux 平臺上運行的底層處理硬件(例如 CPU、GPU 或新型 Arm 機器學習處理器)。這樣,開發(fā)人員能夠繼續(xù)使用他們首選的框架和工具,經(jīng) Arm NN 無縫轉(zhuǎn)換結(jié)果后可在底層平臺上運行。

機器學習需要一個訓練階段,也就是學習階段(“這些是貓的圖片”),另外還需要一個推理階段,也就是應用所學的內(nèi)容(“這是貓的圖片嗎?”)。訓練目前通常在服務器或類似設備上發(fā)生,而推理則更多地轉(zhuǎn)移到網(wǎng)絡邊緣,這正是新版本 Arm NN 的重點所在。

一切圍繞平臺

機器學習工作負載的特點是計算量大、需要大量存儲器帶寬,這正是移動設備和嵌入式設備面臨的最大挑戰(zhàn)之一。隨著運行機器學習的需求日益增長,對這些工作負載進行分區(qū)變得越來越重要,以便充分利用可用計算資源。軟件開發(fā)人員面臨的可能是很多不同的平臺,這就帶來一個現(xiàn)實問題:CPU 通常包含多個內(nèi)核(在 Arm DynamIQ big.LITTLE 中,甚至還有多種內(nèi)核類型),還要考慮 GPU,以及許多其他類型的專用處理器,包括 Arm 機器學習處理器,這些都是整體解決方案的一部分。Arm NN 這時就能派上用場。

下圖中可以看出,Arm NN 扮演了樞紐角色,既隱藏了底層硬件平臺的復雜性,同時讓開發(fā)人員能夠繼續(xù)使用他們的首選神經(jīng)網(wǎng)絡框架。

使用機器學習的應用程序 需要機器學習的已編寫應用程序
TensorFlow、Caffe 等 繼續(xù)使用現(xiàn)有的高級別機器學習框架和支持工具
Arm NN 自動將上述格式轉(zhuǎn)換為 Arm NN,優(yōu)化圖表,并使用 Compute Library 中的函數(shù),使其面向目標硬件
Compute Library 低級別的機器學習函數(shù),針對各種硬件內(nèi)核(目前為 Cortex-A 和 Mali GPU)進行了優(yōu)化
CMSIS-NN 低級別 NN 函數(shù),針對 Cortex-M CPU 進行了優(yōu)化
平臺 包含多個內(nèi)核和內(nèi)核類型(例如 CPU、GPU,今后還有 Arm 機器學習處理器)

Arm NN SDK 概覽(首次發(fā)布版本)

您可能已經(jīng)注意到,Arm NN 的一個關鍵要求是Compute Library,它包含一系列低級別機器學習和計算機視覺函數(shù),面向Arm Cortex-ACPU 和Arm Mali GPU。我們的目標是讓這個庫匯集針對這些函數(shù)的一流優(yōu)化,近期的優(yōu)化已經(jīng)展示了顯著的性能提升 – 比同等 OpenCV 函數(shù)提高了 15 倍甚至更多。如果您是Cortex-MCPU 的用戶,現(xiàn)在還有一個機器學習原語庫 – 也就是近期發(fā)布的CMSIS-NN。

CMSIS-NN 是一系列高效神經(jīng)網(wǎng)絡內(nèi)核的集合,其開發(fā)目的是最大程度地提升神經(jīng)網(wǎng)絡的性能,減少神經(jīng)網(wǎng)絡在面向智能物聯(lián)網(wǎng)邊緣設備的 Arm Cortex-M 處理器內(nèi)核上的內(nèi)存占用。Arm開發(fā)這個庫的目的是全力提升這些資源受限的 Cortex CPU 上的神經(jīng)網(wǎng)絡推理性能。借助基于 CMSIS-NN 內(nèi)核的神經(jīng)網(wǎng)絡推理,運行時/吞吐量和能效可提升大約 5 倍。

主要優(yōu)勢

有了 Arm NN,開發(fā)人員可以即時獲得一些關鍵優(yōu)勢:

更輕松地在嵌入式系統(tǒng)上運行 TensorFlow 和 Caffe

Compute Library 內(nèi)部的一流優(yōu)化函數(shù),讓用戶輕松發(fā)揮底層平臺的強大性能

無論面向何種內(nèi)核類型,編程模式都是相同的

現(xiàn)有軟件能夠自動利用新硬件特性

與 Compute Library 相同,Arm NN 也是作為開源軟件發(fā)布的,這意味著它能夠相對簡單地進行擴展,從而適應 Arm 合作伙伴的其他內(nèi)核類型。

適用于 Android 的 Arm NN

在五月舉行的 Google I/O 年會上,Google 發(fā)布了針對 Android 的 TensorFlow Lite,預示著主要新型 API 開始支持在基于 Arm 的 Android 平臺上部署神經(jīng)網(wǎng)絡。表面上,這與 Android 下的 Arm NN SDK 解決方案非常相似。使用 NNAPI 時,機器學習工作負載默認在 CPU 上運行,但硬件抽象層 (HAL) 機制也支持在其他類型的處理器或加速器上運行這些工作負載。Google 發(fā)布以上消息的同時,我們的 Arm NN 計劃也進展順利,這是為使用 Arm NN 的 Mali GPU 提供 HAL。今年晚些時候,我們還將為 Arm 機器學習處理器提供硬件抽象層。

Arm 對 Google NNAPI 的支持概覽

Arm NN 的未來發(fā)展

這只是 Arm NN 的第一步:我們還計劃添加其他高級神經(jīng)網(wǎng)絡作為輸入,對 Arm NN 調(diào)試程序執(zhí)行進一步的圖形級別優(yōu)化,覆蓋其他類型的處理器或加速器……請密切關注今年的發(fā)展!

⊙Cortex-M與機器學習|神經(jīng)網(wǎng)絡教會小怪物走路

⊙機器學習讓拍照更智能|Arm與Facebook、Arcsoft合作開發(fā)更高性能的移動設備技術

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5089

    文章

    19169

    瀏覽量

    306772

原文標題:Arm NN:在移動和嵌入式設備上無縫構建和運行機器學習應用程序

文章出處:【微信號:Ithingedu,微信公眾號:安芯教育科技】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    人工神經(jīng)網(wǎng)絡的原理和多種神經(jīng)網(wǎng)絡架構方法

    在上一篇文章中,我們介紹了傳統(tǒng)機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經(jīng)網(wǎng)絡的原理和多種神經(jīng)網(wǎng)絡架構方法,供各位老師選擇。 01 人工
    的頭像 發(fā)表于 01-09 10:24 ?203次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡</b>架構方法

    在邊緣設備上設計和部署深度神經(jīng)網(wǎng)絡的實用框架

    ???? 機器學習和深度學習應用程序正越來越多地從云端轉(zhuǎn)移到靠近數(shù)據(jù)源頭的嵌入式設備。隨著邊緣計算市場的快速擴張,多種因素正在推動邊緣人工智
    的頭像 發(fā)表于 12-20 11:28 ?230次閱讀

    Moku人工神經(jīng)網(wǎng)絡101

    Moku3.3版更新在Moku:Pro平臺新增了全新的儀器功能【神經(jīng)網(wǎng)絡】,使用戶能夠在Moku設備上部署實時機器學習算法,進行快速、靈活的信號分析、去噪、傳感器調(diào)節(jié)校準、閉環(huán)反饋等應
    的頭像 發(fā)表于 11-01 08:06 ?340次閱讀
    Moku人工<b class='flag-5'>神經(jīng)網(wǎng)絡</b>101

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNN神經(jīng)網(wǎng)絡-車牌識別

    ,尤其適用于嵌入式設備等計算資源受限的場景。 一、LPRNet模型下載 使用cd命令進入到Demo程序路徑下,運行下載腳本,將模型程序下載過來。 cd ~/projects/rknn_model_zoo
    發(fā)表于 10-10 16:40

    【飛凌嵌入式OK3576-C開發(fā)板體驗】開箱報告

    (12Gbps)和擴展PCIe NVMe/SATA SSD固態(tài)硬盤,提供高效的數(shù)據(jù)存儲和讀取能力,滿足工控設備對大容量存儲的需求。 1.3、工業(yè)級屬性 穩(wěn)定性:核心板通過了飛凌嵌入式實驗室嚴苛的工業(yè)環(huán)境測試
    發(fā)表于 10-10 09:22

    基于MCU的神經(jīng)網(wǎng)絡模型設計

    力不從心。神經(jīng)網(wǎng)絡作為一種強大的機器學習模型,能夠提供高效的數(shù)據(jù)處理和分析能力,但其計算復雜度和資源需求往往超出了普通MCU的能力范圍。因此,設計一種適合MCU運行的神經(jīng)網(wǎng)絡模型,成為
    的頭像 發(fā)表于 07-12 18:21 ?1192次閱讀

    BP神經(jīng)網(wǎng)絡學習機制

    BP神經(jīng)網(wǎng)絡(Backpropagation Neural Network),即反向傳播神經(jīng)網(wǎng)絡,是一種基于梯度下降算法的多層前饋神經(jīng)網(wǎng)絡,其學習機制的核心在于通過反向傳播算法
    的頭像 發(fā)表于 07-10 15:49 ?691次閱讀

    BP神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的關系

    BP神經(jīng)網(wǎng)絡(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,簡稱CNN)是兩種在人工智能和機器學習
    的頭像 發(fā)表于 07-10 15:24 ?1689次閱讀

    人工神經(jīng)網(wǎng)絡與傳統(tǒng)機器學習模型的區(qū)別

    在人工智能領域,機器學習神經(jīng)網(wǎng)絡是兩個核心概念,它們各自擁有獨特的特性和應用場景。雖然它們都旨在使計算機系統(tǒng)能夠自動從數(shù)據(jù)中學習和提升,但它們在多個方面存在顯著的區(qū)別。本文將從多個維
    的頭像 發(fā)表于 07-04 14:08 ?1499次閱讀

    深度神經(jīng)網(wǎng)絡與基本神經(jīng)網(wǎng)絡的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(通常指傳統(tǒng)神經(jīng)網(wǎng)絡或前向神經(jīng)網(wǎng)絡)的區(qū)別時,我們需要從多個維度進行深入分析。這些維度包括
    的頭像 發(fā)表于 07-04 13:20 ?1016次閱讀

    如何使用神經(jīng)網(wǎng)絡進行建模和預測

    神經(jīng)網(wǎng)絡是一種強大的機器學習技術,可以用于建模和預測變量之間的關系。 神經(jīng)網(wǎng)絡的基本概念 神經(jīng)網(wǎng)絡是一種受人腦啟發(fā)的計算模型,由大量的節(jié)點(
    的頭像 發(fā)表于 07-03 10:23 ?815次閱讀

    卷積神經(jīng)網(wǎng)絡和bp神經(jīng)網(wǎng)絡的區(qū)別

    化能力。隨著深度學習技術的不斷發(fā)展,神經(jīng)網(wǎng)絡已經(jīng)成為人工智能領域的重要技術之一。卷積神經(jīng)網(wǎng)絡和BP神經(jīng)
    的頭像 發(fā)表于 07-02 14:24 ?4600次閱讀

    神經(jīng)網(wǎng)絡架構有哪些

    神經(jīng)網(wǎng)絡架構是機器學習領域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡的運作方式,通過復雜的網(wǎng)絡結(jié)構實現(xiàn)信息的處理、存儲和傳遞。隨著深度
    的頭像 發(fā)表于 07-01 14:16 ?825次閱讀

    嵌入式系統(tǒng)發(fā)展前景?

    應用領域。隨著汽車電子化和智能化程度的不斷提高,嵌入式系統(tǒng)將在汽車控制、安全系統(tǒng)、自動駕駛等方面發(fā)揮更為重要的作用。 工智能和機器學習技術的發(fā)展為嵌入式系統(tǒng)提供了新的發(fā)展機遇。
    發(fā)表于 02-22 14:09

    嵌入式學習步驟

    開發(fā)板上測試固件以及在實際設備上進行測試。 嵌入式系統(tǒng)的多樣化發(fā)展,它將更為廣泛地應用于各個領域,實現(xiàn)智能化、網(wǎng)絡化、自動化的目標。同時,隨著人工智能和機器
    發(fā)表于 02-02 15:24