0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

結(jié)合DNN API驅(qū)動未來神經(jīng)網(wǎng)絡(luò)應(yīng)用的解決方案

電子設(shè)計 ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2018-04-03 09:13 ? 次閱讀

毫無疑問,神經(jīng)網(wǎng)絡(luò)變得越來越流行,在各式各樣的產(chǎn)品中都可以找到它的相關(guān)應(yīng)用。它們會根據(jù)你的興趣自動調(diào)整社交多媒體內(nèi)容、讓照片顯示更加好看、在AR/VR頭戴設(shè)備中增強檢測和眼球追蹤功能。

在智慧監(jiān)控領(lǐng)域,它可以應(yīng)用于安全保障、提供增強的面部識別功能、群體行為分析等。在網(wǎng)上支付系統(tǒng)中,它對于詐騙行為的檢測也比人類更加強大。神經(jīng)網(wǎng)絡(luò)也將應(yīng)用到無人駕駛汽車系統(tǒng)中,借以避免碰撞事故的發(fā)生,實現(xiàn)無人機運送包裹,此外最近比較受大家關(guān)注的就是以臉部辨識來解鎖手機了。

神經(jīng)網(wǎng)絡(luò)專用硬體需求高

為了能夠?qū)崿F(xiàn)如此眾多的功能,神經(jīng)網(wǎng)絡(luò)首先需要經(jīng)過訓(xùn)練,這通常需要強大的伺服器硬體提供支援。物體識別的實現(xiàn)其實就是不斷地進行推斷和對比,而且需要即時的方式來完成。當(dāng)然神經(jīng)網(wǎng)絡(luò)越大,需要的運算量就越大,也需要更高水準(zhǔn)的性能支援,尤其在行動應(yīng)用方面。盡管神經(jīng)網(wǎng)絡(luò)推斷引擎可以在CPU上運行,但是它們通常采用GPU,利用其強大的平行運算特性,以求更快處理神經(jīng)網(wǎng)絡(luò)運算。然而為了在嚴(yán)格的功耗下滿足下一代性能要求,專用的神經(jīng)網(wǎng)絡(luò)加速硬體則是必需的。

這對硬體來說是一個自然演進過程。從早期的桌面PC游戲到街機游戲機,到后來的家庭游戲機以及移動設(shè)備端等,PowerVR一直都與圖形技術(shù)密切相關(guān),除此之外,PowerVR還擁有包括電腦視覺和AI應(yīng)用的系列IP產(chǎn)品。原本早期的桌面處理器甚至沒有整合數(shù)學(xué)運算輔助處理器模組,無法在游戲類應(yīng)用軟體中提供浮點數(shù)運算加速功能,然后自20世紀(jì)80年代這種功能已經(jīng)成為CPU設(shè)計的標(biāo)準(zhǔn)。在20世紀(jì)90年代以后,CPU整合了記憶體快取以進一步提升性能,不久GPU也被整合于其中。隨后在2010年代出現(xiàn)了專用于編解碼的ISP(圖像訊號處理)和硬體設(shè)備,以實現(xiàn)流暢的視訊重播?,F(xiàn)在輪到神經(jīng)網(wǎng)絡(luò)擁有專用的晶片了(圖1)。

邊緣運算盼來專用晶片神經(jīng)網(wǎng)絡(luò)加速器進駐行動終端

圖1 嵌入式系統(tǒng)的演進

將神經(jīng)網(wǎng)絡(luò)運算轉(zhuǎn)移到終端

2017年9月21日PowerVR在中國首發(fā)一項全新的IP產(chǎn)品—硬體神經(jīng)網(wǎng)絡(luò)加速器PowerVR 2NX。命名為神經(jīng)網(wǎng)絡(luò)加速器(NNA),乃是基于其能夠支援多種神經(jīng)網(wǎng)絡(luò)模型和架構(gòu)以及機器學(xué)習(xí)框架,并具備高性能和低功耗特性。

在很多案例中,神經(jīng)網(wǎng)絡(luò)的推斷處理過程是放在云端伺服器強大的硬體上來執(zhí)行的,但是由于多種原因這部分工作現(xiàn)在需要轉(zhuǎn)移到終端硬體設(shè)備上來,有些應(yīng)用必須要快速的回應(yīng)。由于延遲問題,通過網(wǎng)絡(luò)運行神經(jīng)網(wǎng)絡(luò)是不切實際的,轉(zhuǎn)移到終端設(shè)備上來能夠消除可能發(fā)生的安全問題。況且蜂巢網(wǎng)絡(luò)(3G、4G、5G)也不是在任何情況下都可行,終端專用的硬體設(shè)備則更加可靠,除了能夠提供更強大的性能,還能大幅減少系統(tǒng)功耗。

舉個例子,無人機的飛行速度一般會超過150mph(67公尺/秒),沒有硬體的情況下,它需要檢測前面10~15公尺范圍內(nèi)的障礙物以避免碰撞(圖2)。由于延遲、頻寬和網(wǎng)絡(luò)的可靠性等因素,采用云端伺服器的方式在運作上會出現(xiàn)問題。采用終端硬體解決方案比如PowerVR 2NX,無人機可以運行多個神經(jīng)網(wǎng)絡(luò),能夠在1米范圍內(nèi)即時識別和追蹤前方的障礙物。如果想借助無人機傳遞包裹或者以獨特的視角觀看各種體育運動,神經(jīng)網(wǎng)絡(luò)硬體輔助則必不可少。

圖2 無人機就是一個案例,采用神經(jīng)網(wǎng)絡(luò)硬體加速可實現(xiàn)更快更高效的碰撞檢測。

如今智慧手機保存了太多我們的照片,一般會有1,000張或者更多,手機系統(tǒng)可以采用不同的方式自動進行排序,比如識別出包含某個人的所有照片,這個過程需要大量的分析運算,一款旗艦級的GPU運行神經(jīng)網(wǎng)絡(luò)處理過程可能需要60秒,但是采用PowerVR 2NX則僅需要2秒鐘(圖3)。

圖3 PowerVR 2NX能夠為行動設(shè)備提供高速的圖片處理功能,同時保持低功耗。

同時還要考慮電池使用時間。GPU處理大約2,400張照片會使用1%的電量,而消耗同樣的電量PowerVR 2NX能夠處理大約428,000張圖片。低功耗特性支援更多新的應(yīng)用場景,比如智慧監(jiān)控。2NX能支援采用終端硬體平臺進行分析處理,比如部署在城市中心、體育場內(nèi)的攝影機或者智慧家庭安全系統(tǒng)等都有其相關(guān)應(yīng)用。因為2NX支援不同的網(wǎng)絡(luò)類型,可以做出更智慧的決策,減低了錯誤發(fā)生的機率。由于其低功耗特性,這些攝影機都可以采用電池驅(qū)動,方便了部署和管理。

靈活的位元數(shù)支援

為了支援不同的應(yīng)用案例,2NX NNA進行了全面的設(shè)計,支援高效的神經(jīng)網(wǎng)絡(luò)推理過程。是什么讓2NX硬體加速器有別于其他的神經(jīng)網(wǎng)絡(luò)解決方案(DSP/GPU)?首先2NX超低功耗利用了在行動平臺設(shè)計方面的經(jīng)驗,第二個是靈活的位元數(shù)支援,更重要的是每個推理層都具備此特性。神經(jīng)網(wǎng)絡(luò)訓(xùn)練通常采用32位元全精度,但是這樣無疑會需要更高的頻寬、更多的功耗,這對于行動設(shè)備的功耗要求顯然是不允許的,盡管硬體設(shè)備有足夠的性能支援神經(jīng)網(wǎng)絡(luò)的運作,但這對電池的使用壽命會有很大的沖擊。

為了解決這個問題,2NX為權(quán)重和資料提供可變的位元數(shù)支援,這樣就能夠在保持較高推理精度的同時大大降低對頻寬的要求,功耗要求也隨之減少。

與其他解決方案不同,其降低位元數(shù)要求并不是采用硬性的方法,而是在每個分層都可以靈活配置權(quán)重和資料的位元寬,因此開發(fā)者可以全面優(yōu)化訓(xùn)練網(wǎng)絡(luò)的性能。而且不光要保持精度還要保持精確性,最終得以在更低的頻寬和功耗的情況下提供更高的性能(圖4)。

邊緣運算盼來專用晶片神經(jīng)網(wǎng)絡(luò)加速器進駐行動終端

圖4 PowerVR 2NX神經(jīng)網(wǎng)絡(luò)加速器實現(xiàn)靈活的配置權(quán)重和精度

實際上2NX需要的頻寬僅是其他競爭解決方案的25%左右,在某些應(yīng)用場景從8位元位寬降低到4位元位寬精度,2NX消耗的功耗則降為69%,但是精確度的降低卻不足1%。

強化必要性能

最近某個智慧手機制造商宣布其硬體平臺支援人臉檢測并可用于解鎖手機,相當(dāng)于每秒6,000億次的推理操作。PowerVR 2NX單核IP運作在保守頻率800MHz,能提供2,048 MACs/cycle(產(chǎn)業(yè)標(biāo)準(zhǔn)性能指標(biāo))操作,意味著每秒3.2萬億次推理操作—相當(dāng)于最有競爭力的對手的兩倍。2NX是一個高度可擴充的解決方案,如果需要更高的性能,則可以使用更多的核心。

2NX非常強大,在非常小的面積上能夠提供業(yè)界最高的推理/mm2指標(biāo)。實際上在SoC中,PowerVR GPU結(jié)合NNA的解決方案,相比競爭對手純GPU解決方案占用更少的晶片面積,當(dāng)然2NX可以單獨使用,不必結(jié)合GPU,CPU也僅僅是用于驅(qū)動。

2NX IP同樣具備儲存管理單元(MMU),可以應(yīng)用于Android和其他復(fù)雜的作業(yè)系統(tǒng)(OS)中,而且不需要整合額外的晶片或者其他復(fù)雜的軟體。

支援不同網(wǎng)絡(luò)類型/模型/框架/ API

神經(jīng)網(wǎng)絡(luò)涉及各種各樣的形式和特性,如何選用很大程度上依賴于要實現(xiàn)的系統(tǒng)功能。2NX NNA支援多種形式的神經(jīng)網(wǎng)絡(luò),包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多層感知器(MLP)、遞回神經(jīng)網(wǎng)絡(luò)(RNN)和SSD物體檢測框架。目前2NX支援主要的神經(jīng)網(wǎng)絡(luò)框架,比如Caffe和TensorFlow,對于其他框架的支援也在持續(xù)開發(fā)中(圖5)。

邊緣運算盼來專用晶片神經(jīng)網(wǎng)絡(luò)加速器進駐行動終端

圖5 PowerVR 2NX于神經(jīng)網(wǎng)絡(luò)運算架構(gòu)中的位置

使用優(yōu)化轉(zhuǎn)換和調(diào)優(yōu)工具,結(jié)合深度神經(jīng)網(wǎng)絡(luò)(DNN)API,開發(fā)者能夠快速部署他們所選擇的網(wǎng)絡(luò)框架并且運行PowerVR NNA加速器。PowerVR長久以來一直在支援Android系統(tǒng),當(dāng)Google發(fā)布Android神經(jīng)網(wǎng)絡(luò)API后,2NX也將全面支援。當(dāng)然開發(fā)者也可以采用現(xiàn)在的工作流程開發(fā)行動App原型,然后使用DNN API與2NX進行配對,實現(xiàn)應(yīng)用系統(tǒng)加速和功耗降低。

隨著我們的世界與電腦的關(guān)系越來越密切,機器也會更加地理解這個世界,PowerVR 2NX NNA代表的是神經(jīng)網(wǎng)絡(luò)加速和性能的一個轉(zhuǎn)捩點,具有在產(chǎn)業(yè)內(nèi)最高的「推理/milliwatt」和「推理/mm2」性能指標(biāo),能夠滿足在行動硬體平臺部署神經(jīng)網(wǎng)絡(luò)之功耗和性能約束條件的IP解決方案。除此之外PowerVR NNA還支援主要的神經(jīng)網(wǎng)絡(luò)和框架,結(jié)合DNN API使得PowerVR 2NX成為驅(qū)動未來神經(jīng)網(wǎng)絡(luò)應(yīng)用的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4776

    瀏覽量

    100934
  • 面部識別
    +關(guān)注

    關(guān)注

    1

    文章

    375

    瀏覽量

    26662
  • powervr
    +關(guān)注

    關(guān)注

    0

    文章

    98

    瀏覽量

    31085
收藏 人收藏

    評論

    相關(guān)推薦

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機器學(xué)習(xí)的基礎(chǔ)知識和多種算法。在本文中,我們會介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡(luò) ? 人工神經(jīng)網(wǎng)絡(luò)模型之所
    的頭像 發(fā)表于 01-09 10:24 ?174次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    深度神經(jīng)網(wǎng)絡(luò)在雷達系統(tǒng)中的應(yīng)用

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)在雷達系統(tǒng)中的應(yīng)用近年來取得了顯著進展,為雷達信號處理、目標(biāo)檢測、跟蹤以及識別等領(lǐng)域帶來了革命性的變化。以下將詳細探討深度神經(jīng)網(wǎng)絡(luò)在雷達系統(tǒng)中的應(yīng)用,包括其優(yōu)勢、具
    的頭像 發(fā)表于 07-15 11:09 ?787次閱讀

    BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是兩種在人工智能和機器學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 07-10 15:24 ?1644次閱讀

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的區(qū)別

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡稱ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一個基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及未來
    的頭像 發(fā)表于 07-10 15:20 ?1192次閱讀

    深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu)解析與優(yōu)化策略

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)作為機器學(xué)習(xí)領(lǐng)域中的一種重要技術(shù),以其強大的特征學(xué)習(xí)能力和非線性建模能力,在多個領(lǐng)域取得了顯著成果。DNN的核心在于其多層結(jié)構(gòu),通過
    的頭像 發(fā)表于 07-09 11:00 ?2020次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
    的頭像 發(fā)表于 07-05 09:52 ?602次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)

    遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)實際上是同一個概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?821次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩種非常重要的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 14:24 ?1385次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指傳統(tǒng)神經(jīng)網(wǎng)絡(luò)或前向神經(jīng)網(wǎng)絡(luò))的區(qū)別時,我們需要從多個維度進行深入分析。這些維度包括
    的頭像 發(fā)表于 07-04 13:20 ?988次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡(luò))是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法來調(diào)整網(wǎng)絡(luò)中的權(quán)重和偏置,以達到最小化誤差的
    的頭像 發(fā)表于 07-03 11:00 ?842次閱讀

    神經(jīng)網(wǎng)絡(luò)擬合的誤差怎么分析

    像識別、自然語言處理和時間序列預(yù)測等。然而,神經(jīng)網(wǎng)絡(luò)的擬合誤差是一個關(guān)鍵問題,影響模型的性能和泛化能力。本文將從多個角度分析神經(jīng)網(wǎng)絡(luò)擬合誤差的原因、影響因素和解決方案。 神經(jīng)網(wǎng)絡(luò)基本原
    的頭像 發(fā)表于 07-03 10:36 ?634次閱讀

    BP神經(jīng)網(wǎng)絡(luò)屬于DNN

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,簡稱DNN)則是指具有多個隱藏層的神經(jīng)網(wǎng)絡(luò),可以處理復(fù)雜的數(shù)據(jù)和任務(wù)。那么,BP神經(jīng)網(wǎng)絡(luò)是否屬于
    的頭像 發(fā)表于 07-03 10:18 ?824次閱讀

    bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)是一種常見的前饋神經(jīng)網(wǎng)絡(luò),它使用反向傳播算法來訓(xùn)練網(wǎng)絡(luò)。雖然BP神經(jīng)網(wǎng)絡(luò)在某些方面與深度
    的頭像 發(fā)表于 07-03 10:14 ?891次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是兩種不同類型的人工神經(jīng)網(wǎng)絡(luò),它們在
    的頭像 發(fā)表于 07-03 10:12 ?1276次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)和BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Networks,簡稱BPNN)是兩種
    的頭像 發(fā)表于 07-02 14:24 ?4470次閱讀