0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高效打包邊緣人工智能神經網絡模型

CEVA ? 來源:未知 ? 2023-11-09 10:15 ? 次閱讀

嵌入式設計中常常需要將應用程序打包到有限的片上內存中,現在,將人工智能神經網絡模型壓縮到有限的存儲器中也是如此。對于傳統(tǒng)軟件,就某些方面而言,做到這一點可謂更具挑戰(zhàn),因為基于神經網絡的系統(tǒng)中的工作內存都是“內部循環(huán)”的,要求換出到DDR內存,可能會降低性能。另外,在推理過程中重復訪問DDR也會增加邊緣設備的典型低功耗預算,這一點也同樣很難令人滿意。更大的片上存儲器是解決問題方法之一,但是會增加產品成本。綜上所述,最佳解決方案是盡可能高效地將模型打包到可用內存中。

眾所周知,在編譯人工智能神經網絡模型以便在邊緣設備上運行時,有一些量化技術可以縮小此模型的大小,如將浮點數據和權重值轉換為定點,然后進一步縮小為INT8或更小的值。想象一下,如果還能更進一步會怎樣。在本文中,我將介紹幾種圖優(yōu)化技術,助您在2MB的二級緩存中安裝更多量化模型,但僅僅量化是無法完成安裝的。

優(yōu)化人工智能神經網絡圖中的緩沖區(qū)分配

wKgaomVMQdOAfJPPAACmlCKXd8g725.png

▲圖1.一個簡單的人工智能圖

(Op代表運算符;E代表外部輸入;

C代表常數(權重);V代表變量;T代表張量)

人工智能神經網絡模型表示為圖形并作為圖形來管理,其中的運算是通過緩沖區(qū)相互連接的節(jié)點進行的。這些緩沖區(qū)固定分配在內存中,大小在編譯圖時確定,用于保存圖中的中間計算結果或輸入和輸出。在所有圖中,流水關系圖是最基本的一種,但更典型的簡單圖如圖1所示。

我們的目標是讓編譯器優(yōu)化緩沖區(qū)內存總需求。想想簡單的人工智能神經網絡圖中可能的分配序列(圖2中的左圖)。首先要明白,圖中的不同運算需要不同大小的緩沖區(qū),并且在進行下一波處理之前,將不再需要已完成運算的輸入緩沖區(qū)。讀取緩沖區(qū)A(此處分配有800K字節(jié)),就可以在后續(xù)運算中重復使用了,緩沖區(qū)B也是如此,依此類推。在左圖出現分支時,先將緩沖區(qū)A和B分配給了右側分支,之后則必須為左側分支分配一個新的緩沖區(qū)C。

wKgaomVMQdOAMcq5AABxXZ4kfzw357.jpg

▲圖2.說明緩沖區(qū)分配的簡單圖

(右圖在左圖的基礎上,將緩沖區(qū)B和C互換

并增加了緩沖區(qū)B的大小,得到了改善)

從這個例子中不難看出,一開始就將緩沖區(qū)B的大小增加到1000K,稍后再在左側分支中重復使用B的全部大小,右側分支中緩沖區(qū)C就只需要額外10K內存,如右圖所示。左/右內存需求差異明顯。左圖需要2.5MB (800K+700K+1000K),而修改順序后的右圖只需要 1.81MB(800K+1000K+10K)。

在一般人工智能神經網絡圖中找出最優(yōu)排序就是眾所周知的0-1背包問題。我們展開了初步測試,研究這種優(yōu)化如何改善打包到固定大小L2緩存的效果。即使是當下初步階段,結果也相當不錯。我們測試了幾種常見網絡在2MB和4MB L2緩存中的安裝效果。優(yōu)化前,只有13%的模型可以安裝在2MB內存中,38%的模型可以安裝在4MB內存中。優(yōu)化后,66%的模型可以安裝在2MB內存中,83%的模型可以安裝在4MB內存中。僅這一項優(yōu)化就值得我們努力,我們的目標是確保更多模型可以完全在片上內存中運行。

通過合并緩沖區(qū)優(yōu)化人工智能神經網絡模型

在卷積人工智能神經網絡模型中,經過前幾層處理后,緩沖區(qū)大小通常會縮小。這種結果表明,一開始分配的大緩沖區(qū)可以通過與稍后需要的較小緩沖區(qū)共享空間得到更高效的利用。圖3說明了這種可能性。

wKgaomVMQdSAckvDAABjXjMxhDI560.jpg

▲圖3.不同的簡單圖

(最初為緩沖區(qū)A分配的大小可以稍后由左右分支共享,

此處的C緩沖區(qū)源自最初的A緩沖區(qū))

我們試著進行優(yōu)化,看看這種合并對內存總需求有何影響。在一系列無比熟悉的網絡中,我們發(fā)現緩沖區(qū)總大小減小了15%到35%。再次重申一遍,這些改進非常具有吸引力。

?

要點

?

我們通過這些優(yōu)化,運行各種主流卷積人工智能神經網絡模型,從檢測到分類到細分,再到RNN模型不一而足。大多數情況下,模型完全遷移至了4MB二級緩存,某些情況下,模型遷移至了二級緩存中,只有一部分還留在DDR內存中。幾乎所有模型都在打包方面呈現出巨大改進。

即使你的人工智能神經網絡模型無法安裝在片上內存,也并非無法優(yōu)化。在人工智能編譯器階段可以對緩沖區(qū)進行優(yōu)化,大幅壓縮模型總大小。在CEVA,我們很樂意與你討論以上問題和其他想法,以便進一步優(yōu)化人工智能神經網絡模型的內存使用。

識別右側二維碼

立即了解CEVA

更多信息

wKgaomVMQdSAUrT4AAFqtfxSXaM346.png ?

本文作者:Rami Drucker, Machine Learning SW Architect, CEVA


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • CEVA
    +關注

    關注

    1

    文章

    189

    瀏覽量

    76387

原文標題:高效打包邊緣人工智能神經網絡模型

文章出處:【微信號:CEVA-IP,微信公眾號:CEVA】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    人工神經網絡的原理和多種神經網絡架構方法

    在上一篇文章中,我們介紹了傳統(tǒng)機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經網絡的原理和多種神經網絡架構方法,供各位老師選擇。 01 人工
    的頭像 發(fā)表于 01-09 10:24 ?864次閱讀
    <b class='flag-5'>人工</b><b class='flag-5'>神經網絡</b>的原理和多種<b class='flag-5'>神經網絡</b>架構方法

    邊緣設備上設計和部署深度神經網絡的實用框架

    ,以及由強大而高效的軟件工具鏈補充的低成本邊緣設備的可用性。此外,需要避免通過網絡傳輸數據——無論是出于安全原因還是僅僅為了盡量減少通信成本。 邊緣人工智能涵蓋廣泛的設備、傳感器、微控
    的頭像 發(fā)表于 12-20 11:28 ?651次閱讀

    BP神經網絡和卷積神經網絡的關系

    BP神經網絡(Backpropagation Neural Network)和卷積神經網絡(Convolutional Neural Network,簡稱CNN)是兩種在人工智能和機器學習領域
    的頭像 發(fā)表于 07-10 15:24 ?2132次閱讀

    人工神經網絡模型包含哪些層次

    人工神經網絡(Artificial Neural Network,ANN)是一種模擬人腦神經網絡的計算模型,具有自適應、自學習、泛化能力強等特點。本文將詳細介紹
    的頭像 發(fā)表于 07-05 09:17 ?1016次閱讀

    人工神經網絡模型的分類有哪些

    人工神經網絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經元網絡的計算模型,它在許多領域,如圖像識別、語音識別、自然語言處理、預測分析等有著廣泛
    的頭像 發(fā)表于 07-05 09:13 ?1964次閱讀

    人工智能神經網絡系統(tǒng)的特點

    人工智能神經網絡系統(tǒng)是一種模擬人腦神經網絡結構和功能的計算模型,具有高度的自適應性、學習能力和泛化能力。本文將介紹人工智能
    的頭像 發(fā)表于 07-04 09:42 ?776次閱讀

    人工智能神經網絡模型有哪些

    人工智能神經網絡模型是一類受人腦啟發(fā)的計算模型,它們在許多領域都取得了顯著的成功。以下是一些常見的神經網絡
    的頭像 發(fā)表于 07-04 09:41 ?1025次閱讀

    人工智能人工神經網絡有什么區(qū)別

    人工智能是一門研究如何使計算機模擬人類智能行為的學科。它起源于20世紀40年代,當時計算機科學家們開始嘗試開發(fā)能夠模擬人類思維過程的計算機程序。人工智能的目標是通過計算機程序實現對人類智能
    的頭像 發(fā)表于 07-04 09:39 ?1987次閱讀

    人工智能神經網絡的結構是什么

    人工智能神經網絡是一種模擬人腦神經網絡的計算模型,其結構和功能非常復雜。 引言 人工智能神經網絡
    的頭像 發(fā)表于 07-04 09:37 ?918次閱讀

    人工智能神經網絡的工作原理是什么

    人工智能神經網絡的工作原理是一個復雜且深入的話題,涉及到多個領域的知識,包括數學、計算機科學、生物學等。 神經網絡的基本概念 神經網絡是一種受人腦結構啟發(fā)的計算
    的頭像 發(fā)表于 07-04 09:35 ?1271次閱讀

    人工智能神經網絡芯片的介紹

    : 概述 人工智能神經網絡芯片是一種新型的處理器,它們基于神經網絡的計算模型,通過模擬人腦神經元的連接和交互方式,實現對數據的
    的頭像 發(fā)表于 07-04 09:33 ?1220次閱讀

    神經網絡人工智能的關系是什么

    神經網絡人工智能的關系是密不可分的。神經網絡人工智能的一種重要實現方式,而人工智能則是神經網絡
    的頭像 發(fā)表于 07-03 10:25 ?1803次閱讀

    卷積神經網絡和bp神經網絡的區(qū)別

    化能力。隨著深度學習技術的不斷發(fā)展,神經網絡已經成為人工智能領域的重要技術之一。卷積神經網絡和BP神經
    的頭像 發(fā)表于 07-02 14:24 ?5700次閱讀

    人工神經網絡模型及其應用有哪些

    ,人工神經網絡已經發(fā)展成為機器學習和人工智能領域的重要技術之一。本文將詳細介紹人工神經網絡模型
    的頭像 發(fā)表于 07-02 10:04 ?1541次閱讀

    神經網絡人工智能的關系

    在快速發(fā)展的科技領域,人工智能(Artificial Intelligence, AI)和神經網絡(Neural Networks)是兩個備受矚目的概念。它們之間的聯系緊密而復雜,共同推動了智能
    的頭像 發(fā)表于 07-01 14:23 ?1443次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品