0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

邊緣AI的模型壓縮技術

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Rakesh R. Nakod ? 2022-10-19 14:22 ? 次閱讀

深度學習在模型及其數據集方面正在以驚人的速度增長。在應用方面,深度學習市場以圖像識別為主,其次是光學字符識別,以及面部和物體識別。根據 Allied 的市場調查,2020 年全球深度學習市場規(guī)模為 68.5 億美元,預計到 2030 年將達到 1799.6 億美元,從 2021 年到 2030 年的復合年增長率為 39.2%。

在某個時間點,人們認為大型和復雜的模型表現更好,但現在它幾乎是一個神話。隨著邊緣AI的發(fā)展,越來越多的技術將大型復雜模型轉換為可以在邊緣上運行的簡單模型,所有這些技術結合在一起執(zhí)行模型壓縮。

什么是模型壓縮?

模型壓縮是在具有低計算能力和內存的邊緣設備上部署SOTA(最先進的)深度學習模型的過程,而不會影響模型在準確性,精度,召回性等方面的性能。模型壓縮廣泛地減少了模型中的兩件事,即大小和延遲。大小減小側重于通過減少模型參數使模型更簡單,從而減少執(zhí)行中的 RAM 要求和內存中的存儲要求。減少延遲是指減少模型進行預測或推斷結果所花費的時間。模型大小和延遲通常是一起的,大多數技術都會減少兩者。

流行的模型壓縮技術

修剪:

修剪是模型壓縮的最流行的技術,它通過刪除冗余和無關緊要的參數來工作。神經網絡中的這些參數可以是連接器、神經元、通道,甚至是層。它很受歡迎,因為它同時減小了模型的大小并改善了延遲。

pYYBAGNPl6-AZ2uZAAGw_oTIvEs500.png

修剪

修剪可以在訓練模型時或在訓練后完成。有不同類型的修剪技術,包括重量/連接修剪,神經元修剪,過濾器修剪和層修剪。

量化:

當我們在修剪中移除神經元,連接,過濾器,層等以減少加權參數的數量時,權重的大小在量化過程中減小。在此過程中,較大集中的值將映射到較小集中的值。與輸入網絡相比,輸出網絡的值范圍較窄,但保留了大部分信息。

知識提煉:

在知識提煉過程中,一個復雜而大型的模型在一個非常大的數據集上被訓練。微調大型模型后,它可以很好地處理看不見的數據。一旦實現,這些知識就會轉移到較小的神經網絡或模型中。同時使用教師網絡(較大模型)和學生網絡(較小模型)。這里存在兩個方面,知識提煉,其中我們不調整教師模型,而在遷移學習中,我們使用確切的模型和權重,在一定程度上改變模型,并針對相關任務進行調整。

poYBAGNPl7aAcED2AAB8DjxHRCw852.png

知識蒸餾系統(tǒng)

知識、蒸餾算法和師生架構模型是典型知識蒸餾系統(tǒng)的三個主要部分,如上圖所示。

低矩陣分解:

矩陣構成了大多數深度神經架構的大部分。該技術旨在通過應用矩陣或張量分解并將它們變成更小的矩陣來識別冗余參數。當應用于密集 DNN(深度神經網絡)時,此技術可降低 CNN(卷積神經網絡)層的存儲要求和因式分解,并縮短推理時間。具有二維且具有秩 r 的權重矩陣 A 可以分解為更小的矩陣,如下所示。

poYBAGNPl72AUTPYAABK48-5WA8433.png

低矩陣因式分解

模型準確性和性能在很大程度上取決于正確的因式分解和秩選擇。低秩因式分解過程中的主要挑戰(zhàn)是更難實現,并且計算密集型??傮w而言,與全秩矩陣表示相比,密集層矩陣的因式分解可導致更小的模型和更快的性能。

由于邊緣AI,模型壓縮策略變得非常重要。這些方法相互補充,可以在整個AI管道的各個階段使用。像張量流和Pytorch這樣的流行框架現在包括修剪和量化等技術。最終,該領域使用的技術數量將會增加。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 連接器
    +關注

    關注

    98

    文章

    14635

    瀏覽量

    136964
  • RAM
    RAM
    +關注

    關注

    8

    文章

    1369

    瀏覽量

    114859
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121382
收藏 人收藏

    評論

    相關推薦

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    并非易事,它涉及到從選擇合適的算法架構到針對特定硬件平臺進行優(yōu)化等一系列復雜的工作。 接下來,我們將詳細介紹如何在資源受限的邊緣設備上成功部署目標檢測模型,探索其背后的原理和技術,并討論解決該領域內常見
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設備的奇妙之旅:如何在邊緣端部署OpenCV

    識別、分類、跟蹤、場景重建等。這可能涉及到機器學習和深度學習模型的應用。 簡而言之,圖像處理是計算機視覺的基礎,提供了必要的工具和技術來預處理和優(yōu)化圖像數據;而計算機視覺則是在此基礎之上,通過更加復雜
    發(fā)表于 12-14 09:31

    AI模型部署邊緣設備的奇妙之旅:如何實現手寫數字識別

    系統(tǒng)的智能化水平,還極大地拓展了其應用范圍, 使得嵌入式系統(tǒng)在智能家居、智能交通、智能醫(yī)療等領域有了更深層次的運用。AI技術的嵌入,已經成為未來嵌入式系統(tǒng)發(fā)展 的一個重要趨勢。踏入邊緣端部署的第一步
    發(fā)表于 12-06 17:20

    AI模型托管原理分析

    AI模型托管是指將訓練好的AI模型部署在云端或邊緣服務器上,由第三方平臺提供模型運行、管理和優(yōu)化
    的頭像 發(fā)表于 11-07 09:33 ?225次閱讀

    云天勵飛邊緣AI推動大模型規(guī)?;瘧寐涞?/a>

    2024年毫無疑問是大模型應用落地元年,面對靈活多變的任務和復雜的場景環(huán)境,用邊緣AI打造低成本、高效能、強落地的大模型應用是關鍵。
    的頭像 發(fā)表于 09-18 14:59 ?449次閱讀

    云知聲在邊緣側大模型技術探索和應用

    ? 隨著人工智能技術的飛速發(fā)展,汽車行業(yè)正從“軟件定義汽車”向“AI定義汽車”的新時代邁進。如何將大模型技術更深入地整合到車載系統(tǒng)中,以實現更高效、更低成本的智能化解決方案,正成為眾多
    的頭像 發(fā)表于 06-29 15:30 ?867次閱讀

    “從無處不在到無人不用”,大模型推動邊緣計算變革的機遇與挑戰(zhàn)

    《從云到端 AI觸手可及》2024年芯原AI專題技術研討會上,芯原執(zhí)行副總裁、IP事業(yè)部總經理戴偉進作了“大模型推動邊緣計算變革的機遇與挑戰(zhàn)
    的頭像 發(fā)表于 06-18 16:11 ?1152次閱讀
    “從無處不在到無人不用”,大<b class='flag-5'>模型</b>推動<b class='flag-5'>邊緣</b>計算變革的機遇與挑戰(zhàn)

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計算盒子詳解

    的解決方案。AI邊緣盒子的主要用途在于利用邊緣計算和人工智能技術,在數據產生源頭附近即時處理數據,提供低延遲和高響應性能。例如,在智慧工地上,AI
    的頭像 發(fā)表于 05-29 14:24 ?1041次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計算盒子詳解

    STM CUBE AI錯誤導入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 05-27 07:15

    部署在邊緣設備上的輕量級模型

    的地方進行智能決策和數據處理。 ? 邊緣AI 算法通常是經過優(yōu)化和壓縮的輕量級模型 ? 邊緣AI
    的頭像 發(fā)表于 05-11 00:17 ?2649次閱讀

    NVIDIA與恩智浦聯手,在邊緣設備上部署AI模型

    恩智浦工業(yè)及IoT邊緣高級副總裁Charles Dachs表示,人工智能的創(chuàng)新將塑造智能互聯世界的未來,融入Nvidia先進的AI培訓技術以及恩智浦在工業(yè)及物聯網邊緣科研實力,將產生協
    的頭像 發(fā)表于 03-25 16:05 ?931次閱讀

    cubemx ai導入onnx模型壓縮失敗了怎么解決?

    cubemx ai導入onnx模型壓縮失敗。請問我怎么解決
    發(fā)表于 03-19 07:58

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 03-14 07:09

    NanoEdge AI技術原理、應用場景及優(yōu)勢

    能耗并提高數據安全性。本文將對 NanoEdge AI技術原理、應用場景以及優(yōu)勢進行綜述。 1、技術原理 NanoEdge AI 的核心技術
    發(fā)表于 03-12 08:09

    什么是AI邊緣計算,AI邊緣計算的特點和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是將人工智能技術引入
    的頭像 發(fā)表于 02-01 11:42 ?955次閱讀