0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你知道TinyML運(yùn)行效能誰說了算嗎?

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2023-08-03 16:06 ? 次閱讀

AI芯片或神經(jīng)加速處理器(Neural Network Processing Unit, NPU或Deep Learning Accelerator, DLA)領(lǐng)域中,大家也都說自家的芯片世界最棒,對(duì)手看不到車尾燈,難道沒有一個(gè)較為公正衡量芯片運(yùn)行(推論)效能,就像手機(jī)跑分軟件一樣,讓大家比較信服的基準(zhǔn)嗎?

其實(shí)在AI芯片領(lǐng)域中所謂的「效能」,可能因關(guān)心的重點(diǎn)不同而會(huì)有不同定義和解讀。分別可從硬件每秒可執(zhí)行乘加的次數(shù)(又可細(xì)分FP32,FP16及INT8等)、對(duì)于特定模型在指定推論精度下每秒可執(zhí)行次數(shù)或推論一次所需時(shí)間(包含有無模型優(yōu)化處理)、特定模型推論功耗(推論一次耗費(fèi)焦耳數(shù))、每瓦特可執(zhí)行乘加指令次數(shù)及其它特定規(guī)范時(shí)的表現(xiàn),甚至有用每塊美金獲得算力來當(dāng)成基準(zhǔn)。所以常會(huì)遇到誰也不服誰,老王賣瓜自賣自夸的現(xiàn)象。

目前較被大家接受的就是ML Commons所提出的MLPerf規(guī)范,其中包含訓(xùn)練及推論兩大項(xiàng),而推論部份又可細(xì)分為數(shù)據(jù)中心(Datacenter)、邊緣(Edge)、行動(dòng)(Mobile)及微型(Tiny,大多為MCU)。前不久(2023/6/27)才剛公布了Tiny v1.1測(cè)試結(jié)果報(bào)告,接下來就幫大家解讀一下這份報(bào)告,讓大家能更了解未來單芯片運(yùn)行AI的方向及可行性。

評(píng)測(cè)場(chǎng)景及項(xiàng)目

目前ML Commons在Tiny部份先前已經(jīng)過三輪(v0.5, v0.7, v1.0)測(cè)試,此次公布的是v1.1結(jié)果。測(cè)試時(shí)分為封閉(Closed)及開放(Open)型式,前者依官方規(guī)范測(cè),而后者廠商可提出依自己規(guī)范測(cè)試更優(yōu)的結(jié)果,不過不是每輪評(píng)測(cè)都會(huì)有開放型式。

目前主要評(píng)測(cè)項(xiàng)目如Fig.1 所示,共有四個(gè)項(xiàng)目,包含關(guān)鍵詞偵測(cè)(Keyword Spoting, KS)、視覺喚醒字(Visual Wake Words, VW)、影像分類(Image Classification, IC)及異常偵測(cè)(Anomaly Detection, AD)。而每個(gè)項(xiàng)目都是采單串流數(shù)據(jù)(Single Stream)方式進(jìn)行,即推論完一筆再取下一筆進(jìn)行推論。依照不同項(xiàng)目,分別使用對(duì)應(yīng)的數(shù)據(jù)集和模型,并在指定的推論質(zhì)量下進(jìn)行評(píng)量。

wKgZomTLYEaANXFwAAFCAFJOc0s385.jpg

Fig.1 MLPerf v1.1 工作場(chǎng)景及效能評(píng)量項(xiàng)目

參與評(píng)測(cè)公司、硬件及軟件

本次參與評(píng)測(cè)的項(xiàng)目共有32項(xiàng),以下依不同項(xiàng)目分別介紹。

參與評(píng)測(cè)公司:共有10家,Krai, Nuvoton(新唐科技), STMicroelectronics(簡(jiǎn)稱STM), Skymizer(臺(tái)灣發(fā)展軟件科技), cTuning, fpgaconvnet, Plumerai, Syntiant, Robert Bosh GmbH, kai-jiang(個(gè)人)。

參與評(píng)測(cè)開發(fā)板:共有14種,規(guī)格下如下所示。

STM NUCLEO-H7A3ZI-Q, Arm Cortex-M7(DSP+FPU) @280MHz

STM NUCLEO-L4R5ZI, Arm Cortex-M4(DSP+FPU) @120MHz

STM NUCLEO-U575ZI-Q, Arm Cortex-M33(DSP+FPU) @160MHz

STM NUCLEO-G0B1RE, Arm Cortex-M0+ @64MHz

STM DISCO-F746NG, Arm Cortex-M7(DSP+FPU) @216MHz

Nordic nRF5340 DK, Arm Cortex-M33(DSP+FPU) @128MHz

Nuvoton NUMAKER-M467HJ, Arm Cortex-M4F @200MHz

DIGILENT Cora Z7, Arm Cortex-A9 @667MHz

DIGILENT ZC706, Arm Cortex-A9 @650MHz

DIGILENT ZedBoard, Arm Cortex-A9 @650MHz

DIGILENT ZyBo, Arm Cortex-A9 @650MHz

Infineon CY8CPROTO-062-4343W, Arm Cortex-M4 (DSP + FPU) @150MHz

Syntiant NDP9120, HiFi3+M0 @30.7MHz/98.7MHz

ZCU106, RISC-V @20MHz

主要CPU規(guī)格:共有7大類。只有1項(xiàng)使用RISC-V,1項(xiàng)為MCU+NPU,其余皆是Arm Based。Cortex-M為單芯片(MCU)等級(jí),Cortex-A為微處理器(MPU)等級(jí)芯片,用于手機(jī)或單板微電腦。

Arm Cortex-M0+ (1項(xiàng))

Arm Cortex-M33 (4項(xiàng))

Arm Cortex-M4/M4F (13項(xiàng))

Arm Cortex-M7 (7項(xiàng))

Arm Cortex-A9 (4項(xiàng))

Syntiant HiFi3+M0 (2項(xiàng))

RISC-V (1項(xiàng))

主要軟件及函式庫:共有9種。

Skymizer ONNC

MicroTVM

Plumerai Inference Engine

Syntiant TDK+SDK

Bosch Hardware-Aware Lowering Engine(HALE)

STM X-CUBE-AI

fpgaConvNet(Model+Optimiser)

Arm CMSIS-5

TVM

評(píng)測(cè)結(jié)果:

由于芯片等級(jí)落差頗大,單從推論時(shí)間(毫秒ms)及能耗(微焦耳uJ 比較可能會(huì)有點(diǎn)不公平,所以這里依CPU等級(jí)及工作頻率來分會(huì)更清楚些。Fig. 2分別列出各等級(jí)中推論速度表現(xiàn)最好的。

wKgaomTLYEaAHbHTAAP1WwqQPI8795.jpg

Fig.2 MLPerf Tiny v1.1各等級(jí)CPU及不同應(yīng)用表現(xiàn)最佳清單。

另外從此次提交的項(xiàng)目亦可看出Arm Cortex-M4已成為TinyML的主流,若推論仍不夠快時(shí),則可再提升到Cortex-M7。而新上市的Cortex-M33效能已高過Cortex-M4,略低于Cortex-M7,讓使用者有多一點(diǎn)性價(jià)比的選擇空間。

小結(jié)

在邊緣智能(Edge AI)裝置及智能物聯(lián)網(wǎng)(AIoT)應(yīng)用中使用單芯片(MCU)來運(yùn)行AI(TinyML)已是現(xiàn)在進(jìn)行式,透過此次的評(píng)比結(jié)果,可讓大家更了解各家芯片性能及模型優(yōu)化工具的進(jìn)展,未來隨著MCU+NPU的普及,相信下一次的評(píng)比結(jié)果可能就有更大躍升,就讓大家一起期待吧!



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM處理器
    +關(guān)注

    關(guān)注

    6

    文章

    360

    瀏覽量

    41746
  • MPU
    MPU
    +關(guān)注

    關(guān)注

    0

    文章

    359

    瀏覽量

    48803
  • Cortex-M4
    +關(guān)注

    關(guān)注

    6

    文章

    89

    瀏覽量

    46551
  • 加速處理器
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    6446
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1887

    瀏覽量

    35025

原文標(biāo)題:TinyML (MCU AI) 運(yùn)行效能誰說了算?

文章出處:【微信號(hào):易心Microbit編程,微信公眾號(hào):易心Microbit編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    推拉力機(jī)夾具效果檢測(cè),好不好說了算#測(cè)試儀器 #推拉力測(cè)試

    推拉力測(cè)試機(jī)
    力標(biāo)精密設(shè)備
    發(fā)布于 :2024年11月11日 17:07:50

    F型頭組件電纜屏蔽效能測(cè)試

    德索工程師說道F型頭組件電纜屏蔽效能測(cè)試的方法多種多樣,常用的包括傳導(dǎo)屏蔽效能測(cè)試、輻射屏蔽效能測(cè)試以及基于場(chǎng)的測(cè)量方法和基于路的測(cè)量方法。傳導(dǎo)屏蔽效能測(cè)試是通過將被測(cè)試電纜與一個(gè)外界
    的頭像 發(fā)表于 09-14 14:34 ?269次閱讀
    F型頭組件電纜屏蔽<b class='flag-5'>效能</b>測(cè)試

    淺析三大力之異同

    隨著一年多前ChatGPT的出現(xiàn)引爆人工智能(AI)浪潮,支撐大模型背后的“力”概念突然闖進(jìn)我們的視野,成為科技圈炙手可熱的新詞,引領(lǐng)著最新潮流。作為數(shù)字經(jīng)濟(jì)時(shí)代新生產(chǎn)力,也許不少人知道力有許多
    的頭像 發(fā)表于 08-30 12:56 ?877次閱讀
    淺析三大<b class='flag-5'>算</b>力之異同

    虹科技術(shù) 全新Linux環(huán)境PCAN驅(qū)動(dòng)程序發(fā)布!CAN/CAN FD通信體驗(yàn)全面升級(jí)!

    ”。想要體驗(yàn)字符模式設(shè)備驅(qū)動(dòng)接口(chardev)的便捷,還是SocketCAN設(shè)備驅(qū)動(dòng)接口(netdev)的高效?都由您說了算! 新版本驅(qū)動(dòng)包概覽 1、設(shè)備驅(qū)動(dòng)程序模塊源代碼及Makefile文件,確保
    的頭像 發(fā)表于 08-29 09:36 ?444次閱讀
    虹科技術(shù) 全新Linux環(huán)境PCAN驅(qū)動(dòng)程序發(fā)布!CAN/CAN FD通信體驗(yàn)全面升級(jí)!

    知道影響貼片電感發(fā)熱的因素有哪些嗎?

    知道影響貼片電感發(fā)熱的因素有哪些嗎?
    的頭像 發(fā)表于 08-17 14:24 ?451次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>影響貼片電感發(fā)熱的因素有哪些嗎?

    知道貼片電感故障時(shí)可能出現(xiàn)的癥狀嗎?

    知道貼片電感故障時(shí)可能出現(xiàn)的癥狀嗎?
    的頭像 發(fā)表于 08-17 14:20 ?375次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>貼片電感故障時(shí)可能出現(xiàn)的癥狀嗎?

    國產(chǎn)芯上運(yùn)行TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫-米爾基于芯馳D9國產(chǎn)商顯板

    是面向單片機(jī)的超輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫,即 TinyML 推理庫,可以讓你在任意單片機(jī)上運(yùn)行輕量級(jí)深度學(xué)習(xí)模型~ 開源地址:https://github.com/sipeed/TinyMaix搭建
    發(fā)表于 08-09 18:26

    知道共模電感用錯(cuò)了會(huì)有什么影響嗎

    電子發(fā)燒友網(wǎng)站提供《知道共模電感用錯(cuò)了會(huì)有什么影響嗎.docx》資料免費(fèi)下載
    發(fā)表于 07-30 10:42 ?0次下載

    瑞薩電子推出Reality AI Explorer Tier,用于開發(fā)AI與TinyML解決方案

    全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費(fèi)版本,可用于開發(fā)工業(yè)、汽車和商業(yè)應(yīng)用中的AI與TinyML解決方案。
    的頭像 發(fā)表于 07-19 10:03 ?440次閱讀

    浪潮信息攜手天府云數(shù)據(jù)科技推出了42kW智風(fēng)冷力倉

    不僅標(biāo)志著我國智基礎(chǔ)設(shè)施邁入了全新的高密度、高效能時(shí)代,更為人工智能、自動(dòng)駕駛、生物制藥、AIGC(人工智能生成內(nèi)容)及智能制造等多個(gè)前沿領(lǐng)域提供了強(qiáng)有力的力支撐。
    的頭像 發(fā)表于 07-15 16:18 ?665次閱讀

    TinyML在機(jī)器人中的應(yīng)用——?jiǎng)?chuàng)建語音控制機(jī)器人子系統(tǒng)

    通過對(duì)TinyML領(lǐng)域基礎(chǔ)概念的堅(jiān)實(shí)理解,我們將把我們的知識(shí)應(yīng)用到現(xiàn)實(shí)生活中的項(xiàng)目中。nbsp; 在深入研究這個(gè)項(xiàng)目之前,我想說明一下,這個(gè)項(xiàng)目將使用現(xiàn)有的數(shù)據(jù)集,Google Colabs和由
    的頭像 發(fā)表于 05-07 14:51 ?7643次閱讀
    <b class='flag-5'>TinyML</b>在機(jī)器人中的應(yīng)用——?jiǎng)?chuàng)建語音控制機(jī)器人子系統(tǒng)

    全新Linux環(huán)境PCAN驅(qū)動(dòng)程序發(fā)布!CAN/CAN FD通信體驗(yàn)全面升級(jí)!

    ”。想要體驗(yàn)字符模式設(shè)備驅(qū)動(dòng)接口(chardev)的便捷,還是SocketCAN設(shè)備驅(qū)動(dòng)接口(netdev)的高效?都由您說了算!
    的頭像 發(fā)表于 04-19 10:38 ?936次閱讀

    知道激光鉆孔技術(shù)有多牛嗎?看完這篇文章就明白了

    知道激光鉆孔技術(shù)有多牛嗎?看完這篇文章就明白了
    的頭像 發(fā)表于 02-29 17:09 ?968次閱讀

    電機(jī)運(yùn)行功率怎么

    電機(jī)是現(xiàn)代工業(yè)中最常見、最重要的動(dòng)力裝置之一,廣泛應(yīng)用于各行各業(yè)。而作為電機(jī)運(yùn)行特性的一個(gè)重要參數(shù),功率的計(jì)算與分析對(duì)于電機(jī)的設(shè)計(jì)、運(yùn)行和維護(hù)具有重要意義。本文將介紹電機(jī)運(yùn)行功率的計(jì)算方法。 一
    的頭像 發(fā)表于 02-20 14:22 ?3596次閱讀

    知道電感損壞對(duì)電路有影響嗎

    在電子產(chǎn)品的電路中,電感是非常重要的一種電子元器件,它不僅會(huì)對(duì)電路的穩(wěn)定運(yùn)行產(chǎn)生影響,而且有可能會(huì)影響到電路中其他電子元器件的運(yùn)行。本篇我們就來簡(jiǎn)單探討以下電感損壞對(duì)電路可能產(chǎn)生的影響。 電感損壞
    的頭像 發(fā)表于 01-10 10:13 ?753次閱讀