久久久精品黄色毛片网,麻豆1区2产品乱码芒果白狼在线

一

背景

Backbone模型是各種視覺任務(wù)訓(xùn)練的基石，視覺任務(wù)模型的性能和模型的速度都受backbone模型的影響，良好的backbone模型可以有效提高視覺任務(wù)模型的性能和精度。因此設(shè)計(jì)優(yōu)良的backbone模型對視覺任務(wù)模型的表現(xiàn)至關(guān)重要。目前存在低延遲且高性能的開源模型已經(jīng)有很多，但這些模型的設(shè)計(jì)往往只考慮到了理論計(jì)算量，并沒有和實(shí)際的硬件條件相結(jié)合，因此這些模型部署到實(shí)際的硬件上，并不能發(fā)揮最大的速度潛能。針對這個(gè)挑戰(zhàn)，為了發(fā)揮backbone模型的最大潛力，我們在M55H平臺(tái)上，基于MobileNetV2模型定制了適用于M55H平臺(tái)的backbone模型AXSpine系列，相比于原始MobileNetV2模型，AXSpine-Middle在精度提升的同時(shí)，速度提升了50%，硬件的MAC利用率大幅提高，在多個(gè)具體任務(wù)上達(dá)到80%以上。另外還有多組通過裁剪或者擴(kuò)充的AXSpine系列模型提供，以供不同延遲和精度要求的視覺任務(wù)進(jìn)行選擇。

二

性能指標(biāo)

以下展示AXSpine-Middle模型和MobileNetV2模型在愛芯元智M55H平臺(tái)上不同分辨率的性能對比，數(shù)據(jù)集采用ImageNet數(shù)據(jù)集，精度均在224x224分辨率條件下進(jìn)行測試，更多AXSpine模型指標(biāo)在文章末尾表格中：

模型名稱	Input shape	acc1(224 x 224 標(biāo)準(zhǔn)輸入條件下)	M55H 幀率(@vnpu111)
MobileNetV2	1x3x576x320	71.88	124 fps
MobileNetV2	1x3x288x160	71.88	373.7 fps
AXSpine-Middle	1x3x576x320	72.87	186 fps
AXSpine-Middle	1x3x1280x720	72.87	36.5 fps
AXSpine-Middle	1x3x1920x1080	72.87	19.4 fps

三

相關(guān)模型介紹

3.1 MobileNetV2

MobileNetV2是google提出的用于移動(dòng)端的backbone模型，具有精度高、計(jì)算量小的特點(diǎn)，在移動(dòng)端設(shè)備上推理效果顯著。MobileNetV2模型的基本組成塊為倒置殘差卷積，由兩組1x1的卷積和一組3x3的depthwise卷積構(gòu)成。1x1卷積主要作用為對depthwise卷積做升/降維，3x3的depthwise卷積則在升維的空間上進(jìn)行卷積運(yùn)算，這種架構(gòu)可以在保證表達(dá)能力的同時(shí)有效地增強(qiáng)計(jì)算效率。隨后，這種倒置殘差卷積結(jié)構(gòu)進(jìn)行若干次的堆疊，構(gòu)造成為MobileNetV2模型。

3.2 地平線相關(guān)模型

地平線公司也在自身平臺(tái)上專門對backbone模型進(jìn)行了優(yōu)化，并推出了VarGENet和MixVarGENet等系列模型，其基本塊如下圖所示：

3.3 特斯拉相關(guān)模型

特斯拉相關(guān)模型為RegNet，RegNet為何凱明的相關(guān)工作，旨在用超參數(shù)搜索的方式，指導(dǎo)模型設(shè)計(jì)的相關(guān)工作，在低運(yùn)算量的條件下，取得了相對優(yōu)良的精度，由于沒有用到depthwise卷積，在GPU模型上表現(xiàn)良好，被特斯拉硬件采用。其基本結(jié)構(gòu)與resnet等同，如下所示：

四

模型優(yōu)化

相對于MobileNetV2官方實(shí)現(xiàn)，AXSpine模型做了以下改動(dòng)：

●將MobileNetV2的所有的depthwise卷積修改為小channel size的group卷積；

●將模型第二層的倒置殘差卷積替換為一個(gè)簡單的3x3 conv層；

●對不滿足硬件通道對齊的層進(jìn)行硬件通道對齊；

● 減小部分層的expand_ratio提高運(yùn)算速度；

● 將原有的5層stage結(jié)構(gòu)，仿照convnext修改為4層stage結(jié)構(gòu)3393，速度提升，精度降低。

五

改動(dòng)詳細(xì)說明

5.1 depthwise卷積修改為group卷積

由于邊緣側(cè)芯片的depthwise卷積的支持往往比較低效，這導(dǎo)致使用depthwise卷積的MobileNetV2無法發(fā)揮理論計(jì)算效率，在這里將depthwise卷積修改為group卷積，增強(qiáng)模型的表達(dá)能力，由于芯片組卷積，在特定channel的情況最為高效，因此將所有的depthwise卷積修改為特定channel數(shù)的group卷積。

5.2 替換第二層倒置殘差卷積

MobileNetV2的第一層為一個(gè)3x3的普通卷積，第二層為一個(gè)expand_ratio = 1 的倒置殘差卷積，在原有的MobileNetV2設(shè)計(jì)中，使用倒置殘差卷積的目的是為了減少計(jì)算量，然而當(dāng)修改為group卷積后，運(yùn)算量反倒大幅增加，因此將第二層的倒置殘差卷積的兩個(gè)堆疊的卷積層，修改為單個(gè)普通的3x3卷積。

5.3 對不滿通道對齊的卷積進(jìn)行對齊

硬件單元在計(jì)算的過程中，需要進(jìn)行數(shù)據(jù)對齊，如果不滿足數(shù)據(jù)對齊條件，就會(huì)降低運(yùn)算效率，M55H硬件也是一樣。因此，為了充分利用硬件的計(jì)算能力，需要對不滿足channel對齊的層進(jìn)行對齊操作，MobileNetV2模型中，部分層不滿足硬件對齊條件，這里需要對不滿足硬件對齊的層進(jìn)行向上補(bǔ)齊操作，不影響性能，表達(dá)能力有所提升。

5.4 減小expand_ratio

由于原有的depthwise卷積被替換成了group卷積，模型的表達(dá)能力大幅增強(qiáng)，而我們修改MobileNetV2模型的最終目的是為了在保證精度的情況下，提升速度，因此在此處對expand_ratio進(jìn)行消減，將expand_ratio從6修改為4，第二層的expand_ratio由4再消減為2，理論上模型的計(jì)算量減少約30%，這種expand_同時(shí)也考慮到了M55H的調(diào)度特性，在實(shí)際的調(diào)度過程中，由于各層特征圖的大小得到了均衡，整體調(diào)度效率也得到了提升。

5.5 修改模型stage排布

借鑒convnext文章中的的思路，模型應(yīng)當(dāng)包含有4個(gè)stage，每個(gè)stage的比例大概為13:1較優(yōu)，基于此判斷，對MobileNetV2模型的stage進(jìn)行重新劃分，將原有的stage排布按照39:3進(jìn)行排列，相比于直接削減channel數(shù)提升速度的方式，修改stage對模型精度的損傷較小，修改見下圖所示：

六

總結(jié)

經(jīng)過對MobilenetV2模型的適應(yīng)性改動(dòng)，愛芯元智發(fā)布了基于M55H芯片平臺(tái)的定制化模型AXSpine，相比于原版MobilenetV2模型，AXSpine-Middle模型具有更高的精度和達(dá)到50%提升的速度。得益于愛芯元智M55H平臺(tái)軟硬件聯(lián)合設(shè)計(jì)優(yōu)化，經(jīng)過改良后的AXSpine模型相較業(yè)界友商在單位算力情況下，展現(xiàn)出了強(qiáng)大的性能和延遲表現(xiàn)。此外除了AXSpine-Middle模型以外，還有若干組模型上架，以滿足不同的延遲和精度需求，總結(jié)表格如下，以下模型目前已應(yīng)用于多組視覺任務(wù)中，歡迎使用：

模型名稱	Input shape	acc1(224 x 224 標(biāo)準(zhǔn)輸入條件下)	M55H 幀率(@vnpu111)
MobileNetV2	1x3x576x320	71.88	124 fps
AXSpine-Small	1x3x576x320	71.59	227 fps
AXSpine-Middle	1x3x576x320	72.87	186 fps
AXSpine-Big	1x3x576x320	75.31	131 fps

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
303

瀏覽量
5864

原文標(biāo)題：愛芯分享 | 基于M55H的定制化backbone模型AxeraSpine

文章出處：【微信號：愛芯元智AXERA，微信公眾號：愛芯元智AXERA】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

安裝定制化防震基座時(shí)需要哪些工具和設(shè)備

安裝定制化防震基座所需的工具和設(shè)備

發(fā)表于 12-30 15:28 ?141次閱讀

安裝<b class='flag-5'>定制</b><b class='flag-5'>化</b>防震基座時(shí)需要哪些工具和設(shè)備

AI模型部署邊緣設(shè)備的奇妙之旅：目標(biāo)檢測模型

介紹了如何使用分類任務(wù)進(jìn)行手寫數(shù)字的分類。相信大家腦海中可能會(huì)產(chǎn)生如下疑問：數(shù)據(jù)依賴性強(qiáng)：分類模型的表現(xiàn)通常依賴于大量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練。獲取高質(zhì)量、大規(guī)模的數(shù)據(jù)集既耗時(shí)又昂貴。泛化能力有限：模型

發(fā)表于 12-19 14:33

可靈AI全球首發(fā)視頻模型定制功能，助力AI視頻創(chuàng)作

屬于自己的專屬人臉模型。在模型定制完成后，用戶可以基于該模型生成包含同一人物鏡頭的多個(gè)視頻內(nèi)容，從而滿足用戶對于個(gè)性化視頻創(chuàng)作的多樣

發(fā)表于 11-26 14:02 ?563次閱讀

語言模型自動(dòng)化的優(yōu)點(diǎn)

語言模型自動(dòng)化不僅優(yōu)化了信息處理流程，提高了工作效率，還促進(jìn)了跨文化交流，增強(qiáng)了人機(jī)交互的智能化水平。以下，是對語言模型自動(dòng)化優(yōu)點(diǎn)的梳理，由

發(fā)表于 11-26 11:17 ?115次閱讀

TPS7H5001-SP最壞情況分析模型

電子發(fā)燒友網(wǎng)站提供《TPS7H5001-SP最壞情況分析模型.pdf》資料免費(fèi)下載

發(fā)表于 11-14 14:52 ?0次下載

TPS7<b class='flag-5'>H</b>5001-SP最壞情況分析<b class='flag-5'>模型</b>

浪潮信息發(fā)布KOS AI定制版，大幅提升大模型訓(xùn)練效率

浪潮信息近期推出了“元腦服務(wù)器操作系統(tǒng)KOS AI定制版”，為人工智能領(lǐng)域帶來了革命性的變化。這款定制版操作系統(tǒng)通過簡單的兩步操作，即可實(shí)現(xiàn)大模型訓(xùn)練環(huán)境的快速部署。

發(fā)表于 10-30 17:23 ?559次閱讀

資料保存1：工業(yè)定制化儀器設(shè)計(jì)方案

Camera Link 輸出子卡 , FPGA邏輯視頻采集 , FPGA實(shí)時(shí)計(jì)算平臺(tái) , 實(shí)物仿真平臺(tái) , 工業(yè)定制化儀器

發(fā)表于 10-24 09:27 ?187次閱讀

資料保存1：工業(yè)<b class='flag-5'>定制</b><b class='flag-5'>化</b>儀器設(shè)計(jì)方案

M12航插連接器與線束定制，為您的自動(dòng)化設(shè)備提供專業(yè)互連支持

隨著自動(dòng)化技術(shù)的不斷進(jìn)步，設(shè)備的連接性能對于提高工作效率和可靠性至關(guān)重要。面對每個(gè)自動(dòng)化項(xiàng)目的獨(dú)特需求，電子谷作為專業(yè)的連接器與線束制造商，特別推出M12航插連接器和線束的定制服務(wù)，為

發(fā)表于 10-10 08:06 ?510次閱讀

<b class='flag-5'>M</b>12航插連接器與線束<b class='flag-5'>定制</b>，為您的自動(dòng)<b class='flag-5'>化</b>設(shè)備提供專業(yè)互連支持

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

供應(yīng)商的移遠(yuǎn)通信，于近日正式對外宣布將推出全新大模型解決方案。該方案將融合強(qiáng)大的算力平臺(tái)、技術(shù)和服務(wù)，為眾多垂直行業(yè)提供標(biāo)準(zhǔn)化、定制化及智能化

發(fā)表于 08-27 11:29 ?688次閱讀

基于MATLAB 的質(zhì)量守恒空化模型（JFO 模型）

可有大佬會(huì)基于MATLAB 的質(zhì)量守恒空化模型（JFO 模型）

發(fā)表于 07-05 23:32

Al大模型機(jī)器人

和迭代來不斷改進(jìn)自身性能。它們可以從用戶交互中學(xué)習(xí)并根據(jù)反饋進(jìn)行調(diào)整，以提高對話質(zhì)量和準(zhǔn)確性。可定制性與整合性: AI大模型機(jī)器人可以根據(jù)特定需求進(jìn)行定制和整合，以滿足不同場景和應(yīng)用的要求。它們可以與其

發(fā)表于 07-05 08:52

快手自研文生圖大模型“可圖”開放，支持AI圖像創(chuàng)作及定制

5月30日最新動(dòng)態(tài)，快手于近日向公眾推出其自主研發(fā)的文生圖大模型命名為“可圖”。該模型具備文生圖及圖生圖兩種功能，適用于AI圖像創(chuàng)作及AI形象定制。

發(fā)表于 05-31 10:32 ?670次閱讀

浪潮信息發(fā)布“源2.0-M32”開源大模型

浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎(chǔ)上，引入了“基于注意力機(jī)制的門控網(wǎng)絡(luò)”技術(shù)，構(gòu)建了一個(gè)包含32個(gè)專家的混合專家模型（MoE），有效提升

發(fā)表于 05-29 09:08 ?682次閱讀

MGMF444A1H9M-MINAS A6N系列介紹松下

電子發(fā)燒友網(wǎng)為你提供Panasonic(Panasonic)MGMF444A1H9M-MINAS A6N系列介紹相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊，更有MGMF444A1H9M-MINAS A6N系列介紹

發(fā)表于 05-22 19:13

定制化DC電源模塊的設(shè)計(jì)與制作

定制化DC電源模塊的設(shè)計(jì)與制作定制化DC電源模塊的設(shè)計(jì)與制作需要按照具體需求和要求來進(jìn)行。下面是一般的設(shè)計(jì)和制作步驟： 1. 確定需求和規(guī)格：明確需要的電源模塊的輸出電壓、輸出電流、

發(fā)表于 02-29 13:48 ?670次閱讀

搜索歷史

基于M55H的定制化backbone模型AxeraSpine

評論

安裝定制化防震基座時(shí)需要哪些工具和設(shè)備

AI模型部署邊緣設(shè)備的奇妙之旅：目標(biāo)檢測模型

可靈AI全球首發(fā)視頻模型定制功能，助力AI視頻創(chuàng)作

語言模型自動(dòng)化的優(yōu)點(diǎn)

TPS7H5001-SP最壞情況分析模型

浪潮信息發(fā)布KOS AI定制版，大幅提升大模型訓(xùn)練效率

資料保存1：工業(yè)定制化儀器設(shè)計(jì)方案

M12航插連接器與線束定制，為您的自動(dòng)化設(shè)備提供專業(yè)互連支持

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

基于MATLAB 的質(zhì)量守恒空化模型（JFO 模型）

Al大模型機(jī)器人

快手自研文生圖大模型“可圖”開放，支持AI圖像創(chuàng)作及定制

浪潮信息發(fā)布“源2.0-M32”開源大模型

MGMF444A1H9M-MINAS A6N系列介紹松下

定制化DC電源模塊的設(shè)計(jì)與制作