(文章來源:雷鋒網(wǎng))
谷歌從 17 年發(fā)布 MobileNets 以來,每隔一年即對該架構進行了調整和優(yōu)化。現(xiàn)在,開發(fā)者們對 MobileNetV3 在一次進行了改進,并將 AutoML 和其他新穎的思想融入到該移動端的深度學習框架中。谷歌發(fā)布了相關文章對升級后的 MobileNetV3 進行了講解,雷鋒網(wǎng) AI 開發(fā)者將其整理編譯如下。
將深度學習融合到移動端正成為人工智能領域最活躍的研究領域之一。而設計能夠在移動端運行時有效執(zhí)行的深度學習模型,則需要對神經(jīng)網(wǎng)絡中的許多架構范例進行更進一步的思考。移動端的深度學習模型需要平衡復雜神經(jīng)網(wǎng)絡結構的精度和移動運行時的性能約束。在移動端深度學習領域中,計算機視覺仍然是最具挑戰(zhàn)性的領域之一。
在 2017 年,谷歌推出了基于 TensorFlow 的計算機視覺系列模型 MobileNets。而最新的 MobileNets 架構正是于幾天前發(fā)布,其中包含了一些改進移動端計算機視覺模型的有趣想法。MobileNetV3 是該模型結構的第三個版本,它能夠為許多主流的移動應用程序提供圖像分析的功能。該體系結構還被集成到流行的框架中,例如:TensorFlow Lite。
MobileNet 需要盡可能維持其中發(fā)展較快的計算機視覺和深度學習領域與移動環(huán)境局限性之間平衡。因此,谷歌一直在定期對 MobileNets 架構進行更新,其中也加入了一些有關于深度學習領域中最新穎的想法。
MobileNets 的第一個版本于 2017 年春季發(fā)布,其核心思想是引入一系列基于 TensorFlow 的計算機視覺模型,在最大限度地提高精度的同時,平衡設備上或嵌入式應用程序的有限資源。從概念上講,MobileNetV1 正試圖實現(xiàn)兩個基本目標,以構建移動第一計算機視覺模型:
較小的模型 參數(shù)數(shù)量更少較小復雜度 運算中乘法和加法更少遵循這些原則,MobileNetV1 是一個小型、低延遲、低功耗的參數(shù)化模型,可以滿足各種用例的資源約束。它們可以用于實現(xiàn):分類、檢測、嵌入和分割等功能。
MobileNetV1 的核心架構則基于一個流線型架構,該架構使用深度可分離卷積網(wǎng)絡來構建了輕量級深度神經(jīng)網(wǎng)絡。就神經(jīng)網(wǎng)絡結構而言,深度可分離卷積將卷積核分成兩個單獨的卷積核,這兩個卷積核依次進行兩個卷積,即先是深度卷積,然后進行逐點卷積。
在 MobileNetV1 中,深度卷積網(wǎng)絡的每個輸入信道都應用了單個濾波器。然后,逐點卷積應用 1 x1 卷積網(wǎng)絡來合并深度卷積的輸出。這種標準卷積方法既能濾波,又能一步將輸入合并成一組新的輸出。在這之中,深度可分離卷積將其分為兩層,一層用于濾波,另一層則用于合并。
第一代 MobileNetV1 的實現(xiàn)作為了 TensorFlow Slim 圖像分類庫的一部分;而隨著新的移動應用程序使用全新的模式進行構建,就誕生出了新的想法以改進整體架構。
(責任編輯:fqj)
-
谷歌
+關注
關注
27文章
6211瀏覽量
106515 -
計算機視覺
+關注
關注
8文章
1703瀏覽量
46249
發(fā)布評論請先 登錄
相關推薦
評論