如何利用CNN實(shí)現(xiàn)圖像識(shí)別的任務(wù)
輸入層讀入經(jīng)過(guò)規(guī)則化(統(tǒng)一大?。┑膱D像,每一層的每個(gè)神經(jīng)元將前一層的一組小的局部近鄰的單元作為輸入,也就是局部感受野和權(quán)值共享,神經(jīng)元抽取一些基本的視覺(jué)特征,比如邊緣、角點(diǎn)等,這些特征之后會(huì)被更高層的神經(jīng)元所使用。卷積神經(jīng)網(wǎng)絡(luò)通過(guò)卷積操作獲得特征圖,每個(gè)位置,來(lái)自不同特征圖的單元得到各自不同類(lèi)型的特征。一個(gè)卷積層中通常包含多個(gè)具有不同權(quán)值向量的特征圖,使得能夠保留圖像更豐富的特征。卷積層后邊會(huì)連接池化層進(jìn)行降采樣操作,一方面可以降低圖像的分辨率,減少參數(shù)量,另一方面可以獲得平移和形變的魯棒性。卷積層和池化層的交替分布,使得特征圖的數(shù)目逐步增多,而且分辨率逐漸降低,是一個(gè)雙金字塔結(jié)構(gòu)。
CNN的特征
1)具有一些傳統(tǒng)技術(shù)所沒(méi)有的優(yōu)點(diǎn):良好的容錯(cuò)能力、并行處理能力和自學(xué)習(xí)能力,可處理環(huán)境信息復(fù)雜,背景知識(shí)不清楚,推理規(guī)則不明確情況下的問(wèn)題,允許樣品有較大的缺損、畸變,運(yùn)行速度快,自適應(yīng)性能好,具有較高的分辨率。它是通過(guò)結(jié)構(gòu)重組和減少權(quán)值將特征抽取功能融合進(jìn)多層感知器,省略識(shí)別前復(fù)雜的圖像特征抽取過(guò)程。
2)泛化能力要顯著優(yōu)于其它方法,卷積神經(jīng)網(wǎng)絡(luò)已被應(yīng)用于模式分類(lèi),物體檢測(cè)和物體識(shí)別等方面。利用卷積神經(jīng)網(wǎng)絡(luò)建立模式分類(lèi)器,將卷積神經(jīng)網(wǎng)絡(luò)作為通用的模式分類(lèi)器,直接用于灰度圖像。
3)是一個(gè)前潰式神經(jīng)網(wǎng)絡(luò),能從一個(gè)二維圖像中提取其拓?fù)浣Y(jié)構(gòu),采用反向傳播算法來(lái)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),求解網(wǎng)絡(luò)中的未知參數(shù)。
4)一類(lèi)特別設(shè)計(jì)用來(lái)處理二維數(shù)據(jù)的多層神經(jīng)網(wǎng)絡(luò)。CNN被認(rèn)為是第一個(gè)真正成功的采用多層層次結(jié)構(gòu)網(wǎng)絡(luò)的具有魯棒性的深度學(xué)習(xí)方法。CNN通過(guò)挖掘數(shù)據(jù)中的空間上的相關(guān)性,來(lái)減少網(wǎng)絡(luò)中的可訓(xùn)練參數(shù)的數(shù)量,達(dá)到改進(jìn)前向傳播網(wǎng)絡(luò)的反向傳播算法效率,因?yàn)镃NN需要非常少的數(shù)據(jù)預(yù)處理工作,所以也被認(rèn)為是一種深度學(xué)習(xí)的方法。在CNN中,圖像中的小塊區(qū)域(也叫做“局部感知區(qū)域”)被當(dāng)做層次結(jié)構(gòu)中的底層的輸入數(shù)據(jù),信息通過(guò)前向傳播經(jīng)過(guò)網(wǎng)絡(luò)中的各個(gè)層,在每一層中都由過(guò)濾器構(gòu)成,以便能夠獲得觀測(cè)數(shù)據(jù)的一些顯著特征。因?yàn)榫植扛兄獏^(qū)域能夠獲得一些基礎(chǔ)的特征,比如圖像中的邊界和角落等,這種方法能夠提供一定程度對(duì)位移、拉伸和旋轉(zhuǎn)的相對(duì)不變性。
5)CNN中層次之間的緊密聯(lián)系和空間信息使得其特別適用于圖像的處理和理解,并且能夠自動(dòng)的從圖像抽取出豐富的相關(guān)特性。
6)CNN通過(guò)結(jié)合局部感知區(qū)域、共享權(quán)重、空間或者時(shí)間上的降采樣來(lái)充分利用數(shù)據(jù)本身包含的局部性等特征,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),并且保證一定程度上的位移和變形的不變性。
7)CNN是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,具有極強(qiáng)的適應(yīng)性,善于挖掘數(shù)據(jù)局部特征,提取全局訓(xùn)練特征和分類(lèi),它的權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)使之更類(lèi)似于生物神經(jīng)網(wǎng)絡(luò),在模式識(shí)別各個(gè)領(lǐng)域都取得了很好的成果。
8) CNN可以用來(lái)識(shí)別位移、縮放及其它形式扭曲不變性的二維或三維圖像。CNN的特征提取層參數(shù)是通過(guò)訓(xùn)練數(shù)據(jù)學(xué)習(xí)得到的,所以其避免了人工特征提取,而是從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí);其次同一特征圖的神經(jīng)元共享權(quán)值,減少了網(wǎng)絡(luò)參數(shù),這也是卷積網(wǎng)絡(luò)相對(duì)于全連接網(wǎng)絡(luò)的一大優(yōu)勢(shì)。共享局部權(quán)值這一特殊結(jié)構(gòu)更接近于真實(shí)的生物神經(jīng)網(wǎng)絡(luò)使CNN在圖像處理、語(yǔ)音識(shí)別領(lǐng)域有著獨(dú)特的優(yōu)越性,另一方面權(quán)值共享同時(shí)降低了網(wǎng)絡(luò)的復(fù)雜性,且多維輸入信號(hào)(語(yǔ)音、圖像)可以直接輸入網(wǎng)絡(luò)的特點(diǎn)避免了特征提取和分類(lèi)過(guò)程中數(shù)據(jù)重排的過(guò)程。
9)CNN的分類(lèi)模型與傳統(tǒng)模型的不同點(diǎn)在于其可以直接將一幅二維圖像輸入模型中,接著在輸出端即給出分類(lèi)結(jié)果。其優(yōu)勢(shì)在于不需復(fù)雜的預(yù)處理,將特征抽取,模式分類(lèi)完全放入一個(gè)黑匣子中,通過(guò)不斷的優(yōu)化來(lái)獲得網(wǎng)絡(luò)所需參數(shù),在輸出層給出所需分類(lèi),網(wǎng)絡(luò)核心就是網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)與網(wǎng)絡(luò)的求解。這種求解結(jié)構(gòu)比以往多種算法性能更高。
10)隱層的參數(shù)個(gè)數(shù)和隱層的神經(jīng)元個(gè)數(shù)無(wú)關(guān),只和濾波器的大小和濾波器種類(lèi)的多少有關(guān)。隱層的神經(jīng)元個(gè)數(shù),它和原圖像,也就是輸入的大?。ㄉ窠?jīng)元個(gè)數(shù))、濾波器的大小和濾波器在圖像中的滑動(dòng)步長(zhǎng)都有關(guān)。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100777 -
卷積
+關(guān)注
關(guān)注
0文章
95瀏覽量
18512 -
cnn
+關(guān)注
關(guān)注
3文章
352瀏覽量
22217
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論