0 引言
人臉作為圖像與視頻中最重要的視覺(jué)圖像之一,在計(jì)算機(jī)視覺(jué)、模式識(shí)別、多媒體技術(shù)研究中占有很重要的地位。可視化分析和目標(biāo)識(shí)別研究中最具有挑戰(zhàn)性的任務(wù)之一就是理解人們?nèi)绾翁幚砗妥R(shí)別彼此的相貌,并進(jìn)行相應(yīng)的計(jì)算機(jī)建模來(lái)最終完成人臉的自動(dòng)識(shí)別。近年來(lái),隨著計(jì)算機(jī)科學(xué)在人機(jī)交互領(lǐng)域的快速發(fā)展,作為人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù),人臉檢測(cè)與識(shí)別現(xiàn)在已經(jīng)成為模式識(shí)別與計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)一項(xiàng)受到普遍重視。無(wú)線視頻監(jiān)控系統(tǒng)將被監(jiān)控點(diǎn)實(shí)時(shí)采集的圖片、視頻文件通過(guò)無(wú)線網(wǎng)絡(luò)及時(shí)地傳輸給遠(yuǎn)程監(jiān)控中心,實(shí)時(shí)動(dòng)態(tài)地報(bào)告被監(jiān)測(cè)點(diǎn)的情況,及時(shí)發(fā)現(xiàn)問(wèn)題并進(jìn)行處理。
本文提出了一種有效的無(wú)線遠(yuǎn)程人臉追蹤系統(tǒng)的解決方案。采用AdaBoost算法進(jìn)行人臉的檢測(cè),選擇了Haar特征方法,把訓(xùn)練得出的Haar特征轉(zhuǎn)換成弱分類(lèi)器,通過(guò)一定的方法將弱分類(lèi)器進(jìn)行組合構(gòu)成強(qiáng)分類(lèi)器,對(duì)分類(lèi)器進(jìn)行訓(xùn)練后應(yīng)用到圖像中進(jìn)行人臉區(qū)域的檢測(cè),從而得到較準(zhǔn)確的人臉信息;采用GPRS技術(shù)進(jìn)行人臉圖像數(shù)據(jù)的無(wú)線傳輸,通過(guò)GPRS/CDMA無(wú)線窄帶網(wǎng)絡(luò)連接Internet互聯(lián)網(wǎng)絡(luò),在無(wú)線視頻監(jiān)控終端對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)采集,無(wú)線傳送到遠(yuǎn)程服務(wù)器;采用Gabor小波進(jìn)行特征提取,獲得人臉圖像的Gabor特征;采用SVM進(jìn)行分類(lèi),對(duì)人臉圖像進(jìn)行分類(lèi)識(shí)別,得出識(shí)別結(jié)果,對(duì)符合條件的人臉給出警報(bào)。本系統(tǒng)可以應(yīng)用于商場(chǎng)、機(jī)場(chǎng)、車(chē)站、地鐵站等場(chǎng)所。
1 視頻圖像處理
1.1 去噪處理
圖像在生成和傳輸過(guò)程中常受到各種噪聲的干擾和影響,使圖像質(zhì)量下降。所以在進(jìn)行圖像分析和處理之前都需要對(duì)圖像進(jìn)行去噪處理。噪聲的模型按照對(duì)圖像的影響可以分為加性噪聲模型和乘性噪聲模型兩大類(lèi)。假設(shè),f(x,y)為原始圖像,g(x,y)為有噪聲的圖像,n(x,y)為噪聲。
加性噪聲模型為:
g(x,y)=f(x,y)+n(x,y) (1)
乘性噪聲模型為:
g(x,y)=f(x,y)[1+n(x,y)] (2)
空域中去噪方法包括:中值濾波、均值濾波等。中值濾波是基于排序統(tǒng)計(jì)理論的一種能有效抑制噪聲的非線性處理技術(shù)。其核心運(yùn)算是將模板中的數(shù)據(jù)進(jìn)行排序,這樣一個(gè)亮點(diǎn)(暗點(diǎn))的噪聲,就會(huì)在排序過(guò)程中被排在數(shù)據(jù)序列的最右側(cè)或最左側(cè),因此,最終選擇的數(shù)據(jù)序列中間位置上的值一般不是噪聲點(diǎn)的值。由此便可以達(dá)到抑制噪聲的目的;均值濾波實(shí)際上就是用該像素對(duì)應(yīng)的模板中各像素值的均值替代該像素的像素值,均值濾波的方法是,對(duì)待處理的當(dāng)前圖像,選擇一個(gè)模板,該模板為其近鄰的若干像素組成,用模板中像素的均值來(lái)替代原像素值。
1.2 亮度調(diào)整
由于采集圖像時(shí)的光照強(qiáng)度和相機(jī)自身性能的不同,使得采集到的圖像的亮度有許多不同。而本文的人臉檢測(cè)是基于特征的,特征值與圖像的灰度值有很大關(guān)系。所以即使圖像對(duì)應(yīng)的特征結(jié)構(gòu)相同,但是由于亮度不同,通常會(huì)被分類(lèi)器認(rèn)為是不同的圖像。所以無(wú)論是在訓(xùn)練分類(lèi)器階段還是在檢測(cè)階段都需要對(duì)圖像進(jìn)行亮度的調(diào)整,需要將不同亮度的圖像調(diào)整到同一范圍。常用的亮度調(diào)整技術(shù)包括:線性動(dòng)態(tài)范圍調(diào)整、非線性動(dòng)態(tài)范圍調(diào)整、直方圖均衡化等。線性動(dòng)態(tài)范圍調(diào)整的方法是其中比較簡(jiǎn)單的一種,計(jì)算量也比較小。調(diào)整的計(jì)算公式如下:
1.3 圖像的形狀變換
圖像形狀變換是指用數(shù)學(xué)建模的方法對(duì)圖像形狀發(fā)生的變化進(jìn)行描述的過(guò)程。最基本的圖像變換包括圖像的縮小、放大、旋轉(zhuǎn)等。本文中的訓(xùn)練階段和檢測(cè)階段都需要對(duì)圖像進(jìn)行形狀的變換,比如在建立訓(xùn)練樣本庫(kù)的時(shí)候?qū)⒉煌叽绲膱D像歸一化到19×19的尺寸。圖像縮小從物理意義上來(lái)說(shuō),是將描述圖像的物理尺寸縮小相應(yīng)的倍數(shù)。數(shù)字圖像的縮小是通過(guò)減少像素個(gè)數(shù)來(lái)實(shí)現(xiàn)的,所以就需要根據(jù)所期望縮小的尺寸數(shù)據(jù),從原圖像中選擇合適的像素點(diǎn),使圖像縮小之后可以盡量保持原有的特征不丟失。
圖像放大,從物理含義上來(lái)講是指圖像縮小的逆運(yùn)算。但是圖像放大是從小數(shù)據(jù)量到大數(shù)據(jù)量的過(guò)程,因此需要對(duì)許多數(shù)據(jù)進(jìn)行估計(jì)。由于圖像相連像素之間的相關(guān)性很強(qiáng),所以可以利用這個(gè)相關(guān)性來(lái)實(shí)現(xiàn)圖像的放大。比較好的圖像放大的方法是雙線性插值法,該方法不是將原圖像的像素復(fù)制到子快中,而是只填寫(xiě)在子快的某一個(gè)像素的位置上。采用雙線性插值的方法可以平緩像素塊之間的過(guò)度,有效的抑制了馬賽克現(xiàn)象的產(chǎn)生。本文采用了雙線性插值的方法。
基于AdaBoost算法人臉檢測(cè)#e# 2 基于AdaBoost算法人臉檢測(cè)
2.1 AdaBoost人臉檢測(cè)算法
AdaBcoost是一種基于分類(lèi)器的算法,其基本思想是利用大量的分類(lèi)能力較弱的弱分類(lèi)器通過(guò)一定方法疊加起來(lái)形成分類(lèi)能力很強(qiáng)的強(qiáng)分類(lèi)器。理論證明,只要每個(gè)弱分類(lèi)器分類(lèi)能力比隨機(jī)猜測(cè)好,當(dāng)分類(lèi)器的個(gè)數(shù)趨于無(wú)窮時(shí),強(qiáng)分類(lèi)器的錯(cuò)誤率將趨于零。該算法根據(jù)人臉面部的主要灰度分布特征,選擇采用了Haar特征。Haar特征是一種基于積分圖像的特征,主要用于灰度圖像中,該特征計(jì)算比較簡(jiǎn)單,提取速度相對(duì)較快。Adaboost算法首先提取樣本圖像中的Haar特征,然后通過(guò)在訓(xùn)練過(guò)程中選取出最優(yōu)的Haar特征,再將訓(xùn)練得出的Haar特征轉(zhuǎn)換成弱分類(lèi)器,最終通過(guò)一定的方法將這些弱分類(lèi)器進(jìn)行組合構(gòu)成強(qiáng)分類(lèi)器。分類(lèi)器訓(xùn)練完之后,就可以將其應(yīng)用到圖像中進(jìn)行人臉區(qū)域的檢測(cè)。由于人臉可能在圖像中的不同位置出現(xiàn),所以必須在被檢測(cè)的圖像中移動(dòng)搜索窗口。
對(duì)于一個(gè)訓(xùn)練集(xi,yi),…,(xL,yL),其中xi是輸入的訓(xùn)練樣本,yi是樣本類(lèi)別標(biāo)志,yi∈(1,0)對(duì)應(yīng)真假樣本。在開(kāi)始訓(xùn)練前,對(duì)所有訓(xùn)練樣本均賦予一個(gè)初始權(quán)值,然后用AdaBoost學(xué)習(xí)算法對(duì)訓(xùn)練樣本進(jìn)行T輪訓(xùn)練,在每一輪訓(xùn)練結(jié)束后,從若干個(gè)簡(jiǎn)單分類(lèi)器中選擇誤差最小的那個(gè)作為該輪選出的一個(gè)弱分類(lèi)器hi。選好了弱分類(lèi)器之后,將所有弱分類(lèi)器進(jìn)行線性組合就構(gòu)成了強(qiáng)分類(lèi)器。
訓(xùn)練過(guò)程主要包括以下幾個(gè)模塊:
(1)樣本的采集,對(duì)樣本進(jìn)行圖像預(yù)處理,形成樣本集;
(2)以樣本集作為輸入,計(jì)算并獲得矩形特征值集;
(3)對(duì)特征值集進(jìn)行優(yōu)化處理,選出分辨能力好的特征;
(4)采用AdaBoost算法,在每一輪迭代過(guò)程中采用窮舉搜索法確定每個(gè)特征對(duì)應(yīng)的簡(jiǎn)單分類(lèi)器的閾值,獲得簡(jiǎn)單分類(lèi)器集,并保存其對(duì)應(yīng)的參數(shù);
(5)選出錯(cuò)誤率最低的簡(jiǎn)單分類(lèi)器作為本輪最優(yōu)的弱分類(lèi)器;
(6)將訓(xùn)練得到的弱分類(lèi)器根據(jù)其分類(lèi)能力賦予不同的權(quán)重,然后線性組合構(gòu)成強(qiáng)分類(lèi)器。
2.2 AdaBoost檢測(cè)過(guò)程
級(jí)聯(lián)分類(lèi)器應(yīng)用于人臉檢測(cè)是由Viola提出的,這使得人臉檢測(cè)能在很高檢測(cè)率下同時(shí)達(dá)到實(shí)時(shí)的檢測(cè)速度。級(jí)聯(lián)分類(lèi)器由一系列強(qiáng)分類(lèi)器的組合而成,圖像依次通過(guò)每一個(gè)強(qiáng)分類(lèi)器,最終通過(guò)全部分類(lèi)器的區(qū)域被檢測(cè)為人臉。每一層的強(qiáng)分類(lèi)器由AdaBoost算法訓(xùn)練得到,但是組成強(qiáng)分類(lèi)器的弱分類(lèi)器個(gè)數(shù)隨著級(jí)數(shù)的增加而增加。通過(guò)參數(shù)的調(diào)整可以使前面幾層幾乎讓所有人臉通過(guò),從而拒絕很大一部分非人臉,而后面幾層則對(duì)被前面幾層判斷為人臉的圖像進(jìn)行更加嚴(yán)格的檢測(cè)。由于前面幾層使用的弱分類(lèi)器數(shù)目比較少,只是有幾個(gè)重要的特征組合而成,而且排除了大量非人臉區(qū)域?yàn)楹罄m(xù)的檢測(cè)減少了檢測(cè)對(duì)象數(shù)目,所以計(jì)算速度比較快。
假定級(jí)聯(lián)分類(lèi)器由K個(gè)強(qiáng)分類(lèi)器組成,第i級(jí)強(qiáng)分類(lèi)器的誤檢率為fi,檢測(cè)率為di,則最終的誤檢率F和檢測(cè)率D分別為:
測(cè)試圖像來(lái)自生活中的實(shí)際數(shù)碼照片與從互聯(lián)網(wǎng)上收集的圖像,包括不同人種、不同年齡的正面圖像,人臉檢測(cè)結(jié)果如圖1所示。
3 基于GPRS技術(shù)的窄帶數(shù)據(jù)傳輸
通用無(wú)線分組業(yè)務(wù)(General Packet Radio Service,GPRS)作為第2代移動(dòng)通信技術(shù)GSM向第3代移動(dòng)通信(3G)技術(shù)的過(guò)渡技術(shù),是由英國(guó)BT Cellnet公司早在1993年提出的,是GSMPhase2+(1997)規(guī)范實(shí)現(xiàn)的內(nèi)容之一,是一種基于GSM的移動(dòng)分組數(shù)據(jù)業(yè)務(wù),面向用戶提供移動(dòng)分組的IP或者X.25連接。GPRS是一項(xiàng)高速數(shù)據(jù)處理的科技,它以分組交換技術(shù)為基礎(chǔ),用戶通過(guò)GPRS可以在移動(dòng)狀態(tài)下使用各種高速數(shù)據(jù)業(yè)務(wù)。
通過(guò)GPRS網(wǎng)絡(luò)建立TCP連接傳輸數(shù)據(jù)和指令有2種方式:
(1)監(jiān)控終端通過(guò)GPRS Modem與GSM基站通信,GPRS分組數(shù)據(jù)包從GSM基站發(fā)送到GPRS服務(wù)支持節(jié)點(diǎn)(Serving GSN,SGSN),再由SGSN送到GPRS網(wǎng)關(guān)支持節(jié)點(diǎn)(Gateway GPRS Supporting Node,GGSN),GGSN把收到的包進(jìn)行處理,轉(zhuǎn)換為可在Internet中傳送的格式,最終送給遠(yuǎn)程視頻服務(wù)器端。GGSN在GPRS網(wǎng)絡(luò)和公用數(shù)據(jù)網(wǎng)之間起關(guān)口站的作用,它可以把GSM網(wǎng)中的GPRS分組數(shù)據(jù)包進(jìn)行協(xié)議轉(zhuǎn)換,從而可以把這些分組數(shù)據(jù)包傳送到遠(yuǎn)端的TCP/IP或X.25網(wǎng)絡(luò)。
(2)監(jiān)控終端的GPRS Modem通過(guò)GPRS網(wǎng)絡(luò),直接與遠(yuǎn)程視頻服務(wù)器端的GPRS Modem進(jìn)行點(diǎn)對(duì)點(diǎn)通信,然后通過(guò)串口把數(shù)據(jù)發(fā)送給視頻服務(wù)器。
整個(gè)智能網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)分為現(xiàn)場(chǎng)視頻采集、處理模塊和遠(yuǎn)程視頻服務(wù)器2部分,現(xiàn)場(chǎng)視頻采集和處理模塊在上電后自動(dòng)尋找遠(yuǎn)程視頻服務(wù)器,而遠(yuǎn)程視頻服務(wù)器在與現(xiàn)場(chǎng)視頻采集和處理模塊建立TCP連接后,可通過(guò)發(fā)送指令來(lái)遠(yuǎn)程控制靜態(tài)圖像編碼的傳送。
本文無(wú)線視頻監(jiān)控通過(guò)無(wú)線視頻監(jiān)控終端對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)采集和壓縮,以壓縮圖片格式(JPEG,JPEG2000等)并通過(guò)無(wú)線網(wǎng)絡(luò)傳送到遠(yuǎn)程視頻服務(wù)器。實(shí)現(xiàn)發(fā)送實(shí)時(shí)壓縮圖片。視頻服務(wù)器使用套接字通信,應(yīng)用程序采用面向?qū)ο蟮姆椒?。視頻服務(wù)器與監(jiān)控終端之間使用C/S模型。程序中視頻服務(wù)器作為服務(wù)器,監(jiān)控終端作為客戶端。服務(wù)器端軟件主要完成監(jiān)聽(tīng)客戶端發(fā)送的連接請(qǐng)求;同時(shí)接收來(lái)自多個(gè)監(jiān)控終端的壓縮圖像數(shù)據(jù);保存、查看和管理監(jiān)控終端的圖像數(shù)據(jù)。
在監(jiān)控端通過(guò)監(jiān)控設(shè)備監(jiān)測(cè),運(yùn)算并獲取人臉圖像數(shù)據(jù),并通過(guò)GPRS網(wǎng)絡(luò)通信技術(shù)對(duì)人臉圖像數(shù)據(jù)進(jìn)行無(wú)線傳輸,服務(wù)器終端進(jìn)行接收。為了減少傳輸流量負(fù)荷,人臉圖像大小歸一化為19×19,從而保證了每個(gè)攝像頭傳輸占用不超過(guò)20 Kb/s的帶寬,使得整個(gè)網(wǎng)絡(luò)保證在一個(gè)可以承受的范圍內(nèi)。
4 基于Gabor和支持向量機(jī)的人臉識(shí)別
4.1 Gabor小波特征提取
Gabor函數(shù)由Dennis Gabor于20世紀(jì)40年代提出的,后來(lái)被J Daugman首先用于表征圖像,并用于視覺(jué)方面的研究。隨著計(jì)算機(jī)的不斷發(fā)展,成為非常流行的圖像處理方法。二維Gabor濾波器是一種典型帶通濾波器,由于它具有良好的方向選擇性和頻率選擇性,因此Gabor濾波器被廣泛應(yīng)用于圖像分析、圖像理解等計(jì)算機(jī)視覺(jué)領(lǐng)域,以獲取圖像信號(hào)的空間頻率(尺度)、空間位置和方向選擇性的局部結(jié)構(gòu)信息。
人臉圖像的Gabor特征由人臉圖像和Gabor濾波器的卷積得到。通常的Gabor特征抽取方法是:設(shè)為人臉樣本圖像的灰度分布,則在選定Gabor慮波器參數(shù)后,對(duì)樣本圖像中抽樣點(diǎn)(x,y)提取的特征由下式表示:
式中:G為Gabor函數(shù)在點(diǎn)(x,y)處的離散值;(a,b)為Gabor濾波器窗口大小;(w,h)為圖像的尺寸大小。這樣得到的圖像在點(diǎn)(x,y)處的40個(gè)Gabor幅值特征對(duì)應(yīng)于以該位置為中心的局部區(qū)域的能量分布,將這40個(gè)幅值特征級(jí)聯(lián)起來(lái)構(gòu)成該位置的Gabor特征,通常稱為一個(gè)Jet,位置點(diǎn)(x,y)處的Jet表示為:
Jet(x,y)=(Jet(x,y)vμ) (7)
將所有抽取點(diǎn)提取的Gabor特征構(gòu)成一張人臉樣本的特征矢量:
F1={Jet(x,y)|0≤y≤h} (8)
顯然,對(duì)于一副19×19大小的人臉圖像如果按上述方法逐個(gè)象素抽取Gabor特征,得到的Gabor特征向量F的維數(shù)為19×19×40=14 440,遠(yuǎn)遠(yuǎn)高于原始圖像的維數(shù)19×19=361。如果直接利用這樣的高維Gabor特征矢量進(jìn)行分類(lèi)器的訓(xùn)練和圖像識(shí)別,將產(chǎn)生通常所講的維數(shù)災(zāi)難。因此必須對(duì)高維Gabor特征矢量進(jìn)行適當(dāng)?shù)慕稻S。
4.2 支持向量機(jī)SVM
支持向量機(jī)(Support Vector Macine,SVM)是一種對(duì)線性分類(lèi)器的最優(yōu)設(shè)計(jì)方法論。它對(duì)非線性、高維數(shù)的小樣本人臉識(shí)別問(wèn)題有非常好的分類(lèi)效果和學(xué)習(xí)推廣能力,是目前模式識(shí)別的常用的分類(lèi)器。
SVM從線性可分情況下的最優(yōu)分類(lèi)面發(fā)展而來(lái)。設(shè)2類(lèi)可分樣本集(xi,yi),i=1,2,…,n;
?
人臉識(shí)別屬于非線性問(wèn)題,根據(jù)模式識(shí)別的理論,總可以將低維空間非線性可分得問(wèn)題映射到高維空間,使其在高位空間線性可分。從而把非線性可分的問(wèn)題轉(zhuǎn)化為線性可分問(wèn)題。利用核函數(shù)K(xi,x)可將輸入向量x映射到高位空間進(jìn)行分類(lèi),此時(shí)最優(yōu)分類(lèi)超平面的決策函數(shù)式變?yōu)椋?/p>
常用的核函數(shù)有:線性核函數(shù)K(xi,x)=(xix);多項(xiàng)式核函數(shù)K(xi,x)=[(xix)+1]d;徑向基核函數(shù);Sigmoid核函數(shù)。
對(duì)于多類(lèi)模式識(shí)別問(wèn)題,SVM可通過(guò)2類(lèi)問(wèn)題的組合來(lái)實(shí)現(xiàn)。通常有2種策略:“一對(duì)一”策略,即分類(lèi)的每一步將其中的任意2類(lèi)模式分開(kāi),這樣,對(duì)于N類(lèi)問(wèn)題,則需要N(n-1)/2個(gè)支持向量機(jī)分類(lèi)器;另一種“一對(duì)多”策略,即分類(lèi)的每一步將其中的一類(lèi)模式和其它的所有模式分開(kāi),這樣,對(duì)于N類(lèi)問(wèn)題,則需要N個(gè)與每個(gè)類(lèi)對(duì)應(yīng)的支持向量機(jī)分類(lèi)器。本文采用“一對(duì)一”的策略來(lái)的人臉進(jìn)行分類(lèi)識(shí)別。
人臉圖像庫(kù)來(lái)源于http://www.ai.mit.edu/projects/cbcl。訓(xùn)練集包括6 977個(gè)19×19圖像樣本,2 429張的人臉和4 548張非人臉。本文選用了庫(kù)中的1 000幅人臉圖像,2 000幅非人臉圖像。由于MITCBCL數(shù)據(jù)庫(kù)中的人臉都是國(guó)外的,所以筆者采集了500幅國(guó)內(nèi)的人臉圖像,并將其標(biāo)準(zhǔn)化為19×19的尺寸。所以人臉總數(shù)共1 500幅,非人臉圖像總數(shù)共2 000幅。實(shí)驗(yàn)結(jié)果如表1所示。
5 結(jié)語(yǔ)
本文采用AdaBoost算法進(jìn)行人臉的檢測(cè),根據(jù)人臉面部的主要灰度分布特征,選擇采用了Haar特征,通過(guò)在訓(xùn)練過(guò)程中選取出最優(yōu)的Haar特征,再將Haar特征轉(zhuǎn)換成弱分類(lèi)器,最終組合構(gòu)成強(qiáng)分類(lèi)器,應(yīng)用到圖像中進(jìn)行人臉區(qū)域的檢測(cè),得到較準(zhǔn)確的人臉信息。采用GPRS技術(shù)進(jìn)行人臉圖像數(shù)據(jù)的無(wú)線傳輸,通過(guò)無(wú)線視頻監(jiān)控終端對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)采集,并通過(guò)無(wú)線網(wǎng)絡(luò)傳送到遠(yuǎn)程視頻服務(wù)器。采用Gabor小波進(jìn)行人臉特征提取,采用SVM進(jìn)行分類(lèi),采用“一對(duì)一”的策略來(lái)的人臉進(jìn)行分類(lèi)識(shí)別。
雖然本文從各方面都考慮了算法的有效性,但是在實(shí)際運(yùn)行中還是存在不足的地方,如攝像頭達(dá)到一定數(shù)量時(shí),傳輸速率受到一定影響,如何保證傳輸速率和圖像較少失真問(wèn)題有待進(jìn)一步研究解決。
評(píng)論
查看更多