近年來,隨著安防行業(yè)的不斷向前發(fā)展,智能化是未安防行業(yè)發(fā)展的一大發(fā)展趨勢。所謂人臉識別技術(shù),即基于人的臉部特征,對輸入的人臉圖象或者視頻流進(jìn)行判斷,首先判斷其是否存在人臉。如果存在人臉,則進(jìn)一步的給出每個臉的位置、大小和各個主要面部器官的位置信息。并依據(jù)這些信息,進(jìn)一步提取每個人臉中所蘊涵的身份特征,并將其與已知的人臉進(jìn)行對比,從而識別每個人臉的身份。
人臉識別技術(shù)原理分析
人臉由于其易采集的特性,受到很多行業(yè)客戶的關(guān)注,特別是公安、海關(guān)、商場等。人類每天都在進(jìn)行人臉識別,因此也最能接受這種身份認(rèn)證方式。人臉識別的研究始于上世紀(jì)中期,經(jīng)歷了數(shù)十年的努力,現(xiàn)在已經(jīng)可以應(yīng)用在我們的實際生活中,為我們提供各種便利。
人臉識別主要分為人臉檢測(face detection)、特征提取(feature extraction)和人臉識別(face recognition)三個過程.
人臉檢測:人臉檢測是指從輸入圖像中檢測并提取人臉圖像,通常采用haar特征和Adaboost算法 訓(xùn)練級聯(lián)分類器對圖像中的每一塊進(jìn)行分類。如果某一矩形區(qū)域通過了級聯(lián)分類器,則被判別為人臉圖像。
特征提取:特征提取是指通過一些數(shù)字來表征人臉信息,這些數(shù)字就是我們要提取的特征。常見的人臉特征分為兩類,一類是幾何特征,另一類是表征特征。幾何特征是指眼睛、鼻子和嘴等面部特征之間的幾何關(guān)系,如距離、面積和角度等。由于算法利用了一些直觀的特征,計算量小。不過,由于其所需的特征點不能精確選擇,限制了它的應(yīng)用范圍。另外,當(dāng)光照變化、人臉有外物遮擋、面部表情變化時,特征變化較大。所以說,這類算法只適合于人臉圖像的粗略識別,無法在實際中應(yīng)用。
表征特征利用人臉圖像的灰度信息,通過一些算法提取全局或局部特征。其中比較常用的特征提取算法是LBP算法。LBP方法首先將圖像分成若干區(qū)域,在每個區(qū)域的像素640x960鄰域中用中心值作閾值化,將結(jié)果看成是二進(jìn)制數(shù)。圖3顯示了一個LBP算子。LBP算子的特點是對單調(diào)灰度變化保持不變。每個區(qū)域通過這樣的運算得到一組直方圖,然后將所有的直方圖連起來組成一個大的直方圖并進(jìn)行直方圖匹配計算進(jìn)行分類。
人臉識別:這里提到的人臉識別是狹義的人臉識別,即將待識別人臉?biāo)崛〉奶卣髋c數(shù)據(jù)庫中人臉的特征進(jìn)行對比,根據(jù)相似度判別分類。而人臉識別又可以分為兩個大類:一類是確認(rèn),這是人臉圖像與數(shù)據(jù)庫中已存的該人圖像比對的過程,回答你是不是你的問題;另一類是辨認(rèn),這是人臉圖像與數(shù)據(jù)庫中已存的所有圖像匹配的過程,回答你是誰的問題。顯然,人臉辨認(rèn)要比人臉確認(rèn)困難,因為辨認(rèn)需要進(jìn)行海量數(shù)據(jù)的匹配。常用的分類器有最近鄰分類器、支持向量機等。
與指紋應(yīng)用方式類似,人臉識別技術(shù)目前比較成熟的也是考勤機。因為在考勤系統(tǒng)中,用戶是主動配合的,可以在特定的環(huán)境下獲取符合要求的人臉。這就為人臉識別提供了良好的輸入源,往往可以得到滿意的結(jié)果。但是在一些公共場所安裝的視頻監(jiān)控探頭,由于光線、角度問題,得到的人臉圖像很難比對成功。這也是未來人臉識別技術(shù)發(fā)展必須要解決的難題之一。
現(xiàn)在已有一些機構(gòu)、高校在進(jìn)行人臉識別新領(lǐng)域、新技術(shù)的研究。如遠(yuǎn)距離人臉識別技術(shù),3D人臉識別技術(shù)等。遠(yuǎn)距離人臉識別系統(tǒng)面臨兩個主要困難。一是如何從遠(yuǎn)距離獲取人臉圖像。其次,在得到的數(shù)據(jù)并不理想的情況下如何識別身份。從某種意義上來看,遠(yuǎn)距離人臉識別并不是一個特定的關(guān)鍵技術(shù)或基礎(chǔ)研究問題。它可看成是一個應(yīng)用和系統(tǒng)設(shè)計問題。通常有兩類解決方法用于獲取人臉圖片。一種是高清的固定式攝像機,另一種是使用PTZ控制系統(tǒng)多攝像機系統(tǒng)。后者更適合于一般情況,不過其結(jié)構(gòu)更為復(fù)雜,造價也更貴。后者需要考慮如何協(xié)調(diào)多臺攝像機的同步操作。一般地,系統(tǒng)由低分辨率廣角攝像機和高分辨率長焦攝像機組成。前者用于檢測和追蹤目標(biāo),后者用于人臉圖像采集和識別。目前遠(yuǎn)距離人臉識別技術(shù)還處于實驗室階段,未來如果能夠解決上述問題,對人員布控這樣的應(yīng)用有著重要意義。
3D人臉識別能夠很好地克服2D人臉識別遇到的姿態(tài)、光照、表情等問題。主要原因是2D圖像無法很好地表示深度信息。通常,3D人臉識別方法使用3D掃描技術(shù)獲取3D人臉,然后建立3D人臉模型并用于識別。不過,3D人臉識別技術(shù)的缺點也是很明顯的。首先它需要額外的3D采集設(shè)備或雙目立體視覺技術(shù),其次,建模過程需要的計算量較大。相信隨著未來芯片技術(shù)的發(fā)展,當(dāng)計算能力不再受到制約,采集設(shè)備成本大幅下降的時候,3D人臉識別將會成為熱門技術(shù)之一。
人臉識別在應(yīng)用中的挑戰(zhàn)
從實際測試來看,用戶的預(yù)期與當(dāng)前的技術(shù)水平之間的差距還是比較大的。人臉識別技術(shù)在動態(tài)監(jiān)控應(yīng)用中面臨的壓力實際上也比較大。
1.用戶希望正確報警率要求高。而現(xiàn)實是理論上來說必須接受高誤報率。在技術(shù)方面,要達(dá)到高正確報警率,可以通過降低閾值來實現(xiàn),但是降低閾值的代價是:高誤報率。為了達(dá)到95%正確報警率,很多算法可能會產(chǎn)生300%或更高的誤報率。
2.用戶希望監(jiān)控庫足夠大,往往要求數(shù)萬或幾十萬,甚至上百萬的監(jiān)控名單,希望能捕到“大魚”?,F(xiàn)實是庫容量大就必須接受高誤報率。
3. 用戶希望大規(guī)模成網(wǎng)建設(shè),能夠勾畫出監(jiān)控人員的活動軌跡。 現(xiàn)實是必須高投入,重新建專用網(wǎng)絡(luò)和相關(guān)硬件。
4. 用戶希望盡量使用目前的監(jiān)控設(shè)備(攝像機和網(wǎng)絡(luò))。 現(xiàn)實是現(xiàn)有的攝像機清晰度不夠,圖像質(zhì)量差,用于場景監(jiān)控時視頻中人臉過小,網(wǎng)絡(luò)帶寬不夠等等造成無法使用現(xiàn)有設(shè)備。
5. 用戶希望少產(chǎn)生誤報甚至不產(chǎn)生誤報。 現(xiàn)實是這樣就必將損失正確報警率和減少監(jiān)控庫容量,與用戶的想法相違。
6.光照問題
面臨各種環(huán)境光源的考驗,可能出現(xiàn)側(cè)光、頂光、背光和高光等現(xiàn)象,而且有可能出現(xiàn)各個時段的光照不同,甚至在監(jiān)控區(qū)域內(nèi)各個位置的光照都不同。
7. 人臉姿態(tài)和飾物問題
因為監(jiān)控是非配合型的,監(jiān)控人員通過監(jiān)控區(qū)域時以自然的姿態(tài)通過,因此可能出現(xiàn)側(cè)臉、低頭、抬頭等的各種非正臉的姿態(tài)和佩戴帽子、黑框眼鏡、口罩等飾物現(xiàn)象。
8. 攝像機的圖像問題
攝像機很多技術(shù)參數(shù)影響視頻圖像的質(zhì)量,這些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、內(nèi)置圖像處理芯片和鏡頭等,同時攝像機內(nèi)置的一些設(shè)置參數(shù)也將影響視頻質(zhì)量,如曝光時間、光圈、動態(tài)白平衡等參數(shù)。
9.丟幀和丟臉問題
需要的網(wǎng)絡(luò)識別和系統(tǒng)的計算識別可能會造成視頻的丟幀和丟臉現(xiàn)象,特別是監(jiān)控人流量大的區(qū)域,由于網(wǎng)絡(luò)傳輸?shù)膸拞栴}和計算能力問題,常常引起丟幀和丟臉。
OpenCV是Intel公司支持的開源計算機視覺庫。它輕量級而且高效--由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法,作為一個基本的計算機視覺、圖像處理和模式識別的開源項目,OpenCV 可以直接應(yīng)用于很多領(lǐng)域,其中就包括很多可以應(yīng)用于人臉識別的算法實現(xiàn),是作為第二次開發(fā)的理想工具。
1 系統(tǒng)組成
人臉識別系統(tǒng)可以在Linux 操作系統(tǒng)下利用QT庫來開發(fā)圖形界面,以O(shè)penCV 圖像處理庫為基礎(chǔ),利用庫中提供的相關(guān)功能函數(shù)進(jìn)行各種處理:通過相機對圖像數(shù)據(jù)進(jìn)行采集,人臉檢測主要是調(diào)用已訓(xùn)練好的Haar 分類器來對采集的圖像進(jìn)行模式匹配,檢測結(jié)果利用PCA 算法可進(jìn)行人臉圖像訓(xùn)練與身份識別,而人臉表情識別則利用了Camshift 跟蹤算法和Lucas–Kanade 光流算法。
2 搭建開發(fā)環(huán)境
采用德國Basler acA640-100gc 相機,PC 機上的操作系統(tǒng)是Fedora 10,并安裝編譯器GCC4.3,QT 4.5和OpenCV2.2 軟件工具包,為了處理視頻,編譯OpenCV 前需編譯FFmpeg,而FFmpeg 還依賴于Xvid庫和X264 庫。
3 應(yīng)用系統(tǒng)開發(fā)
程序主要流程如圖所示。
-
人臉識別
+關(guān)注
關(guān)注
76文章
4015瀏覽量
82126 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46059 -
光流法
+關(guān)注
關(guān)注
0文章
3瀏覽量
7875
發(fā)布評論請先 登錄
相關(guān)推薦
評論