目前已經(jīng)有了越來越多的基于人臉識(shí)別的應(yīng)用,例如我們現(xiàn)在應(yīng)用極廣的“刷臉支付”、“刷臉打卡”等。但隨著技術(shù)的發(fā)展,當(dāng)年很多電影中的畫面慢慢變成了現(xiàn)實(shí),壞人可以通過帶上提前準(zhǔn)備好的照片或者面具,甚至是一副眼鏡,輕而易舉的被識(shí)別成其他人,隨著這種人臉偽造的風(fēng)險(xiǎn)和隱患逐日增加,人臉活體檢測(cè)技術(shù)得到了越來越多的關(guān)注。
目前人臉識(shí)別面臨以下三種常見欺詐手段:
合法用戶的人臉圖片:用戶的人臉圖片是最容易獲取的,可以通過偷拍,在互聯(lián)網(wǎng)上搜索(例如微博,朋友圈,小紅書)等形式得到。惡意用戶可以打印其照片或使用屏幕和其他投影裝置欺騙人臉識(shí)別系統(tǒng)。
合法用戶的人臉視頻:可以直接盜取用戶現(xiàn)有視頻,或偷拍,也可以通過Deepfake[2]等技術(shù)手段合成視頻,如果可以獲得含眨眼,頭部運(yùn)動(dòng)等活體信息的視頻將會(huì)對(duì)圖像人臉識(shí)別系統(tǒng)有較大威脅。惡意用戶可以通過屏幕或投影設(shè)備等播放視頻來欺騙人臉識(shí)別系統(tǒng)。
合法用戶的3D模型(包括面具或頭套):直接三維合成人臉對(duì)系統(tǒng)進(jìn)行欺詐可能會(huì)比上述兩種手段更具威脅。惡意用戶可以直接頭戴或者擺放模型等方式欺騙人臉識(shí)別系統(tǒng)。
人臉活體檢測(cè)技術(shù)主要分為以下三大類:
圖片人臉活體檢測(cè):通過靜態(tài)圖片進(jìn)行活體檢測(cè),通常基于傳統(tǒng)圖像處理,主要的方式有基于紋理特征的方式、基于圖像質(zhì)量的方式、以及基于深度特征的方法。
其中,基于紋理特征的方法主要專注使用人臉照片或視頻進(jìn)行的攻擊,照片或視頻中的人臉在攝像頭下二次成像時(shí)面部的紋理會(huì)帶有紙質(zhì)或者屏幕的紋理(例如摩爾紋等),而與普通活體人臉皮膚的紋理存在差異。除此之外,真實(shí)人臉與圖片或視頻人臉主要的差異也在于三維結(jié)構(gòu)與二位結(jié)構(gòu)的差異,光在三維結(jié)構(gòu)和二維結(jié)構(gòu)表面形成不同的反射也會(huì)造成顏色陰暗區(qū)域的差異。這些差異可以有效的幫助基于紋理特征的活體檢測(cè)方法區(qū)分真實(shí)人臉與虛假人臉。
基于圖像質(zhì)量的方式主要通過呈現(xiàn)的虛假人臉與真實(shí)人臉之間圖像質(zhì)量的差異,由于虛假人臉通常需要通過中介(如照片、顯示器等)呈現(xiàn)在人臉識(shí)別系統(tǒng)前,容易導(dǎo)致虛假人臉的圖像質(zhì)量和活體人臉存在差距,例如圖像顏色的失真、顯示器反光導(dǎo)致的色差、與人臉圖像的模糊程度等。目前比較常用的基于圖像質(zhì)量的人臉活體檢測(cè)方式會(huì)利用人臉的失真程度、圖像模糊程度、顏色分類等特征,使用SVM,二次判別分析等分類模型區(qū)分活體人臉與虛假人臉
基于深度特征的方法主要是在前兩種方法的基礎(chǔ)上,利用深度學(xué)習(xí)方法高效抽取高層語義的特征表達(dá)。為了達(dá)到更好的區(qū)分度,基于深度特征的方法首先利用傳統(tǒng)的方式對(duì)人臉圖像進(jìn)行處理后,利用卷積神經(jīng)網(wǎng)絡(luò)抽取分類特征。
配合式人臉活體檢測(cè):需要人臉識(shí)別使用者的配合交互,通過判斷用戶是否按照要求在鏡頭前完成指定動(dòng)作來進(jìn)行活體檢測(cè),主要包括隨機(jī)動(dòng)作指令人臉活體檢測(cè)和語音活體檢測(cè)。
隨機(jī)動(dòng)作指令人臉活體檢測(cè)需要用戶根據(jù)提示做出相應(yīng)的動(dòng)作,通過眨眼、點(diǎn)頭、搖頭、張嘴等面部動(dòng)作驗(yàn)證用戶是否為真實(shí)活體本人操作。隨機(jī)動(dòng)作式活體檢測(cè)依賴于動(dòng)作識(shí)別算法的性能和準(zhǔn)確率,通常方法是通過對(duì)一個(gè)連續(xù)多幀人臉活體圖像數(shù)據(jù)中包含的活體動(dòng)作特征執(zhí)行區(qū)域信息進(jìn)行動(dòng)作特征識(shí)別抽取,例如二值化處理,然后通過分析多幀圖像之間特征變化是否大于指定動(dòng)作對(duì)應(yīng)閾值來判斷用戶是否完成了該動(dòng)作。
語音活體檢測(cè)則是需要用戶配合提示讀出相應(yīng)文字驗(yàn)證碼,然后分別對(duì)視頻和音頻進(jìn)行檢測(cè)。這種技術(shù)主要通過人臉關(guān)鍵點(diǎn)定位技術(shù)和人臉追蹤等技術(shù),通過用戶配合完成的動(dòng)作聲音是否與系統(tǒng)要求相符合來驗(yàn)證用戶是否為真實(shí)的活體本人。也可以通過抽取嘴部區(qū)域的光流特征變化,然后使用SVM等分類器識(shí)別用戶是否完成了文字的朗讀。
靜默人臉活體檢測(cè):無需用戶動(dòng)作或語音配合,可以在不超過1秒的時(shí)間內(nèi)實(shí)時(shí)完成檢測(cè)。靜默活體檢測(cè)的主要原理是結(jié)合了圖片活體檢測(cè),除了抽取圖片的紋理顏色特征,利用圖片的質(zhì)量進(jìn)行判斷外,還利用了基于生命信息的方法與和時(shí)間相關(guān)的深度特征。
由于真實(shí)人臉并非絕對(duì)靜止,存在很多不自覺的輕微動(dòng)作,活體人臉會(huì)有心跳導(dǎo)致血管抖,眨眼,微表情引起臉部肌肉跳動(dòng)等生命特征,可以利用人臉識(shí)別過程中的多幀畫面提取運(yùn)動(dòng)特征,心跳特征,連續(xù)性特征等用于人臉活體檢測(cè)。通過遠(yuǎn)程光體積變化描記圖法(Remote photoplethysmography, rPPG)等方法可以檢測(cè)到來自攝像頭的人體器官變化信息,通過計(jì)算人體心率以及人臉血流導(dǎo)致的顏色變化等有效信息來區(qū)分真假人臉?;谏畔⒌姆椒▽?duì)利用3D模型的虛假人臉攻擊有明顯的防御效果。
隨著現(xiàn)在技術(shù)的發(fā)展,人臉登錄、人臉支付、人臉閘機(jī)等商業(yè)化應(yīng)用也開始廣泛的在安全、金融、教學(xué)、醫(yī)院等領(lǐng)域落地。在大部分人臉識(shí)別技術(shù)的現(xiàn)實(shí)應(yīng)用場(chǎng)景中,如果被偽造人員攻擊成功,很有可能性就會(huì)對(duì)使用者產(chǎn)生重大損失。越是這樣,人臉活體檢測(cè)技術(shù)就越來越具備了重要的科研價(jià)值和現(xiàn)實(shí)的商業(yè)使用價(jià)值,因此活體檢測(cè)技術(shù)對(duì)于提高人臉識(shí)別系統(tǒng)的安全性、可信性有著非常關(guān)鍵的意義,已成為目前人臉識(shí)別應(yīng)用中不可缺少的重要部分。
審核編輯黃宇
-
算法
+關(guān)注
關(guān)注
23文章
4625瀏覽量
93143 -
檢測(cè)
+關(guān)注
關(guān)注
5文章
4509瀏覽量
91632 -
人臉識(shí)別
+關(guān)注
關(guān)注
76文章
4014瀏覽量
82113
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論