借助于深度神經(jīng)網(wǎng)絡(luò),俄羅斯國(guó)立高等經(jīng)濟(jì)大學(xué)的人研究人員已經(jīng)提出了一種新方法,能夠從視頻中識(shí)別出人的身份。該方法不需要大量的照片,并且與現(xiàn)有方法相比具有明顯更高的識(shí)別準(zhǔn)確度——即使只有某個(gè)人的一張照片可用。
面部識(shí)別技術(shù)在過(guò)去幾年中發(fā)展迅速。作為驗(yàn)證和識(shí)別個(gè)人身份的工具,這些技術(shù)被用于各種領(lǐng)域,從打擊恐怖主義的執(zhí)法機(jī)構(gòu)到社交網(wǎng)絡(luò)和移動(dòng)應(yīng)用。許多國(guó)際公司和世界領(lǐng)先大學(xué)的研究小組正在不斷對(duì)數(shù)據(jù)和儀器本身進(jìn)行試驗(yàn),以提高識(shí)別的準(zhǔn)確率。
識(shí)別可以通過(guò)多種方式進(jìn)行,但最近在高精度神經(jīng)網(wǎng)絡(luò)的幫助下獲得了最好結(jié)果。神經(jīng)網(wǎng)絡(luò)獲得的訓(xùn)練圖像越多,該過(guò)程就越有效。網(wǎng)絡(luò)可以提取出關(guān)鍵面部特征,然后在識(shí)別未知圖像時(shí)使用該知識(shí)。
現(xiàn)在,可以更容易地訪問(wèn)越來(lái)越多的照片數(shù)據(jù)集,并將這些數(shù)據(jù)集用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)。對(duì)于受限的觀察環(huán)境(具有相同的面部方向、照明等因素的照片),算法的準(zhǔn)確性早已達(dá)到人類面部識(shí)別的能力水平。然而,在識(shí)別不受約束的條件下,收集到的視頻數(shù)據(jù)具有可變的照明、角度和大小,實(shí)現(xiàn)高精度識(shí)別對(duì)研究人員來(lái)說(shuō)是一個(gè)更大挑戰(zhàn)。
國(guó)立高等經(jīng)濟(jì)大學(xué)信息系統(tǒng)與技術(shù)部教授Savchenko解釋說(shuō):“網(wǎng)絡(luò)能夠以100%的準(zhǔn)確度識(shí)別知名演員,因?yàn)檠輪T的可用圖像數(shù)量可能有數(shù)百萬(wàn)張。然而,隨著神經(jīng)網(wǎng)絡(luò)中積累的知識(shí)的變化,這并不意味著它可以適應(yīng)只有一張照片用作訓(xùn)練樣本的情況并識(shí)別出人的身份?!?/p>
為了解決這個(gè)問(wèn)題,國(guó)立高等經(jīng)濟(jì)大學(xué)的研究人員利用模糊集和概率理論來(lái)開(kāi)發(fā)視頻識(shí)別算法。在利用少量圖像進(jìn)行視頻實(shí)時(shí)面部識(shí)別的實(shí)驗(yàn)中,該算法顯著提高了若干眾所周知的神經(jīng)網(wǎng)絡(luò)架構(gòu)的準(zhǔn)確度(比早期實(shí)驗(yàn)高2-6%),如VGGFace、VGGFace2、ResFace和LightCNN。
作為測(cè)試數(shù)據(jù)庫(kù),國(guó)立高等經(jīng)濟(jì)大學(xué)的研究人員使用以下傳統(tǒng)數(shù)據(jù)集來(lái)對(duì)視頻面部識(shí)別方法進(jìn)行評(píng)估:IJB-A(IARPA Janus Benchmark A)和YTF(YouTube Faces)。這些數(shù)據(jù)集包含了著名人物(演員、政治家、公眾人物)的免費(fèi)圖像,而這些圖像是在不受約束的環(huán)境中和不同時(shí)間點(diǎn)從開(kāi)放源頭收集的。在最復(fù)雜的實(shí)驗(yàn)中,研究人員使用上述算法和來(lái)自于另一個(gè)具有更好分辨率的LFW(Labeled Faces in the Wild)數(shù)據(jù)集的相同人物的幾張照片來(lái)識(shí)別來(lái)自YouTube視頻中的人。而這些照片本身是在不同的時(shí)間(從20世紀(jì)70年代到21世紀(jì)10年代)和不同的地點(diǎn)拍攝的。
這種新方法的實(shí)質(zhì)是利用參考照片的相關(guān)性信息,即它們之間的距離或差距。相似個(gè)體之間的聯(lián)系(即數(shù)學(xué)模型中的距離)較小,而不相似個(gè)體之間的聯(lián)系則較大。了解人與人之間的差異程度可以幫助系統(tǒng)在識(shí)別視頻幀的過(guò)程中糾正錯(cuò)誤。
Savchenko教授解釋說(shuō):“算法估計(jì)一幀與一個(gè)人的接近程度,以及另一幀與另一個(gè)人的接近程度。然后,它比較這兩個(gè)人的訓(xùn)練靜態(tài)照片之間的相似程度。接下來(lái),它將第三人添加進(jìn)來(lái)并評(píng)估他與哪個(gè)人的相似度更高——第一個(gè)人或第二個(gè)人。然后它會(huì)糾正識(shí)別錯(cuò)誤。”
該算法已經(jīng)用針對(duì)固定計(jì)算機(jī)的Python語(yǔ)言實(shí)現(xiàn),能夠幫助用戶在照片/視頻專輯中查找和分組不同人的面部,并估計(jì)一個(gè)人的出生年份、性別和其他參數(shù)。研究人員還開(kāi)發(fā)了一個(gè)Android應(yīng)用程序原型,用于確定照片和視頻中人物的年齡和性別。對(duì)照片庫(kù)的分析能夠?qū)崿F(xiàn)對(duì)用戶社交活動(dòng)程度的自動(dòng)評(píng)估,并識(shí)別用戶的親密朋友和親戚。對(duì)于現(xiàn)代智能手機(jī),該應(yīng)用程序原型每秒能夠處理15幀。據(jù)研究人員稱,有了他們的方法,面部識(shí)別可以獲得更高的準(zhǔn)確率。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4772瀏覽量
100845 -
面部識(shí)別
+關(guān)注
關(guān)注
1文章
375瀏覽量
26647
原文標(biāo)題:新型神經(jīng)網(wǎng)絡(luò)可從單張照片識(shí)別人臉
文章出處:【微信號(hào):AI_News,微信公眾號(hào):人工智能快報(bào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論