0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談面向人臉表情識別的雙模板稀疏分類方法

電子工程師 ? 來源:電子技術(shù)應(yīng)用第6期 ? 作者:蔣行國;馮彬;韋 ? 2021-05-05 00:05 ? 次閱讀

摘要:提出一種面向人臉表情識別的雙模板稀疏分類方法(DT-SRC)。該算法在用訓(xùn)練樣本組成觀測矩陣的基礎(chǔ)上,通過添加正、負雙模板構(gòu)造新的觀測矩陣,最后使用稀疏表示分類(SRC)進行識別。分別在JAFFE和CK人臉庫中進行驗證,結(jié)果表明,該算法識別準確率高,比SRC有更好的性能。

近幾年來,隨著MA Y[1-2]等人提出了基于稀疏表示分類的人臉識別,掀起SRC在人臉識別領(lǐng)域應(yīng)用的熱潮。郝靜靜[3]等人提出一種改進的人臉識別方法,效果得到明顯提高。SALAH R[4]等人結(jié)合紋理特征提取和稀疏表示實現(xiàn)人臉表情的識別。Zhang Shiqing[5]等人把Gabor小波和局部二值化(LBP)分別用于表情特征提取,評估稀疏表示分類(SRC)的性能,并與支持向量機(SVM)、NSC、NNC等進行了比較。

MAHOOR H[6]等人對人臉運動單元進行稀疏表示實現(xiàn)表情識別,并與SVM、NSC方法進行了比較。但表情特征相對于人臉特征復(fù)雜,表情樣本少,加大了表情識別難度;直接運用SRC實現(xiàn)表情識別效果不是很好。鄒修國[7]等人把人臉識別系統(tǒng)應(yīng)用到DSP,為識別系統(tǒng)廣泛應(yīng)用奠定了基礎(chǔ)。

針對上述識別方法的優(yōu)缺點,本文提出雙模板稀疏表示算法對人臉表情進行識別。通過增加正、負模板重構(gòu)新的觀測矩陣,優(yōu)化了稀疏表示的性能,減少噪聲、遮擋等對表情識別的影響,提高了表情的識別率。

1 基于稀疏表示的表情識別

1.1 稀疏表示理論

稀疏表示SR(sparse representation)可稱為壓縮感知,在很多領(lǐng)域扮演了越來越重要的角色。在式(1)中,稀疏表示理論的核心是在過完備矩陣D∈Rm×n下,重構(gòu)出的

15168767514886.gif

逼近原信號x,可理解為求解方程的過程:

pIYBAGB3u4KAYuqdAAAH9uQGLH0372.png

在實際應(yīng)用中,當m《

pIYBAGB3u5qAEcTBAAAQwgkfE9g002.png

但式(2)的求解過程是一個NP-hard問題,計算效率極低。參考文獻[8]指出,在滿足約束等距性RIP的條件下,最小l1范數(shù)解逼近最小l0范數(shù)解。所以,可以在解集合尋找最小范數(shù)解(min‖x‖1)來代替求min‖x‖0,這是一個凸優(yōu)化問題,用式(3)表示:

15171639644633.gif

對于上述最優(yōu)化問題,有許多l(xiāng)1算法[9]能夠有效地求解,包括正交匹配追蹤算法、LASSO、SPGL1算法等。

1.2 基于稀疏表示的表情識別算法

從表情庫中隨機取大部分人臉圖像作為訓(xùn)練樣本,用于構(gòu)建測試樣本對應(yīng)的冗余字典。設(shè)第i類訓(xùn)練樣本用矩陣表示為

15172070052364.gif

,每個圖像用v來表示。將k類共n個訓(xùn)練樣本組合在一起形成整個訓(xùn)練集矩陣D:

15172383778535.gif

其中,m表示樣本的像素點,ni表示第i類樣本數(shù)目。通過求解出測試人臉在由訓(xùn)練樣本構(gòu)成的字典里的表示,可以知道測試人臉的表情類別信息。給出一個屬于第i類的測試樣本y,可以表示為:

15172691718664.gif

測試樣本僅用來表示自同一類訓(xùn)練樣本的線性組合,其他類別的系數(shù)為零,即求解出的解x1=[0,0,…,0,

15172986246128.gif

],只有第i類的值是非0元素。系數(shù)向量a中包含大量有利于分類的信息。判斷測試樣本所屬類別的公式為:

15173279215837.gif

其中δi(x1)∈Rn,是第i組系數(shù)中非零的數(shù)為系數(shù)x1中與i對應(yīng)的那些數(shù)。ri(y)=‖y-Aδi(x1)‖2表示的是y與Aδi(x1)的殘差值,認為殘差值最小的對應(yīng)類別i為y的類別。

2 雙模板稀疏分類算法

實際應(yīng)用中,訓(xùn)練樣本個數(shù)和單樣本的像素點影響原信號重構(gòu)的效果。直接用訓(xùn)練樣本來構(gòu)造冗余字典D,重構(gòu)效率很低。由于圖像中含有噪聲干擾,為了解決噪聲的影響,式(1)改寫為:

15175091014403.gif

其中,ε表示誤差向量,它與稀疏解x一樣含有大量的稀疏零點。因此,為了方便計算,把解x和ε合并起來,添加一個模板I去構(gòu)造新的矩陣B,故y可以表示為:

15175779912567.gif

其中,B=[D,I]∈Rm×(n+m)。由于m《(m+n),所以方程(8)一直是欠定方程,ω的解并不唯一。把矩陣I用單位矩陣表示,I的向量ii∈Rm中只含一個非零數(shù),用來表示圖像中零散的噪聲點。單模板I通過向量e幫助x分擔原圖像的零散噪聲,使更多有用信息集中于向量x上。

原則上,觀測矩陣D在沒有限制的條件下,系數(shù)x可以為任何實數(shù)。然而,在識別的應(yīng)用中,被識別的目標應(yīng)該被訓(xùn)練樣本用非負系數(shù)所表示。在訓(xùn)練樣本庫中,尋找到類似測試樣本類別的個體時,主要集中于該類似樣本的非負系數(shù)上。然而,直接對上述的輔助稀疏x、e進行非負約束不太合理。因此,本文在正模板的基礎(chǔ)上提出了雙模板的擴展矩陣。如圖1所示,由訓(xùn)練樣本矩陣、正模板和負模板共同構(gòu)造雙模板的觀測矩陣。把測試樣本中可能存在的負值轉(zhuǎn)移到負模板,消除負系數(shù)對稀疏解x用于分類時的影響。此時,式(1)可寫為:

o4YBAGB3u8-AB9XuAADReV_nrlE613.png

圖1 雙模板觀測矩陣

其中,e+∈Rm,e-∈Rm分別為正輔助系數(shù)和負輔助系數(shù)向量,新觀測矩陣

15177416519975.gif

Rn+2m是非負系數(shù)向量。此時,負模板-I中的每一列向量-ii只含有一個零值,與正模板的ii剛好相反,可以減少稀疏表示中對n的要求,解決樣本數(shù)不夠的問題。式(8)的矩陣B中m《2m+n,因此是欠定方程,且ω沒有唯一的解。通過變換域把式(8)求解問題轉(zhuǎn)化為l1-正則化最小平方問題,稀疏表達式表示為:

15178742528236.gif

其中‖·‖1和‖·‖2分別表示l1和l2范數(shù)。本文使用l1范數(shù)解法l1_ls求稀疏解x。然后把稀疏解x代入式(6),求出殘差值,即可得到測試樣本y對應(yīng)的類別。

對于一個有效的測試人臉,所求的非零系數(shù)集中于單個訓(xùn)練目標。為了衡量觀測矩陣的性能,參考文獻[4]定義稀疏集中指數(shù)(SCI)來測量稀疏系數(shù)集中程度:

15179323323114.gif

如果

15179549205226.gif

則測試樣本只用一個目標樣本來表示;如果

15179734071343.gif

,則測試樣本的稀疏表示均勻地分布在所有樣本中。

15179932504281.gif

的值越大,說明求解的x稀疏性越好。本文將通過衡量SCI指數(shù)比較DT-SRC和SRC的性能。

3 實驗及結(jié)果分析

3.1 JAFFE人臉數(shù)據(jù)庫上的實驗

對人臉庫的圖像進行幾何歸一化、灰度歸一化、濾波等預(yù)處理。JAFFE人臉圖像經(jīng)過預(yù)處理后大小為64×64,如圖2所示,從左到右依次為憤怒、厭惡、恐懼、開心、自然、傷心、驚奇7種表情。

pIYBAGB3vAiAfMERAADUDT2WqBE165.png

圖2 KA的7種表情預(yù)處理后的圖像

把JAFFE人臉庫的210張圖片按7種表情進行分類,每人每種表情隨機抽取一個作為測試樣本,其他為訓(xùn)練樣本。對人臉圖像進行下采樣降維,針對SRC和DT-SRC算法選擇最優(yōu)的下采樣率,采樣點為15×7,比較NSC、SRC和DT-SRC的識別性能。

表1中平均SCI指數(shù)為統(tǒng)計70個測試人臉的每個SCI指數(shù)后求平均值,它能反映出稀疏表示分類的識別性能。從表1可以看出,DT-SRC相對SRC和NSC在識別率上有很大的提升,但犧牲了一定的時間;SRC和NSC的識別率差不多。

pIYBAGB3vCGAbns8AACHrx2wUAc778.png

圖3中,SCI指數(shù)的范圍為[0,1],指數(shù)越接近1,所求得的解越稀疏,稀疏性越好。從圖3可以看出,在第12、50個測試樣本時SCI都很低,可以認為這些樣本類別不能很好地被識別,所含的表情分類信息不明顯;DT-SRC的SCI指數(shù)普遍比SRC的高,則DT-SRC的重構(gòu)效果比SRC有了很大的提高。

o4YBAGB3vDiAc740AAJ13_tcEW8336.png

圖3 JAFFE的測試人臉在SRC、DT-SRC的SCI指數(shù)

本文取圖3的第70個測試人臉圖,列出該圖在DT-SRC和SRC下的殘差值,如圖4所示。圖4(a)為第70個人臉的裁剪圖,圖4(b)和圖4(c)中的橫坐標1~7分別表示憤怒、厭惡、恐懼、開心、自然、傷心、驚奇的7種表情。圖4(b)、圖4(c)的第7個方柱(驚奇)的殘差值最低,可以判斷出圖4(a)的類別是驚奇,該人臉的表情是驚奇。

從圖4可以看出,DT-SRC的第7類表情殘差值相對其他類表情要明顯,所求解的系數(shù)x在表情類別中主要集中于驚奇處。圖4(b)中最低兩個殘差值的比例大約為1 400/100=14:1;圖4(c)中最低兩個殘差值的比例大約為500/200=5:2;在該測試人臉的識別中,DT-SRC算法比SRC有更好的稀疏性和分類效果。

o4YBAGB3vGCAUlNWAAIKjCyXcT4016.png

圖4 某個測試人臉的殘差值圖

3.2 在CK人臉數(shù)據(jù)庫上的實驗

3.1節(jié)實驗同樣適用于Cohn-Kanade(CK)表情庫。選取裁剪成64×64的CK人臉庫作為實驗數(shù)據(jù)庫,把其中一人的7種表情顯示如圖5所示,從左到右依次為厭惡、恐懼、開心、自然、傷心、驚奇、憤怒7種表情。

o4YBAGB3vIWAe3y5AAC7RWMOHAU349.png

圖5 CK的7種表情預(yù)處理后的圖像

CK庫有18個人,每個人每種表情有5張,有7種表情,共有630張圖像。每人每種表情隨機抽取一個作為測試樣本,其他為訓(xùn)練樣本,則總有126張測試樣本、504張訓(xùn)練樣本。然后比較NSC、SRC、ISRC 3種算法的識別率,實驗結(jié)果如表2所示。計算每張CK測試人臉在SRC、DT-SRC識別后的SCI指數(shù),126張測試人臉的SCI指數(shù)如圖6所示。

pIYBAGB3vKKAeJ-TAALOy_74i3M378.png

圖6 CK的測試人臉在SRC、DT-SRC的SCI指數(shù)

分析表1和表2可知,SRC和NSC在識別時間上比其他方法有絕對的優(yōu)勢,而且識別率也較好。在CK庫中的識別率明顯比JAFFE庫好,這是因為所使用的CK庫的圖片質(zhì)量好,各表情差異明顯。DT-SRC比SRC和NSC在識別率方面有所提高,特別是在圖片表情特征不明顯的情況下,識別率能有很大的提高。其實,在CK庫中所使用訓(xùn)練樣本比較多,SRC算法能達到很高的識別率。

但在JAFFE庫里,由于表情庫的樣本不多,導(dǎo)致字典D的列數(shù)不夠,不能充分發(fā)揮出稀疏表示的作用,從而導(dǎo)致它的識別率低。而本文的算法DT-SRC彌補了字典矩陣D列數(shù)不足的缺點,且降低了噪聲和負系數(shù)的影響,使識別率得到提高,但犧牲了一定的運算時間。

從圖3和圖6的SCI指數(shù)圖看出,DT-SRC的SCI總體上比SRC的高,DT-SRC的稀疏表示性比SRC的好。當測試樣本不是有效的人臉時,DT-SRC能更好地排除該張圖片,減少錯誤的判斷。

本文提出的DT-SRC實用性強、效率高,降低了識別的復(fù)雜度,解決了SRC用于表情識別時效率不高的問題。通過SRC與DT-SRC的比較,發(fā)現(xiàn)字典矩陣D的構(gòu)造影響著正確識別率和稀疏分類性能,D中的元素能最大程度地表示測試樣本的結(jié)構(gòu),且所添加的正、負模板可消除噪聲、負系數(shù)等影響。因此,DT-SRC在表情識別方面效果不錯。

參考文獻

[1] WRIGHT J, YANG A Y, MA Y,et al. Robust face recognition via sparse representation[J]。 Pattern Analysis and Machine Intelligence, 2009,31(2):210-217.

[2] JIA K,CHAN T H,MA Y. Robust and practical face recognition via structured sparsity[C]。 European Conference on Computer Vision(ECCV), 2012:331-344.

[3] 郝靜靜,李莉。一種基于KPCA與LDA的人臉識別改進算法[J]。電子技術(shù)應(yīng)用,2013,39(12):132-134.

[4] SALAH R, KHOLY A E, YOUSSRI M. Robust facial expression recognition via sparse repre-

sentation and multiple gabor filters[J].International Journal of Advanced Computer Sciences and Applications, 2013,4(3):82-87.

[5] Zhang Shiqing, Zhao Xiaoming, Lei Bicheng. Robust facial expression recognition via compressive sensing[J].Sensors, 2012,12(12):3747-3761.

[6] MAHOOR H, ZHOU M, KEVIN L,et al. Facial action unit recognition with sparse representation[C].Automatic Face & Gesture Recognition and Workshops(FG2011), 2011:336-342.

[7] 鄒修國, 李林, 陸靜霞。 基于DSP的人臉HU矩識別研究[J]。電子技術(shù)應(yīng)用,2013,38(11):150-153.

[8] CAND?魬S E J, WAKIN M B. An introduction to compressive sampling[J]。 Signal Processing Magazine,2008,25(2):21-30.

[9] YANG A, GANESH A, MA Y,et al. Fast L1-minimization algorithms for robust face recognition[J]。 IEEE Transactions on Image Processing(TIP), 2013,22(8):3234-3246.

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SVM
    SVM
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    32483
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    4012

    瀏覽量

    81937
  • SRC
    SRC
    +關(guān)注

    關(guān)注

    0

    文章

    60

    瀏覽量

    18000
  • NNC-
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    21129
收藏 人收藏

    評論

    相關(guān)推薦

    開源六軸協(xié)作機器人myCobot 320結(jié)合人臉表情識別情緒!

    與眾不同的功能。通過結(jié)合人臉表情識別技術(shù),我們可以讓機械臂感知到我們的情緒變化。當我們開心時,機械臂可以跟著一起開心地舞動;當我們傷心難過時,它可以過來安慰我們,給予溫暖的撫摸。這種基于表情
    的頭像 發(fā)表于 08-12 15:21 ?921次閱讀
    開源六軸協(xié)作機器人myCobot 320結(jié)合<b class='flag-5'>人臉</b><b class='flag-5'>表情</b><b class='flag-5'>識別</b>情緒!

    基于Python的深度學(xué)習(xí)人臉識別方法

    基于Python的深度學(xué)習(xí)人臉識別方法是一個涉及多個技術(shù)領(lǐng)域的復(fù)雜話題,包括計算機視覺、深度學(xué)習(xí)、以及圖像處理等。在這里,我將概述一個基本的流程,包括數(shù)據(jù)準備、模型選擇、訓(xùn)練過程、以及測試與評估,并附上簡單的代碼示例。
    的頭像 發(fā)表于 07-14 11:52 ?1274次閱讀

    人臉識別技術(shù)的可行性在于矛盾具有什么性

    矛盾的普遍性角度,探討人臉識別技術(shù)的可行性,并分析其在實際應(yīng)用中所面臨的矛盾和問題。 二、人臉識別技術(shù)概述 人臉
    的頭像 發(fā)表于 07-04 09:28 ?522次閱讀

    人臉識別技術(shù)的優(yōu)缺點有哪些

    人臉識別技術(shù)是一種基于人臉特征信息進行身份識別的生物識別技術(shù)。隨著計算機視覺、深度學(xué)習(xí)等技術(shù)的發(fā)展,人臉
    的頭像 發(fā)表于 07-04 09:25 ?2362次閱讀

    人臉識別技術(shù)將應(yīng)用在哪些領(lǐng)域

    人臉識別技術(shù)是一種基于人臉特征信息進行身份識別的生物識別技術(shù)。隨著科技的發(fā)展,人臉
    的頭像 發(fā)表于 07-04 09:24 ?2821次閱讀

    人臉識別技術(shù)的原理介紹

    人臉識別技術(shù)是一種基于人臉特征信息進行身份識別的生物識別技術(shù)。它通過分析人臉圖像,提取
    的頭像 發(fā)表于 07-04 09:22 ?1237次閱讀

    如何設(shè)計人臉識別的神經(jīng)網(wǎng)絡(luò)

    人臉識別技術(shù)是一種基于人臉特征信息進行身份識別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實現(xiàn)人臉
    的頭像 發(fā)表于 07-04 09:20 ?668次閱讀

    人臉識別模型訓(xùn)練是什么意思

    人臉識別模型訓(xùn)練是指通過大量的人臉數(shù)據(jù),使用機器學(xué)習(xí)或深度學(xué)習(xí)算法,訓(xùn)練出一個能夠識別分類人臉
    的頭像 發(fā)表于 07-04 09:16 ?624次閱讀

    人臉檢測和人臉識別的區(qū)別是什么

    檢測和人臉識別的區(qū)別。 定義 人臉檢測是指在圖像或視頻中快速準確地找到人臉的位置,并將其從背景中分離出來的技術(shù)。人臉檢測的目的是確定圖像中是
    的頭像 發(fā)表于 07-03 14:49 ?1248次閱讀

    人臉檢測與識別的方法有哪些

    人臉檢測與識別是計算機視覺領(lǐng)域中的一個重要研究方向,具有廣泛的應(yīng)用前景,如安全監(jiān)控、身份認證、智能視頻分析等。本文將詳細介紹人臉檢測與識別的方法
    的頭像 發(fā)表于 07-03 14:45 ?731次閱讀

    請問esp who人臉識別的臉部信息如何保存在sd卡中?

    esp who人臉識別的臉部信息如何保存在sd卡中?
    發(fā)表于 06-28 08:09

    中國面向人工智能的數(shù)據(jù)治理 行業(yè)研究報告

    電子發(fā)燒友網(wǎng)站提供《中國面向人工智能的數(shù)據(jù)治理 行業(yè)研究報告.pdf》資料免費下載
    發(fā)表于 05-10 17:22 ?0次下載

    人臉識別終端 10寸人臉

    終端人臉識別
    深圳市遠景達物聯(lián)網(wǎng)技術(shù)有限公司
    發(fā)布于 :2024年04月22日 16:01:46

    語音識別的技術(shù)歷程及工作原理

    語音識別的本質(zhì)是一種基于語音特征參數(shù)的模式識別,即通過學(xué)習(xí),系統(tǒng)能夠把輸入的語音按一定模式進行分類,進而依據(jù)判定準則找出最佳匹配結(jié)果。
    的頭像 發(fā)表于 03-22 16:58 ?3243次閱讀
    語音<b class='flag-5'>識別的</b>技術(shù)歷程及工作原理

    人臉識別技術(shù)的原理是什么 人臉識別技術(shù)的特點有哪些

    人臉檢測是人臉識別的首要步驟。其目標是在圖像或視頻中準確地定位人臉的位置。人臉檢測算法常用的方法
    的頭像 發(fā)表于 02-18 13:52 ?1953次閱讀