摘要:提出了一種新的基于相位一致性的模塊化PCA的人臉識(shí)別方法。解決了人臉識(shí)別受光照影響的問(wèn)題。首先得到人臉訓(xùn)練樣本的相位一致性圖像;然后將人臉相位一致性圖像劃分為更小的子模塊,用PCA方法處理這些子模塊圖像。在姿勢(shì)、光照以及表情變化的情況下同一個(gè)人的局部面部特征是不變的,因此用該方法來(lái)處理這些變化。給出了傳統(tǒng)的模塊化PCA方法與該方法在不同姿勢(shì)、光照和表情變化條件下的對(duì)比實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)結(jié)果表明該方法的人臉識(shí)別率較傳統(tǒng)模塊化PCA方法有了較大提高。
關(guān)鍵詞:人臉識(shí)別;主成分分析;模塊化主成分分析;相位一致性
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2008)01-0318-03
由于臉形的相似以及同一張臉圖像的無(wú)數(shù)變化,使得人臉識(shí)別成為一個(gè)相當(dāng)困難的問(wèn)題。人臉圖像隨著面部表情、光照條件、姿勢(shì)等的變化而變化,人臉識(shí)別系統(tǒng)的任務(wù)就是用一種獨(dú)立于這些因素的方式將人臉識(shí)別出來(lái)。自動(dòng)的人臉識(shí)別被認(rèn)為是計(jì)算機(jī)視覺(jué)和模式識(shí)別中的一個(gè)基本問(wèn)題,許多不同領(lǐng)域的科學(xué)工作者都在從事這一方面的研究。一些基于統(tǒng)計(jì)的、基于神經(jīng)網(wǎng)絡(luò)的還有基于特征的人臉識(shí)別方法相繼被提出來(lái)[1]。目前,比較前沿而且識(shí)別效果比較好的方法之一就是主成分分析法(PCA)。這是一種統(tǒng)計(jì)的方法,將人臉圖像表示成特征向量的一個(gè)子集合,稱(chēng)為特征臉[2~5]。PCA也應(yīng)用于掌印的識(shí)別[6]、手寫(xiě)體的識(shí)別[7]、工業(yè)機(jī)器人技術(shù)[8]以及移動(dòng)機(jī)器人技術(shù)[9]。但是結(jié)果表明當(dāng)姿勢(shì)變化超過(guò)30,光照變化較大時(shí),識(shí)別效果很難讓人滿意。研究的主要目標(biāo)就是要提高識(shí)別精度,并且不在受面部表情、光照條件以及姿勢(shì)變化的影響。如上所述,PCA和模塊化PCA方法已經(jīng)廣泛應(yīng)用于人臉圖像識(shí)別當(dāng)中,但是當(dāng)光照等條件發(fā)生變化時(shí),它們均不能保證足夠的精度。本文研究的目的就是要在表情、光照以及姿勢(shì)變化的條件下提高人臉識(shí)別的效率。筆者提出了一種新的模塊化方法,它是傳統(tǒng)的PCA方法的改進(jìn)和延續(xù),它不是對(duì)原始人臉圖像的直接處理,而是首先將人臉圖像進(jìn)行相位一致性的處理,然后將人臉的相位一致性圖像模塊化,再利用PCA的方法進(jìn)行識(shí)別。這樣不但降低了姿勢(shì)和表情變化的影響,更重要的是光照條件的影響也將大大減小。實(shí)驗(yàn)表明該方法比傳統(tǒng)的PCA以及單一的模塊化方法有較高的識(shí)別效率。
1相位一致性特征
基于梯度的算子關(guān)鍵在于尋找具有最大梯度的點(diǎn),這很難恰當(dāng)?shù)靥綔y(cè)到并局部化圖像特征中的較大部分。與用于識(shí)別急劇變化大邊緣探測(cè)不同,相位一致性模型是在相位頻譜中探測(cè)點(diǎn)序列。根據(jù)Oppenheim等人[10]對(duì)于傅里葉域的圖像重建過(guò)程,相位構(gòu)成比量級(jí)構(gòu)成更加重要。生理學(xué)上也有證據(jù)表明人的視覺(jué)系統(tǒng)對(duì)于相位信息高度有序的圖像中的點(diǎn)有強(qiáng)烈的反應(yīng)。相位一致性提供了一種獨(dú)立于信號(hào)的全局量級(jí)的方法,使其不隨圖像光照條件發(fā)生變化而變化。圖1給出了人臉的原始圖像以及相位一致性圖像。本文使用的相位一致性技術(shù)是基于P. Kovesi[11]提出的。
2新的模塊化PCA方法
基于人臉識(shí)別的PCA方法在變化的姿勢(shì)和光照條件下不是很有效,因?yàn)樗紤]的是每一幅人臉圖像的全局信息并且用一組權(quán)重來(lái)表示它們。在這些條件下圖像的權(quán)向量將會(huì)比正常姿勢(shì)和光照下發(fā)生相當(dāng)大的變化,因此很難正確地識(shí)別出來(lái)。另一方面如果將相位一致性的人臉圖像劃分為更小的區(qū)域,針對(duì)每一小的區(qū)域計(jì)算權(quán)向量,這樣權(quán)重就代表了人臉的局部信息。當(dāng)出現(xiàn)姿勢(shì)或光照變化時(shí),僅僅一部分人臉區(qū)域會(huì)發(fā)生變化,而其余部分仍然保持常規(guī)條件下的人臉圖像。這樣不受影響的人臉多個(gè)小區(qū)域的權(quán)重將會(huì)與正常條件下同一個(gè)人的臉部區(qū)域很好地匹配起來(lái),所以改進(jìn)的模塊化的PCA方法將會(huì)得到更高的識(shí)別率。如果簡(jiǎn)單地直接將人臉圖像分割為更小的區(qū)域,人臉的全局信息可能會(huì)丟失,識(shí)別精度也會(huì)降低。本文采取了將預(yù)處理后的人臉圖像也即相位一致性圖像模塊化的方法,然后對(duì)各個(gè)小模塊運(yùn)用PCA的方法進(jìn)行處理。
3實(shí)驗(yàn)
3.1人臉圖像數(shù)據(jù)庫(kù)
本文的實(shí)驗(yàn)是在ORL人臉數(shù)據(jù)庫(kù)[12]上進(jìn)行的。ORL人臉數(shù)據(jù)庫(kù)包含了40個(gè)成人的400幅人臉圖像,每個(gè)人有10幅。主要包含了因?yàn)槊娌勘砬楹凸庹諚l件不同的人臉圖像。每10幅圖像中用7幅作為訓(xùn)練集,剩下的3幅作為測(cè)試集。圖3表示了同一個(gè)人的訓(xùn)練集圖像和測(cè)試集圖像。訓(xùn)練圖像和測(cè)試圖像的選擇主要是為了便于三種方法在不均勻的光照和局部閉塞條件下的對(duì)比。在訓(xùn)練和測(cè)試識(shí)別率的實(shí)驗(yàn)過(guò)程中,每次均從每個(gè)人的10幅圖像的集合中刪除1幅,重復(fù)10次,每次刪除1幅不同的圖像。該測(cè)試方法將在后面涉及到。
3.2實(shí)驗(yàn)結(jié)果
3.2.1不同M′情況下的結(jié)果
本文測(cè)試了PCA、傳統(tǒng)模塊PCA和本文提出的新的模塊PCA算法在不同的向量數(shù)目下的識(shí)別效果。增加特征向量的個(gè)數(shù)可以提高識(shí)別率,但是同時(shí)計(jì)算成本也會(huì)隨著相連個(gè)數(shù)的增加而線性增長(zhǎng)。圖4為三種不同方法在不同的向量數(shù)目下的識(shí)別率。圖中結(jié)果是用ORL數(shù)據(jù)庫(kù)進(jìn)行測(cè)試的。可以看出,隨著M′的增大,PCA和mPCA的識(shí)別率均在增長(zhǎng)。當(dāng)M′>30時(shí)沒(méi)有太大改進(jìn);當(dāng)N=4,16,64,256,1 024時(shí),有相似的結(jié)果。實(shí)驗(yàn)表明本文提出的方法(NmPCA)具有更高的識(shí)別率。
3.2.2表情變化和不同光照條件下的結(jié)果
在本實(shí)驗(yàn)中主要測(cè)試了mPCA 和 NmPCA兩種方法下識(shí)別率、錯(cuò)誤識(shí)別率和錯(cuò)誤拒絕率,利用ORL數(shù)據(jù)庫(kù)在不同表情和光照條件下進(jìn)行測(cè)試。訓(xùn)練圖像和測(cè)試圖像按照3.2節(jié)進(jìn)行選擇。圖5給出了mPCA在不同情況下NmPCA的各種實(shí)驗(yàn)結(jié)果。
本文提出的方法最大的改進(jìn)在于不直接對(duì)人臉的原始圖像進(jìn)行模塊化的PCA處理,而是先將其進(jìn)行預(yù)處理也即獲得相位一致性圖像;然后對(duì)相位一致性圖像進(jìn)行模塊化PCA處理,得到了比較高的識(shí)別率。
(a) mPCA識(shí)別率、誤識(shí)率、錯(cuò)誤拒絕率分別為0.44,0.31,0.24情況下對(duì)應(yīng)NmPCA的值(b) mPCA識(shí)別率、誤識(shí)率、錯(cuò)誤拒絕率分別為0.48,0.36,0.16情況下對(duì)應(yīng)NmPCA的值圖5mPCA在不同情況下NmPCA的各種實(shí)驗(yàn)結(jié)果
4結(jié)束語(yǔ)
本文提出了一種新的模塊化PCA人臉識(shí)別方法,它既是對(duì)PCA方法的延伸,又是對(duì)傳統(tǒng)的模塊化PCA方法的改進(jìn)。首先對(duì)人臉圖像進(jìn)行的相位一致性處理消除了光照對(duì)識(shí)別帶來(lái)的影響,而模塊化兼顧了圖像的局部特征,降低了姿勢(shì)表情因素的影響。實(shí)驗(yàn)表明本文方法的有效性。
參考文獻(xiàn):
[1]CHELLAPPA R,WILSON C L,SIROHEY S.Human and machine recognition of faces: a survey[J]. Proc IEEE,1995,83(5):705-740.
[2]KIRBY M,SIROVICH L. Application of the karhunen loeve procedure for thecharacterization of human faces[J]. IEEE Trans Pattern Anal MachineIntell,1990,12(1):103 108.
[3]GRAHAM D B,ALLINSON N M.Characterizing virtual eigen signatures for general purposeface recognition[C]//Proc of Face Recognition: From Theory to Applications, NATO ASI Series F.[S.l.]: Computer and Systems Sciences,1998:446-456.
[4]MOGHADDAM B,PENTLAND A.Probabilistic visual learning for object representation[J]. IEEE Trans Pattern Anal Machine Intell PAMI,1997,19(7):696-710.
[5]MARTINEZA M.Recognition of partially occluded and/or imprecisely localized faces using a probabilistic approach[C]//Proc ofComputer Vision and Pattern Recognition. 2000:712-717.
[6]MURASE H, KIMURA F, YOSHIMURA M, et al. An improvement of the auto correlation matrix in pattern matching method and its applications to handprinted ‘HIRAGANA’[C]//Proc of Transactions on IECE.1981.
[7]MURASE H, NAYAR S. Visual learning and recognition of 3 D objects from appearance[J].Int J Computer Vision,1995,14:5-24.
[8]NAYAR S K, NENE N A, MURASE H. Subspace methods for robot vision[J].IEEE Trans Robot Automat,1996,RA 12(5):750-758.
[9]WENG J J. Crescepton and SHOSLIF: towards comprehensive visual learning[M]//NAYAR S K, POGGIO T.Early visual learning. Oxford:Oxford University Press, 1996:183-214.
[10]OPPENHEIM A V, LIM J S.The importance of phase in signals[J]. IEEE Proceedings, 1981,69:529-541.
[11]KOVESI P. Edges are not just steps[C]//Proc of the 5th Asian Conference on Computer Vision. 2002:23-25.
[12]SAMARIA F, HARTER A. Parameterisation of a stochastic model for human face identification[C]//Proc of the 2nd IEEE Workshop on Applications of Computer Vision. Saratoga:[s.n.],1994.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”