苗春玉,閆德勤
(遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連116029)
人臉識別特指利用分析比較人臉視覺特征星系進行身份鑒別的計算機技術(shù),是一項熱門的計算機技術(shù)研究,它屬于生物特征識別技術(shù),是人工智能與模式識別領(lǐng)域以及計算機視覺領(lǐng)域最富挑戰(zhàn)性的研究課題之一。特征提取是人臉識別中極其關(guān)鍵的一步。線性判別分析(LDA)也叫做 Fisher線性判別(FLD),是模式識別的經(jīng)典算法,其基本思想是將高維的樣本投影到低維最佳鑒別矢量空間,投影后保證樣本在該空間中有最佳的可分離性。但LDA算法過度強調(diào)了邊緣類與其他類的類間距離大小,導(dǎo)致在投影空間中近鄰類樣本的重疊。LDA算法在人臉識別應(yīng)用中常遇到兩個問題:(1)SSS小樣本問題(Small Sample Size)[1];(2)邊緣類的存在造成投影空間中近鄰樣本重疊的問題。而一種改進的LDA算法——最大邊際近鄰元判別分析方法(LMNLDA)可以有效地克服樣本類間數(shù)據(jù)重疊,增加了樣本間的相似度來描述數(shù)據(jù)之間關(guān)系,于是重新定義散度矩陣,從而得到該判別準(zhǔn)則。

如圖1所示,考慮一個M維的樣本模型投影到一維空間,假定有一個邊緣類4與類1、類2、類3相隔較遠,則根據(jù)傳統(tǒng)LDA算法得到的最佳投影方向A夸大了與其他3個類的類間距離較大的、可分性很好的類4,但卻造成了類間距離本來就小的類1、類2、類3的彼此重疊。因此,就分類性而言,基于Fisher準(zhǔn)則得到的鑒別方向并不是最優(yōu)的,最大邊際近鄰元判別分析方法同樣沒有對這類問題進行解決。
假設(shè)訓(xùn)練數(shù)據(jù)集 X={x1,x2,…,xc},其中 xk,k=1,2,…c是第k類數(shù)據(jù)集。LDA的目的是從高維特征空間里找出最有分類信息的低維特征,即尋找一個變換矩陣G,使得類內(nèi)盡可能緊湊,類間盡可能分離。通常用離散度來刻畫樣本的分布,于是得到Fisher準(zhǔn)則:

最大邊際近鄰元判別分析方法(LMNLDA)是一種改進的LDA算法。假設(shè){(xi,yi)}ni=1表示一個樣本輸入集,其中 xi∈RD,yi表示每一類的類別。 用二進制矩陣 yij∈{0,1}來表示類別yi和 yj是否匹配,并且矩陣yij是固定的,用變換L來決定樣本之間的度量[3]。首先對于每一個輸入樣本xi∈RD,根據(jù)k近鄰原則,采用歐式距離來進行距離度量,定義如下的懲罰函數(shù):

此函數(shù)包括兩部分,即在新的線性空間內(nèi),“引力”部分迫使拉近目標(biāo)近鄰點的距離使之盡量緊湊在一起,“斥力”部分迫使不同于輸入樣本類別的其他點盡量離得遠一些。兩部分相互對立、相互制約。最后,利用交替投影算法對式(3)進行優(yōu)化取得最小值,進而求得最優(yōu)變換矩陣L。
于是,在新的變換空間中,獲得的新的類內(nèi)、類間和總體散布矩陣為:

該方法能夠克服樣本類間數(shù)據(jù)重疊并且增加了一種描述數(shù)據(jù)之間關(guān)系的樣本間相似度,但并未解決邊緣類對選擇投影方向的影響及矩陣Sneww的奇異問題。
在計算等式SbG=SwG∧時的一個普遍問題是求Sw的逆,例如利用零空間方法,也就是忽略了零空間之后的列空間。但是Chen等[4].曾經(jīng)驗證了Sw包含了重要的判別信息,如果去掉零空間,則會丟失掉一部分有價值的信息,因此這里通過因數(shù)分解保持了信息的完整性,將等式(2)轉(zhuǎn)化為:




為了測試優(yōu)化的LMNLDA算法的識別性能,本文采用Yale人臉數(shù)據(jù)庫、ORL人臉數(shù)據(jù)庫和PIE人臉數(shù)據(jù)庫進行了識別對比實驗。
采用國際通用的Yale人臉數(shù)據(jù)庫,該數(shù)據(jù)庫由15人,每人11幅,共165幅人臉正面256級灰度圖像組成,每幅圖像大小為243 mm×320 mm。其中有些圖像是拍攝于不同時期的,人的臉部表情和臉部細節(jié)有著不同程度的變化,人臉姿態(tài)也有相當(dāng)程度的變化。圖2所示為預(yù)處理后的同一個人的人臉圖像,共選擇105個圖像為訓(xùn)練集,其余的60個圖像為測試集。
ORL人臉數(shù)據(jù)庫由劍橋大學(xué)實驗室1992年4月到1994年4月拍攝的一系列人臉圖像組成,具體為40個人,每個人由不同表情或不同視點的10幅圖像構(gòu)成,傾斜角度不超過20°。人臉庫中某一人的10幅圖像如圖3所示,一共選擇了280個圖像為訓(xùn)練集,其余的120個圖像為測試集。

PIE人臉數(shù)據(jù)庫擁有68人,有不同的姿勢,不同的燈光條件,以及不同的明暗表情等差別,其中包括了每個人的 13種姿態(tài)條件,43種光照條件和4種表情下的照片。如圖4所示的一部分圖像,一共選擇340個圖像為訓(xùn)練集,其余的11 214個圖像為測試集。


表1 在Yale人臉庫的識別結(jié)果比較

表2 在ORL人臉庫的識別結(jié)果比較

表3 在PIE人臉庫的識別結(jié)果比較
如表1、表 2、表3表示5種方法在取相同特征維數(shù)的情況下的識別率比較,通過對3種人臉數(shù)據(jù)庫的實驗結(jié)果對比可以看出,本文所提出的優(yōu)化的LMNLDA算法的識別率比其余4種方法的識別率都要高,5種算法呈現(xiàn)一個大體的趨勢,就是在一個確定的維數(shù)即本征維數(shù)上識別率最高,維數(shù)越大,識別率越趨于平衡。從以上的實驗結(jié)果可以看出,在相同特征維數(shù)的情況下OLMNLDA優(yōu)于其余4種算法,克服了邊緣類對選擇最佳投影方向的影響,進而能得到較為滿意的效果。實驗結(jié)果充分證明了本文算法的有效性。
[1]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J,et al.Fisherfaces:Recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[2]張賢達.矩陣分析與應(yīng)用[M].北京:清華大學(xué)出版社,2004.
[3]KILIAN Q,WEINBERGER L K,SAUL.Distance metric distance metric learning for large margin nearest neighbor classifiers[J].Journal of Machine Learning Research,2009(10):207-244.
[4]CHEN L,LIAO H,KO M,et al.A new lda-basedface recognition system which can solve the small sample size problem[J].Pattern Recognition,2000,33(10):1713-1726.
[5]MARTINEZ A M,ZHU M.Where are linear featureextraction methods applicable[J].IEEE Trans.On Pattern Analysis and Machine Intelligence,2005,27(1):1934-1944.
[6]LIU K,CHENG Y Q,YANG J Y,et al.An efficient algo rithm for Foley-Sammon optimal set of discriminant vectors by algebraic method[J].Int.J.Pattern Recog.Artif.Intell,1992,6(5):817-829.