王科俊,鄒國鋒,張潔
(哈爾濱工程大學自動化學院,黑龍江哈爾濱 150001)
SPCA參數對單樣本人臉識別效果影響分析
王科俊,鄒國鋒,張潔
(哈爾濱工程大學自動化學院,黑龍江哈爾濱 150001)
奇異值擾動的主分量分析(SPCA)是一種有效的單樣本人臉識別方法,但SPCA算法的識別效果受參數選擇的影響比較大,針對SPCA算法中衍生圖像生成參數n和結合參數α的不同取值對識別效果的影響進行了分析,利用ORL人臉庫和CAS-PEAL人臉庫做了大量的實驗和比較分析,實驗結果表明給出的SPCA參數選取方法和取值范圍是合理的,并有效地提高了SPCA算法的實際應用效果和單樣本人臉識別的性能.
人臉識別;奇異值分解;結合投影主分量分析;奇異值擾動主分量分析;衍生圖像;結合圖像
單樣本人臉識別問題[1]給人臉識別技術帶來巨大挑戰,近年來已成為人臉識別研究中的一個重要方向,并得到廣泛關注.單樣本人臉識別可以有效降低訓練樣本的收集成本和存儲成本,加快人臉識別系統的處理速度,所以在犯罪取證、身份證驗證、銀行和海關監控等一些特殊的場合得到應用;但是由于訓練樣本的有限性,單樣本人臉識別的識別率往往不高,所以如何有效提高單樣本條件下的識別率已成為人們研究的重點.
近年來,研究人員分別從不同的角度對單樣本人臉識別問題進行了研究,王科俊等[2]將目前文獻中出現的主要針對單訓練樣本人臉識別的方法概括為以下幾類:基于幾何特征的方法、樣本擴張法、特征子空間擴展法、通用學習框架法、圖像增強法、神經網絡法和三維識別方法等.其中,圖像增強法是使那些對于識別比較重要的特征更加突顯出來,同時對那些次要無用的、甚至對識別造成干擾的信息進行抑制的一種方法,該方法側重于圖像的預處理.基于奇異值擾動的主分量分析[3](singular value decomposition perturbation principal component analysis,SPCA)就是利用原圖像奇異值分解(singular value decomposition,SVD)的重構圖像來增強原圖像的一種方法,通過增強能夠使樣本提供的信息得到充分利用,可以有效提高識別率,特別是在單樣本人臉庫中人臉類別比較多的情況下效果更顯著.SPCA人臉識別方法易受人臉圖像大小影響,隨著人臉圖像的不斷變小,SPCA方法和其他人臉識別方法的區別變得并不那么明顯,同時,SPCA方法也受到衍生圖像重構參數和結合參數的嚴重影響,但是這2個參數的取值目前還沒有可依據的理論方法.
針對SPCA人臉識別方法易受到奇異值分解參數和結合圖像生成參數影響的問題,本文就這2個參數的取值方法進行了深入分析,同時為了充分討論這2個參數的影響,在ORL人臉庫和CAS-PEAL人臉庫上進行了大量實驗,驗證了不同取值方式對于識別效果產生的不同影響,得出了SPCA人臉識別方法中參數取值的原則和規律,為SPCA在人臉識別中的進一步應用提供了參考依據.
主分量分析法(principal component analysis,PCA)[4]由 Kirby 和 Sirovich[5]首先引入人臉識別,并取得巨大成功,成為一個判別人臉識別方法性能好壞的公認基準.針對單訓練樣本人臉識別問題,Wu和Zhou[6]在PCA的基礎上提出了結合投影的主分量分析(projection combined principal component analysis,(PC)2A),這種方法能夠在一個更小的特征空間中獲得優于傳統PCA算法的識別性能,但是Chen等[7]又進一步探討了n階(PC)2A,他們認為采用高階投影組合能夠進一步降低特征維數,而識別性能略有提高,并提出了E(PC)2A(enhanced(PC)2A)算法,隨后Zhang等[3]又注意到人臉圖像矩陣的奇異值除了對噪聲不敏感外,還具有保持輸入向量的某些代數和幾何不變性的重要性質,從而提出了奇異值擾動的主分量分析(singular value decomposition perturbation principal component analysis,SPCA)
(PC)2A是專門針對單樣本人臉識別提出的,側重圖像預處理的一種擴展的PCA方法,該方法把原人臉圖像與其一階投影相結合,以增強人臉圖像中對識別有利的信息,抑制人臉圖像中對識別無用的信息,從而提高單訓練樣本情況下的人臉識別效果.
假設P(x,y)是一幅經過歸一化的大小為N1×N2的圖像的灰度矩陣,x∈[1,N1],y∈[1,N2],P(x,y)∈[0,1].P(x,y)的水平和垂直投影分別定義如式(1)和式(2):


式(1)、(2)的2個投影在一定程度上反映了人臉圖像重要局部區域的分布特點.
P(x,y)的投影圖像定義為


最后,定義P(x,y)的結合投影圖像Pa(x,y).

式中:0<α<1.0為結合參數,Pa(x,y)的取值有可能超出[0,1],可對其進行歸一化使其取值在[0,1]內,歸一化策略如下:

最后,得到原圖像的結合投影圖像P'α(x,y),然后對其運用PCA進行降維和特征提取.根據文獻[6],在使用較少的特征臉(10%~15%)情況下,即在一個更小的特征空間中,(PC)2A可以獲得比傳統特征臉方法更高的識別精度.
遵循(PC)2A的思路,SPCA為研究單樣本人臉識別問題提供了一條新的思路,它是一種圖像增強的方法.它首先需要得到圖像的奇異值擾動衍生圖像,再把原圖像和衍生圖像按一定的法則結合形成結合圖像,最后對結合圖像運用PCA以識別圖像.SPCA的目的就是要從單幅人臉圖像中“擠出”更多的信息,這些“擠出”的信息包含某些對識別很重要的人臉特征.
假設I(x,y)是一幅歸一化的大小為N1×N2的圖像灰度矩陣,其中 I(x,y)∈[0,1],根據奇異值分解定理,I可表示為


然后,通過擾動原圖像I的奇異值來獲得I的奇異值衍生圖像P,P定義為

式中:n是一個實數,取值范圍為1<n<2.
得到衍生圖像P后,再把P與原圖像I線性結合,產生一幅新的結合圖像J(x,y),結合方式如式(5):

式中:α是結合參數,取值范圍為0<α<1.0.
通過式(4)求取衍生圖像的過程實質是圖像重構的過程,當n=1時,衍生圖像P等于原始圖像I;當n>1時,滿足λi>1的奇異值對應的特征向量將被放大,同時λi<1的奇異值所對應的特征向量被縮小,因此衍生圖像P在強調較大奇異值作用的同時,對較小的奇異值進行了限制,實現了對人臉圖像中有用信息的放大增強,對無用信息的削弱衰減.所以,將P結合到I得到結合圖像J的這一過程,在保持原始圖像主要信息的前提下,將會對輕微的表情、光照和遮擋等變化具有較好的適應性.
結合圖像 J(x,y)的取值有可能超出[0,1],盡管這對最終的識別結果不會有影響,但顯示圖像時會產生變形.為此,對J(x,y)的取值也采用式(3)進行歸一化.然后,對歸一化后的結合圖像J(x,y)而不是原圖像I(x,y)采用主分量分析法提取特征和識別,這就是奇異值擾動的主分量分析法,也即SPCA.
通過1.2節的分析,可以看出參數n和α對SPCA過程及識別效果有嚴重的影響.文獻[3]在介紹SPCA算法的過程中,將參數α的值設定為0.25,但并沒有給出取值的原則和方法,只是在參數α=0.25的情況下簡要討論了參數n對識別效果的影響,得出了n取 3/2時SPCA效果較好的結論.另外,何家忠等[8]在討論一種新的圖像增強方法時,也對參數的取值進行了分析,但也只是在固定α=0.3的情況下分析了參數n的變化帶來的影響,并得出n取9/8時算法的識別性能較好,然后在固定n=9/8時分析了參數α對算法性能的影響,得出了參數α的取值范圍為0.15<α<0.4.顯然,固定一個參數而分析另一個參數對SPCA過程及識別效果的影響是不全面的,應當在參數n和α同時變化的情況下進行有效的分析.
文獻[3]指出在衍生圖像的重構過程中參數n是一個大于1的實數,n取大于1的實數可以有效地將有用信息進行增強,無用信息進行衰減,但并不是n越大越好,當n取較大值時衍生圖像的內部信息結構被擾亂,圖像變得平滑模糊,不再適合用來表征人臉圖像,會導致識別率下降.所以在一些文獻中把參數n的變化范圍限制在1~2,其中文獻[3]通過定義n=1+1/(11 -m)(m=1,2,…,10)將n的取值設定在1~2,但是這種取值方式使得n的取值在m取1~5的數時過于密集,而當m在7~10變化時n的取值又過于稀疏.當m取1~5的數時,n的取值分別為 1.1、1.111 1、1.125、1.143、1.166 7,顯然,參數n這樣的取值變化較小,對于奇異值衍生圖像的生成不會產生明顯的影響變化,從而對于最終結合圖像增強效果的影響也并不明顯,不利于分析n的變化給識別率所帶來的影響;而當m取值為7時,n的取值為1.25,當m的取值為8時,n對應的為1.333,當m變化到9的時候n的取值為1.5,所以中間的取值1.4對于識別效果有怎么樣的影響無法進行有效的分析.
本文對文獻[3]中n值的取值方式進行了改進,采取均勻取值的方式,定義n取值為1.1,1.2,…,1.9,2.0,這樣可以更全面和均衡準確地分析出取值分布對于識別率的影響.另外,對參數n的取值范圍,分別在ORL人臉庫和CAS_PEAL人臉庫上進行了大量的實驗,實驗表明文獻[3]將參數n的上限值確定在2.0是并不合理的,在實際的人臉識別系統中應當根據具體采用的人臉數據庫中,人臉圖像模式的復雜程度設定參數n的上限值,而將參數n固定在某一個值的做法是不恰當的.
而對于結合參數α會對識別率產生怎么樣的影響,文獻[3]中沒有給出明確的取值原則,本文則通過大量的實驗對比得出了結合參數α合理的取值范圍.在獲得參數n和α較小的取值范圍后,再在這個小范圍內進行更為精確細致的實驗,最終得到參數n和α的最優取值.
SPCA算法的實質是奇異值分解結合主分量分析,因此可連接圖像的奇異值分解及主分量分析2個步驟來實現,具體實現步驟如下:
1)對于人臉庫中的一幅人臉圖像,可用實矩陣A∈RM×N來表示,先把A的像素值范圍歸一到[0,1],計算 ATA∈RN×N.

3)根據式(4)計算A的奇異值擾動衍生圖像P,根據式(5)和(3)計算結合圖像J.


7)訓練圖像和測試圖像按P=UTY往投影空間U投影,得到投影向量,再利用歐式距離來確定測試圖像的類別.
本文分別在ORL人臉庫和CAS-PEAL人臉庫上進行了大量的實驗,其中ORL人臉庫是一個變化模式相對單一且由西方人人臉構成的人臉庫,而CAS-PEAL人臉庫是變化模式相對較為復雜且由東方人人臉組成的人臉庫.通過在這樣的2個人臉庫上的實驗可以更充分地驗證參數n和α取不同值時對SPCA識別效果的影響.
實驗所用人臉圖像為英國劍橋大學AT&T實驗室創建的ORL人臉數據庫[10].ORL人臉庫包括40個人,每人10幅,共400幅人臉圖像,圖像為256級灰度,尺寸大小為92×112(寬×高)像素.照片拍攝于不同的時間,采用統一的黑色均勻背景,在一定范圍內存在光照變化,面部表情變化(睜眼或者閉眼、微笑或者嚴肅)以及臉部細節變化(如是否戴眼鏡).所有的照片都是正面直立的,允許一定角度的頭部傾斜和旋轉,一般旋轉角度不超過20°.這有利于驗證SPCA參數是否可以抑制無用干擾信息,對于分析參數變化對識別效果的影響是有利的.
實驗中選取40個人,每人一幅具有正常表情的標準人臉圖像作為訓練樣本庫,剩余的360幅圖像用于測試.圖1給出了其中一個人的圖像.

圖1 ORL人臉庫中一個人的圖像Fig.1 One person’s images in ORL face database
針對參數n和α取不同值,采用文獻[3]中的取值方式和本文提出的均勻取值方式進行了實驗,圖2和圖3分別給出了2種取值情況下圖像的奇異值擾動衍生圖像、結合圖像隨n變化的情況.

圖2 文獻[3]中m取不同值時的衍生圖像和結合圖像Fig.2 The derived images and combined images in[3]with different m


圖3 本文中n取不同值時的衍生圖像和結合圖像Fig.3 The derived images and combined images in this paper with different n
通過上面的實驗圖像可以明顯地看出,當采用文獻[3]中的取值方式時,在α=0.25的情況下,m從1~6的變化過程中,衍生圖像幾乎沒有變化;同樣得到的結合圖像也沒有太大變化;而當m從8變化到10時,衍生圖像則發生較大的模糊變化,這對于充分分析n取不同值對衍生圖像的重構帶來的影響是不利的.所以,為了能夠均衡、充分地分析n和α的變化給識別率帶來的影響,分別針對文獻[3]的取值方法和本文的取值方法進行了大量的實驗.實驗結果如圖4、5與表1、2所示.

圖4 本文采用n均勻取值方式下的識別率Fig.4 Recognition rate n values in the uniform mode

圖5 文獻[3]中n取值方式下的識別率Fig.5 Recognition rate n values in[3]

表1 參數n 2種取值方式下的平均識別率對比Table 1 The average recognition rate n in two values modes

表2 參數n 2種取值方式時參數α變化對平均識別率的影響Table 2 The influence of parameter α change under different n values
通過圖4和圖5以及表1、2中的實驗數據,2種取值方式隨著n的不斷增大,平均識別率都呈現下降的趨勢,但是相對于文獻[3]提出的取值方法,采用均勻取值的方式時,識別率呈現均勻下降的趨勢,能更全面地觀察出n的變化給識別率帶來的影響.通過表1數據可以看出,當1<n≤1.6時平均識別率在80%以上,識別效果較好.
在分析n取值變化給識別率帶來影響的同時,也詳細地針對α的變化給識別率帶來的影響進行了大量的實驗,通過表中的數據,隨著α的增大平均識別率整體呈現下降的趨勢,在n值均勻變化的情況下,隨著α的增大平均識別率的變化范圍較寬,結合上述2個表中的數據,0.1<α<0.5時,SPCA的識別性能較好.
上面的實驗數據只是說明了識別率受參數變化影響時的總體變化趨勢,并得出了參數n和α的一個大致的取值范圍.在得出此范圍之后,本文又進行了實驗,結果如圖6所示.從而得出n和α的最佳取值.

圖6 n和α小范圍變化時的識別率Fig.6 Recognition rate n and α change in a small area
結合表1、表2、圖6的實驗數據可以看出,當n取值為1.15或1.2時平均識別率分別為87.34%和86.63%,而單項識別率也是比較高的.而對于α的取值為0.25時,平均識別率為85.39%是比較高的,而且單項的識別率也是最高的.綜合以上的分析,最終得到參數n和α取值分別為1.15和0.25.
由3.2節的測試數據可以看出,由于ORL人臉庫中的人臉模式變化單一,所以識別效果還令人滿意.現在再采用人臉模式變化較多的CAS-PEAL人臉庫進行實驗,測試參數取值對于識別效果的影響.CAS-PEAL人臉庫包含了1 040名中國人共99 450幅頭肩部圖像,所有圖像在專門的采集環境中采集,涵蓋了姿態、表情、飾物和光照4種主要變化條件,部分人臉圖像具有背景、距離和時間跨度的變化.本文實驗中采用每人的7幅圖像,這7幅圖像分別是每人在表情、正常、背景、距離、飾物、姿態和光照變化下的人臉圖像.圖7是選擇出來的一個人在7種變化下的人臉圖像.

圖7 CAS-PEAL人臉庫中選擇出來的一個人的人臉圖像Fig.7 One person’s images in CAS-PEAL face database

圖8 本文采用的n均勻取值方式下的識別率Fig.8 Recognition rate n values in the uniform mode

圖9 文獻[3]中n取值方式下的識別率Fig.9 Recognition rate n values in[3]

圖10 n 2種取值方式下的平均識別率Fig.10 The average recognition rate n in two values modes

圖11 參數α變化對平均識別率的影響Fig.11 The influence of parameter α change
通過圖8~11的實驗數據看出,識別率有明顯的下降,這也恰恰說明了在復雜情況下提高單樣本人臉識別率是困難的.采用文獻[3]的取值方式,參數n被限定在1~2,但是顯然SPCA算法的識別率沒有達到最優值,識別率明顯處于上升階段,無法得出參數n對識別效果有影響的正確結論.所以本文在此基礎上,進行了進一步的實驗,把參數n的取值范圍擴大到了1~3,實驗數據表明參數n在取值為2.1和2.2時平均識別率和單項識別率是最高的,當n變化到2.8以后識別率基本維持在一個固定的值,不再發生變化.
而參數α對識別效果的影響并不是特別明顯,采用文獻[3]的取值方式時,在參數α變化的情況下平均識別率基本都維持在53%左右,而采用本文的方法時,平均識別率維持在54%左右,并沒有大幅度的增減現象出現.但是通過單項識別率可以看出,參數α取值在0.5~1.0的識別率相對較高.
通過以上的分析和格數據得出這樣的結論,在CAS-PEAL人臉庫上進行實驗測試SPCA參數的影響,參數α的取值范圍為0.5<α<1.0,參數n的最佳取值為2.1,已經超出文獻[3]所規定的2.0的上限值.
本文通過在ORL人臉庫和CAS-PEAL人臉庫上的大量實驗,驗證了SPCA算法衍生圖像生成參數n和結合圖像計算中結合參數α對識別效果有嚴重的影響.針對不同情況下的人臉庫,參數n和參數α應當有不同的取值規律,并不是一成不變的.對于人臉模式變化較為單一且由西方人人臉構成的人臉庫,一般參數n和參數α取值是比較小的,而對人臉模式變化較為復雜且為東方人的人臉庫,參數n和參數α取值相對較大.這主要是由于在人臉模式單一的情況下,如果參數n取值較大衍生圖像的內部信息結構被擾亂,圖像變得平滑模糊,不再適合用來表征人臉圖像,會導致識別率下降.但是在人臉模式較為復雜的情況時,人臉圖像信息已經很復雜,經過衍生圖像變換后,最終得到的人臉結合圖像變得模糊從而忽略了一些細節信息,但這樣更能表達出復雜狀態下各種人臉的概況信息,所以識別率反而提高.
奇異值擾動的主分量分析(SPCA)首先對人臉圖像進行特殊的預處理,以增強人臉圖像中對識別有用的信息,并抑制那些對識別不利的信息,然后再使用主分量分析法進行特征提取和識別,為單訓練樣本人臉識別開辟了一條新的思路.本文重點討論并測試了SPCA中衍生圖像生成參數n和結合圖像計算中結合參數α對識別結果的影響,得出了SPCA取得較好識別效果時參數的取值原則,從而進一步說明SPCA方法的有效性.
[1]TAN Xiaoyang,CHEN Songcan,ZHOU Zhihua,ZHANG Fuyan.Face recognition from a single image per person:a survey[J].Pattern Recognition,2006,39:1725-1745.
[2]王科俊,段勝利,馮偉興.單訓練樣本人臉識別技術綜述[J].模式識別與人工智能,2008,21(5):77-83,635-642.
WANG Kejun,DUAN Shengli,FENG Weixing.A survey of face recognition using single training sample[J].Pattern Recognition and Artificial Intelligence,2008,21(5):77-83,635-642.
[3]ZHANG Daoqiang,CHEN Songcan,ZHOU Zhihua.A new face recognition method based on SVD perturbation for single example image per person[J].Applied Mathematics and Computation,2005,163(2):895-907.
[4]TURK M,PENTLAND A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[5]KIROBY M,SIROVICH L.Application of the Karhunen-Loeve procedure for the characterization of human faces[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,12(1):103-108.
[6]WU Jianxin,ZHOU Zhihua.Face recognition with one training image per person[J].Pattern Recognition Letters,2002,23(14):1711-1719.
[7]CHEN Songcan,ZHANG Daoxiang,ZHOU Zhihua.Enhanced(PC)2A for face recognition with one training image per person[J].Pattern Recognition Letters,2004,25(10):1173-1181.
[8]何家忠,杜明輝.單樣本人臉識別中一種新的圖像增強方法[J].微計算機信息,2006,22(3):266-268.
HE Jiazhong,DU Minghui.A new image enhancement method for face recognition with single training sample[J].Microcomputer Information,2006,22(3):266-268.
[9]徐士良.C常用算法程序集[M].2版.清華大學出版社,1996:74-77.
[10]劍橋大學 AT&T實驗室.ORL人臉庫建[EB/OL].[2010-05-12].http://www.cl.cam.ac.uk/Research/DTG/attarchive/facedatabase.html.

王科俊,男,1962年生,教授,博士生導師,博士,哈爾濱工程大學自動化學院副院長,哈爾濱工程大學模式識別與智能系統學科帶頭人.現任中國人工智能學會理事、中國人工智能學會科普工作委員會副主任、黑龍江省人工智能學會理事長、黑龍江省神經科學學會副理事長、黑龍江省神經科學學會人工智能與醫學工程專業委員會主任、黑龍江省自動化學會理事.曾獲得部級科技進步二等獎2項,三等獎3項,省高校科學技術一等獎1項、二等獎1項,中國船舶工業總公司優秀青年科技工作者稱號,2002年黑龍江省十大杰出青年提名獎,哈爾濱工程大學首屆十大杰出青年稱號.主要研究方向為生物特征識別與智能監控、神經網絡、計算生物信息學等.完成科研項目20余項,在研項目10余項.發表學術論文150余篇,出版學術專著3部,國防教材1部,主審教材2部.

鄒國鋒,男,1984年生,博士研究生,主要研究方向為生物特征識別與智能監控.

張潔,女,1987年生,碩士研究生,主要研究方向為生物特征識別與智能監控.
Analysis of the influence of SPCA parameters on the recognition of a single sample face
WANG Kejun,ZOU Guofeng,ZHANG Jie
(College of Automation,Harbin Engineering University,Harbin 150001,China)
Singular value decomposition perturbation principal component analysis(SPCA)is an effective singlesample face recognition method;however,the identification results of the SPCA algorithm are seriously affected by parameter selection.In this paper,the effect on the identification,which was caused by the derived image parameter and the combined image generation parameter in the SPCA algorithm,was analyzed.Many experiments and comparative analyses were performed on the basis of the ORL face database and the CAS-PEAL face database.The experimental results show that the SPCA parameter selection method and the parameter range given in this paper are reasonable.In addition,reasonable parameters are effective in improving practical application of SPCA algorithms and the recognition performance of a single-sample face.
face recognition;singular value decomposition;(PC)2A;SPCA;derived image;combined image
TP391.4
A
1673-4785(2011)06-0531-08
10.3969/j.issn.1673-4785.2011.06.009
2010-09-14.
國家“863”計劃資助項目(2008AA01Z148);黑龍江省杰出青年科學基金資助項目(JC200703);哈爾濱市科技創新人才研究專項基金資助項目(2007RFXXG009).
鄒國鋒.E-mail:zgf841122@163.com.