摘要:人臉識別技術是計算機模式識別領域非常活躍的研究課題,在法律、商業等領域有著廣泛的應用背景。由于人臉圖像的特殊性,人臉識別問題也是模式識別領域一個相當困難的問題,要使這一技術趨于成熟還有許多工作需要做。
本文闡述了Fisher線性鑒別分析算法及其實現,同時針對其鑒別空間的統計相關性,提出改進措施。
關鍵詞:Fisher線性鑒別;特征子空間;正交鑒別分量
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2008)04-11694-05
The Technology of Face Recognition Based on Fisher Linear Discrimination Analysis
LIU Chang-hua
(Anhui Broadcasting Movie and Television College, Hefei 230022, China)
Abstract: The technology of face recognition is an active subject in the area of pattern recognition, which has broad applications in the fields of law, business etc. For the particularity of the face image, face recognition is also a very difficult problem in the field of pattern recognition. To make the technology tend to maturity, there is still much work left to do.
The methods to preprocess Fisher Linear Discrimination Analysis, An improvement measure, which is aimed on the statistical correlation of the discrimination space, is proposed.
Key words: Fisher Linear Discrimination Analysis; Eigen Subspace; orthogonal discrimination vectors
1 引言
線性判別函數是統計模式識別的常用的方法之一。它的基本思想是利用樣本集直接設計分類器,它首先假設判別函數g(x)是x的線性函數,即g(x)=wT+w0,對于C類問題可以定義為C個判別函數,gi(x)=wiT+wi0,i=1,2,…,C用樣本去估計wi和wi0,并把未知樣本歸到具有最大判別函數的類別中,一個基本的考慮是針對不同的情況,提出不同的設計要求,是分類器盡可能好地滿足這些需求。當然,要求不同,設計結果也將各異。這說明“盡可能好”是相對于設計要求而言的。這種設計要求,在數學上往往表現為某個特定的函數形式,稱之為準則函數,“盡可能好”的結果相應與準則函數取最優值。這實際上將分類器的設計問題轉化為求準則函數極值問題了。
對解決人臉識別問題來說,線性判別分析分類器是一個很好的選擇。一般所采用的線性判別分析函數是Fisher線性判別函數,也稱為FDA (Fisher Discriminant Analysis)。它首先由R.A.Fisher于1936年提出,不過直到近些年才被應用到人臉識別中。在模式識別領域,Fisher線性判別方法有著重大的影響,其基本思想就是在Fisher判別準則函數取得極值的條件下,求得一個最佳判別方向,然后再將模式高維特征向量投影到該最佳判別方向上,構成一個一維的判別特征空間。于是模式識別可以在一維空間中進行。
2 Fisher線性鑒別
2.1 Fisher線性鑒別原理
Fisher線性鑒別考慮把d維空間的樣本投影到一條直線上,即形成一維空間,那么即使樣本在d維空間形成若干緊湊的互相分得開的集群,如果把它投影到一條直線上,就可能使幾類樣本混在一起而無法識別,在一般情況下,總可以找到某個方向,使樣本投影到這條直線后分開的最好,尋找這條投影線正是Fisher要解決的問題。
在w1/w2兩類問題中,假設有N個訓練樣本xi(i=1,2,...,N),其中N1個來自于類型w1,N2個來自類型w2,兩個類型w1,w2的訓練樣本分別構成訓練樣本的子集X1,X2,令
yi是向量xi通過變換w得到的標量。事實上,對于給定的w,yi就是判別式的值。由于子集X1,X2的樣本經w映射后形成了兩個子集Y1,Y2。令‖w‖=1,那么yi就是xi在w的方向上的投影,使Y1,Y2最容易分開的w方向就是區分超平面的法線方向。
下面研究如何得到最佳w方向的解析式。令
為各類在d維特征空間的樣本均值向量。通過變換w映射到一維特征空間后,各類的平均值為
映射后,各類樣本的類內離散度矩陣定義為
Fisher思想是映射后兩類的平均值之間的距離越大越好,而各類的離散度越小越好。因此Fisher準則定義為
JF最大的解析解w*就是最佳解向量,即Fisher的線性判別式。下面求解極大值。先將式(1-4)變為w的顯函數。把(1-1)式和(1-2)式代入式(1-3),有
所以
式中
Sb=(m1-m2)(m1-m2)T (1-8)
Sb是原d維特征空間里的樣本類內離散度矩陣,它表示了兩類均值向量之間的離散大小。Sb越大越容易區分。
將(1-1)式和(1-5)式代入(1-3)式,可得
所以
Si是原d維特征空間樣本類內離散度矩陣,而Sw是樣本類內總離散度矩陣。類內離散度越小越便于分類。
將(1-6)式和(1-10)代入(1-4)式,就是JF(w)的顯函數
下面求解使JF(w)取最大值時的w*,可以用Lagrange乘子法求解。令分母等于非零常數。即
式中λ為Lagrange乘子。對于上式對w求偏導數,得
令偏導數為零。得到
式中的w*就是JF(w)的極值解,即d維空間到一維空間的最好投影方向。利用w*和式(1-1)可以將d維樣本xi(i=1,2,...,N)投影到一維。上式(1-13)為廣義特征值問題,滿足式(1-13)的解w*會有多個。
上述結論是在兩類問題中的基礎上推導出來的,對于C類問題,Fisher線形判別自然推廣的C-1判別函數,這樣形成d維空間向C-1維空間的投影。不言而喻,這里假設d>C,類內離散度矩陣的推廣顯然為:
2.2 推廣至c類的Fisher線性鑒別
設原始圖像x是n維向量。樣本類別有c類(即有c個人的人臉圖像樣本)w1,w2,...,wC,則樣本的類內離散度矩陣Sw,類間散布矩陣Sb和總體散布矩陣St分別為:
其中:P(Wi)為第i類樣本的先驗概率,mi=E(x/wi)為第i類樣本的均值向量(i=1,2,...,C),m=(Ex)為總體樣本的均值向量:
設第i類中含有ni個樣本,記為xij(j=1,2,...,ni),則類內散布矩陣Sw,類間散布矩陣Sb估計公式為:
其中xi和x分別為mi和m的估計:
這里,第i類樣本的先驗概率p(wi)一般取為:
Fisher鑒別準則函數定義為
使得式(1-25)取極大值的向量W是Fisher最佳鑒別方向,其物理意義是使得樣本集在W方向上的投影使得其具有最小的類內散布和最大的類間散布。也就是說,投影后使得同一類的樣本盡可能地靠近,而不同類的樣本盡可能地分開。
下面求解使JF(w)取極大值時的w*。式(1-25)中的JF(w)是廣義的Rayleigh商,可以用Lagrange乘子法求解,令分母等于非零常數,即令wTSww=c≠0定義Lagrange函數為:
L(w,式中λ為Lagrange乘子。對于上式對w求偏導數,得
令偏導數為零。得到
其中w*就是使式(1-26)取得極大值時的W的值。在Sw非奇異時候,式(1-27)兩邊左乘Sw-1,可得:
求解式(1-28)即為求解一般矩陣Sw-1Sb的特征值問題,Sw-1Sb最多有c-1個非零廣義特征值,c為樣本類別數。
最優LDA的判別函數為:
2.3 小樣本問題
Fisher線性鑒別在實際使用時,存在一些困難需要解決。令先驗概率等于類wi的樣本個數與總體樣本個數的比率,那么類內矩陣Sw的秩滿足
其中,d維原始圖像的維數,n為樣本總個數,c為樣本類別數即人數。從不等式(1-30)可知,當d>n-c即n 目前解決小樣本問題的方法可以分為三類,一是先對圖像進行降維,再采用線性判別方法,二是Fisher 線性鑒別最優準則,三是線性鑒別方法中的類內類間散布矩陣進行調整。 (1)降維后使用線性鑒別方法 這類方法在使用線性鑒別方法之前先對圖像進行降維,把樣本的維數d降到d'(d' (2) 對線性鑒別最優準則的修改 我們知道,Fisher標準是兩種衡量標準的組合。它一方面要最大化類間離散度,一方面要最小化類內離散度,當然這兩種散度也可以用其他指標來代替。Liu使用總體散布矩陣St來代替類內矩陣。由于總體散布矩陣的秩滿足rank(St)≤min(d,n-1),它仍然有可能是奇異的。因此我們尋求變換矩陣T使得在條件tr(T'StT=0)的限制下,有tr(T'SbT≠0),其中Sb是類內離散度矩陣,St=Sb+Sw。這個變換T通常并不是唯一的。Chen提出在St的零空間進一步最大化tr(WT,SbW)。Yu和Yang則提出直接LDA方法,在Sb的范圍尋找矩陣T。這種方法對類內散布矩陣Sb(或)和Sw進行同步對角化,使式WTSwW=Dw,WTSbW=I或WTStW=I成立。 (3)在LDA算法中調整類內離散度矩陣 Tian使用Sw的擬逆,當圖像樣本的數量增加的時候,擬逆趨近于它的逆。Hong將Sw調整為Sw+εI。Yu Bing加入權函數重新定義類間散布矩陣。 3 Subspace LDA Subspace LDA 算法又稱為Fisherface方法,通過特征臉方法將d維人臉圖像空間的維數先降低到特征子空間的k維;然后,根據fisher線性鑒別分析,將維數進一步降低到l維。所以Fisher判別的投影矩陣為 W=WpcaWlda 其中,Wpca就是在使用主分量分析法時所得到的特征子空間, 下面討論使用子空間線性鑒別分析進行人臉識別的具體算法。 (1)計算每一類的均值mi和總體的均值m。 (2)中心化每一類的圖像數據: (3)中心化每一類的均值: (4)將所有圖像數據組成一個數據矩陣X。 (5)將原始的圖像數據X投影到PCA降維形成的特征子空間Wpca 其中Wpca由原始圖像數據所對應得血方差矩陣的特征向量組成,即人臉子空間,也就是上一章所求出的特征臉空間。 (6)將中心化后的每一類的均值投影到子空間: (7)計算投影后子空間中的類間散布矩陣Sb和類內散布矩陣Sw (8)求解式(1-27)的廣義特征值問題。 (9)保留前面的l個特征向量。將特征值由高到低排列,保留對應的前面c-1個特征向量組成Fisher投影空間。 (10)投影分類。最后的投影方向即降維轉換矩陣W=WpcaWlda。首先將樣本圖像投影到人臉子空間中,然后將子空間中的低維的圖像再次投影到Fisher投影空間上。在測試的時候同樣將測試圖像投影兩次,選擇合適的分類其進行判別分類。 4 改進措施——正交分量鑒別分析 以上算法所得到的特征空間的基是非正交基。這樣,識別結果容易受到訓練集的影響,具有統計相關性。為了滿足統計無關性,需要使每一個鑒別向量滿足正交。 Okada提出一種利用Gram-Schmidt正交化求解正交鑒別空間的方法。其基本思想是:取線性鑒別分析中所得到的最大特征值對應的特征向量作為正交化的起始向量(第一個向量),然后將類內散布矩陣和類內散布矩陣在與起始向量垂直的方向上作投影變換,得到新的類內,類間散布矩陣,求其最大特征值對應的特征向量作為正交化第二個向量,依次類推。 顯然這樣得到的基的數目要比LDA得到的多,并且求法相當繁瑣。 本文通過修改Fisher最優判別準則,使所得到的鑒別分量既能夠滿足使類內離散最小,類間離散最大的要求,又能夠使其滿足統計無關性,最終得到一組正交鑒別分量以組成線性鑒別空間。 如前所述,Fisher線性鑒別準則函數為 由行列式的性質, 因此準則函數可寫成 可得到最優變換w是特征向量方程Sw-1SbSw-1w=wΛ的解向量。這些解向量構成了式(1-31)中的Wlda 。這些解向量也就是矩陣Sw-1SbSw-1的特征向量。 從式(1-28)可知,原來的Fisher線性鑒別特征空間的向量是矩陣Sw-1Sb的特征向量。由定義可知,類間離散度矩陣Sb和類內離散度矩陣Sw都是對稱矩陣。但是由 (Sw-1Sb)T=SbT(Sw-1)T=SbT(SwT)-1=SbSw-1 可知Sw-1Sb并不一定是實對稱矩陣。所以其特征向量并不一定滿足相互正交。這樣就解釋了為什么Fisher線性鑒別方法或子空間線性鑒別方法所得到的鑒別向量是與統計相關的,受到訓練集的影響。 但是修改后的Fisher線性鑒別準則(1-37)所得到的鑒別向量是矩陣Sw-1SbSw-1的特征向量。由 (Sw-1SbSw-1)T=(Sw-1)TSbT(Sw-1)T=(SwT)-1SbT(SwT)-1=Sw-1SbSw-1 可知矩陣Sw-1SbSw-1是實對稱矩陣。由線性代數的知識可知,實對稱矩陣對應于不同特征值的特征向量是互相正交的。因此,只要確定矩陣Sw-1SbSw-1的特征值互不相同,我們就可以認為所得到的鑒別分量是正交的,從而滿足了統計無關性。 我們將修改后的Fishe判別準則用于Subspace LDA方法,并得到了矩陣Sw-1SbSw-1在不同情況下時的特征值。我們使用特征臉方法進行降維的時候,取不同數目的特征向量構成特征子空間Wpca,并求出在上述變化下Sw-1SbSw-1的特征值。將這些特征值按從大到小降序排列,與之對應的特征向量隨之排序。我們試圖在排序后的特征向量中尋找合適數目的正交鑒別分量以構成Wlda,以使其滿足統計無關性。這些滿足統計無關性的鑒別向量所對應的特征值應該互不相等。 5 改進算法的識別性能 下面考察改進算法的識別性能。如前所述,改進的算法能夠使得線性鑒別空間滿足統計無關性,使其鑒別分量相互正交,從而提高其算法的識別與分類性能。從圖1看出,雖然Subspace LDA 算法識別性能低于特征臉算法,但是我們提出的改進算法可以大幅度地提高其識別率,并且識別率也普遍超過了特征臉算法。其在子空間維數達到60左右的時候,識別率達到最高,為0.91。而特征臉方法的識別率最高為0.89。 從圖中可以看出,未經過小波變換情況下,算法的識別性能要高于經過小波變換的情況。在未經過小波變換時,改進算法的識別性能最高可達到0.93.可見,小波變換雖然大幅度地降低了識別時間和訓練時間,但是對于線性鑒別分析來說,小波變換削弱了圖像間的差異,丟失了一些分類信息,從而也造成線性鑒別分析的分類性能的下降。 6 小結 本文基于Fisher線性鑒別分析算法,考察了子空間線性鑒別分析。并且指出子空間線性鑒別分析的缺點,即鑒別空間不滿足統計無關性。針對此缺點,本文提出了使鑒別分量滿足正交的改進措施。通過修改Fisher鑒別準則,使其鑒別空間滿足正交,從而獲得了優于子空間線性鑒別的識別性能。 參考文獻: [1] 張敏貴. 基于小波和支持向量機的人臉識別方法研究[M]. 西北工業大學控制理論與控制工程,2003. [2] 金忠,楊靜宇,陸建峰. 一種具有統計不相關性的最佳鑒別矢量集[M]. 計算機學報,1999, 22(10):1105-11083. [3] 周激流,張嘩. 人臉識別理論研究進展[M]. 計算機輔助設計與圖像學學報,1999, 11(2):180-184. [4] 周杰,盧春雨,張長水,李衍達. 人臉識別方法綜述[M]. 電子學報,2000, 28(4):102-106. [5] P. N. Belhumeur, J. P. Hespanha, D. J. Kriegman, Eigenfaces vs fisherfaces Recognition using classs pecific linear projection, IEEE Trans,1997. [6] L. Chen, H. Liao, M. Ko, J. Lin, and G. Yu. A new lda based face recognition System which can solve the small sample size problem, Pattern Recognition, 2000,33(10):1713-1726. 注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”