任克強, 張靜然
(江西理工大學 信息工程學院,江西 贛州 341000)
在自動人臉識別過程中,如何高效的將原人臉圖像空間中數據映射到低維空間中是一個關鍵問題,特征降維不僅可以使原數據變換后有特定屬性,而且可以提高計算的效率。子空間作為一種有效的降維和特征提取方法在人臉識別領域有廣泛應用[1]。
線性子空間降維方法有基于主成分分析(principle component analysis,PCA)[2]、線性判別分析(linear discriminant analysis,LDA)及二維的2DPCA和2DLDA等方法,但以歐氏結構來衡量樣本點間相似性難以挖掘數據本征的特征,導致傳統的線性子空間算法很難對數據在低維空間的分布做合理的估計。近年來流形學習領域產生的大量研究成果表明人臉圖像數據呈現非線性結構,且可能取樣于嵌入在高維歐氏空間的低維流形子空間中,很難利用全局線性映射來尋求這種低維投影。以不同準則來對數據進行降維的流形學習算法嘗試揭示數據的本征分布結構,這種非線性降維方式直觀有效,目前在人臉識別方向基于流形的子空間算法有局部保持投影(locality preserving projection,LPP)[3]以及對稱局部保持的半監督維數約簡[4]等。但為了更加有效的利用樣本標簽信息進行樣本的分類,研究者們提出了監督的判別流形學習算法,如監督拉普拉斯特征圖[5]、多鄰域保持嵌入[6]等,在保持樣本局部信息的同時,提升由樣本類別信息帶來的判別能力。以上降維約簡技術從樣本中提取有較好判別性的子特征,但對噪聲和有損信號的應對能力不理想,而稀疏表示則對有損信號有較好的建模能力。文獻[7]借鑒LPP的局部嵌入思想以保持數據的稀疏l1圖結構,編碼階段先根據以訓練樣本作為字典學習稀疏系數,然后投影保持這種稀疏關系;識別階段直接將測試樣本由學到的投影矩陣投影到低維子空間,用最近鄰識別器分類。文獻[7]能夠較好地提取保持數據間稀疏特性的特征,但沒有合理利用樣本標簽信息;文獻[8]在此基礎上考慮稀疏結構投影保持的同時,利用樣本標簽信息來提升特征判別能力及降低算法復雜度。文獻[9]在樣本標簽信息可利用情況下保持數據的稀疏l1圖結構,最終轉化為回歸問題求解投影矩陣。文獻[10]在獲取數據特征表示的同時保持變換后的樣本關系,可以提取利于子空間分類的稀疏的近鄰結構。
針對近鄰圖中通過實驗方法選擇近鄰參數K不能完全反映數據真實近鄰分布的問題,本文提出局部Fisher準則判別投影算法,通過求解樣本在總體樣本下稀疏表示來自適應選擇樣本的近鄰參數,以使樣本間分布關系盡可能符合真實情況,在此基礎上利用樣本標簽信息構造自定義的類內局部散度矩陣和類間局部散度矩陣,以提高樣本標簽信息帶來的判別能力。
局部保持算法的識別效果很大程度依賴近鄰圖中參數K的選擇,實際應用要進行大量實驗來選擇最優參數,而且對于分類任務而言,首要目標是設法讓不同類的樣本有區分度。針對這些問題,本文提出局部Fisher準則判別投影算法。
通過實驗來選擇近鄰矩陣中近鄰尺寸K的大小相當的耗時,而且以歐氏距離作為樣本點間相似性度量,是建立在樣本相互獨立的基礎上,實際上會忽略不同樣本間的聯系性。所有的樣本都使用人工選擇的固定K近鄰參數,實際應用中不合理,也不能真正的反應樣本流形結構,如果從鄰接矩陣中元素稀疏的角度考慮,可以運用稀疏表示來獲取鄰接矩陣,使得樣本點的近鄰結構非固定大小。
(1)


(2)

如果同類樣本在低維子空間中分布聚集,而不同類樣本在低維子空間中分布分散,那么分類算法構造的分類超平面具有更強的泛化能力,而且有更優的分類性能。
為保證樣本xi與同類近鄰樣本在降維后仍然保持近鄰關系,可以考慮減小樣本xi與同類鄰域矩陣中樣本的平均距離來實現,該距離表示為
(3)
式中X′為全體樣本集合構成的矩陣
X′=[x1,x2,…,xn]∈Rm×n
由此構造類內局部散度矩陣為

(4)

本文不是按每個樣本等權值的方式來構造類內散度矩陣,而是根據信號稀疏表示后的重構系數,即使是同類樣本信號它們間也有不同的相似性,利用這種稀疏關系來構造類內散度矩陣可以更優的逼近樣本的真實分布。
樣本xi與近鄰矩陣中不同類樣xj(li≠lj,j=1,2,…,n)本間平均距離為
(5)
為了有更優的分類特性,類間散度分布應盡量的大,可以考慮增大降維后的不同類樣本點間的稀疏近鄰距離。由不同類樣本的稀疏近鄰關系構造類間散度矩陣為


(6)

一般將每個近鄰圖上的樣本視作嵌入在同一個子流形上,這樣兩個非同類的近鄰樣本就可能位于同一子流形,直接采取保持局部近鄰關系的投影算法會導致樣本在低維子空間重疊的現象。用于分類的降維投影算法應考慮將處于同一子流形上非同類樣本進行相互分離。
(7)
式中μ為均衡因子,0<μ<1。
同時需考慮投影降維后局部的近鄰結構得到保持
(8)

為防止投影方向的幅值隨意變化而影響求解,可以添加如下正交投影限制條件
WTW=Id×d
(9)
因此,本文局部Fisher準則判別投影的目標函數表示為
γWTX′LX′TW),s.t.WTW=I
(10)
式中γ為均衡因子,用來平衡局部判別項和局部近鄰結構保持項的重要性,其中γ>0。式(16)的約束問題可以轉化為Lagrange乘子法進行求解

γwTX′LX′Tw-λwTw=wTX′(μ(Lw+Lb)-Lb+γL)X′Tw-λwTw
(11)
Lagrange乘子法最優解的充要條件需滿足

X′(μ(Lw+Lb)-Lb+γL)X′Tw*=λ*w*
(12)

本文局部Fisher準則判別投影算法的步驟描述如下:
S1:PCA降維。通常訓練樣本的個數遠小于樣本的維數,為保證應用稀疏表示求稀疏近鄰關系時,由訓練樣本組成的字典超完備,需運用PCA算法將原始樣本投影到低維子空間中。
S2:利用式(1)求每個樣本的稀疏近鄰權值矩陣A,再利用式(2)分別求取同類樣本近鄰權值矩陣Aw和非同樣本近鄰權值矩陣Ab。



本文在Yale、AR、Yale B三個公共人臉數據庫上進行實驗,其中從AR庫中選取由50個男性和50個女性組成的共1 400幅只有光照和表情變化的圖像子集進行測試。每幅圖像剪裁成32×32的尺寸。
為評估本文算法的識別效果,實驗將本文算法與PCA,LDA,LPP和文獻[9]的DSLFDA以及文獻[10]的OSSPP算法進行比較,在Yale,AR及Yale B人臉數據庫上,分別測試這些子空間算法在不同訓練集和不同降維特征維數下的識別率,圖像空間中的二維圖像展開表示為1 024維的向量,以便訓練獲得特征子空間,在實施其它子空間算法來提取特征之前需先應用PCA來預處理數據,且均采用最近鄰(nearest neighbor,NN)分類器來進行分類。
本節實驗主要分析比較不同降維子空間維數對人臉識別率的影響。實驗在Yale數據庫上按每人6幅圖像來訓練,在PCA降維階段選擇特征降維的維數為89,各子空間算法的人臉識別率隨維數變化的曲線如圖1(a)所示;在AR數據庫中按每人7幅圖像來訓練,PCA降維階段選擇特征降維的維數為200,各子空間算法的人臉識別率隨維數變化的曲線如圖1(b)所示;在Yale B數據庫上按每人32幅來訓練,PCA降維階段選擇特征降維的維數為200,不同子空間算法的人臉識別率隨特征維數變化曲線如圖1(c)所示。

圖1 不同維數下的識別率
由圖1可知本文算法隨著所提取的樣本子空間特征維數的增多,人臉識別率開始增長較快,后來慢慢趨于平穩;在圖1(a)中Yale數據庫上由于訓練集樣本較少,子空間算法的識別率都沒有超過85 %,本文算法有稍優于其它算法的識別性能;而在圖1(b)的AR數據庫和圖1(c)的Yale B數據庫上本文算法則有明顯優于其他算法的表現。
本節實驗主要分析比較不同訓練樣本個數對人臉識別率的影響。實驗在Yale數據庫中每人隨機選取l(l=4,5,6)幅圖像用于訓練,剩余11-l幅圖像用于測試;AR數據庫中每個人的14幅圖像,隨機選取l(l=3,5,7)幅圖像用于訓練,剩余14-l幅圖形用于測試;Yale B數據庫中每個人隨機選取l(l=10,20,32)幅圖像用于訓練,剩余的圖像用于測試。重復20次實驗,取實驗平均結果。
在Yale、AR、Yale B這3個數據庫上進行不同的訓練樣本數量對最終識別率的實驗,結果如表1、表2和表3所示,表中數據組織為“均值±標準差(維數)”,Baseline為用1024維的人臉數據進行最近鄰分類。

表1 算法識別性能比較(Yale)
從表1結果可知,在小型數據庫Yale上,樣本數量較少,姿態和光照變化等因素的影響會較明顯,所以LDA與PCA的識別率都不理想;相較于DSLFDA和OSSPP,本文算法在考慮稀疏近鄰結構的同時,提升了由標簽到來的判別能力,能提取信號判別特征,最終計算的子空間有最優的識別率。

表2 算法識別性能比較(AR)

表3 算法識別性能比較(Yale B)
從表2結果可知,在AR數據庫上,實驗集上的人臉圖像信號受身份外的因素影響較小,在訓練樣本充足時,除PCA之外,具有判別特征提取能力的算法識別率均有提升,但本文算法考慮保持稀疏的近鄰結構同時,添加全局類別差異,有優于其它算法的性能。
從表3所示,由于數據庫中某些圖片的光照因素引起的變化比圖片類別變化都要劇烈,所以,PCA在尋求數據最大方差變化方向時極有可能求得由光照引起變化的特征方向,這不利于對圖像樣本的身份識別,所以,PCA在該樣本大的數據庫中反而識別效果較差;LDA、LPP直接從原樣本中提取具有判別特性的特征,識別性能較PCA有較大提升,但還是較易受光照等因素的干擾;樣本足夠時,DSLFDA、OSSPP以及本文算法有更高的識別率,且本文算法有更優的識別性能。
本文算法使得同類樣本在低維線性子空間中分布聚集,而非同類樣本在低維線性子空間中分布分散,以保證最終分類超平面擁有更強的泛化能力。在與相關文獻的算法仿真比較實驗中,本文算法表現出了更加優異的人臉識別性能,可以有效提升人臉識別率。