任成娟
(寶雞文理學院 計算機科學系,陜西 寶雞 721000)
由于計算機人臉識別在管理、公共安全等領域有著巨大的應用前景,目前已成為人工智能和模式識別領域的一個研究熱點。特征提取是計算機人臉識別的核心步驟,子空間分析方法因其具有技術代價小、易實現、描述能力強和可分性好等優點被廣泛地應用于人臉特征提取,成為目前人臉識別的主流方法之一。近年來許多研究成果表明,人臉圖像很可能位于一個非線性流形上。當前許多流行算法被提出,如:等距映射(Isomap),局部線性嵌入(LLE)和拉普拉斯特征映射(Laplacian Eigenmaps)。它們通過保持原始數據的局部關系結構以探索人臉的非線性流行結構。雖然局部線性嵌入和拉普拉斯特征映射都能很好地揭示人臉數據的內部結構,但是這些方法一般不能直接用于人臉識別,因為他們得到的明晰投影矩陣很難直接提取出新樣本的特征。此后,He等人提出了局部保持映射算法(Locality Preserving Projections,LPP)并將其成功地應用于人臉識別[1-2]。提出一種巴氏距離與LPP結合的人臉識別算法(簡稱BSLPP),BSLPP利用LPP對樣本進行降維特征提取,以此保留有效的特征信息,降維的樣本進行巴氏距離迭代,這樣降低最小錯誤率上界,提高分類效果,提高人臉識別的識別率。間Rn中的數據集x={x0,x1,…,xn}映射為低維空間Rl(1<n)中的數據y={y0,y1,…,yn},即:yi=wTxi,i=1,…,N使得Rl空間中互為近鄰的兩點經W映射后在低維空間仍互為近鄰。為了達到這個目的,LPP最小化下面的目標函數:

S=[Sij]i,j=1,…,N為權值矩陣,Sij定義為:

t是常數。經過代數變換,可得最優化目標函數WTXLXTW,其中x={x0,x1,…,xn}。L=D-S,L為Laplacian矩陣,D為對角權值矩陣,其對角元素為S的行(或列)元素之和。矩陣D表示領域圖節點的測度,Dii值越大表明樣本點xi越重要。給出約束條件:yTDy=1?wTXDXTW=1
這時最小化問題就轉化為求解:

進而,公式(3)的最小化可以轉換成求如下廣義特征值問題:

為了得到較高的識別率,一般取k(k>1)個投影向量。假定a0,a1,…,ak-1為式(4)的k個特征向量解,對應的特征值λ0<λ1<…<λk-1,則最優的轉換矩陣為:wopt=[a0,a1,…,ak-1]
LPP算法的目標是尋找一個最優轉換矩陣W將高維空
最后,LPP算法得到的線性降維映射為:


當空間維數很大時,利用巴氏距離進行特征提取非常困難。LPP能夠保留人臉的流型結構,降低圖像維數。文中把巴氏距離與LPP結合進行人臉特征選擇。由文獻[3-7]可知,若m維特征空間中,存在Z個類別,且先驗概率相等,Bayes最小錯誤率上界可用巴氏距離表示為:

3.1 巴氏距離與LPP結合特征選擇實現步驟
1)參數初始設置
參數初始設置主要包括:巴氏距離與LPP結合識別率、訓練時間、測試時間、初始類數、每類訓練樣本數、每類樣本數、學習樣本總數、測試樣本總數等初始值設置。
2)從人臉圖庫中獲取圖片數據轉換成矩陣
主要包括以下操作:定義圖像矩陣、從數據庫中讀訓練樣本、把讀取的訓練樣本轉換成數值矩陣、計算投影矩陣、讀測試樣本。
3)LPP投影降維
構建領域圖,領域矩陣,求解特征值和特征向量,最后得到特征矩陣。
4)求測試樣本的和均值的差。
5)用巴氏距離求出數據與樣本哪個相近
設置初始值,λ=0.01,γ=0.000 1為初始值;
①利用公式(8)(9)(10)(11)分別求出對應樣本的的矩陣和均值;
②用(3)步求出樣本的方差矩陣和k維復合矩陣,m維復合矩陣;
④再把第1)2)3)步中求得的數據代入(14);
⑤計算Xr+1=Xr-λ??εXmrr,如果‖Xr-1-Xr‖>λ時,返回⑤否則執行⑥;
⑥求識別率。
ORL圖像庫共40個人,每一個人10幅圖像。同一個人的不同圖像間只有一些細微差別,所有的圖像都面部朝外,且在同一黑色背景下拍攝而得。ORL圖像庫原始每一幅圖像的大小為112×92。文中采用雙線性插值將人臉圖片調整為64×64(圖1)。下面的實驗值均是10次實驗的平均值,每次每個樣本選擇5個圖像做訓練,5個圖像用做測試。

圖1 經過調整后的部分樣本圖像(ORL人臉庫)Fig.1 Some cropped and resized sample images from ORL database
圖2 給出了PCA、BSPCA、LPP以及本文提出方法的識別率對比,維數的變化從5到55。表1給出了這4種算法最高識別率以及對應的維數(100)和訓練時間的對比。根據圖中曲線的變化本文所提出的算法取得了最好的效果。原因在于文中所提出的算法不僅保留了原算法的優點,對人臉局部和流型結構的較好描述,關鍵在于利用巴氏距離對降維的樣本進行迭代,這樣降低最小錯誤率上界,所以識別率有所提高,對人臉局部的變化具有較好的魯棒性和穩定性。引進了LPP算法相對巴氏對距離在人臉識別中的應用而言,運行時間會縮短。正如得到的表1的情況一致。

圖2 4種算法在ORL上的識別率對比Fig.2 Comparison of recognition rate four methods on ORL database

表1 4種算法在ORL數據庫上的數據對比Tab.1 Comparison of on data four methods on ORL database
LPP是一種有效的特征提取算法并被成功的用于人臉識別。文中提出一種巴氏距離與LPP相結合的人臉識別算法,BSLPP利用LPP對樣本進行特征降維提取,以此保留有效的特征信息,降維的樣本進行巴氏距離迭代,這樣降低最小錯誤率上界,提高分類效果,提高人臉識別的識別率及運行時間。但是沒有有效的考慮運行總時間快慢,這需要進一步研究。
[1]He X F,Niyogi P.Locality preserving projections[C]//Proceedings of Neural Information Processing Systerm,Vancouver,2003.
[2]He X F,Yan S C,Hu Y X,e al.Face recognition using Laplacianfaces[C]//IEEE Trans.on PAMI 27(3),2005:328-340.
[3]SHEN Bi-chuan,MAO Qi-jian,LV Yi.Scene change detection in video stream based on bhattacharyya distance[J].Journal of Chongqing University of Posts and Telecommunications,2009,21(1):69-73.
[4]Fall K,Varadhan K.The ns manual[EB/OL].(2007-08-10).http://ftp.isi.edu/nsnam/ns/doc/ns_doc.pdf.
[5]RAO Yuan,WANG Ru-chuan.Agent-based load balancing routing for LEO satellite networks[J].Computer Networks,2010,54(17):3187-3195.
[6]Vajaria H,Islam T,Mohanty P,e al.Evaluation and analysis of a face and voice outdoor multi-biometric system[J].Pattern Recognition Letters,2007,28(12):1572-1580.
[7]Chen S,Zhu Y.Subpattern-based principle component analysis[J].Pattern Recognition,2004,37:1081-1083.
[8]Stpmja T J.Practical face recognition and verification with WISARD[C]//Ellis H D,Jeeves M A,Newcomber F,et al.Aspects of Face Processing.Dordecht:Nijhoff,1987:426-441.