歐陽文,王 燕
(蘭州理工大學 計算機與通信學院,甘肅 蘭州 730050)
人臉識別由于其在公共安全、視頻監控、身份鑒別、智能人機交互等方面的廣闊應用前景以及對模式識別理論的發展具有重要的學術意義而備受關注,是模式識別的熱門研究領域之一。在過去的幾十年里,人臉識別技術取得了較大的發展,涌現出許多人臉識別方法,子空間方法成為當前人臉識別的主流方法之一,子空間方法中最為主要和流行的方法是主成分分析(Principal Component Analysis,PCA)[1-2]和線性判別分析(Linear Discriminant Analysis,LDA)[3]。
特征提取是人臉識別技術中一個基本而又十分重要的環節,在整個人臉識別過程中,特征提取扮演著尤為重要的角色,如何提取出穩定、有效的特征,并用最少的特征來表示盡可能多的人臉信息是人臉識別成敗的關鍵。
Gabor展開是一種同時用時間和頻率表示一個時間函數的方法,而求解Gabor展開系數的公式被稱為Gabor變換。傳統的Gabor變換的缺點是窗口尺寸一經確定就無法更改,因此不具有變焦特性,無法對信號進行多分辨率分析。為解決這一問題人們將Gabor理論同小波理論相結合,提出了Gabor小波[4]。Gabor小波具有小波變換的多分辨率特性,同時具有Gabor函數本身所具有的局域性和方向性。目前Gabor變換和Gabor展開已被公認是信號與圖像表示的最好的方法之一。Gabor變換中要解決的最基本問題是:在給定綜合窗下如何求解分析窗及Gabor變換系數。
Turk[1-2]于1991年提出了著名的特征臉方法(Eigenface),將主成分分析(PCA)應用于人臉識別,通過提取人臉圖像的主成分進行識別。Eigenface是基于重建準則的,即重建誤差最小,它無法揭示數據的局部結構。當人臉的光照、表情產生比較大的變化時,其識別率一般不是十分理想。Fisherface[5]屬于有監督識別方法,利用線性判別分析(LDA)尋找使類間距和類內距比值最大化的投影方向,獲得了較好的識別效果。然而,當樣本數目小于樣本維數時,Fisherface會出現小樣本問題。所以一般先采用PCA方法進行降維,然后再用LDA提取特征進行識別,這樣既解決了小樣本問題,又可以得到更具判別性的特征。
因此,文中充分利用Gabor小波變換具有良好的提取和區分能力的空間特性,首先進行人臉特征的提取,然后在此基礎上利用PCA進行初次降維,最后利用LDA所具有的判別性優勢來得到最終的人臉特征。
Gabor小波變換是利用小波核函數能夠模擬大腦皮層反射區的特性,使良好的空間特性對各類特種具有良好的提取和區分能力,在許多領域尤其是圖像分析及識別領域的應用非常廣泛。
二維Gabor小波的函數表示為:

其中δ為高斯窗口的尺度因子,用來調節該濾波器的尺度與帶寬;方向與頻率由φu與ωv控制。只要設置好δ、φu和ωv,就可以利用 Gabor濾波器組對圖像 I(x,y)進行進一步處理,這個過程也是一個卷積的過程:

該式通過對人臉圖像的Gabor小波分解,從而得到所需要的特征。
圖1表示了在頻域半平面上,6個相隔30度的方向上不同頻率的Gabor小波濾波器:

圖1 不同方向及頻率的Gabor小波族Fig.1 Gabor wavelet family of different directions and frequencies
LDA(Linear Discriminant Analysis)算法其最主要的功能就是提取出高維特征空間中最具分辨能力的低維特征向量,使得屬于同類的樣本盡量靠近,而不同類的樣本盡量分散,使得類間散度與類內散度的比值最大化。
設人臉圖像訓練樣本集為X,首先將訓練集中二維圖像轉換為一維向量,轉換后記為D×1維,將屬于一類的人臉圖像進行相應的圖像歸類記為Xi,樣本總數為n,總共分為l類,其中每類樣本數為 ni,i=1,2,3,…,l。
專利權利要求中的錯誤初探:錯誤的形式、改正的途徑........................................................................孟 睿 徐棣楓 11.66
定義類間散度矩陣為:

類內散度矩陣為:


wi(i=1,2…d)為特征方程 SbWi=λSwWi最大的 d 個特征值 λi(λ1≥λ2≥…≥λd)相對應的特征向量。 則 Wopt=[w1,w2,…,wd]正是所求的最佳投影矩陣。通過將特征向量進行該空間的投影降維,即可得到該算法下的分類特征,即:

在文中通過設定 4 個不同尺度 v(0,1,2,3)、8 個不同方向u(1,2,3,4,5,6,7)組成 32 個 Gabor特征組進行進一步的處理。通過Gabor濾波,一幅人臉圖片的維數為原來圖片維數的32倍,復雜性相對較高。同時考慮到復雜度,將預處理后的圖像尺寸設為112×92,若用4個尺度,8個方向的Gabor濾波器組G(4,8)進行全局特征提取,則特征矢量維數高達112×92×32=329 728,這個計算量是相當大的。在此,算法首先進行全局均勻采樣,間隔為8,然后將得到的5 152維特征矢量作為進一步處理的基礎矢量。
整體算法描述如下:
1)Gabor小波變換進行特征提取:采用Gabor小波變換來對經過預處理的人臉圖像進行處理,提取出人臉特征,然后進行全局均勻采樣,得到5 152維的特征矢量。
2)PCA處理:對訓練樣本集進行(1)中處理,得到矩陣A,并對A進行PCA降維得到PCA的投影子空間Wpca。
3)計算類間散度矩陣和類內散度矩陣分別為:
Sb=為投影到Wpca后的樣本,mi為投影到Wpca后的樣本均值,m為投影到Wpca后的總樣本均值。
4)依據LDA算法求解過程,以及(3)中得到的類間散度矩陣和類內散度矩陣,來求解最佳的LDA分類子空間得WLDA。
文中主要在ORL人臉庫和YALE人臉庫上進行實驗驗證,并將本文提出的Gabor+PCA+LDA算法與PCA和LDA算法用于人臉識別時的識別結果進行比較。同時,為了實現橫向比較,最后的分類器統一采用最近鄰分類器來實現分類。
實驗一:ORL人臉庫實驗。ORL人臉庫是由英國劍橋大學建立,包括40個人,每個人10張112×92的在不同時間采集的正面人臉圖像組成。其中包括不同視角、不同表情(高興、微笑、生氣、吃驚、閉眼、睜眼等)和不同面部細節(戴或不戴眼鏡、有或無胡須、不同發型),人臉姿態有變化和旋轉不超過20°。圖2所示的是來自ORL人臉庫的某一人的10張圖像。

圖2 ORL人臉庫圖像示例Fig.2 The sample images of ORL face database
對于ORL人臉庫的實驗驗證,隨機地從每個人的圖片中選擇 l(l=3,4,…,7)張圖片作為訓練樣本,余下的 10-l張圖片來作測試樣本。具體的實驗結果如表1所示。

表1 ORL人臉庫上的識別結果比較Tab.1 Recognition results on ORL face database
實驗二:YALE人臉庫實驗。YALE人臉庫由15個人,每個人有11張共165張圖像組成。這些圖像在光照條件變化比較大,而且面部表情(正常、驚訝、傷心、開心和眨眼等)和細節 (戴或不戴眼鏡、有或無胡須)也有比較明顯的變化。YALE人臉庫中的某一個人的11張圖像如圖3所示。

圖3 YALE人臉庫圖像示例Fig.3 The sample images of YALE face database
在YALE人臉庫庫實驗中,也是隨機地從每個人的圖像中選取 l(l=3,4,…,7)張圖片作為訓練樣本 ,而 余下11-l張作測試樣本。表2為具體的在YALE人臉庫上的實驗結果。

表2 YALE人臉庫上的識別結果比較Tab.2 Recognition results on YALE face database
從表1和表2中的實驗數據中可以看出,本文提出的基于Gabor+PCA+LDA的算法在ORL人臉庫和YALE人臉庫上均取得了最高識別率,且識別效果均要比傳統的PCA算法和LDA算法要好;當樣本數取7時,PCA、LDA以及本文算法的識別率都達到最高。同時,由于YALE人臉庫中的圖像在光照條件變化比較大,且表情和細節變化也比較大,所以,在YALE人臉庫上的識別率要整體的低于ORL人臉庫中的識別率。
本文主要針對人臉識別中的特征提取問題,提出了一種新的基于Gabor小波變換的算法,并通過實驗驗證了本文算法的有效性。雖然本文算法比傳統的PCA和LDA算法具有較大的優勢,但離人臉識別在實際中的應用要求還比較遠。在接下來的工作中,將主要通過對分類器的優化選擇及改進來進一步的提高識別率[6-7]。
[1]Turk M,Pentland A.Eigenfaces forrecognition[J].Journal of Cognitive Neuroscience,1991:71-86.
[2]TURK M,PENTLAND A.Face recognition using eigenfaces[C]//Proceeding of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Washington D C:IEEE Computer Society Press,1991:586-59l.
[3]Belhumeur P,Hespanha J,Kriegman D.Eigenfaces VS.Fisherfaces:Recognition using classspecific linear projection[C]//IEEE Transactions onPattern Analysis and Machine Intelligence,1997,19(7):711-720.
[4]葉敬福,詹永照.基于Gabor小波變換的人臉表情特征提取[J].計算機工程,2005,31(15):172-174.YE Jin-fu,ZHAN Yong-zhao.The face expression feature extraction based gabor wavelet transform [J].Computer Engineering,2005,31(15):172-174.
[5]盧桂馥,林忠,金忠.基于最大差值的二維邊界Fisher的人臉識別[J].計算機科學,2010,37(5):775-779.LU Gui-fu,LIN Zhong,JIN Zhong.The face recognition algorithmbased ontwodimensionalboundaryfisherofmaximum difference[J].Computer Science,2010,37(5):775-779.
[6]YANG Han-xuan,SHAO Ling,ZHENG Feng,et al.Recent advances and trends in visual tracking:A review[J].Neurocomputing,2011,74(18):3823-3831.
[7]Scherer S,Kane J,Gobl C,et al.Investigating fuzzy-input fuzzy-output support vector machines for robust voice quality classification[J].Computer Speech&Language,2012.