王曉華,楊清梅,楊 濤
西安工程大學 電子信息學院,西安 710048
改進的Gabor變換和二維NMF融合的人臉識別
王曉華,楊清梅,楊 濤
西安工程大學 電子信息學院,西安 710048
為了得到高質量的人臉特征,提高人臉識別性能,提出基于改進的Gabor變換和(2D)2NMF(二維非負矩陣分解法)的人臉識別方法。改進的Gabor變換提取的特征有較高的品質,魯棒性增強。二維非負矩陣分解法降維能大大降低圖像數據維數,縮短計算時間,提高識別率。最后在ORL人臉庫中進行實驗,結果表明改進的Gabor變換和二維NMF方法相結合計算時間略微增加,但識別效率明顯提高,從而證明了該方法的有效性。
人臉識別;Gabor變換;二維非負矩陣分解法
人臉識別是通過分析比較人臉特征信息進行身份鑒別的一種計算機技術。隨著科學技術的不斷發展,生物特征技術尤其是人臉識別技術由于其眾多的優越性被廣泛應用在很多領域,例如:視頻圖像監控、身份識別驗證、入口控制、刑偵破案等等。
1946年,Gabor把短時傅里葉變換的窗函數取為高斯函數,并提出Gabor變換[1]。Gabor變換具有很強的空間局部性和方向選擇性,被廣泛應用于人臉識別的特征提取中。傳統的Gabor變換對光照和姿態魯棒性不強,會對識別效果造成影響。1999年,Lee和Seung在《nature》上提出了NMF(非負矩陣分解法)并用于圖像處理。NMF算法具有實現上的簡便性、分解形式和分解結果上的可解釋性,以及占用空間少等優點[2]。但由于NMF矩陣的構建過程中,需對圖像進行向量化,會導致部分結構信息丟失,同時,高維數據使得矩陣存在奇異性,分解速度變慢,識別率降低。文獻[3]將Gabor變換和NMF方法相結合,對Gabor變換后得到的高維特征,采用NMF方法進行降維,識別效率有所提高,但忽略了Gabor變換易受光照、姿態等外界因素變化的影響,同時在進行NMF分解時并不能保持數據潛在結構,所以識別率并不高。
鑒于上述方法存在的不足,本文采用將改進的Gabor變換與(2D)2NMF(二維非負矩陣分解法)相結合的人臉識別方法。首先對人臉圖像進行改進的Gabor變換,提取圖像特征,對提取到的高維特征,采用(2D)2NMF(二維非負矩陣分解法)進行降維[4],進一步提取有效的特征信息,并利用最近鄰法進行分類識別。在ORL人臉庫上進行實驗仿真,實驗結果證明該方法識別速度更快,所占的計算存儲空間減少,識別效果明顯高于傳統方法。
Gabor在數字圖像分析領域具有很好的性能,Gabor函數可以在空間域和頻率域同時進行分析,具有很好的空間局部性和方向選擇性[5]。在一定條件下,Gabor變換的多分辨率分析即為Gabor小波變換。由于Gabor變換存在方向性,此時的Gabor小波變換也是具有方向性的小波變換。Gabor變換的本質就是對二維圖像求卷積,Gabor變換的效率由二維卷積運算的效率決定。
Gabor濾波器對人臉圖像的響應特征主要體現在邊緣、位置和亮度三方面,圖像的輸入信號和Gabor小波的卷積就是卷積的輸出結果。當輸入信號的變化與小波信號變化一致時,輸出比較強。通過修改Gabor函數的參數,可以獲得不同中心頻率和不同方向上的Gabor濾波器,從而提取到不同局部細節特征和全局性較強的特征,同時能減少噪聲干擾。
一個濾波圖像包含了圖像一個頻帶和方向上的成分。二維Gabor濾波函數是一個被復正弦函數調制的高斯函數,通常表示為:

其中,σx和σy是高斯包絡在X和Y方向上的標準差,決定了高斯函數在X軸和Y軸上的伸縮程度,f0是中心頻率,θ是旋轉角。(x,y)是原坐標,(x1,y1)是旋轉后的坐標。
x1=xcosθ+ysinθ,y1=-xsinθ+ycosθ,上式中的exp(f20/2σxσy)是直流分量,可以避免Gabor變換對圖像絕對亮度的依賴性。
Gabor小波是一組帶通濾波器,通過調整各個參數,每一組濾波器都有它們各自的方向和頻率選擇性,這樣,不同頻率和方向的濾波器就完全覆蓋了整個頻率域。一幅人臉圖像的Gabor特征也就是該圖像與一族Gabor小波的卷積結果。
設一幅圖像的灰度分布為I(x,y),則,它的Gabor特征可表示為如下:

其中,Qu,v(x,y)相當于方向v和尺度u的Gabor卷積結果,Ψu,v(x,y)為Gabor的核函數。當u、v取不同值時就得到了不同方向和不同尺度的Gabor核函數,尺度選的越小得到的圖像的細節特征就越多,相反,尺度越大,提取到的大多為圖像的輪廓特征。選取的方向越多,覆蓋的圖像區域面積就越大,得到的圖像細節就越多。由于受到很多限制,在進行圖像處理時,一般選擇一些能夠反映圖像中大多數特征的方向,這樣不但能夠減少計算量同時還能提高處理速度。
這里,選取了一個圖像進行試驗,分別選擇0°,45°,90°,135°這4個方向,由于濾波器有對稱性,所以在濾波時相當于對8個方向進行了濾波,提高了運算效率,同時選擇4個不同尺度,濾波結果如圖1。

圖1 Gabor濾波器濾波圖像
實驗表明,經過Gabor濾波器濾波的圖像,在4個方向都取得了不錯的特征。
利用Gabor濾波器提取人臉特征時,由于Gabor特征維數很高,計算量大,實時性差。越來越多的研究人員提出了改進方案,力圖在特征的提取準確度與計算效率提高等方面有所突破。
在人臉識別中,如何消除光照和姿態變化對人臉識別性能的影響是關鍵?;谝陨螱abor濾波器的性能,對Gabor濾波器做了兩點改進:
(1)考慮到直流分量是人臉背景的灰度值,本文補償了直流分量,以增強Gabor濾波器對全局照明變化的魯棒性。
如上節所述,傳統Gabor變換表達式中,exp(f20/2σxσy)為其直流分量,為了增強Gabor濾波器對光照變換達到魯棒性,使其具有0直流分量,以保證不同亮度值構成的均勻亮度區域的響應相同。為此,再增加此直流分量,以使直流分量為0,從而實現補償。
背景灰度值一般是均勻的直流可算作是一個常數用來指代背景,對其進行直流補償后,背景所受光照,外界干擾影響變小,圖像越均勻,圖像所處的環境也越好 ,濾波時就會得到很好的效果。
(2)考慮到濾波器具備中心頻率越高則相應的脈寬越窄的性能,本文增加一個系數使Gabor濾波器的尺度伸縮隨中心頻率變化,中心頻率高,伸縮尺度??;反之,則伸縮尺度大,使濾波器有較高的品質,可以在一定程度上減少冗余信息[6]。改進后的Gabor濾波函數為:

將人臉圖像與Gabor濾波器進行卷積,結果就是所提取的圖像的Gabor特征。圖2是某人臉圖像5個尺度8個方向的Gabor幅值特征與相位特征。從圖中可以看出,Gabor相位信息隨著空間位置呈周期性變化,而幅值的變化相對平滑而穩定。幅值反映了圖像的能量譜,Gabor幅值特征通常稱為Gabor能量特征,Gabor小波可像放大鏡一樣放大灰度的變化,人臉的一些關鍵功能區域(眼睛、鼻子、嘴、眉毛等)的局部特征被強化,從而有利于區分不同的人臉圖像。相位信息的周期性變化對光照有一定的不敏感性,受光照變化影響不大。相位特征和幅值特征相比,在光照變化明顯的環境下有突出的優勢,光照變化越大,Gabor相位特征越有優勢。而本文采用的改進的Gabor變換對光照已具有魯棒性,相位特征優勢減弱。相位信息因其為周期性變化的,會一定程度上降低計算效率,因此,本文只應用了Gabor幅值信息,而不應用相位信息。

圖2 Gabor的幅值特征與相位特征
在對圖像進行特征提取過程中,由于提取到的特征太多并且維數較高,會導致圖像特征匹配復雜,耗費資源,因此必須對其進行降維。本文采用NMF(非負矩陣分解法)進行特征降維。該方法具有實現上的簡便性,分解形式和分解結果上的可解釋性,以及占用存儲空間少等優點。
非負矩陣分解利用數據的非負性,用一個包含原始矩陣基本特征信息的低維矩陣來近似表示原始矩陣。對于任意的非負矩陣A,將其分解成一個m×l的非負矩陣W 和一個l×n的非負矩陣 H[7],通常l遠遠小于m、n或者l(m+n)<mn,并且A,W,H 滿足下列條件:

其中,W為基矩陣,H為系數矩陣。A中的一列向量為左矩陣W中所有列向量的加權和,權重系數為右矩陣H中對應列向量中的元素。這種基于基向量組合的表示形式即為“局部構成整體”思想。
對上述公式通常利用輔助目標函數來達到解的最優化。優化問題即在WH≥0情況下,尋找使上式達到最小所對應的W和H??赏ㄟ^乘法迭代算法從任意的非負初始值出發,交替的更新矩陣W和H。目標函數有多種形式,其中矩陣A與WH的歐氏距離的平方最為常用:
對于上式的更新法則:

重復上式直至收斂。
傳統的NMF分解法在矩陣的構建過程中,圖像的向量化會導致部分圖像結構信息丟失,對識別效果造成影響。并且沒有考慮到所提取的特征和分類目的之間的關系[8]。都會導致其需要更多的計算成本,同時處理圖像的效率較低,為此,本文采用(2D)2NMF(二維非負矩陣分解法)進行特征降維。
(2D)2NMF方法是采用二維圖像矩陣來構建圖像矩陣,分別對原始圖像進行行矩陣分解和列矩陣分解[9]。與傳統NMF方法相比,能更大程度上減少圖像矩陣維數,縮短計算過程所用時間。同時,由于其考慮了圖像的結構信息,因而提高了圖像的分解精度。
3.2.1 圖像矩陣行方向的分解
用矩陣 Xp×qm=[A1,A2,…,Am]表示大小為 p×q的m幅圖像,其中Ak代表這M幅人臉圖像中的一幅。對其進行NMF分解,得到如下式子:

這里,d為參考維數,L為圖像分解后得到的基矩陣,H為系數矩陣。
3.2.2 圖像矩陣列方向的分解
用矩陣Yq×pm=[B1,B2,…,Bm]表示大小為 p×q的m幅圖像,其中Bk=AkT,表示原圖像的轉置。對其進行NMF分解,得到如下式子:

這里,r為參考維數,R為圖像分解得到的基矩陣,H為系數矩陣。
由于是對圖像的行和列分別進行了分解,因此可以提取到圖像的二維結構信息。并且信息存儲在行基矩陣L和列基矩陣R中。因而,對于任意一幅圖像Ak,它在行和列基矩陣上的投影系數可表示為:

利用行基矩陣L和列基矩陣R重構得到的圖像可表示為:

對(W,H)進行初始化后,收斂速度顯著提高。本文引用基于Lanczos對角化過程去尋找矩陣的一個低秩近似。
Lanczos算法將對稱矩陣通過正交相似變換變成對稱三對角矩陣的算法[10]。通過Lanczos雙對角化先得到矩陣的一個秩K近似,在Lanczos過程中得到每個秩1矩陣的非負部分的近似,最后得到A的非負矩陣分解的初始化矩陣。
Lanczos雙對角化過程:
對給定的一個初始化向量b,i=1,2,…,k,計算:

上式的矩陣形式寫為:

此處Bk+1是一個下雙對角矩陣。
主要步驟:
(1)運行K步的Lanczos雙對角化過程,得到矩陣JK=UKBKVTK。
(2)從WH=JK-E得到近似的非負矩陣(W,H)。
由于初始向量b的選擇不唯一,所以初始化策略帶有隨機性,但和NMF結合后收斂速度更快。
基矩陣W的列數即特征基的數量r,直接決定了算法得到的特征子空間的維數。對特定的數據集,隱藏在數據集內部的特征空間的維數是確定的,當r選取與實際數據集的特征空間維數一致時,得到的特征空間以及特征空間的基最有意義[11],r越小,識別率越低,r越大,識別率越高,當r增大到一定程度時,識別率反而下降。本文采用能量提取法來計算基個數。
對矩陣A進行NMF分解,得到A=WH,目標函數采用:

能量提取法[12]步驟:
(1)計算含有矩陣90%能量的奇異值個數。
(2)將上式 A做奇異值分解,得到分解因子u,s,v,對奇異值 σ1,σ2,…,σk求和,其中k=rank(A),設基個數為 l,選取90%的能量,r=∑2/∑1<90% ,(∑2+σr+1)/∑1≥90% ,其中 ∑2=σ1+σ2+…+σr。
若 A為滿秩矩陣,當 r<mn/(m+n)時,l=r;當r≥mn/(m+n)時,令 ∑1=σ1+σ2+…+σk-1,重新利用能量提取法選取90%的能量,確定新的r1,直至r1<mn/(m+n),取基個數l=r1。
若A為非滿秩矩陣,當r<mn/(m+n)時,l=max(r,表示正方向取整。
圖3是經過NMF分解的重構圖像。由圖3可看出,經過二維NMF分解后重構圖像效果更好。

圖3 (a) NMF

圖3 (b) (2D)2NMF分解的重構圖
基于改進Gabor變換和二維NMF(非負矩陣分解法)的人臉識別步驟如下:
(1)對訓練樣本進行圖像預處理并采用公式(3)對圖像進行Gabor變換。
(2)對Gabor變換得到的特征圖像進行(2D)2NMF分解,具體分解過程如上章所述,采用公式(7)~(9)計算得到投影系數,并采用公式(10)計算得出重構圖像即低維特征圖像。
(3)對測試樣本同樣進行圖像預處理和Gabor變換。
(4)將得到的測試樣本的特征圖像向訓練樣本的基矩陣上投影,以此作為測試樣本的低維特征圖像。
(5)計算出訓練樣本和測試樣本低維特征之間的歐氏距離。
(6)利用最近鄰分類器進行分類。
算法流程如圖4所示。

圖4 算法流程圖
本文人臉識別算法中,先確定參數。再選用ORL人臉庫進行實驗,庫中共有40個人,每人有10幅,圖片灰度級均為256,大小為112×92,并且每幅圖像在光照、姿勢和角度方面都存在差異。將該人臉圖像庫分成兩組:選取每個人的前五張圖像作為訓練樣本,后五張作為測試樣本,這樣測試樣本和訓練樣本共有200張人臉圖像。
非負矩陣分解時,有兩個因素直接影響識別率,即怎樣設置初始矩陣W、H和怎樣設置特征子空間的維數。W的列數直接決定了特征子空間的維數,而當特征子空間的維數越大,則會增加計算時間,占用較大的存儲空間。只有選取合適的子空間維數,才能使所選取的特征最具代表性和所占用的存儲空間最少。為了選擇合適的特征子空間維數,采用直方圖方法,選取基矩陣每列中的能量占總能量90%以上的信息作為特征信息[11]。經多次實驗,特征子空間的維數和識別率的關系如圖5所示。

圖5 特征空間的維數和識別率的關系
由圖5可知當特征子空間的維數達到50時,識別率最高。當特征子空間的維數繼續增大時,識別率基本保持不變。與理論相匹配,一個數據結構一定有一個潛在的特征結構,過高或過低的特征維數都會使識別率或計算時間受到影響[13]。
圖像預處理過程中,將圖像經過伽馬變換后,圖像的對比度會增強,不同的γ值會有不同的變換效果。對于γ值的選取需要通過實驗來確定。圖6為不同的伽馬變換因子測試結果。

圖6 不同的伽馬變換因子測試結果
由圖可以看出,采用伽馬因子γ=0.1,識別率會達到更高,識別時間相對于其他卻更少。
圖7所示為ORL人臉庫中部分具有代表性的人臉圖像。

圖7 ORL人臉庫
對人臉圖像分別進行Gabor變換和改進的Gabor變換,所提取的特征圖像如圖8所示。

圖8 (a) Gabor變換提取的特征圖像

圖8 (b) 改進的Gabor變換提取的特征圖像
由提取到的特征圖像可看出改進的Gabor變換進行特征提取效果更加明顯,在特征提取中更具優勢。
如圖9是NMF和二維NMF在ORL人臉庫上進行實驗后的比較,由圖可看出二維NMF在識別時間和識別精度上都占優勢。
為了驗證本文方法的有效性,對以下幾種人臉識別方法分別進行了實驗。第一種,對原圖像直接進行Gabor變換提取特征并進行識別;第二種,對原圖像直接采用NMF分解進行特征提取并采用K近鄰法分類[14];第三種,對圖像進行Gabor變換,對得到的高維特征再進行NMF分解降維,并利用K近鄰法分類;第四種,采用改進的Gabor和(2D)2NMF方法提取特征,K近鄰法進行分類識別。實驗過程中,測試集、訓練集、中心頻率和方向都相同,在此條件下,不同方法測試結果如表1,識別率為幾次測試結果的平均值。

圖9 (a) 訓練時間比較

圖9 (b) 訓練精度比較

表1 不同方法的測試結果

圖10 四種人臉識別方法識別率結果圖
基于傳統Gabor變換的識別方法雖然簡單高效,但由于其受光照、表情、姿態等變換的影響較為嚴重,很大程度上降低了識別效率。采用基于傳統NMF方法進行人臉識別,由于其在獲取子空間的過程中沒有利用不同人臉圖像的類,所得到的特征不是最佳分類特征,因而容易導致識別錯誤,降低識別率[15]。將Gabor變換和NMF相結合,明顯克服了圖像特征維數過高帶來的識別率過低問題,提高了識別的精確度,但此方法在利用NMF方法進行特征降維的過程中卻很容易造成有用信息的流失,對識別結果造成很大影響。本文采用改進后的Gabor變換來進行特征提取,相比于傳統的Gabor變換對光照和姿態等有了更好的魯棒性,同時減少了信息冗余。對于高維特征,采用(2D)2NMF分解,與傳統的NMF方法相比,很大程度上保留了原始圖像的結構信息,加快了計算速度,分辨率也大大提高。通過在ORL人臉庫進行實驗測試,確定了使識別率達到最高的參數,該算法不僅使識別率最大限度的提高,而且保存數據在原始空間幾何關系的基礎上,使識別率有所提高。
[1]汪堂洪.基于Gabor變換的人臉識別算法研究[D].西安:西安科技大學,2016.
[2]Lee D D,Seung H S.Learning the parts of objects by non-negative matrix factorization[J].Nature,1999,401:788-791.
[3]張素娥,周軍,王大偉,等.Gabor小波變換和NMF結合的人臉識別[J].計算機工程與應用,2015,51(3):1-3.
[4]高宏娟.基于NMF改進算法的人臉識別仿真研究[J].計算機仿真,2011,28(12):1-2.
[5]李鈺,孟祥萍.基于Gabor濾波器的圖像特征紋理提取[J].長春工業大學學報,2008,29(1):2-3.
[6]Lee T S.Image representation using 2D Gabor wavelets[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(10):859-871.
[7]Chang Y H,Jheng G Y.Customizable facial expression recognition using non-negative matrix factorization[C]//IEEE 2011 International Conferenceon on Electrical and Control Engineering,2011:2073-2084.
[8]高宏娟,潘晨.基于二維NMF及其改進算法的人臉識別[J].計算機應用,2007,27(7):1-2.
[9]王俊科,左春婷.非負矩陣分解特征提取技術的研究進展[J].自動化,2014,31(4):973-974.
[10]Simon H D,Zha H.Low-rank matrix approximation using lanczosbidiagonalization processwith applizatins[J].SIAM Journal on Scientific Computing,2000.
[11]王曉華,孫小姣.加權小波和流行正則化的NMF融合的人臉識別[J].計算機工程與應用,2016,52(7):150-154.
[12]喬涵麗,馬昌鳳.確定NMF基個數的能量提取法[J].桂林電子科技大學學報,2012,32(6):487-489.
[13]張志偉,楊帆,夏克文,等.基于小波變換和NMF的人臉識別方法的研究[J].計算機工程,2007,33(6):176-178.
[14]邱天爽,楊春暉.一種基于改進近鄰分類器的人臉識別方法[J].信號處理,2008(1):54-57.
[15]David G,Jordi V.Non-negative matrix factorization for face recognition[C]//Proceedings of the 5th Catalonian Conference on AI:Topics in Artificial Intelligence,2002,2504:336-344.
WANG Xiaohua,YANG Qingmei,YANG Tao
School of Electronic Information,Xi’an Polytechnic University,Xi’an 710048,China
Face recognition based on improved Gabor transform and nonnegative matrix factorization.Computer Engineering and Applications,2017,53(21):132-137.
In order to get the high quality facial features and improve the performance of face recognition,the face recognition method based on improved Gabor transform and two-dimensional non negative matrix factorization is proposed in this paper.Improved Gabor transform extracts the characteristics with a higher quality,enhances the robustness.Two dimensional non negative matrix decomposition of dimensionality reduction can greatly reduce the dimension of the image data,shorten the calculation time,improve the recognition rate.At last,experiments are carried in the ORL face database.The results show that improved Gabor transform and two-dimensional NMF method have a slight increase in the calculation time,but the recognition efficiency is improved obviously,thus proves the effectiveness of this method.
face recognition;Gabor transform;two-dimensional non-negative matrix decomposition method
A
TP24
10.3778/j.issn.1002-8331.1607-0226
國家自然科學基金(No.61301276);西安工程大學控制科學與工程學科建設經費資助(No.107090811);西安工程大學博士科研啟動金項目(No.BS1207)。
王曉華(1972—),女,博士,副教授,研究方向為模式識別、智能機器人等,E-mail:W_xiaohua@126.com;楊清梅(1992—),女,碩士研究生,研究方向為模式識別與智能系統。
2016-07-15
2016-09-12
1002-8331(2017)21-0132-06
CNKI網絡優先出版:2017-01-11,http://www.cnki.net/kcms/detail/11.2127.TP.20170111.1014.004.html