安陽工學院計算機學院 吳朝霞 郭 強
邊界Fisher分析的一種改進
安陽工學院計算機學院 吳朝霞 郭 強
邊界Fisher分析(MFA)是一種典型的監督子空間嵌入特征提取方法。該算法解決了由于線性判別分析高斯假設所引起的不足,通過最大化類內緊湊度和類間區分度來獲取映射矩陣。該算法雖然相對與線性判別分析已經有了很大的提高,但是在算法執行過程中一個關鍵的部分,求取每一個樣本點的近鄰,MFA處理方法簡單,求得結果并不能很好的表征近鄰關系,所以針對此點進行改進,用一種比較好的方法代替該過程.通過在ORL,耶魯樣本上的人臉識別實驗,驗證了該方法非常有效,相對于原始的MFA算法又有了明顯的提高。
邊界Fisher分析;人臉識別;特征提取
在現實條件下,人臉識別原始數據都是高維樣本,而高維樣本并不適應于人臉識別,因為高維數據魯棒性差、計算復雜度高,因而在人臉識別中,降維也就是特征提取是必不可免的。二十多年來,對于特征提取,國內外學者提出了各種各樣的方法。最經典最基本的特征提取算法是主成份分析(PCA)[1]和線性判別分析(LDA)[2]。針對于以上經典的算法進行了大量的改進,例如MPCA[4],2D-LPP[5],DATER[6]改善了小樣本問題。邊界判別分析(MFA)考慮到LDA的不符合實際的高斯假設問題,應用邊界樣本進行分類。鄰接保留嵌入(NPE),無監督判別映射(UDP),,局部判別嵌入(LDE)[10]等都對鄰接矩陣應用的一些改進。
以上提高的區分分析方法,都可以表示做圖嵌入[的形式,通過顏等人提出的圖模型我們發現以上這些算法降維后的特征應用到人臉識別上效果的不同,完全在于表示各點近鄰關系的圖的構建方法的不同,所以基于這一點我們對MFA算法做了大量的實驗,并找出了一種更好的查找近鄰的方法,應用到MFA的圖構建過程,實驗證明該方法是有效并且可行的。
利用圖嵌入框架,提出了邊界Fisher分析。此后,MFA算法得到進一步的研究和不斷的改進,下面我們簡單介紹邊界Fisher分析。
MFA應用了圖嵌入框架的思想,它構建了兩個關鍵性的表示近鄰關系的圖:一個叫做本質圖,用來表征類內緊湊度,記為Gc。另一個叫做懲罰圖,用來表征類間區分度,記為Gp。Gc描述了同類數據點的近鄰關系,每個數據點連接了k1個同類中與之最近的點。Gp描述了類和類之間的邊界關系,每個數據點連接了k2個其他類別中與之最近的點。

類內散度表示為:

類間散度表示為:

其中:

MFA算法的最佳投影軸w通過如下邊界Fisher判別準則求出:

。
在求取近鄰過程改為先判斷兩個樣本臉的每一對相對應的列是否近鄰,并構建兩個人臉的每一個相應列的近鄰圖,然后查看近鄰圖判斷兩個臉是否有足夠的列為K近鄰,從而確定兩個人臉是否為近鄰,通過該方法求取近鄰并應用到該算法中,進行特征提取。
具體實施過程如下:
(1)利用主成成份分析降維:首先把樣本投影到PCA子空間,用WPCA表示PCA的投影矩陣。
(2)構造類內散布矩陣W、類間散布矩陣Wp:
其中p為大于1小于m的值。
(3)將上過程求得的構造類內散布矩陣W、類間散布矩陣W p代入到原始的邊界Fisher判定準則中,解下邊最小化問題。

為了上面提出的RMFA算法的分類性能,基于ORL和yale兩個標準人臉數據庫, 本論文對LDA和MFA算法實施了系統的對比實驗。在整個實驗過程中,所有的人臉圖像樣本被標準化到32×32維。除此之外,在后續的實驗中我們利用表示隨機抽取的每個人的m個人臉圖像進行訓練并且使用剩下的n個人臉圖像用來測試。對于三種降維算法,隨著參與學習樣本數的增加識別率也不斷的提高。在同等條件下MFA識別率高于LDA是由于LDA算法本身的缺陷,LDA假設每個類的觀測數據點都服從高斯分布,現實中確并非如此。
安陽工學院青年基金項目群體行為識別研究(QJJ2015019);河南省教育廳重點研究項目(15A430012)。