王健 王新中 楊文霞 彭保
【摘 要】綜述了主成分分析(Principal Component Analysis, PCA)算法的基本原理,并詳細闡述了PCA算法在人臉識別中的應用,包括:分塊PCA、基于類內平均臉的PCA算法改進、PCA和ICA的組合算法。最后,本文提出:未來的研究應著眼于擴大算法的比較范圍和尋找最優分塊方式。
【關鍵詞】主成分分析;人臉識別;分塊PCA;算法組合
0 引言
PCA是經典的模式識別算法。它的思想是在特征空間尋找一些方向,使得數據在這些方向上的誤差平方和最小。本文將簡要介紹PCA在人臉識別中的基本原理和應用。
1 PCA人臉識別的基本原理
圖1 PCA人臉識別的基本原理
PCA能夠最大限度地保留原有數據的結構分布,變換的核心是在最小均方意義下尋找最能代表原始數據的投影,從而達到對特征空間降維的目的。
人臉圖像作為二維矩陣,每個元素代表圖像中相應點的灰度等級。設一幅人臉圖像為一個m行n列的矩陣Im×n。Im×n=(I1,I2,…,Ii,…,In,),其中為第i列向量(i∈[1,n])。對人臉圖像進行PCA變換主要包含6個步驟,如圖1所示。
1.1 圖像向量化
1.6 采用最近鄰分類器對特征進行分類
2 PCA人臉識別的應用
PCA人臉識別能夠在降維的同時最大限度地保留原始圖像的主要識別信息。它能夠反映樣本集合的主要分布方向,抓住圖像之間的所有差異。但是,PCA仍然有缺點:
(1)PCA反映的圖像之間的差異可能是類內差異,也可能是類間差異,因此PCA變換進行分類的效果未必好。
(2)PCA抽取的是人臉的全局特征。在人臉表情和光照條件變化較大時(即局部變化大時),人臉識別的效果不顯著。因此,需要改進PCA算法來捕捉人臉的局部信息特征。
(3)圖像向量化過程將產生很高的向量維數。一方面會增加計算復雜度;另一方面會使樣本數目小于特征維數,導致小樣本問題,造成特征提取困難。
針對上述問題,解決辦法有三類:(1)對人臉圖像采取分塊PCA。(2)改進PCA的算法結構。(3)吸取其它算法的優點,將PCA和ICA、LDA等算法進行組合來識別人臉。
2.1 分塊PCA
分塊PCA的主要思想是對人臉圖像手動分塊(p*q塊),然后再對每一子塊分別進行PCA變換[1],或者將這些子塊進行能量歸一化和傅里葉變換,在頻域范圍進行子塊PCA變換[2]。兩種方法差別不大。分塊PCA變換后,采用最近鄰分類器對提取的主分量特征進行分類。
研究表明:分塊PCA不但可以降低圖像向量的維數,而且可以以2的冪次方增加樣本的數量,避免小樣本問題。此外,分塊PCA可以更清晰地捕捉人臉的局部信息特征,在表情和光照條件變化較大時具有更好的識別能力和魯棒性。因此,分塊PCA優于經典PCA。
2.2 PCA算法的改進:基于類內平均臉的PCA
實驗表明:基于類內平均臉的PCA方法有效地增加了不同類別之間樣本的距離,同時縮小了類內樣本之間的距離,有利于提高人臉識別率。(下轉第44頁)
(上接第34頁)在基于類內平均臉的PCA基礎上,還可對圖像進行分塊處理。研究表明:基于類內平均臉的分塊PCA的人臉識別效果明顯優于經典PCA方法和普通分塊PCA方法[4]。
2.3 PCA+ICA
PCA提取的特征是最小均方誤差意義上的二階統計信息,各分量之間互不相關;而ICA提取的是高階統計信息,各分量之間相互獨立。因此PCA的主分量特征與ICA的獨立分量特征是對原數據的兩類不同描述。如果將二者結合起來,那么必定使抽取到的信息更加全面,人臉識別的性能也將得到改善。
1)先對人臉圖像進行PCA變換,在變換后的特征空間進行ICA變換[5-7]。具體為:
(1)人臉圖像訓練樣本先進行PCA降維,得到。
(2)在PCA變換得到的特征空間上求取ICA最佳投影矩陣W,由此得到聯合最優投影矩陣。
(3)人臉圖像訓練樣本和測試樣本經過Y=(W?鄢)TX進行變換。
(4)用最近鄰分類器分類。
2)分別對人臉圖像進行PCA和ICA變換,得到的特征分別求距離或余弦相似度,最后將相似度結果求和并進行分類[8]。具體為:
(1)人臉圖像進行PCA變換;
(2)人臉圖像進行ICA變換;
(3) PCA和ICA的兩類特征使用余弦分類器和最近鄰分類器進行聯合人臉識別。
實驗表明:基于分類器組合的方法優于單獨使用PCA或ICA的單分類器方法。
3)分別對人臉進行PCA和ICA變換,對得到的特征加權求和,并分類[9]。具體為:
(1)對人臉圖像進行PCA變換,得到PCA特征。
(2)對人臉圖像進行ICA變換,得到ICA特征。
(3)將PCA特征和ICA特征加權求和,構造加權特征值。
(4)對加權特征值進行分類(最近鄰法和余弦法)。
實驗表明:單獨的ICA識別率高于單獨的PCA;PCA和ICA特征加權識別率高于單獨的PCA或單獨的ICA。
3 總結及展望
本文總結了PCA的基本原理,并詳細闡述了PCA算法在人臉識別中的應用,包括:分塊PCA,基于類內平均臉的PCA算法改進,PCA和ICA的組合算法。未來的研究中可以著眼于以下幾點:
(1)算法組合后,人臉識別效果的比較范圍應該擴大。在現有文獻中,組合算法進行人臉識別后,通常只和某種單一的算法進行比較,而不和其它的組合算法比較,這樣無法發現哪種組合算法更優。
(2)解決分塊PCA如何最優分塊的問題。研究表明:不同的分塊方式、不同的分塊個數將導致不同的人臉識別率,那么尋找最佳的分塊方式和分塊數目將成為下一步研究的重點。
【參考文獻】
[1]陳伏兵,楊靜宇.分塊PCA及其在人臉識別中的應用[J].計算機工程與設計,2007,28(8):1889-1892.1913.
[2]孫鑫,劉兵,劉本永.基于分塊PCA的人臉識別.基于分塊PCA的人臉識別[J].2005,27:80-82.
[3]何國輝,甘俊英.PCA類內平均臉法在人臉識別中的應用研究[J].計算機應用研究,2006,3:165-166,169.
[4]李曉東,費數岷,張濤.一種改進的模塊PCA方法及其在人臉識別中的應用[J].測控技術,2008,11:19-21,24.
[5]安高云,阮秋琦.基于獨立分量分析的普適人臉識別系統[J].北京交通大學學報,2006,30(5):6-9,14.
[6]王宏漫,歐宗瑛.采用PCA/ICA特征和SVM分類的人臉識別[J].計算機輔助設計與圖形學學報,2003,15(4):416:420
[7]劉直芳,游志勝,王運瓊.基于PCA和ICA的人臉識別[J].激光技術,2004,28(1):78-81.
[8]徐勇,張重陽,楊靜宇.基于主分量特征與獨立分量特征的人臉識別實驗[J].計算機工程與設計,2005,26(5):1155-1157,1184.
[9]王展青,劉小雙,張桂林,王仲君.基于PCA與ICA的人臉識別算法研究[J].華中師范大學學報:自然科學版,2007,41(3):373-376.
[責任編輯:鄧麗麗]