隋在娟
(三星電子(中國)研發中心 江蘇省南京市 210012)
近年來,在統計學,信號處理、圖像處理等領域中,稀疏問題得到廣泛的研究,并已經成功地應用于解決很多實際問題。稀疏表示可以去掉冗余信息,用很少的數據來表示出圖像絕大部分的重要信息,因此圖像稀疏表示算法已成為近年來圖像處理領域中的研究重點。同樣稀疏問題也被用在信號處理中,在信號處理領域中,稀疏問題的研究在于表示和壓縮信號,在給定的超完備字典中用盡可能數量少的原子來表示信號,從而使人們更方便進一步對信號壓縮,編碼等。同樣,人們也一直探索稀疏方法在人臉識別方向上的應用。本文在稀疏算法的基礎上,進一步研究將稀疏表示應用于人臉識別與分類,為了驗證算法的有效性,在AR 和CAS-PEAL 人臉庫進行識別效果驗證,實驗結果表明,稀疏投影用于人臉識別正確率比傳統的算法有明顯的提升。
給定一定的人臉數據集X=[x1,x2,...,xn],這里的n 是樣本總數,xi是某一個人臉的二維圖像列向量化得到的一維向量。因為任意一個人臉樣本可以用相同類的其他人臉樣本線性表示,所以,若稀疏表示用的完備字典選用訓練所用的全部人臉圖像來組成,即任意一個樣本由總的樣本集來表示的話,通常其他不相關樣本的貢獻理論上為零,只有與該樣本相關的同類的其他樣本才可以在構造中發揮主要作用。也就是說,將任意樣本xi由所有樣本集來線性表示如下:

圖1中等號左邊是某個待表示的人臉圖像樣本xi,中間12 張人臉表示去除該樣本xi后的剩下所有人臉圖像構成的字典(該樣本集字典大小為12,最上面一排4 個樣本與選定樣本xi是同一類),最右部分線段圖表示左邊男性人臉樣本由完備字典中所有其他樣本重構得到的稀疏系數。從右邊稀疏系數圖可看出,與左邊特定樣本相關性最大的是前幾個樣本(即同一類),它們對重構做出主要的貢獻。
現將重構后的樣本表示為,稀疏系數矩陣表示為A,則所有重構樣本的過程可以表示為公式:Y=XA。其中,通過下面公式計算得到重構系數集合:

其中||·||0表示用來計算向量中非零元素的個數,數學上稱之為向量的L0范數。如果字典足夠大,那么 中零元素個數相對較多,非零數目就相對較少,所以就越稀疏。
在實際應用中,L0范數本身不容易有一個很好的數學表示形式,給出上面問題的形式化表示是一個很難的問題,故被認為是一個NP 難題。實際中都不是直接求L0范數,而是轉換成高階范數,在足夠稀疏的情況下,上述L0范數的求解可以用L1范數的求解來代替,兩者得到的解幾乎等價。所以對于公式(2),可以將0 范數的最優求解轉換到1 范數的最優化問題:

圖1:人臉稀疏表示示意圖

圖2:AR 數據庫識別率對比展示

圖3:CAS-PEAL 數據庫識別率對比展示

實際中有很多成熟的快速求解最小化L1范數問題,包括有梯度投影,增廣拉格朗日等解法,因此系數稀疏求解問題得到解決。
基于稀疏表示理論提出的一種特征提取的方法稀疏保留投影(SPP),它和很多保留結構信息的降維方法不同,SPP 是在流形稀疏表示框架下,構建數據集的緊鄰權重矩陣,以保留樣本的稀疏重構關系。它的目標是獲得一個線性投影空間,使樣本之間的全局重構關系得以在低維空間中保留。這種方法因為不需要提前知道類別信息,因此屬于無監督的人臉識別方法,但是稀疏表示有其自然的不俗的鑒別力,即一幅人臉圖像的最緊湊的重構表示絕大部分來自于相同的類。它無需選擇任何模型參數,具有很強的適應性和靈活性。
SPP 的第一步是前面介紹的公式(3),用L1范數最優問題求解得到稀疏重構系數矩陣A。之后,SPP 的目標是求如下公式(4)最小化問題,就是要尋找最優的W 投影空間,使初始圖像在W 投影空間投影和重構樣本在W 投影空間中投影,且保證投影后二者的差值最小:

簡化展開可得:

設e 為N 維單位向量,則上式可以寫成:


下面給出SPP 算法用于人臉識別的步驟:
(5)選擇合適的分類器進行分類。
SPP 有很多優點,比如它是線性的,所以out of sample 的問題隨之被解決;不需要解決模型參數問題;同時數據的局部屬性得到大部分保留。所以它很容易在其他有監督或半監督的人臉識別方法中得到使用和拓展,并同時得到較好的其他衍生方法。
我們選取了兩個人臉庫:AR 庫和CAS-PEAL 庫上進行實驗,我們將稀疏保留投影同另外的兩個經典的人臉分析方法:PCA 和LDA 的分類正確率進行對比,同時我們還對實驗結果進行了詳細的數據分析。
AR 數據庫包含126 個人,其中男性70 名,女性56 名,一共約4000 幅人臉彩色照片。這4000 張圖像是不同的光照明暗、光照方向,不同人臉表情神態,不同遮擋物下的正面人臉圖像,它們拍攝于不同時期。由于相機采集到的原始人臉圖像維數比較高,直接使用該圖像庫所需的計算量超過了目前普通計算機的處理能力,所以使用處理過后的圖片集(包括119 個人,每人26 個圖片,每幅圖像有256 個灰度級別,圖像的分辨率壓縮至60×60 像素)組成一個新的AR 人臉庫。
在本實驗中,我們隨機地從每個人的所有圖片中選取6 個圖像樣本作為訓練樣本,剩余的20 個為測試樣本,并且為了公平起見所有的方法運行20 次。識別率對比結果如圖2。
圖2可以看出,總體說來,兩個經典的人臉識別方法PCA 和LDA 在該人臉庫的識別率基本上都輸給稀疏保留投影SPP 方法,我們將20 次的結果求出平均值:PCA 平均識別率76.35%,LDA 83.44%,SPP 86.13%。在AR 庫中SPP 比對比方法至少高了2.69(86.13%-83.44%)個百分點,說明稀疏投影成功應用到人臉識別中,并且識別效果比傳統的兩種人臉線性鑒別算法好。
CAS 人臉數據庫由中國科學院制作,包含了106 個人,每人10 張圖像。此數據庫的特點是各個圖像是在光照條件有很大差異的情況下拍攝的。每張圖像大小是120×90,每幅圖像256 個灰度級。我們將圖像分辨率壓縮成60×45 像素大小。
本實驗在CAS-PEAL 庫上選取5 個訓練樣本,剩余的5 個為測試樣本,并且為了公平起見所有的方法也運行20 次。識別率對比結果如圖3。
圖3可以看出,稀疏保留投影SPP 方法在該人臉庫的識別率也基本上都超過了PCA 和LDA 人臉識別方法,我們將20 次的結果求出平均值:PCA 平均識別率79.65%,LDA 84.52%,SPP 88.18%。在CAS-PEAL 庫中SPP 比對比方法至少高了3.66(88.18%-84.52%)個百分點,識別效果有了更進一步的提高,說明稀疏投影總體優于傳統人臉線性鑒別方法,達到了我們預期的效果,是一種可行的和有效的算法。
本章著重介紹稀疏理論,研究了稀疏投影在人臉識別上的應用。稀疏投影使人臉樣本之間的全局重構關系得以在低維空間保留,因此優于傳統算法,文章將它與傳統的人臉識別方法作對比,實驗結果表明有效的提高了人臉識別率,可見稀疏投影在人臉識別中也可以成功運用,并打開了人臉識別領域的新思路。