摘 要:為了提高人臉定位算法的執行效率和魯棒性,以傳統的SNoW(Sparse Network of Winnows)算法為理論基礎,提出一種新的人臉定位算法。樣本特征提取時將亮度做了局部二值化映射,訓練分類器時訓練了人臉和非人臉2個網絡,利用這2個網絡的輸出結果之差進行分類,使用采樣的方法檢測不同大小的人臉,使用遮罩避免頭發和衣領的干擾。實驗結果表明,新算法比傳統算法節約計算資源,提高了執行效率,提升了算法對于表情、遮蓋、光照、姿勢、大小魯棒性。
關鍵詞:人臉定位;SNoW;分類器;魯棒性
中圖分類號:TP317.4 文獻標識碼:B 文章編號:1004373X(2008)1814603
An Improved Face Detection Algorithm Based on SNoW
XU Jian1,CHANG Zhiguo2
(1.Xi′an Institute of Post Telecommunications,Xi′an,710121,China;
2.School of Electronic Information and Electrical Engineering,Shanghai Jiaotong University,Shanghai,200240,China)
Abstract:To improve the efficiency and robustness of the face detection algorithm,a novel approach based on traditional SNoW (Sparse Network of Winnows)is proposed.Main innovations consist of the followings: the illumination insensitive feature is mapped into local binary feature,face table and nonface table are trained and the difference between the outputs of two tables is used for classification,sampling is used for detecting faces of various sizes,mask is utilized for avoiding the interference of hair and collar.The experimental results show that the new algorithm saves the computing resource and improves the efficiency and robustness to expression,occlusion,lighting,pose and size.
Keywords:face detection;SNoW;classifier;robustness
1 引 言
人臉定位是確定景物中是否有人臉,有幾個人臉,并且確定其位置的技術。人臉定位與識別系統被廣泛應用于監控、制造、急救以及基于內容的視頻檢索中。近年來,人臉定位技術獲得較大的發展,并涌現出了許多研究方向[1,2]。現有的人臉定位研究主要集中在如下的幾個領域:神經網絡技術[3]、統計模型[4]、AdaBoost[5]、SNoW[6]和支持向量機[7]。與其他技術相比,SNoW具有算法復雜度低,執行速度快等優點,所以受到了廣泛關注。但是傳統的SNoW算法直接使用像素亮度為特征,導致網絡龐大,占用存儲空間大。且分類算法對于表情,遮蓋,光照,姿勢,大小等魯棒性較差[6]。
本文以提出一種新的算法對傳統的SNoW算法做出了大的改進。實驗表明,改進之后的算法具有良好的效果。
2 算法描述
2.1 SNoW算法
SNoW(Sparse Network of Winnows)學習體系的基本思想是利用事先定義好的樣本特征來訓練線性稀疏網絡,然后用訓練好的網絡實現分類。每一個線性網絡節點直接與樣本特征相對應。SNoW用于人臉定位最初由Roth在文獻[6]中提出。
在訓練網絡的過程中,樣本被分為兩類。一類為積極樣本,一類為消極樣本。在人臉定位過程中,訓練該網絡的積極樣本為人臉樣本,消極樣本為非人臉樣本。令At={i1,i2,…,im}為積極樣本的特征集合,它們對應網絡上目標節點t。設wti為網絡節點t的第i個特征的權重,θt為判決門限。當且僅當∑i∈Atwti>θt時,表示網絡的權重滿足要求,否則將根據訓練規則調整網絡節點的權重wti。
SNoW網絡的訓練規則主要是通過事先定義的積極和消極樣本升高和降低網絡節點的權重。首先定義門限θt、上升參數α>1,和下降參數0<β<1。當輸入訓練樣本為人臉,但是∑i∈Atwti<θt時,令i∈At:wti←αwti;當輸入樣本為非人臉,但是∑i∈Atwti>θt時,令i∈At:wti←βwti。經過大量的人臉和非人臉的樣本訓練,該線性網絡具有了分類的功能。當輸入一幅未知內容的圖像時,該網絡就可以實現人臉定位。
傳統的算法主要使用圖像的原始亮度作為特征來訓練網絡。該特征定義如圖1所示[8]:
圖1 亮度特征傳統的算法具有占用資源多、執行效率低、魯棒性差等缺點。本文針對這些缺點從樣本特征定義和分類算法方面對傳統的算法做出改進。
2.2 樣本特征的提取
2.2.1 傳統算法的缺點
傳統算法直接使用亮度作為像素特征具有以下缺點:
(1) 占用資源多。由于每個像素都有256種可能灰度,所以當樣本圖像的大小為m×n時,線性網絡的大小為m×n×256。
(2) 魯棒性差。光照的強弱會直接導致人臉亮度的大小。所以同樣一張人臉在光照不同的情況下,傳統算法會得出不同的結果,導致漏檢或錯檢。
2.2.2 新算法的步驟
針對以上缺點,新的算法提出局部二值化映射算法,步驟如下:
(1) 計算樣本圖像亮度的局部均值E(x,y)。
(2)以局部均值E(x,y)為閾值,對樣本圖像的亮度I(x,y)進行局部閾值的二值化,得到二值化圖像M(x,y)。I(x,y)→E(x,y)M(x,y)(1)
(3) 根據式(2)將M(x,y)映射為D(x,y)。D(x,y)=M(x,y)+2×M(x+1,y)+
4×M(x,y+1)+8×M(x+1,y+1)(2)
(4) 利用D(x,y)作為像素特征訓練樣本。
2.2.3 新算法的優點
(1) 由于D(x,y)只有16種可能值,所以當樣本圖像的大小為m×n時,線性網絡的大小為m×n×16。比傳統算法大大節約資源。
(2) 局部二值化有效的克服光照的強弱對算法的影響,提高了算法的魯棒性。
2.3 SNoW分類器的訓練方法
SNoW算法的關鍵是如何訓練一個有效的線性網絡。本文提出的新的分類器如下:θ=∑x∈Whnonfacex(M(x))-∑x∈Whfacex(M(x))(3)其中hnonfacex為非人臉網絡;hfacex為人臉網絡;θ為非人臉網絡與人臉網絡計算結果之差;定義判決門限為γ,當θ<γ時判決為人臉,當θ>γ時判決為非人臉。
訓練人臉網絡hfacex的方法如下:
(1) 建立一個m×n×16的矩陣,每個矩陣元素的值均為1。
(2) 利用標準人臉圖庫進行訓練。
當∑x∈whfacex(Mi(x))≤ε時:hfacex(Mi(x))=αhfacex(Mi(x))其中α>1。
(3) 利用標準非人臉圖庫進行訓練。
當:∑x∈whfacex(Mi(x))>ε時:
hfacex(Mi(x))=β hfacex(Mi(x))。
其中0<β<1。
訓練非人臉網絡的方法與上述方法類似,但升高和降低網絡權重的規則正好相反。
2.4 分類器用于人臉定位
當訓練好的分類器用于人臉定位時,為了避免頭發和衣領的影響。這里使用一個遮蓋物將圖像四角遮蓋起來[9]。
圖2 遮罩人臉定位分類器對于人臉大小的魯棒性問題一直是該領域研究的重點。這里使用采樣的方法獲取一個圖像的不同大小。例如對圖像進行隔1個像素采1個樣,獲取圖像的大小為原圖像的1/2。如果隔1個像素采2個像素,采樣得到的圖像為原圖像大小的2/3。
3 實驗結果
這里使用CMU+MIT[10]標準人臉數據庫,其中包含2 429張人臉和4 548張非人臉來訓練人臉和非人臉網絡。接下來將待定位圖像以19×19的大小為單位進行局部二值化映射,并將圖像以9/10的比例進行逐級采樣。然后送入人臉定位分類器進行分類。為了驗證分類器的性能,做了2組實驗。一組使用標準圖庫,這里采用的是ATT的400副圖進行實驗。第二組采用20副自然照片進行實驗。實驗結果證明,該人臉定位算法對于表情、遮蓋(如眼鏡,胡須等)、光照、姿勢、大小等均具有較強的魯棒性。
表1 實驗結果統計
正確率錯誤數標準圖庫85%6020副自然照片80%7
部分人臉定位的結果如圖3所示:
圖3 部分人臉定位結果4 結 語
本文提出一種基于SNoW的人臉定位算法。樣本特征提取時將亮度做了局部二值化映射有效地提高了算法對于光照的魯棒性。訓練分類器對人臉和非人臉模板分別進行訓練,利用兩個網絡的輸出結果之差進行分類,增加了人臉檢測的準確率。使用采樣的方法來檢測不同大小的人臉,提高了算法對于人臉大小的魯棒性。使用遮罩避免了頭發和衣領的干擾。
實驗結果表明,新算法比傳統算法節約了計算資源,提高了執行效率。結合其他數學模型進一步優化算法,提高定位精度是下一步工作的重點。
參 考 文 獻
[1]Yang M H,Kriegman D,Ahuja N.Detecting Faces in Images:A Survey[J].IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI),2002,24(1):3458.
[2]Hjelmas E,Low B K.Face Detection:A Survey\\.Computer Vision and Image Understanding,2001,3(3):236274.
[3]Rowley H,Baluja S,Kanade T.Neural Networkbased Face Detection[C].Proceedings of Computer Vision and Pattern Recognition,1996:203208.
[4]Schneiderman H,Kanade T.Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Recognition[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR ′98),1998:4551.
[5]Viola P,Jones M.Rapid Object Detection Using A Boosted Cascade of Simple Features[C].Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR),2001(1):511518.
[6]Roth D,Yang M,Ahuja N.A Snowbased Face Detector[C].Advances in Neural Information Processing Systems 12 (NIPS 12),2000:855861.
[7]Osuna E,Freund R,Girosi F.Training Support Vector Machines:An Application to Face Detection[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR ′97),1997:193199.
[8]Gundimada S,Asari V.An Improved SNoWbased Classification Technique for Headpose Estimation and Face Detection[C].Proceedings of the 34th Applied Imagery and Pattern Recognition Workshop (AIPR′05) ,2005:9499.
[9]Nilsson M,Nordberg J,Claesson C.Face Detection Using Local SMQT Features and Split up SNoW Classifier[C].IEEE International Conference on Acoustics,Speech,and Signal Processing (ICASSP),2007(2):589592.
[10]Dimitri Pissarenko.Face Databases[EB/OL].http://openbio.sourceforge.net/,Jan 18,2008.
作者簡介 徐 健 女,1981年出生,助教,碩士學位。研究方向為模式識別。
常志國 男,1976年出生,博士研究生。研究方向為圖像處理。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文