韓貴金+楊嘉寧
【摘要】本文提出了一種基于改進卷積神經網絡的人臉檢測算法,對傳統卷積神經網絡的結構進行了改進,同時利用圖像的全局和局部特征來進行人臉檢測。仿真實驗表明,本文所提出的人臉檢測算法取得了良好的檢測效果。
【關鍵詞】人臉檢測深度學習卷積神經網絡局部特征全局特征
基金項目:西安市科技計劃項目,項目名稱:公路視頻測速中的距離自動標定與測距關鍵技術研究,項目編號:CXY1701(5)。
文獻標識碼:A中圖分類號:TP391.4
作為近年來最為流行的機器學習算法,深度學習可以從海量數據中自動學習出表達和區分能力更強的特征,能更準確地表征真實人臉外觀。卷積神經網絡是深度學習算法的一種,其在圖像識別與分析等計算機視覺領域中獲得了最為廣泛的應用。本文提出了一種基于改進卷積神經網絡的人臉檢測算法,對傳統卷積神經網絡的結構進行了改進,并提取圖像的全局和局部特征進行人臉檢測。
基于改進卷積神經網絡的人臉檢測
深度學習利用建立好的模擬人腦分析學習機制的神經網絡來解釋圖像、聲音和文本等數據,通過對低層特征進行組合形成更抽象的高層特征,從而得到數據的分布式特征。
卷積神經網絡是在計算機視覺領域應用最為廣泛的深度學習模型,其基本結構包括卷積層和池化層,卷積層利用卷積核提取特征,卷積層通過局部感知和權值共享來減少權值參數數量,池化層利用池化核來對卷積層提取出的特征進行統計操作。
人類識別人臉時在考慮人臉的局部特征的同時,也會考慮人臉的全局特征。為此,本文對傳統卷積神經網絡的結構進行了改進,改進后的網絡結構由3個卷積層、4個池化層、引入層和3個全連接層組成,各網絡層的具體參數如表1所示。
改進后的卷積神經網絡中有3個卷積層,卷積層的具體參數如表1所示,第一個卷積層參數中96×96×3為待處理圖像的尺寸,卷積核通過滑窗的方式對輸入圖進行卷積,每個卷積核對應一種特征提取的方式,卷積操作后得到一個特征圖,88×88×32中88×88為卷積操作后特征圖尺寸,32為卷積核個數,9×9×3為卷積核尺寸。其他卷積層的參數與此類似。
卷積運算如下式所示:

仿真實驗及分析
本文分別采用AFLW數據集和FDDB數據集作為訓練圖像集和測試圖像集。AFLW數據集由32203圖片中的393703張人臉圖片組成,FDDB數據集由2845圖片中的5171張人臉圖片組成,是學術界評價人臉檢測和識別性能時應用非常廣泛的測試數據集。
在構造人臉正負樣本時,由于不同訓練圖片中人臉尺寸并不一致,本文將從訓練圖片中剪切并歸一化為96×96像素大小的人臉圖片作為正樣本,將從訓練圖像中隨機剪切出的同樣大小的圖像塊作為負樣本。
表2給出了本文算法和現有部分現有人臉檢測算法的檢測準確度比較結果。其中,“全局”表示僅利用圖片的全局特征時的人臉檢測算法;“局部”表示僅利用圖片的局部特征時的人臉檢測算法;“全局+局部”表示本文所提出的同時利用圖片全局和局部特征的人臉檢測算法。從表中可以看出,當僅利用圖像全局特征時,人臉檢測效果很低;當僅利用圖像局部特征時,人臉檢測效果提升并不明顯,而當同時利用圖像全局和局部特征時,人臉檢測效果得到了進一步的提升。
圖1給出了本文人臉檢測算法對FDDB數據集中幾幅測試圖片的檢測結果。從圖中可以看出,本文所提人臉檢測算法成功檢測出了背景和光照條件不同的圖片中的人臉,而且人臉的角度也不盡相同。
本文主要研究了如何利用深度學習進行人臉檢測,提出了一種基于改進卷積神經網絡的人臉檢測算法,同時利用圖像全局和局部特征來檢測人臉。如何進一步改進卷積神經網絡結構將是今后的研究內容。
參考文獻:
[1]GlorotX,BordesA,BengioY.,“Deepsparserectifier neural networks”(2011 International Conference on Artificial Intelligence and Statistics, Lauderdale:IEEE Press,2011:315-326).
[2] Jain V Learned-Miller E.,“Online Domain Adaptation of a Pre-Trained Cascade of Classifiers”(2011 IEEE Conference on Computer Vision and Pattern Recognition. Washington:IEEE,2011:577-584).
[3]Yang S,Luo P,Loy C C, et al.,“From facial parts responses to face detection: a deep learning approach”(2015 IEEE International Conference on Computer Vision. Washington:IEEE,2015:3676-3684).
作者單位:韓貴金西安郵電大學自動化學院陜西西安
楊嘉寧特藝(中國)科技有限公司中國北京endprint