胡亞君
(南京理工大學 計算機學院,江蘇 南京 210094)
?
卷積神經網絡在人臉識別的應用
胡亞君
(南京理工大學 計算機學院,江蘇南京210094)
摘要:文章通過使用深度學習的卷積神經網絡模型實現了人臉識別技術。實驗表明相比于傳統的神經網絡模型,卷積神經網絡取得了更好的識別效果。
關鍵詞:人臉識別;卷積神經網絡;MATLAB
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術,相比其他生物體征識別方法,人臉識別具有非強制性、非接觸性、并發性等優點[1]。近些年來,深度學習方法作為機器學習領域的新的研究方向出現,在多個圖像處理領域取得了明顯的成果[2]。卷積神經網絡(CNN)正是一種代表性的深度學習方法,它以其局部權值共享的特殊結構在圖像處理方面有著獨特的優越性,特別是多維輸入向量的圖像可以直接輸入網絡這一特點避免了特征提取,降低了分類過程中數據重建的復雜度[3]。
2.1卷積神經網路整體框架(見圖1)

圖1 卷積神經網絡整體框架
卷積神經網絡是一種特殊的深層的神經網絡模型,通常包括卷積層、下采樣層和全連接層。卷積神經網絡具有以下兩個結構特征:
稀疏連接:每一層的神經元只與前一層的指定的神經元進行連接,以這種方式來利用圖像的局部空間特性。
權值共享:同一個特征映射圖的神經元對應的權值相等。
下面對分別對卷積層和下采樣層分別進行簡單介紹。由于在圖像的某一部分的特征在圖像的其他位置上也會出現,我們使用一個卷積核對一張圖片進行卷積操作,得到新的特征映圖。相對應根據圖像局部相關性的原理,可以采用對不同位置的特征進行聚合統計的方式實現下采樣操作。
2.2卷積神經網絡的訓練算法
卷積神經網絡的訓練主要分為兩個階段:向前傳播階段和反向傳播階段。下面對2個階段分別進行介紹。
2.2.1向前傳播階段
卷積過程:用卷積核與輸入圖像進行卷積操作,加上偏置,經過一個激活函數,得到卷積層的結果。具體的運算公式如下,這里的Mj表示選擇的輸入的maps的集合中特征映射圖的數量:

下采樣過程:設采樣窗口的大小是n*n,采用平均采樣。具體公式如下 ,down()為下采樣函數:

2.2.2反向傳播階段
(1)卷積層誤差。
由于下采樣操作,采樣層的每個像素點的靈敏度δ對應于卷積層的一個采樣窗口大小的多個神經元,為了準確的計算靈敏度,我們需要進行上采樣操作。類比BP算法,得到如下公式:

最后,由于很多連接的權值是共享的,因此,對于一個給定的權值,有如下公式:

(2)采樣層誤差。
由公式(2)可以看出,每個輸出特征映射圖都對應一個唯一的乘性偏置和一個加性偏置。計算采樣層的誤差,首先還是要求得靈敏度δ。根據前向的卷積操作過程可以得到靈敏度的推導公式:于是,類比BP算法的權值更新公式可以得到:


3.1實驗數據集
為了驗證卷積神經網絡的有效性,本實驗中使用CASIA WebFace數據庫[4],選擇其中的25個人的大小為250*250的照片作為本實驗的數據集,其中訓練集7900張,測試集3688張。實驗環境是工作站,E5-2640CPU2.0GHz,64G內存,Windows7操作系統,MATLAB2015a實驗平臺。
3.2結果對比

圖2 CNN模型均方誤差線圖
圖2顯示了卷積神經網絡在WebFace數據集上的性能,隨著迭代次數的增加,卷積神經網絡的均方誤差穩定2.3%左右。作為對比,我們在相同數據集上測試了傳統的的多層感知器網絡(MLP)和徑向基神經網絡(RBF),對比結果如表1所示。從表1中可以清晰地看出,相比于傳統的MLP和RBF方法,卷積神經網絡的識別率有了非常大的提升。

表1 3種神經網絡模型結果對比
本文主要介紹了應用于人臉識別的深度學習中的卷積神經網絡模型。相比于傳統的MLP和RBF兩種方法,CNN的準確率顯著高于另外2種方法,凸顯出該模型在處理圖像時的優勢。其中一個重要的原因在于CNN可以自動提取有效特征。不過CNN的訓練需要大量的樣本,海量的訓練數據和漫長的訓練過程致使CNN的泛化能力較弱。未來的研究將主要集中在卷積神經網絡的學習效率與泛化能力。
[參考文獻]
[1]蔣遂平.人臉識別技術及應用簡介[M].北京:中國計算機世界出版社,2003.
[2]孫銀黎.對深度學習的認識[J].紹興文理學院學報:教育版,2007(11):34-36.
[3]胡正平,陳俊嶺,王蒙,等.卷積神經網絡分類模型在模式識別中的新進展[J].燕山大學學報,2015(4):283-291.
[4]Y Sun,X Wang,X Tang, Deep Learning Face Representation by Joint Identification-Verification[C]//NIPS, 2014.
The Application of Deep Convolutional Neural Network on Face Recognition
Hu Yajun
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing210094, China)
Abstract:This paper applied Deep Convolutional Neural Network (CNN) to face recognition, and the experimental results showed that the DCNN achieved better performances compared to Multilayer Perceptron (MLP) and Radial Basis Function (RBF) neural networks.
Key words:face recognition; deep convolutional neural network; MATLAB
作者簡介:胡亞君(1993-),女,安徽蕪湖,本科;研究方向:機器學習,圖像處理,模式識別。