李超琪 王紹宇



摘要:人臉包含了較多的可區分生物特征信息,這些信息除了可用于身份認證和識別外,還可用于人臉年齡分類等應用。為克服人臉所表征年齡信息會受到復雜的非線性因素例如個體的基因差異、居住環境、健康情況和種族差別等因素的影響,本文使用深度卷積神經網絡,通過設計一系列的卷積、池化、全連接和歸一化層,對人臉的年齡進行了有效地分類。本算法能克服傳統SVM分類算法不能有效處理人臉圖像和實際年齡間復雜的非線性關系而帶來的準確率下降問題,在FG-NET人臉數據測試集上達到了94.4%的準確率,能有效地應用在安防、人機交互和娛樂影音等領域。
關鍵詞:卷積神經網絡;深度學習;年齡分類
0引言
人臉作為人類個體鮮明顯著的生物特征之一,包含著豐富的個人信息。隨著計算機視覺和機器學習技術的發展,相關的人臉識別等技術已成為這些項目任務的熱點課題,并在法醫、電子化客戶關系管理、安防、生物識別和娛樂影音等諸多領域中得到廣泛應用。人臉除了可進行身份認證和識別外,還可以提取出性別、種族和年齡等信息,特別是可以將年齡及分布特征用于人機交互和商業智能等應用中,因此年齡估計研究具有重要的科學意義和實用價值。
相對于人臉識別,人臉所能表征的年齡信息要受到很多因素的影響,例如不同個體的基因差異、生活習慣、環境、抗壓能力、健康情況和種族差別等有很大的關系。同時,相同個體因發型、化妝和表情的不同也會影響年齡的估計。因此,如果要基于傳統的分類算法(如支持向量機)并利用人臉圖像信息來進行年齡分類將很難得到理想的結果。針對這些問題,目前的研究還相對不足,如果能有效解決上述問題,對大部分潛在的應用領域也都將帶來深刻的影響。
1相關工作
年齡分類的主要流程是先根據人臉圖像獲取特征,再通過機器學習方法構建模型,通過把年齡分為多個年齡區段,即每個年齡段對應一個類別(比如未成年或成年人等)。因此可以把年齡分類看成是一個二分類或者多分類的分類問題來進行求解。1994年,Kwon和Lobo則從人臉圖像中獲取年齡分類,把人分為3種不同的類別,也就是兒童、青年人和老年人,強調重要特征點的選擇。2002年Lanitis等人提出了能自動對年齡實現估計的年齡量化方法。而且,王先梅等的綜述中也整體梳理了相關年齡估計技術的研究發展。王紹宇等人還基于SMV采用生物特征對人臉進行分類,分為小孩和成人。此外在2016年,董遠等人更將遷移學習和卷積神經網絡用于人的年齡和性別分類。
傳統的淺層機器學習模型,如支持向量機(SVM)等分類方法很難建立一個統一的模型去表示人臉圖像和實際年齡之間復雜的非線性關系,如果要提高年齡分類的準確性,需要通過大量地協配人工參與來研究提取能區分對應不同年齡類別的大量特征。深度學習算法能夠優質克服傳統淺層學習算法中需要手工提取特征的缺點,能自動地從低級別的圖像中抽取特征,再逐層地抽取特征,最后獲取高級別的抽象特征。卷積神經網絡(CNN)作為深度學習算法的一種,近幾年呈現迅速發展態勢,并在許多圖像識別任務中取得了很大的成功。Krizhevskv等在2010年的ILSVRC中利用深度卷積神經網絡,對1000種不同類別的圖片展開分類,取得了當時最好的識別率。此外,還在諸如語音識別、圍棋等領域,卷積神經網絡也得到了大量的應用。
本文工作主要面向不需要提取準確年齡信息,只需區分對象所處年齡段的應用場合,通過基于CNN的模型來對年齡進行兒童和成人的分類,能有效用于自動售貨機出售酒精和香煙產品的授權、上網用戶的成年人認證和公共場合對未成年人的重點視頻監控等實際應用中。