周 婕,馬明棟
(1.南京郵電大學 通信與信息工程學院,江蘇 南京 210003;2.南京郵電大學 地理與生物信息學院,江蘇 南京 210003)
眾所周知,人臉表情作為非語言交際的一種形式,包含著豐富的情感信息,同時傳達出一些有關人的認知行為、性格和心理情緒,雖然顯示出的信息是比較隱晦的,但更能實時地、真實地反映出人的內心活動,真實性更高,且這種信息表達方式不能被其他方式所替代,因此人臉表情在人們的日常交流中占據著重要地位。隨著計算機技術的快速發展,人們對人工智能的研究更加深入,希望通過計算機能模擬人類行為,提高人類的生活質量,造福人類。因此人臉表情識別技術作為通過計算機來預測人類心理狀態的一種方式具有廣闊的應用前景,比如在教育、醫學、心理學、商業、安全駕駛等各大領域都有對此技術的研究。
人臉表情識別的關鍵就在于人臉不同表情特征點的提取,然而傳統的特征提取算法,如尺度不變特征變換(SIFT)、局部二值模式(LBP)等,不僅設計方法比較困難,而且特征點提取不完全,從而導致效率低下。因此,研究人員將卷積神經網絡如AlexNet、VGGNet、GoogleNet等用于人臉表情識別。卷積神經網絡以其能夠共享卷積核,對高維數據處理無壓力且特征分類效果好的獨特優勢,在圖像、語音處理方面得到廣泛的應用。但隨著網絡深度的加深,學習能力的加強,反而造成了梯度爆炸和梯度消失,從而出現了所謂的“退化”問題,即優化效果越來越差,測試數據和訓練數據的準確率也越來越低。……