999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合Multiscale CNN和BiLSTM的人臉表情識別研究

2021-02-22 06:58:45李軍李明
北京聯合大學學報 2021年1期

李軍 李明

[摘要]為了有效改善現有人臉表情識別模型中存在信息丟失嚴重、特征信息之間聯系不密切的問題,提出一種融合多尺度卷積神經網絡(Multiscale CNN)和雙向長短期記憶(BiLSTM)的模型。BiLSTM可以增強特征信息間的聯系與信息的維持,在Multiscale CNN中通過不同尺度的卷積核可以提取到更加豐富的特征信息,并通過加入批標準化(BN)層與特征融合處理,從而加快網絡的收斂速度

,有利于特征信息的重利用,再將兩者提取到的特征信息進行融合,最后將改進的正則化方法應用到目標函數中,減小網絡復雜度和過擬合。在JAFFE和FER2013公開數據集上進行實驗,準確率分別達到了95.455%和74.115%,由此證明所提算法的有效性和先進性。

[關鍵詞]多尺度卷積神經網絡;雙向長短期記憶;特征融合;批標準化層;正則化

[中圖分類號]TP 391.41[文獻標志碼]A[文章編號]10050310(2021)01003505

Research on Facial Expression Recognition Based on the

Combination of Multiscale CNN and BiLSTM

Li Jun, Li Ming

(School of Computer and Information Science,Chongqing Normal University,Chongqing 401331,China)

Abstract: In order to effectively improve the problems of serious information loss and inadequate connection between feature information in the existing facial expression recognition model, a model combining Multiscale Convolutional Neural Network (Multiscale CNN) and Bidirectional Long and ShortTerm Memory (BiLSTM) is proposed. BiLSTM can enhance the connection between feature information and the maintenance of information. In Multiscale CNN, richer feature information can be extracted by convolution kernels of different scales. After adding a Batch Normalization (BN) layer and feature fusion processing in order to accelerate the convergence rate of the network and increase the reuse of feature information, and then by fusing the feature information extracted by the two, the improved regularization method is applied to the objective function to reduce network complexity and overfitting. Experiments on the public data sets of JAFFE and FER2013 have achieved accuracy rates of 95.455% and 74.115%, respectively, which proves the effectiveness and advancement of the proposed algorithm.

Keywords: Multiscale Convolutional Neural Network(Multiscale CNN); Bidirectional Long and ShortTerm Memory(BiLSTM); Feature fusion; Batch Normalization(BN) layer; Regularization

0引言

人臉表情是人與人之間信息溝通的有效途徑之一[1],隨著科技的不斷發展,人臉識別技術應用的領域越來越廣泛,例如教育、交通、醫療等領域。傳統的人臉表情識別技術有幾何特征[2]、稀疏表示[3]和局部二值模式[4],人工智能與大數據的發展使得神經網絡備受矚目,研究者開始將卷積神經網絡[5]和3D卷積神經網絡[6]應用于人臉表情識別中。卷積神經網絡是特征提取的最有效方法之一,所以被廣泛應用于圖像處理和圖像識別領域中,并且取得了較好的研究成果。當前主流的方法是CNN與RNN的結合[7]和特征融合[8]等,但仍然存在信息丟失與組件間聯系不密切等問題。造成這些問題的原因是卷積神經網絡對圖像的理解粒度太粗,池化操作丟失了一些隱含信息,從而限制了模型的學習能力。卷積核能夠理解非常細微的局部特征,池化操作能夠讓局部特征更加明顯,而對人臉表情識別必須突出局部特征來學習表情的分類,所以池化操作在人臉表情識別中是非常重要的,也是必不可少的一部分。但是,也不能忽略特征信息之間的綜合聯系,例如,不能僅僅通過嘴角上揚就判斷出人臉表情為開心,如果嘴角上揚的同時眉頭緊皺,那么這種表情則為傷心。所以,在神經網絡訓練的過程中,要綜合全部信息來決定分類結果,特征信息需要滿足信息豐富、特征信息之間聯系密切及特征信息維持時間長等條件。

多尺度卷積神經網絡的出現使得特征信息更加豐富,研究者開始將多尺度卷積神經網絡應用于單目深度估計[9]、圖像增強[10]和人臉識別中[11]。本文將多尺度卷積神經網絡與雙向長短期記憶相融合,提出一種融合多尺度卷積神經網絡(Multiscale CNN)與雙向長短期記憶(BiLSTM)的模型。

1理論基礎

1.1BiLSTM

LSTM可以很好地解決梯度消失和梯度爆炸的問題,LSTM元胞中有輸入門、輸出門和遺忘門。輸入門決定輸入哪些信息,遺忘門決定保留哪些信息,輸出門決定輸出哪些信息。相關公式如式(1)~(5)所示[12]。

ft=Q(w1×[at-1,xt]+b1),(1)

It=Q(w2×[at-1,xt]+b2),(2)

Ut=tanh(w3×[at-1,xt]+b3),(3)

Yt=Q(w4×[at-1,xt]+b4),(4)

Ot=tanh(ft×Ct-1+It×Ut)×Yt。

(5)

其中,xt代表輸入信息,at-1和Ct-1代表上文信息,在xt和at-1堆疊后被復制成4份;w1代表遺忘權重,w2代表輸入權重,w3代表生成候選記憶權重,w4代表輸出權重;Q代表sigmoid激活函數,映射到[0,1]區間中,0代表全部抑制,1代表全部激活;tanh函數用于生成候選記憶,值域為[-1,1]。

雙向LSTM存在兩種類型的元胞,即前向元胞和后向元胞,雙向LSTM的輸出層不僅依賴之前的輸入,還會依賴后面的元素,這就增加了信息的交流與維持,充分利用了數據。具體過程如式(6)~(8)所示[12]。

A1=f(X1×U+w×A2),(6)

a1=f(X1×u+a0×W),(7)

Y1=S(V×A1+v×a1)。(8)

其中,U和u代表輸入層到隱藏層的權重,V和v代表隱藏層到輸出層的權重,W和w代表隱藏層之間的權重,f是激活函數,S是分類函數,通常用于二分類的是sigmoid函數,用于多分類的是softmax函數。

1.2多尺度卷積神經網絡

多尺度卷積神經網絡是使用多個不同尺寸的卷積核對圖像進行卷積,再分別進行池化操作,然后將結果連接,最后進行分類處理,如圖

1所示[13]。

多尺度卷積神經網絡通過不同尺寸的卷積核提取特征,可以增加特征圖的數量,使得提取的信息更加豐富。多尺度卷積神經網絡的

訓練效果雖然優于基準卷積神經網絡,但是存在訓練不穩定的缺陷,主要原因是特征信息之間聯系不密切和特征利用不夠充分。

2模型建立

首先,通過Multiscale CNN和BiLSTM分別對圖像進行特征提取;再將提取到的特征信息進行融合,豐富特征信息;最后,通過全連接層和分類層得到輸出結果,模型結構如圖2所示。BiLSTM可以加強特征信息之間的聯系與信息的維持,Multiscale CNN通過不同尺度的卷積核可以提取更加豐富的特征信息。在Multiscale CNN中每個卷積層后加入BN層,能夠加快網絡的收斂速度,將上一層的特征信息與多尺度卷積后的特征進行融合,有利于特征信息的重利用,在BN層后加入最大池化操作,使得特征信息更加明顯。

2.1改進的Multiscale CNN

本文改進的多尺度卷積神經網絡的具體結構如圖3所示。

1) 多尺度卷積:通過不同的卷積核提取特征,可以得到更加豐富的特征信息,一定程度上減少了信息的丟失。

2) 特征融合:在每一次卷積操作后,都會將前一層的特征信息進行融合,并將每層不同尺度的卷積神經網絡提取出的特征進行融合,可以增強信息的重利用。

3) BN層:在卷積層后加入BN層,能夠加快網絡的收斂速度,使網絡更加穩定。

4) 池化層:池化層可以讓特征更加明顯,本文采用最大池化操作,池化區域為2×2,步長為2,池化后的特征圖分辨率變為原來的1/2。

BiLSTM中的前向元胞與后向元胞的神經元個數均為360個,經過BiLSTM后輸出為

720,對其進行變形,使大小與Multiscale CNN輸出的大小一致,變為6×6×20;再與Multiscale CNN的輸出進行特征融合,輸出由像素為6×6的916個圖像組成,將這些圖像展開為一個一維向量,長度為6×6×916;將這個向量作為輸入傳入含有625個神經元的全連接層,最后再傳入輸出層,由含有7個神經元的全連接層組成。

2.2改進的正則化方法

正則化方法是指通過在模型中加入某種指定的正則項從而達到某種特定目的的方法,常用來減小測試誤差,增強模型的泛化能力。傳統的正則化方法有L1正則化和L2正則化。

L1正則化通過對原目標函數加上所有特征系數絕對值的和來實現正則化。具體公式如(9)和(10)所示,其中C0是原始的損失函數,λnni=1Wi是L1正則化項,λn是正則化系數,W是權值,sgn是符號函數。L1正則化對于所有的權重均給予同樣的懲罰,所以較小的權重也很容易產生特征系數為0的情況,由于大量模型參數變為0,因此達到了稀疏化的目的。但是如果盲目使用L1正則化,在遇到共線性很高的多個特征時,只會選擇其中一個特征,所以會導致誤差較大的結果。

C=C0+λnni=1Wi。(9)

CW=C0W+λnsgn(W)。(10)

L2正則化通過對原目標函數加上所有特征系數的平方和來實現正則化,L2正則化的優點是面對多個共線性特征的時候,會將權值平分給這些特征,從而保留有用的特征。具體公式如(11)和(12)所示,其中C0是原始的損失函數,λ2nni=1W2i是L2正則化項,λ2n是正則化系數,W是權值。可以發現,L2正則化對于絕對值較大的權重給予較大的懲罰,對于絕對值很小的權重給予非常小的懲罰,當權重接近于0時,基本不懲罰,因此使得模型的參數趨于0,而不是等于0,也就是做不到稀疏化。

C=C0+λ2nni=1W2i。(11)

CW=C0W+λnW。(12)

對正則化參數的選擇一直是一個較難解決的問題,參數選擇過大容易產生欠擬合,參數選擇太小容易產生過擬合。針對以上問題,本文對正則化方法進行了改進,將L1正則化與L2正則化進行融合,結合兩者優點,再設計自適應的正則化參數,具體公式如式(13)和(14)所示。

minw=(λt‖W‖1+λt‖W‖22)。(13)

λt=λmin+(λmax-λmin)

e-10iN。(14)

其中,‖W‖1代表W的1范式,‖W‖2代表W的2范式,λmin代表最小值的正則化參數,λmax代表最大值的正則化參數,i代表當前的迭代次數,N代表模型迭代的總次數。根據公式(14),當迭代次數為0時,λt為λmax;當迭代次數增加時,e-10iN隨之減小,無限趨近于0,也就是當迭代次數達到迭代總次數時,λt為λmin。由此,使得模型在最大值與最小值之間選取出最合適的參數,本文中λmax為1,λmin為0.001。

3數據集與實驗結果

3.1數據集

本文采用的數據集有兩種:一種是JAFFE人臉表情數據集,包括213張圖片,由10名日本女性的正面人臉表情組成,本文將數據集裁剪為48×48,隨機打亂數據,并以9∶1分為訓練集和測試集;另一種是FER2013人臉表情數據集,是由Kaggle人臉表情識別挑戰賽提供的數據集,由35 887張人臉表情圖片組成,訓練集有28 709張,公共測試集和私有測試集各有3 589張,本文在私有測試集上進行測試。兩種數據集均有7種表情,分別為憤怒、厭惡、恐懼、高興、悲傷、驚訝和中性。

3.2實驗結果和分析

實驗環境為Windows 10操作系統、python編程語言,采用TensorFlow深度學習框架,在谷歌提供的Colab平臺上使用GPU資源進行實驗。

首先,在JAFFE數據集上進行實驗,批處理樣本設為32,學習率設為0.000 5,總迭代次數為70次,經過27次迭代訓練之后,在JAFFE測試集進行測試,準確率達到95.455%。達到最優時,通過公式(14)計算,λt的值為0.021。本文所提方法與其他方法在JAFFE測試數據集上準確率的對比,如表1所示。

其次,在FER2013數據集上進行實驗,批處理樣本設為128,學習率設為0.005,總迭代次數為380次,經過170次迭代訓練后,在FER2013私有測試集上進行測試,準確率達到74.115%,達到最優時,通過公式(14)計算,λt的值為0.012。本文所提方法與其他方法在FER2013測試數據集上準確率的對比,如表2所示。

4結束語

本文提出了融合Multiscale CNN和BiLSTM的模型,可以融合各自的特點,豐富特征信息,增強特征信息之間的聯系,并將改進的正則化方法應用到目標函數中,減小了過擬合。實驗證明,與其他方法相比,本文方法在JAFFE和FER2013人臉表情識別數據集上的準確率較高,下一步的研究目標是在保證準確率的前提下減少模型訓練的時間。

[參考文獻]

[1]葉繼華,祝錦泰,江愛文,等.人臉表情識別綜述[J].數據采集與處理,2020,35(1):21-34.

[2]COOTES T F, TAYLOR C J, COOPER D H, et al. Active shape modelstheir training and application[J]. Computer Vision and Image Understanding, 1995, 61(1): 38-59.

[3]WANG W, XU L H. A modified sparse representation method for facial expression recognition[J].Computational Intelligence and Neuroscience, 2016:5687602.

[4]GOYANI M M, PATEL N. Recognition of facial expressions using local mean binary pattern[J]. Electronic Letters on Computer Vision and Image Analysis, 2017, 16 (1): 54-67.

[5]LOPES A T, AGUIAR E D, SOUZA A F D, et al. Facial expression recognition with convolutional neural networks: coping with few data and the training sample order[J]. Pattern Recognition, 2017, 61:610-628.

[6]BYEON Y H, KWAK K C. Facial expression recognition using 3D convolutional neural network[J]. International Journal of Advanced Computer Science & Applications, 2014, 5

(12): 107-112.

[7]LIANG D, LIANG H, YU Z, et al. Deep convolutional BiLSTM fusion network for facial expression recognition[J]. The Visual Computer, 2020, 36(3):499-508.

[8]HUANG G, LIU Z, VAN DER MAATEN L, et al. Densely connected convolutional networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 4700-4708.

[9]LIU J W, ZHANG Y Z, CUI J H, et al. Fully convolutional multiscale dense networks for monocular depth estimation[J].IET Computer Vision, 2019,13(5):515-522.

[10]AUDEBERT N, LE SAUX B, LEFVRE S. Semantic segmentation of earth observation data using multimodal and multiscale deep networks[C]//13th Asian Conference on Computer Vision (ACCV 2016).Taipei: Springer, 2016:180-196.

[11]MIN W, FAN M, LI J, et al. Realtime face recognition based on preidentification and multiscale classification[J]. IET Computer Vision, 2019, 13(2):165-171.

[12]ZACCONE G, KARIM R M, MENSHAWY A. TensorFlow深度學習[M].李志,譯.北京:人民郵電出版社,2018.

[13]李金洪.深度學習之TensorFlow工程化項目實戰[M].北京:電子工業出版社,2019.

[14]GU W F, XIANG C, VENKATESH Y V, et al. Facial expression recognition using radial encoding of local Gabor features and classifier synthesis[J]. Pattern Recognition, 2012, 45(1): 80-91.

[15]何志超, 趙龍章, 陳闖. 用于人臉表情識別的多分辨率特征融合卷積神經網絡 [J]. 激光與光電子學進展, 2018, 55(7): 370-375.

[16]UCAR A, DEMIR Y, GUZELIS C. A new facial expression recognition based on curvelet transform and online sequential extreme learning machine initialized with spherical clustering[J]. Neural Computing and Applications, 2016, 27(1): 131-142.

[17]張立志,王冬雪,陳永超,等.基于GMRF和KNN算法的人臉表情識別[J].計算機應用與軟件,2020,37(10):214-219.

[18]劉濤,周先春,嚴錫君.基于光流特征與高斯LDA的面部表情識別算法[J].計算機科學,2018,45(10):286-290+319.

[19]CHANG T Y, WEN G H, HU Y, et al. Facial expression recognition based on complexity perception classification algorithm

[Z/OL].(2018-03-01)[2020-11-06].https://arxiv.org/ftp/arxiv/papers/1803/1803.00185.pdf.

[20]呂誨,童倩倩,袁志勇.基于人臉分割的復雜環境下表情識別實時框架[J].計算機工程與應用,2020,56(12):134-140.

[21]李旻擇,李小霞,王學淵,等.基于多尺度核特征卷積神經網絡的實時人臉表情識別[J].計算機應用,2019,39(9):2568-2574.

[22]蘭凌強,李欣,劉淇緣,等.基于聯合正則化策略的人臉表情識別方法[J].北京航空航天大學學報,2020,46(9):1797-1806.

[23]張愛梅,徐楊.注意力分層雙線性池化殘差網絡的表情識別[J/OL].計算機工程與應用,(2020-08-06)[2020-11-06].http://kns.cnki.net/kcms/detail/11.2127.TP.20200805.1832.032.html.

(責任編輯白麗媛)

主站蜘蛛池模板: 五月婷婷丁香综合| 婷婷久久综合九色综合88| 黑人巨大精品欧美一区二区区| 日韩在线中文| 国产欧美精品一区aⅴ影院| 亚洲国产日韩在线成人蜜芽| 亚洲高清在线天堂精品| 亚洲伊人天堂| 国产欧美日韩在线在线不卡视频| 欧美三级视频在线播放| 国产网友愉拍精品视频| 视频在线观看一区二区| 99在线视频免费观看| 毛片久久网站小视频| 无码专区国产精品一区| 婷五月综合| 免费毛片a| 日韩第九页| 日韩精品亚洲一区中文字幕| 国产午夜福利片在线观看| 欧美午夜视频在线| 精品国产成人国产在线| 亚洲AV无码久久精品色欲| 欧美高清三区| 国产福利小视频高清在线观看| 中文字幕在线日韩91| 国产内射一区亚洲| 日韩国产一区二区三区无码| 国产色网站| 熟妇丰满人妻av无码区| 精品国产欧美精品v| 欧美成人精品在线| 亚洲人成亚洲精品| 亚洲无码精彩视频在线观看| 伊人中文网| 中文字幕亚洲电影| 久久www视频| 欧美综合一区二区三区| 亚洲无限乱码| 欧美自慰一级看片免费| 亚洲天堂在线免费| 欧美国产菊爆免费观看 | 国产在线精品香蕉麻豆| 久久动漫精品| 亚洲精品无码抽插日韩| 色综合久久久久8天国| 亚洲伦理一区二区| 欧美日韩精品一区二区视频| 激情無極限的亚洲一区免费| 国产99视频免费精品是看6| 国内精品久久人妻无码大片高| 亚洲午夜福利在线| 久久久久亚洲AV成人人电影软件| 国产免费黄| 精品国产网| 四虎精品国产永久在线观看| 国产精品永久不卡免费视频 | 久久精品国产免费观看频道| 青青操视频在线| 色有码无码视频| 国产亚卅精品无码| 国产v欧美v日韩v综合精品| 国产成人精品免费av| 久久国产高潮流白浆免费观看| 亚欧美国产综合| 国产96在线 | 日韩欧美中文字幕一本| 试看120秒男女啪啪免费| 欧美国产视频| 色婷婷综合激情视频免费看 | 亚洲精品福利视频| 亚洲精品视频免费| 制服丝袜一区| 尤物精品视频一区二区三区| 国产精品成人AⅤ在线一二三四| 二级特黄绝大片免费视频大片 | 自拍亚洲欧美精品| 视频国产精品丝袜第一页| 五月天久久婷婷| 精品国产中文一级毛片在线看 | 无码'专区第一页| 欧美精品在线观看视频|