999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經網絡和SVR的年齡估計

2019-09-10 07:22:44孟文倩穆國旺
河北工業大學學報 2019年1期
關鍵詞:利用特征方法

孟文倩 穆國旺

摘要 人臉圖像年齡估計已經成為計算機視覺領域中一個重要的研究課題,具有廣泛的應用價值。利用在IMDB-WIKI年齡數據庫上訓練得到的卷積神經網絡(CNN)提取特征,并利用主成分分析對特征進行降維,最后利用支持向量機回歸的方法進行年齡估計。還討論了對CNN不同層輸出的特征進行融合的結果。在FG-NET標準年齡數據庫上對該算法進行了測試,實驗結果表明,本文算法平均絕對誤差較小,優于傳統的年齡估計方法。

關 鍵 詞 計算機視覺;年齡估計;深度學習;卷積神經網絡;支持向量回歸

中圖分類號 TP391.41 文獻標志碼 A

0 引言

人臉年齡估計就是從人臉圖像中提取與年齡相關的面部特征,利用模式識別算法構造數學模型,對待測圖像的具體年齡或年齡段進行估計的一種技術[1]。人臉年齡估計在實際生活中具有諸多的應用,例如在安全領域,利用人臉年齡估計技術可以幫助辦案人員縮小嫌疑人的范圍;在電子商務中,通過分析購物者的年齡可以制定更有針對性的營銷策略;可以借助年齡估計技術限制未成年人在自動售貨機上購買香煙、酒類;限制未成年人進入網吧等不宜進入的場所。年齡估計技術還可以用于圖片分類、檢索等方面.因此,近年來人臉年齡估計受到了國內外學者的廣泛關注,成為計算機視覺領域的一個研究熱點。

人臉年齡估計算法通常是先提取能夠反映年齡的面部特征,然后利用分類或回歸對年齡進行估計。用于提取年齡特征的模型(或方法)主要有:人體測量學模型[2]、主動外觀模型(active appearance models,AAM)[3]、年齡成長模式子空間(aging pattern subspace, AGES)[4]、年齡流形(age manifold)[5]、基于仿生學的模型(bio-inspired features, BIF)[6]等.基于分類的年齡估計方法主要有:特定年齡和外觀方法(appearance and age specific, AAS)[7]、支持向量機方法(SVM)[8]、超平面排序(ordinal hyperplane rank, OHRank)[9]、標簽分布學習(label distribution learning, LDL)[10]等;基于回歸的方法主要有:支持向量機回歸(support vector regression, SVR)[11]、線性回歸[12]、二次回歸[12]、偏線性回歸[13]等。

國內對年齡估計的研究起步較晚,但近年來也有許多學者對人臉年齡估計進行了研究,并提出了一些新的算法。例如,2006年,胡斕、夏利民[14]提出了基于人工免疫識別系統的年齡估計。2008年,張宇、周志華[15]提出了基于集成的年齡估計方法。余慶、杜吉祥[16]提出一種基于改進的非負矩陣分解的人臉年齡估計方法。2012年,黃兵、郭繼昌[17]提出基于Gabor小波與LBP直方圖序列的人臉年齡估計。2014年,瞿中等[18]提出利用典型相關分析融合LBP和HOG特征的人臉年齡估計方法。2015年,李玲芝等[19]提出基于稀疏表示的自動年齡估計。

近年來隨著計算機運算能力和神經網絡理論的發展,深度學習越來越引起科學界和工業界的關注。深度學習是一種自動學習特征的算法,其中最具代表性的是卷積神經網絡( Convolutional Neural Network,CNN) ,它在目標分類、檢測和人臉識別等應用中取得了巨大的成功。2016年, Rasmus Rothe等[20]提出了基于卷積神經網絡的DEX方法,他們對用于圖像分類的VGG網絡的最后一層進行修改,使每個神經元對應一個年齡(或年齡段),并采用Softmax激活函數,將每個神經元的輸出看成輸入圖像屬于該年齡(或年齡段)的概率,通過求期望值的方法得到年齡的估計值。

本文利用文獻[20]作者在網絡上公開的在IMDB-WIKI數據集上訓練得到的用于年齡估計的VGG-16網絡提取特征[20],但采用傳統的支持向量機回歸(SVR)來進行年齡估計,并在FG-NET數據集上對算法進行驗證。實驗表明,在不對FG-NET人臉圖像進行任何預處理操作的前提下,利用本文所述方法比單純利用CNN的DEX方法得到的結果更好,而且所得結果由于各種傳統的年齡估計方法。

1 卷積神經網絡

卷積神經網絡(CNN)是一種前饋神經網絡。它的底層主要是提取一些與邊緣、角度、輪廓相關信息,具有一定的通用性。它的高層逐漸提取出一些圖像的結構信息。通常而言,層數越多,提取到的信息越全面。卷積神經網絡有3個結構上的特性:局部連接、權重共享以及空間或時間上的下采樣。這些特性使得卷積神經網絡具有一定程度上的平移、縮放和扭曲不變性,能夠有效降低網絡模型的學習復雜度,由于具有更少的網絡連接數和權值參數,從而更容易訓練。卷積神經網絡涉及的最重要的前向傳播運算是卷積操作和下采樣操作。

1.1 卷積層

在全連接前饋神經網絡中,如果第[l]層有[nl]個神經元,第[l-1]層有[nl-1]個神經元,連接邊有[nl×nl-1]個,也就是權重矩陣有[nl×nl-1]個參數(如圖1)。當[m]和[n]都很大時,權重矩陣的參數非常多,訓練的效率會非常低。

如果采用卷積來代替全連接,第[l]層的每一個神經元都只和第[l-1]層的一個局部窗口內的神經元相連,構成一個局部連接網(如圖2)。

第[l]層的第[i]個神經元的輸出定義為

[ali=fj=1mwlj?al-1i-j+m+bli =fwl?al-1i+m-1:i+bli], (1)

式中:[wl∈Rm]為[m]維的濾波器;[al-1i+m-1:i=al-1i+m-1,...,al-1iΤ]。這里,[al]的下標從1開始。也可以寫為

[al=fwl?al-1+bl]。 (2)

[wl]對于所有的神經元都是相同的,也就是卷積層的權值共享特性,這樣,在卷積層里只需要[m+1]個參數,另外,第[l+1]層的神經元個數不是任意選擇的,而是滿足[nl+1=nl-m+1]。

圖像是以二維矩陣的形式輸入到神經網絡中,需要二維卷積。可以寫為

[Xl=fWl?Xl-1+bl]。 (3)

為了增強卷積層的表現能力,可以使用K組不同的濾波器來得到K組輸出,每一組輸出都共享一個濾波器。卷積層的作用是提取一個局部區域的特征,每一個濾波器相當于一個特征提取器。

1.2 下采樣層

卷積層雖然可以顯著減少連接的個數,但是每一個特征映射的神經元個數并沒有顯著減少。如果后面接一個分類器,分類器的輸入維數依然很高,很容易出現過擬合。為了解決這個問題,在卷積神經網絡中一般會在卷積層之后再加上一個池化(Pooling)操作,也就是下采樣(Subsampling),構成一個下采樣層。下采樣層可以大大降低特征的維數,避免過擬合。

對于卷積層得到的一個特征映射[Xl],可以將[Xl]劃分為很多區域[Rk],[k=1,…,K],這些區域可以重疊,也可以不重疊。一個下采樣函數[down(…)]一般是取區域內所有神經元的最大值(Maximum Pooling)或平均值(Average Pooling):

[poolmax(Rk)=maxi∈Rkai], (4)

[poolavgRk=1Rki∈Rkai]。 (5)

下采樣的作用還在于可以使得下一層的神經元對一些小的形態改變保持不變性,并擁有更大的感受野。

2 基于深度網絡和數學期望的年齡估計

在文獻[20]中,提出了基于深度卷積網絡和數學期望的年齡估計方法,并稱之為DEX(Deep Expectation)方法。他們采用VGG-16卷積神經網絡結構,其主要結構如圖3。VGG網絡結構最初由Simonyan K,Zisserman A[21]提出,用于1 000類物體的分類,在ImageNet大規模圖像分類的競賽中取得了優異的成績。和經典的卷積神經網絡結構——AlexNet相比,VGG-16網絡層數更多,共有16層,包括13個卷積層和3個全連接層。在VGG網絡中,卷積層全部采用3×3大小的濾波器,卷積操作的間隔(stride)為1,因此,可以捕捉更精細的圖像特征。在原始的用于物體分類的VGG網絡中,最后一層全連接層的神經元個數是1 000,采用Softmax激活函數。為了利用VGG網絡進行年齡估計,文獻[20]中對于VGG-16網絡的最后一層進行修改,使每個神經元對應一個年齡(或年齡段)。設將年齡范圍劃分為k個子集[Y1,Y2,...,Yk],其中,[Yi]包含的最小年齡是[Ymini],最大年齡是[Ymaxi],則網絡最后一層的神經元個數設置為k。用[x∈Rn+1]表示最后一層(Softmax層)的輸入向量,[θi=Rn+1,i=1,2,...,k]表示第i個神經元和輸入向量連接的權重,采用Softmax激活函數,則網絡的輸出是

[o=1j=1keθΤjxeθΤ1xeθΤ2x?eθΤkx]。 (6)

DEX方法將第i個神經元的輸出[oi=eθΤixj=1keθΤjx]看成輸入圖像的年齡屬于[Yi]的概率,通過計算年齡的數學期望

[E(O)=i=1kyi?oi], (7)

來估計輸入圖像的年齡,其中,[yi]是年齡值在[Yi]中的所有訓練樣本(圖像)的平均年齡,[oi]是第[i]個神經元的輸出。

為了訓練用于年齡估計的卷積神經網絡,Rothe R,Timofte R,Gool L V. 等人[20]在網絡上搜集了大量名人和電影明星的照片,建立了自己的用于年齡估計和性別識別的人臉數據庫IMDB-WIKI.在訓練用于年齡估計的VGG-16網絡時,他們利用了在ImageNet數據集上訓練得到的用于圖像分類的VGG網絡的參數(除最后一層以外)作為初始值,然后利用IMDB-WIKI數據集對網絡進行訓練,得到了用于年齡估計的卷積網絡VGG_ILSVRC_16。

3 基于CNN和SVR的年齡估計

和文獻[20]中提到的年齡估計方法DEX不同,本文雖然也利用了文獻[20]中在IMDB-WIKI數據集上訓練得到的用于年齡估計的VGG-16網絡, 但只是用它來提取圖像的年齡特征。一般來說,卷積神經網絡中前面的各個卷積層提取的是低層的特征,而后面各層提取的是相對高層的更能反映分類信息的特征,因此,本文分別嘗試將VGG-16網絡中最后2層(即圖3中的fc6,fc7這2個全連接層)的輸出作為特征。由于它們均是4 096維的特征,維數較高,接下來利用主成份分析(PCA)對特征進行降維,最后訓練支持向量機回歸(SVR)模型用于年齡估計。本文算法的基本流程如圖4所示.

4 實驗結果

本文在標準的年齡數據庫FG-NET上進行了實驗。FG-NET數據庫包含82個人在不同表情、姿態和光照條件下的1 002幅圖像,年齡范圍在0~69歲。本文采用LOPO (Leave One Person Out)協議進行實驗,即每次取1個人的圖像作為測試樣本,其他81個人的圖像作為訓練樣本進行實驗,最后計算平均絕對誤差(MAE),用來對算法進行評價。

本文利用文獻[20]中在IMDB-WIKI數據庫上訓練得到的卷積神經網絡VGG_ILSVRC_16來提取特征。對于輸入的圖像,經過前向計算,得到網絡各層的輸出,將fc6和fc7層的輸出作為特征,接著利用PCA方法將提取到的特征降到1 000維,最后通過SVR方法進行年齡估計。在SVR模型中,采用高斯核函數,懲罰系數C取為90,高斯核的參數取為0.005。實驗結果如表1所示。從中可以看出,和直接使用基于VGG_ILSVRC_16網絡的DEX方法相比,本文方法的MAE更小。需要說明是,在文獻[20]中,首先要對圖像進行人臉檢測、對齊、裁剪等預處理操作,然后再將其作為網絡輸入。而為了處理方便,同時,也為了驗證文獻[20]中網絡的魯棒性和可遷移性,在本文實驗中,并沒有對FG-NET數據庫中的圖像進行人臉檢測、對齊和裁剪等操作,而只是簡單地將圖像縮放為224×224的彩色圖像,再利用VGG_ILSVRC_16網絡的參數進行歸一化操作,然后就將其作為VGG_ILSVRC_16網絡的輸入。此外,VGG_ILSVRC_16網絡在訓練過程中沒有使用FG-NET中的任何樣本,因此,直接利用VGG_ILSVRC_16網絡和DEX方法對于FG-NET 中的圖像進行年齡估計,其MAE為6.29,誤差較大。而表中其它方法都采用了LOPO協議,即每次都利用一部分FG-NET中的圖像對模型進行訓練,然后預測另一部分圖像的年齡.可以看出來,本文算法優于各種常規的年齡估計算法。

除了分別利用卷積神經網絡VGG-16中fc6和fc7層的輸出作為特征并利用SVR進行年齡估計外,本文還嘗試對fc6和fc7層輸出的特征進行融合。為了便于計算,本文嘗試了2種簡單的融合方法。一種是特征級融合,將fc6特征和fc7特征串接后,得到8 192維的特征向量,再利用PCA方法降維,得到1 000維的特征向量,最后,利用SVR進行年齡估計,MAE為3.77,和單獨使用fc6或fc7特征相比,誤差略有下降。另一種是將利用fc6特征和fc7特征計算得到的年齡值取平均,作為最后的年齡估計值,MAE為3.76,誤差進一步減少。

5 結論

年齡估計在刑事偵查、失蹤人口追蹤、電子商務、智能人機交互、圖像檢索等領域都有重要的應用,因此,對它的研究具有重要的意義。但由于人的面貌除受年齡變化的影響外,還受到健康、環境、地域、種族等方面的影響,加之年齡數據庫采集的不宜,因此,基于圖像的年齡估計是一個具有挑戰性的問題。文獻[20]中提出了基于卷積神經網絡和數學期望的年齡估計算法,并且在ICCV 2015舉辦的關于外觀年齡估計挑戰賽(The ChaLearn Looking At People ICCV2015 challenge)中獲得了第一名。本文利用了文獻[20]中訓練得到的用于年齡估計的卷積神經網絡(VGG_ILSVRC_16),但采用了和文獻[20]中不同的處理方法,即只是用它來提取特征,然后再進行PCA降維,最后利用SVR進行年齡估計。實驗結果表明,本文方法優于傳統的年齡估計方法,并且,通過對CNN不同層輸出的特征進行融合,可以進一步減少年齡估計的誤差。

參考文獻:

[1] 潘思宇,趙雯婷,唐鯤,等. 人臉年齡估計和年齡面貌合成技術研究進展[J]. 刑事技術,2017,42(4):270-276.

[2] KWON YH,LOBO NDV. Age classification from facial images[J]. Computer Vision and Image Understanding,1999,74(1):621-628.

[3] COOTES TF,EDWARDS GJ,TAYLOR CJ. Active appearance models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(6):681-685.

[4] GENG X,ZHOU ZH, SMITH-Miles K. Automatic age estimation based on facial aging patterns[J]. IEEE Trans Pattern Anal Mach Intell,2007, 29(12):2234-2240.

[5] FU Y,HUANG TS. Human age estimation with regression on discriminative aging manifold[J]. IEEE Transactions on Multimedia,2008, 10(4):578-584.

[6] GUO GD,MU GW, FU Y,et al. Human age estimation using bio-inspired features[C]//Proc of the IEEE Conf on Computer Vision and Pattern Recognition (CVPR 2009), 2009:112-119.

[7] LANITIS A,DRAGANOVA C,CHRISTODOULOU C. Comparing different classifiers for automatic age estimation[J]. IEEE Trans Syst Man Cybern B Cybern, 2004,34(1):621-628.

[8] GUO G, FU Y, HUANG TS,et al. Locally adjusted robust regression for human age estimation[C]//IEEE Workshop on Applications of Computer Vision IEEE Computer Society,2008:1-6.

[9] CHANG KY,HEN CS, HUNG YP. Ordinal hyperplanes ranker with cost sensitivities for age estimation[C]//EEE Conference on Computer Vision and Pattern Recognition,2011:585-592.

[10] GENG X,YIN C, ZHOU ZH. Facial age estimation by learning from label distributions[J]. IEEE Trans Pattern Anal Mach Intell,2013,35(10):2401-2412.

[11] GUO G,FU Y,DYER CR,et al. Image-based human age estimation manifold learning and locally adjusted robust regression[J]. IEEE Transactions Image Processing,2008,17(7):1178-1188.

[12] LANITIS A,TAYLOR CJ,COOTES TF. Toward automatic simulation of aging effects on face images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):442-455.

[13] GUO G,MU G. Simultaneous dimensionality reduction and human age estimation via kernel partial least squares regression[C]//Computer Vision and Pattern Recognition,IEEE,2011:657-664.

[14] 胡斕,夏利民. 基于人工免疫識別系統的年齡估計[J]. 計算機工程與應用,2006,42(26):186-188.

[15] 張宇,周志華. 基于集成的年齡估計方法[J].自動化學報,2008,34(8):997-1000.

[16] 余慶,杜吉祥. 基于一種改進NMF算法的人臉年齡估計方法[J]. 中國圖像圖形學報,2008,13(10):1865-1868.

[17] 黃兵,郭繼昌. 基于Gabor小波與LBP直方圖序列的人臉年齡估計[J]. 數據采集與處理,2012,27(3):340-345.

[18] 瞿中,孔令軍,馮欣. 典型相關分析融合LBP和HOG特征的人臉年齡估計[J]. 重慶大學學報,2014,37(4):52-57,87.

[19] 李玲芝,梁毅雄,艾瑋,等. 基于稀疏表示的自動年齡估計[J]. 中南大學學報(自然科學版),2015,46(3):878-885.

[20] ROTHE R,TIMOFTE R,GOOL L V. Deep expectation of real and apparent age from a single image without facial landmarks[J]. International Journal of Computer Vision,2016:1-14.

[21] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[J]. Computer Science,2014:1409-1556.

[責任編輯 楊 屹]

猜你喜歡
利用特征方法
利用min{a,b}的積分表示解決一類絕對值不等式
中等數學(2022年2期)2022-06-05 07:10:50
利用一半進行移多補少
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
利用數的分解來思考
Roommate is necessary when far away from home
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产一区亚洲一区| 91福利片| 国产微拍一区二区三区四区| 精品成人免费自拍视频| 污污网站在线观看| 亚洲精品午夜无码电影网| 狠狠色婷婷丁香综合久久韩国| 国产在线97| 国产成人精品一区二区不卡 | 伊人久久综在合线亚洲2019| 免费观看精品视频999| 国产视频只有无码精品| 在线欧美日韩| 国产成人综合日韩精品无码首页 | 无码AV动漫| 亚洲无码视频图片| 欧美精品亚洲精品日韩专区va| 精品91自产拍在线| 综合色88| 在线精品亚洲国产| 国产欧美专区在线观看| 亚洲欧美日韩天堂| 亚洲美女视频一区| 呦女亚洲一区精品| 欧美一级高清免费a| 国产h视频在线观看视频| 国产精品30p| 极品私人尤物在线精品首页 | 丁香综合在线| 制服丝袜国产精品| 亚洲综合色婷婷中文字幕| 日本欧美中文字幕精品亚洲| 亚洲国产中文精品va在线播放| 久久特级毛片| 色哟哟国产精品| 黄色三级网站免费| 久久大香香蕉国产免费网站| 四虎永久免费在线| 麻豆国产在线观看一区二区 | 国产成年女人特黄特色大片免费| 99久视频| 成人在线天堂| 久久久久亚洲精品成人网| 无码中字出轨中文人妻中文中| 大乳丰满人妻中文字幕日本| 日本高清在线看免费观看| 精品五夜婷香蕉国产线看观看| 色悠久久综合| 亚洲天堂视频在线免费观看| 日韩成人免费网站| 日本草草视频在线观看| 毛片最新网址| 毛片网站在线播放| 久久精品66| 嫩草影院在线观看精品视频| 久久久久亚洲AV成人网站软件| 国产亚洲精品91| 99视频有精品视频免费观看| 成人国产精品2021| 国产精品蜜臀| 天堂va亚洲va欧美va国产| 国产91视频免费观看| av在线人妻熟妇| 91青青草视频在线观看的| 99国产精品一区二区| 伊人久久婷婷五月综合97色| 国产白浆一区二区三区视频在线| 九色视频一区| 国产精品区视频中文字幕 | 亚洲全网成人资源在线观看| 欧美精品啪啪一区二区三区| 美女黄网十八禁免费看| 国产伦片中文免费观看| 国产一级视频久久| 久久久黄色片| 久久国产精品娇妻素人| 欧美三级视频网站| 中文字幕佐山爱一区二区免费| 伊人久久福利中文字幕| 国产精品伦视频观看免费| 日韩欧美中文| 国产杨幂丝袜av在线播放|