翟進(jìn)有 代冀陽(yáng) 王嘉琦 應(yīng)進(jìn)


摘要:傳統(tǒng)的人臉識(shí)別算法如SVM,等都需要人為的進(jìn)行特征提取。該文以經(jīng)典的深度卷積神經(jīng)網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)進(jìn)行特征提取,結(jié)合區(qū)域搜索網(wǎng)絡(luò),設(shè)計(jì)出一種自學(xué)習(xí)的人臉檢測(cè)算法。該文通過(guò)搭建多種不同深度的殘差網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)模型,結(jié)合區(qū)域搜索網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)研究,在人臉檢測(cè)數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試,最終測(cè)試結(jié)果顯示該算法對(duì)遮擋不明顯的人臉圖像檢測(cè)效果較SVM算法更好。
關(guān)鍵詞:殘差網(wǎng)絡(luò)多捷聯(lián)式;殘差學(xué)習(xí);時(shí)間復(fù)雜度
中圖分類(lèi)號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2019)04-0182-02
在現(xiàn)實(shí)世界中進(jìn)行人臉檢測(cè),由于姿態(tài),表情,角度以及光線照明因素造成的視覺(jué)變化,導(dǎo)致計(jì)算機(jī)難以準(zhǔn)確檢測(cè)。因此,需要先進(jìn)且高效的辨別模型來(lái)準(zhǔn)確的區(qū)分出背景和人臉。
1994年初Vaillant et al等人應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測(cè),他們提出訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)來(lái)檢測(cè)圖像窗口中人臉的存在或缺失,并在網(wǎng)絡(luò)的所有可能位置掃描整個(gè)圖像。1996年,Rowley等人提出了一個(gè)視網(wǎng)膜連接的神經(jīng)網(wǎng)絡(luò),用于智力的正面人臉檢測(cè)。該方法在兩年后被擴(kuò)展用于旋轉(zhuǎn)不變式人臉檢測(cè),使用“路由器”網(wǎng)絡(luò)來(lái)估計(jì)人臉位置并應(yīng)用適當(dāng)?shù)臋z測(cè)器網(wǎng)絡(luò)。2002年,Garcia等人,設(shè)計(jì)出一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)檢測(cè)復(fù)雜圖像中的版正面人臉。2005年,Osadchy等人,訓(xùn)練出用于同時(shí)進(jìn)行人臉檢測(cè)和姿態(tài)估計(jì)的網(wǎng)絡(luò)。
自從Viola等人做出了開(kāi)創(chuàng)性的工作以來(lái),具有簡(jiǎn)單特征的增強(qiáng)級(jí)聯(lián)網(wǎng)絡(luò)成為人臉檢測(cè)中最流行和有效的方法。功能簡(jiǎn)單的特性能夠使得人臉檢測(cè)達(dá)到快速評(píng)估的效果。Viola-Jones等人設(shè)計(jì)的最原始的人臉檢測(cè)器使用Haar特征,該特征可以快速的評(píng)估人臉正面的辨識(shí)度。然而,由于Haar特征的簡(jiǎn)單性,使得該人臉檢測(cè)器在面對(duì)不同姿態(tài),意外照明以及面部有遮擋的情形下效果較差。
1人臉識(shí)別網(wǎng)絡(luò)
通過(guò)檢測(cè)結(jié)果可以看出,本文提出的區(qū)域搜索網(wǎng)絡(luò)模型在人臉檢測(cè)數(shù)據(jù)集上能夠獲得較好的效果,而在訓(xùn)練的過(guò)程中我們沒(méi)有觀察到退化現(xiàn)象,因此可以從大量增加深度上顯著提高準(zhǔn)確度。所有評(píng)估指標(biāo)都體現(xiàn)了深度的好處。通過(guò)采用更深的網(wǎng)絡(luò)模型能夠獲得更好的檢測(cè)效果。
3 結(jié)語(yǔ)
針對(duì)人臉識(shí)別的實(shí)時(shí)性與準(zhǔn)確性要求,以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),搭建了多種深度的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,并且通過(guò)比較各網(wǎng)絡(luò)的性能優(yōu)劣,最終找到檢測(cè)準(zhǔn)確率最高的網(wǎng)絡(luò)。基于深度殘差網(wǎng)絡(luò)的人臉檢測(cè)算法,相較于傳統(tǒng)的檢測(cè)算法可以避免人為提取目標(biāo)特征而帶來(lái)的誤差,在識(shí)別精度上有了巨大的提升。對(duì)于復(fù)雜背景下的目標(biāo),深度殘差網(wǎng)絡(luò)的捷徑反饋機(jī)制能夠有效地降低網(wǎng)絡(luò)訓(xùn)練的難度,使得更深層次的網(wǎng)絡(luò)依然能夠有效地訓(xùn)練使用。使用深度殘差網(wǎng)絡(luò)的目標(biāo)檢測(cè)應(yīng)用于無(wú)人機(jī)目標(biāo)識(shí)別中,通過(guò)準(zhǔn)確率與檢測(cè)時(shí)間的綜合性能考慮要更優(yōu)于傳統(tǒng)的深度卷積神經(jīng)網(wǎng)絡(luò)。
然而本文所研究的目標(biāo)數(shù)據(jù)集依然較少,在以后的研究中需要獲取更大更多的人臉數(shù)據(jù)集,并且搭建更深層次,性能更優(yōu)的網(wǎng)絡(luò)以及更高效的特征提取來(lái)提高目標(biāo)檢測(cè)的準(zhǔn)確率與檢測(cè)時(shí)間。且本文中所采用的人臉檢測(cè)數(shù)據(jù)集大部分都是正面和側(cè)面照,缺少具有遮擋的人臉數(shù)據(jù),因此對(duì)于有部分遮擋住的人臉檢測(cè)效果并不是很好,數(shù)據(jù)集的豐富性仍然有待提高。
參考文獻(xiàn):
[1] 李偉,張旭東.基于卷積神經(jīng)網(wǎng)絡(luò)的深度圖像超分辨率重建方法[J].電子測(cè)量與儀器學(xué)報(bào),2017,31(12):1918-1928.
[2] 蔣帥.基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別[D].吉林:吉林大學(xué),2017.
[3] Chang L, Duarte M M, Sucar L E, et al. A Bayesian approach for object classification based on clustersof SIFT local features[J]. Expert Systems with Applications, 2012, 39(2): 1679-1686.
[4] Saxe A M, McClelland J L, Ganguli S. Exact solutions to the nonlinear dynamics of learning in deep linear neural networks[J]. arXiv preprint arXiv:1312.6120, 2013.
[5] He K, Zhang X, Ren S, et al. Delving deep into rectifiers: Surpassing human-level performance on imagenet classification[C]//Proceedings of the IEEE international conference on computer vision,2015: 1026-1034.
【通聯(lián)編輯:代影】