摘要:針對(duì)人臉識(shí)別中的特征定位問(wèn)題,文章提出了一種眼角定位方法。首先根據(jù)小波變換,對(duì)灰度圖中的人臉粗定位兩眼的位置,然后結(jié)合 Susan 算子方法找出內(nèi)外眼角的精確位置,實(shí)現(xiàn)對(duì)雙眼的定位。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)方法相比,該方法能較好的實(shí)現(xiàn)眼睛定位,能夠顯著提高了定位準(zhǔn)確率和定位速度。
關(guān)鍵詞: 人臉識(shí)別;小波變換;Susan算子;眼睛定位
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)30-0708-02
A Method of Localization of the Eyes Based on Wavelet
SUN Yu-sheng, JIN Jing-yong
(College of Electricity and Information Engineer, Zhengzhou University of Light Industry, Zhengzhou 45003, China)
Abstract: In view of the person face recognition's in characteristic localization question, the article present one corner of the eye localization method. First according to the wavelet transformation, locates two positions thickly to the gradation chart's person face, then unifies the Susan operator method to discover the inside and outside corner of the eye's exact location, realizes to both eyes' localization. The experimental result indicated that compares with the conventional methods, the method can better realize the eye localization, could obviously raise the localization rate of accuracy and the localization speed.
Key words: face recognition; wavelet; operator susan; eye location
1 引言
眼睛是人臉面部最為顯著的特征之一,在人臉檢測(cè)和識(shí)別中發(fā)揮著重要的作用。眼睛的檢測(cè)與定位是人臉識(shí)別中尺度歸一化的依據(jù),是臉部其他特征如眉、鼻、嘴等準(zhǔn)確定位的基礎(chǔ)。在人眼特征點(diǎn)中,內(nèi)外眼角比瞳孔更為穩(wěn)定,隨年齡、表情、胖瘦等改變變化的很小。因此眼角的精確定位將直接影響人臉特征點(diǎn)的整體定位質(zhì)量和識(shí)別的準(zhǔn)確率。
現(xiàn)在關(guān)于眼睛定位的方法層出不窮,有區(qū)域分割法、邊緣特征分析法、灰度投影法以及模板匹配法等。區(qū)域分割法[1]對(duì)于如人眼閉合、戴眼鏡等情況易定位失敗;邊緣提取法[2]需要做大量預(yù)處理,參數(shù)過(guò)多的眼部模板不適用于個(gè)體差異太大的人臉;灰度投影法[3]速度較快,但定位精度較差,易陷入局部最小而導(dǎo)致定位失敗;模板匹配法使用方便,但計(jì)算量較大,定位準(zhǔn)確率較低。此外還有一些其它的定位算法,如Bala[4]等人提出一種基于遺傳算法和決策樹(shù)的眼睛定位方法等。
在本文的工作中,首先根據(jù)小波變換,對(duì)人臉灰度圖粗定位兩眼的位置,然后結(jié)合Susan算子方法對(duì)內(nèi)外眼角點(diǎn)進(jìn)行提取,實(shí)現(xiàn)對(duì)人眼的定位。實(shí)驗(yàn)結(jié)果證明本文的定位方法快速準(zhǔn)確穩(wěn)定。
2 眼睛的粗定位
2.1 小波高頻子圖的分析
小波變換是一種空間(時(shí)間)和頻率的局部變換。一幅圖像經(jīng)一層小波變換后分解為四個(gè)子帶圖像,各個(gè)子帶圖像從不同角度描述原圖像如圖1。由圖1可以看出,高頻子圖反映了人臉圖像中變化豐富的區(qū)域如眼睛、嘴巴、眉毛等,對(duì)應(yīng)區(qū)域的亮度比其它區(qū)域集中。因此,可以利用高頻子圖中的亮度分布判斷人臉特征點(diǎn)的大致位置。
高頻子圖中的水平子圖較為清晰地反映了人臉器官的形狀和位置,對(duì)圖1(b)進(jìn)行二值化,然后取亮度最大的幾個(gè)區(qū)域,即可得到圖2。
該圖反映了小波高頻子圖中亮度最大的一些區(qū)域。將孤立亮點(diǎn)去掉,取面積最大的幾個(gè)區(qū)域得到圖2(b)。圖2(b)顯示人臉器官中眉毛和嘴巴的區(qū)域特征比較明顯,因此可以從圖中找到兩眉區(qū)域的大致位置,然后由人臉的結(jié)構(gòu)分布,可以得到眼睛大致位置。
2.2 人臉特征點(diǎn)的選取
經(jīng)過(guò)2.1中處理的圖像,可以得到人眼的大致位置。步驟如下:取上面兩個(gè)面積最大者為眉毛區(qū)域,區(qū)域最長(zhǎng)直線的中點(diǎn)為左右眉心位置;左右下眼簾中點(diǎn)位于左右眉心的正下方,與眉毛中心的距離與兩眉心距離之比為0.3;左右眼角位于左右眼簾同左右眉心連線的中垂線上,其到連線的水平距離是兩眉心距離的0.4;
在此基礎(chǔ)上,可以劃定雙眼的眼部區(qū)域(大小為30*10的矩形)如圖3。
3 眼部區(qū)域中定位內(nèi)外眼角點(diǎn)
首先對(duì)粗定位的眼部區(qū)域采用自適應(yīng)二值化方法進(jìn)行處理,獲得眼部區(qū)域的自動(dòng)二值圖像。然后結(jié)合Susan 算
子,利用邊緣和檢測(cè)的算法[5]實(shí)現(xiàn)對(duì)眼角點(diǎn)的定位。
Susan 算子的原理為:以像素半徑為r的圓形區(qū)域?yàn)檠谀#疾靾D像中的每個(gè)點(diǎn)在該區(qū)域范圍內(nèi)的所有點(diǎn)的像素值與當(dāng)前點(diǎn)值的一致程度:
其中:r0為當(dāng)前像素點(diǎn);r為區(qū)域范圍的其它點(diǎn);I(r)為像素的灰度值;c(r,r0)是兩像素灰度值的相關(guān)性度量;t為像素間差異閾值。模板內(nèi)所有點(diǎn)與核亮度之差的和為:
SUSAN算子既可以檢測(cè)邊緣,又能用來(lái)提取角點(diǎn)。在提取局部區(qū)域的邊緣和角點(diǎn)特性方面,與Sobel、Canny等邊緣檢測(cè)算子相比有著更為優(yōu)越的性能,更適合于對(duì)眼角點(diǎn)和嘴角的定位。并且通過(guò)調(diào)整算子的參數(shù)r或t和g的大小,對(duì)不同質(zhì)量的人臉圖像都可以取得很好的效果。本文采用的是半徑r為3的圓形模板;t取20;g取27;非最大抑制采用的是一個(gè)3*3的模板。
4 實(shí)驗(yàn)結(jié)果
本文采取FERET圖像庫(kù),包含70個(gè)人每人6副圖像共420幅,均為112*92像素的灰度圖像,包括不同的人不同姿勢(shì)、表情、光照等。規(guī)定得到的特征點(diǎn)位置與手工確定的位置的橫縱坐標(biāo)之間相差不超過(guò)3個(gè)像素,就認(rèn)為位置準(zhǔn)確。對(duì)于如閉眼、瞇眼、戴眼鏡等不太容易處理的圖片,直接利用小波變換來(lái)定位人眼眼角,其它圖像用小波變換粗定位眼部區(qū)域,然后再結(jié)合Susan算子精確定位。
測(cè)試結(jié)果顯示內(nèi)外眼角點(diǎn)定位準(zhǔn)確率可達(dá)到96%以上。結(jié)果如圖4所示。通過(guò)實(shí)驗(yàn)表明,這種方法受臉部姿勢(shì)、表情、光照的干擾較小。對(duì)于不同人臉的內(nèi)外眼角點(diǎn)都可以實(shí)現(xiàn)準(zhǔn)確定位。失敗的例子主要集中在人臉有大角度旋轉(zhuǎn)和光線變化較大等情況。采用此算法檢測(cè)人眼特征點(diǎn)總體時(shí)間小于1秒,滿足實(shí)時(shí)性要求。
5 結(jié)論
本文針對(duì)人臉識(shí)別中眼部關(guān)鍵特征點(diǎn)提取,給出一種快速準(zhǔn)確地定位內(nèi)外眼角點(diǎn)的方法,有助于提高人臉識(shí)別算法的識(shí)別率。這種特征定位方法是利用小波高頻信息,不受臉部姿勢(shì)和圖像尺寸的影響,對(duì)光照也不敏感。實(shí)驗(yàn)證明該方法有很好的效果。文章提出的方法優(yōu)點(diǎn):用小波變換粗定位人眼受臉部姿勢(shì)、表情、光照的干擾較小,能快速搜索到人眼區(qū)域。而且對(duì)于一些不太容易處理的圖片,如閉眼、戴眼鏡等的定位效果也較好。可以顯著提高最后的定位準(zhǔn)確率。
參考文獻(xiàn):
[1] 山世光,高文,陳熙霖.基于紋理分布和變形模板的面部特征提取[J].軟件學(xué)報(bào),2001,12(4):570-577.
[2] 王磊,莫玉龍,戚飛虎.基于霍夫變換和眼瞼模板的眼睛特征提取[J].紅外與毫米波學(xué)報(bào),1999,18(1):53-60.
[3] 耿新,周志華,陳世福.基于混合投影函數(shù)的眼睛定位[J].軟件學(xué)報(bào),2003,14(8):1394-1400.
[4] Bala J, DeJong K, Huang J, et al. Visual routine for eye detection using hybrid genetic architectures[C]. In: Backer E, Gelsema ES, eds. Proceedings of the 13th International Conference on Pattern Recognition.Los Alamitos:IEEE CS Press, 1996:606-610.
[5] 王展,皇甫堪,萬(wàn)建偉.基于模板匹配的人臉圖像特征提取[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2000,(05):333-336.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文