摘 要:人臉識別技術具有采集隱蔽性強、不需要人配合、成本較低等優勢,近幾年來在身份識別方面扮演著非常重要的作用,并在我國公安、銀行、交通等方面應用越來越廣泛。本文結合實際,對常用的幾種人臉識別方法進行了探討,以供參考。
關鍵詞:人臉識別;人臉特征;身份識別
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1674-7712 (2013) 14-0000-01
人臉識別技術是運用計算機提取人臉的特征并且依照此些特征給予身份驗證的一種技術。此項技術具有采集隱蔽性強、不需要人配合、成本較低等優點,通過這項技術可以較好地對進行身份識別。國內外許多學者對此項技術的研究頗感興趣。比如,國外CMU、MIT、UCLA等高校學者均對人臉識別進行了大量的研究。國內科達士(中國)公司、上海銀晨智能識別科技有限公司等單位專家學者也對人臉識別技術在罪犯緝拿、邊境口岸出入控制進行了大量研究??v觀這些研究,筆者發現常用的人臉識別方法具有如下幾種。
一、基于幾何特征的人臉識別方法
基于幾何特征的人臉識別技術是應用最早的人臉識別方法。該方法是通過提取人臉的幾何特征,包括人臉部件歸一化的點間距離、比率以及人臉的一些特征點,如眼角、嘴角、鼻尖等部位所構成的二維拓撲結構進行識別的方法。這方面的識別工作,早由Poggio和Brunelli使用積分投影法,提取出35維人臉特征矢量用于模式分類。結合積分投影和灰度差累加值投影提出了一種精確定位五官的方法,并對人臉器官的七個特征點構造了十個特征向量,根據模式相似性的最近距離分類器進行分類。
基于幾何特征的識別方法具有不少優點,例如思維方式比較直觀,很容易明白其中的原理,每幅圖形所需要的存儲量不大,對光照變化不敏感等等。但這種方法也有不少的缺點,首先是提取特征時,由于人臉不可能一直處于可以方便提取狀態,當有干擾時不容易提取到特征。另外,這種方法的魯棒性也不好,特別是人臉具有表情變化多端的特點。最后,這種方法只考慮到五官的幾何基本特征,沒有考慮到一些細節,信息量包含太少,所以識別能力較低。
二、基于模板匹配的人臉識別方法
這是經典的人臉模式識別方法,這種方法把人臉的整體看成一個模板,也可以用一組獨立的小模板表示人臉特征,利用計算模板和圖像灰度的自相關性來實現識別功能。Roverand Brunelli等人使用了眼睛、鼻子、嘴、眉毛以下部分這幾個模板來比較各個模板的性能,結果發現眼睛模板是最優的,其次是鼻子模板,再次是嘴模板,最后是整個人臉。他們通過比較還得出了模板匹配要優于基于幾何特征的識別方法這一結論。王靜等[1]提出了一種基于圖像梯度和模板匹配相結合的眼睛定位方法,利用投影函數確定眼睛區域的上下邊界,然后對于眼睛睜開較大的圖像根據眼球的梯度方向信息定位眼睛中心,對于眼睛睜開較小或完全閉合的情況利用梯度眼睛模板進行二次匹配,該算法定位準確率高,不受眼睛狀態的影響,并且對頭部姿態變化和焦距變化等具有一定的魯棒性。謝毓湘等提出了一種基于膚色與模板匹配的人臉識別算法,首先利用膚色在HSI空間的聚類特征對膚色加以判別,繼而提取出人臉候選區域,最后通過模板匹配過程對候選區域加以識別。
三、基于統計特征的人臉識別方法
特征臉識別方法是將人臉圖像信息的數據進行降維處理,然后再進行模式分類,在將圖像排成一維向量時去掉了很多空間相關性信息。特征臉識別方法的基本思想是在低維空間中做人臉投影分類識別,低維空間由高維的圖像空間經過離散K-L變換后得到的正交基生成。
特征臉識別主要有兩種:(1)基于KL變換的特征識別方法;(2)是奇異值分解(SVD)方法。KL變換曾經因為在人臉識別中取得過比較好的效果而一度在上世紀90年代初引起了大量的研究,它的識別率視乎人臉圖像質量的好壞而定。KL變換雖然從能量壓縮角度看是最優的,但是它的理論卻存在著缺陷。KL變換的生成矩陣是訓練樣本的散步矩陣,這導致它的最大特征向量是訓練樣本的分布,因此它本質上是一種圖像的統計,只能通過圖像之間的差異去識別人臉,而非從人臉的本質去識別人臉。因此,它無法判斷出圖像的差異來源,對于一些光照等的干擾條件沒有很好的抗干擾能力,一旦人臉圖像的干擾因素增加,它的識別率會大幅度降低,因此它不是一種理想的識別方法。
羅仁澤等[2]研究光照變化條件下的人臉識別問題,基于最近提出的二階特征臉方法和(2D)2PCA方法,提出了二階(2D)2PCA方法,將(2D)2PCA技術分別應用到原始圖像矩陣集和剩余圖像矩陣集,實驗表明在光照變化條件下,二階(2D)2PCA方法是一種有效的人臉識別方法。
特征臉法是基于代數特征的人臉識別方法,它將圖像看作具有一定分布模態的隨機變量。人臉的五官比例總是大體不變,因此通過主成分分析法可以得到人臉圖像分布的主分量方向,利用改主分量表示人臉的特征,無需再考慮人臉的幾何拓撲關系和局部特征等較為復雜的條件。特征臉識別方法需要做大量的預處理以減少干擾,而如何減少表情差異則是特征臉識別能否提高識別效率的關鍵因素。
四、基于神經網絡的人臉識別方法
基于神經網絡的人臉識別方法:神經網絡很早就在人臉識別的應用中被采用。早期用于人臉識別的神經網絡主要是自聯想映射神經網絡,這種方法可以還原出人臉圖像,即使當輸入的人臉圖像受噪聲干擾,自聯想神經網絡也能通過計算恢復出原來完整的人臉圖像。
Cottrell等使用BP神經網絡進行人臉識別,尤其在部分受損、光照有所變化的圖像識別能力較好。Valentin等用自相關神經網絡對人臉的部分主元進行樣本訓練,用多層感知器進行分類,也取得了不錯的效果。許學斌等[3]針對小波變換在人臉識別中存在識別正確率較低的問題,提出了一種基于二代曲波變換的人臉識別方法,首先將所有樣本圖像和測試圖像通過基于\"打包\"的快速離散曲波變換進行分解,獲得不同尺度、不同角度的曲波變換系數,再利用曲波變換分解系數中包含了人臉重要特征信息的低頻系數,作為特征參數送入反向傳播(BP)神經網絡中進行學習訓練,最后將訓練好的BP神經網絡用于人臉識別,ORL人臉庫的圖像識別實驗表明識別正確率達到95%。
參考文獻:
[1]王靜,譚同德.基于梯度和模板二次匹配的人眼定位[J].計算機技術與發展,2007(10).
[2]羅仁澤,冉瑞生.基于二階(2D)2PCA的人臉識別[J].計算機應用與軟件,2009,26(11).
[3]許學斌.張德運,張新曼.采用二代曲波變換和反向傳播神經網絡的人臉識別方法[J].西安交通大學學報,2008,42(10).