陳虹旭 李曉坤 鄭永亮 邵娜 楊磊 劉磊

摘 要: 隨著信息化社會的高速發展,人們生活水平的不斷提升,與此同時人們開始越來越注重身份驗證的準確性、安全性、穩定性。人體生物特征表現出了幾大特點:唯一性、穩定性、不可復制。本文通過深度學習技術簡述、分析特性、探究支持,研究了生物特征識別中的虹膜識別方法。虹膜識別性能指標在應用中相比其他生物指標高,具有很高的研究價值。希望通過本次對虹膜識別方法的探究,促進虹膜識別在人工智能方面的新發展。
關鍵詞: 深度學習;生物特征識別;虹膜識別;人工智能
Abstract:With the rapid development of the information society people's living standard has been continuously improved. At the same time more and more attention has been paid to the accuracy security and stability of authentication. The biological characteristics of human body shows several characteristics: uniqueness stability and non-reproduction. In this paper through technical discussion characteristics analysis and support exploration of deep learning iris recognition of the biometric recognition is researched. Simulation shows that the technological index of iris recognition performance in the application is higher than other biometric identification index,which has high research value. It is expected that this research could promote the new development of iris recognition in artificial intelligence.
Key words: deep learning;biometric identification;iris recognition;artificial intelligence
引言
在科技高速發展的今天,生物特征識別已經開始進入人們的日常生活工作中。目前指紋識別、人臉識別、語音識別已廣泛用于手機等終端設備解鎖,通過深度學習手機端實現虹膜識別解鎖也將會成為潮流趨勢。虹膜識別技術屬于一種人工智能,并因其所具備的唯一性、不可復制、穩定性等特征,而使其在驗證識別身份領域得到重要應用[1],同時也深受該領域科研工作人員的青睞與高度關注。
1993年,Daugman博士提出了虹膜識別的理論框架。該框架將虹膜識別分為4個重要組成部分[2]:虹膜點位置、圖像歸一化、特征提取和匹配。Daugman[3]首先提出了模糊虹膜圖像檢測方法。該方法使用了特定的模板來對原始的虹膜圖像進行卷積。其中模板的傅里葉變換是2個sinc函數之間的差值,圖像的中頻和高頻會被提取為模糊特征。另一種經典的虹膜圖像模糊檢測方法是基于能量譜分布特征和SVM分類器的圖像模糊決策方法[4]。該方法計算了虹膜區域低頻、中頻和高頻能量的比值,根據這些比值判斷圖像的離焦和運動模糊,同時判斷是否有睫毛遮擋。此外,Kalka等人[5]研發了一種分開檢測離焦模糊和運動模糊的虹膜圖像檢測方法。Jang[6]則發現可以通過計算不同頻段小波變換系數的均值作為模糊圖像的模糊特征。Chen[7]又相繼設計分析了可以利用墨西哥草帽小波提取不同尺度的虹膜圖像小波系數來作為模糊特征。Zhou等人[8]提出利用虹膜圖像中光斑特征進行運動模糊檢測。在此基礎上,Park[9]的研究又指出可根據光斑的大小判斷虹膜圖像是否存在離焦模糊。
1 數據來源
本文所采用的數據庫為CASIA V4.0虹膜庫[10],是中國科學院自動化研究所免費公開的數據庫。CASIA V4.0已經成為國際上具有較高認知度的虹膜圖像庫,而且國際上已有超過70個國家及地區的3 000多家科研單位申請使用。
2 虹膜識別
虹膜是研究的一個重要組成部分。虹膜位于眼角膜之后和晶狀體之前,直徑約為12 mm、厚度約為0.5 mm的盤狀膜[11]。為了合理控制外界光線進入眼睛,瞳孔將隨著光線強弱調節自身大小,虹膜也會隨之發生變化。虹膜識別可以解析為模式識別和計算機視覺問題。通過收集虹膜,可以對采集到的圖像進行分析和處理,并通過結果信息識別身份。虹膜識別的研究流程可表述為:圖像采集、預處理、提取特征,并對其編碼、匹配識別,而預處理中又包含有定位及歸一化。
具體來說,虹膜圖像處理主要通過采用預定的光學及電路設計,來提取高質量的虹膜圖像。所得到的圖像包含眼瞼及睫毛等,需要對虹膜展開定位研究。此時,在定位處理中需要將虹膜區域的邊界近似為2個圓,通過定位獲得圓心位置及半徑大小。每個人的虹膜大小不同,同一個人的虹膜在外界光線刺激下也會隨著光線的不同而改變,這些彈性變化會影響到識別結果,因而還需對采集到的虹膜引入歸一化處理。通過歸一化處理可以有效地表達和描述虹膜的特征信息,對信息進行編碼處理。特征匹配識別時,則將通過比對提取信息的編碼與數據庫編碼來分析確認身份。
3 虹膜識別原理
3.1 虹膜圖
基于深度學習的虹膜識別是將圖像進行預處理,在圖像中獲得感興趣的區域,采用暗道去霧理論進行去霧增強,實現圖片灰度處理;利用EMD方法進行分塊特征提取,得到特征向量,最終獲得虹膜識別結果。運行后結果可如圖1所示。
3.2 PCHIP-LMD
PCHIP-LMD算法是對LMD與EMD算法的優缺點整合,將PCHIP運用到LMD方法中獲取局域包絡估計函數和局域均值函數。PCHIP可以保證相鄰兩點之間插值曲線和單調性,有效消除了欠包以及過包絡現象。
3.3 虹膜歸一化
每個人的虹膜大小各異,同一個人的虹膜在外界光線刺激下也會隨著光線的不同而改變。瞳孔會隨著外界光線強弱發生收縮或擴張,從而影響虹膜的大小。在進行虹膜采集時,眼睛距離采集設備的遠近,也直接影響瞳孔的大小。采集虹膜時的這一變化將會影響比對結果,不同大小的虹膜難以用作匹配識別,虹膜歸一化可以有效地糾正瞳孔縮放失真。這里,也研究給出了EMD歸一化虹膜識別系統的功能設計解析即如圖2所示。
3.3.1 彈性模型
目前得到廣泛使用的歸一化方法,就是由Daugman教授提出的橡皮圈(Rubber-sheet)模型[3] Rubber-sheet假定虹膜為彈性模型,具有彈性和各向同性。根據固定模式將虹膜轉換為固定矩形區域。
3.3.2 歸一化結果
通過彈性模型,可以將虹膜轉換為固定的矩形,歸一化后就能夠獲得不受遮擋的虹膜圖像,舍棄識別率較差的部分。而且,理論可以證明,虹膜的歸一化處理還表現出良好的尺度不變性和平移不變性。
4 深度學習
機器學習是時下具有快速發展勢頭的活躍學術領域之一。深度學習就是機器學習中一種基于任務的算法。深度學習采用分層結構來加工處理復雜的數據,而每一分層均由含有特征檢測器的單元組成,底層主要檢查簡單特征,再將特征信息傳輸給高層,從而可以檢查更為復雜的圖像特征。深度學習是通過整合多個非線性處理單元以生成輸出更加抽象和更富有價值的特征值。借助深度學習就使得無論是生物特征識別、虹膜識別,還是語音識別、聲紋識別等方面的研究都將獲得識別率的大幅提升。深度學習并非預先定制方程來獲得設計驅動,而是在運行中通過收集數據,進行自我學習、訓練來實現處理加速。
4.1 遞歸神經網絡(RNN)
遞歸神經網絡(RNN)是一種人工神經網絡,主要通過網絡的內部狀態來描述系統的非線性動態行為,具有很強的動態逼近能力。而且,還可以描述任何非線性動力系統。Hopfield網絡[12-13]是全局反饋遞歸網絡的經典成果,但只是一個單層對稱反饋神經網絡。根據網絡的輸出,可將其分為離散網絡和連續網絡兩種。其中,離散網絡往往用于優化計算,而連續網絡則用于聯想記憶。離散網絡與連續網絡都具有初始狀態收斂到穩定狀態的能力。
如各神經元在初始狀態和外部輸入作用下,發生狀態變化,神經元與神經元之間形成環路,神經元輸出到其它的輸入相連接,進而產生了特定設計輸出。這種反饋狀態將繼續在穩定的網絡狀態下激蕩反復,以達到穩定的平衡狀態。Hopfield網絡采用全連接網絡方式進行連接,網絡節點數目增多時網絡將過于復雜。在應用中若要達到簡單優化,可以采用部分反饋網絡結構,就能保留原有動態特性。
4.2 卷積神經網絡(CNN)
卷積神經網絡(CNN)是人工神經網絡的一種。這是一種帶有前向反饋的神經網絡,是深度學習常用方法之一[14]。CNN由多個可訓練層采用層層堆疊的方式聚集構成,通過在輸出層增加監督分類器來獲得分類功能。CNN在圖像分類、識別問題上獨具優勢,而在機器學習中還可以更有效地提高準確率。在處理圖像方面,CNN的網絡結構可以實現平移、縮放、傾斜等情況下高度不變的特性;在提取像素中可以給出一層到二層近原圖的像素級別提取特征;在圖像發生維度變化時,還可以基本保持圖像全局性。關于CNN的重點研究內容可闡釋分述如下。
4.2.1 卷積層
卷積層是CNN的核心設計。卷積層由若干張特征圖組成,每張特征圖都是在輸入圖像上采用固定卷積對其進行內積操作所得到,在特征圖轉發過程中,過濾器需要在輸入卷積高度與寬帶上采用卷積,在過濾器輸入和條目間計算點積,并針對過濾器生成二維激活影像。不同的卷積核可以對不同的特征進行提取,卷積操作的卷積區域就是卷積神經網絡(CNN)的局部感知域。如果網絡處于某個空間位置時會對其展開檢測,并在檢測到特定類型特征時進行學習過濾。
4.2.2 池化層
池化層主要通過降采樣方式來處理得到的圖像區域并獲得關鍵的模態特征,但還要對此特征圖進行深度的抽象與降維。前者將輸入圖像進行圖像塊均值或最大值的采集以做到進一步的結果抽象解析。而降維則是通過對采集圖像進行無重疊的降采樣來實現。對特征圖像進行平均池化類似于均值濾波器,也就是對圖像進行平滑處理,避免噪點的影響。
4.2.3 激活函數
對于卷積層的卷積以及池化層的降采樣來說,都需要對采集圖像及特征圖像進行線性處理。對于采集樣本中獲得的特征分類樣本并不都是線性可分的,還要對其引入激活函數,并追加非線性因素,這樣才可以得到適用于非線性的分類模型。
4.2.4 全連接層
在經過卷積、池化、激活函數等一系列操作后,將得到的特征表達映射到標記空間中。在采集數據中,RGB圖片是三維的,而對應的采集標簽是一維的。考慮到此后的計算梯度所需,就要將三維的RGB圖片與一維的標簽進行關聯映射處理,因此設計研發了全連接層將信息轉換保存到一維空間中。
4.2.5 改進的深度學習模型
采用一個單層的下采樣層,針對不同大小的特征映射統一對其進行下采樣歸一化處理,使其達到相同的尺寸。多尺度在傳統特征算子中發揮了重要作用,在卷積網絡中同樣可以采取類似的形式,例如卷積層就采用了3種不同的下采樣。下采樣過程是通過控制池化卷積模板來自適應生成尺寸和步長,與前卷積層設定比例輸出,以保證下采樣輸出子圖固定大小。這里將給出本次研究的設計模型如圖3所示。
5 實驗結果
5.1 實驗一
本節實驗從CASIA V4.0虹膜庫中選取150人作為訓練樣本,隨機分別抽取50人成為測試樣本。
實驗步驟:設置閾值為0.157 1,取得最高識別率。錯誤拒絕次數FR為68,錯誤接受次數FA為23,最高正確識別率CRR為99.968%。實驗運行結果如圖4所示。
5.2 實驗二
本節實驗從CASIA V4.0虹膜庫中選取150人作為訓練樣本,隨機分別抽取50人作為測試樣本。
實驗步驟可表述為:
(1)將原始采集虹膜經過歸一化處理后得到特征圖;
(2)將特征圖作為原樣本輸入卷積神經網絡;
(3)設置閾值為0.157 1。
在此基礎上,得到的識別結果可見表1。
根據以上結果分析得出:CNN算法得到的識別率超過90%,而傳統的LMD算法識別率較低。
5.3 實驗三
本節實驗從CASIA V4.0虹膜庫中選取200人作為訓練樣本,隨機分別抽取每人100組為測試樣本,其中50組作為測試集。設置實驗參數,PCHIP-LMD閾值為0.157 1,最后得到試驗結果可見表2。
根據以上結果得出:CNN算法得到的識別率超過95%,而傳統的PCHIP-LMD算法識別率為89%。
6 結束語
綜上結論可以看出,虹膜識別的結果會受到閾值的影響。閾值可通過對圖像的分解處理后來提取識別特征圖,再對特征圖進行移位匹配,最后計算匹配向量得到。當閾值過高或過低都會影響識別結果,通過實驗可知閾值為0.157 1時,識別準確率最高。經過比較不難發現,CNN方法的識別率遠高于LMD與PCHIP-LMD的識別方法。但是也需指出,由于卷積神經網絡在訓練和設置參數方面難度較高,因此還需要通過大量實驗的輔助佐證支持。本次研究表明,CNN可以在虹膜識別領域得到廣泛應用,只要再加以改進,這種算法就可以在更大程度上提升虹膜研究的識別率。
參考文獻
[1] 李歡利,郭立紅,陳濤,等. 基于PCHIP-LMD的虹膜識別方法[J]. 光學精密工程 2013 21(1):197-206.
[2] DAUGMAN J G. High confidence visual recognition of persons by a test of statistical independence[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 1993,15(11): 1148-1161.
[3] DAUGMAN J G. How iris recognition works[J]. IEEE Transactions on Circuits Systems for Video Technology 2004 14(1): 21-30.
[4] MA Li TAN Tieniu WANG Yunhong et al. Personal identification based on iris texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 2003 25(12): 1519-1533.
[5] KALKA N D,ZUO Jinyu SCHMID N A et al. Estimating and fusing quality factors for iris biometric images[J]. IEEE Transactions on Systems Man and Cybernetics Part A: Systems and Humans 2010 40(3): 509-524.
[6] JANG J PARK K R KIM J,et al. New focus assessment method for iris recognition systems[J]. Pattern Recognition Letter 2008 29(13): 1759-1767.
[7] CHEN Y DASS S C JAIN A K. Jain. Localized iris image quality using 2-D wavelets[C]//Proceedings of International Conference on Biometrics. Berlin/Heidelberg:Springer-Verlage,2006: 373-381.
[8] ZHOU Z DU Y,BELCHER C. Transforming traditional iris recognition system to work on non-ideal situation[J]. IEEE Transactions on Industrial Electronics 2009 56(8): 3203-3213.
[9] PARK K R KIM J. A real-time focusing algorithm for iris recognition camera[J]. IEEE Transactions on Systems Man and Cybernetics Part C 2005 35(3): 441-444.
[10]CASIA. Database of human iris [EB/OL]. [2009-09-21]. http://www.cbsr.ia.ac.cn/english/Iris Database.asp.
[11]倪綽. 眼的解剖組織學及其臨床應用 [M]. 上海:上海醫科大學出版社 1993.
[12]楊行峻,鄭君里. 人工神經網絡與盲信號處理[M]. 北京:清華大學出版社,2003.
[13]吳啟迪,汪鐳. 反饋式神經網絡智能控制[M]. 上海:上海科學教育出版社,2004.
[14]BOUVRIE J. Notes on convolutional neural networks[J]. Neural Networks,2006(1):38-44.