陳虹旭, 孫怡然, 李曉坤, 劉清源, 徐 龍, 董濰赫
(1 黑龍江恒訊科技有限公司 國家博士后科研工作站, 哈爾濱150090;2 黑龍江大學, 哈爾濱150090)
近年來,智慧電網的信息安全問題較多,隱患很大,常規的用戶名,密碼等身份驗證方式已經不能滿足智慧電網的信息安全需求。 而掌紋識別具有信息豐富,易于收集,成本更低,精確度更高的優點,在智慧電網的信息安全和個人認證領域發揮著重要作用。 傳統的掌紋識別方法可歸納為基于結構的方法[1],基于紋理的方法,基于子空間的方法和統計方法。 這些方法可以取得很好的效果[2]。
特征提取在掌紋識別中占有非常重要的地位。本文重點介紹利用卷積神經網絡(CNN)提取掌紋圖像的局部特征。 CNN 有許多模型,如AlexNet,ResNet 和VGG-F,它們在圖像分類,圖像識別和圖像檢索等領域取得了一定成果[3-5]。 由大量圖像集訓練的CNN 網絡具有良好的推廣性,使得從CNN卷積層提取的特征具有更好的性能[6]。 通過將圖像輸入CNN 卷積層[7],可以有效地提取圖像的特征,與傳統的提取方法相比,省去了許多步驟,重要的是來自卷積層的特征可以被提取為與圖像對應的許多局部特征,增強了圖像的局部特征的表示[8]。
CNN 通常由一系列堆疊階段組成,每個階段可以進一步分解為多個堆疊層,包括濾波器層(卷積層),非線性激活函數,空間池化層,也可是規范化層[9]。 卷積層可通過減少數量參數的方式簡化全連接層的步驟。 在一個全連接層中,它的神經元與其前一層完全相連。 第一個簡化步驟是為了加強空間局部性,即加強神經元與神經元局部區域相連的上一層,這一層也被稱為本地連接圖層。 下一步是分享所有空間位置的權重,獲得卷積層。 經典的非線性激活函數包括雙曲正切函數tanh(x) 等[10]。Relu 具 有 非 飽 和 特 性[11],經 校 正 的 線 性 單 元(Relu)f(x)=max(0,x) 的 網絡比未校正的速度快幾倍,Relu 不是最優選擇,但出于效率考慮,它是有利的。 空間池只保留一種活動,就相當于向下取樣[12]。 對于特征映射的每個局部區域,保留的值可以是該區域內的最大或平均活動。 實證結果表明:在大多數情況下,最大池化是更好的。 在上述設置下,卷積階段的活動H1可以簡明地表述為

其中?表示卷積操作,Hl-1是上一層的輸入,H0是原始輸入數據,Wl包含許多過濾器,bl包含一些共享的偏差來跨越不同的空間位置。 因此,對于Hl中的每個特征映射,在Wl中存在一系列濾波器,bl中的一個條目(偏置)。 Relu 也集成在等式(1)中,以及空間最大池。 考慮到Relu 在[0,+∞)中,只要有一些例子產生積極活動,就可以安全地將數據輸入到網絡中。 有專家提出局部響應歸一化可以幫助泛化。 實現了一種橫向抑制的形式,引入競爭機制,在特征映射上進行大型活動。表示第i個內核計算(x,y) 位置的Relu 非線性單元的輸出,響應歸一化的輸出值可以計算為

其中,常量n,α,β和k都是超參數,它們的值都由驗證集決定,求和部分公式中的n表示同一個位置下與該位置相鄰的內核映射的數量,而N表示這一層所有的內核數(即通道數)。 若一個網絡被初始化,它的特征映射將按一定的順序排列,這種響應歸一化實現了一種模仿真實神經元的橫向抑制,從而在使用不同內核計算的神經元輸出之間產生較大的競爭,在某些層應用Relu后再使用這種歸一化方法。
通常,對于特定的任務,給定的數據由于嚴重的過度擬合而無法訓練出一個好的模型。 可以應用數據增強技術。
CNN 通常是由上述層組成的,但是網絡體系結構會根據特定的任務和目的而有所不同。
1.卷積過程[13]:使用可訓練的濾波器fx,對輸入圖像進行反卷積(第一階段為輸入圖像,第二階段為特征圖的卷積),再加上偏置,最后得到卷積層Cx。
2.二次抽樣過程: 將每個鄰域的四個像素相加得到一個新的像素,用標量Wx +1對該像素進行加權,然后增加偏壓bx +1, 最后通過激活函數sigmoid得到一個減少75%的特征圖[14]。 卷積和二次抽樣過程如圖1 所示。

圖1 卷積和二次抽樣過程Fig. 1 The process of convolution and sub-sampling
3.f6是全連接層,它與C5層完全連接,并計算輸入和權重向量之間的點積,再加上一個偏差,將其傳遞給sigmoid函數來生成一個狀態單位,輸出層由歐氏徑向基函數單元組成。
AlexNet 由5 個卷積層和3 個全連接層組成[15],每個卷積層將一組輸入特征映射與一組權重過濾器進行卷積,得到一組輸出特征映射[16]。 全連接層中每個輸出都是所有輸入的函數。
Caffe 是一個基于表達、速度和模塊化的深度學習框架。 采用了Caffe 深度學習框架,它為提取掌紋提供了準確的特征[17-18]。

圖2 掌紋特征提取的AlexNet 體系結構Fig. 2 The AlexNet architecture for palmprint feature extraction
系統掌紋識別匹配流程圖見圖3。

圖3 系統掌紋識別匹配流程圖Fig. 3 System palmprint recognition matching flow chart
使 用 Hausdorff 距 離 進 行 掌 紋 匹 配[19]。Hausdorff 距離是圖像邊緣點與最近模板邊緣點之間的最大距離。 從集合A 到集合B 的hausdorff 距離是一個極大值函數定義:

其中,a 和b 分別是集合A 和B 的點,d(a,b)是這些點之間的任意度量,H(A,B) 一個極大值函數。 為了簡單起見,取d(a,b) 作為a 和b 之間的歐幾里德距離[20]。
需要注意的是,Hausdorff 距離是有向的(也可以說是不對稱的),意味著大多數情況下h(A,B)不等于h(B,A)。 Hausdorff 距離的一般定義:

公式(4)定義了A 和B 之間的Hausdorff 距離,公式(3)適用于A 到B 的Hausdorff 距離(也稱為定向Hausdorff 距離)。 距離h(A,B) 和h(B,A) 有時被稱為A 到B 的正向和反向的Hausdorff 距離。
掌紋定位是在掌紋圖像中通過輸入一個矩形或繪制一個矩形來確定掌紋位置的過程。 基于CNN的方法在對象定位中有良好的表現,提出了一種基于AlexNet 體系結構的掌紋定位CNN 架構。 在該架構中, 使用四個參數(bx,by),bw和bh來指定ROI(掌紋感興趣區域)的中心點,寬度和高度。
基于在現有的數據庫中沒有足夠的可用數據,采用了學習的概念。 前七層的網絡權重使用Alexnet 模型進行預訓練,調整與邊界框相關的參數(bx,by,bw,bh)。 這些參數應用于掌紋圖像,提取掌紋ROI。
考慮ω 的學習參數和b'x(ω),b'y(ω),b'w(ω),b'h(ω) 作為網絡輸出值,定義C(ω),成本函數公式(5):

一旦進行了特征提取操作,就會根據余弦相似度和歐氏距離測度對提取的特征進行NCC(歸一化互相關匹配法)分類。

在這里它代表了范數[21]。 在這之后,得到三個匹配分數(用于曲率圖像的兩個分數和用于2M 圖像的一個分數),該分數可以被融合以用于最終決策。 許多史考爾E 級融合技術可用于求和分數、積分數、最小分數、最大值、加權和分數和加權積分數。本文使用加權和(WSum) 分數規則。 它的定義是:

式(8)中wi為di的權值, n 是特征的總數,式(9)中等錯誤率(EER) 來調整閾值,使得誤拒絕率(FRR)等于誤接受率(FAR),此時的FAR 與FRR 的值稱為等錯誤率。 一般來說,紋理是掌紋的主要特征。 ROI 提取后容易受到噪聲的影響, 直接影響特征提取和匹配。 因此,采用改進的模糊增強算法來增強掌紋圖像。 相較于傳統模糊增強算法的閥值對于不同圖像的取值難以判斷是否科學,常導致傳統的模糊增強算法有時效果不佳,改進的模糊增強算法首先對隸屬函數進行了一定的改造,有利于實現高灰度區域的像素增強和低灰度區域的像素衰減,也防止出現圖像過度增強。 該算法采用連續分段函數作為隸屬函數和模糊增強算子,而新的隸屬函數表示為

為了保證隸屬函數的連續性,式(11),式(12)分別為s1,s2,XT是利用最大類間方差法求得的類間分割點,可以使圖像分成低灰度和高灰度區域兩部分。
掌紋識別的流程見圖4。

圖4 掌紋識別的流程Fig. 4 Palmprint recognition process
PolyU 掌紋數據庫包含386 個不同手掌的7752個灰度圖像,每個手掌大約10 個樣本分別在第一和第二個會話中被捕獲。 每個圖像的感興趣區域(ROI) 大小為128 × 128,以V1 和V2 作為提取ROI的參考點,V1 為食指和中指之間的縫隙點,V2 為無名指和小指之間的縫隙點。 圖5 顯示了PolyU 掌紋數據庫中的樣本ROI 圖像。
使用AlexNet 進行特征提取,這是CNN 的經典模型,步驟如下:
(1)配置環境,指定模型參數,并使用AlexNet處理輸入圖像。

圖5 掌紋ROI 樣本圖像Fig. 5 Palmprint ROI sample image
(2)將3 個公共數據庫中的歸一化ROI 圖像(256×256)作為圖像放入圖像中,利用Caffe 進行特征提取。AlexNet 中fc7 層的輸出結果作為圖像深度特征[22]。
(3)在驗證實驗中, 驗證不同方法性能的標準是等錯誤率(EER) 值。 利用錯誤拒絕率(FRR) 和錯誤接受率(FAR)的值來計算等錯誤率(EER),利用Hausdorff 距離來匹配特征向量。 為了驗證所提出的方法,首先以原始ROI 圖像和增強圖像作為測試圖像,利用空間域技術進行CNN 特征提取[23],如動態閾值處理,邊界提取和頻域圖像處理技術(如FFT 和能量壓縮),使ROI 提取更加準確[24],如圖6所示,本方法的創新點為對各種特殊情況也有良好的適應性,具有很高的定位精度和魯棒性。

圖6 提取掌紋區域ROIFig. 6 Extract palm area ROI
4.3.1 精度
輸出結果和實際結果是以交叉熵和隨機梯度下降(SGD)作為優化器[25-27]。 進行了兩個不同類型的實驗。 實驗環境1 見表1。

表1 實驗環境Tab. 1 Lab environment
實驗1:CNN 算法測試的圖像大小為64×64 像素到32×32 像素[27]。 精度的結果如圖7 所示,精度無明顯差異,在64×64 像素的圖像大小上顯示出最佳的準確性,訓練數據精確度為99.7%,測試數據精確度為99.5%。 產生的影響是計算時間的不同。 大尺寸圖像所需的計算時間比小尺寸圖像的計算時間要長,如圖8 所示。

圖7 不同圖像大小下的精度結果Fig. 7 Loss result with different image size

圖8 不同圖像大小下的損失值結果Fig. 8 Accuracy result with different image size
實驗2:對SGD 優化器使用的學習率[28]進行實驗,學習率分為3 類:大尺寸0.1,中等大小0.01,小尺寸為0.001,以獲得基本結果。 從關于學習率的實驗獲得的結果如圖9 所示。 學習率的實驗表明,學習率的選擇決定學習結果的準確性。 在尺寸為0.1的高學習率實驗中,獲得了較低的精度占25.5%。學習正確率最高的為0.01,準確率為96.3%。 因此,確定學習率,不應該太大或太小,否則會得到不理想的結果,如圖10 所示。
4.3.2 接受者操作特性
將典型的特征提取方法與基于卷積神經網絡掌紋特征提取方法進行對比,即LBP,DCT 和CNN 對所提框架的性能進行評價[29]。 將所提出的方法與類型進行比較,并應用Hausdorff 距離進行匹配,結果如表2 所列,與傳統的識別方法(如PCA、LBP)相比,基于卷積神經網絡的掌紋識別率更高。

圖9 不同學習速率大小下的精度結果Fig. 9 Accuracy result with different image size

圖10 不同學習速率下的損失結果Fig. 10 Loss result with different image size

表2 原始EER 與加強后EER 對比Tab. 2 Comparison between original EER and enhanced EER
如今,全國范圍內正在開發的智慧電網旨在將現代IT 網絡引入工業控制系統,以便更有效地發電、輸電和配電。 然而這些網絡有其獨特的弱點,也面臨著各種各樣的威脅,相互連接無疑會增加復雜性,引入新的漏洞,合并后的網絡對黑客的吸引力也會更大。智慧電網項目成功與否,很大程度上取決于它抵御遠程網絡攻擊的能力,用于訪問智能電網的用戶身份驗證是抵御此類攻擊的第一道也是最強大的防線。
將掌紋識別應用于用戶認證的隱私增強方法,運用卷積神經網絡和深度學習的方法進行掌紋識別技術的研究,并將其運用到智慧電網的身份驗證系統中,不再采用用戶名以及密碼形式,而采用掌紋識別和用戶名密碼雙認證登錄智慧電網系統,解決了智慧電網信息系統的眾多安全隱患。 基于卷積神經網絡的掌紋識別也將會運用到GGD 高壓開關柜的開關閘,只允許工作人員進行相關操作,也可在分布式電源和分布式儲能系統接并網技術、配電用電自動一體化等日常生活和專業技術領域中應用[30]。還可以結合掌紋識別和用戶口令來控制智慧電網移動作業系統APN 網關和安全接入平臺之間的數據鏈路通斷,極大的防止非工作人員對其進行操作,提升智慧電網移動作業系統的信息安全防護等級,使國家電網更加的安全化、智能化。
為了使國家電網能始終處于全球前列,信息化技術是不可缺少的,現代的基于密碼的認證機制已經被證明是不夠的,生物認證技術將顯著提高智慧電網的安全性,本文使用CNN 的Alexnet 模型進行掌紋的匹配,Hausdorff 距離對特征進行匹配,提高了識別率,在精確度上有一定提升,同時也考慮了不同學習速率的精確結果及損失結果,該模型的優越性表明深度學習的特征更具有鑒別性。