孫 玥,楊國為,2
1(青島大學 電子信息學院,山東 青島 266071)
2(南京審計大學 信息工程學院,南京 210000)
E-mail:yue_er94@163.com
在通過生物特征對人臉認證識別時,往往需要引入合適拒識機制[1-3],以便分類器工作時,要么拒識,要么分類絕對正確.也即要求:1)拒識率(在公共測試樣本庫中,拒識的樣本個數與測試樣本庫的總樣本個數之比)很小;2)正確識別率(在去掉拒識的樣本之后的測試樣本庫中,正確分類樣本個數與總樣本數的比例)逼近100%.若拒識率較大,則分類器的實用范圍和場合受到限制.若正確識別率不能逼近100%,則不能直接用該識別器去認證一些特別重要場合.顯然拒識率小與正確識別率高是矛盾事件,解決該矛盾十分困難.
要做到拒識率小、正確識別率高實際上就是要設計識別器,使該識別器確定的同w類樣本的特征區域(把區域內的任一點視為w類樣本點,而把區域之外點視為別的類點或拒識點)幾乎包含了w類所有樣本點形成的實際特征區域(幾乎不損失自己領域),同時幾乎不侵占別的已知類的特征區域和未知可能類的特征區域.
系列有代表性超球支持向量機(超球SVM)分類算法思想[4-7]是將所有特征向量映射到一個很高維的空間里,在這個空間里建立一個滿足某種約束的半徑最小超球面,超球面包裹幾乎所有同類樣本點.該超球面或同心超球面對應的原始空間曲面就是分類決策面.但是超球SVM分類決策面包裹區域侵占了未知類別的特征區域,即分類決策面沒有緊密包裹同類樣本實際特征區域.在以上超球SVM分類器中也存在問題:
1)沒有引入合適拒識機制:因為不方便確定恰當的拒識區域,或者勉強確定了拒識區域,但并不一定帶來正確識別率提高;
2)分類決策面包裹區域侵占未知類的特征區域,有把未知類錯判為某已知類的風險,分類器正確識別率不能逼近100%.
本文針對支持向量數據描述(Support Vector Data Description,SVDD)設計中存在的難題,提出了一種具有合適拒識機制的高正確識別率分類器設計算法—基于同類特征點集的同類特征區域緊密包裹曲面的求解算法(Closely Enveloped Surface-Support Vector Data Description,CES-SVDD),設置了所有緊密包裹面之外的公共區域為分類器的拒識區域,從而得到一種具有合適拒識機制的高正確識別率分類器設計算法.
如圖1所示,二維平面內中,有兩個區域,一個形如香蕉的區域,另一個區域是香蕉以外的小部分區域.對兩區域做采樣,香蕉區域采樣點用*號表示,采樣50個,其他區域內采樣點用+表示,采樣10個,分布在香蕉周圍.在SVDD模型中,訓練*號點集超球面,映射到原始空間得到一個如圖類似圓.很明顯類似圓包裹不緊密,之間有較大空隙,分類決策曲面包裹的區域侵占了未知類特征區域.

圖1 分類決策結構圖




圖2 坐標示意圖





CES-SVDD算法由“同類特征集合的緊密包裹集構造算法”、“基于同類特征點集和包裹點集的同類特征區域緊密包裹曲面的求解算法”、“多類分類器的合適拒識區域設置算法”組成.


第二步由每一個Xj=(xj1,…,xji,…,xjN),1≤j≤M派生出2N個點(xj1,…,xji±ε,…,xjN),1≤i≤N.

由前面定理1可知,I(C)中點的個數不少于C的邊界點個數.

圖3 緊密包裹曲面示意圖

為了方便設C中有m1個點,I(C)中有m2=n-m1個點,c是高維空間的球心.我們建立以下優化模型,通過求解優化解來構造同類特征區域緊密包裹曲面.
(1)
s.t.‖φ(Xi)-c‖2≤r2-ξi, 1≤i≤m1‖φ(Xi)-c‖2-r2-ρ2+ξj),m1≤j≤n,0≤ξk,1≤k≤n

(2)
Lagrange函數的極值點應滿足:
(3)
(4)
(5)
(6)
(7)
因此:
(8)
這樣得對偶問題模型:
(9)
用K(Xi,Xj)替代φ(Xi)·φ(Xj),由可核函數性質知:
(10)
對偶問題是一個二次優化問題,可用二次優化問題求解方法求解[11,12].本文用經典的序貫最小優化(sequential minimal optimization,簡稱SMO)算法來求解.
在求解以上問題之后,為求出r、ρ2和r2+ρ2,考慮兩集合:
(11)
(12)
令n1=|S1|,n2=|S2|,由KKT條件[13]知:
(13)
其中:
P1=∑xi∈S1‖φ(Xi)-c‖2
(14)
P2=∑xj∈S2‖φ(Xi)-c‖2
(15)
(16)
分類決策函數為:
f(x)=sgn(r2-‖φ(X)-c‖2)
(17)
分類決策曲面為:
r2-‖φ(X)-c‖2
(18)
該曲面(曲面上點求解可用數值計算方法求近似解)緊密包裹同類特征區域.特征區域邊界到分類決策邊界的坐標方向距離(投影長度)小于ε.
當人臉識別應用于人身份認證識別、銀行儲蓄認證識別、門禁系統認證識別等高正確識別率的任務時,對于無法確定的情況的出現,我們必須要設置一定的拒識機制,從而有效遏制不良情況的出現.

(19)
和分類決策緊密包裹曲面:
jr2-‖φ(X)-jc‖2
(20)


實驗數據使用ORL人臉數據庫和擴展Yale B人臉數據庫,樣例如圖4和圖5所示.ORL面部庫存由40個人在一定的光線,表情(微笑,眨眼,閉眼等)和配件(眼鏡)組成,每個都有10個圖像.其中前五張為訓練集,后五張為測試集.擴展Yale B包含16128張照片,包括38人在9個姿勢和64個照明條件下拍攝的圖像.本實驗選用到的數據為30人的每人50張圖像,其中前30張為訓練集,后20張為測試集,未被選用到的是光照太弱的模糊不清的圖像,即用到的圖像總數為1500張,數據庫中的圖像數據都是手動對齊、裁剪的,然后重新調整到168×192大小的圖像.

圖4 ORL數據庫樣例
預處理所獲取的面部圖像是面部識別中的重要步驟.其目的是減小外界環境對要識別的目標圖像的干擾,并且使圖像達到標準化[14,15].通過預處理,可以最大限度的把干擾減到最小,并對人臉識別性能的穩定性起到一定作用.
由于主成分分析(PCA)是基于圖像灰度統計的算法,因此需要對面部圖像進行適當的預處理.首先,需要將彩色圖像轉換為灰度圖像,然后通過直方圖均衡化方法對直方圖圖像進行歸一化,有效地消除了噪聲對人臉圖像灰度分布的影響.預處理原始圖像可以有效地解決基于統計提取特征的外部干擾引起的圖像差異(如照明,照片角度等與臉部圖像本身(每個臉部的大小不同)之間的差異.
特征提取是將對分類模式識別最有效的特征提取出來,通過這一過程可以壓縮模式的維數,使之便于處理,減少損失.
特征提取后的特征空間是為了分類使用的,對于相同的物體在不同的分類規則下,提取的特征必須滿足某些標準下的最小分類誤差.在特診提取的同時刪除貢獻微弱的特征,已達到減少分類錯誤額目的.

圖5 Yale B數據庫樣例
特征面部方法使用主成分分析(PCA),也稱為KL變換,并且通常用于面部圖像的表示和識別[16].主成分分析最早用于統計學,用來找出某一集合的主要成分.對于L×L維的面部圖像,可以認為它屬于圖像空間,并且該圖像空間可以被定義為所有尺寸L×L的一組像素矩陣.并且圖像空間中的基矢量的數量是L×L,并且L×L個基矢量被任意加權和組合.您可以在圖像空間中獲取任何圖像.假設像素的灰度級為8,則圖像空間中共有256 L× L個圖像,這其中人臉空間只占很小的一部分,因此,使用圖像空間的基矢量來表示面部空間顯然會帶來冗余,以減少冗余,最合適的方法是用人臉空間本身的基向量來表示人臉.在面部空間進行KL變換以進行訓練,以獲得面部空間本身的基礎矢量.它被稱為特征向量,也稱為特征面,所有特征面的集合稱為特征面空間.使用這些特征向量來表示面部空間大大減少了冗余.

圖6 部分特征臉
對于ORL人臉庫來說,對所截取的人臉圖像通過預處理后,PCA降維至20維,低維空間的圖像是40*5*20的矩陣,每條線代表一個主要組件面,每個面都有20維特征.對于擴展Yale B數據庫來說,對人臉圖像通過預處理后,PCA降維至20維,低維空間的圖像是30*30*20的矩陣,部分特征臉如圖6所示.
剩余的尺寸減小的面可以由特征面線性地表示.在選擇要識別的面以降低維數然后將由這些基底(特征面)形成的矩陣相乘之后,可以獲得這些面在低維度上的線性表示.這些表示就是識別的依據.
將CES-SVDD算法用于人臉識別工作,并與最初的SVDD作對比,以此驗證算法的有效性.對于ORL數據庫使用前5張作為訓練集,共有200張圖片.使用矩陣表示200個映射,形成200*10304矩陣.后5張圖用來當測試集,共有200張圖.對于擴展Yale B數據庫來說,使用前30張作為訓練集,共有900張圖片.使用矩陣表示900個映射,形成900*32256矩陣.后20張圖用來當測試集,共有600張圖.
對兩個測試數據處理后,分別用SVDD和CES-SVDD進行分類識別,兩種方法各進行5次實驗后,結果如表1和表2所示,為了更加直觀的觀察實驗結果,將5次實驗結果生成折線圖,如圖7和圖8所示.其中,拒識率指在公共測試樣本庫中,拒識的樣本個數與測試樣本庫的總樣本個數之比;識別率指在去掉拒識的樣本之后的測試樣本庫中,正確分類樣本個數與總樣本數的比例.
表1 ORL實驗結果
Table 1 ORL experimental result

實驗編號SVDD識別率%CES-SVDDCES-SVDD拒識率%識別率%1952.5100295.51.599.5391.52100492397.55980.599
表2 Yale B實驗結果
Table 2 Yale B experimental result

實驗編號SVDD識別率%CES-SVDDCES-SVDD拒識率%識別率% 190.2 3.399.8296.64.6100392.34.198.3491.22.399.1593.13.699.7

圖7 ORL實驗結果

圖8 Yale B實驗結果
由表1、表2可以看出,對于兩個數據庫來說,只要拒識率合適,識別準確率都可以逼近100%,并且很明顯CES-SVDD的效果比沒有加緊密包裹集的SVDD的正確率高.
對于高識別率的識別器可以去認證一些特別重要場合.比如公司考勤系統,需要確保公司人員的高準確率;銀行取款機,在面臨大額交易下往往需要確保取款人員是否是本人,本文提出的識別方法在去除拒識圖片后識別率通常都會達到100%,可以用于這類高要求的識別場合.效果如圖9所示.

圖9 識別效果
論文討論了通過生物特征對人臉認證識別的高正確識別率分類器設計要求,指出了現有一些超球SVM分類器存在沒有合適拒識機制和正確識別率不能逼近100%等問題.舉除了超球SVM分類決策面不緊密包裹同類特征的實例.證明了同類特征集合的緊密包裹集的存在定理.提出了基于同類特征集合和緊密包裹集的同類特征區域緊密包裹面的求解算法.以ORL人臉庫和Yale B做對比實驗,實驗表明本文提出的分類器設計算法是一種有效的高正確識別率分類器設計方法.今后的方向主要是對于維度比較大模糊圖像的處理研究,爭取在降低拒識率的基礎上,提高識別的準確率.