張 擎, 劉淑美
(山東大學 藝術學院, 山東 濟南 250100)
實驗室資源安全管理關系到實驗教學和科學研究能否順利進行,國家財產能否免受損失,實驗室使用人員的人身安全能否得到保障,對高校、研究機構乃至整個社會的安全和穩定都至關重要[1]。目前,實驗室開放力度加大,實驗室資源已成為教學、實踐、科研的重要軟、硬件依托,資源競爭激烈。同時,實驗室資源也呈現多樣性,包含種類繁多的化學藥品、易燃易爆物品和劇毒物品,有的實驗要在高溫度、高壓力或者超低溫、真空、強磁、微波、輻射、高電壓和高轉速等特殊環境下或條件下進行,有的實驗會排放有毒物質[2-3]。此外,大量貴重儀器設備和重要技術資料存放在實驗室,實驗資源存在被誤操作、毀壞和惡意篡改的風險。加之實驗室資源的使用頻繁、使用人員流動性大,實驗室資源的安全管理工作面臨前所未有的挑戰。
在實驗資源的安全管理中,防止非法獲取資源是保障實驗室資源安全使用的關鍵,而合法身份認證是核心技術。生物特征識別技術作為一種身份認證技術,在各安全領域發揮著越來越重要的作用。不同于傳統的密碼和IC卡等認證和識別手段,生物特征識別是利用一種或多種人類的生理特征(如指紋、人臉、虹膜、靜脈等)或行為特征(如步態、簽名等)進行身份識別的技術[4]。其中,利用兩種或兩種以上生理或者行為特征進行身份識別,被稱為多生物特征識別。生物特征識別技術具有不會忘記、不會丟失、安全性高等諸多優勢,得到了國內外學術界和企業界的高度關注。
深入分析實驗資源管理工作的特殊性,從而有針對性地挖掘利用生物特征識別技術的獨特優勢,提高實驗資源使用和管理的安全性,是一個值得探索的問題。
實驗室資源安全管理對身份認證系統有以下幾點要求:
隨著實驗教學重要性的不斷凸顯,實驗室開放力度的不斷加大,實驗資源使用的安全性需求也在不斷提升。加之許多實驗資源具有一定危險性或涉及重要技術或資料,非法使用和誤操作造成的后果極為嚴重。因此,身份認證技術具有高準確度是實驗資源安全管理的首要要求。
目前依托實驗室開展的教學、實踐、科研等活動較為頻繁,實驗室利用率較高,為確保安全使用,身份認證工作需頻繁進行,系統響應的實時性是必要條件。例如對于一門有幾十名學生參與的實驗課程,每次上課前需要對所有學生進行身份認證。這就要求每次身份認證過程的響應時間要控制在能夠接受的范圍內。
身份認證工作頻繁進行,從而要求系統有良好的用戶體驗,也就是系統具有較高的使用方便性。如果需要頻繁的用戶交互,且用戶交互過程繁瑣,例如要求用戶一次認證過程中幾次擺出固定姿勢,則認為是不可接受的。較低的用戶體驗會對實驗資源的使用帶來麻煩,甚至造成實驗資源不可用。
目前生物特征識別技術一般均可以達到實時響應的要求,因此在系統框架設計上,不再將實時性作為主要的考慮因素。單一生物特征識別技術,如指紋識別、人臉識別等,雖在使用方便性上具有優勢,但目前在技術上,其可用性和安全性具有一定限制[5]。由于多種生物特征之間存在較好的獨立性和互補性,結合多種生物特征的多生物特征識別系統具有更高的識別準確性和可靠性,更加能夠符合具有高安全要求的實驗室資源管理工作。然而,目前所提出的多生物特征識別系統在使用方便性和識別性能方面還具有缺陷。本文提出一種結合并行融合的序列化融合框架,同時提高系統的用戶體驗和識別性能,使其更加符合實驗室資源安全管理的需求。
在多生物特征識別系統的研究中,目前主流的融合方法是并行融合,即同時采集和使用多種生物特征實現識別[4-5]。并行融合系統的用戶交互負擔重,使用體驗較差。另一種融合方法是序列化融合,用戶逐個使用生物特征進行識別,如首先使用的生物特征可以準確識別用戶,則不再需要后續特征的參與[6-9]。這種方式在使用方便性上逼近于單一生物特征識別,卻能提供更高的安全性,因此更符合實驗室資源安全管理的需求。
目前,針對序列化多生物特征識別的研究較少。2007年,G.L. Marcialis等人研究了結合指紋識別和人臉識別的序列化融合方法,并結合識別性能和識別響應時間等指標研究了兩個特征的使用順序問題[6],此后,該工作被擴展到兩個以上生物特征的情況[7]。另外,AmitKale等人研究了步態和人臉識別的序列化融合[8]。以上研究主要以識別精度、識別效率等指標為依據,研究對生物特征的使用順序的設置。最新研究指出,不同生物特征的使用方便程度不同,如步態識別中用戶走過一段通道即可被識別,而人臉識別中,用戶需要停下來提取人臉圖像,使用方便性更低。指紋識別則需要接觸式的樣本采集,方便性最差[9]。文獻[9]認為,應將生物特征按照使用方便性從大到小的順序進行排序,盡量避免使用方便性差的特征。
文獻[9]提出的序列化多生物特征識別框架充分考慮了系統的用戶體驗,能夠充分滿足實驗室安全管理的需求。然而該框架中,信息利用并不充分,識別準確度和使用方便性均有待提高。在序列化融合中,如果首先使用的特征無法成功識別用戶,則在使用后續特征時已經獲取了至少兩種生物特征的樣本,可以在不增加額外用戶交互負擔的前提下并行融合已采集的多種生物特征進行識別。結合使用多種生物特征,增強了系統后續步驟中的識別成功率和可靠性。本質上,這是一種結合并行和序列化融合的混合型融合方式。此系統框架中特征的使用方便性和識別準確率之間仍存在矛盾[9],因此,本文利用半監督學習技術[10]同時提升系統識別準確性和使用方便性。
本文以結合指紋、人臉、步態三種生物特征的多模態生物特征識別系統為例進行研究。依據第2節中分析,此三種生物特征的使用方便性從高到低的順序應為步態、人臉、指紋。因此,依據本文所提系統框架,系統應如圖1中所示進行部署:

圖1 系統部署示意圖
圖2展示了在本文所提框架下,系統的運行過程。其中,A表示將標記后的步態樣本存入模板庫;B 表示將標記后的步態、人臉樣本存入模板庫;C表示將標記后的步態、人臉和指紋樣本存入模板庫;D代表再訓練過程;S1、S2、S3分別為各分類器的識別閾值;Smax1、Smax2、Smax3分別為輸入樣本與模板樣本匹配的最高得分。對于系統的運行過程,可以分為識別過程和再訓練過程兩部分進行介紹。

圖2 結合并行融合的序列化多生物特征識別系統框架
、
注冊階段,采集合法用戶的步態、人臉和指紋樣本,組成模板庫。識別階段,系統的識別過程如下:
步驟1:用戶首先進入步態通道,采集步態序列,進行步態識別。若識別成功,則系統提供所申請服務,將新采集樣本進行標記并存入模板庫中。由于將誤識的樣本用于擴展模板庫會造成模板庫摻雜進錯誤模板,因此各分類器閾值設置為在模板庫上的零誤識閾值。若識別失敗,則進行步驟2。
步驟2:采集人臉樣本,與人臉的模板樣本進行匹配,結合步驟1中步態的匹配得分,使用并行融合方式得到最終匹配得分,進行識別。若識別成功,則將新采集到的步態和人臉樣本置為標記樣本存到模板庫,系統提供所申請服務。若不能成功識別,則進行步驟3。
步驟3:采集指紋,與指紋的模板樣本進行匹配,結合步驟1和步驟2中步態和人臉的匹配得分,使用并行融合方式得到最終匹配得分,進行識別。若識別成功,則將新采集到的步態、人臉和指紋樣本置為標記樣本保存到模板庫,系統提供所申請服務。若仍不能成功識別,則系統最終拒識,向用戶提出認證失敗。
在步驟2和步驟3中的并行融合采用得分級線性相加的融合方法。假設sm是第m,m∈{1,2,3}個模態中某待識別樣本與模板的匹配得分,采用公式(1)將sm歸一化:
μm)/δm
(1)
其中,μm和δm分為m模態上所有匹配得分的均值和標準差。將匹配得分歸一化后,用線性相加的方法得到最終匹配得分fs:

(2)
公式(2)中,wi∈[0,1],i∈{1,2,3}為權重,且∑wi=1,i∈{1,2,3}。利用模板庫上樣本的交叉驗證方法對各特征的識別準確率進行估計,根據各特征的識別準確率設定權重。
注冊階段,注冊標記樣本需要較高的用戶交互,因此,一般只采集少量標記樣本。而隨著系統的使用,可以獲取大量未標記樣本。基于此,在系統運行過程中,利用半監督學習方法擴充模板庫,重新訓練各特征分類器,從而提升各階段分類器的識別準確率。
具體的再訓練過程包括:
(1) 步態識別利用更新模板重新計算特征空間,提取步態特征。
(2) 人臉識別利用更新模板更新特征空間,重新提取人臉特征。
(3) 指紋識別中重新選擇匹配模板。
(4) 為各分類器重新計算識別控制閾值。
實驗主要包括兩方面內容:
(1) 驗證系統在使用方便性方面,也就是用戶體驗方面的優勢。根據第3節中的分析,需要驗證本文所提框架與文獻[9]提出的系統框架相比在滿足用戶通過較少分類器而得到成功識別方面是否有所提高。實驗中將本文提出的框架簡稱結合并行融合的框架,將文獻[9]所提框架簡稱結合單生物特征的框架。
(2) 驗證系統在識別準確度方面的優勢。首先,驗證隨系統的使用,系統中弱分類器的識別準確性是否有所提升;再次,將本文所提出的框架與單一生物特征識別系統,以及結合單生物特征的框架進行比較,驗證本框架在識別準確率上是否具有優勢。實驗中,為跟蹤系統的性能變化,模擬歷經一個月(30天)的時間,25個用戶每人每天利用系統進行一次識別的情況。
在本文所提框架下,理論上步態、人臉和指紋識別可采用現有任意算法。實驗中,步態識別采用基于外層輪廓的識別方法[11],人臉識別采用基于稀疏相似度序列的方法[12],指紋識別采用基于細節點的方法[13]。
為滿足實驗需求,采集包括步態、人臉和指紋三種生物特征的同源多生物特征數據庫。采集25個用戶的步態、人臉和指紋數據。其中,每個用戶采集80個步態序列、60張人臉圖像及400幅指紋圖像。人臉圖像分為正面、左側面和右側面三個角度,每個角度各采集圖像20幅。采集右手五個手指的指紋,每個手指采集80幅圖像。圖3中顯示了本實驗所采用的指紋、人臉及步態樣本的樣例。

圖3 實驗用指紋、人臉及步態樣本的樣例
實驗中將數據庫分為兩個部分:(1)初始模板庫,針對每個模態,為每個用戶隨機抽取3個樣本作為初始模板;(2)測試數據,針對每個模態,為每個用戶隨機抽取30個樣本,模擬對系統的30次使用,獲取系統狀態和識別準確性。
圖4中給出了經過30次系統使用,所有用戶通過驗證所使用的生物特征個數之和。這一指標可以體現用戶使用系統時的交互負擔,從而直觀地反映系統使用方便性方面的性能。通過圖4可以看出,本文所提框架中,用戶可以使用更少的生物特征得到成功識別,該框架較結合單生物特征的框架在使用方便性上具有優勢。系統使用方便性的提高是通過在序列化融合的基礎上利用并行融合提高各階段分類器的識別性能實現的。

圖4 所有用戶通過驗證使用生物特征的個數之和
圖5中比較了兩種框架下,步態識別中成功識別的用戶數量。可以看出,兩種框架下步態識別的性能逐步提高,且在前5輪性能提高較為明顯。兩種框架下,步態識別的性能差別不大。這是因為不論在哪一步得到成功識別,最終所有用戶基本都通過了系統驗證,因此,兩種框架中步態的模板庫更新基本一致。
圖6顯示兩個框架中在第2步成功識別的用戶占所有需要進行第2步識別的用戶的比例。由于需要進行第2步識別的用戶數量難以確定,因此,這里用成功識別用戶比例比較第2步識別的準確性。可以看出,在第2步識別中,分類器性能也有逐步提升的趨勢,且本文所提框架較結合單生物特征的框架提升速度更快。總體來說,結合人臉與步態的并行識別算法識別性能優于單一人臉識別。這驗證了本文框架在識別準確性和適應性上均優于對比框架。

圖5 步態識別中成功識別的用戶數量

圖6 第2步中成功識別的用戶比例
圖7顯示兩個框架中在第3步成功識別的用戶占所有需要進行第3步識別的用戶的比例。可以看出,第3步中的分類器性能較高。步態、人臉與指紋的融合算法的識別正確率是100%,而單一指紋識別出現了錯誤。再一次證明本文所提框架識別準確率優于結合單生物特征的框架。

圖7 第3步中成功識別的用戶比例
圖8給出各系統識別準確率,包括單一步態識別、人臉識別和指紋識別系統、結合單生物特征的框架以及本文所提框架的識別準確率。識別準確率通過利用各系統對25個用戶的30個樣本進行識別獲得。可以看出,如第3節中的分析,單一生物特征識別的準確率均低于多生物特征識別,且步態識別準確率最低,人臉識別其次,指紋識別準確率最高。本文所提框架在識別準確率上高于單一生物識別系統以及結合單生物特征的框架。

圖8 各系統的識別準確率
本文分析實驗室資源安全管理的特殊要求,在此基礎上,提出結合并行融合和序列化融合的多生物特征識別框架這一新的安全認證策略。該框架在不增加用戶交互的前提下,將系統中所獲取的信息更加充分、合理地利用,進一步提高用戶體驗和系統的識別準確性。實驗驗證了該框架在用戶體驗及安全性上皆具有優勢,更加符合實驗室資源安全管理需求。