丁增喜 王旭 祁衛煒
1.證件防偽公安部重點實驗室 2.公安部第一研究所
在各種人體生物特征中,指紋識別由于其具有唯一性、穩定性、識別率高等特點,在目前使用的各種生物特征識別技術中成為最為成熟、最為廣泛的生物特征識別技術[1]。
指紋識別技術有兩種應用模式:一是1:1的認證,二是1:N的辨識。目前最多的應用場景是1:N辨識,尤其是在刑偵領域中,1:N辨識功能對于案件的偵破有著很大的幫助。對于指紋識別技術來說,無論1:1認證還是1:N辨識都是圍繞如何提高識別準確性和識別的速度來進行的,其研究內容包括指紋圖像增強、指紋特征提取、指紋特征匹配以及指紋分類等算法。而這些指紋識別算法無論是警用還是民用,都需要基于一定容量的指紋庫進行性能測試,指紋庫中數據組織的分布規則以及數據庫容量的大小都對指紋識別算法的性能產生一定的影響。此外,隨著指紋識別技術的大規模應用,國內外市場上指紋識別類產品種類越來越多,其性能指標、技術參數參差不齊,各種產品的宣傳往往偏重商業目的,這些問題為公安行業以及其他指紋識別技術應用部門在產品的選擇上造成了困難,迫切需要相關部門建立評價體系對指紋識別類產品進行客觀的性能評測,為應用部門提供科學合理的選擇依據。而指紋測試樣本庫是評測指紋識別算法性能的重要依據,只有基于大規模指紋測試樣本數據才能真實有效的完成指紋識別算法核心性能指標的評測[2]。如何合理、高效、快捷地完成指紋測試樣本的采集將是指紋測試評測首先面臨的重要問題,而完成這項工作需要解決測試庫建庫規則、采集設備接口、采集模式設計、系統架構方式等多個技術難題。
首先,需要確立測試樣本庫的建庫規則。我國幅員遼闊、人口眾多,是一個多民族聚居的地區。居民在聚居區域、民族、性別、年齡以及職業等多個方面具有一定的分布特點,這些因素對指紋的質量均具有一定程度的影響。因此在測試樣本庫建庫之前就要制定一套規則,使測試樣本庫中指紋的分布符合我國現有國情。
其次,近年來我國指紋生物特征技術發展迅速。市場上的采集設備品種繁多,接口類型千差萬別。各個廠家設備應用領域各不相同,應用方式千差萬別,采集設備的接口和采集的輸出結果也沒有得到統一。因此在采集前如果不能很好的統一接口和輸出結果,會為采集工作增添很多困難,也會為進一步影響指紋識別算法的評測工作。此外,由于采集系統需要同時掛接多款采集設備,在系統設計時還要確保多款采集設備在實時調用時互不影響。
最后,一般情況下指紋采集工作需在多個采集地點同時進行,因此在系統設計和采集方式選擇上如何讓工作人員能夠方便操作,實現快速、準確、高效地采集到符合要求的指紋樣本也是需要解決的問題。
從測試樣本庫建庫角度出發,為了建立一套客觀、科學、完整的指紋應用技術評價體系,需要針對指紋應用人群分布特點采集特定人群的指紋樣本。以居民身份證指紋測試樣本庫建庫為例,該項工作目標為選出全國范圍應用的指紋識別算法,因此測試庫設計時,參考我國第六次全國人口普查數、《2009年度人力資源和社會保障事業發展統計公報》等文獻資料,編制建庫規則(如圖1所示)。測試庫建庫規則按照性別、產業、民族以及地域/環境等五個方面進行屬性劃分,其中年齡按照小于15歲、15-59歲以及大于等于60歲三個年齡段進行劃分。在職業上按照第一產業、第二產業以及第三產業三部分進行分類,這樣就很好地涵蓋了我國當前多種職業,具有很好的代表性[3]。建庫樣本規則的確定為指紋測試樣本采集工作奠定了基礎。

針對指紋采集設備品種多、可選范圍大等情況,需參考市場占有率及設備試用情況,從各類指紋采集設備中選擇了最有代表性的產品用于樣本采集。為了統一指紋采集設備接口,便于將來系統調用,系統設計時需參考已得到廣泛應用的行業標準,例如《活體指紋圖像應用程序接口規范第1部分:采集設備》[4,5]、《指紋采集器接口規范》等,以用于指導和規范參與指紋測試樣本采集的采集設備動態庫接口,只有符合了該接口規范的采集設備才能夠接入采集系統;通過這種方式能很好地解決采集設備接口不統一的問題。
在指紋測試樣本采集系統設計時,對指紋采集器廠家提供的接口文件格式,均要求以Windows動態庫格式提供。Windows動態庫格式是微軟提出的一種標準函數調用格式,它可以將共享的程序代碼編譯成獨立模塊以供調用,庫函數的任何修改都不對應用程序產生影響。通過對動態庫的動態調用,操作人員可以決定在何時加載和釋放指紋采集設備,使各個設備之間的加載和釋放不存在任何影響。在設計開發的時候,系統列出廠家設備名稱,通過選擇某個廠家,系統自動調用該廠家對應采集動態庫,激活設備進行指紋采集。而調用該動態庫時候,會自動釋放上次調用的動態庫,使多個設備在調用過程中互不影響。對采集設備按照統一的規則進行編號和命名,如圖2所示。
為了滿足指紋測試樣本的采集數量大、次數多、速度快、隨機性高等特點,在采集系統中設計了自動采集模式。廠家要根據自動采集函數接口要求,提供設備采集動態庫。系統對質量滿足基本要求的指紋圖像自動采集入庫保存。此外,為了防止在采集過程中有些指紋圖像由于傷病、磨損、脫皮等情況而導致無法自動采集的情況下,系統又提供了人工采集模式,可以實現人工手動實時采集指紋圖像并入庫保存。系統啟動成功并選取設備之后會自動進入自動采集模式,在規定的時間內自動采集按壓的手指指紋圖像,在系統連續采集規定數量的指紋圖像后由操作人員核驗采集圖像質量然后提交保存,采集界面如圖3所示。采集后在未提交前如果發現某一幅指紋圖像質量不符合基本要求,則實時選取該幅指紋圖像進行再次采集,而不用影響其他幾幅圖像。在采集過程中如果有些手指指紋圖像質量較差,指紋采集設備無法自動成功采集,可以選擇人工采集模式進行手動采集。通過人工采集模式可以強制采集一幅指紋圖像,從而確保了采集到的指紋測試樣本的真實性。

指紋測試樣本的采集可以采取多種系統架構方式,既可以聯網集中采集,也可以脫機移動采集。聯網集中采集將采集機器集中聯網,采集數據集中統一入庫。這種方式采集效率高、速度快,采集的指紋數據記錄編號連續,便于后期處理。每次采集的指紋數據自動進入統一的數據庫,不需要后期的數據歸納整理。此外,每臺機器也可以不必掛接所有指紋采集設備,系統負荷壓力小,但是這種架構方式只適合采集地點固定、采集時間相對集中的情況。
而脫機移動采集方式卻可以在多個地點同時進行指紋測試樣本的采集。通過對采集設備的接口以及對設備采集庫提供方式進行統一,每臺采集系統均可以掛接所有指紋采集設備,并可以在采集設備間實時切換進行樣本采集。這樣每臺采集系統都可以成為一臺采集服務器,可以實現多臺采集系統在多個采集點進行集中采集,多臺采集系統之間互為冗余。這種采集方式存在的問題是要在采集前根據預先規定的采集人數需要事先為每個采集地區的分配采集編號范圍。在采集結束后需要對每臺機器中采集的數據進行整理集中。脫機移動采集方式如圖4所示。

此外,在采集質量上控制上,通過培訓講解和實際操作等方式,使操作人員快速掌握指紋測試樣本采集系統的使用,避免由于主觀因素而導致采集指紋測試樣本圖像下降的問題。圖5給出了幾種不合格指紋圖像的情況,如采集指紋圖像面積過小、圖像太暗或太淺、手指按壓方向錯誤以及采集部位錯誤等。這樣盡可能確保指紋測試樣本的質量,減少不必要干擾因素對測試樣本庫圖像質量的影響。

指紋測試樣本的采集是一項復雜工作,本文從指紋測試樣本采集的背景和目的出發,對指紋測試樣本采集所面臨的問題以及需要解決的幾項關鍵技術進行詳細介紹。通過筆者及同事多年多地的采集實踐證明,按本文設計的指紋測試樣本采集系統在應用上是成功高效的,無論是刑偵用大面積滾動指紋測試樣本采集,還是證件用平面指紋測試樣本的采集,都可以順利完成。這不僅為指紋識別算法的測試工作提供強有力的支持,同時也為相關類似項目的設計和開發提供了有益的參考。
[1] 田捷,楊鑫, 等.生物特征識別理論與應用[M].北京:清華大學出版社,2009.
[2] GA/T 894.6-2010, 安防指紋識別應用系統 第6部分:指紋識別算法評測方法.
[3] GA 1012-2012, 居民身份證指紋采集和比對技術規范.
[4] GA/T 893-2010, 安防生物特征識別應用術語.
[5] GA/T 626.1-2010, 活體指紋圖像應用程序接口規范 第1部分:采集設備.