劉 琦
(河南警察學院,河南 鄭州 450000)
隨著技術發展,主動配合的圖像采集及識別技術非常成熟,靜態人臉圖像識別準確率更是達到99.999 9%,無限接近于100%。但是動態人像布控中一個極為關鍵的問題是非主動配合人臉圖像采集的質量問題。路人庫中充斥著大量低質量人臉圖片,因無法達到人臉檢測最低標準而無法充分利用。搭建低質量人臉圖像數據庫,并與相對應高質量人臉圖像進行比對,為下一步處理低質量人臉圖像奠定基礎。
人臉識別技術發展迅速[1-3],通用的圖像質量評估流程如圖1所示。不難發現,當圖像的質量被評估為不合格后,就會被丟棄或僅僅報警處理。但是,往往路人庫中存在著豐富的低質量圖像,無法達到檢測標準。對低質量圖像進行研究,融合其他技術甚至是傳統技術,較好地解決這一問題至關重要,具有非常重要的研究意義和實用價值。

圖1 人臉識別系統中質量評估框圖
如果低質量圖像的問題得以解決,會為人們生活各個方面帶來更好的安全保障。例如在公安機關涉及的相關案件處理流程中,可以簡化更多偵破流程,提高辦案效率。在案件偵查階段,公安機關會從監控視頻資料中截取所需嫌疑人的人臉圖像,但大多數情況圖像的質量極低,通過算法處理之后可以提高圖像的識別概率,從而極大地縮小目標范圍,提高調查取證效率。在訴訟階段,可以更好地提高公訴質量,在電視報道中可以經??匆姡瑱z察機關在批捕或起訴各類犯罪案件時,常因為視頻錄像或嫌疑人圖像的模糊無法有力地證實犯罪,極大地影響了公訴的進程。在證據出示階段,往往由于現場勘驗的空間狹小、光線不足等條件影響圖像質量,從而因證據不足審判無法繼續。
綜上,低質量圖像問題的解決無論是對于公安系統案件偵破效率的提高,還是對于居民人生安全的保障來看,都起著至關重要的作用。
對于低質量圖像,在識別時往往會出現模糊、有遮擋、亮度不夠等側重于主觀方面的詞匯[4-5],本文在界定低質量圖像時則采用人臉圖像質量評估算法來界定,當該評估結果為“低質量圖像”時,則為本文所討論的對象。
本論文的研究對象為低質量圖像,為更好地研究相關算法以及進行數據庫的搭建與測試,從某地市公安局得到了涉及低質量圖像識別的案件信息及嫌疑人圖像,以下對所收集圖像的具體情況進行闡述。
根據某地市公安局提供信息,共得到相關案件30 起,案件信息如圖2所示,案件性質類型涉及持刀搶劫、入室盜 竊、飛車搶奪、無名女尸身份確認等;案件信息包括案件詳情描述、監控視頻、人臉截圖、系統對比圖像等;共計得到人臉低質量圖像273 張,根據圖像審核標準選出質量較好的圖像47 張,供后文數據測試使用。
案件情況與篩選出的低質量圖像匯總如圖3所示,其中的命名方式為:首位數字為涉及案件的數字代碼、次位數字為該圖片在該案件中出現的順序。

圖2 案件信息

圖3 低質量人臉圖像匯總
圖像的分類使得多個圖像根據自身特征信息劃分到不同類別,有助于圖像的檢索、收集、存儲與使用。相比人眼視覺效果的區分效果,科學的分類規則更能體現圖像的各自特征信息。
本小節針對以上所篩選出的47 張圖像,進行不同方式的分類,為數據庫圖像信息的錄入打下基礎。
3.1.1 基于圖像格式的分類
圖像的格式即計算機用于存儲圖片的格式,格式不同,也就決定著圖像有著不同的優缺點,如JPG 格式圖片之所以能被廣泛地應用,因為它下載速度快、文件的尺寸小,各種類型的瀏覽器均支持該圖像格式;但同時它也存在著會被壓縮耗損而降低數據質量的缺點。
常見的圖像類型有:JPG、PNG、TIFF、SWF、BMP、PCX、TGA、WEBP、AI、EXIF、CDR、PCD、WMF、FPX、EPS、DXF、PSD、RAW、EPS、PSD、UFO 和SVG 等,本文所討論對象中有45 張JPG 格式圖像、2 張PNG 格式圖像。
3.1.2 基于圖像大小的分類
作為圖像屬性的大小與數據庫的搭建工作有著密不可分的關系,圖像大小決定了用于存儲該圖像文件所需要磁盤存儲空間的大小,它的度量單位是字節,計算公式為:

文件的大小與該圖像的像素數目有著直接的關系。將圖像按照大于1 G、小于1 G 大于100 k、小于100 k 分為三個等級,統計三個等級數量分別為4 張、20 張、23 張。
3.1.3 基于圖像分辨率的分類
分辨率是生活中常常提到用來描述圖像清晰程度的專業名詞,專業來講,它是表達圖像內所含數據量多少的一個參數。包含數據越多,文件的長度越長,那么就能夠展現出該圖像更多的細節;然而當數據非常少時,圖像就會隨之變得粗糙,這樣的狀況在將圖像尺寸放大時表現更為明顯。本文所討論的就是后者這類分辨率的低質量圖像。根據數據的大小將所得圖像進行了分類,分為高、中、低三個等級,分別有23 張、14 張、10 張。
上述三種方式都能實現對圖像的分類,本論文的研究重點為圖像的質量問題,所以本設計數據庫搭建工作采用基于分辨率的分類方式進行分類。
根據需求搭建預處理模板數據表、深度學習功能模塊數據表和人臉識別模塊數據表,如圖4、圖5、圖6所示。

圖4 預處理模塊數據表

圖5 深度學習功能數據表

圖6 人臉識別數據表
3.2.1 預處理模塊數據表
所得到的低質量圖像的原始照片多在某些因素上被影響,其中有無法恢復的部分,比如大小、分辨率等,但部分因素造成的影響可以在預處理的流程中被處理,比如飽和度、亮度、色調等,該數據表則對圖像的具體信息進行統計與存儲[6-8]。
3.2.2 深度學習功能數據表
該數據庫是為后續小組另一位成員算法的實現而搭建,該算法的核心思想為通過基于深度學習的訓練來提升低質量圖像與高質量圖像的識別概率,即需要一個數據表來存儲兩者圖像的標識,便于數據庫的調取。
3.2.3 人臉識別數據表
提升低質量圖像的根本目的即為獲取圖像中人員信息,便于公安機關展開對嫌疑人的抓捕工作或案件審判中的舉證工作,需創建人臉識別結果信息存儲的數據表,信息內容包含人員的姓名、性別、民族、戶籍等相關信息。
在數據中添加數據表后,開始對數據庫的運行做測試,部分代碼如下:


運行結果如圖7所示,該數據庫能夠調取數據表里圖像的信息并進行成功比對,得出兩者的相似度。由此測試搭建的數據庫可以滿足需求。

圖7 運行結果
本文對低質量數據庫采集后如何分類,建立預處理表、功能表及識別數據表,代碼實現結果的測試等問題進行了研究與技術實現。本文的工作對于進一步處理低質量圖像起到較好的支撐作用。