摘要:近年來模式識別在刑事科學技術領域得到了廣泛的應用,綜述了模式識別的識別過程及常用識別方法,并論述了模式識別在刑事科學技術中的應用。
關鍵詞:模式識別;特征提取;分類器;刑事科學技術
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2008)34-1855-02
Theory andApplications of Pattern Recognition in Criminal Science and Technology
ZHANG Song-lin1, GAO Pei-pei2
(1.Department of Electronics of Henan Mechanical and Electrical Engineering College, Xinxiang 453003,China;2.Department of Forensic of Xinxiang Medical university, Xinxiang 453002, China)
Abstract: Pattern Recognition in recent years in criminal science and technology has been widely applied,Summary of the identification process of pattern recognition and identification method commonly used,and application of pattern recognition in criminal science and technology.
Key words: pattern recognition; feature extracting; classifier; criminal science and technology
1 引言
模式識別(Pattern Recognition)是一種從大量信息和數據出發,在已有認識和經驗的基礎上,利用計算機及數學推理的方法對信息特征自動完成識別的過程。模式識別屬計算機科學中人工智能的研究范疇[1],內容非常廣泛。20世紀70年代發達國家開始將模式識別廣泛技術應用于刑事偵察部門[2],近年來,模式識別在我國刑事技術的應用也取得長足發展,模式識別在刑事技術中的應用不僅提高了刑事科學技術水平,也極大地提高了刑事科學技術現代化的建設。
2 模式識別與模式識別系統
模式識別是對表征事物或現象的各種形式的(數值的、文字的或邏輯關系的等)特征信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程。
模式識別的研究主要集中在兩方面[3-4],一方面研究生物體(包括人)是如何感知對象的,另一方面是在給定的任務下,如何用計算機實現模式識別的理論和方法。前者屬于認知科學的范疇;后者則是通過數學家、信息學專家和計算機科學工作者研究的范圍,目前已經取得了系統的研究成果。
模式識別通常包括相互關聯的兩個階段:學習階段和實現階段,前者是對樣本進行特征選擇,尋找分類的規律構筑分類器,后者是根據分類規律對未知樣本集進行分類和識別,模式識別系統框圖如圖1所示。
■
圖1 模式識別系統框圖
1) 數據采集及預處理:
數據采集是指把被研究對象的各種信息轉換為機器可以接受的數值或符號集合。這種數值或符號所組成的空間為模式空間。為了從這些數字或符號中抽取出對識別有效的信息,必須進行預處理,包括進行二值化處理、數字濾波進行平滑去噪處理及規范化處理等。
2) 特征提取:
預處理后的信息送入特征提取模塊抽取特征用于分類器的設計。特征提取的目的是從原始信息中抽取出用于區分類型的本質特征。無論是識別過程還是訓練學習過程,都要對研究對象固有的、本質的重要特征或屬性進行量測并將結果數值化或符號化,形成特征矢量。比如,指紋識別時,提取的特征有紋理、交叉點、形狀等。特征的提取和選擇對識別過程是至關重要的,如果模式選擇得好,對不同類的模式就能表現出很大的差別,就能比較容易地設計出性能較高的分類器。因此特征的選擇會直接影響到分類器的構造和識別的效果。
雖然特征的提取和選擇在模式識別中占有如此重要的地位,但是迄今沒有特征提取和選擇的一般方法,大多數的方法都是面向問題的。有人可能認為在處理識別問題時,模式特征取得越多越好,或者說,模式向量的維數越高,對分類器的設計越是有利。經常有這樣的情況,當用一組特征做出來的分類器不能滿足要求的話,自然就會想到增加新的特征。雖然知道特征的增加同樣也會增加特征提取的困難和分類計算的復雜性,但總認為這樣可以改進分類器的性能。但是,在實際工作中,往往會發現當特征的數目達到某個限度后,不但不能改善分類器的性能,反而使它的工作惡化,產生這個問題的基本原因是用以設計分類器的樣本數目是有限的。為了使模式識別的結果滿意,在增加特征的同時,必須增加供學習的樣本數量。
3) 分類器設計及分類識別:
生成的模式特征空間,就可以進行模式識別的最后一部分:分類器設計及分類識別。該階段最后輸出的可能是對象所屬的類型,也可能是模型數據庫中與對象最相似的模式編號。分類器設計及分類識別通常是基于已經得到分類或描述的模式集合而進行的。這個模式集合稱為訓練集,由此產生的學習策略稱為監督學習。學習也可以是非監督性學習,在此意義下產生的系統不需要提供模式類的先驗知識,而是基于模式的統計規律或模式的相似性學習判斷模式的類別。分類器設計及分類識別的方法有很多,常見的模式識別方法:模板匹配、統計模式識別、句法(或結構)模式識別、模糊模式識別和神經元網絡模式識別。
3 模式識別方法
3.1 模板匹配
模板匹配是一種相對簡單的也是早期常用的模式識別方法之一。匹配是模式識別的一種分類操作,主要是判斷同一類的兩個實體特征間的相似性。模板匹配的基本思想主是利用實體的特征進行模板匹配。但是該方法計算量非常大,同時該方法的識別率嚴重依賴于已知模板,如果已知模板產生變形,會導致錯誤的識別結果。
3.2 統計模式識別
統計模式識別理論是一種相對較為完善和成熟的識別理論。統計模式識別,又稱決策理論識別,該方法基于模式的統計特征,用一個n維特征空間(特征集)來描述每個模式,然后基于概率論矩陣理論等知識,利用合適的判別函數,將這個n維特征空間劃分為m個區域,即類別。特征值分布函數可以通過指定或學習得到。統計模式識別經常用于解決分類問題?,F在研究的一個熱點-支持向量機就是基于統計學習理論基礎上的一個新的模式識別方法。
3.3 結構(句法)模式識別
結構(句法)模式識別主要是基于特征的結構相關性將復雜的模式用簡單的子模式或基元遞歸來描述,這種描述與文字中的句子通過多個單詞來描述相似。
3.4 神經網絡模式識別
神經網絡可看作是由大量交互的神經元構成的計算系統[5],神經模式識別即是利用神經元網絡中出現的神經計算模式進行。神經元網絡允許模式可以有噪聲,若訓練得當,神經元網絡會對未知模式的類別做出正確的響應。
4 模式識別在刑事科學技術中的應用
經過多年的發展,模式識別已被廣泛應用在了刑事科學技術領域[6],如痕跡檢驗、票證印章識別、相貌識別等。
4.1 痕跡鑒別
痕跡鑒別是在刑事科學技術中廣泛應用于查證、披露和確認罪犯的一種十分有效的技術手段。主要包括指紋鑒別、足跡鑒別、掌紋及皮膚紋鑒別、槍彈痕跡鑒別、兇器及作案工具鑒別和汽車輪胎等其它痕跡的鑒別。其中指紋識別[7,8]最為常用,經專家證實,每個人的手指、腳、腳趾內側表面的皮膚凸凹不平產生的紋路會形成各樣的圖案,而這些皮膚的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可將一個人同他的指紋對應起來,從而識別出對應的案犯。現代公安系統中的指紋自動識別系統即是利用計算機進行自動識別,并與人工認定相結合,效果十分顯著。這種識別技術還可以用于金融、保險、出入境安全通道、醫療卡、安全系統等重要業務的身份鑒別。
4.2 票證印章識別
票證包括護照、支票、銀行信用卡、股票、國庫券、發貨票、產權證、工作證等有價證券、證件和票據,一般票證均采取相應的高新技術防偽措施如在票證上印刷上有特殊花紋、加金屬線和熒光粉材料等。除了用一些簡易的紫外線方法檢驗外,通常可將形成防護信息轉換成代碼均勻散布在票證上[2],鑒別時只需將防護信息代碼提取出來由計算機進行自動識別,如直接通過刷卡、掃描等方式即可鑒別真偽。
4.3 生物特征識別
所謂生物特征識別是指通過計算機與生物統計學等手段利用人體所固有的生理特征或行為特征來進行個人身份鑒別[9,10]。生理特征多為先天性的;行為特征則多為后天性的。同時用于身份鑒別的生物特征應具有普遍性、唯一性和可接受性等特點。
基于生理特征的識別技術包括人臉識別、虹膜識別、視網膜識別、掌紋識別、手形識別、人耳識別、基因識別及紅外溫譜圖識別等?;谛袨樘卣鞯淖R別技術主要有步態識別、擊鍵識別和簽名識別等。
5 結束語
隨著計算機軟硬件技術的快速發展,模式識別得到了更多的關注,模式識別技術越來越完善,應用領域也越來越廣泛。模式識別技術在刑事科學技術領域中的應用,將為刑事科學技術的發展,刑事科學的現代化進程推向一個新的高度。
參考文獻:
[1] 邊肇祺,張學工.模式識別[M].2版.北京:清華大學出版社,2000.
[2] 賈鐵軍,李錦.人工智能在刑事技術中的應用[J].刑事技術,2002,(6):56-60.
[3] 嚴紅平,潘春洪.模式識別簡述[J].自動化博覽.2006(2):22-26.
[4] 熊超.模式識別理論及其應用綜述[J].中國科技信息,2006(6):171-172.
[5] 潘盛輝,韓峻峰.基于神經網絡的模式識別及其應用[J].廣西工學院學報,2000,11(4):33-36.
[6] 賈玉文,張書杰.刑事科學技術[M].2版.北京:人民衛生出版社,1999.
[7] 楊宏林,吳陳.指紋識別方法綜述[J].華東船舶工業學院學報,2003,17(3):37-42.
[8] 謝健陽,李鐵才,唐降龍,等.指紋識別系統的設計與實現[J].微計算機信息,2006,22(3):156-157.
[9] 周激流,張曄.人臉識別理論研究進展[J].計算機輔助設計與圖形學學報,1999,11(2):180-184.
[10] 夏鴻斌,須文波,劉淵.生物特征識別技術研究進展[J].計算機工程與應用,2003(20):77-80.
[11] 楊艷.生物特征識別技術概述[J].大眾科技,2006(8):31-33.