摘要:隨著計(jì)算機(jī)科學(xué)的發(fā)展和社會(huì)的進(jìn)步,人臉檢測(cè)的研究和應(yīng)用越來(lái)越得到廣泛的關(guān)注。但是設(shè)計(jì)快速有效的人臉檢測(cè)方法仍然是一個(gè)難度很大的問(wèn)題。該文基于統(tǒng)計(jì)的模式識(shí)別分析了當(dāng)前人臉檢測(cè)的主要問(wèn)題和方法,同時(shí)也給出了模式識(shí)別的概念、原理、方法。
關(guān)鍵詞:模式識(shí)別;人臉檢測(cè);統(tǒng)計(jì)模式
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)26-1783-02
Summarization For Human Face Detect Method Base On Statistical Pattern Recognition
WANG Bin-bin, LI Xiao-min
(Department of Computer, Pingdingshan Institute of Technology, Pingdingshan 467044, China)
Abstract: With the development of computer science and the society, the face detection research and application drew more and more attention . But how to design fast and efficient face detection method is still a big problem. This paper will analyze current major issues and detection method of face detection and describes some concepts, principles and methods about pattern recognition.
Key words: pattern recognition; face detection; statistical pattern
1 引言
模式識(shí)別(Pattern Recognition)是指對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過(guò)程,是信息科學(xué)和人工智能的重要組成部分。人臉檢測(cè)是模式識(shí)別的一個(gè)新近的發(fā)展方向和重要應(yīng)用,人臉檢測(cè)和識(shí)別在安全識(shí)別、身份鑒定、以及公安部門的稽查活動(dòng)中都有廣泛而重要的應(yīng)用前景。本文基于統(tǒng)計(jì)模式方法介紹人臉檢測(cè)中遇到的一系列問(wèn)題,來(lái)學(xué)習(xí)模式識(shí)別。
2 人臉識(shí)別和人臉模式特征提取
2.1 人臉識(shí)別
人臉識(shí)別問(wèn)題是指:對(duì)輸入的人臉圖像或者視頻,首先判斷其中是否存在人臉,如果存在人臉,則進(jìn)一步的給出每個(gè)人臉的位置、大小和各個(gè)主要面部器官的位置信息,并依據(jù)這些信息,進(jìn)一步提取每個(gè)人臉中所蘊(yùn)含的身份特征,并將其與已知人臉庫(kù)中的人臉進(jìn)行對(duì)比,從而識(shí)別每個(gè)人臉的身份。人臉識(shí)別的過(guò)程可以分為以下三個(gè)部分:
1)人臉檢測(cè):判斷輸入圖像中是否存在人臉,如果有,給出每個(gè)人臉的位置,大小;
2)面部特征定位:對(duì)找到的每個(gè)人臉,檢測(cè)其主要器官的位置和形狀等信息;
3)人臉比對(duì):根據(jù)面部特征定位的結(jié)果,與庫(kù)中人臉對(duì)比,判斷該人臉的身份信息。
完整的人臉識(shí)別系統(tǒng)至少包括兩個(gè)主要環(huán)節(jié)。首先在輸入圖像中找到人臉的位置,將人臉從背景中分割出來(lái);其次,將分割后的人臉圖像進(jìn)行特征提取和識(shí)別。如下圖1所示:
2.2 人臉模式特征提取
特征提取是指從濾波數(shù)據(jù)中衍生出有用的信息,從許多特征中尋找出最有效的特征,以降低后續(xù)處理過(guò)程的難度。人臉模式的特征包括膚色特征和灰度特征兩個(gè)方面。膚色特征是人臉的重要信息,不依賴于面部的細(xì)節(jié)特征,對(duì)于旋轉(zhuǎn)、表情等變化情況都能夠適用,具有相對(duì)的穩(wěn)定性并且和大多數(shù)背景物體的顏色相區(qū)別。因此膚色特征在人臉檢測(cè)中是最常用的一種特征,膚色特征主要由膚色模型與色度空間描述。
3 人臉檢測(cè)及其策略
人臉的檢測(cè)過(guò)程實(shí)際上就是對(duì)人臉模式特征的綜合判斷過(guò)程,包括膚色區(qū)域分割與人臉驗(yàn)證 。人臉是一類具有復(fù)雜細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),由于人臉的特殊性,人臉檢測(cè)面臨如下幾個(gè)關(guān)鍵難題:人臉外貌、表情、膚色的不同,造成模式的可變性;人臉可能存在眼睛、胡須等附屬物;人臉影像收到光照產(chǎn)生的陰影影響。本文主要采用基于統(tǒng)計(jì)模式識(shí)別的方法,統(tǒng)計(jì)模式識(shí)別是目前最成熟也是應(yīng)用最廣泛的方法,統(tǒng)計(jì)模式識(shí)別的基本模型如下圖2,該模型主要包括兩種操作模型:訓(xùn)練和分類。此類方法將人臉區(qū)域看作一類模式,即模板特征,使用大量的“人臉”與“非人臉”樣本訓(xùn)練、構(gòu)造分類器,通過(guò)判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▽?shí)現(xiàn)人臉的檢測(cè)。實(shí)際上,人臉檢測(cè)問(wèn)題被轉(zhuǎn)化統(tǒng)計(jì)模式識(shí)別的二分類問(wèn)題。下面從幾個(gè)方法分別介紹:
3.1 基于事例學(xué)習(xí)的方法
本文以快速串行過(guò)程一對(duì)數(shù)求得最鄰近物體,決定人臉局部特征的最直接的方法是:計(jì)算人臉各局部空間最匹配模塊的距離,求取這些距離的最小值。對(duì)一張人臉劃分n+1個(gè)區(qū)域,要計(jì)算n個(gè)距離和比較(n-1)個(gè)距離。因此,當(dāng)n較小時(shí),我們一般取n<=10,這種直接方法最好用。
3.2 基于特征空間方法
此類方法將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分“人臉”與“非人臉”兩類模式。主分量分析(PCA, Principal-Component Analysis)是一種常用的方法。它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行的正交變換(K-L 變換),K—L變換是Karhunen—Loeve變換的簡(jiǎn)稱,這是一種特殊的正交變換。對(duì)于給定的信號(hào)向量X=[x(0),x(1)……x(N—1)] T經(jīng)K—L變換后變?yōu)镹點(diǎn)向量各分量之間完全去掉了相關(guān)性,能最大限度地突出各維信息的特征,且對(duì)近似的均方誤差為最小。
4 實(shí)驗(yàn)及其結(jié)果分析
目前基于統(tǒng)計(jì)模型的方法主要針對(duì)正面端正人臉的檢測(cè)。評(píng)估不同方法的性能需要共同的測(cè)試集,目前比較公認(rèn)的測(cè)試集是Sung等的M 1T測(cè)試集和Row ley等的CMU測(cè)試集。實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)如表1所示。
從測(cè)試實(shí)驗(yàn)可以看出基于統(tǒng)計(jì)模型的方法具有很強(qiáng)的適應(yīng)能力性,不依賴于人臉的先驗(yàn)知識(shí)和參數(shù)模型,可以避免不精確或不完整的知識(shí)造成的錯(cuò)誤;采用了實(shí)例學(xué)習(xí)的方法獲取模型的參數(shù),統(tǒng)計(jì)意義上更為可靠;通過(guò)增加學(xué)習(xí)的實(shí)例可以擴(kuò)充檢測(cè)模式的范圍、提高檢測(cè)系統(tǒng)的魯棒性。
5 結(jié)束語(yǔ)
自從90年代初期統(tǒng)計(jì)模式識(shí)別經(jīng)歷了一個(gè)迅速發(fā)展的時(shí)期,這主要由于新方法得引入(包括神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)科學(xué)等)和新出現(xiàn)的應(yīng)用(包括數(shù)據(jù)挖掘、文檔分類等)。現(xiàn)在我們擁有了解決各類分類問(wèn)題的方法,在實(shí)際的分類中我們只要針對(duì)于不同問(wèn)題把各種方法結(jié)合起來(lái),取長(zhǎng)補(bǔ)短,推進(jìn)模式識(shí)別的更大發(fā)展。
參考文獻(xiàn):
[1] Moghaddam B, Pentland A. Probabilistic visual learning for object representation[M].IEEE Trans on PAMI,1997:696-710.
[2] 張春梅,田寶玉.具有獨(dú)特領(lǐng)域獨(dú)立性的通用模式識(shí)別研究[J].微電子學(xué)與計(jì)算機(jī),2006,23(8)35-37.
[3] 黃勇,宋忠虎.多類支持向量機(jī)綜述[J].計(jì)算機(jī)技術(shù)與自動(dòng)化,2005,24(4):65-67.
[4] 趙陵滋,甘云祥.統(tǒng)計(jì)模式識(shí)別算法的MATLAB語(yǔ)言實(shí)現(xiàn)[J].應(yīng)用技術(shù),2002,29(6):12-13.