耿艷萍
(山西大學工程學院,山西 太原 030013)
人臉識別是基于人的臉部特征,對輸入的人臉圖像或者視頻流進行一種判斷,首先判斷其是否存在人臉,如果存在,則進一步的給出每個臉的位置、大小等信息,并依據這些信息來提取每個人臉中所蘊含的身份特征,將其與已知的人臉進行對比,從而識別每個人臉的身份。廣義的人臉識別實際包括構建人臉識別系統的一系列相關技術,包括人臉圖像采集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術。
當前很多國家展開了有關人臉識別的研究,主要有美國等歐洲國家以及日本,著名的研究機構有美國MIT的Media lab,AI lab,CMU的 Human-Computer Interface Institute,Microsoft Research,英國的Department of Engineering in University of Cambridge等。
國內關于人臉自動識別的研究始于20世紀80年代,主要的研究單位有清華大學、哈爾濱工業大學、中科院計算所、中科院自動化所、復旦大學、北京科技大學等,并都取得了一定的成果。國內的研究工作主要是集中在三大類方法的研究:基于幾何特征的人臉正面自動識別方法、基于代數特征的人臉正面自動識別方法和基于連接機制的人臉正面自動識別方法。周激流實現了具有反饋機制的人臉正面識別系統。彭輝、張長水等對“特征臉”的方法做了進一步的發展,提出采用類間散布矩陣作為產生矩陣,而降低了產生矩陣的維數。程永清、莊永明等對同類圖像的平均灰度圖進行SVD分解得到特征臉空間,每一幅圖像在特征臉空間上的投影作為其代數特征,然后利用層次判別進行分類,張輝、周洪祥、何振亞采用對稱主元分析神經網絡,用去冗余和權值正交相結合的方法對人臉進行特征提取和識別;北京科技大學的王志良教授主要研究人工心理,建立了以數學公式為基礎的心理學模型。

圖1 人臉結構相似性
綜合國內外研究現狀及有關文獻,目前人臉識別的方法主要集中在以下幾個方面:
1.1.1 模板匹配
主要有兩種方法,固定模板和變形模板。固定模板的方法是首先設計一個或幾個參考模板,然后計算測試樣本與參考模板之間的某種度量,以是否大于閾值來判斷測試樣本是否為人臉。變形模板在原理上與固定模板相同,但其中包含一些非固定的元素:①手工構造參數化的曲線和曲面以表征人臉中的某些非固定特征;②系統自動生成自適應的曲線或曲面,以構成變形人臉模板。檢測方法是:將模板與測試圖像進行彈性匹配,并加入懲罰機制,利用某種能量函數表示匹配程度。
1.1.2 示例學習
示例學習的基本思想是從某一概念的已給正例和反例的集合中歸納產生出接受所有正例同時排斥所有反例的該概念的一般規則。將人臉樣本和非人臉樣本送入學習機中,產生出判別規則,從而用于判斷輸入的測試圖像是否屬于人臉的主要判別依據。為了獲得較高的精度,學習過程需要大量的樣本,另外樣本數據本身是高維矢量,因此,研究通用而有效的學習算法的關鍵是精確的區分性和數據維數的降低。將多個表示人臉模式的線性空間進行組合,是示例學習的另一條途徑。
1.1.3 神經網絡
從本質上講,神經網絡也是一種基于樣本的學習方法。將神經網絡用于人臉檢測取得了很大的進展。MIT的學者首先對人臉樣本集和非人臉樣本集聚類,以測試樣本與人臉樣本集和非人臉樣本集的子類之間的距離作為分類的度量,利用多層感知器(MLP)網絡作為分類器。CMU的研究人員直接以圖像作為神經網絡的輸入,設計了一個具有獨特結構的適用于人臉特征的神經網絡分類器,并通過前饋神經網絡對檢測結果優化。
1.1.4 基于隱馬爾可夫模型的方法
馬爾可夫模型是一個離散時序有限狀態自動機,隱馬爾可夫模型(HMM)是指這一馬爾可夫模型的內部狀態在外界不可見,外界只能看到各個時刻的輸出值。對于人臉模式來說,我們可以把它分成前額、眼睛、鼻子、嘴巴和下巴這樣一個序列。人臉模式就可以通過對這些區域的有序的識別來檢測,這正好是隱馬爾可夫模型容易做到的。除此以外,基于AdaBoost的人臉識別算法,基于彩色信息的方法,基于形狀分析的方法,以及多模態信息融合的方法在國外都進行了大量的研究與實驗。
總結上面人臉識別的研究現狀及主要方法不難看出,人臉識別的困難主要是人臉作為生物特征的特點所帶來的。
1.2.1 相似性
不同個體之間的區別不大,所有的人臉的結構都相似,甚至人臉器官的結構外形都很相似。這樣的特點對于利用人臉進行定位是有利的,但是對于利用人臉區分人類個體是不利的。
1.2.2 易變性
人臉的外形很不穩定。人臉具有相當復雜的細節變化,可以通過臉部的變化產生很多表情,如眼、嘴的開與閉等,不同的人有不同的外貌如臉形、膚色等,在不同觀察角度,人臉的視覺圖像也相差很大。另外,人臉識別還受光照條件(例如白天和夜晚,室內和室外等)、人臉的很多遮蓋物(例如口罩、墨鏡、頭發、胡須等)、年齡等多方面因素的影響,見圖2、圖3。

圖2 人臉識別受光照影響

圖3 人臉識別受表情姿態影響
在人臉識別中,第一類的變化是應該放大而作為區分個體的標準的,而第二類的變化應該消除,因為它們可以代表同一個個體。通常稱第一類變化為類間變化(inter-class difference),而稱第二類變化為類內變化(intra-class difference)。對于人臉,類內變化往往大于類間變化,從而使在受類內變化干擾的情況下利用類間變化區分個體變得異常困難。
每個人都有一張臉,而且臉也是一個人最重要的外貌特征。目前最熱門的應用領域有3個方面:
(1)身份認證與安全防護。在這個世界上,只要有門的地方幾乎都帶有一把鎖。當然,在許多安全級別要求較高的區域,例如金融機構、機關辦公大樓、運動場館、甚至重要設施的工地,都需要對大量的人員進行基于身份認證的門禁管理。手機、筆記本電腦等個人電子用品,在開機和使用中經常要用到身份驗證功能。
(2)媒體與娛樂。人們的許多娛樂活動都是跟臉部有關的。最著名的娛樂節目之一就是川劇的變臉;在網絡虛擬世界里,通過人臉的變化,可以產生大量的娛樂節目和效果;手機、數碼相機等消費電子產品中,基于人臉的娛樂項目越來越豐富;QQ、MSN等即時通信工具以及虛擬化身網絡游戲也是人臉合成技術的廣闊市場。
(3)圖像搜索。目前Google的圖像搜索其實還是文字搜索。基于人臉圖像識別技術的搜索引擎將會具有廣泛的應用前景。
從20世紀90年代中期開始,人臉識別技術得到廣泛應用,陸續出現了一些人臉識別商業系統,例如智能門衛、智能視頻監控、公安布控、出入境管理、司機駕照驗證等都是典型的應用。
一般來說,人臉識別系統輸入的是一張或者一系列含有未確定身份的人臉圖像,以及人臉數據庫中的若干已知身份的人臉圖象或者相應的編碼,而其輸出的則是一系列相似度得分,表明待識別的人臉的身份。一個完整的人臉識別系統的主要的功能模塊有:
(1)人臉捕獲:人臉圖像數據源包括圖像序列(視頻流)和靜止圖像。主要可以通過掃描儀,數碼相機,攝像頭等數字輸入設備獲取。
(2)人臉檢測定位:該模塊用來分析輸入的圖像,判斷其是否存在人臉,如果存在,則進一步給出每個臉的位置,并把人臉從背景圖像中分離出來。
(3)圖像預處理:盡可能使人臉圖像處于同一尺度和標準,為后續處理提供高質量的輸入圖像,需要完成對圖像的尺度歸一化,灰度歸一化,降噪,去光照等功能。
(4)特征提取和選擇:對處理后的人臉圖像按照某種策略提取出用于識別的特征,將原始的臉空間映射到新的特征空間。
(5)訓練:此過程主要生成可用于識別的參數。通常,在已有的訓練樣本集基礎上設定某個判別規則,按此規則對識別對象進行分類所造成的錯誤識別率最小。
(6)識別。通過比對獲得未知人臉參數和訓練所得的人臉參數完成人臉的分類和判別,并給出識別結果。
2.2.1 硬件結構
系統采用客戶端、服務器結構,具有建庫(注冊)和識別功能,支持多種輸入設備。識別系統可以建在市級,一個識別系統可以有多個前端(客戶機),前端可以建在分局乃至建在派出所。識別系統可以使用一個服務器,也可使用多個服務器,一般來講,基于數據庫的識別系統,單服務器保持在50萬人以下的數據容量,多服務器按50萬人/臺的規模來設置。見圖4。

圖4 人臉識別系統結構
2.2.2 軟件支持
2.2.2.1 規范化的人臉數據采集
(1)照片的形成。基本上應按照身份證照片的要求,大頭照,最好要露出眉毛。
(2)掃描儀分辨率的設置。用掃描儀形成數字圖像時,可以采用600 dpi分辨率掃描1寸的照片,形成BMP圖像。保持較高分辨率的原始圖像是很重要的,同時,應保證數字圖像中包括頭頂到下巴的完整人頭像。為了降低存儲空間,常采用圖像壓縮技術對人臉圖像進行壓縮。
2.2.2.2 系統支持軟件
(1)人臉圖像尺寸歸一化軟件。人臉圖像應只包括頭頂到下巴的完整人頭像,在一個數據庫中,應有一個準確的尺寸。
(2)人臉圖像設備屬性歸一化軟件。一般由于照片的數量較多,所以就以照片為標準進行歸一化的工作。
(3)人員信息庫的數據導出軟件。在各單位已有人員庫,其中有照片和文檔資料。如果有導出軟件,就可以大大減少重復性的工作。
(4)批量入庫軟件。人臉識別通常在大庫上運行(10萬以上),單張照片入庫太慢,因此需要批量入庫。批量入庫包括兩方面:文檔直接倒入照片特征提取入庫和圖像壓縮入庫。
在上述軟件的支持下,根據已有經驗,在一個月內建立百萬級的人臉識別數據庫是可能的。
(1)誤識率(False Accept Rate)。這是將其他人誤作指定人員的概率。
(2)拒識率(False Reject Rate)。這是將指定人員誤作其他人員的概率。
計算機在判別時采用的閾值不同這兩個指標也不同。一般情況下,誤識率FAR隨閾值的增大(放寬條件)而增大,拒識率FRR隨閾值的增大而減小。因此,可以采用錯誤率(Equal Error Rate;ERR)作為性能指標,這是調節閾值,使這FAR和FRR兩個指標相等時的FAR或FRR。
隨著人臉識別技術的發展與人臉識別市場應用日漸廣泛,針對人臉識別的難題和困境,一些創見性的解決問題方案也相繼提出。人臉識別技術已經成功應用到金融、軍工等多個領域,行業發展優勢明顯。基于現階段的技術與市場現狀,人臉識別的發展前景十分樂觀,伴隨技術的不斷創新,人臉識別應用領域會更加廣闊,民用市場就是其中之一。目前,已有多家國內知名防盜門廠商與人臉識別技術提供商取得聯系,就人臉識別技術嵌入式家用防盜門展開合作。也許在不久的將來,人們將與鑰匙徹底告別,而迎來人臉開門的新時代。另外,大型的考生驗證系統也是人臉識別將來有望大展拳腳的領域,一旦打開這個“缺口”,不僅能夠直接刺激人臉識別市場的發展,對于人臉在其他領域的應用也將帶來更好的前景。
[1]孫濤,谷士文,費耀平,等.基于PCA算法的人臉識別方法研究比較[J].自動化技術,2005,10(3):112~114.
[2]李武軍,王崇駿,張煒,陳世福.人臉識別研究綜述「J」.模式識別與人工智能,2006(19):58~62.
[3]張翠平,蘇光大.人臉識別技術綜述[J].中國圖象圖形學報,2000,5(ll):885~894.
[4]山世光.人臉識別中若干關鍵問題的研究[D].北京:中國科學院博士學位論文,2004.