陳 坤,黃興能,譚 皓,蒙世初
(百色市公安局 科技信息化科,廣西 百色 533099)
作為計算機系統的一項關鍵技術,人機交互技術隨著計算機的發展而不斷取得新進展,人們對人臉自動識別技術的研究也逐漸深入,人臉識別在公安、校園、地鐵、機場、企業、社區等生活中的各領域得到廣泛應用,因而成為圖像智能處理和模式識別中最熱門的研究課題之一。在公安的偵察工作中,通過人臉識別技術的運用,人像識別鑒定、嫌疑人識別、布控排查、重點場所門禁監管等方面都獲得較好應用效果。人臉識別技術受個體年齡、姿態、動作、表情、服飾、光照等多方面因素影響而面臨著極大挑戰[1]。年齡是造成個體面部特征變化的主要因素,對人臉識別的準確性有著關鍵性影響。隨著年齡增長,面部形狀、色澤、細微紋理會潛移默化地發生著變化。人類面部的老化是復雜的非線性變化過程,同年齡的不同人具有相似情況,同一個人在不同年齡段有著差異性變化特點,故而人臉老化過程的建模極其復雜,跨年齡人臉識別具有相當大難度。
人臉識別是一種生物特征識別技術,從圖像中獲取個性化的人臉特征,確定人臉圖像位置,包括人臉檢測、人臉裁剪、人臉校正、特征提取和人臉識別等流程[2],具有非接觸性、非侵擾性、便捷性和友好性等優勢。但是在實際應用中,人臉識別也面臨諸多問題。如:人臉數據庫的定期更新需耗費巨大的人力物力、人類的衰老導致面部特征的改變等。這些問題都促使人臉識別技術的不斷迭代升級,因而發明一款穩定高效的跨年齡人臉識別系統顯得尤為重要。跨年齡人臉識別包括圖片中人臉檢測、面部關鍵點檢測、人臉對齊、關鍵特征提取、驗證判定等階段。過去的人臉識別技術是非端到端的連續過程,每步流程的結果都會影響到下一階段的準確性,保障每個階段的準確性和可靠性意味著識別結果的準確率,跨年齡人臉識別的重點任務是獲得忽略年齡變化的身份特征。本文闡述跨年齡人臉識別技術在公安業務的應用前景,結合人臉識別技術在當前的發展現狀,對跨年齡人臉識別技術進行深入研究,提出相應算法,以提高人臉識別在公安應用中的精準度。
人臉作為人類表面的生物特征具有對環境及設備要求低、采集技術難度低、非接觸式等易采集優點。但因自然年齡增長、光照不穩定、表情和姿態變化等因素影響,自然場景下的人臉識別也存在諸多挑戰。人工智能、深度學習的快速崛起使得計算機視覺、圖像處理、人臉識別等技術在公安刑偵司法等工作中已得到廣泛且重點應用,并將在未來的公安工作中有著光明的應用及研究價值??缒挲g人臉識別在公安業務場景中的應用主要涉及幾下方面。
全國公安機關每年都有大量潛逃的境內外犯罪嫌疑人,有的罪犯被立案逃逸后潛逃時間長達十幾年甚至二十年以上,而公安機關的資料中往往只有罪犯作案時期的照片。經過數年長期潛逃躲避后,容貌大多會發生極大改變,令人難以用肉眼識別辨認,這也令人臉識別技術面臨極大挑戰。跨年齡人臉識別就能很好地解決這個難題,即便罪犯在逃串多年臉部樣貌發生一定改變后,其人臉一旦出現在公安的人臉系統,也能被快速準確識別認證。這對提升警方的工作效率、降低辦案難度,加強社會治安無疑有巨大功勞。
如據報道,中國每年約有800 萬失蹤人口,公安機關有上千萬人需要尋找,人口失蹤已成為一項較為嚴重的社會問題。在人員流動節奏快的背景下,一旦錯過失蹤人口剛走失后幾小時的最佳時間,就只能大大拉長搜索范圍,而公安對人臉的檢索將增大到千萬級別,海量數據的人臉對比,使得難度呈指數級增長,導致走失人員的長期失蹤。在走失人口中大部分是兒童,兒童一旦失蹤,極可能是被拐賣到較偏遠地區,再找回來的機率便微乎其微。正常孩童的成長發育速度很快,幾年時間中面貌和體型都會發生很大改變,隨著走失時間的延長,甚至連家長和親人都無法辨認是否為自家孩子??缒挲g識別技術在識別遺失數年之久的失蹤人員上,可有效避免年齡增長造成的人臉變化影響,助力公安找到更多遺失人口,幫助他們早日實現家人團聚。
在信息飛速傳播,網絡社交媒體都發達的今天,許多場景都需要用到個人證件比對驗證,特別是機場車站安檢、出入境、辦證大廳、銀行業務辦理等場合,且這些場合的證件驗證系統往往都與公安追捕罪犯的網絡系統聯通。一般的證件查驗是通過辦理人員人工肉眼查看,有的當事人的證件辦理年份久遠,而更新不及時,證件照片與當事人當下面部已有明顯變化,就極大增加了工作人員的辦事效能,肉眼驗證不但效率低還有很高的不可靠性??缒挲g人臉識別技術的興起不但利于這些特殊場景的辦事人員大大提高工作效率、增加對應系統的可靠性,還能在檢測到警方黑名單中在逃疑犯后實時通知公安系統,使公安及時開展抓捕逃犯行動,便于打擊犯罪分子。
人臉識別技術伴隨計算機技術的飛速發展而得到深入研究和廣泛使用。追溯人臉識別的研究歷史,最初是1954 年J.S.Bruner 發表有關心理學的人的感知,從感知和心理學角度探索人臉識別的原理。由于跨年齡人臉識別在許多領域有著不可取代的效用,因此受到大量關注。當前科研界對跨年齡人臉識別的研究主要分為以下4 類。
該方法是根據人類面部老化過程的特征進行建模,模擬人臉在自然老化中紋理、顏色、形狀等特征的變化。找到不同年齡段的實驗者,用老化模型生成各個年齡階段的照片,進行人臉驗證,但實驗結果往往因參數設置過高、計算成本較大、缺乏真實年齡數據等因素而不理想。Lanitis 等人[3]于2004 年發明了多分類器算法,用于接收人臉圖像模型生成的圖像。每個分類器生成人臉圖像的預估年齡,通過不同分類器處理圖像得出的年齡,證實了機器也能模擬人類推測一個人的年紀大小。Shu[4]的團隊于2015 年設計了一個老化字典模型,模型中以個體的身份和年齡決定人臉特征為前提,人的身份特征幾乎是固定的,但年齡特征會隨時間的推移發生改變。老化字典模型不斷學習人年齡老化過程中的面部特征,試圖線性表達一個人的衰老過程,但人類的老化過程并不是一個簡單的線性函數就能表達清楚的,因此這個模型會引起老化后的人臉分影。Wang等[5]通過長短時記憶網絡技術,構建了基于遞歸神經網絡的人臉連續老化框架,能分辨0~80 歲不同年齡階段的人臉,對老化字典模型中的人臉分影模糊現象的消除有一定作用,能獲得兩個離散組間的老年人臉部圖片。但因實驗數據量缺乏,又受臉部表情、形態等噪聲影響,這種形式也不能很好地進行跨年齡人臉識別。
與生成方式相反,判別式是關注圖像中對年齡不敏感的因素,盡量忽略年齡差異導致的影響,從而實現人臉識別。因此,在此方法中提取對年齡不敏感的特征顯得尤為重要。最新的判別式法是文獻[6]將跨人臉年齡驗證與跨年齡人臉驗證聯合建模,以年齡驗證輔助人臉驗證,排除年齡敏感特性以獲得年齡不變的特征。文獻[7]提出以最大熵模型為基礎的具有更好魯棒性的特征描述符,該方法包含了隱變量分析模型,以提高識別的精確度。其研究團隊在2014 年曾從人類中衰老導致的變異與穩定特征的差異著手,建立隱藏因素分析模型,將人臉表示為個人身份特征與年齡特征的線性關系,忽視了年齡特征會受到面部老化影響而發生非線性變化的情況。文獻[8]通過對人臉圖像高頻多次地隨機采樣法,得到了更準確地描述臉部特點的因素,但該方法缺乏對不同年齡差異特點的考慮,沒有很好地針對性。文獻[9]提出梯度方向金字塔特征描述符,該方法使用方向梯度直方圖,以多尺度信息收集判別特征來削弱年齡跨度對人臉識別的影響,利用支持向量機當作判別器進行跨年齡人臉識別。
數據量的不足會阻礙所有研究發展的腳步,跨年齡人臉識別研究一直在基礎實驗數據獲取方面困難重重。文獻[10]收集了多位名人不同年齡階段的臉部圖像,建立了一個跨年齡人臉數據集CARD,研究出以數據作為驅動的跨年齡人臉識別法,同時使用特定個體不同時期的面部圖像用于特征編碼,這種模式也成為跨年齡參考編碼。
隨著卷積神經網絡在計算機視覺和自然語言處理領域的成功應用,深度學習在跨年齡人臉識別中也逐漸得到重視。文獻[11]利用深度學習獲取臉部特征,并與LBP 特征結合實現人臉識別目標,這是學習更高級別特征的新方式。文獻[12]為解決同年齡不同個體的人臉識別和檢索問題,利用自編碼網絡學習人臉的非線性空間模型,探索出耦合自編碼網絡模型。文獻[13]采用卷積神經網絡生成隱形因子主導的跨年齡人臉識別模型。文獻[14]通過無監督特征學習分層特征表示,把經過無監督學習的模型嵌套進卷積神經網絡,獲得了深度學習人臉表達的多層信息。文獻[15]將個人特征中由年齡增長引起的變化因素剝離,學習其不變因素后進行人臉識別實驗,由此得出一種新的深度學習人臉識別網絡,即年齡估計引導卷積神經網絡。文獻[16]聯合相似度度量和基于卷積神經網絡的特征表示任務,通過優化端對端的模型提高跨年齡人臉識別的精確性。
跨年齡人臉識別可采用基于深度學習的圖像細粒度分類算法來實現,其目的是對粗粒度的大類別進行更加細致的子類劃分。由于關鍵的判別力區域散布在細小區域,需要網絡進行定位的工作,而現有大多數的網絡將定位與識別整合在一起,網絡缺乏捕獲判別力區域的能力。因此,亟待尋求能夠學習有效特征和區分難易特征的方法。跨年齡人臉識別技術關鍵要解決兩類問題:
(1)尋找同一子類內部的共同特征:如圖1 所示,同一個人不同年齡的人臉特征存在較大差異,需要尋找能唯一標識的共同特征。

圖1 跨年齡人臉數據集示意圖Fig.1 Schematic diagram of cross-age face dataset
(2)區分不同子類之間的類間差異:不同人不同年齡的人臉特征可能會存在局部較大相似性,如何保證在同一子類內部具有共同特征的條件下,尋找合適的類間差異,也是此類問題的難點。
本文針對這些問題進行的實驗探索過程如下。
Hawkeye 是一個開源的、基于PyTorch 的細粒度圖像識別模型庫,該算法包括了注意力機制、特殊損失函數等多種識別方法,本文使用Hawkeye 庫中基于注意力機制的壓縮-多擴展(One-Squeeze Multi-Excitation,OSME)+多注意力多類別約束(Multi-Attention Multi-Class,MAMC)算法框架。該框架由OSME 與MAMC 兩部分組成:
(1)OSME 模塊負責提取多個注意力區域的特征,雖然其借鑒了SENet 的注意力機制,但區別在于OSME 采用多層特征提取結構,因此可以提取多個注意力區域的特征。
(2)MAMC 模塊負責加強多個注意力區域之間的通信,其借鑒了度量學習的思想,將OSME 模塊提取的多個注意力區域進行劃分,改進了正負樣本之間的關系,并且防止了注意力檢測引入噪聲及噪聲被不斷放大的缺陷。該算法具有端到端單階段的優勢。
該算法首先通過OSME 模型學習每個輸入圖像的多注意力特征區域,然后在度量學習框架中應用多注意力多類別約束(MAMC)。其中,對于每個特征,MAMC 函數能夠拉近相同注意力且是相同類別的特征,同時拉遠不同注意力或者不同類別的特征。算法原理如圖2 所示。

圖2 OSME+MAMC 算法網絡原理圖Fig.2 Network schematic diagram of OSME+MAMC algorithm
目前公開的跨年齡人臉數據集較多,如Face Gap、Large Age-Gap、UTKFace、CACD2000 等,本文選擇使用Face Gap 數據集進行相應實驗。Face Gap數據集由兩部分組成:其中圖像數據,即跨年齡的人臉數據,共1 002 張人臉圖像;標注數據,對應每一張圖像中人臉的位置頂點坐標。該數據集由82 個人的人臉圖像組成,其中包含兒童/年輕人到成人/老年人的圖像,年齡范圍從0 到69 歲,年齡差距達45 歲。實驗中按照8 ∶2 的比例將數據集劃分為訓練集和測試,配置好數據集路徑。
實驗的參數都在相應的yaml 文件中,可讀性高、便于修改,本文使用Adam 優化器,學習率為0.000 1,訓練1 000個周期,得到最優的識別模型。訓練的損失函數曲線如圖3 所示。

圖3 模型訓練loss 曲線圖Fig.3 Loss curve of model training
使用未參與訓練的100 張圖片對模型進行效果測試,共識別準確的95 張、錯誤5 張,測試效果如圖4 所示。

圖4 模型測試效果Fig.4 Effect picture of model test
人臉識別技術作為計算機視覺領域的一個熱點研究方向,在社會生活的方方面面都得到廣泛應用。人體臉部老化不是單調的線性變化過程,而是隨著個體的內在特征存在明顯差異的,因此傳統的人臉識別算法在跨年齡人臉識別問題上往往表現欠佳。本文結合目前最新的深度學習技術,采用基于卷積神經網絡的圖像細粒度分類算法框架OSME+MAMC,用多注意力機制實現對人臉年齡特征的提取,并用度量學習的思想進行誤差估算,最終實現跨年齡人臉識別的目的。經基于開源的Face Gap 數據集對算法的測試,識別準確率達到了約95%,證明了該方法的可行性。另外,本文對跨年齡人臉識別在公安業務中的應用場景進行了分析,該技術具有非常廣闊的應用前景和重要的研究價值。