寧毅 陳金龍
摘要:人臉檢測技術是多學科的課題,覆蓋了數學,數字圖像處理,神經網絡,機器學習有等學科內容,具有非常重要的應用價值。互聯網人臉檢測是互聯網人臉識別系統的前提,找到魯棒性強,檢測效率高的人臉檢測方法非常有必要。文章通過介紹互聯網人臉檢測的研究背景以及研究現狀,指出互聯網人臉檢測的難點所在,并分析目前人臉檢測的主要研究方法以及方法的優缺點,最后對人臉檢測的技術的發展進行展望。
關鍵詞:人臉檢測;互聯網視頻;膚色模型
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)03-0166-02
1 互聯網視頻檢測研究背景以及意義
互聯網視頻是已經成為互聯網主要應用領域之一,用戶人數高速增長,覆蓋率不斷提高。根據中國互聯網中心數據,截至2016年12月,我國網民規模達7.31億,普及率達到53.2%。全年共計新增網民4299萬人,增長率為6.2%,其中至2016年12月底我國網絡視頻用戶規模接近5.5億人。對互聯網的視頻研究具有非常重要的意義。近年來,犯罪率上升,通過互聯網視頻來作為重要安全防范手段,被廣泛應用于公安、交通、金融等諸多領域。其中比較典型的應用為互聯網視頻的人臉檢測。
如何充分利用互聯網視頻中人臉時間信息和空間信息克服互聯網視頻噪聲明顯,分辨率低,光照、姿態變化劇烈等困難是研究的重點。美國的MIT、CMU大學和中國的自動化所、清華大學等都對基于視頻人臉檢測檢測進行了廣泛的研究,而且目前隨著機器學習和深度學習的廣泛研究對視頻人臉檢測產生了重大影響,因此有必要對現階段基于視頻的人臉檢查方法進行分析和總結,期望更好的指導未來的研究。
作為互聯網視頻人臉識別的前提,互聯網視頻人臉檢測是指通過輸入互聯網視頻確定視頻中人臉的具體方位、姿態。隨著計算機技術的發展,在視頻人臉檢測領域相關的科研成果不斷涌現,出現了方式,方法不一樣的檢測方法。目前主要的人臉檢測方法有:基于膚色模型的方法、幾何特征的方法、基于統計理論的方法、基于視頻的運動分析方法。
2 目前人臉檢測的主要方法
2.1 基于膚色模型檢測方法
膚色特征是人臉區域的重要特征,是人臉區別與其他物體的極少數特征之一。它不受人類表情變換的影響,具有相對的穩定性,但亮度變化影響膚色檢測。經大量的研究發現無論是黃種人、白種人還是黑種人,膚色在色彩空間中分布較為集中,利用人體膚色檢測可以大幅度減少檢測時間。但當背景顏色或視頻圖像其他物體顏色與皮膚顏色接近的時候會產生誤差。膚色模型是指在一定的色彩空間描述膚色分布的模型。因此建立膚色模型首先先選取一定的顏色空間,目前的顏色空間有RGB、LUV、YIQ、HSV等,其次是根據選取的顏色空間建立數學模型。膚色模型的優點是對人體姿態、面部表情不敏感,具有較強的魯棒性。但是當光照較強時背景亮度過高與膚色接近,從而造成誤檢;當光照不足時,膚色亮度不夠往往會造成誤檢,因此需要研究出不同光照條件下膚色分割的取值。常見的顏色空間有:
2.1.1 RGB顏色空間
RGB顏色空間也稱為紅藍綠色彩空間,能用RGB值表示的顏色,是單色光中的紅綠藍(色光三原色,波長也是嚴格規定的,R 700.0nm,G 546.1nm,B 435.8nm),按不同比例的混色光。
在RGB顏色空間中,圖像中每個像素點都在都可以用圖1像素空間點來表示。在圖1中RGB顏色空間立方體中,RGB顏色立方體的原點(0,0,0)表示該點R,G,B顏色值為零意思為該點為黑色,當R,G,G各分量最大的時候,該點為白色。一般情況下其他顏色空間都可以由,R,G,B顏色空間轉換過來。
RGB膚色模型的優點是對人體姿態、面部表情不敏感,具有較強的魯棒性。但是當光照較強時背景亮度過高與膚色接近,從而造成誤檢;當光照不足時,膚色亮度不夠往往會造成誤檢,因此RGB往往不適合直接用于膚色分割。
2.1.2 HSI顏色空間
當人觀察一個彩色物體時,往往用色調、飽和度、亮度來描述物體的顏色, HSI(Hue-Saturation-Intensity)正是基于符合描述人類觀察而產生的,HSI顏色空間是由色度(HUE),飽和度(Saturation),亮度(Intensity)組成。這種色彩空間符合人類觀察色彩的方式,同時也有利于數字圖像處理。它是由R,G,B空間轉換而來。
顏色的色度指與它最接近的波普波長,色度為零時表示為紅色,色度為120為綠色,240時為藍色,色度在0-240為可見光的顏色,當色度在240-360時為非可見光。
顏色的飽和度是指與它圖2中某一點與圓心之間的距離,在圓周圍上的飽和度為1,在圓心的飽和度為0,可以通過這樣的方式理解飽和度:一副亮度很強的綠色的飽和度為1,當往里面添加水時,色彩慢慢稀析,飽和度變小,但是亮度不變。
HSI的優點在與將亮度信息I與色度H,和飽和度S區分開來,當人臉膚色檢測時,膚色的聚類性只與色度和飽和度有關,與亮度無關,這樣就可以通過計算色度和飽和度來區分人臉也背景出來。
HSI可以通過如下公式計算出來:
2.2 基于幾何特征的檢測方法
人臉具有明顯的幾何性質,比如耳朵的對稱性,眼睛的對稱性等。側影識別是最早的基于幾何特征的人臉檢測方法,該方法從人臉側臉輪廓線選取特征點,利用這些點組成的幾何特征來進行識別。目前太多數證件照為人臉正面因此該檢測方法往往根據耳朵、眼睛、鼻子的形狀和五官在臉上的幾何分布。對于耳朵、眼睛等人臉部件的輪廓邊緣提取目前常用的算法有:微分算子法、拉普拉斯高斯算子法(LOG)、Canny邊緣檢測算子。
在圖像進行邊緣特征提取前,需要對圖像進行預處理。對于人臉檢測,首要工作就是耳朵等主要人體器官進行定位,定位之前應對人臉圖像進行歸一化,圖像歸一化的運算定義為:g=f(x',y')=f[a(x,y),b(x,y)],其中f(x,y)表示輸入圖像,g(x,y)表示輸出圖像,函數a(x,y),b(x,y)描述了唯一的空間變換。
基于幾何特征的人臉檢測方法優點有:1)符合人類的視覺識別機理,便于理解。2)相對于膚色模型來說,該方法對光照照射不敏感。但該方法的缺點有:1)人臉的表情變化、特征點遮擋時,該方法檢測效果不佳。2)從不同圖像中選點相對穩定的特征點時不容易選取。但是由于人臉的部件提取往往都是由邊緣算子提取出來,所以這種人臉檢測方法往往對于圖像質量的要求比較高,對于光照、背景、噪音等要求比較高,因為噪音、陰影等往往對人臉部件邊緣造成破壞,進而影響算法的有效性。
2.3 基于統計理論的人臉檢測方法
隨著統計理論分析和機器學習以及深度學習在人臉檢測中的廣泛應用,涌現出大量的研究成果。該方法是通過對大量樣本進行訓練,找出人臉樣本的統計特性,構建出檢測分類器,使用分類器進行人臉檢測。目前常用方法有支持向量機和Adboost。
支持向量機方法,由訓練和檢測兩部分組成,訓練過程由大量人臉樣本和非人臉樣本訓練SVM分類器,使得獲得超優分類平面。檢測的時候用訓練好的SVM分類器來檢測圖像中的人臉。
Adboost是通過選擇少量關鍵的視覺特征,產生高效的強分類器,在用級聯方式將各強分類器合成更加復雜的層疊分類器。該方法在人臉檢測方面速度比較快。
通過統計理論的人臉檢測方法算法較為穩定,但是樣本的采集工作繁重,采集樣本的好壞往往對檢測效果影響較大。
3 結束語
目前人臉檢測技術快速發展,在刷臉支付、刷臉考勤等新型應用中得到快速應用,人臉檢測的精度大大提高,檢測時間快速減少。然而,人臉具有豐富的表情特性,以及互聯網視頻清晰度不足,光照和環境等影響。在很多背景復雜情況下,互聯網視頻人臉檢測難以達到較好效果。因此在今后工作中研究的重點為:1)在實際應用中,單一方法往往檢測效果較低,因此采用多種檢測方法的聯合使用,提高檢測精度。2)在前人研究基礎之上,提出新的檢測算法提高檢測效率。
參考文獻:
[1] 陳鍛生, 劉政凱. 膚色檢測技術綜述[J]. 計算機學報, 2006(2).
[2] 陳雅茜, 雷開彬. 人臉識別技術綜述[J]. 西南民族大學學報:自然科學版, 2007(4).
[3] 肖陽. 人臉檢測算法綜述[J]. 電子技術與軟件工程, 2014(4).
[4] 艾海舟, 梁路宏, 徐光祐, 等. 基于膚色和模板的人臉檢測[J]. 軟件學報, 2001(12).
[5] 楊新權. 基于膚色分割及連續Adaboost算法的人臉檢測研究[D]. 重慶: 電子科技大學, 2013.
[6] 陳冠潼. 人臉檢測與識別算法的研究與應用[D]. 大連: 大連理工大學, 2013.
[7] 袁正海. 人臉識別系統及關鍵技術研究[D]. 南京: 南京郵電大學, 2013.
[8] 段玉波, 任璐, 任偉建, 等. 基于膚色分割和改進AdaBoost算法的人臉檢測[J]. 電子設計工程, 2014(12).
[9] 王尋, 趙懷勛. 基于改進的膚色空間和幾何特征的快速人臉檢測研究[J]. 計算機應用與軟件, 2015(02).