山東外事職業大學 衣柳成
現階段,人臉檢測作為人臉識別的重要部分已日益成為一項專門的研究課題,逐步被業界所重視。安防監控的核心即為人臉圖像識別,其特點是可以在密集人群中檢測出人臉圖像。如今,在密集人群的場合開展人臉圖像識別一般會運用常用的CPU 芯片來對照人臉庫中存儲的全部圖片,這樣會大幅使用CPU 芯片的內部資源,減弱CPU 芯片的處理速度,也會對全面的人臉圖像處理產生干擾。因此,要更多地探究密集人臉檢測技術,作為后續研究的參考依據。
現如今,在電子信息及計算機科學等先進技術的快速發展環境下,計算機分析人臉成為一項重要的研究課題,人臉結構及細節方面的特點是人類身上重要且獨特的生物特征,有效地分析其包含的眾多信息,包括五官特點、性別、年齡、姿態、表情等,抓住這些信息數據來歸納不同的人臉屬性。對于人臉地分析涉及到心理學、計算機視覺、人工智能以及人機交互等不同的技術及學科領域,也成為了計算機對人類重要的理解及提升認知的環節,對于人臉分析中開展特征提取及識別方式的更多開發,可進一步引導其他模式的分類,對不同的領域提供理論與實踐方面的依據,對提升此類領域的不斷發展也有著重要的意義。
目前,計算機的網絡技術在持續發展,各界也提升了對模式識別及計算機視覺的重視。人臉識別也漸漸成為了目前不同領域內重要的研發項目,人臉識別的基本內容是人臉檢測,其也是人臉識別中的重要項目。人臉檢測是人臉識別的開端,與人臉識別密不可分,在人臉識別中作為最重要也最難完成的環節,其核心內容是判斷人臉圖像中的人臉數據。人臉檢測對于計算機來說并不像人類分辨人臉那樣簡單,而是一個非常繁瑣的過程。計算機進行人臉檢測的最終目標就是降低計算量的同時要保持更高的準確率[1]。
對人臉檢測的實際效果產生影響的因素包括:(1)人臉姿態。相機的成像位置會造成人臉中雙眼未在同一水平線上,這會導致人臉檢測時的面部姿態受到干擾。(2)遮蓋物。單個或多個人臉圖像可能會受到遮蓋物或相互之間的遮擋,以及被其他背景遮擋等情況。(3)光照強度。人臉圖像在拍攝過程中的不同光照強度會造成人臉圖像灰度的不同,形成很大的局部對比度,導致人臉檢測的真實效果受到干擾。(4)面部表情。人臉的表情會對人臉檢測效果帶來最直接的干擾。所以,目前的重點研究目標要從如何克服以上問題入手。
人臉檢測作為一個系統的識別概念包括各類不同的信息,人臉的不同分析任務代表著檢測角度的差異,比如,表情識別、年齡分析、性別判斷、顏值吸引力判別等,現階段的人臉檢測基本都是單獨的檢測不同的分析任務[2]。
(1)表情識別。利用人臉的各種形態判斷人的情緒及心理活動;(2)年齡分析:按照人臉的衰老狀態、面部特點估算具體的年齡范圍;(3)性別判斷:計算機對人臉圖像進行分析,判斷其為男性或女性;(4)顏值及吸引力判別:這方面的分析需要事先設置標準臉。
人臉檢測中有效捕獲人臉的具體特征是開展人臉分析的重點,人臉特征地獲取方式主要有兩種,即人為構建和深度開展網絡學習。人為構建的人臉特征會在指定的人臉分析任務中發揮很好的性能,但每種人臉的分析任務都要進行不同的特征設定,也無法達到獲得其他更高語義屬性的相關數據;深度學習的方式無需針對不同任務手動設計各類特征,但有很高的相關信息需求。雖然對于不同的人臉屬性已具備相應的高精度屬性識別算法,但這類算法只識別某個單一的特定任務,對其開展模型訓練,對人臉的所有屬性分析要整合每個單一的任務,不僅消耗時間及人力,同時任務模型只有單一的功能,結構參數龐大繁瑣,可達幾十兆至幾百兆,在實際使用時,因移動平臺內的硬件限制無法實現同時分析多個任務模型,因此,研究人臉分析算法時,在提升識別算法精準度的同時,更要注重實際應用中算法模型的大小及運算速度等方面的問題[3]。
人臉檢測算法是要精準定位圖像中全部人臉的具體對應位置,輸出的外接矩形是人臉圖像所在的坐標及人臉姿態信息等。人臉雖有著不變的結構,但相同的人因呈現的姿態及表情的差異,在外觀上也會有不同的體現,外加光照、遮擋、相機設置等因素的影響,造成了人臉極難被精準的檢測到。
在深度學習方式未引入人臉檢測領域時,人臉檢測算法的具體流程如下:采用無數人臉及非人臉的樣本圖像開展模型訓練,獲得分類器來處理二類分類的具體問題,這也就是通常所說的人臉檢測模板。人臉檢測模板只能輸入特定尺寸的圖片,并進行二類分類,也就是說,人臉檢測模板只能判斷是否為輸入區域或是否為人臉。傳統的人臉檢測算法使用的即為此類分類器匹配技術,采用一個人臉檢測圖像模板匹配被檢測圖片的所有位置區域,來明確此區域內是否存在人臉,這就是初期的在具備上下文信息的高密度人群內開展人臉檢測分析的人臉檢測算法流程。在此之后,某些深入學習在應用于人臉檢測的相關算法中涵蓋了神經網絡及支持向量機(SVM)等。以上均是在圖像中的各個區域開展的二分類識別[4]。
以人工設計為基礎的人臉特征不具備穩定性,設計出的特征很容易在光照條件、照相角度、人臉間的遮擋等不同的外界條件下受到相應的干擾,因此,在高密度人群的繁雜情境中,傳統的人臉檢測方式無法保障其性能,傳統人臉的檢測算法的應用方面也極大地受情境制約。由于傳統的人臉檢測算法在機器學習的基礎上,其速度、性能、應用場景等方面都受到了制約,因此,需要其他性能更高的算法應用于復雜場景中,即深度學習方式地出現,極大地緩解了這種局面[5]。由于人臉檢測有著重要的商業用途及研究價值,在深度學習基礎上的人臉檢測算法可作為目標檢測算法及深度學習算法等研究的發展方向。深度卷積神經網絡可以有效地學習圖像目標的不同形態特征,是可以抵御各種復雜情況干擾的新型人臉檢測方式。在二階段人臉檢測基礎上的傳統算法采用滑動窗口來直接獲取候選區域,這種方式需要大量的計算,且無法實現動態檢測效果;而一階段具有更快的人臉檢測算法效率。不管檢測器是第一或第二階段,大體也都是根據卷積神經網絡的自身特征來設定。深度卷積神經網絡(DCNN)在成功達成圖像分類的難題后,運用其捕捉特征的方式大大超越了傳統的機器學習檢測結構的精準度,目前已具備了相應的檢測精度及更高檢測效率的算法,并被人臉檢測的各個領域推廣應用。
小目標檢測在人臉檢測領域中作為一直備受困擾的難題,其中的小人臉檢測也是遺留的一項重要問題。由于小人臉具備的特征信息不多,且尺寸微小很難被檢測到,且這類問題與主流算法的自身結構設定有著密切的關系,如深度卷積神經網絡的重復采樣造成了最終分數層上對應原圖上區域的定位點超過小人臉尺寸。人臉檢測器根據結合多尺度特征層,輸入圖像的金字塔以及空間的上下文等不同的信息來開展小人臉檢測。預測過程中要運用不同的錨結構來對應不同放縮比例的輸入圖片,其中會得到錨結構更接近小人臉的尺寸,來幫助開展小人臉檢測。
動態人臉分析系統簡化了之前的人臉屬性算法,并在傳統人臉檢測算法優越的效率優勢基礎上,結合深度學習精準地對人臉屬性進行檢測的識別算法,提出深度學習識別算法的小網絡模型來開展對人臉不同屬性的判斷,不僅保障了識別的準確度且大大提升了識別效率。人臉檢測一般會運用以下的處理步驟:首先是人臉識別輸入的采樣圖像,其次是大致定位人臉圖像的具體五官位置,再按照五官的位置將人臉對齊給出標準人臉,最后在不同人臉屬性特征的訓練分類器內開展人臉屬性識別。利用人臉檢測捕捉人臉圖像后同步開展定位人臉的關鍵點以及識別人臉屬性,這樣能促進模型的簡單統一,且防止利用對齊人臉關鍵點(二維仿射變換)造成人臉失真,從而導致人臉屬性缺乏識別的準確度。
定位人臉關鍵點指的是對人臉的重要輪廓,如眼睛、鼻子、嘴巴等的定位,其宗旨是利用人臉關鍵點周圍的數據及其相互間的關系來開展定位。人臉的屬性識別即是對人臉屬性的合理分類,一般分為兩個步驟:獲取人臉特征屬性及訓練屬性的識別分類器。人臉具有不同的屬性,各類人臉屬性也具有各自的人臉特征及屬性分類器,若需對多任務屬性進行識別,用人為手段或單獨種類的人臉特征或分類器則很難實現,但深度學習可有效處理這類問題。深度學習方式無需手動設定人臉特征,可通過海量的人臉數據智能地對人臉特征進行學習,且深度學習采用統一的框架,有效地整合特征提取及分類器訓練等不同功能,同時運用此優勢對各類屬性任務開展訓練,并有效完成訓練任務,也就是說,其在定位人臉的關鍵點時,可同步識別人臉屬性,通過關鍵點信息來促進對人臉屬性地判斷,再通過反饋的人臉屬性信息來輔助定位人臉的關鍵點,這將得到更為精準的人臉關鍵點定位信息。
深度學習不僅在關鍵點定位方面得到普遍的應用,在目前也觸及到了人臉屬性的識別算法。進行人臉屬性的識別任務時,對于吸引力、胖瘦、微笑、性別、年齡、是否佩戴眼鏡等六種不同的分類任務進行判斷、識別、檢測等,開展深度的網絡學習訓練。在對以上六類屬性開展分類的過程中,對其中每類任務開展逐一的訓練可以發現,無論采取哪種網絡訓練方式,都只會捕捉眼鏡和性別這兩類屬性,其他的微笑、胖瘦、吸引力、年齡等屬性則無法捕捉,由此可以判斷,需通過一個綜合的網絡訓練來解決屬性不復雜的二分類問題,而相對復雜且不清晰分類的屬性任務則無法用一個深度網絡學習到適用的模型;單一屬性的訓練失敗后又進行了幾類屬性的集成任務訓練,結果一樣是在吸引力、年齡等屬性任務的分類中沒有獲取更好的分類效果,原因可能為這一設計并未設置限制關鍵點的規范,而是直接開展通過人臉圖像及屬性標簽的相關訓練,簡單的單個神經網絡不足以捕捉對應的人臉屬性特征。應重視人臉的關鍵點與其屬性間的關系,在關鍵點開展檢測任務的過程中提升重視人臉屬性,創建多任務的深度學習網絡,通過制約人臉關鍵點來提升精準識別人臉屬性識別,并在單個網絡開展檢測人臉關鍵點的同時輔以人臉屬性來提升檢測的精準度。
深度網絡的結構層次為由低到高,每個層次的輸入都以非線性的形式展現,從低層的邊緣、輪廓等信息的層次疊加,形成高層次的語義信息,多任務的深度網絡允許不同數據源的同時輸入,不同的數據源在共享數據的過程中開展子任務的模型訓練,共享低層數據,具備共同屬性的任務在共享中與相關信息建立連接,可顯著降低計算量,并全面學習特征,由指定層為指定的任務創建指定的損失函數,來獨自完成各自的任務,實現數據共享及指定多任務之間的全面統一。
人臉檢測系統共有攝像頭、處理系統、顯示屏三種硬件設施。攝像頭利用數據傳送接口將捕捉到的視頻信息傳送到處理系統,系統接收信息數據后開展檢測分析,并將結果傳送至顯示屏。人臉分析的應用情境主要是人群狀態分析,如在車站、景點及街道等相對事故高發、人群密集的區域內開展對人群的分析識別,對人群密度、性別分布及情緒狀態等進行分析,預先防護,避免意外事件發生。人臉檢測系統共有的功能主要如下:在捕捉到視頻圖像中的人臉信息以后上傳至人臉檢測模塊;獲得人臉區域后再傳送至人臉關鍵點及屬性模塊;開展人臉關鍵點及屬性的定位及識別;在嵌入式的開發板上實現系統操作,要先進行開發板的軟件環境配置。
在實際生活中人臉分析系統擁有更多的應用前景,在大型賣場及無人超市的應用中,利用人臉分析系統能夠創建一類新型的營銷情境,用戶進店之后,人臉分析根據用戶屬性及其目前的情緒狀況對用戶開展精準有效的商品推薦;同時對用戶喜好合理統計并進行產品定位,按各類商品的客流統計狀況,判斷用戶中不同的年齡及性別人群的喜好,來提升助力產品定位。
現如今,隨著計算機視覺及人工智能的持續發展,人臉檢測也在不斷地進行深入研發,現階段的研究重點是怎樣迅速、精準地在復雜場景中分析動態人臉的多種形態,這也是當下的研發難點。目前正在采用更多更新的技術和方法來進行更深入的探索,以此來體現人臉檢測技術對于人臉識別技術發展的促進作用。