王 樂,張明青,陳春曉,于海鵬
(中國人民解放軍31111部隊,江蘇 南京 210017)
隨著工業(yè)園區(qū)、農(nóng)業(yè)園區(qū)、科技園區(qū)等各類園區(qū)投資的不斷發(fā)展和深化,園區(qū)已經(jīng)成為工作與生活的載體。與此同時,園區(qū)安防問題也成為社會關(guān)注的熱點。如上下班高峰時期,保安圖省事將門一直敞開,陌生車輛、人員出入都很輕松,進出登記制度、巡邏制度等安防措施常常執(zhí)行不到位。傳統(tǒng)基于人工的安防方式數(shù)據(jù)不互通,業(yè)務(wù)難融合,難以實現(xiàn)實時入侵檢測、視頻監(jiān)控、消防報警等,長期面臨著綜合安防弱、服務(wù)體驗差、運營效率低、管理成本高等痛點。智慧安防通過大數(shù)據(jù)、人工智能、無線通信等先進技術(shù)對獲取信息進行整合,可實現(xiàn)事前預(yù)防、事中感知、快速響應(yīng)和事后分析。人臉識別技術(shù)是實現(xiàn)智慧安防的必要環(huán)節(jié)與重要手段,是計算機視覺、模式識別、生物特征識別等領(lǐng)域熱點研究課題之一,同時也得到了公安、交通等用戶方的高度重視[1]。
本文從園區(qū)安防特點出發(fā),進行了系統(tǒng)需求分析,闡述了人臉識別主要步驟,給出了系統(tǒng)的核心功能,在解決方案中介紹了基于幾何特征、子空間、模板匹配、機器學(xué)習(xí)的人臉識別算法和邏輯架構(gòu),最后從隱私性、欺騙攻擊、布設(shè)考慮3個方面探討了系統(tǒng)應(yīng)用思考。
園區(qū)安防不同于一般家庭安防,各種產(chǎn)業(yè)園區(qū)科技含量高、附加價值高、覆蓋面積大,動輒上千畝,對安防工作來說是極大的挑戰(zhàn)。產(chǎn)業(yè)園區(qū)公共區(qū)域覆蓋面積多,攝像頭點位監(jiān)控等多達上百個,考慮到園區(qū)的美化,一般不使用實體的圍墻或柵欄做邊界,大多數(shù)用綠化帶做虛擬邊界,在夜間很難依靠傳統(tǒng)紅外報警手段實施安全防范。一般園區(qū)設(shè)有單一閘門,保安人員控制閘門升降,進出口人口密度大、人口流動大、人員活動頻繁,很難做到一一詢問登記,且部分園區(qū)涉及密級制度,需要對相關(guān)人員進行行為跟蹤等。
園區(qū)在項目制造之初,服務(wù)器設(shè)備一般體量較大,系統(tǒng)前端視頻監(jiān)控點位多,后端網(wǎng)絡(luò)結(jié)構(gòu)龐綜復(fù)雜,易出現(xiàn)單點網(wǎng)絡(luò)故障或設(shè)備故障等隱患,對于中心網(wǎng)管設(shè)備,需要容災(zāi)備份。
園區(qū)內(nèi)通常樓宇眾多、業(yè)態(tài)多樣,存在多個管理者的情況。每個管理者負責(zé)自己轄區(qū)內(nèi)的樓宇視頻監(jiān)控圖像,通常不被允許相互調(diào)用,而園區(qū)總控制室又需要獲取所有部位監(jiān)控錄像,在管理模式上,存在多種權(quán)限管理、多站點管理現(xiàn)象。
人臉識別技術(shù)是基于人的臉部特征,分析采集得到的人臉圖像或者視頻數(shù)據(jù),并將其與已建成的人臉數(shù)據(jù)庫進行對比,從而實現(xiàn)對人員身份的識別[2-3]。人臉識別技術(shù)的研究可以追溯到20世紀60年代,此時以人臉面部幾何特征(包括眼睛、口、鼻等重要特征點的位置)為識別基礎(chǔ)。這種識別方式計算簡單,操作方便,但是在復(fù)雜環(huán)境下人臉識別效果會降低,比如光照變化或者被遮擋。因此,基于統(tǒng)計特征的方式受到人們更為廣泛的關(guān)注。通常而言,人臉識別的過程主要包括人臉檢測、圖像預(yù)處理、人臉特征提取和人臉匹配識別4個步驟[4],如圖1所示。

圖1 人臉識別主要流程
人臉檢測是指通過分析攝像頭等設(shè)備采集的圖像,包括靜態(tài)圖像、動態(tài)圖像、不同位置多角度的圖像等,在復(fù)雜背景中判斷是否存在面像,并分離出這些面像。常用方法有參考模板法、人臉規(guī)則法、樣品學(xué)習(xí)法、膚色模型法、特征子臉法。
圖像預(yù)處理是在人臉檢測的基礎(chǔ)上,通過圖像處理為后續(xù)特征提供高質(zhì)量圖像。實際中由攝像機等設(shè)備獲取的圖像受到光照、角度、遮擋等因素的影響,往往無法直接使用。圖像預(yù)處理可以使圖像清晰可用,主要方法包括幾何校正、光線補償、灰度變換、直方圖均衡化等。
特征提取也稱人臉表征,就是使用特定的數(shù)字來表征人臉特征信息,如視覺特征、像素統(tǒng)計特征等。主要方法可以分為兩類,分別為基于知識的表征方法和基于代數(shù)特征或統(tǒng)計學(xué)習(xí)的表征方法。
將提取出的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進行搜索匹配,根據(jù)待識別的人臉圖像與數(shù)據(jù)庫中人臉的相似度來判定,當(dāng)相似度超過了預(yù)先設(shè)定的閾值,則判定待識別的人臉身份與數(shù)據(jù)庫中身份為同一身份。主要應(yīng)用分為身份確認和身份辨識兩類。
人臉識別系統(tǒng)主要具有以下功能。
身份核驗是日常生活工作中最常用也是最基本的功能。如在城市交通系統(tǒng)中身份核驗就是基于姓名和身份證號,將當(dāng)前獲取的人臉圖片與調(diào)取的公民身份證小圖對比,得出相似度或者比對分數(shù),從而據(jù)此判斷是否為同一人。智慧園區(qū)安防中必須具備人員身份核驗功能,從而確定人員的屬性以及具有的權(quán)限。如對于園區(qū)大門來說,所有園區(qū)內(nèi)工作人員均可以進入。但是在某些辦公場所中,只有具有特定權(quán)限的人員才可以進去。此時,身份核驗是后續(xù)所有的功能的基礎(chǔ)。
在人員身份核驗的基礎(chǔ)上,為進一步了解人員各種信息,人員識別系統(tǒng)需具有人員軌跡刻畫功能。通過人員軌跡刻畫或者查詢,可以統(tǒng)計人員在特定時間是否出現(xiàn)在特定地點,從而可以簡便快捷地統(tǒng)計人員在位時間、工作時長等數(shù)據(jù)。
重點人員一般分為園區(qū)內(nèi)工作人員和非法入侵人員。園區(qū)內(nèi)人員具有園區(qū)的進入權(quán)限,可以通過人臉識別系統(tǒng)進入園區(qū)。但是如果存在不良動機,可能會對園區(qū)造成惡劣影響的,識別系統(tǒng)則需實時關(guān)注該人員異常行為。對于非法入侵人員,需要具備快速預(yù)警和報警功能。
人臉識別算法是人臉識別系統(tǒng)的核心。經(jīng)過幾十年的發(fā)展,人臉識別算法也有了質(zhì)的提高,識別準確率可達90%以上。主要的人臉識別算法包含以下幾類[5]。
4.1.1 基于幾何特征的方法
基于幾何特征的方法是利用人臉上眼睛、嘴巴、鼻子、眉毛、下巴等器官的幾何特征信息(如幾何距離)進行識別的方法。1973年,KANADE首次利用基于幾何特征的方法構(gòu)建了人臉識別系統(tǒng),系統(tǒng)識別率可達75%。這些算法理論簡單、易理解、速度快,但識別率較低。
4.1.2 基于子空間的方法
理想情況下人臉圖像簡單易分,但實際中受到光照、表情、姿態(tài)等因素的影響使得獲得的人臉圖像比較復(fù)雜,常常很難用幾何特征來表示。子空間方法(基于特征)就是將包含豐富信息的高維數(shù)據(jù)映射到低維子空間,映射后每類樣本的分布更加有規(guī)律,也更有利于樣本的分類。
4.1.3 基于模板匹配的方法
模板匹配是圖像識別中最具代表性的方法之一。它是從待識別的圖像中提取若干特征向量,并與模板對應(yīng)的特征向量進行比較,同時計算圖像與模板特征向量之間的距離,用最小距離法判定所屬類別?;谀0迤ヅ涞姆椒ㄍǔP枰藴誓0鍘?。
4.1.4 基于神經(jīng)網(wǎng)絡(luò)的方法
隨著深度學(xué)習(xí)在計算機視覺領(lǐng)域的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于人臉識別領(lǐng)域,并取得了良好的效果,相比傳統(tǒng)識別方法具有更高的識別準確率和更好的穩(wěn)定性[6]。針對靜態(tài)場景下的人臉識別問題,文獻[7]提出了一種高效通道注意力網(wǎng)絡(luò)的輕量級表情識別方法,所提方法在FER-2013與CK+數(shù)據(jù)集的識別率達到73.3%與97.9%。文獻[6]通過將基于色彩紋理分析的人臉活體檢測算法與人臉認證算法相融合,提出了一種在無需用戶配合的單目攝像頭場景下進行人臉活體檢測和人臉驗證的人臉識別算法。在動態(tài)目標追蹤中,目標移動方向不確定性和復(fù)雜多變背景環(huán)境等因素增加了動態(tài)目標跟蹤的難度。文獻[5]分別研究了基于方向梯度直方圖的人臉特征提取算法和基于歐氏距離的人臉識別算法,在此基礎(chǔ)上設(shè)計了人臉識別跟蹤系統(tǒng)。文獻[8]從公共場合治安維護和云端身份認證兩個例子,分析目前安防現(xiàn)狀、人臉識別技術(shù)的原理、性能和準確率,講述智能安防的應(yīng)用。文獻[9]介紹了卷積神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用,并深入調(diào)研了CNN準確率的影響因素(數(shù)據(jù)集、模型架構(gòu)、損失函數(shù))。文獻[10]提出了面向低質(zhì)量數(shù)據(jù)的3D人臉識別方法。該方法針對快速采集設(shè)備的低質(zhì)量3D人臉數(shù)據(jù)提出了空間注意力機制的Dropout(SAD)、類間正則化損失函數(shù)(IR Loss),有效提升了不完整3D人臉數(shù)據(jù)的識別精度。清華大學(xué)張鈸院士在文獻[11]中從人臉檢測問題的分類、人臉模式的分析、特征提取與特征綜合、性能評價等角度,系統(tǒng)地整理分析了人臉檢測問題的研究文獻。
為便于前端顯示與后端數(shù)據(jù)處理,人臉識別系統(tǒng)邏輯架構(gòu)通常采用分層結(jié)構(gòu),包括接入層、服務(wù)層、數(shù)據(jù)層和應(yīng)用層4個層次。集成人臉識別相關(guān)的各種資源、服務(wù)和應(yīng)用,實現(xiàn)靈活完備的數(shù)據(jù)接入、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用[4]。
接入層的作用是實現(xiàn)各種類型的前端采集終端的接入,包括普通攝像機、人臉抓拍攝像機等各類的數(shù)據(jù)采集設(shè)備。
服務(wù)層主要是基于所采集的數(shù)據(jù)完成基礎(chǔ)的人臉識別過程,人臉識別算法在該層運行,包括人臉圖像預(yù)處理、人臉特征提取、人臉比對等服務(wù)。
數(shù)據(jù)層主要完成各種大數(shù)據(jù)的存儲管理與對外提供數(shù)據(jù)訪問服務(wù)。
應(yīng)用層負責(zé)具體業(yè)務(wù)邏輯處理,包括人臉檢索、身份核驗、重點人員預(yù)警、人員軌跡查詢等應(yīng)用需求。
盡管人臉識別系統(tǒng)在實際中具有多方面應(yīng)用,具有自然性和不被被測個體察覺的特點。人臉識別技術(shù)完全利用可見光獲取人臉圖像信息,而不同于指紋識別或者虹膜識別,需要利用電子壓力傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而更有可能被偽裝欺騙。但是實際部署應(yīng)用過程中,仍有很多問題值得進一步思考。
2020年,一男子“戴著頭盔看房”的短視頻在網(wǎng)上流傳。據(jù)了解,該男子之所以戴著頭盔的原因就是要保護自己的個人信息,因為售樓處安裝了人臉識別系統(tǒng)?,F(xiàn)實生活也確實成了“看臉”,比如商場刷臉付款、上班刷臉打卡、上課刷臉報到等。人臉識別技術(shù)帶來的安全隱患越來越為公眾所關(guān)切。特別是數(shù)據(jù)泄露后,對公眾生活將產(chǎn)生極為嚴重的影響。
雖然人臉識別技術(shù)不斷提高,但仍面臨嚴峻的欺詐攻擊威脅,如照片攻擊、視頻攻擊、3D Mask攻擊和虛擬現(xiàn)實(Virtual Reality,VR)攻擊等。理論上,高清攝像機或者照相機實時獲取的真實面部數(shù)據(jù)和欺詐攻擊所使用的人臉面部數(shù)據(jù)之間存在固有差異,包括圖像紋理、光譜信息、運動信息、深度信息等。但是使用人臉識別技術(shù)區(qū)分困難,如用戶A用手機拍攝了一張包含人臉的圖片一,用戶B翻拍了圖片一得到了圖片二,并用圖片二偽造成用戶A去進行識別操作。
人臉識別應(yīng)用對服務(wù)器資源、網(wǎng)絡(luò)資源以及存儲資源均有較大的需求,高精度的識別率依賴于清晰的人臉圖像。由于環(huán)境的復(fù)雜性和識別對象的多變性,單一的人臉識別途徑很難做到準確識別,在一定程度上存在誤差空間。為此,需加強頂層設(shè)計,如前端設(shè)備所采集的視頻質(zhì)量將直接影響人臉識別應(yīng)用的準確性和效率,為此需仔細設(shè)計前端攝像機的安裝點位和現(xiàn)場部署。