馮新淇 譚海濤 王 海 魏 寧
(南京體育學院,江蘇 南京 210000)
隨著物聯網、大數據、圖像處理及人工智能等信息技術的快速發展,計算機視覺(CV)領域技術逐漸趨于成熟,作為新興計算機視覺與模式識別交叉領域的生物識別技術應運而生。所謂生物識別技術,是指通過計算機利用人體所固有的生理特征(指紋、虹膜、臉部、血管等)來進行個人身份鑒定的技術[1]。人臉識別算法從早期的幾何特征算法發展到現在的基于深度學習的算法,在大數據和神經網絡技術的支持下,識別率接近百分之百。目前,人臉識別技術在全國各大高校中逐漸普及,用于教室考勤、會議簽到、考試實名驗證、門禁通行等諸多場景中。這種高效便捷且人性化的管理模式提高了管理效率,推動了高校從數字校園到智慧校園的進步。本文主要利用基于全量數據中心和特征值提取的人臉識別門禁平臺架構,解決南京體育學院兩校區人員進出通行管理的問題。
校級門禁系統的建設,需要建立以人員數據為基礎,以門禁管理平臺為核心,依托智能化門禁設備和人臉識別技術完成“刷臉”通行的一系列建設流程和框架,以實現各類智慧應用和個性化服務。南京體育學院作為一所特殊高校,傳統門禁管理方案無法滿足其動態、個性化的需求,因此需要構建一種新的系統來解決以下幾個問題。
校園門禁系統的建設與使用依賴于基礎數據的支撐,人員數據作為門禁系統建設的基礎,其準確性和完整性至關重要。建設南京體育學院校園門禁系統所涉及的人員數據大致分為以下幾類:人員基礎信息數據、人臉數據、人員通行規則數據等。根據部門職能管理通行人員分類如下:教職工、本科生、研究生、運動員、臨時人員、校外訪客。南京體育學院作為體育類院校,信息化基礎薄弱、起步晚,業務系統建設情況參差不齊,因此一部分人員數據分散在各個業務系統中,軟硬件的壁壘限制了系統之間的數據共享,出現了數據差異,無法確認權威數據源;另外一部分人員不存在于任何管理系統,人員數據處于未知的狀態。另外,根據目前的人員已知數據,校內普遍存在“一人多身份”的現象,如A既是研究生又是教職工,B既是運動員又是本科生。不同身份人員管理口徑不一致,通行權限也沒有明確的規則,給通行策略帶來了極大的不確定性。上述人員數據不完整、不準確,“一人多身份”,通行權限多變性等諸多問題給實現校園全量人員“刷臉”通行帶來了極大的挑戰。
校園門禁系統建設的核心是打造一個校級門禁管理平臺,實現人臉照片采集、多級授權、數據下發、通行管理等功能。學校部分業務部門已經嘗試建設了局部的人臉識別通道,如何在建設過程中兼容已有的門禁設備,避免重復建設,也成為一個難題。項目啟動后,使用部門根據實際工作需要提出了針對南京體育學院運動員食堂等特殊場景需求,同時支持根據學校管理政策變動進行平臺對應功能調整,支持對接會議簽到、教室考勤點名等應用,對門禁平臺的可擴展性提出了更高的要求。由于人的面部特征具有易采集性,容易被竊取并模仿,可以通過人臉照片攻擊、視頻攻擊、面具攻擊、化妝攻擊或計算機三維建模等手段模擬人臉進行識別,從而威脅用戶財產甚至人身安全。因此,門禁平臺的兼容性、擴展性和安全性成為本次方案設計的重要考慮因素。
為保證門禁平臺的兼容性、擴展性和安全性,并解決目前面臨的人員相關數據問題,本文提出一種基于全量數據中心和特征值提取的門禁系統建設方案,整體建設思路與架構如圖1所示。該架構將源頭業務系統的人員數據與通行規則數據進行整合,以數據中臺為依托,匯總梳理全量人員基礎數據、通行白名單數據、多身份人員數據,以標準API接口將源頭數據對接到門禁管理平臺,門禁平臺向下兼容不同硬件管理平臺與硬件設備,向上通過標準化接口提供多樣化擴展應用服務,并通過人臉提取特征值下發到終端的方式提升安全性。

圖1 基于全量數據中心和特征值提取的門禁系統建設框架
“數據中臺”這一概念的首創者是阿里巴巴,它是指以數據為中心,對海量數據進行采集、計算、存儲、加工,同時統一標準和口徑,并對外提供便捷數據服務的一種技術架構,能夠實現數據對于應用業務的價值[2]。人員數據作為門禁系統建設的基礎,為保證全量人員數據的規范性和標準性,特制定全校人員的統一編碼規范和數據標準,發布《南京體育學院人員編碼規范實施辦法(暫行)》。為保證準確性、完整性、實時性,通過數據中臺的數據同步接口將人事系統、教務系統和研究生系統等已有系統的教職工和學生基礎數據進行集成對接與治理,同時新建運動員管理系統、臨時人員管理系統和訪客系統,作為運動員、臨時人員和訪客數據的權威數據源頭進行數據集成對接,整合來自各個流程平臺的線上、線下的學生請銷假、教職工返校、運動員請假等通行規則數據進行集成對接,最終由數據中臺將全量人員的基礎數據及權限推送到門禁平臺中,解決門禁通行中“人員身份”和“人員通行權限”的問題。
在門禁平臺根據中臺的人員基礎數據和通行白名單數據進行權限下發時,通常會遇到兩類問題:一是同一個人同一身份的權限來自不同的通行規則分組,并且不同分組中的規則給出的權限出現沖突時,平臺無法給出準確的通行權限進行下發授權;二是同一個人出現多個身份且不同身份的通行權限出現沖突時,平臺根據不同身份進行分別授權,最終造成只要有一個身份具有通行權限,則此人具有“刷臉”進出權限,不符合校園實際使用場景的管理。
為解決第一個“一人多權限”問題,門禁平臺在人員授權功能中設計“多數據源計算”模塊。在模塊中自定義教職工組、學生組、運動員組、白名單、黑名單、自定義人員角色分組(如開學白名單、迎新志愿者)等的規則之間的優先級,從而利用不同分組的交集、并集組合計算出最終通行權限。
為解決第二個“一人多身份”問題,利用全量數據中心打造多身份管理平臺。多身份管理平臺對人員姓名、性別、身份證號、人臉照片(特征值)、一卡通賬號等基本屬性字段進行組合,并根據實際使用場景中的重要程度分配不同的權重,配置人員身份自動合并的初始化計算公式,如圖2所示。多身份管理平臺可以通過合并多個不同身份的人員賬號識別出唯一的自然人,分配一個新的UID(Unique Identity),而作為原有身份主鍵的學工號無法作為唯一ID識別一個自然人的身份,只能作為自然人的身份屬性數據。例如上文中提到的既是研究生又是教職工的自然人A,身份合并后生成唯一的UID作為主鍵,除了姓名、性別、身份證號等原有屬性外,學號、工號、身份類型集合也成為A新的屬性字段。然后利用數據中臺將多身份管理平臺人員多身份數據表推送到門禁平臺中,結合人員基礎數據和多數據源計算模塊進行組合判斷權限,從而避免因一人多個身份的通行權限不同而導致最終權限無法識別或者識別錯誤的現象。

圖2 多身份統一管理平臺
基于數據中臺打造全量人員數據中心,制定數據標準和數據規范,將源頭人員基礎數據和通行數據進行數據集成、清洗和整合,按照統一的數據標準和規范存儲,識別人員多身份信息,多數據源組合計算,生成通行白名單,為門禁平臺提供數據支撐服務。
人臉識別技術主要應用于人臉驗證(Face Verification)和人臉身份識別(Face Identification)[3]。人臉驗證用于判定兩張人臉圖像是否屬于同一個人,如門禁系統中的刷身份證模式,依靠人臉驗證技術證明人證一致。人臉身份識別是用于識別圖像中的人臉身份問題,如校園人臉識別門禁。兩者的本質是等同的,且都依賴于高效的人臉特征值提取技術。特征值提取技術是指對生物特征進行取樣,提取其唯一的特征,通過計算機將該特征數字化,轉化成數字代碼,并進一步將這些代碼組合成特征模板。在交互認證時,識別系統獲取生物特征,通過濾波、降噪等處理算法后將該特征形成數字代碼,與數據庫中的特征模板進行比對,以確定是否匹配,從而確定身份,具有很強的安全性和可靠性。而人臉識別的原理是依據人臉特征,在原始圖像上根據人臉檢測算法得到人臉區域,再根據特征提取算法提取人臉特征,最后根據這些特征對人臉圖像進行身份識別認證[4]。
深度學習技術是以數據的原始數據形態作為算法輸入,經過算法層層抽象,將原始數據抽象為特征表示,最后以特征到任務目標的映射作為結束,無須夾雜任何人為操作。而人臉識別技術本質上是利用深度學習技術解決圖像特征提取問題[5]。傳統的人臉識別技術主要通過提取局部的、淺層的特征,如LBP、SIFT等圖像特征描述算子,然后進行多種特征的融合,利用主成分分析法(PCA)降維后再采用傳統的機器學習分類器進行人臉驗證,但是這種特征提取技術易受人臉圖像的光線、姿態、表情、年齡、遮蓋等噪聲影響[6]。近些年來,隨著深度學習技術的迅猛發展,人臉識別技術也取得了突破性的進展。目前深度學習能夠提取圖像深層的、抽象的、概念化的特征,與傳統特征描述算子提取的淺層特征相比,能夠從圖像全局的角度提取到人臉最本質的特征,對人臉的角度、姿態、表情、光線、年齡、遮擋、背景等噪聲具有很強的抗噪能力。
基于人臉特征值提取的人臉識別技術思路,就是將人臉圖像從像素空間映射到另一個空間,并在另一個空間中做相似性計算,這是圖像識別的基本思想[7]。通過變換到另一個空間,相似的人臉圖像會聚到一起,差異性較大的人臉圖像距離會較遠。因為人臉圖像受各種因素的影響,包括角度、姿態、表情、光線、年齡、遮擋、背景等不同,造成同一個目標人臉圖像在視覺信息上存在很大的差異,這樣的圖像在原像素空間分布中很難用簡單的線或者面區分開,但是如果變換到另一個空間,就能夠很好地把他們區分開了。
因此,基于特征值提取的人臉識別技術的應用,減小了視角、背景、光線、姿態、表情、年齡、遮蓋等不同因素對人臉識別的影響,極大地提高了人臉識別的準確率,縮短了識別響應時間,提升了系統的安全性。
目前市面上主流的門禁建設廠家大致分為三類:傳統的硬件設備類廠家、人臉識別算法類廠家和門禁軟件產品類廠家。傳統的硬件設備類廠家的平臺管理功能較弱且具有排他性,人臉識別算法類廠家的中心計算模式時間延遲較高、邊緣計算模式終端照片安全性存在風險,門禁軟件產品類廠家無獨立硬件設備且平臺可定制化能力弱。因此,本次項目實施為滿足平臺的兼容性、擴展性和安全性,從硬件設備選擇、軟件功能定制、建設實施過程等多角度著手進行了設計與實現,如圖3所示。

圖3 門禁管理平臺設計與實現
2.4.1 兼容性
一是摒棄傳統利用人臉采集設備進行定點拍照采集的方式,本項目部署移動端照片自助采集程序,完成照片的自助采集上傳、合規性自動校驗、后臺審核等流程后,由門禁平臺根據不同品牌的終端設備型號進行自動調整適配。二是向下兼容不同門禁設備廠家的管理平臺與終端設備,目前南京體育學院門禁管理平臺已成功與大多數主流門禁設備廠家完成管理平臺對接,也可以通過異構管理中間件直接對接不同廠家的終端硬件設備,不具有排他性。
2.4.2 擴展性
門禁平臺可通過標準接口,向鑒權后的第三方應用提供人臉照片調用服務和AI算力服務。以會議室簽到為例,當會議室人臉識別面板具有計算能力時,門禁平臺可以提供人臉照片調用服務,將人員基礎數據和人臉數據提供給第三方,避免重復進行數據和人臉采集;當終端面板不具有計算能力時,由門禁平臺提供AI算力服務,終端將照片上傳到平臺,平臺將識別結果反饋到終端面板。兩種靈活的調用服務為人臉識別應用建設提供了很強的擴展性。
2.4.3 安全性
為更好地保護校園師生的人臉隱私數據,保障平臺的安全性,項目在建設實施過程中將門禁設備與校園網所在環境進行了隔離,做到專網專用。人臉數據的安全性在采集、存儲、下發、調用、備份等過程中得到了充分的體現。師生可在了解隱私保護協議并簽署知情同意書后進行自助采集人臉數據,審核通過后,后臺會對人臉庫照片進行加密存儲、統一管理。門禁平臺通過特征值提取服務器將照片進行特征值提取,然后將特征值通過硬件管理平臺下發到終端人臉識別設備,避免直接下發照片帶來的隱私數據泄露風險。終端設備采用人臉活體檢測技術,可以有效識別照片攻擊、視頻攻擊、面具攻擊、化妝攻擊等假體攻擊行為[8]。人臉活體檢測技術旨在判斷系統采集的人臉數據是否為真實的人臉,以防止偽造的假體人臉攻擊帶來安全威脅,提升人臉識別安全性[9]。另外,門禁平臺在向第三方提供人臉照片或特征值調用服務時會進行盲水印處理,做到來源可溯,去向可查。門禁平臺的智能數據同步代理(Agent)會與數據中臺進行定期數據交互,人臉照片和特征值數據也會通過數據中臺進行備份,實現了人員基 礎數據和人臉數據可復用,人臉庫照片或特征值丟失后版本可回溯,提高了數據安全性。
基于全量數據中心和特征值的門禁系統建設在校門進出管理、學生迎新返校等諸多場景得到了應用,推進了學校治理能力的現代化,輔助校園智慧化、精細化管理水平的提升。但是目前該架構還存在門禁平臺、硬件管理平臺與終端設備之間的耦合度過高,導致一方出現變動后對其他模塊產生不可預估的影響,從而影響終端人臉識別結果的問題。因此,該架構只有在實際使用的過程中不斷磨合與改進,才能在保證門禁平臺兼容性、擴展性和安全性的基礎上獲得最佳的用戶體驗。