陳春杰
(常州市公安局,江蘇 常州 213000)
步態識別技術自1994年面世以來,伴隨著各市“雪亮工程”“天眼系統”的大規模建設并投入使用,各個城市的視頻監控數量與日俱增,視頻監控也完成了從傳統模擬監控到高清數字化的過渡[1]。當前步態識別技術進入了高速發展時期,加上人工智能(Artificial Intelligence,AI)技術的發展和不斷應用到各行各業,智能視頻監控分析技術成為公安實戰中應用的一種重要偵查手段。步態是指通過對人們行走的姿勢進行研究,探索人行走的周期性規律。個人生理上的差異,導致其行走方式存在著根本性的差別。步態識別,是對視頻監控中的行人進行各方面生理特征的分析,通過與后臺數據庫比對,來識別人員的身份信息。目前,步態識別的國際最高水平精度只有65%,而中國的步態識別技術經歷了幾年的優化和發展,精度已經達到了94%以上,50米外行人的實時步態,在普通全高清攝像機下,識別準確率已高達90%以上。步態識別技術表現出其獨有的優勢和應用前景,研究步態識別技術現狀和發展,將在協助打擊違法犯罪、大型公共活動安保等方面,為公安實戰帶來革命性的解決方案,意義非凡[2]。
步態識別技術的原理主要是通過視頻數據或者實時采集行人的步態視頻,對視頻畫面中的行人展開四步法,即追蹤、檢測、分割、提取,得到行人的動態特征,如行人的腰部、雙臂、雙腿、頭部等部位的搖動、擺臂、行走等,另外還要對行人的靜態特征進行提取,如面部、服飾等,然后將提取到的特征轉換為特征值,進行編碼,再與現有數據庫中的行人特征值匹配比對,按閾值相似度大小排序,從而識別人員的身份信息[3]。
步態識別技術的主要過程涉及步態采集、步態分割、步態特征提取以及特征對比,圖1為步態識別技術流程圖。

圖1 步態識別技術流程圖
通常情況下,步態特征采集主要涉及計算機視覺的方法、肌電信號傳感器方法、壓力測試板等方法。一般使用監控攝像機來采集步態數據,包含彩色(RGB)攝像機、運動相機等。當前,步態特征數據主要利用RGB攝像機進行采集。在一些照明不好的情況下或者遇到環境惡劣時,部分步態數據集通過紅外攝像機來捕獲。此外,三維體感攝像機可以直接輸出人體的關節位置和姿態[4]。
行人的步態分割是視頻監控技術中不可或缺的一部分。步態分割是從已抓拍的視頻序列圖像中,將行人的步態輪廓進行差分法分割,通過對雙腳的距離變化分析,來判斷個人行走的步態頻率周期,從中提取關鍵幀用于下一步處理。
步態特征提取是對分割出來的人體剪影進行特征提取,包括靜態特征和動態特征兩方面。步態特征提取是步態識別的關鍵環節,起初應用的是單一輪廓特征法、融合特征法,但兩者均需依靠人工來提取特征,而且部分特征不能完整被提取。目前,深度學習和卷積神經網絡方式被廣泛應用于步態特征的提取,其適用于防控場合的步態提取,不同行人的特征區別很明顯,同一個體的步態特征有很強的內聚性,擁有毫秒級響應速度[5]。常用的步態識別分類器包括支持向量機、孿生支持向量機以及K近鄰法等。
最早的步態數據庫是在1998年由加州大學的研究者所創建的。步態數據集用于采集行人處于不同時間、不同狀態時行走姿態的視頻序列。常用的三個步態數據集分別是清華大學發布的GREW數據集、中科院發布的CASIA-B數據集及日本大阪大學發布的OU-MVLP數據集。
GREW是清華大學提供的戶外步態數據集,發布于2021年。數據集中共26 345個目標,128 671段序列,未定義特定角度,共用882個攝像頭拍攝。此數據集提供了2D、3D關節點,剪影圖及光流圖。行走條件包括干擾物、背景、攜帶物、穿著、遮擋、光照、速度、鞋子和行走方向等。圖2為受試者在不同行走條件下的示例。

圖2 受試者在不同行走條件下的示例
中國科學院自動化研究所開發的CASIA-B數據庫采集于2005年1月。該數據庫規模大、多視角,共有124位行人的原始視頻數據和輪廓圖。每位行人有11個視角(0°、18°、36°、…、180°),如圖3所示。命名規則:行人編號-行走條件-序列號-角度(001-nm-01-180.avi)。

圖3 行人11個視角的圖片
日本大阪大學科學與工業研究所在2018年發布的OUMVLP,是多視角人口步態數據集[6]。數據集共有10 307個目標(其中男性5 114名,女性5 193名,年齡2~87歲之間),4個角度(-270°、-90°、0°、180°)。該數據集提供了2D關節點及剪影圖。剪影序列(90°視角)示例如圖4所示。

圖4 剪影序列
與其他常用的生物識別技術對比,步態識別具有以下優點。
在受到前端視頻采集設備硬件條件的限制以及識別目標相距較遠時,行人面部易模糊不清,在其他生物特征無法采集的情況下,目標人物的行走姿態卻清晰可見[7]。另外,從防范角度來看,步態識別更適用于遠距離身份辨別。
與指紋、虹膜等生物特征識別技術比較,步態識別不需要識別目標體的配合,即可獲取所需信息。
指紋、虹膜等可以利用偽裝通過識別系統,步態是人體各個部位的協調動作,是落腳、起腳和支撐擺動階段,行人的行走姿態具有瞬間穩定性,難以模仿更難以改變,因此步態具有唯一性[8]。步態識別主要受視覺的靈敏程度、肌肉的力量、個人的協調能力、肌腱與骨骼的長度、個人經歷、個人的體重、生理以及個人的走路風格等因素影響,每個人的步態都是不盡相同的。因此,步態不同于人像,存在相似性,而具有身份識別的唯一性。此外,心理學研究也表明,步態所獨有的唯一性可用于身份鑒別,可以用步態識別系統來做門禁系統。
步態識別技術除了具備唯一性特征之外,還兼具隱蔽性采集的特點。在公安實戰工作中,無論工作人員采取何種偵查方法,開展工作的核心任務都是快速準確地確定嫌疑人的身份,步態識別技術的出現大大提升了偵查工作的效率。步態識別以其獨有的特征奠定了其在公安實戰領域無出其右的應用地位。特別是在各類案件偵查中,反偵查意識強的罪犯就算僥幸躲過面部識別系統,也難以逃脫步態識別系統的識別[9]。
公安機關為了高效防控重大惡性事件,尤其是涉毒、前科、敏感人群的防范控制、身份核實等問題,可借助步態識別系統加強排查,全面提升全社會治安防控水平。
一般大型活動具有參加人員數量多、活動持續時間較長、影響范圍深遠、臨時性等特點,有效核查人員的身份信息,在第一時間快速鑒別出可疑人員,具有時間的緊迫性,成為大型活動安保的頭等大事。為了省時省力快捷高效地開展大型活動安保工作,在活動現場出入口和重點部位安裝步態監控,能全面提升大型活動安保質量。
近年來,犯罪向專業化、智能化方向發展。案件發生后,公安機關可以利用步態識別系統以圖搜圖,進行人員實時布控和搜索人員軌跡,明確嫌疑人的身份和行蹤,從而精確、高效、有力地打擊違法犯罪。
人的輪廓和人的步態是人們在進行身份識別時首選的甄別方式,即使嫌疑人距離較遠,也能幫助公安機關進行快速身份識別。在預防恐怖襲擊犯罪時,步態識別能提供早期預警和較長的反應時間,幫助公安機關及早掌握反恐斗爭的主動權。
步態識別技術作為新生力量,具有遠距離、360°無死角的全視角特點,讓人耳目一新。但是步態識別技術在很多時候依然存在很多挑戰和問題,例如,步態特征信息具有易失性、步態數據庫小、單獨使用步態識別技術無法滿足實戰需求等。步態識別的發展前景可歸納為以下幾方面。
目前步態識別研究主要側重于克服跨視角方向問題,實際拍攝過程中,被遮擋或自遮擋長期存在,很難得到全周期的步態圖像,不利于步態特征的提取,影響了步態識別精度。遮擋干擾是目前乃至今后一段時間內需要研究和攻克的技術難題。基于現有的圖像信息,通過算法對人體姿態進行計算,或通過對人體姿態的深度計算,還原出被遮擋的部分,有助于提高模型對遮擋問題的穩健性。
大多數步態識別算法是通過疊加步態序列生成能量圖,但在疊加合成時,容易造成部分特征信息的丟失。為了能更好地優化和提高步態識別算法的精準度,步態視頻序列輸入可用于步態特征的提取,以確保人員步態信息的完整性。LSTM網絡可以有效解決長序列訓練時導致的信息丟失問題,充分利用LSTM網絡能提高動態視頻序列直接輸入的可能性。
海量步態數據庫是步態識別技術可持續發展的基礎保障。但是,目前的步態數據庫與人像數據庫相比,底庫數量要小得多,并且數據收集時的實際情況更是錯綜復雜,如多變的外部環境、行人不同的狀態和行走條件等。為了彌補上述缺陷,科研人員將通過大量樣本來學習與訓練,構建一個優質的智能神經網絡,供公安實戰使用。單純依靠人工單方面收集步態數據,耗時費力,通過裁剪、增設噪聲、改變角度、調整亮度等圖像樣本的擴增法值得一試。
任何生物特征識別技術都有它的不足之處,步態識別技術也不例外。步態識別的準確率會受到各種干擾,例如行人的年齡、身體情況、心理狀態及服飾等,將步態識別和其他生物識別技術共同應用,兩者之間取長補短,是未來發展的必然趨勢[10]。這主要涉及兩個維度的融合,分別是特征層面和識別模式層面。特征層面的融合將有助于提升決策的準確性。另外,通常人臉識別的準確性高于步態識別的準確性,但人臉識別在光線差、距離遠和多度遮擋時,準確性很不理想,而步態識別配合人臉識別運用,能夠大大提高復雜案件人員身份的識別率,構建多模態識別模式是絕佳的選擇。今后,步態識別還會和虹膜、指紋、筆跡等生物特征識別技術相融合,開拓生物特征識別領域的新藍海。
目前,步態識別技術對于大型數據集的錯誤識別率仍然有很大的改進空間。同時,樣本數據中依然存在多視角、復雜場景、服飾變換等諸多因素的干擾,捕獲到的人體輪廓存在較大的差異,可能導致識別錯誤。截至目前,步態數據庫還存在兩個問題:第一,步態數據庫規模急需擴大,由于樣本實例不足,步態特征維數過高,導致步態識別的精度不理想;第二,當前的步態數據庫針對復雜場景的應用不足,尤其是在人流多的情況下,總是會出現多人并排走的情況,導致物遮擋人、人遮擋人,以至于干擾對部分行人的步態特征獲取。因此,步態數據集還涉及人流、遮擋、光線照射亮度、天氣狀況等因素的影響,全面的步態數據集是訓練出優質步態識別模型的前提。
伴隨著步態識別技術的不斷成熟和新的突破,算法發展成熟的周期不斷縮短,步態識別指標持續提升,包括數據采集設備產品性價比不斷提高等,步態識別技術將會在公安實戰領域衍生出越來越多的應用模式,解鎖更多、更寬泛的應用場景[11]。由于步態識別具有遠距離、易感知和非侵犯性、難偽裝的特點,能與廣泛使用的人像識別技術相互補充,今后將會大面積地部署在各類公共安全領域,因此,不再需要大量人員安防力量,耗費大量的人力、物力進行巡檢和防護,能夠主動實現人員非法入侵報警,并自動鎖定跟蹤嫌疑人員。步態識別技術將成為公安偵查破案、反恐維穩的有效技術支撐,打造我國智慧城市發展的新方向。