連俊芳
(閩南理工學院實踐教學中心,福建 石獅 362700)
目前各大商場、小區等都安裝了大量的監控設備,但這些監控設備大多由安保人員進行人工監察,而安保人員每日工作時間通常超過8 h,并且夜間也需要長時間地監看。長時間工作使得安保人員難免因疲勞而導致在異常狀況發生時無法作出準確判斷,從而引發安全問題。目前,人們對于安全問題越來越重視,視頻監控的數量也越來越多,對安防人員的要求也越來越高,這就造成在人工成本驟增的情況下安全還不能得到絕對的保障。因此,需要利用人工智能的手段,在降低成本的同時提高視頻監控的準確度,降低出錯率。
本文設計了一套端對端的智能安全防控系統,利用行人檢測、行人追蹤研究方法在嵌入式設備中的應用,用戶不需要進行任何操作,就可以得到行人的各項數據[1];同時,該設計利用一系列研究方法,在保證視頻監測準確率的前提下提升其效率,并且考慮到有可能出現行人重復出現而導致識別錯誤的情況發生,采用了行人重識別技術,保證行人數據的唯一性。
本系統主要針對攝像頭實時視頻或以往拍攝的視頻而設計,可以不需要用戶進行任何操作就能自動完成行人檢測、行人追蹤以及行人信息統計的過程。在系統自動檢測追蹤的過程中,可以在顯示界面標注出檢測到的行人和其ID的實時信息[2];同時,可以將剪輯行人的實時信息錄入到數據庫中,為后續行人重識別提供依據。這個過程全程自動化,無需用戶進行手動操作;系統設置了數據管理員,可以憑借權限進入數據庫進行行人數據信息查詢、行人數據信息修改以及行人數據信息維護等一系列操作。該系統可以應用在各大商場、車站等人員密集的地方,對來往人員進行實時監測,發現異常情況及時處理,以達到安全防控的目的[3]。
為了實現系統的功能,設計了一個完整的端到端的行人信息統計系統,包含行人檢測、行人追蹤、行人重識別、數據庫管理、顯示界面5大模塊[4]。很多研究人員在以上單獨的模塊上均有深入的研究,但很少有人將這五者結合,設計出一個完整的用于安全防控的行人信息檢測與統計的系統。
邊緣計算并不新鮮,但是隨著科技的進步,人們對互聯網的要求越來越高,使得邊緣計算越來越流行,而如何將算法在嵌入式設備上得到很好的應用是筆者一直關注的重點。本文設計的基于嵌入式的行人檢測、追蹤智能安全防控系統,就是將算法應用在嵌入式設備上,同時將嵌入式設備的易部署、成本低、便攜的優勢和算法的性能優勢相結合,使其在實際場景中得到很好的應用。系統的行人檢測過程流程圖如圖1所示。

圖1 行人檢測過程流程圖
系統結構圖如圖2所示,從系統結構圖中可以看出,普通用戶對行人檢測、行人追蹤、行人重識別以及對數據庫數據調用對比等操作的過程是不可見的,普通用戶僅能夠觀察顯示界面中行人的一些統計數據。考慮到安全性的問題,會設置一個系統管理員,系統管理員對行人的數據具有可操作的權利。

圖2 系統結構圖
根據目標檢測算法的流程,目前主流的算法分為two-stage和one-stage兩種。two-stage算法的主要代表有R-CNN系列,one-stage算法的主要代表有YOLO系列[5]。
YOLO算法實際上是將目標檢測的問題化簡成回歸問題,其直接從每幅圖像的像素出發,以得到框和分類概率。YOLO具有檢測速度很快、會根據整張圖片現有信息進行預測的優點,所以本系統采用YOLO模型進行行人檢測。YOLO將輸入的圖片縮放到合適的分辨率,使用卷積神經網絡模型對圖片進行特征提取,然后輸出對應張量,最后預測候選框。本系統采用非極大值抑制算法,將置信度最高的候選框選取出來,目的是防止多次檢測到同一個目標,將重復框過濾掉,從而得到最終的檢測結果。其詳細流程如圖3所示:YOLO利用卷積神經網絡分割圖片為S×S網格,檢測網格中是否存在目標,確定中心點位置。
本系統采用的是比較有代表性并且精度比較高的YOLOv3-SPP結構模型進行行人檢測。YOLO可以對目標行人實現端到端的檢測[6]。YOLO利用卷積神經網絡分割圖片,檢測網格中是否存在目標,確定中心點位置,從而實現行人檢測的目的[7]。

圖3 檢測算法流程圖
本系統采用基于Deep Sort框架進行改進的行人檢測與追蹤的追蹤策略。利用YOLOv3在速度上的優勢,以及Deep Sort中包含的RE-ID模型可以對行人進行特征提取的特點,就可以重新“訓練”出一個在行人數據集上有更好性能的模型。
在行人檢測過程中難免會出現同一個行人反復出現在同一個攝像頭范圍內或者同一區域跨攝像頭出現的情況。為了防止同一行人短時間內反復出現或跨鏡頭出現而導致行人ID不同的情況發生,本系統在行人檢測及追蹤過程中加入短時行人重識別模塊[8],充分利用圖片的表征信息,保證目標信息正確且不會跟丟。同時考慮到長時間內已經出現過的行人也有可能再次出現在攝像頭內,因此還需要加入一個長時間的行人重識別模塊,在對行人識別追蹤之后,在數據庫中匹配,看是否已存在該行人的基本信息,從而實行行人信息的唯一性。
建立存儲行人信息的數據庫,每次檢測和追蹤都是對數據庫信息的一個完善,并且允許系統在進行行人檢測、追蹤和重識別時調用數據庫模塊數據。考慮到安全問題,設置普通用戶無權訪問,管理員用戶在進行驗證之后可以對數據進行修改、查詢等操作。
整個檢測過程通過系統界面進行顯示,界面中可以標注出行人的信息,包括年、月、日、時以及ID等信息,普通用戶不需要進行任何操作即可使用。若出現異常情況會發出警報,用戶根據警報去查看發生的情況即可。
本文應用的是NVIDIA公司設計的第三代嵌入式平臺Jetson Tegra X2(簡稱TX2),基于深度學習的各類模型均可在嵌入式平臺TX2上進行高效部署[9],包括本文設計的行人檢測、追蹤模型的部署。TX2嵌入式平臺如圖4所示。

圖4 TX2嵌入式平臺
TX2 平臺CPU由雙核Denver 和四核ARM Cortex-A57 組成,通過優化架構高效互聯;GPU采用Pascal架構,擁有256個CUDA核心,可進行基于YOLO的深度學習模型運算;顯卡計算性能極高,可以解碼要求極高的高清視頻流。
本文設計的這款行人檢測、追蹤的安全防控系統經過了實際應用,效果良好。圖5是系統的交互界面,從圖中可以看到,系統收集了各個攝像頭的實時信息進行行人檢測和行人追蹤,同時匹配數據庫信息進行行人重識別,對同一個人重復出現或跨攝像頭出現的情況予以刪除,保留一個行人ID[10]。并且系統會對異常情況進行統計,管理員可以登入查看具體異常情況而予以妥善解決。本系統還可以設置人數上限,超過上限人數,系統會發出警報,管理員可以根據人員密集程度而采取一些措施,例如對場所進行限流、分流以防止因人員過于密集而發生安全事件。

圖5 系統的交互界面
本文完成了基于嵌入式的行人檢測、行人追蹤智能安全防控系統的設計,把深度算法運用在嵌入式設備上,可以讓設備變得智能化。隨著5G的發展,在如今萬物互聯的時代,在安全防控系統的改進方面還將具有巨大的潛力。首先,本系統雖然實現了對行人實時檢測的需求,但速度方面還有待提高,可以結合5G網絡進行改進;其次,本系統對數據存儲的空間要求比較高,可以結合云端存儲降低存儲空間,由于5G網絡的低延遲性,并不會對存儲速度產生影響;最后,本系統會對每個行人的每幀進行逐一對比,這就導致了計算量非常巨大,在今后的設計中可以考慮用特征融合的方法來改善行人檢測與重識別的速度。