崔 濤 ,趙 江 ,劉 密 ,王 斌 ,謝蜀娟 ,楊中國 ,趙艷紅 ,范 峰 ,張翔宙
(1克拉瑪依市白堿灘區人民政府 克拉瑪依 834000)
(2克拉瑪依市金牛新能源技術發展有限公司 克拉瑪依 834000)
(3中國石油大學(北京)石油數據挖掘北京市重點實驗室 北京 102249)
(4北京京鴻祥云科技有限公司 北京 101400)
基于視頻處理的智慧社區監控系統
崔 濤1,趙 江2,劉 密1,王 斌2,謝蜀娟1,楊中國3,趙艷紅4,范 峰1,張翔宙3
(1克拉瑪依市白堿灘區人民政府 克拉瑪依 834000)
(2克拉瑪依市金牛新能源技術發展有限公司 克拉瑪依 834000)
(3中國石油大學(北京)石油數據挖掘北京市重點實驗室 北京 102249)
(4北京京鴻祥云科技有限公司 北京 101400)
視頻監控系統已廣泛安裝并應用在社區,但主要依靠人工觀察監控視頻,對特殊人群、特殊服飾、特殊車輛的監控,無法實現24小時的監控,且浪費大量的人力物力。采用視頻處理技術實現視頻中的特殊人群和車輛,對設定人群、車輛及時發出安全預警,其意義在于提高社區的安全程度,促進視頻監控產業的發展,提升監控系統的實用性。同時利用視頻處理識別技術對早期火焰、人群大規模聚集等活動進行及時發現、預警,提高社區應對突然性事件的反應速度和能力,為建設智慧社區、智慧城市做出突出貢獻。
社區安全;人群識別;服飾識別;視頻監控
陡增的城市人口和巨大的流動性給公共安全帶來了巨大的挑戰[1],2014年在發生在昆明火車站和廣州火車站的暴力事件更是給有關監管部門提出了更好的挑戰。如何利用現有的監控資源,自動、實時的發現并預報一些常見的突發事件成為智慧社會乃至智慧城市建設的重要內容。特別的是隨著科技的發展,利用高科技產品犯罪的現象給公安人員防范、偵破犯罪行為也帶來了巨大的挑戰。犯罪嫌疑人的排查工作艱難,成功率低下。社區安全是城市安全的重要組成部分,應在應急準備、預警預測、應急處置等過程中發揮更大的作用[2]。但是目前大多數的社區在應對公共安全事件中反應較慢,不具備應對突發事件的基礎設施,社區工作人員的公共安全知識匱乏[3]。因而建立面向智慧社區的監控系統,建立社區發現可疑人員的預警和應急處理機制,完善基礎設施,可以更好的武裝社區安全人員以及預防和應對突發事件的發生,保障公共安全。
視頻監控是社區安全重要的組成部分也是目前最可靠的安防技術,已在機場、火車站、地鐵、社區等公共場所安裝和應用。大部分監控都是被動式的用于事后查驗,然而這種方式下,大部分的監控視頻并沒有被安防人員看到和分析。研究表明,當人類在連續22分鐘觀看一個幾乎靜止的監控畫面之后,99%的畫面信息就會丟失。即便是能看到監控畫面,安防人員也不能及時辨別或者記憶到犯罪嫌疑人的相貌。其次,監控視頻會占用大量的存儲空間,一個200萬像素的攝像頭每天的存儲量在43G左右。一般錄像數據只保存一個月左右,可以根據實際情況來決定。但是,這些占用大量存儲資源的監控視頻并沒有很好的得到利用,最多只是打上了時間標簽。一旦有社區安全事件發生,就需要大量的工作人員,反復的查看視頻,找到可疑人員,工作強度很大,費力費時。2012年南京發生的“1.6”搶劫案件,1500名民警花了一個多月的時間查看了1萬多臺攝像頭的視頻,卻只發現了20多秒與嫌疑人相關的視頻。目前的部分監控視頻中有人臉識別功能,但是只用在特定場合,比如各個機場安檢、2008年北京奧運會、2010年上海世博會、深圳羅湖口岸等[4-5]。
視頻監控系統作為智慧社區的最重要組成部分,是一個集多媒體信息、計算機交互、通信、實時處理等技術的綜合體。目前,這種系統允許手動控制云臺和鏡頭、自動錄像、遠程傳輸并存儲視頻到硬盤;部分系統還和報警傳感器聯結的功能[6-7]。面向智慧社區的視頻監控系統不同于傳統的監控系統的地方在于,利用視覺處理技術去自動完成一些耗費人力而且效率不高的工作,比如:人群計數、入侵檢測、目標跟蹤、行為識別等。
同時隨著科技的發展,深度學習在圖像處理領域取得突破性的進展,比如A.Krizhevsky[8]等人首次將卷積神經網絡應用于圖像分類任務中,并取得了ILSVRC-2012中的圖像分類和目標定位任務第一。香港中文大學的DeepID項目[9]在戶外人臉識別(LFW)數據庫中取得人臉識別準確率為97.45%。Wei Liu[10]等人在VGG16分類模型的基礎上,利用多尺度的特征圖,直接預測物體所在的位置和類別,在VOC2007上取得了72.1%的MAP。Hyeonseob Nam[11]等人在利用多個共享層基礎上抽取的特征用于對單個物體實現跟蹤,獲得VOT2015最好的成績。M.HadiKiapour[12]將服裝檢索場景形式化為商品相似計算的問題,并設計了一個特定類別的相似度計算的網絡參數訓練模型。在40萬的電商數據,以及4萬組的同款商品上進行訓練,能準確識別裙子、外套、上衣、褲子等。
利用現有的視頻監控大數據資源,研究基于視頻數據的人物身份識別算法、服裝識別算法、車輛識別算法,開發一套基于高性能計算技術的實時視頻預警系統,讓社區安全實時監控發揮最大作用。該智慧社區視頻監控系統結合先進的現代計算機技術、圖像智能分析技術,并用先進的監控設備,旨在為居民提供一個高科技、安全的生活環境和一流的安全防范監控系統。
智能社區視頻監控系統由監控攝像頭、網絡連接設備、識別視頻服務器、數據庫服務器、web服務器等部分構成。系統總體結構示意圖如圖1所示。

圖1 智慧社區監控系統總體結構
系統主要實現以下三個核心功能:
(1)管理攝像頭分組,存儲和顯示監控視頻,遠程控制攝像頭角度、焦距調整等;
(2)檢測報警功能,實現人員身份檢測、明火檢測、特殊車輛檢測、特殊服飾檢測、人群聚集檢測。同事根據設定的閾值,對檢測到的內容進行分級預警;
(3)預警管理功能,用于向web前端發送圖片和報警信息;
(4)可視化功能。
2.2.1 視頻監視功能 對于封閉式社區的情況,攝像頭安裝在主要道路、活動廣場、人群出入頻繁區域,系統通過網絡將實時畫面推送到監控中心,并接入到智能識別服務器中。監控管理人員能通過軟件對云臺進行控制,并調整攝像頭的拍攝角度,以獲取最佳觀察視角,直觀的掌握整個社區的安全動態情況[13]。提供公安人員下載、回放視頻的功能,并存儲視頻到3個月左右的時間。
2.2.2 檢測報警功能 社區安全監控系統主要功能就是對特殊人群、特殊車輛、特殊事件如人群聚集等情況的發生進行及時預警。系統包括的主要的預警功能如圖2所示。

圖2 主要預警功能模塊
(1)火焰檢測。社區中的火災會嚴重威脅人生安全和財產安全,對發生在初期煙霧和發出的明火的檢測極為重要。系統對社區重要區域進行7*24小時實時監控,啟用該功能后可及時檢測到監控區域內發生的煙霧以及明火,隨即發出警報,通知物業人員做出相關處理防止火勢的蔓延。
(2)車輛檢測。社區的重點車輛和重點關注人群密切相關,對車輛的關注也就是對人群的關注,因此在社區實現7*24小時的車輛監控十分必要。車輛的監控還是主要通過車牌的識別來實現,對主要路口的車輛進出實現車牌定位和識別,記錄車輛的活動規律。基于大數據的分析,對車輛的出行規律進行分析和建模,當異常出行發生的時候,可以及時發現和盡早干預。
(3)人員身份識別。社區安全極為重要,掌握重點人群的活動記錄能幫助控制、管理重點人群,及時發現他們的異?;顒印⒓皶r預警等。對重點人物的活動規律進行分析,一旦有異?;顒右幝沙霈F,就可以及時發現,讓社區管理人員及時排除外逃的可能性等。
(4)運動檢測和行人檢測。社區中特定時間禁止行人通行或車輛通行的區域,系統會自動檢測行人或車輛的出現,并發出預警[14]。此功能應用在一些重要區域,除了工作人員能靠近,其他人員一律不能靠近,行人檢測就是能及時發現這些可疑人員,并記錄他們的活動影響。同時,部分區域是不允許車輛進入,例如:跳廣場舞的場所。系統能自動發現車輛駛入這個區域,及時發現并預警,有效保障這個區域的活動自由。
(5)特殊服飾檢測。由于名族服裝的特殊性,可以利用特殊服裝的定位、識別,對特殊人群的發現進行輔助。暴恐分子的服飾有著特定的特征,如常見的星月服、里切克、吉里巴普服等,這些特征在做服飾檢測時都可以作為明確的正樣本來識別,負樣本的服裝就很多了,包括日常的正裝、運動服裝、表演服裝等。
(6)人群聚集檢測。人群的不正常聚集通常伴隨著特殊事件的發生,通過視頻監控及時發現人群聚集和預警,讓社區管理人員進行有效的干預是基于視頻監控的社區安全監控系統的必須的模塊功能。人群的發現主要是通過對人體的檢測實現人群的計數,設定一定的閾值,當人群的個數超過了規定的閾值就進行報警。
(7)摔倒檢測。今年來,人口老化等問題日益突出,老年人在小區活動的時候會出現意外摔倒的情況,基于視頻的摔倒檢測成為了一個研究熱點。系統中集成了相應的摔倒檢測算法,對主要區域的中老年人摔倒等情況進行實時監控,并做出有效判斷。首先是對人體進行跟蹤,當人體的特征比如:身高等發現明顯的變化的時候,可以判斷出摔倒等現象的發生。系統將自動將該圖像保存,并發送到相應的監管平臺,預報給相應的人員[15]。
2.2.3 預警管理
(1)實時預警
提供黑名單管理功能,包括增加、刪除和查詢黑名單,例如把重點關注人群的信息(包含姓名、性別、身份證號、家庭住址、人臉照片等信息)增加到黑名單數據庫,然后對主要出入口的攝像頭配置人臉識功能。這些攝像頭就可以針對出入的人群,定位出人臉區域,然后將人臉和黑名單上的人群進行對比,實時記錄可疑人出現的時間、地點等信息。如果對于特別關注的人物,要提高預警報警等級,實現實時報警。對于部分重點人物,無法獲取到除了身份證意外的照片,則要通過抓拍的方式,人工核驗一些生活照片,并更新到黑名單中的人員照片庫中。只有收集到足夠多的人員照片庫,才能建立更加可靠的人臉識別模型。系統還提供歷史出現記錄查看等功能。人員身份識別是該系統中最終的功能,圖3展示了相應的識別過程。

圖3 人員身份識別功能模塊
(2)歷史查詢
系統保存了歷次報警記錄,不管是火焰識別、車輛識別、人員身份識別的結果都保存在系統的數據庫中,監控人員可以根據地點和時間查看相關的報警記錄。對重要的人員身份識別,可以將抓拍到圖像更新到黑名單底庫中。
(3)人臉圖片搜索
提供一個可疑人員的圖片,系統能搜索到相關的記錄,出現的位置、時間等信息。因為系統只是記錄了出現在黑名單中的人員,因此不在黑名單中的人員無法搜索到。因此,系統將要重新檢索所有的監控視頻,自動巡檢,找到和圖片特征一致的人員,并記錄他們出現的時間、地點,當時的影像等。該功能可以用來幫助公安人員快速查找相關人員的出入情況。
(4)可視化
車輛出入、人員活動等按照時間排列,可以研究車輛出入的活動規律,人員活動的規律等。研究他們是否具有周期性,是否發生了異?,F象等。這部分功能需要系統具有可視化的功能,并能在地圖上繪制運動軌跡,按照時間劃分進行直方圖顯示等。
該系統的軟件功能是要建立在正確的硬件基礎設施上的,在主要道路的出入口,用于車輛識別和人員識別的攝像頭有角度和距離的限制。因為目前的智能識別算法對于低像素、遠距離情況下,人員身份識別是不準確的。而用于人群密度統計和火焰識別的攝像頭對距離的要求不是那么高,可能遠距離情況下,識別效果都能達到精度要求。本章以人員身份為例,說明攝像頭的安裝角度和要求。
為了保證人臉識別的準確率,除了設備本身的品質,現場攝像機的安裝部署也非常重要。一般為了保證現場人車的正常通過,攝像機高度不應低于4米,高度不應該高于5米,在此高度上,人臉識別水平距離應該在20米左右,可正負5米。以人體平均身高1.7米計算,攝像機俯仰角在7~12度范圍之內,能夠滿足人臉識別算法要求。
攝像機的分辨率選擇與所要覆蓋的現場寬度正相關。如圖4所示,一般200萬分辨率攝像機可以覆蓋3米的寬度。鏡頭的選擇主要和攝像機靶面、攝像機分辨率以及需要覆蓋的寬度相關。一般來說,在同樣覆蓋寬度需求的條件下,攝像機靶面越小所需要的鏡頭焦距越短。攝像機分辨率越高,單位面積上獲得的人臉像素越多。

圖4 攝像頭安裝示意圖
智慧監控系統是社區安全重要的組成部分,智能識別技術是智慧監控中的核心內容。圖像處理情況在深度學習浪潮下得到飛速發展,系統集成了人員身份識別、車輛識別、火焰識別、服飾識別等識別功能。系統提供了實時視頻展示,識別記錄、報警預警等功能。在主要路口和出入口等地方部署攝像頭,并和相應的識別服務器聯結,系統運行過程中,就會實時的分析處理視頻圖像并把識別結果推送到web前端。在web前端,按照預設的預警等級,可以實現不同的報警功能。對識別的歷史紀錄,按照時間序列進行繪圖,統計發生頻率,分析周期性的規律,及時發現數據中的異?,F象。本系統能為建設智慧社區提供強有力的監控功能,為公安機關布控可疑人群提供方便快捷的工具。提高了社區的異?,F象及時發現并預警的能力,增強了小區應對突發事件的能力,改善了小區保障小區居民的人生、財產安全的能力。
[1]李巖,陳翔.廣州市小城鎮社區安全預警系統構建[J].今日湖北旬刊,2014(1).
[2]余樹華,周林生.社區應急管理的定位研究[J].華南理工大學學報(社會科學版),2016,18(1):46-56.
[3]王穎.城市社區治理中的公共安全保障問題研究[J].發展,2015(3):97-98.
[4]桑海峰,吳丹陽,王會.視頻監控下的人臉跟蹤與識別系統[J].計算機工程與應用,2014,50(12):175-179.
[5]王煒,田野.人像識別系統在視頻監控領域的應用[J].警察技術,2014(5):12-15.
[6]趙俊.智能視頻監控系統關鍵技術研究[D].西安電子科技大學,2007.
[7] Kuehl C S.Architecting HD full motion video into military avionics infrastructures[C].Document analysis systems,2010:4.E.4-1:4.E.4-12.
[8] KrizhevskyA,Sutskever I,Hinton G E,et al.ImageNet classification with deep convolutional neural networks[C].Neural information processing systems,2012:1097-1105.
[9] Sun Y,Wang X,Tang X,et al.Deep Learning Face Representation from Predicting 10,000 Classes[C].Computer vision and pattern recognition,2014:1891-1898.
[10] Liu W,Anguelov D,Erhan D,et al.SSD:Single Shot MultiBox Detector[C].European conference on computer vision,2015: 21-37.
[11] Nam H,Han B.Learning Multi-Domain Convolutional Neural Networks for Visual Tracking[C].Computer vision and pattern recognition,2015:4293-4302.
[12] Kiapour M H, Han X,Lazebnik S,et al.Where to Buy It:Matching Street Clothing Photos in Online Shops[C].International conference on computer vision,2015:3343-3351.
[13]余臘生,劉勇.基于網絡的智能視頻監控系統的設計與實現[J].計算機工程與設計,2009(16):3879-3882.
[14] Lin Lizhong,Liu Zhiguo,Zhang Yubin.Research on Detection and Tracking of Moving Target in Intelligent Video Surveillance[C].Computer Science and Electronics Engineering(ICCSEE),2012 International Conference on, 2012:477-481.
[15] Li Y,Yin Y.Towards Suspicious Behavior Discovery in Video Surveillance System[C].Second International Workshop on Knowledge Discovery and Data Mining. IEEE Computer Society, 2009:539-541.
The video-based Surveillance System of Intelligent Community
Cui Tao1,Zhao Jiang2, ,Liu Mi1,Wang Bin2,Xie Shujuan1, Yang Zhongguo3,Zhao Yanhong4,Fan Feng1, Zhang Xiangzhou3.
1.Karamay Baijiantan District People's Government, Karamay, 834000, China ;2.Karamay Jinniu New Energy Technology Development Co. Ltd, Karamay,834000, China; 3.Petroleum Engineering and Data Mining Lab, College of Geophysics and Information Engineering, China University of Petroleum, Beijing ,102249, China; 4.Beijing JingHongXiangYun Technology Co.,Ltd, Beijing,101400, China.
The video-based surveillance system is widely used in the community, but it is mainly relay on manpower to take a close look on the special persons, special costume and special vehicles. A multiple of human resources are wasted.So the utilization of intelligent techniques in the surveillance system is vital to improve the degree of security and the application effect. The main function of the intelligent system consists of the real-time detection of person and special vehicles automatically from the video. In addition, the early detection and warning of flame and crowd gathering enable the community to quickly cope with some emergence situation. In conclusion, the intelligent video-based surveillance system will make a great contribution to the construction of intelligence community and city.
Community safety; Population identification; Dress recognition;Video monitoring
TN948.6 【文獻標識碼】A 【文章編號】1009-5624(2018)02-0127-04