陳 威 陽許軍
(1.武漢郵電科學研究院 武漢 430074)(2.武漢虹信技術服務有限責任公司 武漢 430074)
隨著社會的發展,人口流動的日益頻繁,社會治安形勢的多樣性、復雜性,犯罪作案手段隱蔽性和向高智商犯罪發展的趨勢,治安和維穩形勢的快速變化以及警務功能的不斷細化和拓展,傳統的警務和社區綜合治理模式已越來越不能適應維護社會穩定和治安的發展變化,越來越難以掌握當代社會治安和維穩的主動權[1]。因此帶來一系列社會穩定、治安管理等難題,給社區警務工作造成了空前的難度和壓力。
為了適應新形勢的需要,本文提出構建基于數據分析的治安情報研判系統。通過對社區人口數據,以及由人產生的日常生產生活數據進行收集、整理、歸類,與既有的公安警務數據、社區網格管理數據進行多源信息融合分析,挖掘數據中蘊藏的巨大價值,進行有效的情報研判,從而實現對流動人口和重點防控人員的科學管理、動態管理和長效管理,在指揮調度、警力配置、聯防聯控等治安防范工作中變被動為主動,將有限的治安力量投放到最關鍵的位置。使基層治安和維穩工作的資源配置更加科學、協同配合更加便捷、管理服務更加高效,在維護國家穩定、保障社會安寧和人民安居樂業方面具有重大意義,對平安城市和智慧城市的建設提供有力的補充和支撐[2]。
當前,全國多數地區在進行治安工作時仍停留在傳統的人工研判形式,費時費力效率低下,缺乏準確性和預見性,當然有部分社區治安機構已嘗試建立了治安數據綜合管理平臺,平臺包含了社區人員信息、車輛信息、違法信息等相關數據,形成了一個龐大的治安信息數據庫,且數據信息基本能夠做到實時收集。而目前對治安情報數據的分析,多數只能做到一般的統計分析,缺乏與案件相關的人員、車輛、居住地等相關信息的關聯分析和挖掘分析,故從這些數據中獲取的信息量僅占了整個數據庫中的很少部分信息量,無法發現隱藏在案件背后的發生規律和發展趨勢,難以達到精準制定預防決策的要求。
基于數據分析的治安情報研判系統的搭建,目的是利用數據分析的科學手段,研究出能夠科學分析影響社會治安各種因素的方法,從而挖掘出傳統分析方法不易得到的客觀規律,進行有效的情報研判。系統包含兩個方面的關鍵技術:一是創建治安情報綜合分析數據倉庫,二是確立治安情報分析主題與挖掘模型。
在創建數據倉庫之前,我們首先要獲取數據源[3]。基于數據分析的治安情報研判系統的數據源,主要包括社區警務數據、網格數據,比如社區內的車輛信息、人口信息、重點防控對象等,同時還要獲取社區內的人員車輛出入記錄、視頻監控、門禁道閘、能源消耗等多方面的相關數據,這些都是數據倉庫的基石。
數據倉庫是一個數據集合,它具有面向主題、融合性高、容量大、相對穩定、時變等特點。整個系統架構包含數據源、數據倉庫、數據集市、數據應用、數據管理[4]。數據源先將系統的所有初始數據提取出來,然后進行清洗轉換,再將其匯入數據倉庫。數據倉庫存儲分析研判數據,將所有研判數據集中起來,便于管控。數據集市通過對各種研判主題構造一系列數據集,從而增強系統的適應能力,而且數據也更易于重復利用。數據應用是數據的展示層,可以通過web、app等形式向用戶提供查詢統計、多維分析、數據挖掘、可視化等功能。數據管理用于確保整個研判系統安全可靠的運行。系統的總體結構如圖1所示。

圖1 系統總體結構圖
情報研判系統采用常規的數據分析方法,如關聯分析、回歸分析、聚類分析、時間序列模型等方法[5],根據社區治安情況的特點,建立適用于情報研判的分析主題,然后根據不同的主題選取相關的挖掘模型,由此進行各種情報數據的分析挖掘。
可以將治安情報的挖掘分析分為兩類,一類是描述型的,能夠發現數據的內部結構和之間的聯系,另一類是預測型的,能夠根據歷史數據預測出數據將來的變化走向,后文將會詳述這兩類分析。
基于數據分析的治安情報研判系統通過對社區警務平臺數據及其他相關數據進行預處理獲得數據源,然后創建治安情報綜合分析數據倉庫,在此基礎上,進行案件信息的統計分析,案件與案發時間地點等因素的關聯分析,案情發展趨勢預測的挖掘分析,案件數據處理結果的可視化分析,經過這一系列操作之后,通過提供接口輸出情報分析研判結果,從而實現了社區治安情報的綜合分析研判。整體流程如圖2所示。
4.2.1 統計分析
統計分析是對歷史案件統計的項目與未曾統計到的項目的擴充,是對之前的統計功能與欲改進功能的完善,具體包括案件信息任意分析、案件特征綜合分析、案件發展趨勢分析、案件發生原因分析等。

圖2 系統整體流程圖
現對上述各類分析分別作出解釋。任意分析,就是對案件信息的任意條件進行單一和組合分析[6];特征分析,就是對案件性質以及重點區域和人員進行統計分析;趨勢分析,就是通過多維度統計分析出某時間段(年季月周或特殊節假日,如國慶、春節等)內的案情發展趨勢;原因分析,就是在統計案件發生的直接原因時與歷史重大相似案件產生原因相結合進行綜合分析。
4.2.2 關聯分析
針對案件來講,基本都有作案時間、作案地點、案件性質、受害人群等一系列的要素[7],而且通常情況下在案件情況相同或相似時,差不多就能推測出該案是由同一個人或團伙所致。關聯分析不僅是為了對各種類型案件進行區別劃分,更主要的目的是對多起案件所獲取的現場資料展開分析,由此分析結果便可縮小嫌疑人的范圍,甚至鎖定嫌疑人。
系統首先從數據倉庫中提取出案件信息,通常情況下,關聯案件具有很多相同或相近的屬性,故可將特征相似的案件近似地歸到一組,從而這些案件就能被關聯起來。那么,如何對相似案件進行歸類呢?
對于未曾歸類過的數據集合,通常會采用“聚類”算法。“聚類”算法就是在無需人為參與的情境下,根據一定的規則,對有處理需求的數據集合自動歸類。“聚類”算法能夠對大量文本數據進行處理,并且處理效率較高,故其在案件歸類中有著廣泛的運用。選擇k-means算法作為案件歸類的核心算法,因為其在“聚類”算法中快速高效[8],并且許多編程語言庫都提供了其算法實現。該算法的主要思想是通過判斷兩個空間節點間的距離,距離越近說明兩點具有越高的相似性,然后將距離最相近的節點歸到一起,稱之為“簇”,這樣不同的“簇”就可以等效為一個案件類型。本系統中該算法在案件歸類時有如下實現過程。
1)將案件的屬性如時間、地點、人群等各作為一個坐標維度,各案件作為坐標系中的一點,各點坐標就等效于其代表案件的對應屬性。
2)設定一個k值,在坐標系中任選k個點當作“質點”,將各案件歸并到距離最相近的“質點”集合內。
3)將各集合中最具該集合各點共性的案件重新當作“質點”,由此再次劃分新的案件集合,并再次將各案件坐標點歸并到新劃分的集合內。
4)重復執行第3)步,當劃分的案件集合不再改變時停止,此時,案件的關聯分類便完成了。
4.2.3 挖掘分析
1)描述型挖掘分析
通過對案件單因素分析,能夠大致判斷案情危害程度與定性影響因素之間獨立與否、相關與否。這里我們用到卡方檢驗的方法,該方法是可用于判斷定性變量間是否存在關聯性[9]。模型方程式為

式中,fi是統計樣本的實際觀測值,fe是統計樣本的理論期望值。
在案件單因素分析的基礎上,構造案件危害程度與案件多個相關因素(如年齡、性別、是否獨居、出行記錄、人際關系等)之間的累積邏輯回歸模型,更一步確立定性變量間的函數關系,用來反映變量間的相互影響,計算出危害系數值[10],從而得到相應的分析結論。模型方程式為

式中,β0,j為偏置,βp為權值系數,p為變量數目,P為案件相關因素的危害系數,此值越大,代表危害程度越高。
2)預測型挖掘分析
構造治安情報各項因素的多元線性回歸模型,以此評價案情的發展趨勢,從而能夠依據歷史案件數據對各項指標進行長遠的趨勢預測。線性回歸分析是用來推斷多個變量之間相互依存定量關系的分析方法[11],假定變量Y和變量X1,X2,…,Xp間存在線性關系,那么可寫出多元線性回歸方程式:

式中,β0為常數項,p為變量數目,βj(j=1,2,…,p)為回歸系數,ε為誤差。
構造治安情報各項因素的時間序列自回歸移動平均模型,研究序列值相關關系的統計規律,依據案件歷史數據計算出案情短時間內預測值,從而預測時間序列的短期走勢。時間序列自回歸移動平均模型(ARMA模型),在研究平穩時間序列時有著廣泛運用[12]。ARMA(p,q)模型中,AR意為“自回歸”,MA意為“移動平均”,模型可表示為如下方程式:

式中,p為自回歸項數,φi為自回歸系數,q為移動平均項數,θj為移動平均系數[13]。
4.2.4 可視化分析
所謂可視化就是將上述一系列分析結果通過圖形化界面直觀地展示出來,可以借助JavaScript或Python等編程語言提供的圖形化庫來實現。這樣就能從宏觀上把控社區治安情況的各項指標,比如區域分布、人員分布、發展趨勢等,并且對重點可疑對象、地點可以實現預警通知,從而為社區治安工作的開展帶來了極大的便利。
基于數據分析的治安情報研判系統對于開展社區治安工作提供了極大的幫助,通過對治安情報各項指標的綜合分析研判,能夠在實際治安維穩工作中起到指導和決策的作用,充分體現了“情報主導警務”的思想[14]。在實際應用中還可根據實際情況開展如下的重點分析研判工作。
1)情報特征專項分析
開展案發時間、地點分布特征,人員年齡、職業分布特征,案件原因、性質分布特征等專項分析,能夠根據需要去重點關注某些因素。
2)案件高發因素分析
開展案件高發因素分析,比如案件高頻出現的時間地點以及屢犯人員,以便及時盯防,從而降低風險。
3)案情發展趨勢分析
開展案情發展趨勢分析,可以預測出未來潛在的安全威脅,以便提前采取相應防范措施。
本系統雖然是基于社區數據搭建起來的,但是通過大數據的手段,完全可以將其推廣到地區、城市等更高層次,這樣更有助于實現社會綜合治理和平安城市的目標。
綜上所述,在當前社會治安依舊難以穩定的形勢下,面對潛在的各種安全威脅,社會治安部門對于案情分析研判的精準性和針對性要求日益增加,對于案件數據的挖掘需求也日益急切,因此,本文設計了一套實用的治安情報研判系統,對于發現龐大復雜的案件數據背后潛在的發展規律,以便采取科學的防范措施和有效的決策起到了重大的實際作用。
如今,大數據技術飛速發展,未來社會治安維穩的情報數據量會相當龐大[15],所以治安情報研判系統的功能及性能需求也越來越高,可能還需要多個子系統的相互協助配合,這也是今后新社會形勢下系統需要不斷改進和完善的方向。