孫 暢 翟一鳴 丁 寧 陳 鵬
(中國人民公安大學 北京 102600)
在我國刑事案件中侵財類案件最為高發,盜竊案件在其中占80%以上。入室盜竊是盜竊犯罪中較為多發的一類,由于其具有發案頻率高、區域廣泛、易形成系列案件的特點,對社會治安秩序形成了危害并一定程度上導致了人民群眾安全感的缺失[1]。因此,公安機關急需掌握入室盜竊犯罪案件在時間和空間分布上的特點以便采取恰當手段,進行有效防控和堅決打擊。
國內外現有的許多研究表明,犯罪行為在時空維度內并非完全均勻分布,而是會存在某些“犯罪熱點”[2],即犯罪行為表現出較為明顯的時空聚集性。不同類型的犯罪發生時間在季度、月份、一天內[3]都可能會呈現一定的規律性。同時研究也發現,犯罪活動不僅時間特征明顯,而且在空間分布上也有著明顯的分布差異性[4]。入室盜竊犯罪的時空聚集特征表現為臨近重復現象[5],即某地案發后,短期內犯罪分子在同一地點或者是周邊區域再次作案的可能性極高。國內外均有研究表明在首次入室盜竊案發后的一段時間、一段距離內,該類犯罪風險會有明顯提高,時間—空間參數和風險概率與研究區域人口、居住特點、社會治安狀況等多方面因素有關[6]。
本文對B市2012-2014年間入室盜竊案件的報警統計數據進行分析,試圖分析出入室盜竊案件在時間、空間上的分布規律和時空交互的關聯性,探測時空熱點并結合自然因素和社會因素對發案量進行預測。發現的時空熱點和聚集風險對于公安機關在警力配置、資源優化、有效打擊和預防此類犯罪工作有著積極的意義。
(一)研究對象及數據來源。本文研究的空間范圍為B市的16個區,其中i、l、e、o、m、d并稱“城六區”。使用的數據來自B市公安局110接警和警務地理信息系統數據庫,為B市入室盜竊案件報警數據。數據內容包含有案發的詳細時間、地點、簡要案情等。日期從2012年1月1日至2014年12月31日。預測部分用到的節假日日期、氣候數據、公安機關專項行動日期等均為官方公布的公開信息。
(二)數據處理與研究方法。本文在時空分析部分將統計分析與調查研究的方法相結合,利用Excel、SPSS等工具通過描述性統計、卡方檢驗等方法,以探究時間分布特征。空間分析時借助百度API將地址以百度坐標形式體現,再通過轉化得到平面坐標,通過SPSS、ArcGIS等工具軟件,運用核密度估計法等方法對空間上分布規律進行比較分析,制成熱力圖。運用臨近重復計算器分析犯罪的臨近重復現象形成風險密度表。對犯罪量的預測采用了Fbprophet與線性回歸相結合的方法。
(一)入室盜竊案件時間變化特征。為科學地驗證入室盜竊案件在時間維度上分布特性,本文將案發數量分別以季節、月份、星期、日期和小時為單位進行統計并做卡方檢驗,結果顯示均存在較為顯著的差異性。
1.季節與月份分布。入室盜竊案件在月份的分布上表現出了較為明顯的季節性特征,春季(3-5月)和夏季(6-8月)的案發數量明顯多于秋(9-11月)冬(1-2月與12月)兩季,分別占全年的28%和29%,冬季案發量最少僅占20%。
在比較各月份的案發量時,為消除由于每月天數不同帶來的影響,采用了日均案發量數據替代總案發量。如圖1所示,日均案發量從3月開始逐漸上升,4-8月均處于相對較高的水平,而后總體趨勢表現為下降。此外,2014年6-7月發案量明顯較低是由于B市公安機關此時正在開展“3號行動”,集中打擊入室盜竊犯罪所致[7]。

圖1 各月案發量變化情況(日均)
2.日期與星期分布。每月中旬是發案量較高的時段,9-21日間發案量普遍高于平均水平,22-31日發案量較低,同時發現每月1、5、10、15、20日會出現發案量的小高峰,且該規律在3年中普遍存在。分析案發時間在周內的分布情況,星期一至星期五的案發量相對穩定,周末的發量明顯低于工作日。
3.每日時刻分布。根據人們日常活動規律可將一天分為:凌晨(0-7時)、早高峰(7-9時)、上午(9-12時)、午休(12-14時)、下午(14-17時)、晚高峰(17-19時)、晚上(19-24時)七個時段,圖2為各個時間段的案發總量以及每小時案發量。晚上和凌晨的案發總量更大,但早高峰時刻發案更加集中。

圖2 各時段案發總量和每小時平均案發量
以小時為基本單位分析發現,一天內案發量有兩個峰值分別出現在0-1時與8-9時,以凌晨尤為明顯。每日7時-12時,22時-次日4時是入室盜竊案件相對高發期,5-6時是低谷期,11時至22時的案發量也基本保持在較低水平。
數據處理中發現0-1時發案量遠遠高于平均水平。經過調研得知,在凌晨發案時間模糊不清且無從查證的情況下,可能會用系統默認錄入為當日0時,但此類案件發案時間仍處于凌晨時段,故總體趨勢不受影響。
(二)入室盜竊案件空間分布特征。
1.行政區域分布特征。將B市按照城六區與其他區域進行劃分,城六區面積僅占B市總面積的8.3%,但近60%的入室盜竊犯罪發生在該區域,說明入室盜竊在空間上分布并不均勻。將三年的案件數量以區為單位分別統計,并分級顯示,結果如圖3。顏色越深表示發生在該區域的案件數量越多。結合數據發現,高發案量以o、m、e三區尤為明顯,均超過8000起;城六區外圍的b、f、j、k、n五個區域發案量3000起以上。

圖3 2012-2014年北京市各區入室盜竊案件發案數量評級(5級)
2.核密度分布特征。核密度估計法是非參數檢驗方法的一種,將每一個事件作為一個核,然后將核函數設置在核的空間位置上,每個事件核通過核函數對周圍區域進行影響,事件最終的密度分布就是把所有事件的核密度函數疊加起來[8]。對于空間區域內犯罪點x1,x2,…xn中任意一點xk,其相鄰區域內其他點xi對其貢獻程度與xk到xi之間的距離相關[9]。f( )
y表示核函數的概率密度,n為事件數,k表示核函數,h表示核函數的帶寬,則xk案件點的概率密度可以被估計為[10]:

通過核密度估計法分別計算2012-2014各年度及各年內所有入室盜竊案件在空間上的密度分布,如圖4所示。從B市各年入室盜竊案發聚集區域地理位置上來看,各區均有面積不等的聚集區域,以中心城區聚集性最為明顯,城鄉結合部次之。比較各年度的核密度分布圖發現,聚集性高發區域在總體相對穩定,沒有明顯的增加、消失或轉移。從功能性角度分析,入室盜竊案發地主要集中于人員密集的大型社區、專業商業辦公用樓、主要交通樞紐附近、大學城等區域。

圖4 核密度分布圖
(三)入室盜竊案件近重復現象與風險密度。近重復現象是指一起案件發生后,在相隔較短的時間內,相臨近的地區再次遭受該類犯罪的可能性會明顯升高,是一種犯罪行為在時空維度內交互影響的現象[11]。本文使用臨近重復計算器通過蒙特卡洛模擬的方法判斷入室盜竊是否存在顯著的時空關聯性,得到入室盜竊概率風險密度表(表2)。

表2 B市入室盜竊風險密度表
通過多次參數測試,最終選擇關聯效果更好的1天和100米分別作為時間和空間間隔,設定p=0.001,即在此參數下進行999次時間重新賦值實驗,得出風險密度表(如表2,截取前15天)。表中數值表示在該時間—空間范圍內實際發生的案件數量與1000次(999次蒙特卡洛模擬數據和1次真實數據)案件數量的期望值大小的比值,數字越高,觀察到的數據與預期數量之間的差異就越大[12]。表中數值“3.00”表示在一次入室盜竊發生后,在第二天距離該案發地點100米范圍內再次發生該類案件的概率比零假設(完全隨機分布)情況下發生案件概率高200%。
結果表明,最明顯的時空范圍影響體現在首次入室盜竊事件發生的0-1天100米范圍內,與零假設模式相比,再次發生該類案件的概率高出約699%。當取p≥0.05時,則有:在距離首次案發地101-200米范圍內,高案發風險可能持續6天;在301-400米范圍內,5天內均有較高案發風險;在601-700米范圍內,3天內案發風險較高;在首次案發地的1-100米、201-300米、401-500米、501-600米范圍高案發風險可能持續2天等結論。
(一)Fbprophet預測。Fbprophet算法基于時間序列分解和機器學習的擬合,在時間序列分解的基礎上進行了改進和優化,納入了節假日對犯罪的影響,擬合方式有加法模型和乘法模型兩種[13]。乘法的形式可以通過取對數再進行時間序列的分解方式獲得。g(t)表示趨勢項,s(t)表示周期項,h(t)表示節假日項,?t表示誤差項(剩余項),時間序列y(t)表示為[14]:

本文采用的訓練集為2012-2013年的犯罪數據,根據國務院辦公廳每年發布的放假安排對模型進行優化,分別運用加法模型和乘法模型進行預測。預測集為2014年犯罪數據,輸出結果為每日案發數量,模型最終預測的準確率以全年每日預測準確率的均值計。每日準確率計算方式為:

最終加法模型預測準確率為74.84%,乘法模型預測準確率為75.40%,從結果看乘法模型具有更好的預測效果。
(二)二次回歸預測。將上述乘法模型的結果進行線性回歸分析,在模型中另引入自然和社會等因素,如表3所示。最終預測的準確率提升為79.26%。
以顯著性角度分析各項影響因素,Prophet預測結果和世界杯賽事的影響顯著。自然環境因素影響不顯著,可能與溫度和是否降雨存在一定關聯。比較各因素影響力大小,自然天氣中雨雪天氣對案件數量的影響相對較大;社會因素中世界杯影響明顯,開展公安專項行動也有利于該類案件數量的減少。

表3 自然和社會因素對入室盜竊案發數量的影響情況
本文基于110平臺的報警數據,對B市2012-2014年入室盜竊案件的時空分布特征進行了實證研究,歸納總結了B市高發時間規律以及空間熱點分布情況,并通過Fbprophet與線性回歸相結合的方法和對犯罪量進行預測。得出以下主要結論:
1.從時間分布看,當分別以季節、月份、星期、日期、小時為單位進行統計時均表現出明顯的差異性。具體表現為:發案量在春夏兩季高于秋冬,4~8月期間呈現持續高發態勢;在一個月內,9~21日間發案量普遍高于平均水平,22~31日發案量較低;在一周中,周末的案發量更低,工作日間案發量沒有明顯差距;在一天內,早高峰時段(7~9時)發案密度最高,每日7時~12時,22時-次日4時入室盜竊案件相對高發,0~1時與8~9時發案量呈現兩個峰值。
2.空間的分布規律體現在o、e、m是B市發案量最多的三個區域,包括其在內的城六區案發量約占60%。三年內犯罪熱點區域基本保持固定,人員密集場所案發的聚集性更強,如城鄉結合部、大型社區、專業商業辦公用樓、主要交通樞紐附近、大學城等區域。
3.有證據表明(p≥0.05)B市入室盜竊案件存在較為明顯的臨近重復現象,具體表現為:在首次入室盜竊案件發生后的7天內,同一案發地點均有較高的再次案發風險;在首次案發的2天內,案發地周圍900米范圍內均為高風險;在首次案發的5天內,案發地周圍700米范圍再次發生案件的風險增加等。
4.通過Fbprophet與線性回歸相結合的方法可以對入室盜竊犯罪進行時序預測,有良好的效果。加入了節假日影響后的Fbprophet乘法模型對此類犯罪預測效果稍優于加法模型。在乘法模型基礎上加入自然因素和社會因素的影響可以提高預測的準確率。公安機關可以運用這種方法,結合節假日等特殊時間節點和自然、社會等多方面因素,對未來一段時間內入室盜竊犯罪趨勢進行預測。對結果顯示可能高發的時間節點,通過加強警力部署、開展社會治安綜合治理和專項行動等方式對入室盜竊犯罪進行有效的防控,預測結果對公安機關的重點警務工作內容制定具有一定指導意義。
同時,由于入室盜竊案件報案的滯后性引起的案發時間無法確定等客觀原因,存在部分時間數據不準確的情況,可能產生一定誤差。下一步可以通過實地走訪和調研的方式對本文發現的入室盜竊犯罪時空特點和聚集性進行驗證,并結合環境犯罪學等理論對此現象的成因進行深入探討。