曹 霽
(南京森林警察學院基礎部,江蘇 南京 210023)
2014年,Ratcliffe將預測警務定義如下:“利用歷史數據建立犯罪活動或犯罪熱點地區的時空預測模型,以此作為警力資源分配的基礎,并期望在預測的地點和時間區間內部署相應的警力資源來阻止或預防犯罪活動。”[1]
時間序列分析是概率統計學科中應用性較強的分支,廣泛應用于金融經濟、氣象水文、信號處理、機械振動等實際問題中,是一個具有相當高的實際價值的應用研究領域。所謂的時間序列,指的是同一種現象在不同時間上的相繼觀察值排列而成的一組數字序列。觀察這組時間序列在過去的變化規律,推斷其以后可能的變化趨勢,從而對該現象的未來進行預測,就是時間序列預測法。
隨著大數據時代的到來,全國各級公安系統都已建立較為完備的犯罪事件數據庫,各類犯罪事件的發生情況和相關信息都記錄在內,但目前關于這些數據的處理更多的集中在簡單的查詢、統計和簡單的分析。如何利用這些已有的數據,采用更加精確的處理手段,充分利用有限的警力資源,提高出警效率、精準打擊犯罪行為,更好地保護人民群眾的生命財產安全,是非常有必要來進行研究的。
時間序列分析能夠充分利用原時間序列的各項數據,運算速度快,對模型參數有動態確定的能力,是一種非常好的短期預測方法。利用時間序列模型來進行犯罪預測是我國公安情報工作的重要工作之一。目前知網上相關的主要文獻有:2013年屈茂輝、郝士銘作出了1986—2010年全國財產類犯罪人數變遷的時間序列,建立了ARMA(1,10)擬合預測模型,預測了2011年我國財產類犯罪人數[2];2015年陳鵬、趙鵬凱、瞿珂針對廊坊地區的110警情數據,采用ARIMA模型和指數平滑模型進行了數據分析預測[3]。2016年陳鵬、黃鴻志、胡嘯峰、丁寧對2012年北京市入室盜竊類警情的天時間序列進行實證分析,得出了案發量與當日溫度之間的關系[4]。韓一士、范英盛、李國軍、鄭滋椀利用ARIMA模型給出了浙江省衢州市通訊網絡詐騙犯罪的發案模型[5]。侯苗苗、胡嘯峰基于2005年12月—2013年12月我國某北方大型城市的一般傷害、搶奪和搶劫三類犯罪案件數量建立了SARIMA時間序列預測模型[6]。
近年來詐騙案件頻發,影響極其惡劣,手段花樣百出。8· 19徐某玉電信詐騙案,使準大學生徐某玉遭受電信詐騙導致身亡;阿里巴巴女員工遭遇殺豬盤,被初中文化水平男子騙500多萬;南京爆出老同學利用消色筆寫借條給老同學涉嫌詐騙案;還有大量的“公檢法”詐騙案、支付寶詐騙案等等。不同于人們印象中的受教育水平低的人容易被騙,涉世未深的“乖乖女”“大學生”,對世界有著美好的向往,警惕性低,容易相信人,是詐騙犯的“新寵”。然而由于各種各樣無奈的原因,大多數人只能無奈接受損失很難追回的事實。2021年4月,習近平總書記對打擊治理電信網絡詐騙犯罪工作作出重要指示,為做好當前和今后一個時期的打擊治理工作指明了前進方向、提供了根本遵循。2021年6月17日,公安部召開新聞發布會,推出了國家反詐中心APP,為人民群眾構筑一道防詐反詐的“防火墻”。目前百度百科介紹國家反詐中心APP的全國注冊用戶已超過6500萬,已向用戶發送預警2300萬次,接受群眾舉報涉詐線索65萬條,在防范詐騙工作中發揮了重要作用。江蘇省泰州市公安局姜堰分局完善電信網絡犯罪‘打防阻’一體化機制;無錫公安以雷厲風行領跑“平安賽道”,守護萬家燈火;吉林九臺農商銀行把反電信詐騙工作作為全年重點工作來抓,全市公安機關展開“凈網2021”專項行動;深圳掀起了一場聲勢浩大的反詐攻堅行動,在打擊、預警、止付、斷卡、宣防、聯動六條戰線同步發力、齊頭并進。打擊整治詐騙違法犯罪正在成為公安機關越來越重要的一項工作。
然而,詐騙案件類型繁多,手段豐富,“反詐”工作依舊任重道遠。知網檢索上關于詐騙案件的相關文獻有:2021年9月10日北京大學博雅講席教授、博士生導師陳興良認為套路貸是以詐騙罪為核心的一個犯罪群組,以民間借貸為名,采用詐騙方法設立虛假債權是套路貸的主罪。在虛假債權實現過程中,采用侵害人身或者擾亂秩序的方法,可能觸犯非法拘禁罪、非法侵入住宅罪、強迫交易罪、虛假訴訟罪、尋釁滋事罪等多種罪名[7]。同在2021年9月10日,清華大學法學院的李淼博士在《人工智能時代新型支付方式與詐騙罪處分意識》[8]中指出隨著新型支付方式的涌現,詐騙罪的發生領域逐漸由線下轉為線上,這樣的變化不僅給詐騙學的教義學建構帶來沖擊,也給具體案例的適用帶來了新問題。2021年9月7日中國人民大學刑事法律科學研究中心的謝望原教授在文獻中對冒用他人身份信息套取網絡金融機構貸款(信貸消費)的行為的界定提出了意見[9]。
接下來我們將時間序列分析中的ARIMA模型,在往年歷史數據的基礎上,對未來幾年公安機關受理詐騙案件數進行預測分析。


在中國第三產業統計年鑒上我們可以查到2006—2019年公安機關受理詐騙案件數如表1所示。

表1 2006—2019年公安機關受理詐騙案件數
我們將在這些已有數據的基礎上,構建ARIMA模型,并對2020—2024年的公安機關受理故意傷害案件數進行預測。
模型構建的基本方法可參考本人另一篇文章《基于ARMA模型的故意傷害案件預測模型研究》。下面將模型構建簡要敘述如下。



b=diff(a);
n=length(b);
m=armax(b,[2,0])
即得到模型

隨后利用forecast程序:
ythat=forecast(m,b,5);
xthat=a(end)+cumsum(ythat)
預測2020—2024年的公安機關受理詐騙案件數如表2所示。

表2 模型預測結論
時間序列分析預測方法在犯罪數據預測方面具有較大的優勢。一是此類預測方法只考慮前面幾年該犯罪數據的歷史數據,不考慮其他方面例如民生、經濟等等其他可能相關的數據,在整個的模型構建方面思路非常清晰,避免了繁雜的數據搜集、處理,也避免了此過程中可能出現的錯誤和誤差;二是時間序列分析在充分利用歷史數據的基礎上,簡單、快速地預測在未來較短時間內數據的變化趨勢,預測精度高,便于掌握,我們在預測過程中使用的是公開的、全國性的數據,但相關工作人員帶入具體的基層數據后模型依然可以處理,這說明該類數據處理方法具有非常廣泛的應用領域。
利用時間序列分析模型,在現有近幾年案件數的基礎上,建立和優化數學模型來預測未來幾年公安機關受理案件數,從而協助公安機關制定更加有效的犯罪防范對策,具有非常重要的意義。