◆王萌萌 高冠東 宋杰 李云航
(中央司法警官學院 河北 071000)
進入新時代,云計算、大數據、人工智能蓬勃興起。經濟社會發展的方方面面都離不開信息化,社區矯正領域也極其重視信息化建設。2019年7月5日,司法部召開全系統網信工作會議,就深入學習貫徹習近平總書記網絡強國戰略思想、建設“數字法治、智慧司法”信息化體系做出了全面部署。會議提出到2019年年底,初步建成“數字法治、智慧司法”信息化體系,形成“大平臺共享、大系統共治、大數據慧治”的信息化新格局
社區矯正人員再犯風險評估是非常具有現實意義的一個課題。從字面上理解,社區矯正人員風險評估(RiskAssessment ofCommunityCorrection)是指相關負責部門對某一矯正人員在社區服刑期間再次實施違法犯罪行為的可能性進行評估,即對其人身危險性的測評。從實際相關經驗來看,風險評估是社區矯正的一項基礎工作。采取科學的評估方法能夠顯著提升矯正方案的針對性,根據需求分析和評估結果及時調整矯正項目的內容,將會切實降低社區矯正人員二次犯罪的風險,對促進我國社區矯正工作的科學發展具有重大意義。
數據繁雜的社區矯正工作是大數據應用的重要領域,從海量的犯罪大數據中挖掘潛在有用的信息,實現數據的深度應用和綜合應用尤為重要。但目前研究存在檔案分級分類機制不足、測評量表存在缺陷等一系列問題。
個人檔案是指對個人的相關情況的記載,起著依據和記錄憑證的作用。而社區矯正檔案則是專門針對社區服刑人員而建立的,主要記載社區服刑人員的生活狀態、平時表現、工作經歷以及社區服刑人員改過自新、重新融入社會的重要人生軌跡等。社區矯正檔案的管理工作是我國司法制度改革工作中的重要組成部分,社區矯正檔案中記載內容的好壞直接說明社區服刑人員的表現是否良好,它關系到社區服刑人員監管措施的采取。
測評量表通過對社區矯正對象的人身危險性和重新犯罪的可能性進行科學的量化,從而準確地分析矯正對象重新犯罪的風險大小,為針對性地實施監督管理和教育矯正、避免矯正對象重新犯罪提供科學的參考依據。量表的設計基本是地方根據當地社區矯正情況各自為政,在測評因子的選取、分值的設定與分數段的劃分上差別較大。上海市率先設計了《社區矯正風險評估測評表》,其中涉及過多的主觀因素和含糊的項目,從而缺乏客觀、統一的標準;北京市研發了《北京市社區服刑人員綜合狀態評估指標體系》,雖然內容完整但專業性太強,導致操作起來困難;江蘇省開發了社區矯正風險評估網絡系統軟件,但矯正工作者在實際運用中仍然憑借自己的主觀認知,根據對服刑人員的印象打分,從而客觀性較弱,難以保證預測結果的準確性,難以實現刑罰個別化。另外,在測評因子的選取上,量表難以把不同權重賦予不同因子。如酗酒和賭博對社區矯正人員再次犯罪都有影響,但影響程度不同,權重系數應體現出差異[1]。
近年來,大數據成為推動商業創新和政府管理變革的新動力。在我國互聯網、金融、健康醫療、生物信息與制藥、城鎮化與智慧城市等多個領域,大數據已經得到了廣泛應用并產生了巨大影響。大數據的5V 特點(IBM 提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。在司法領域的基本應用是指通過計算機、網絡等科技手段采集、儲存、共享、驗證、比對和分析虛擬空間和實體空間當中的數據資源,發現犯罪線索,收集犯罪信息,緝獲犯罪嫌疑人。從海量的犯罪大數據中挖掘潛在有用的信息、知識和見解,實現數據的深度應用和綜合利用。利用大數據分析預測矯正人員犯罪風險率,可大大提高觀察效率。在大數據背景下,關聯各類警務業務信息和開展全國范圍內通用滿足實戰要求的犯罪分析研究,可提高未來社區矯正風險評估工作效率和犯罪預防預測準確度。
在國外的研究中,BlakeByronWalker[2]利用犯罪預測架構體系框架圖形象介紹、總結了預測預警算法,為預警系統建立提供了技術支持;EnriqueGracia[3]著眼于當前中國社會,討論有關利用FSOM 和規則提取的智能決策支持模型預防犯罪,研究了采用人工智能分析數據解決犯罪的應用價值;DaweiWang[4]立足大量時空犯罪數據和有力的在線報告大數據進行分析,跟蹤強度暴力犯罪行為;Jamesonltoole[5]、Nathhaneagle[6]參與英國有關的研究,采用流行病學和心理學等學說進行犯罪分析,有力支撐獄內人員的心理變化研究以及危險程度評估。
國內已有的犯罪預測分析主要在定性研究以及宏觀預測上。例如浙江創新“五大應用”,推進司法行政部門打造“智慧監獄”,開發犯情預測預警預防“平安360”系統,實現犯情分析報告生成周期由原來的10 個工作日縮短至3 分鐘,自動預警準確率達100%。浙江司法系統已實現連續7年監獄安全“四無”目標。鄧洋[7]采用灰色系統理論與預測模型,依據時間數列資料的自身規律對犯罪現象未來發展的趨勢、水平和程度進行一種計量和推測;張海文[8]利用相關的犯罪理論解釋犯罪發生的內因和外因,并基于GIS 犯罪分析技術方面的研究資料研究國外優秀軟件的應用方向;李凌[9]將粗糙集邊界和離群點檢測方法結合在一起,充分發揮這兩類方法的特點,提出了一種基于邊界和距離的離群點檢測方法;張春明[10]利用大數據分析技術將社區矯正人員的自建動態因素量表和靜態因素量表相結合,通過實驗測量法進行權重賦值,并應用統計方法對量表進行信度和效度檢驗。隨著社區矯正業務信息管理系統的不斷完善,關于服刑人員的歷史數據量也越來越大。系統通過設定社區矯正人員的服刑表現、犯罪史、犯罪嚴重程度等與服刑人員危險性有關的數據,使通過大數據分析、云計算等方式較為準確判斷社區矯正人員的危險性成為可能。
大數據技術的運用方式一般有三種:一是數據檢索;二是數據比對;三是數據挖掘。獲取司法系統的犯罪數據,然后在Linux 系統上采用Hadoop 搭建云計算平臺,并使用HIVE 結合MySQL 數據庫錄入司法大數據,對其進行整合與分析,從中提取與社區矯正人員危險性有關的數據,具體包括社區矯正人員之前的犯罪時間、地點,犯罪行為動機與社區矯正期間的行為狀況和心理狀態。推進司法系統使用危險性分析系統,可提供對實時社區矯正人員的危險性評估數據。對評估數據進一步進行挖掘與分類,也有利于其結合GIS 技術對系統進行優化升級。
數據挖掘(DataMining)是從眾多數據中挖掘出知識,其最主要目的是確定數據的趨勢和模式。將數據挖掘技術引入社區矯正分析中,運用空間關聯規則等數據挖掘技術,對現有的社區矯正人員評估數據進行挖掘,接下來運用關聯規則以及空間關聯規則的數據挖掘技術對海量的社區矯正人員數據進行分類挖掘,為建立模型提供數據基礎。[11]從統計的角度看,數據挖掘可以看作是用計算機技術自動探索分析大量的數據集。與以往的數據分析方法(例如數據查詢、數據報表、聯機應用分析等)進行比較,數據挖掘的優勢在于結果未知的情況下,嘗試對復雜多樣的社區矯正數據進行分類分析[12]。
以矯正人員為中心,采取一系列步驟,從存儲大量要素信息的社區矯正人員數據庫中挖掘出有實際效果、先前未知、可以使用的知識,然后運用這些挖掘出來的數據做出合理決策[13]。針對社會及司法系統收集的數據,應用基于圖的數據挖掘算法[14](即基于相同犯罪特征頻繁子圖結構的挖掘犯罪規律算法GDMCR)對高危人群案發、高發地點、犯罪網絡標志成員等規律性和特征進行分析。
在現有的警務系統基礎之上,利用GIS 空間分析法(Delaunay三角網,ZDW 插值),GIS 地圖顯示機制以及空間分析技術,建成網絡化分布和聯網運行的社區矯正分析系統。綜合考慮犯罪心理學警察辦案條件,對社區矯正區域實施精確監控。利用犯罪信息進行分析,通過時空序列分析法預測社區矯正人員的危險程度,對連環犯罪及其他類型的犯罪的預測運用時空序列模型