


摘要:隨著社會的發展,信息技術的進步,與大數據技術的廣泛應用,公安系統的信息化建設也得到了長足的發展,從各類案件卷宗信息、身份證信息、戶口信息、交通信息、住宿信息、通信信息、天網數據監控數據等各類信息的電子化,為我們從這些海量數據中分析出某類案件產生的各種背景因素、各類因素之間的關聯關系,提供了數據基礎。而通過分析這些關聯關系,能夠為特定案件的偵破,提供方向指導的數據支持。
關鍵詞:JavaEE;apriori
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2020)27-0097-03
開放科學(資源服務)標識碼(OSID):
1 背景
利用大數據技術,開展公安情報分析,如今已經成為公安系統信息化建設的核心。根據統計年鑒分享平臺的數據分析,從2016年到2017年公安機關刑事案件立案數據如下:2016年,公安機關刑事立案總數為642.75萬起,其中盜竊案430.43萬起,占比66.97%;2017年公安機關刑事案件立案總數548.26萬起,其中盜竊案345.97萬起,占比63.1%。2016年盜竊案中人室盜竊立案1184052起,占比18.42%;盜竊機動車立案435221起,占比6.77%。如此之多的盜竊案,其中大部分都不能破案,因此,本系統試著通過運用APRIORI算法,來分析盜竊案中各類字段之間的關聯性,為案件的偵破提供數據支持。
2 技術介紹
2.1 關聯規則
關聯規則是形如X—Y的蘊涵表達式,在數據庫表中,可以將X與Y看成表中的字段,通過迭代算法,分析出各個字段出現的次數,然后根據貝葉斯算法,計算字段值出現的關聯性概率,關聯規則的強度可以用它的支持度(support)和置信度(con-fidence)來度量,Support(支持度):表示同時包含A和B的事務占所有事務的比例。如果用P(A)表示使用A事務的比例,那么Support=P(A&B)。Confidence(可信度):表示使用包含A的事務中同時包含B事務的比例,即同時包含A和B的事務占包含A事務的比例。公式表達:Confidence=P(A&B)/P(A),通過合理設置置信度,能為公安破案提供偵破方向的數據支持。
2.2 JavaEE技術
為便于民警進行數據的實時查詢,本系統通過B/S架構的JavaEE技術來實現,JavaEE是一個開發分布式企業級應用的規范和標準。通過JDBC技術實現平臺無關的與各類數據庫的連接,通過STRUTS技術實現前端頁面與后臺技術的分離。
3 數據字段設計
根據盜竊案結案錄入的內容,審訊內容,破案經過,本系統著重分析盜竊案的如下字段數據,盜竊物品:分類為A1現金,A2手機,A3貴重物品,A4家電,A5古董字畫,A6含重大價值的文件(科技類,遺囑)。同理方式處理作案手段(Bl撬鎖,B2翻窗,B3冒充戶主開鎖,B4未關門,B5自己家),地點(C1小區,C2普通民房,C3出租屋,C4店鋪),對象(D1獨居老人,D2單身女性,D3單身職員,D4家人外出的空屋),動機(El購買毒品,E2賭博,E3補貼家用,E4獲取重大遺產,E5售賣獲利,E6還債,E7其他),團伙人數(2人團伙,3人團伙,4人團伙,其他),聯系方式(G1手機聯系,G2 QQ聯系,G3微信聯系,G4其他),案發前后去向(H1回住所,H2網吧,H3賓館,H4麻將館,H5 KTV),是否前科(I1是,12不是),時間(J1受害人上班,J2受害人睡著,J3受害者外出)學歷(KI小學,K2初中,K3高中,K4中專,K5大專,K6本科,K7碩士,K8博士),作案者年齡(11 15-20.L221-25,L326-35.L4 36-45 L5 46-50)踩點時間(M1案發前一周內,M2,案發前一個月,M3案發前很久)。作案者職業(N1學生,N2無業人員,N3臨時工,N4薪水<3000,N5薪水<5000,N6個體戶)
具體數據如表1:
4 主要功能模塊
案件統計分析:通過當前報案信息,選擇某個報案進行數據分析。
關聯字段的篩選:根據案件已有的線索,選擇數據分析的字段內容。
可信度與置信度的設置:根據同類案件的數量,設置可信度與置信度。
關聯規則顯示:顯示關聯分析結果數據。
5 案件統計分析
進入情報分析系統,首先根據不同查詢條件查詢報案案件類別,效果如下:
通過struts配置文件:
if (session.getAttribute(" daoqielist")!="nully*將統計查詢數據,放到session中的daoqieList中,如果有刪除舊的。*/
session. removeAttribute("daoqieList"); session. setAttribute(”daoqieList",tj DAO.query2(tj Form》;
public List query2( tongjiForm tjForm)(
List daoqieList= new ArrayList0;
String sql= "select 8from tongji where”;
if(! tj Form.getAO.equals(”0"》
sql =sql+ "and A=”+”¨+tj Form.getAO+”¨;
if(! tj Form.getB O.equals(" 0"》
sql=sql+”and B=”+”¨+tj Form.getB0+”¨;
……….‘
ResultSet rs= conn.executeQuery(sql2);
try{
while (rs.next0){
tjForm= new tongjiForm0;
tjForm.setIDcard (rs.getString(l》;
tjForm.setA(rs.getString(2》;
tj Form.setB (rs.getString(3》;
……..
daoqieList.add(tjForm);
)
…...
return daoqieList;
7 可信度與置信度的設置
通過點擊統計分析:進行字段篩選與置信度,支持度的選擇。
List tjlist = (List) session.getAttribute("daoqieList");
ArrayLisKString> dataList = new ArrayList ();
for (int i = 0; i < tjlist.size(); i++) {
tjForm = (tongjiForm) tjlist.get(i);
for(int j=O;j
if (str_cond[j].equals("A "》
condition = tjForm.getAO + ";";
if (str_cond[jl.equals("B "》
condition = condition + tjForm.getBO + ";";
dataList.add(condition);
//關聯分析代碼
Map relationRulesMap = apriori2.getRela-tionRules(frequentSetMap);
SeKString> rrKeySet = relationRulesMap.keySet0;
for (String rrKey : rrKeySet) {
String s = rrKey;
System.out.println(s.replaceAII(";", " ") + " : '1 +“概率為 :"+ relationRulesMap.get(rrKey》;
}
9 結束語
本系統通過分析盜竊案的各類字段之間的關聯關系,在收到的報案信息中,根據已有的線索信息,可以設置字段篩選內容,從而分析出個字段之間的出現概率,為案件的偵破提供方向指導。
參考文獻:
[1]陳鵬,瞿珂,胡嘯峰.犯罪情報分析中的數據挖掘應用[J].計算機系統應用,2017,26(2): 249-253.
[2]李樂亮,李桂峰.論盜竊案件的特點及偵查方法[J].市場周刊(理論研究),2008(12): 92,115-116.
[3]劉智明,廖藝.入室盜竊案外圍現場勘查的幾點啟示[J].法制博覽,2017(5): 152.
[4]梁凡,趙麗.基于中智模糊關聯規則生成的大數據挖掘分析算法[J].計算機應用與軟件,2019,36(10): 285-292,298.
[5]雷宇.面向大數據的高維數據挖掘技術研究[J].企業科技與發展,2019(7): 166-167.
[6]羅樂,葛啟東,周永學.基于Apriori算法的裝備數據關聯規則挖掘[J].指揮控制與仿真,2020,4(10):2.
[7]王彬.盜竊案件偵查的數據碰撞問題研究[J].遼寧警察學院學報,2019,21(5): 34-40.
【通聯編輯:謝媛媛】
作者簡介:徐雪飛(1977-),男,江西南昌人,講師,碩士,主要研究方向為軟件工程。