999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

刑偵數據倉庫模型設計與數據挖掘技術應用

2014-09-24 06:42:40王云峰寧曉希
軟件工程 2014年6期
關鍵詞:數據挖掘

王云峰 寧曉希

摘 要:針對當前刑偵海量檔案數據信息,首先在分析其數據跨平臺、復雜化和多樣性特點的基礎上,設計了刑偵數據倉庫的概念模型、邏輯模型和物理模型;接著針對刑偵數據倉庫及數據挖掘技術,對已有的刑偵檔案數據進行信息整合和數據挖掘,獲取大量的有用知識,這些知識在促進刑偵研究工作的同時,對一線的實際刑偵工作具有很大的參考價值;最后,文章給出了面向刑偵檔案數據信息的倉庫模型,針對其數據挖掘系統框架提出了相應的數據挖掘方法,為進一步的刑偵數據信息聯機分析處理和有用信息挖掘以及為公安安全防范決策服務。

關鍵詞:刑偵數據倉庫;模型設計;主題事實表;數據挖掘

中圖分類號:TP311.1 文獻標識碼:B

Model Design and Application of Data Mining Based on the Data

Warehouse of Criminal Investigation

WANG Yunfeng1,NING Xiaoxi2

(1.Key Laboratory of Evidence of Science and Technology Research and Application,Institute of Public Security Technology,Gansu Institute of Political Science and Law,Lanzhou 730070,China;

2.Academic Research Division of Gansu Institute of Political Science and Law,Lanzhou 730070,China)

Abstract:Firstly the conceptual model,logic model and physical model of the data warehouse of criminal investigation are analysis and designed by characteristic of the data of criminal investigation;then according to the data warehouse and data mining technology,information integration and data mining on archives of criminal investigation which have been done,and plenty of useful knowledge is obtained,and which might have great value for criminal investigation study and on site work.Last system framework and data mining method based on the data warehouse of criminal investigation have been gave,which beneficial to online analytical processing,useful information mining and public security making.

Keywords:data warehouse of criminal investigation;model design;fact table of theme;data mining

1 引言(Introduction)

目前,隨著社會政治、經濟和科學技術的高速發展,現代犯罪行為表現出了速度化、智能化、高科技化的特點[1],國際上目前狀況的安全信息化技術發展迅猛,公安信息化技術的發展使公安刑偵數據倉庫模型設計成為刑偵數據倉庫研究的核心問題之一,而與數據倉庫技術發展相輔相成的數據挖掘技術,雖然在很多領域的研究取得了進展,但在我國公安刑偵工作的研究中尚處于初級階段[2]。因此,面對我國目前的這種情況,將數據挖掘技術應用于刑偵工作,及時發現新的規則,以提高執法效率與快速反應能力、及時的預防與打擊犯罪行為,成為公安工作中急需解決的問題[3]。但是公安工作具有其自身的規律和特殊性,當前在實際刑偵工作中針對公安刑偵數據倉庫及其數據挖掘算法的應用較少,需要加大對其的研究工作,解決目前面臨的諸多問題。本文首先針對公安刑偵數據信息復雜化多樣性的特點,提出利用當前公安現有計算機信息系統資源及其網絡,形成統一標準,將公安各類檔案數據信息有機結合起來,構建具有統一標準,覆蓋范圍廣泛,信息準確,反應迅速,各部門相互協調運行的跨地區、跨部門的信息交換和共享平臺,形成用于公安刑偵的數據倉庫操作平臺;接著,針對數據挖掘技術在刑偵工作中存在的問題進行了分析研究,并在此基礎上建立一個基于數據挖掘技術的刑偵檔案信息整合及綜合查詢/查證和分析系統,幫助一線民警對跨地區、跨部門的刑偵檔案數據進行檢索和挖掘,從已有的刑偵檔案數據信息中找出相關的犯罪線索及規律,為刑偵檔案數據的信息處理提供科學依據,提高整個公安系統的整體協調能力和工作效率,有利于進一步的刑偵數據信息聯機分析處理和有用信息挖掘以及為公安安全防范決策服務。

2 數據倉庫與數據挖掘有關概念(Relevant concepts

on data warehouse and data mining)

我們知道,數據庫是用于事務處理的,而數據倉庫是由大量的相關數據集成而來的,是用于決策分析的。數據倉庫將大量的數據庫的數據按決策需求進行統一、綜合和重新組織,然后以數據倉庫的形式進行存儲。目前,用于刑偵數據倉庫涉及到的數據量極為龐大,并且根據案件的情節和后果,如何查明案件性質、作案過程以及案件反映當事人和社會等相關更深層次的問題,傳統的數據庫數據建模方法已經顯得過于陳舊,無法適應當前現狀。傳統數據庫那種面向事務型分析處理工作的數據建模方法顯得力不存心,而數據倉庫數據的建模是面向數據分析為決策提供服務的,它包含大量的歷史數據、當前細節數據以及綜合數據,因此,其采用多維數據模型的數據建模方法,完成對數據倉庫中數據的建模和組織。數據挖掘是從大量數據中,根據某種算法及規則,提取出隱藏在數據中的有用及人們感興趣的信息,為人們的正確決策提供服務。用數據庫管理系統來存儲數據,用機器學習方法來分析數據,挖掘大量數據背后的知識,這兩者的結合促成了數據挖掘技術的產生[4,5]。

3 刑偵數據倉庫模型設計(Model design on Data

warehouse of criminal investigation)

3.1 概念模型設計

3.1.1 確定主題域及其內容

面對目前刑偵數據信息的復雜化多樣性,構建刑偵數據倉庫需要對刑偵數據信息特點及對刑偵數據倉庫進行具體的研究和分析,需要首先從目前刑偵檔案數據的實際情況,將其從現場實際進行具體抽象,也就是將現實的決策分析環境抽象成一個概念數據模型的過程分析。然后,將此概念模型邏輯化[6]。通過分析及研究,刑偵數據倉庫中的主題域定義如下,如圖1所示。

圖1 刑偵數據倉庫主題域

Fig.1 Subject fields of data warehouse

(1)人員:指刑偵數據倉庫中所有案件所涉及到的相關人員。

人員主題分析:在此處我們將人員分為數據倉庫的所有全部人員和涉及到違法犯罪的有關人員。

(2)物證:指在現場偵查過程中,能夠在依法情況下搜集到的各種客觀存在的物品或痕跡,其外部特征、物質屬性、所處位置以及狀態能夠證明案件事實情況。

物證主題分析:在偵查破案中,物證起著非常關鍵的作用,對案件的偵破速度、案件性質和相關結果往往能起到決定的作用。以物證為主題,能為查明案件事實提供線索和依據的同時,發現許多相關隱藏的潛在關系,對案件的串并、數據挖掘及刑偵研究提供支持和保障。

(3)案件:指刑偵業務數據庫內所有涉及到的案件。

案件主題分析:案件主題分為未破案件和已破案件兩類,在刑偵工作中案件的偵破是目的,數據倉庫中以案件做主題進行數據組織,便于對案件進行特性分析統計及數據挖掘,可以完成邏輯模型向數據倉庫模型轉化,為數據倉庫概念模型設計、邏輯模型設計和物理模型設計提供了可靠的設計方案。

(4)組織:指刑偵數據倉庫中違反犯罪涉案人員所在的組織。

組織主題分析:組織主題分為團伙犯罪,同監舍關系和社會關系三種類型。組織主題發現許多相關隱藏的潛在關系,有利于案件的串并、數據挖掘及刑偵研究。

(5)地域主題:指有關案件發生的地域。

地域主題分析:地域主題有利于實際工作中犯罪的預防、現有警力的合理配置和領導的安全防范決策。因為不同的地域違法犯罪具有不同的特性,地域主題使地域性、區域性的犯罪特征和犯罪趨勢等相關規則通過數據挖掘得以實現。

3.1.2 確定系統邊界

對于當前刑偵數據倉庫的模型設計,必須根據現實情況,在明確需求分析的情況下,首先要下大工夫實地考察調研等,確切刑偵案件辦案的整個具體流程,通過流程顯示系統所實現的功能,然后確定系統邊界,如圖2所示。

圖2 刑偵案件辦案流程

Fig.2 Criminal investigative processes

其次通過系統需求分析,明確系統相關業務部分的業務流程和功能需求情況,將刑偵案件辦案流程中所需信息資源和整個案件的所有數據信息進行定義,進行數據的抽取、轉換和裝載,通過E-R模型來實現本刑偵數據倉庫的概念模型。數據倉庫為不同的用戶隨時提供各種輔助決策的隨機查詢、綜合數據或趨勢分析等信息,以數據倉庫為基礎,結合聯機分析處理和數據挖掘為不同目的的決策提供支持。綜合刑偵數據倉庫數據的多維特性及聯機分析處理,傳統的數據流圖描述已經不能滿足需要,因此系統采用多維立方體模型來描述[7]。

3.2 邏輯模型設計

對于刑偵數據倉庫的數據信息來說,針對其信息組織特點和概念模型的多維特性,一般采取星型模式來實現刑偵案件數據集市和刑偵案件數據倉庫邏輯模型設計[8],如圖3所示。

圖3 刑偵數據倉庫邏輯模型

Fig.3 Logic model of data warehouse

星型模型是由“事實表”(大表)以及多個“維表”(小表)所組成。在該模式中,中間是事實表,周圍是維表。星型模型邏輯模型設計階段,主要進行的工作是針對刑偵數據倉庫的事實數據進行主題域分析、確定當前要裝載的主題、粒度層次劃分、關系模式、數據分割策略、定義記錄系統等。通過確定決策分析需求,從需求中識別出事實,確定維表等,就可以用包含主題的事實表和多個維表來執行偵查、分析及安全防范等決策支持的相關查詢。具體內容如下:

比如針對報警人、受害人及案件操作等的維表:

報警人信息維:報警人身份證號、報警人姓名、報警人性別、報警人電話號碼、報警人年齡、報警人職業、報警人地址、報警人報警時間等。

受害人信息維:受害人唯一編號、受害人身份證號、受害人姓名、受害人性別、受害人電話號碼、受害人年齡、受害人職業、受害人地址、受害人物品等。

案件操作歷史維:操作權限、系統操作序號、案件編號、操作時間、操作記錄、操作人編號或姓名等。

同理也可描述事實信息維表:

案件基本信息維:案件負責人編號、案件編號、報警人姓名、受害人編號、案件登記時間、案件操作號、案件操作記錄等。

案件流程信息表:案件編號、案件當前狀態、案件操作號、案件操作記錄等。

針對完成的刑偵案件各部分概念結構模塊,需要進一步分析各模塊對刑偵數據倉庫總體框架的匹配及功能服務,符合需求分析后就可以進行數據倉庫的設計及實現,當然,也可以相對獨立的開發其相關獨立的或從屬的數據集市。眾所周知,就當前的絕大多數的刑偵數據倉庫,其數據來源不一而足,有針對一個省或市的信息,也有來自不同的區域或部門的,更有來自不同平臺或不同系統的。因此,要構建數據集市或數據倉庫,首先要對這些數據進行統一的規格化處理,經過統一的格式對數據進行抽取、清洗、轉換及裝載等過程,才能構成數據集市;而相關獨立的或從屬的數據集市的完成,可升級到完整的刑偵數據倉庫。

3.3 物理模型設計

從邏輯模型即星型模型到物理模型設計的轉換完全遵循傳統的數據庫設計方法。針對刑偵數據倉庫的數據,其物理模型設計需要確定一個最適合應用要求的物理結構,即估計存儲容量、確定數據的存儲計劃、確定索引策略、確定數據存放位置及確定存儲分配等。在星型模型中,不管是其綜合事實表還是其維表,一般情況下都是轉變為對應的物理數據庫表進行存儲,但由于刑偵數據倉庫的綜合事實表包含涉案案件的眾多基本信息,其數據量龐大,而其維表雖然包含各方面的具體細節信息(如受害人信息),但其數據量相對來說不是很大,因此在物理模型設計過程中,完成前面描述有關內容外,還需要認真解決多維數據庫管理系統對數據的訪問的效率及靈活程度,所以要用多種數據挖掘方法對數據進行切片、分割、鉆取和旋轉等,以便動態地考察匯總數據和細節數據的關系,為安全防范決策提供技術支持。

目前,高速存儲設備(如硬盤)已成為主要存儲媒介,其存取速度不但與數據存放的位置有關,而且還與存儲設備本身的存取速度有關。因此,對于刑偵數據倉庫中其記錄龐大的事實表,其涉案案件的基本數據信息按其多維性可以考慮分區存放,而反映其細節數據的各種維表,則可以比較集中的存放于相對獨立的某個表空間。一般情況下還必須建立相關表的索引,但索引也是在消耗大量的磁盤空間的基礎上,提高數據的讀取速度,同時,索引也會帶來數據更新速度降低的問題。因此不同系統物理模型設計應根據具體的硬件環境和決策需求合理地進行選擇,在首先要保證數據倉庫穩定性及有效滿足倉庫應用者需求的基礎上,盡量減少有用信息獲取時間,提高數據倉庫的應用效率,為進一步的刑偵數據挖掘或相關決策指揮服務。綜上所述,針對公安數據信息分布性共享的特點,刑偵數據倉庫物理模型一般采取分布存儲方式。

4 刑偵數據倉庫的數據挖掘(Data mining on Data

warehouse of criminal investigation)

對于刑事案件信息數據倉庫的數據挖掘,首先要明確數據挖掘的任務或目的,如要進行數據的分類、聚類、關聯規則發現或序列模式發現等達到什么樣的目的。目前,我們可以分別進行犯罪嫌疑人基本信息、作案規律特點有關信息、損失物品信息、現場痕跡物證信息等的數據挖掘,同時,如果與被盜搶機動車信息和CCIC(中國國家犯罪信息中心)連接的話,將可以進行更深層次的數據挖掘。有了確定的數據挖掘目的,才能針對其挖掘任務有選擇性地決定使用什么樣的挖掘算法才能達到更好的目的。比如對于犯罪嫌疑人信息的數據挖掘,我們可以對數據進行切片、分割、鉆取和旋轉等操作,進行作案規律特點庫和現場痕跡物證庫等的信息分析比對,實施相應的數據挖掘算法,獲取有用的模式,為打擊違反犯罪及公安安全防范提供決策服務。刑偵數據倉庫的數據挖掘方法如圖4所示。

圖4 刑偵數據倉庫的數據挖掘

Fig.4 Data mining on data warehouse

5 結論(Conclusion)

隨著犯罪信息的數字化和網絡化,在現代刑事偵查及公安工作中,利用數據倉庫與數據挖掘技術進行偵查破案,運用系統科學優化數據倉庫以及多層多目標交互式決策建立和優化數據倉庫等,顯得越來越重要;而將數據挖掘技術這門新興科學有效地應用于刑偵工作不但是順應潮流,而且是目前公安工作現實斗爭的迫切需要。在我們實際的刑事偵查工作中,各地區一線的刑偵部門已經積累了大量的刑偵檔案文件,這些數據通過刑偵數據倉庫的模型設計,實施其跨平臺的海量數據的信息整合和數據挖掘,然后就可以獲取大量的有用知識,這些知識不僅對于刑偵研究還是對于一線的刑偵工作,具有非常深刻的科學理論意義和重要的實用價值。本文針對刑偵檔案數據,對刑偵數據倉庫模型設計和數據挖掘進行了初步的探討,同時,面向刑偵數據倉庫,給出了刑偵數據挖掘的系統框架及挖掘方法。我們將針對刑事偵查研究與實際工作中的一些實際問題,在未來的研究中,逐步完善試驗平臺,結合科學技術的發展,嘗試給出不同的解決方案,進一步深入研究相關算法在實際中的應用。

參考文獻(References)

[1] 李小青.論公安刑偵數據倉庫建模[J].廣州市公安管理干部學

院學報,2008,67(1):18-24.

[2] 黃維金,顧益軍.刑偵檔案文本挖掘系統平臺中的文本精煉初

探[J].中國人民公安大學學報(自然科學版),2006,48(2):75-77.

[3] 張輝.數據挖掘技術及其在刑偵工作中的應用[J].信息技術與

信息化開發與應用,2005,4:111-113.

[4] 麥永浩.數據倉庫和數據挖掘方法研究及其在公安信息建設

中的應用[D].華東理工大學博士學位論文.2000:102-105.

[5] 李敬社,張小木,黃澤貴.數據挖掘技術的方法和最新進展[J].

現代電子技術,2004,(6):54-56.

[6] 陳海燕.基于HIS的數據倉庫的建設及數據挖掘[D].2004.6-10.

[7] 金光,等.基于數據挖掘決策樹的犯罪風險預測模型[J].計算

機工程與應用,2003,2:112-114.

[8] 金光,等.數據挖掘技術在犯罪行為分析中的應用[J].寧波大

學學報(理工版),2002,15(3):56-58.

作者簡介:

王云峰(1968-),男,工學博士,副教授.研究領域:公安技

術,模式識別,智能控制,信息安全.

寧曉希(1972-),男,工學碩士,講師.研究領域:網絡安

全,信息安全.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚洲色图欧美| 日日噜噜夜夜狠狠视频| 欧美人与牲动交a欧美精品| 国产91丝袜在线播放动漫 | 亚洲精品视频免费| 国产精品无码久久久久AV| 免费观看欧美性一级| 久久久久久尹人网香蕉| 男女性色大片免费网站| 91精品免费高清在线| 久久久久国产一级毛片高清板| 免费va国产在线观看| 亚洲女同欧美在线| 婷婷伊人五月| 日韩高清欧美| 亚洲第一av网站| 狠狠做深爱婷婷久久一区| 亚洲人成人无码www| 色偷偷一区二区三区| 青青草综合网| 欧美亚洲香蕉| 国产精品第5页| 77777亚洲午夜久久多人| 国产成人麻豆精品| 久久精品嫩草研究院| 91精品国产91久无码网站| 欧美成人在线免费| 欧美日韩另类国产| 免费在线观看av| 亚洲综合香蕉| 午夜视频在线观看区二区| 九九精品在线观看| 亚洲人成色在线观看| 久久免费视频播放| 国产自产视频一区二区三区| 日韩AV无码一区| 91精选国产大片| 在线观看国产精品第一区免费| 精品国产黑色丝袜高跟鞋| 国产在线第二页| a色毛片免费视频| 国产在线无码av完整版在线观看| 91视频99| 亚洲品质国产精品无码| 91无码人妻精品一区| 国产精选自拍| 国产va在线| 欧洲精品视频在线观看| 尤物午夜福利视频| 国产一区二区在线视频观看| 亚洲精品在线91| 日本三级欧美三级| 国产亚洲精品在天天在线麻豆| 无码人妻热线精品视频| 一级看片免费视频| 天堂av综合网| 手机在线免费毛片| 亚洲香蕉在线| 国产欧美中文字幕| 欧美无遮挡国产欧美另类| 欧美在线免费| 日本不卡在线播放| 高潮毛片免费观看| 一本综合久久| 国产无码网站在线观看| 欧美丝袜高跟鞋一区二区| 99免费视频观看| 一级做a爰片久久毛片毛片| 欧美成人A视频| 久久影院一区二区h| 欧美 亚洲 日韩 国产| 97国产在线观看| 亚洲综合狠狠| 久久精品人人做人人综合试看| 国产精品自在自线免费观看| 成色7777精品在线| 亚洲欧美天堂网| 成人午夜视频网站| 99无码熟妇丰满人妻啪啪| 性网站在线观看| 美女无遮挡免费视频网站| 狠狠做深爱婷婷综合一区|