摘 要:本文從業(yè)務實戰(zhàn)角度探討了數(shù)據(jù)在檢察案件中的應用,描述了數(shù)據(jù)在檢察系統(tǒng)電子取證應用的現(xiàn)狀及存在的局限性,探討了多數(shù)據(jù)分析在案件中可能的應用及多數(shù)據(jù)分析軟件現(xiàn)階段的狀態(tài)和存在的技術難點,最后肯定了多數(shù)據(jù)分析是大數(shù)據(jù)時代來臨的前奏。
關鍵詞:檢察;電子取證;數(shù)據(jù)分析;可視化分析
過去,一旦數(shù)據(jù)的基本用途實現(xiàn)了,我們便認為數(shù)據(jù)已經(jīng)達到了它的目的,準備將其刪除,讓他就此消失。畢竟,數(shù)據(jù)的首要價值已經(jīng)得以提取。而在大數(shù)據(jù)時代,數(shù)據(jù)就像一個神奇的鉆石礦,在其首要價值被發(fā)掘之后仍能不斷產(chǎn)生價值。數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。①到2013年,世界上存儲的數(shù)據(jù)預計能達到約1.2澤字節(jié),我們從未像今天一樣產(chǎn)生如此海量的數(shù)據(jù)。②在證據(jù)電子化的大趨勢下,數(shù)據(jù)在案件中的作用越來越重要。在檢察案件中利用電信公司用于計費的話單進行分析,查詢嫌疑人的生活習慣和人脈關系就是數(shù)據(jù)再利用最好的例證。
一、現(xiàn)狀
計算機和網(wǎng)絡技術的飛速發(fā)展和使用成本的降低,使計算機和網(wǎng)絡進行信息溝通已成為社會生活不可缺少的一部分。手機、計算機、平板電腦、電話、各種數(shù)碼產(chǎn)品等通信終端的多樣化,以及論壇、微博、電子郵件、即時消息等多種通信產(chǎn)品的涌現(xiàn),每個行為主體之間的通信方式、媒介多種多樣,造成行為主體的通信行為軌跡分散,信息以片段的形式存在,向電子數(shù)據(jù)取證提出了更大的挑戰(zhàn)。現(xiàn)有的單一電子數(shù)據(jù)取證模式,很難有效地實現(xiàn)信息全面整合、深度綜合分析、關聯(lián)線索碰撞并形成有價值的分析結(jié)論,而這些以片段形式存在的信息都是案件信息、案件線索及案件突破的寶庫,如何有效使用這些信息已經(jīng)是擺在我們面前的一個重要問題。
公安系統(tǒng)在信息化一期建設中已經(jīng)圍繞“還原真實,證明已經(jīng)發(fā)生過的原始狀態(tài)”建立了多種數(shù)據(jù)庫,并在案件中屢立奇功。2013年底最高檢建立了大數(shù)據(jù)分析平臺,并在多個單位設有接入點。2014年9月,某省檢察院在職務犯罪偵查過程中,引入了大數(shù)據(jù)分析軟件,可以在短時間內(nèi)將犯罪嫌疑人基本情況、關聯(lián)線索信息、行蹤軌跡、人際關系網(wǎng)絡等情況清晰分析展示,大力提升了辦案效率與效果。③
某省檢察院自2007年建立電子取證實驗室以來,省內(nèi)絕大部分地市建立了電子取證實驗室、大部門縣區(qū)購買了手機取證、現(xiàn)場勘查箱、話單分析軟件等前端采集分析設備。省檢察院技術處及各地市檢察院技術截止2014年已持續(xù)建設7年,協(xié)助辦理了大量的電子取證案件(含提供案件線索)。這些案件中獲取的大量數(shù)據(jù)在實現(xiàn)其初步價值后就被刪除或丟棄,喪失了產(chǎn)生二次、三次價值的機會,丟掉了一個本來應該擁有的信息查詢和案件線索深入再挖掘的機會(公安系統(tǒng)在各個派出所布置有采集點在大量的采集所有涉案或可能涉案人員的信息建立數(shù)據(jù)庫)。
二、應用
其實,這些數(shù)據(jù)一直案件辦理過程中為我們不斷的創(chuàng)造著價值,如:通過電子取證設備固定嫌疑人的證據(jù),通過話單分析軟件分析犯罪嫌疑人的生活習慣、活動規(guī)律、潛藏地點,通過銀行查賬記錄確認犯罪嫌疑人資金流向、受賄金額等。只是缺少系統(tǒng)的建設、規(guī)劃和綜合利用罷了。大部分的數(shù)據(jù)價值都是潛在的,需要通過創(chuàng)新性的分析來釋放。有時,處于休眠狀態(tài)的數(shù)據(jù)的價值只能通過與另一個截然不同的數(shù)據(jù)集結(jié)合才能釋放出來。用新的方式混合分析這些數(shù)據(jù),將得出更有價值的結(jié)果。
數(shù)據(jù)的浪費也是一種極大的浪費,在數(shù)據(jù)的處理思維上不僅將數(shù)據(jù)作為對象來處理,更要作為一種可重復利用資源的處理,我們需要新的數(shù)據(jù)思維模式。我省經(jīng)過近7年持續(xù)的電子取證實驗室建設和偵查技術裝備采購,已經(jīng)具備了將各個單位連起來,做數(shù)據(jù)采集、積累案件查詢的條件。利用多數(shù)據(jù)分析軟件結(jié)合現(xiàn)有的電子取證設備和其他數(shù)據(jù)采集分析設備整合資源,將現(xiàn)有的數(shù)據(jù)收集和積累起來實現(xiàn)對海量數(shù)據(jù)的分布式處理和分析。將會實現(xiàn)信息查詢、信息共享、遠程協(xié)助、遠程協(xié)同、關聯(lián)查詢等功能。通過多人對事關行為主體的關聯(lián)查詢、比對碰撞、軌跡描述、串并分析,從時間、地域、人員、事件、資產(chǎn)、行蹤、組織等方面,對信息進行組合分析和深入挖掘,最終智能分析出犯罪嫌疑人與相關人的關系網(wǎng)絡、活動規(guī)律、資產(chǎn)交易關系等,深度挖掘案件線索,挖掘出更準、更大的情報線索,從而輔助偵查人員確定偵查方向和重點。
三、難點
現(xiàn)有多數(shù)據(jù)分析軟件多是基于公安指定的規(guī)范標準進行的設計,基于公安的業(yè)務應用建設,并沒有真正結(jié)合檢察業(yè)務的應用。采集、捕獲的數(shù)據(jù)來源于多個廠家或不同的數(shù)據(jù)庫系統(tǒng),不同程度的存在數(shù)據(jù)屬性描述和定義不一致、不規(guī)范問題。圖片、word文檔、視頻等非結(jié)構(gòu)化的數(shù)據(jù)暫時無法導入系統(tǒng)數(shù)據(jù)庫;語義分析、模糊定義查詢、模型建設都尚待需要技術的突破,截止目前為止這些問題都還沒有得到很好的解決。
四、小結(jié)
截止目前為止檢察機關已建立了無行賄犯罪檔案查詢庫、信息查詢平臺,將建立和完善在逃職務犯罪嫌疑人信息數(shù)據(jù)庫,這些數(shù)據(jù)庫已經(jīng)在實際的案件中發(fā)揮著無可替代的作用。多數(shù)據(jù)的大數(shù)據(jù)分析是一個積累和衍生的過程,我們不但需要在實戰(zhàn)工作中逐步積累數(shù)據(jù),更需要不斷的完善新的業(yè)務應用模式和模型。
技術創(chuàng)新和業(yè)務應用是一個從量變到質(zhì)變的過程,隨著并行計算能力不斷提升和云存儲等技術產(chǎn)品成本的不斷降低,人工智能、語義分析、行為分析技術的完善,將會使多數(shù)據(jù)分析真正走到了大數(shù)據(jù)分析的臨界點實現(xiàn)現(xiàn)實意義的大數(shù)據(jù)分析。多數(shù)據(jù)可視化分析在國內(nèi)處在起步應用階段,在檢察系統(tǒng)的應用更處于探索、嘗試階段,我們更需要有能結(jié)合檢察業(yè)務應用的軟件和積極嘗試新技術、新思路在案件中應用的勇氣和與時俱進探索新應用的精神。
注釋:
①摘自[英]維克托.邁爾-舍恩伯格 肯尼思·庫克耶 著《大數(shù)據(jù)時代》第13頁
②摘自[英]維克托.邁爾-舍恩伯格 肯尼思·庫克耶 著《大數(shù)據(jù)時代》第134、135頁
③摘自正義網(wǎng)9月10日貴州訊