杜翰洋
(北京師范大學,北京100875)
論新型網絡技術對電子數據證據的影響
——以“快播案”為例
杜翰洋
(北京師范大學,北京100875)
“快播”傳播淫穢物品牟利案的庭審質證過程暴露了新型網絡技術對電子數據證據的影響。這表現為:大數據時代使電子數據證據的收集效率低下,且電子數據易被篡改或刪除;云計算技術使電子數據的存儲分布碎片化,取證涉及數據管轄權問題。因此,在司法實踐中不僅應提高取證的技術方式,而且應完善電子數據取證的相關法律制度。
電子數據證據;快播案;網絡技術;大數據;云計算
2016年1月8日,“快播”傳播淫穢物品牟利案在北京市海淀法院開庭審理,由于庭審過程是網絡直播,所以吸引了大批網民的關注。其中關于對作為證據的電子數據的提取鑒定問題,公訴方與被告方展開了激烈的質證。在質證的過程中暴露出了新型網絡技術對電子數據證據的影響。
在最近10年網絡技術爆炸式發展中,電子數據呈現出新的態勢,而我國法律也對此作出了改變。《民事訴訟法》第63條規定“證據包括:(一)當事人陳述;(二)書證;(三)物證;(四)視聽資料;(五)電子數據;(六)證人證言;(七)鑒定意見;(八)勘驗筆錄”。其中把電子數據作為一種證據類型單獨列出來。《刑事訴訟法》第48條規定“可以用于證明案件事實的材料,都是證據。證據包括:(一)物證;(二)書證;(三)證人證言;(四)被害人陳述;(五)犯罪嫌疑人、被告人供述和辯解;(六)鑒定意見;(七)勘驗、檢查、辨認、偵查實驗等筆錄;(八)視聽資料、電子數據”。其中電子數據加入了第八項。
新型技術的產生必然帶來新的挑戰與機遇,電子數據是現代信息技術的產物,隨著越來越多的案件涉及網絡社會,電子數據作為證據的地位在不斷提升[1],面對電子數據證據對我們現存證據制度所造成的極大沖擊,我們對電子數據證據的認知必須提高到一個新的水平。
大數據指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產[2]。大數據時代有以下四個特點:
第一,數據量大,隨著人們日益豐富的網絡生活和網絡工作需要,數據規模越來越大,處理難度也是越來越大。如今,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。現在只要幾天就可以創造出21世紀之前所產生的數據總量。
第二,類型繁多,數據內容包括網絡日志文檔、音頻文件、視頻文件、圖片文件、地理位置定位信息等等。
第三,價值密度低,隨著互聯網在各個領域的廣泛應用,隨之有海量信息的產生,但是所產生數據的價值密度普遍較低。
第四,速度快時效高,這是大數據區分于傳統數據挖掘最顯著的特征。

在“快播案”中,雖然公訴方只獲取到了快播公司托管的四臺服務器,但是從上述服務器中的三臺服務器里竟然提取了29 841個視頻文件需要進行鑒定,而認定其中屬于淫穢視頻的文件為21 251個。如此大的數據規模,處理的難度是非常大的。傳統證據一般需要相當準確地收集與案件相關聯的證據,可能收集與案件相關聯的或有助于證明訴訟程序的事實、法律和其他情形的。而在“大數據”時代,很多案件收集與之相關聯的電子數據需要動輒幾個T甚至幾百個T的數據,這需要消耗極大的人力物力來收集全部與之相關的證據。因為電子數據的價值密度降低,真正對案件有重大價值的可能只是幾個數據流。
在“快播案”中,鑒定人為了鑒定這29 841個視頻文件,花費了大量的時間對每一個視頻進行觀看,而鑒定人一天最多才觀看了800個視頻文件,無法有效地提高鑒定的效率。為了能更高效獲取質量更高的證據,就要通過技術手段創造出更高速的機器算法以便于對電子數據的價值“提純”——數據挖掘。但這可能造成新問題,這就是通過大數據挖掘獲得的電子數據證據,有一定機率會脫離其所在的語境,而電子數據證據很有可能被錯誤地理解。
在“快播案”中,公訴方只查獲快播公司托管的服務器4臺,且只有3臺服務器里提取出了能作為證據的視頻文件29 841個,而實際上快播用作存儲的服務器遠不止四臺,視頻文件也不止3萬。這反映了一個問題,如果當事人掌握和控制了電子數據證據本身,并且獲得保存或者修改的權限,那么就很容易收集到相應的證據。另一方面,假如對方當事人或者有關或者無利害關系的第三人控制了相關的電子數據證據,或電子數據證據無法有效保存甚至被銷毀刪除,則收集電子數據證據會更為不易。在大數據時代的背景下,電子數據的控制者通常同時享有電子數據的所有權和管理權限,因而其他當事人就很難獲得相應的電子數據證據。
在該案中,因為公安機關并不完全具備處理這類電子數據證據的能力,所以由文創動力公司負責對電子數據證據進行采集并轉碼。這涉及到電子數據證據采集的問題,假如要收集與案件相關聯且有價值的電子數據證據,這就需要當事人具有獲取和挖掘數據的能力,而這也對當事人提出了更高的技術能力的要求,同時還要求能順利地進入服務器的數據庫,這使得大部分人無法完成如此的任務。而掌控電子數據證據的當事人可能為了利益出發而對證據銷毀或篡改,防止自己被追究責任,而基于電子數據的特點,它相對于其他傳統證據更易銷毀和篡改。在科技迅猛發展的今天,必須建立完善的安全體系,不然相關電子數據證據極易受到修改和刪除,這樣會使電子數據證據的真實性大大下降,案件事實可能會很難查清,甚至可能會造成是錯誤判罰的風險。如果真的如此,當事人則有可能因欠缺相應的電子數據證據而敗訴。在該案中,公訴方只查獲快播公司托管的服務器四臺,而且有一臺服務器因為損壞而無法提取電子數據證據的情況更加證明了電子數據容易銷毀和篡改。

大數據的預測功能在“快播案”類型案件對電子數據證據的收集可以起到一定的作用。大數據的解讀需要通過數據挖掘來獲得,這有可能會大大降低人類腦力勞動的負擔。大數據分析不僅具有讓電商向用戶推薦商品的功能,而且還具有識別犯罪、獲取證據的作用。而大數據挖掘為電子數據證據收集提供了技術方案。通過對大數據的數據挖掘來找到電子數據證據“連接信息點”可以作用在防治類似“快播案”這類傳播淫穢物品案件。通過查看用戶的觀看記錄,公安機關分析這些觀看記錄和上傳淫穢視頻的網站之間的關系,找出這類淫穢視頻觀看者的一個固有搜索模式,當這類淫穢視頻被觀看時,或淫穢視頻網站意圖上傳淫穢視頻時,公安機關會通過中介服務器搜集到處于這個模式的信息,進而標記淫穢視頻網站甚至找出上傳者。
云計算是基于互聯網相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源[3]。大數據需要依托于云計算的分布式計算架構,因為大數據理論上是無法只用一臺計算機來進行處理的。云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術對大數據的海量數據的挖掘有決定性作用[4]。
云計算的發展一定程度上加速了對電子數據證據挖掘的效率,同時云計算正在廣泛作用于云存儲服務,使大量的電子數據從個人計算機同步到了云存儲,為電子數據證據的保全留下新的途徑,越來越多的證據將保存在云存儲之中。
“快播”視頻播放自動加速服務的技術原理所采用的就是云計算技術。
第一,快播公司根據視頻的點擊播放頻度設定指標,當某視頻達到該指標時,快播視頻播放系統自動將該視頻資源上傳至加速服務器內儲存。
第二,加速服務器存儲視頻的目的和用途,是為了提高在線播放服務的質量,而不是直接用于傳播視頻資源,因為它們是經過加密處理的,不能使用任何普通播放器(包括快播播放器軟件)直接播放。
第三,加速服務器存儲的視頻資源只能為其所在的運營商的用戶提供加速服務,而不是為整個互聯網的所有用戶提供加速服務。
第四,加速服務器上的視頻資源并不是在任何情況下都發揮加速服務的作用,只有在互聯網上的視頻資源不能保證流暢播放的情況下,才會自動調度加速服務器上的視頻資源,一旦互聯網上的視頻資源能夠保障流暢播放了,將不再調度加速服務器上的視頻資源。
而基于云計算的工作原理,電子數據一般都被分成很多碎片化文件分別存儲在云存儲當中,電子數據一般不保存在一個特定的服務器上,有時候甚至用戶端也沒有完整的數據文件,這也使得采集完整的電子數據證據變得十分困難。如果電子數據證據不完整,可能會直接影響到它的證明能力的有無和證明力的大小。如果該電子數據證據不具有完整的證明力,為了能證明案件的真實情況,那就需要其他證據用以幫助證明[5]。
快播公司視頻播放自動加速服務會讓視頻文件被分成很多緩存碎片化文件,存儲在不同的服務器中,而這些緩存文件在云計算環境下會與其他用戶的數據混在一起,這也使得可能成為電子數據證據的文件在儲存或傳輸過程中易被污染,而且使得在某個特定服務器中的數據呈現復雜性[6]。這有可能會讓數據的安全性大大下降,并會導致當事人所取電子數據證據的原始性、完整性和有效性受到沖擊。所以就必須通過云計算獲取分布在服務器當中的數據,使之恢復完整的文件形態,如果不通過文創動力開發的特定程序,就無法讀取服務器當中的數據,那就更加不可能進行鑒定工作了。
其實,這次公安機關獲取4臺服務器并對其中的數據具體分析和數據恢復還是屬于比較傳統的電子數據鑒定方法。而快播公司的大量數據已與傳統的存儲方式不同,其主要通過云計算使得數據在網絡中進行存儲,而快播公司是不能控制甚至不知道這些數據的具體存儲位置,其也可能存儲在國外的服務器當中。在“快播案”中,雖然公安機關獲取了快播公司的4臺服務器中3臺服務器的數據,但實際上有大量的緩存碎片化文件分布在國內很多臺服務器甚至國外的服務器中,而這種跨區甚至跨國儲存的情況,就是在云計算環境下分布式系統處理數據的常態。這有可能會涉及極其復雜的管轄權問題,數據傳輸存儲在不同國家,而每個國家又有不同的法律規定,如何有效合法地跨國取證將是一個難題。

無論技術如何更新換代,還是必須堅持全面客觀地收集電子數據證據的原則[7]。大數據時代的到來,導致需要收集的電子數據證據的量在不斷增加,這使得全面收集電子數據證據的難度加大。再加上云計算致使電子數據碎片化,數據的來源越來越復雜,而且它極其容易被污染和刪除,這大大增加了收集完整證據的難度。在“快播案”中,控方所提供的證據大部分來源于那4臺查封的服務器,而這4臺服務器只是提供了部分淫穢視頻文件來作為證據,控方并沒有提供關于這些視頻與快播公司有所關聯的證據,大部分證據只是停留在表明,而并沒有深入其中。我們必須通過數據挖掘,找出更加深層的電子數據證據,用以證明快播公司與淫穢視頻之間的關系。所以還是必須堅持全面客觀地收集電子數據證據這一原則,保證案件可以形成完整的證據鏈。

將傳統收集證據的技術與新型技術相結合,增強收集電子數據證據的技術能力。從“快播案”來看,公訴方收集證據還停留在傳統地扣押存儲源,再提取電子數據證據的階段,并沒有通過網絡技術挖掘云端服務器的方式獲取電子數據證據。這樣不但耗費人力物力,而且很可能無法獲取更為深層次的證據。現階段公安機關需要提升收集電子數據證據的技術能力,不但需要與新型網絡技術的公司合作,還需要培養和招入該技術相關的人才。在還未形成有效處理該類型案件的技術團隊前,可以積極尋求掌握該類技術的相關專家幫助,甚至可以在案件庭審時申請專家證人。

在新型網絡技術快速發展的趨勢下,應盡快制定關于電子數據證據收集的相關程序法律,以及公安機關通過對大數據挖掘推測犯罪行為的相關程序法律。新型技術在不斷的發展,雖然法律具有滯后性,但是我們還是需要對這類收集證據的行為進行程序上的規制,不能出現無法可依的尷尬境地。
對這起“快播案”不論判決結果如何,至少說明在大數據時代,電子數據證據面臨了極大的挑戰。現階段不僅要繼續堅持運用傳統的證據收集方式,還需要運用新型技術來加強獲取電子數據證據的能力。我國應掌握大數據時代電子數據證據的技術特點,不單單在技術層面上提高取證的方式,還要制定和修改關于對電子數據證據提取的法律法規,建立和完善電子數據證據的制度,使得在新型網絡技術之下也能有效地獲取相應的電子數據證據。
[1]邁爾-舍恩伯格.大數據時代[M].盛揚燕,周濤,譯.杭州:浙江人民出版社,2O12.
[2]李學軍.電子數據與證據[J].證據學論壇,2OO1,2(1):433.
[3]尹丹.電子數據司法鑒定技術的發展與挑戰[J].計算機科學,2O11,11(6):S4.
[4]何曉行,王劍虹.云計算環境下的取證問題研究[J].計算機科學,2O12,39(9):1O5.
[5]王敏遠,祁建建.電子數據的收集、固定和運用的程序規范問題研究[J].法律適用,2O13,25(12):23.
[6]秦小梅.電子數據研究[D].杭州:浙江大學,2O13.
[7]張雷.電子數據及其適用規則研究[D].南京:南京大學,2O13.
(責任編輯:陳梓馨)
D915.13
A
1008-5254(2016)01-083-04
2O16-O1-O2
杜翰洋(1937-),男,壯族,廣西南寧人,北京師范大學法學院訴訟法學專業2O13級碩士研究生,研究方向為訴訟法學。