摘? ? ? 要:司法活動正邁向數據化,傳統的證據和證明活動已難以滿足現實需要,利用大數據技術得到的大數據證據成為破解困境的關鍵。從犯罪的新變化、證明難度以及印證證明上看,大數據證據有著獨特價值,其所具有的雙重相關性有利于實現從“因果關系”到“相關關系”的跨越。鑒于我國要求證據形式法定,在審查判斷規則的適用中將大數據證據歸入鑒定意見為宜。大數據證據可信性規則的建構,應從兩方面展開,即基礎數據的宏觀整體真實規則和技術方法的有效質證規則以及最佳技術方法。
關? 鍵? 詞:價值增值;相關關系;有效質證;證據形式
中圖分類號:D925.2? ? ? ? 文獻標志碼:A? ? ? ? 文章編號:1007-8207(2022)03-0081-10
收稿日期:2021-05-20
作者簡介:洪濤,遼寧大學法學院訴訟法學專業碩士研究生,研究方向為刑事訴訟法學。
一、問題的提出
大數據開啟了一次重大的時代轉型,改變著人們的生活以及理解世界的方式,其已成為新發明和新服務的源泉,更多的改變正蓄勢待發。[1]在司法領域,智慧法庭、電子數據、智能機器人犯罪等高新科技也促使著法律和法學家們不斷做出改變。微觀到證據法方面,如今電子數據已成為我國的法定證據種類之一,是證據法學者們討論和爭議的熱點。然而,針對基于海量電子數據的大數據證據,學界的討論明顯不足。現實生活中,很多案件都需要運用大數據技術,如甘肅蘭州特大“套路貸”一案,涉嫌非法放貸APP和網站1317個、貸款合同336萬余份(主要是電子合同)、涉案金額達到89.6億元、受害者多達39萬余人、更有89人因逼債催收自殺身亡。如此龐大的數據,如果不借助大數據技術進行分析,不僅難以認定犯罪嫌疑人之間的層級關系,準確識別出案件的主犯和從犯,亦有可能對部分資金重復評價,違背罪責刑相一致原則,損害犯罪嫌疑人、被告人的合法權益。司法實踐中,運用大數據分析技術得到的信息能否視為證據、屬于什么類型的證據尚不明晰。以傳銷犯罪為例,山東某法院引用了運用大數據分析技術得到的會員信息,卻沒有明確其屬性①;吉林省某法院將利用大數據得到的下線人數、下限層數等信息列入到書證之中②;湖南省某法院則將運用大數據技術提取到的信息列為鑒定意見③。
實際上,大數據證據對司法證明活動有自身的獨特價值。一方面,大數據證據符合降低證明難度的趨勢。證據是司法活動的根基,但復雜的現實情況和人類認知能力決定了證據資源短缺是司法活動的永恒規律。大數據證據著眼于相關關系,通過對海量數據的分析,找到潛在的有用信息,為證明案件事實提供了幫助,超越了以往的因果關系視閾;另一方面,大數據證據能更好地發揮印證證明的作用。傳統證據主要具體反映案件的人、物、事、時等,而大數據證據不同,通過數據挖掘、數據對比等大數據技術,電子數據的系統特征被發揮到極致,從而能夠從整體反映案件事實。大數據證據和印證證明天然具有親和性,是印證的完美適用。從這一意義上講,明確大數據證據屬性和種類有其現實緊迫性和必要性。
二、大數據證據內涵之厘定
目前,我國學界對于大數據證據的定義有爭論而無定論。如有學者將大數據證據界定為基于海量電子數據形成的分析結果或報告,[2]此觀點難以充分體現大數據證據的獨有特點;也有學者將利用大數據技術得到的材料皆稱為大數據證據,[3]此觀點太過寬泛,使得人們對于大數據證據的認識更為混亂;還有學者從方法論角度出發,提出大數據證據能產生某種實用意義上的增值價值,[4]屬于一種可以產生增值的方法,此觀點其實指的是大數據證明而非大數據證據。
筆者認為,對大數據證據的界定應從大數據證據的獨有特點出發。其一,大數據證據的基礎是海量電子數據,規模大且類型多,相較于早期一條一套的電子數據,大數據證據以信息量大為新特色。[5]其二,大數據證據不是對海量數據的簡單羅列而是進一步加工。目前,將大數據證據視為電子數據二次加工的觀點已為眾多學者所認可和采納,成為大數據證據的公認特點。[6]其三,大數據證據的再加工利用了高新技術,如數據挖掘、數據統計、數字模型、數據碰撞等,而這些技術的適用使得大數據證據不同于電子數據,因產生了新的價值增量而有了獨立的意義。其四,大數據證據的關聯性有雙重表現,即基礎數據的弱關聯和分析結論的強關聯,而傳統證據的關聯性只有一重,或強關聯或弱關聯。其五,大數據證據的可信性除受到來源的影響外更受到技術方法合適與否的影響,與傳統證據側重來源真實有明顯的不同。
由此,筆者將大數據證據定義為“建立在大量弱關聯的電子數據之上,通過數據挖掘、數據碰撞、模型建構等技術增值得到的具有強關聯性的、能夠用來證明案件事實的分析報告”。如此界定,一是可以明確大數據證據的基礎是電子數據,進而對二者的關系有一個正確的認識;二是可以明確大數據證據因使用了技術方法而產生價值,故與電子數據存在差別、與鑒定意見存在交叉,突出了大數據證據種類不明晰的問題,這也點明了相關研究未來的主攻方向;三是從大數據證據的特點出發,既可以厘清大數據證據相關性的特殊表現,也有助于為大數據證據設計專門的可信性審查判斷規則,還能夠為以后放棄以證據種類作為證據門檻的做法進行鋪墊。
三、大數據證據證據種類之辨析
在我國,依照《中華人民共和國刑事訴訟法》(以下簡稱《刑事訴訟法》)第五十條第二款之規定,證據包括物證,書證,證人證言,被害人陳述,犯罪嫌疑人、被告人供述和辯解,鑒定意見,勘驗、檢查、辨認、偵查實驗等筆錄,視聽資料、電子數據。只有這八種證據才是法律意義上的“證據”,在此范圍之外的事物、筆錄、陳述等皆非法定“證據”。[7]有學者就此認為:“關于證據種類的規定實際上構成了我國證據審查與適用的第一道門檻,即只有符合法定證據種類要求的信息才有可能成為證據。”[8]目前,國內關于大數據證據證據種類的討論有三種主流說法。一是“電子數據說”。該觀點認為,大數據證據本質上屬于電子數據,分析報告是對電子數據的反映,依附于電子數據,不具有獨立性,屬于衍生品。將大數據證據作為電子數據對待,也是大多數法院的做法。有學者通過實證研究發現,判決中將大數據證據看作電子數據的比例達到66%,[9]而偵查機關提交的犯罪嫌疑人、被告人的活動軌跡多以“情況說明”的形式列入裁判書中。二是“鑒定意見說”。有學者認為應將資金大數據分析納入司法鑒定范疇,這有利于司法實踐的展開,且在法律上也可以找到依據。[10]該觀點得到了部分法院的認可,其在裁判文書中將相應的資金分析報告列為鑒定意見①。2016年修訂的《司法鑒定程序通則》第二條亦規定:“司法鑒定是指在訴訟活動中鑒定人運用科學技術或者專門知識對訴訟涉及的專門性問題進行鑒別和判斷并提供鑒定意見的活動。”從表述上看,大數據證據和鑒定意見的確存在相似之處,都需要利用科學技術,針對的也都是專業問題,都是對基礎材料的再加工,最終形成一份有獨立價值的報告。正因如此,“鑒定意見說”在學界占據著優勢地位。三是“獨立證據說”。該觀點認為,大數據證據不同于現有的法定證據,在未來的證據法當中有必要單列出來作為獨立的證據種類。[11]
在域外,關于大數據證據的證據種類有兩種主流觀點。一是“機器證言說”。美國學者洛斯認為,機器在確定事實上發揮著越來越重要的作用,所傳達的一些信息已成為法庭上的證據,如照相機的圖像、溫度計的測量、專家系統的意見等。[12]因此,可將數據以及數據分析都歸入到機器證言之中,作為值得依賴的、可用于法庭裁判的證據。為使機器證言符合美國的可采性要求,洛斯將機器證言視為“人證”,并設計出一個類似傳聞證據的規則,目的是通過為陪審團提供關鍵的基本事實或背景更好地評估機器傳輸的準確性。二是“數字證據說”。在域外相關研究中,大數據一詞經常和數字取證一同出現。因此,美國國家標準與技術研究所將“數字取證”定義為:“一門應用科學,有助于對證據數據進行識別、分類、評估和審查。”[13]實際上,該觀點擴大了數字證據的范圍,將對相關數據的分析也歸入其中。如有學者將數字取證程序分為“識別、收集、分析、保存和陳述”,[14]其中的“分析”即是利用有效的數據挖掘工具來分析證據數據,這與大數據證據極為相似。還有不少學者認為大數據證據是數字取證之中的一項,由此將大數據取證定義為“數字取證的一個特殊分支,用來識別、收集、分析和陳述非常大規模的證據數據集,以建立犯罪事實。”[15]
法定的八種證據在載體、表現形式等方面各有特點,如何區分不同證據種類的關鍵在于審查判斷規則。如證人證言在審查判斷時主要關注證人是否直接感知案件事實、與案件事實是否有利害關系,而鑒定意見在審查判斷時主要關注鑒定人是否具有資質、鑒定方法是否科學,由此可推斷出二者屬于不同種類的證據。判斷大數據證據屬于何種類型的證據,亦應從其適用什么樣的審查判斷規則著手。從大數據證據構成上看,既需要審查判斷基礎數據,又需要審查判斷技術方法。基于此,筆者對國內外關于大數據證據證據種類的幾種主流說法進行考量:其一,“電子數據說”和“數字證據說”。“電子數據說”盡管看到了大數據證據在審查判斷基礎數據時的確適用電子數據的相關規則,但卻忽視了一個至關重要的問題——“同步性”。最高人民法院、最高人民檢察院、公安部于2016年9月9日印發的《關于辦理刑事案件收集提取和審查判斷電子數據若干問題的規定》(以下簡稱《電子數據規定》)第一條規定:“電子數據是案件發生過程中形成的,以數字化形式存儲、處理、傳輸的,能夠證明案件事實的數據。”從中可以推導出電子數據與案件事實具有同步性,因此電子數據亦被稱為“沉默的現場見證人”。而大數據證據建立在對電子數據的分析之上,是事后加工得到的,顯然不具有同步性。故此,在電子數據的概念沒有更改之前不宜將大數據證據與電子數據等同。“數字證據說”亦是如此,其也忽略了電子數據的同步性。其二,“機器證言說”。機器證言是將“人證”進行了擴大理解,如此就需要將證人證言的審查判斷規則適用于大數據證據,但司法實踐中有關證人證言的審查判斷規則并不適用于機器證言。一方面,證人證言的可信性要通過證人的感知、表達、記憶、誠實性等方面綜合分析判斷,而機器證言是由嚴密的編程程序得出的分析結果,顯然不會受到上述情況的影響;另一方面,證人有出庭作證的義務,其證言要接受控辯雙方和法官的質疑,而機器證言即便出庭也無法回應質疑。其三,“獨立證據說”。將大數據證據獨立為一種新的證據形式,就必須為其設計獨特的審查判斷規則。然而,對大數據證據基礎數據的審查完全可以適用電子數據的相關規則,對大數據證據技術方法的審查判斷亦可參考鑒定意見的相關規則。可見,將大數據證據獨立為一種新的證據形式顯然是一種逃避問題的做法,這種將難以歸類的證據材料獨立處理的“打補丁”方式長久來看不利于形成穩定的證據制度,甚至會給司法裁判活動造成阻礙。其四,“鑒定意見說”。有學者認為,不同于以往專家借助儀器設備作出判斷,大數據分析鑒定意見書很大程度上是由機器算法給出的實質判斷,這對于專家作出判斷的司法鑒定體制是一個過于超前的突破。[16]實際上,這種差異并不妨礙將大數據證據歸入鑒定意見。盡管鑒定意見通常是以“人”為主、以“機器”為輔,但在某些情況下也是以“機器”為主、以“人”為輔的,如DNA鑒定、血液酒精含量鑒定等。而且,鑒定意見通過辯護進行證據審查判斷的規則同樣也適用于對大數據證據技術方法的審查判斷。加之,鑒定人在進行鑒定時遵循的是國家標準、行業標準,將大數據證據歸入鑒定意見即可以適用相應標準對大數據證據技術方法進行審查。因此,將大數據證據歸入到鑒定意見是可行的,不會發生嚴重的沖突。需要說明的是,將大數據證據歸類的目的只是考察其適用何種證據審查判斷規則,對大數據證據的研討還應更進一步,即重新審視大數據證據的相關性并建構符合大數據證據可信性審查判斷的規則。
四、大數據證據相關性之再解
“相關性”一詞譯自于英美法系國家,是指作為證據內容的事實與案件事實之間存在某種聯系。英美法系國家對相關性極為重視,將其作為最基本的證據屬性,如《美國聯邦證據規則》在規則401、402、403中分別規定了相關證據的標準、相關證據的可采性和相關證據的自由裁量性。大陸法系國家將“相關性”亦稱為“關聯性”,其側重的是證據與證明對象之間的形式性關系,即證據相對于證明對象是否具有實質性和證明性。大數據分析報告一旦作為證據,必須具備相關性。
在學界,部分學者對大數據證據的海量基礎數據進行評估后發現,其與案件事實不具有通常意義上的關聯,或者說相較于其他證據的關聯,這些海量基礎數據的關聯極其微弱。故此認為,通過分析加工不具備相關性的數據而得到的大數據證據理所當然地不具有相關性,其證據資格存在重大瑕疵,不能作為證據來使用。在筆者看來,此觀點對于關聯性認識較為模糊且未能充分理解大數據證據的特殊性。一方面,關聯性包括了弱關聯和強關聯,弱關聯也是關聯的一種,對案件事實的證明亦能起到作用;另一方面,大數據證據雖是建立在弱關聯的海量電子數據之上的,但其本身與案件事實是強關聯的,這正是“大數據價值增值論”的根源所在。具言之,其一,大數據證據著眼于“相關關系”。與傳統證據著眼于“因果關系”不同,大數據證據著眼于“相關關系”,通過那些看似不具有關聯的關系發掘背后的常態聯系,用以證明案件事實,這也符合大數據的技術特點。大數據技術就是利用海量信息來挖掘潛在的相關關系,從而超越了通常的因果認知。有學者提出:“傳統證據的因果關系是一種強關聯關系,而大數據的相關關系是一種弱關聯關系。實際上,大數據的相關性是基于機器邏輯的相關關系。”[17]大數據之父舍恩伯格同樣認為:“大數據最重要的思維特征就是‘追求相關、放棄因果’”。[18]在哈爾濱市公安局交警支隊原處長侯某某嚴重違紀案中,正是通過大數據發現侯某某任職前后的消費水平發生了變化,如航班由經濟艙改為了頭等艙。[19]其二,大數據證據與案件事實是強關聯的。大數據證據的基礎數據雖是弱關聯的,但最終的大數據分析報告卻是強關聯的。引入相關關系,是為論證基礎數據的正當性而并非大數據證據本身和案件事實也是弱關聯關系。實際上,所謂的“大數據的相關關系是一種弱關聯關系”指的只是基礎數據而非大數據證據本身。大數據證據并不是海量數據的簡單堆積,其是對海量數據的再加工,通過數據挖掘、數據對比等技術方法,大數據分析報告已然產生新的獨立價值,具有了強關聯性。如涉眾犯罪中通過技術方法得到的人員關系層級表,立體而又生動地描繪了案件中人員的地位和受益金額,與案件事實具有強關聯。美國司法中的“鑲嵌論”認為,分散的信息碎片一旦被整合為整體,就能產生1+1>2的效果。在筆者看來,“鑲嵌論”和“大數據價值增值論”是相互契合的,其都認為碎片整合加工之后能產生更大價值,從而具有一定的獨立性。其三,大數據證據的相關性基于特殊經驗。電子時代帶來了新變化,新型犯罪通常涉及人數較廣,案情較為復雜,相關案情信息極為龐大,已經超越了日常生活的經驗范疇,單靠人力去調查研究是難以完成的。從認識論意義上講,大數據分析運用的相關性理論是超脫于人類經驗判斷的“數據經驗”,[20]通過大數據技術可以將那些隱藏規律外化,從而形成新的不同于人類日常經驗的數據經驗或特殊經驗。之所以稱為特殊經驗,是因為該經驗的得出是基于大數據技術對海量數據的分析,如果以生活常識判斷并不能看到二者具有的關聯。例如:沃爾瑪通過大數據分析發現,啤酒和尿布放在一起售賣時,二者的銷量都會增加;有學者通過實證研究發現,在上海市虹口區人民法院管轄范圍內,自然人之間、自然人與金融機構之間的借款活動相較于其他參與主體借款行為更易失敗。[21]
綜上,筆者認為,在理解大數據證據的相關性時,既要看到大數據證據基礎數據的弱關聯,還要看到數據分析報告的強關聯,更要看到建立在因果關系之上的相關關系。而且,要深刻理解“經驗”不僅僅是人們在日常生活中所形成的經驗,要擴大視野向時代看齊,承認和接納數據經驗或特殊經驗。
五、大數據證據可信性規則之塑造
依據《刑事訴訟法》第五十條之規定,證據必須經過查證屬實才能作為定案的根據。可信性是證據成為定案根據必不可少的條件,包括證據本身可信和證據來源可信。[22]大數據證據的可信性有其特殊性,一方面,大數據證據建立在電子數據之上,而電子數據又處于虛擬空間,與高新技術緊密相連,法官們在審查和判斷時受限于專業性常常陷入窘境;另一方面,算法作為大數據技術的內核因涉及到商業秘密,通常是不公開、黑箱化運行的,故在法庭舉證時控辯雙方對于大數據證據的質證往往流于形式,這使得大數據證據的可信性受到質疑。故此,應科學構建大數據證據可信性的審查判斷規則。
對大數據證據可信性的審查判斷應該關注作為來源的海量基礎數據是否可信,是否存在偽造的或者具有誤導性的數據。如在“新百倫和New Balance商標侵權案”[(2015)粵高法民三終字第444號]中,原告提交的公證書提出二者的“淘寶指數”和“百度指數”曲線基本一致,以此證明二者已構成了商標混淆。然而,原告提交的指數不一定是真實可信的,亦有惡意搜索或人為趨使指數保持一致的可能。《電子數據規定》第二十二條規定:“對電子數據是否真實,應當著重審查以下內容:(一)是否移送原始存儲介質;在原始存儲介質無法封存、不便移動時,有無說明原因,并注明收集、提取過程及原始存儲介質的存放地點或者電子數據的來源等情況;(二)電子數據是否具有數字簽名、數字證書等特殊標識;(三)電子數據的收集、提取過程是否可以重現;(四)電子數據如有增加、刪除、修改等情形的,是否附有說明;(五)電子數據的完整性是否可以保證。”第二十三條規定:“對電子數據是否完整,應當根據保護電子數據完整性的相應方法進行驗證:(一)審查原始存儲介質的扣押、封存狀態;(二)審查電子數據的收集、提取過程,查看錄像;(三)比對電子數據完整性校驗值;(四)與備份的電子數據進行比較;(五)審查凍結后的訪問操作日志;(六)其他方法。”據此,有學者提出,原始電子數據作為大數據證據的基礎,只有每項原始電子數據都能符合電子數據審查規范時,這些電子數據分析得出的大數據證據才是可靠的。[23]還有學者認為,雖然原始電子數據數量是龐大的,但是通過“區塊鏈技術”能夠保證原始數據內容的可信性。[24]但在筆者看來,要求大數據證據的基礎數據全部真實不現實。大數據證據的一大特點就是數據規模大、數據類型多、數據信息海量,因此在審查判斷海量電子數據的可信性時應以宏觀的整體真實為選擇。其實,從整體真實角度考察證據的可信性也是與司法實踐中的等約計量法相契合的,在面對極為復雜的案件時,對于案件事實的探求不以精準計量為導向,關注的是整體樣態。正如舍恩伯格所言,大數據通常用概率說話,而不是板著“確鑿無疑”的面孔;當我們試圖擴大規模的時候,要學會擁抱“混亂”。[25]當然,關注宏觀的整體真實并不意味著要徹底拋棄微觀的具體真實。具體真實具有自身的價值,有存在的必要性,它可以用來印證整體認識的正確與否。如在“張某安、劉某伍組織、領導傳銷活動案”中,偵查人員先是通過對核心技術人員的訊問,確保涉案數據集整體的可信性,再通過對該組織的一個分支機構資金流水的具體查證,部分印證了數據集整體中的層次關系。
大數據證據是對電子數據的再加工,除了要審查判斷作為來源基礎數據的可信性之外,還要審查判斷技術方法的可信性。從某種程度上說,技術方法可信性的影響力甚至大于基礎數據可信性的影響力。基于大數據技術以不公開為原則,表現為黑箱化運行,有學者主張技術方法可信性的審查判斷應以技術方法公開為前提,以確保技術方法透明,從而提高司法審判的透明度。筆者認為,此觀點欠妥。一方面,部分技術方法無法公開,如北斗衛星的圖像分析等,但不公開并不意味著不可信;另一方面,大數據技術專業性很強,即便將相應的技術算法公開,其可信性仍需進一步審查判斷。如在“王某博、鄭某濱侵犯著作權案”[(2020)蘇刑終19號]中,就對“天天街機捕魚”和“千炮捕魚”的源代碼的重復比產生了爭執,為此控方提交多份司法鑒定意見,被告人則主張這些司法鑒定并不可信。可見,對技術方法的可信性審查,公開只是第一步,更為關鍵的是要建構具體的審查判斷規則,即有效質證規則和最佳技術方法規則。
就有效質證規則而言,《刑事訴訟法》第一百九十二條第三款規定:“公訴人、當事人或者辯護人、訴訟代理人對鑒定意見有異議,人民法院認為鑒定人有必要出庭的,鑒定人應當出庭作證。經人民法院通知,鑒定人拒不出庭作證的,鑒定意見不得作為定案的根據。”大數據技術方法的可信性審查亦可通過有效質證來實現:在大數據研究領域中有一項“可視化分析”,通過人機交互技術輔助人們更為直觀和高效地洞悉大數據信息。[26]“可視化分析”可以用來解釋大數據技術的原理和分析報告的形成過程,從而實現大數據證據的有效展示,這比僅僅公開技術方法更為有效。筆者建議,提交大數據證據的一方應附帶“可視化分析”,對其采用的大數據技術進行解釋說明,以便法院及控辯雙方理解和審查判斷。此外,《刑事訴訟法》第一百九十七條第二款明確規定:“公訴人、當事人和辯護人、訴訟代理人可以申請法庭通知有專門知識的人出庭,就鑒定人作出的鑒定意見提出意見。”所以,專家輔助人同樣可以適用于大數據證據技術方法的質證。需要注意的是,申請專家輔助人的質疑既可以針對大數據分析報告本身,也可以針對附帶的“可視化分析”,法官在決定是否允許專家輔助人介入時應側重保護質證方而非舉證方,如此才能平衡雙方的力量。
就最佳技術方法而言,目前因大數據證據的技術方法沒有相應的技術標準導致產生兩個疑問:一是使用的技術方法是否正確,能否得出可信的結論;二是使用的技術方法是否最合適。相較之下,鑒定意見雖然也存在疑問,但其有相應的標準,《司法鑒定程序通則》第二十三條明確規定:“司法鑒定人進行鑒定,應當依下列順序遵守和采用該專業領域的技術標準、技術規范和技術方法:(一)國家標準;(二)行業標準和技術規范;(三)該專業領域多數專家認可的技術方法。”可見,建立相應的技術標準是破解大數據證據技術方法可信性困境的關鍵。但標準的確立需要經驗的積累和總結,短時間內完成不太現實。對此,筆者建議可參考美國在多波特案中提出的評價標準①,即通過算法比較和事后驗證來確立個案中的最佳技術方法。所謂算法比較,是指對同樣的基礎數據采用不同的算法進行數據分析。面對同樣的數據集,采用不同的算法可能得出不同的結論甚至是截然相反的結論。大數據分析的核心同樣在于對算法模型的分析和選擇,算法模型的有效性和適用性很大程度上決定著分析結果的準確性和可采性。[27]故而,應多嘗試算法建構,通過對比分析尋找最合適的技術方法。在進行大數據分析時,或結合現實情況選擇最為適合的算法,或交叉利用多種算法。所謂事后驗證法,是指通過對某一算法得出的結論進行個別驗證。該方法在專業領域亦被稱為黑箱測試,即在已知產品所應具有功能的前提下通過測試來檢測每個功能能否正常的一種測試方法。[28]事后驗證實際上屬于抽樣取證,通過具有代表性的一定物品作為樣本證據,并據此證明全體物品屬性。[29]鑒于抽樣取證難以找到代表性的物品,無法正確反映情況,只能在極特別的情況下使用,因而應通過多次測試以提高正確率,同時結合整體真實性綜合考慮。對于測試過程中可能出現的不相符情形,不要貿然認定結論不真實,應將其認作概率問題從整體上進行考量。
總之,大數據證據在訴訟活動中運用的主要問題在于其屬于哪一類法定證據、如何展開有效的審查判斷。筆者認為,相較于相關性和可信性,證據形式對證據審查運用的影響并沒有那么大。而且,要求證據必須具備合法形式的規定不合理,且實務中這一規定也沒有被嚴格地執行。如交警出具的交通事故認定書、會計事務所出具的審計報告雖然不屬于法定證據,但是幾乎沒人會否認其證明價值進而將其排除在訴訟之外。《最高人民法院關于適用〈中華人民共和國刑事訴訟法〉的解釋(2021)》新增的第一百零一條規定:“有關部門對事故進行調查形成的報告,在刑事訴訟中可以作為證據使用;報告中涉及專門性問題的意見,經法庭查證屬實,且調查程序符合法律、有關規定的,可以作為定案的根據。”此規定已經有了弱化法定證據形式的傾向,因此筆者建議,應將《刑事訴訟法》第五十條第二款中“證據包括”修改為“證據包括但不限于”。
【參考文獻】
[1][18][25](英)維克托·邁爾·舍恩伯格.大數據時代:生活、工作與思維的大變革[M].周濤譯.杭州:浙江人民出版社,2012:1,68-94,46.
[2][5][16][28]劉品新.論大數據證據[J].環球法律評論,2019,(1):22-31.
[3][10][11]何家弘等.大數據偵查給證據法帶來的挑戰[J].人民檢察,2018,(1):56.
[4]謝君澤.論大數據證明[J].中國刑事法雜志,2020,(2):125.
[6]謝君澤.論大數據證明[J].中國刑事法雜志,2020,(2):125;王祿生.論法律大數據“領域理論”的構建[J].中國法學,2020,(2):261.
[7]陳瑞華.刑事證據法(第三版)[M].北京:北京大學出版社,2018:246.
[8]鄭飛,馬國洋.大數據證據適用的三重困境及出路[J/OL].重慶大學學報(社會科學版),Doi:10.11835/j.issn.1008-5831.fx.2020.12.001.
[9]徐惠,李曉東.大數據證據之證據證成研究[J].中國人民公安大學學報(社會科學版),2020,(1):49.
[12]Andrea Roth,Machine Testimony,126Yale L.J.1972(2017).
[13]B.Marr,Why only one of the 5 vs of big data really matters, http://goo.gl/azsnse,2015.
[14]Dr.Tariq Sheikh,Big data and digital forensic,https://www.researchgate.net/publication/323254112.
[15]Shams Zawoad、Ragib Hasan,Digital Forensics in the Age of Big Data:Challenges,Approaches,and Opportunities, IEEE Big Data Security,August2015.
[17]劉品新.電子證據的關聯性[J].法學研究,2016,(6):189.
[19]龐嵐.官員有11套房自以為安全,不料這舉動被大數據揪出[EB/OL].新浪網,https://finance.sina.com.cn/china/gncj/2018-05-30/doc-ihcffhsv2868843.shtml.
[20][21]周蔚.大數據在事實認定中作用機制分析[J].中國政法大學學報,2015,(6):70-75.
[22](美)特倫斯·安德森等.證據分析(第2版)[M].張保生等譯.北京:中國人民大學出版社,2012:84.
[23]張吉喜,孔德倫.論刑事訴訟中的大數據證據[J].貴州大學學報(社會科學版),2020,(4):87.
[24]吳春妹等.大數據證據的定位與運用——以互聯網金融犯罪案件為切入點[J].人民檢察,2020,(3):57.
[26]任磊等.大數據可視分析綜述[J].軟件學報,2014,(9):1910.
[27]劉緒崇,蘇欣,唐德權.智慧警務——大數據環境下新時代公安信息化建設模式探索[M].北京:清華大學出版社,2018:69.
[29]萬毅,縱博.論刑事訴訟中的抽樣取證[J].江蘇行政學院學報,2014,(4):122.
(責任編輯:劉亞峰? 實習編輯:王正橋)
Research and Analysis of Big Data Evidence
Hong Tao
Abstract:Judicial activities are moving towards digitization,and the traditional evidence and proof activities have been difficult to meet the practical needs.The big data evidence obtained by using big data technology has become the key to solve the dilemma.From the perspective of new changes in crime,difficulty of proof and confirmation,big data evidence has unique value,and its dual relevance is conducive to the leap from “causality” to “correlation”.In view of the statutory form of evidence required in China,it is appropriate to classify big data evidence into expert opinions in the application of review and judgment rules.The construction of big data evidence credibility rules should be carried out from two aspects,namely,the macro overall truth rules of basic data,the effective cross examination rules of technical methods and the best technical methods.
Key words:value increment;correlation;effective cross examination;form of evidence