999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據證據在刑事司法中的運用初探

2021-05-17 11:47:56林喜芬
法學論壇 2021年3期

林喜芬

(上海交通大學 凱原法學院,上海 200030)

一、問題的提出:大數據時代的證據維度

作為一項引領世界的技術方法和思維方式,“大數據”已愈來愈廣泛地介入到人們的社會生活、商業行為和政府管理之中。法律是大數據應用的重要場域之一,國家政策、科技公司、司法機關和專家學者都給予了充分的重視。近來,隨著對法律領域特殊性的關注以及法律大數據“領域理論”的探討,(1)參見王祿生:《論法律大數據“領域理論”的構建》,載《中國法學》2020年第2期。學界關于大數據在法律領域的研究正趨于自覺和深入。從目前的文獻看,國內法學界關于大數據的研究主要集中于以下三個方面:其一,關于大數據對法學研究的助推作用。該研究脈絡著重分析了法律大數據研究與傳統實證研究的區別,以及對今后法學研究的范式轉型意義。(2)參見左衛民:《邁向大數據法律研究》,載《法學研究》2018年第4期;白建軍:《大數據對法學研究的些許影響》,載《中外法學》2015年第1期;左衛民、王嬋媛:《基于裁判文書網的大數據法律研究:反思與前瞻》,載《華東政法大學學報》2020年第2期。其二,關于大數據對法律改革和司法決策的推動作用。這一脈絡主要表現在對智慧法院建設、司法信息化、類案推送、量刑輔助等方面的試點改革研究。(3)參見崔亞東:《人工智能與司法現代化》,上海人民出版社2019年版,第106-120頁;程金華:《人工、智能與法院大轉型》,載《上海交通大學學報》2019年第6期;李鑫:《從信息化呈現到體系性構建:判例運用視角下判例檢索系統的建設與發展》,載《四川大學學報》2020年第2期。其三,關于大數據對司法辦案的影響。這一脈絡重點體現在對大數據偵查的規制程序上,尤其涉及如何通過程序來保障公民基本權利免于大數據取證行為的不當干預。(4)參見程雷:《大數據偵查的法律控制》,載《中國社會科學》2018年第11期;裴煒:《個人信息大數據與刑事正當程序的沖突及其調和》,載《法學研究》2018年第2期;楊文革、辛宇罡:《大數據時代查辦涉黑案件情報監管機制研究》,載《情報雜志》2019年第7期。盡管有上述理論探索,但是,從具體辦案的角度講,如何認識使用大數據應用技術收集到的證據材料也是非常值得挖

掘的領域。(5)有代表性的論述,參見劉品新:《論大數據證據》,載《環球法律評論》2019年第1期;謝君澤:《論大數據證明》,載《中國刑事法雜志》2020年第2期。至少在刑事司法實務中,大數據偵查和取證已然登場并正得到較廣泛的應用,這勢必會促使理論和實務界去關注這種新型偵查方法獲取的證據在后續訴訟程序中的運用問題。(6)參見何家弘等:《大數據偵查給證據法帶來的挑戰》,載《人民檢察》2018年第1期。可以說,證據維度乃是大數據技術介入(刑事)司法領域后所繞不開的層面之一。正如以往任何一種證據資料一樣,大數據技術獲取的證據材料也不得不面對諸如其作為訴訟證據的表現形態、作用方式、證據屬性、證據能力判斷和證明力評價等基礎問題。接下來,本文擬結合裁判文書網中的典型案例和證據法的基礎理論,對與大數據證據相關的上述問題展開初步研討。

二、大數據證據在刑事司法中的表現形態與作用方式

(一)大數據證據在刑事司法中的表現形態

在數據時代,人們的犯罪行為會留存下越來越多的數據痕跡,這些構成了恢復案件真實的重要物質基礎。在當前刑事案件中,大數據證據往往被(或可能)用于偵查破案線索、反駁被告辯解、補強言詞證據、印證性的間接證據等,在作用方式上主要包括基于海量數據的數據庫比對和基于算法模型的大數據分析兩種基本類型。

第一,作為偵查破案線索的大數據證據。當前我國使用海量數據偵破刑事案件的實踐方興未艾,但是,在功能上卻主要止于犯罪線索的搜尋和預期犯罪的預防,而且在未來一段時間,這一功能應該也是大數據介入刑事司法的主要方式。例如,在唐某搶劫案的一審刑事判決書中,法院查明:案發后,開江縣公安局偵查人員通過現場走訪、周邊視頻調取,通過大數據情報鎖定唐某為嫌疑人,于2月8日下午14時許,在開江縣普安鎮天星壩村2組將唐某抓獲。(7)參見“四川省開江縣人民法院(2019)川1723刑初181號刑事判決書”。準確地說,這里面的大數據情報充其量只是一種證據資料,還不具備法庭審理時作為定案根據的證據資格,更遑論被用作證明構成要件事實的關鍵依據。即使是在審前程序階段,大數據偵查也并非是獨立存在的,其往往被吸收在技術偵查措施的范疇中。對此,有研究表明,在中國裁判文書網2016年度的刑事案件中,共檢索到570件明確表明適用過技術偵查措施的案件,其中有113件使用了大數據技術,但這些大數據技術均未能(被)轉化為訴訟證據。(8)參見程雷:《大數據偵查的法律控制》,載《中國社會科學》2018年第11期。

第二,作為彈劾被告辯解的大數據證據。在理論上,證據根據其與實體真實之間是否具有“生成”意義上的證據相關性,可以區分為實質證據和輔助證據。(9)參見周洪波:《實質證據與輔助證據》,載《法學研究》2011年第3期。前者是證明主要事實及其間接事實的證據,后者是證明輔助事實(有關實質證據的可信性的事實)的證據。(10)參見[日]田口守一:《刑事訴訟法》,張凌、于秀峰譯,法律出版社2019年版,第438-439頁。彈劾證據就是輔助證據的一種。它是用以攻擊被告辯解(或證人證言可信性)的證據,其主要作用在于抵消言詞證據的可信性,而非用于直接證明案件事實。(11)參見馬朝陽:《對庭審翻供的審查及彈劾證據的運用》,載《人民檢察》2018年第8期。雖然目前大數據偵查的證據生成功能總體有限,但是,在已有的裁判案例中,也確實存在大數據證據發揮刑事證據功能的情形。這首先表現為輔助證據中的彈劾證據,即用于彈劾被告辯解的可信性。例如,在最高人民檢察院發布的第八批全國檢察機關依法辦理妨害新冠肺炎疫情防控犯罪的典型案例——郭某鵬妨害傳染病防治案中,法院查明:在公安民警明確告知大數據顯示其去過國外后,郭某鵬承認有過出境史。在調查、核實其出入境軌跡后,郭某鵬被送至二七區集中隔離點進行觀察。(12)參見最高人民檢察院發布第八批全國檢察機關依法辦理妨害新冠肺炎疫情防控犯罪典型案例之二:河南省郭某鵬妨害傳染病防治案。嚴格來講,彈劾證據主要是審判程序中針對被告辯解或證人證言的可信性而提出的。從裁判文書中的表述推測,在該案中,郭某鵬應是在偵查階段先未承認有出境歷史,后經出示大數據行蹤報告而承認有過出境史。若該情景發生在審判階段(即在法庭審理中,控方出示大數據行蹤報告質疑被告的辯解),大數據證據所發揮的就是典型的彈劾證據之功能。

第三,作為補強言詞證據的大數據證據。輔助證據中除了彈劾證據,還包括了補強證據。(13)參見[日]田口守一:《刑事訴訟法》,張凌、于秀峰譯,法律出版社2019年版,第439頁。大數據證據對被告供述或證人證言的可信性進行補強時,也同樣是在發揮輔助證據之功能。例如,在受賄案件的證明過程中,針對某些客觀方面的要件事實(包括犯罪嫌疑人實施受賄行為的時間、地點、方式、次數、金額等),控訴方在以往主要依賴書證、被告人供述、行賄人證言等證據形式,(14)參見朱小芹主編:《職務犯罪證據審查實務》,中國法制出版社2019年版,第5頁。但是,這種證明比較薄弱的環節就是被告供述或行賄人證言的可信性問題,一旦可信性存疑,控方基于這些言詞證據所構建起來的印證證明體系就會被動搖。畢竟,在言詞證據的合法性遭致質疑的情況下,言詞證據的可信性也不能得到充分保證。該困境隨著數據時代的到來或許會有一定改觀。職務犯罪嫌疑人在實施受賄行為時往往會留下一些數據痕跡,如受賄人與行賄人的通話聯絡記錄,出入某些供詞中所提到的特定場所的行蹤記錄,行賄人的資金收取情況的電子記錄,等等。這些數據痕跡可能藏匿于海量的、非可疑的數據中,對于案件的實體真實可能也并不具有證明價值,但是,通過運用大數據技術進行分析,卻可以作為補強被告供述或證人證言可信性的輔助證據。例如,通過大數據分析發現某一個特定時期受賄人和行賄人有過頻繁通話記錄,這雖然不能證明兩者之間一定有過權錢交易,但卻能夠補強受賄人關于他與行賄人之間熟識程度的供述,有利于增強被告供述的可信性。

第四,作為印證性間接證據的大數據證據。除了作為輔助證據之外,大數據證據還可能以實質證據的身份用于證明案件的主要事實,但往往以間接證據的方式呈現。與直接證據不同,間接證據是需要通過分析推理才能證明案件事實的證據。在司法實務中比較常見的間接證據是實物證據和鑒定意見,它們往往需要與其他證據結合起來,一起證明待證事實。至于大數據證據,至今尚不存在通過大數據分析本身就能夠證明犯罪事實的情況,即使假設如此,大量數據之間也必須通過算法模型和推理邏輯來建立聯系,因此,將其定位為間接證據具有一定的合理性。例如,在高某開設賭場罪案中,法院的裁判文書指出,犯罪事實有受案登記表、立案決定書、戶籍資料、到案經過、大數據情報工作,嫌疑人違法犯罪記錄查詢登記表、認罪認罰具結書,證人楊某、邵某、許某證言,被告人高某供述、辨認筆錄、簽認照片、現場勘驗筆錄等證據證實,足以認定被告人高某以營利為目的,結伙開設賭場聚眾賭博,其行為已構成開設賭場罪。(15)參見“廣東省茂名市電白區人民法院(2019)粵0904刑初711號刑事判決書”。雖然裁判文書中記載的關于大數據證據用于證明的待證事實到底是哪一要件事實,但是,該表述似可以理解為一項獨立的、對待證事實有證明價值的間接證據。

(二)大數據證據在刑事司法中的作用方式

第一,基于海量數據的數據庫比對。在當前,犯罪行為人在實施犯罪的預備、實行、終了之后的整個過程中,不僅會遺留下傳統的物理痕跡信息,還會在特定計算機系統、網絡平臺以及服務器中遺留下諸多電子痕跡信息。而所謂數據庫比對,就是指將偵查中的有關個人遺留下的數據與其他為了偵查取證、刑罰執行、預防犯罪等目的而事先建設形成的數據庫中的數據進行比對,以期實現數據信息的同一認定。在很多國家的刑事司法實踐中,數據庫比對在確定被追訴人身份、查明案件事實方面正扮演著越來越重要的作用。例如,在德國,數據庫比對被區分為兩種:柵網追緝和數據比對,前者是針對特定犯罪類型(如毒品交易或有組織犯罪),在有急迫必要的情形下,對一些數據集進行比較。(16)例如,在知曉恐怖分子在繳納電費時,往往不會以自己名義直接繳納,而是經由房東代繳。因此,偵查機關就會先篩查電力公司的用戶數據,然后將用戶數據與申報紀錄比較,以此找到那些潛在的恐怖主義犯罪嫌疑人。參見[德]克勞斯·羅科信:《刑事訴訟法》,吳麗琪譯,法律出版社2003年版,第72頁。后者是更一般意義上的數據比對,這種數據比對所使用的數據都是已經獲得證實的,因此,這種對比不用滿足柵網追緝的特別要件限制(如特定犯罪類型、補充性、法官準許等)。(17)參見[德]克勞斯·羅科信:《刑事訴訟法》,吳麗琪譯,法律出版社2003年版,第72-73頁。在我國,截至目前,公安機關內網運行的各類信息系統已達7000多個,已建成以全國人口信息庫為代表的八大全國公安基礎信息庫(全國重大案件、在逃人員、出所人員、違法人員、盜搶汽車、未名尸體、失蹤人員、殺人案件),存儲了數百億條基礎數據。(18)參見艾明:《新型監控偵查措施法律規制研究》,法律出版社2013年版,第169-170頁。具體到個案運用中,例如,在羅某妨害公務案的再審刑事判決書中,法院查明:2019年3月28日,江蘇省公安廳刑警總隊出具的《關于核查不明身份犯罪“許某”的相關情況》,其中記載:通過大數據信息研判、人像比對等手段,發現許某疑似身份信息為羅某,女,身份證號……,戶籍在……。(19)參見“江蘇省無錫市新吳區人民法院(2019)蘇0214刑再1號刑事判決書”。

第二,基于算法模型的大數據分析。大數據的研究者預測,未來的數據爆炸會衍生出以下四種數據:過程數據(傳統商務過程產生的數據)、環境數據(包括機器的狀態、大氣的各種參數、人體的各種指標)、社會行為數據(如微信、微博等社交媒體產生的數據)和物理實體的數據(未來的萬事萬物,任何一種物體背后都會有一個數據包與之對應)。(20)參見涂子沛:《大數據》,廣西師范大學出版社2015年版,第358頁。這些數據痕跡將具備更可靠的信息存儲機制,而不再只是依賴于人類稍縱即逝的記憶。除非基于“被遺忘權”制度被要求刪除之外,這些數據痕跡會永久地留存在虛擬空間或特定的存儲介質中。(21)參見[美]麥爾荀伯格:《大數據:隱私篇》,林俊宏譯,天下遠見出版公司2015年版,第21-27頁。這些數據體量更大,結構更繁雜,既包括了結構化的數據,也包括了半結構化和非結構化的數據。此外,在對數據進行分析時,也并不存在一個現存的、直接相關的數據庫可供比對,相反,需要設計一套算法模型去深度挖掘這些看起來雜亂無章的數據。甚至,今后會越來越多地涉及通過訓練機器,進而讓機器去識別、辨認和分析海量數據,最后形成分析報告。隨著數據量幾何增加,數據共享的增強,以及數據挖掘技術的發展,未來可供偵查機關獲取的大數據證據可能涉及很多方面,包括資金數據分析、物流數據分析、發票數據分析、軌跡數據分析、通訊數據分析,等等。以資金流轉數據的分析為例,“在資金流轉過程中,會留下流轉人、流轉人電話、流轉人郵箱、流轉人微信號、流轉人QQ號碼、流轉卡、流轉卡密碼、流轉平臺、流轉終端IP、流轉時間、流轉空間、流轉賬戶、流轉賬目、與流轉人之間的關聯、支付密碼等信息。”(22)參見李雙其等著:《大數據偵查實踐》,知識產權出版社2019年版,第26頁。通過運用大數據技術分析這些數據,就能夠構建出流轉賬號之間的關聯關系,也能夠構建出流轉人之間的關聯關系,甚至還可以進一步推理資金流轉的背后原因。

三、大數據證據在刑事司法中的屬性定位

作為一種新生事物,訴訟法和證據法上首先面臨的問題就是通過大數據技術獲取的證據材料能否作為證據使用。由于民事訴訟并不采行嚴格證明的方法,因此,學界一般認為,經由大數據比對或分析等獲取的大數據證據可以作為證據使用。(23)參見張吉豫:《大數據時代中國司法面臨的主要挑戰與機遇》,載《法制與社會發展》2016年第6期。但是,刑事司法的多數事項(尤其是實體事實)的證明乃遵循嚴格證明法則,因此,大數據證據能否以及如何作為證據使用就顯得更加復雜。

從司法實務上看,筆者調研訪談的一些法官和檢察官對大數據證據總體上還是持謹慎和保守的立場,這其中最主要的原因還是認為大數據證據的證據形式不好確定。此外,多數司法人員都對大數據分析的準確性和大數據證據的可靠性持懷疑態度,基本上不認為大數據證據在定案環節能夠發揮直接證明待證事實的作用。當然,隨著大數據偵查方法的廣泛運用,如前所述,也確實有一些案例會涉及如何運用大數據證據的問題。目前,法院在定位大數據證據的證據屬性和形式時,主要有以下四種操作:其一,將大數據作為一種鑒定意見或專家輔助人意見來對待。尤其是在一些涉及非法獲取計算機信息系統數據、提供侵入、非法控制計算機信息系統程序、工具等案件中,犯罪嫌疑人本身就涉嫌使用惡意程序。黑產人員往往使用了某些人工智能技術來訓練機器,并對大量數據進行清洗和識別(如破解互聯網的驗證碼),從而實現其犯罪目的。(24)參見萬春主編:《網絡犯罪指導性案例實務指引》,中國檢察出版社2018年版,第85-88頁。在這些案件中,一般都會有鑒定人或專家輔助人對被追訴人編寫、獲取或提供的惡意程序提供鑒定意見或專家輔助人意見。實際上,這些鑒定意見或專家輔助人意見也相當于在運用一定的大數據技術對犯罪嫌疑人所使用的人工智能工具及其危害結果進行驗證。其二,將大數據分析等作為一種破案經過材料或情況說明材料。例如,在何某貪污案中,到案經過證實:江蘇省如東縣公安局通過大數據比對,立即趕到廣東省廣州市海珠區中國人民解放軍陸軍第七十四集團軍醫院,將正在該醫院骨科住院治療的李某抓獲。經訊問,李某供述其真實姓名叫何某,并如實供述其貪污關某農業銀行公款一百多萬元并逃跑到廣東的犯罪事實。(25)參見“貴州省關嶺布依族苗族自治縣人民法院(2019)黔0424刑初99號刑事判決書”。其三,將大數據分析結果轉化為書證等證據種類,并予以使用。例如,在吳某走私、販賣、運輸、制造毒品案中,定案證據中包括有“廣西玉林市城市大數據防控系統圖片”,該圖片證實:胡某駕駛桂D***白色小車分別于2017年11月20日1時30分經過自良鎮容藤公路路段、1時43分經過縣底鎮冠塘村路段、2時04分經過容縣容州鎮城南車站路口進城、2時14分經過容縣G324線出城往玉林方向、2時33分經過玉容卡口進城、2時37分經過玉北大道五彩田園路口、2時40分經過玉北大道龜山路口、2時42分經過人民東路秀水收費站進入玉林城區的情況。(26)參見“廣西壯族自治區玉林市中級人民法院(2019)桂09刑初39號刑事判決書”。其四,將大數據分析報告作為一種單獨證據形式來對待,例如,在陳某盜竊案中,公訴機關提交了受案登記表、立案決定書、拘留證、逮捕證,鑒定意見通知書、抓獲經過、被告人戶籍信息、刑事判決書、刑滿釋放證明書、接受證據清單及手機發票,被害人黃某陳述,大數據警察支隊視偵報告、價格認定結論書,被告人陳俊供述及辯解、現場指認筆錄等證據證實。(27)參見“四川省瀘州市龍馬潭區人民法院(2019)川0504刑初347號刑事判決書”。但是,這種情況并不多見,也很難判斷該大數據視偵報告的具體形態到底是大數據分析報告本身,還是經由轉換之后的圖片或錄像。

從訴訟學理上看,直接否定大數據證據作為刑事證據的觀點并不多,相反,更多的學者會傾向于討論大數據應當以何種證據形式在刑事司法實踐中發揮作用。具體來講,其一,有學者從應然的角度提出,“未來的證據法當中,大數據分析報告有必要單列出來作為獨立的證據種類。”(28)參見何家弘等:《大數據偵查給證據法帶來的挑戰》,載《人民檢察》2018年第1期。其二,更多的學者則傾向于支持將大數據證據作為鑒定意見或檢驗報告的觀點,之所以會針對大數據證據的證據種類問題產生理論分歧,有一個癥結就是我國法定證據種類(形式)的封閉性,即大數據分析報告等與大數據應用技術相關的證據資料無法被我國刑事訴訟法中所明確規定的法定證據種類所囊括。究其本質,第一種觀點主張今后要單列一種新的證據種類,第二種觀點則認為應稍做變通,在立法無法及時修訂的情況下,先以最相近的證據種類來約束和規范大數據證據。

在我國刑事證據制度發展史上,法定的證據種類在早期因為具有種類特定、易于把握等特點,曾經起到過指導法官采納證據、規范法官自由裁量等功能,但是,隨著新型證據(如視聽資料、電子數據、大數據)的出現,封閉型證據種類制度陸續呈現出“規范滯后于實踐”的弊端,導致刑事司法人員面對新型證據時的適用困境。在1996年之前和2012年之前的刑事司法實踐中,是否承認和如何定位視聽資料和電子數據就是討論焦點之一,其根本原因也是因為當時的刑事訴訟法中沒有任何一種證據種類能夠很好地包容上述兩種新的證據形式。后來,1996年和2012年刑事訴訟法分別通過修法方式增加了視聽資料和電子數據作為新的證據種類,爭議才逐漸平息。當前,對于大數據比對或分析是否能作為證據使用,又將面臨類似的問題。其實,從證據法理論上講,封閉型的證據種類制度一直以來就飽受詬病,有學者就指出,“我國刑事證據法如此重視對證據形式無一遺漏的封閉式列舉的方式, 并不是適應現實需要的唯一方式。”(29)參見王敏遠:《論我國刑事證據法的轉變》,載《法學家》2012年第3期。一些學者也提出可以借鑒英美法系關于人證、物證、書證這一更具有開放性的證據分類方式。(30)參見龍宗智等:《司法改革與中國刑事證據制度的完善》,中國民主法制出版社2016年版,第16-18頁。事實上,對證據種類的精確界定也并非是沿襲歐陸法系傳統的證據法理論所強調的重點。在大陸法系國家,證據一般可以理解為包括了證據數據和證據方法,前者主要是指所有可能與待證事實直接或間接相關的信息內容;后者是指探求證據信息內容的調查手段,包括訊問被告、詢問證人、提示證物、朗讀文書、鑒定人出庭提供意見、履行勘驗等。證據數據必須透過特定的證據方法才能彰顯其證明價值。(31)參見林鈺雄:《嚴格證明與刑事證據》,法律出版社2008年版,第8-9頁。根據嚴格證明法則的要求,法定的證據種類并不是嚴格證明法則中的法定證據方法,因為證據種類只是證據信息存在的一種載體或形式,并不區分庭前階段和庭審階段,也就無法與刑事庭審的證據調查程序所要求的直接審理原則對應起來。而證據方法則是刑事庭審中所采用的法庭調查方法,與刑事庭審的實質化息息相關。正如林鈺雄教授所指出的,“(證據之種類)如果是指證據數據或其來源,則毫無意義可言,因為任何可能提供或隱藏與待證事實直接或間接相關信息的人、地、物,都是潛在的證據數據或其來源,刑事訴訟法以及其證據法則存在的目的,根本不在于教導偵查機關或法院要如何發覺或偵探可疑的犯罪信息,因此也無所謂限制或未設限制。”(32)參見林鈺雄:《嚴格證明與刑事證據》,法律出版社2008年版,第24頁。

在此,過于糾纏于證據種類分析,并不利于對某些新型證據形式進行深入分析,也不利于我國證據審查判斷規則以及法庭調查程序的發展。可以說,如果將理論重心放置在法定的證據方法而非法定的證據種類,則關于“大數據證據無法在法定證據種類中定位”的問題就并非是無法逾越的屏障。具體而言:其一,我國刑事訴訟法在第一審程序中直接或間接提及的法定證據方法包括了訊問被告人、詢問證人、宣讀書面材料、出示物證、要求鑒定人和專家輔助人出庭并提供意見、詢問鑒定人和專家輔助人,這其實給通過鑒定或檢驗對某些新的證據材料進行合法調查提供了可能。當然,我國關于鑒定業務的分類中并不存在大數據分析或大數據鑒定,但是,根據最高人民法院《關于適用〈中華人民共和國刑事訴訟法〉若干問題的解釋》第87條規定,對案件中的專門性問題需要鑒定,但沒有法定司法鑒定機構,或者法律、司法解釋規定可以進行檢驗的,可以指派、聘請有專門知識的人進行檢驗,檢驗報告可以作為定罪量刑的參考。可見,大數據證據可以參照檢驗報告的方式。此外,公安機關的相關規范性文件也給大數據偵查預留了一定的制度空間,例如,公安部在《公安機關執法細則(第三版)》第29-02條中將“查詢、檢索、對比數據”單列為一種偵查措施,規定進行相關偵查活動時,應當利用有關信息數據庫查詢、檢索、比對有關數據。(33)包括以下偵查活動:(1)核查犯罪嫌疑人身份的;(2)核查犯罪嫌疑人前科信息的;(3)查找無名尸體、失蹤人員的;(4)查找犯罪、犯罪嫌疑人線索的;(5)查找被盜搶的機動車、槍支、違禁品以及其他物品的;(6)分析案情和犯罪規律,串并案件,確定下步偵查方向的。關于大數據偵查的定位,也可參見程雷:《大數據偵查的法律控制》,載《中國社會科學》2018年第11期。因此,可以考慮根據上述規范,將大數據比對或大數據分析納入到電子數據勘驗或檢驗的范疇。大數據證據的證據方法可以區分以下兩種情況:基于海量數據的數據庫比對和基于算法模型的大數據分析。對于前者而言,雖然數據是海量的,但是,數據庫是現成的,其包含的數據往往是采用統一、規范的格式儲存的,因此,并不需要編寫復雜的程序去“挖掘”數據與數據之間的深層關聯點。甚至,該數據庫的比對也并不需要非常專業的數據處理知識就可以勝任數據之間的對比操作。鑒于此,該類大數據證據在證據方法上宜采用類似于電子數據勘驗的方法,在法庭審理過程中由控方傳喚從事數據庫比對的操作人員當庭展示,并交由對方當事人辨識或質證即可。對于后者而言,可以考慮今后增加新的鑒定業務種類,由專門的鑒定人出具鑒定意見和出庭接受質證的方式,或者在當前,以有專門知識的人提供檢驗報告和出庭接受質證的方式。其二,證據方法具有一定的開放性,并不必然對應某一種證據形式,相反,“同一種證據數據或來源,可能使用兩種以上的證據方法及程序加以調查及證明。”(34)例如,犯案工具送請鑒定并作成書面鑒定報告,該書面報告應向被告宣讀或告以要旨。并且,鑒定人出庭陳述鑒定意見時,原則上準用人證規定,并應于鑒定前具結,此外,法院應當庭提示該犯案工具令被告辨認,這種提示,屬于勘驗之證據方法。參見林鈺雄:《嚴格證明與刑事證據》,法律出版社2008年版,第14頁。這一原理也可以有效地應對大數據技術的內部多元性和復雜性。也就是說,當不能確定某一大數據證據到底是基于海量數據的數據庫比對,還是算法模型的大數據分析而獲取時,可以結合不同的證據調查方法,如電子證據的勘驗或檢驗,而核心目的就是為了更好地審查和判斷大數據證據的證據能力和證明力。

四、大數據證據的證據能力與證明力

(一)大數據證據的證據能力

作為一種新興的且帶有數據科學色彩的證據資料形式,大數據證據仍然需要經過司法機關對于證據能力和證明力的審查判斷,方能在事實認定和裁判結論上發揮重要功用。具體而言,在大數據證據的證據能力審查上,應能經受住相關性和科學可靠性的檢驗;(35)除了相關性和科學可靠性檢驗之外,還應當包括合法性檢驗。因為這涉及到大數據偵查程序的構建與分析,在此略去。在證明力評價層面,應結合大數據應用的信息連接點選擇、算法歧視可能性、邏輯架構合理性、算法結論穩健性等判斷大數據證據的可信性以及對待證事實的證明程度。

第一,相關性檢驗。證據材料與案件事實之間是否存在相關性,是決定證據是否具有證據能力的重要因素。因證據無相關性而導致證據無證據能力的,理論上稱為“因無關聯性而無證據能力”的證據。(36)參見萬毅:《論無證據能力的證據》,載《現代法學》2014年第4期。證據材料若要具備相關性,需要具備實質性和證明性兩個特征。例如,美國《聯邦證據規則》第401條規定,在決定一項證據材料是否具有關聯性的時候,法官必須考慮兩個問題:(1)實質性,即該證據材料與案件中的某個要素性事實是否有關。(2)證明性,即該證據材料具有邏輯上的證明作用——使某個事實更可能(或更不可能)。(37)參見[美]羅納德·J·艾倫等:《證據法:文本、問題和案例》,張保生等譯,高等教育出版社2006年版,第149頁。證據的相關性要求在我國刑事訴訟法及其司法解釋也有體現。《刑事訴訟法》第50條規定:“可以用于證明案件事實的材料,都是證據。”該法條可以解讀為,證據必須具備能夠證明案件事實的能力和屬性。(38)參見易延友:《證據法學:原則·規則·案例》,法律出版社2017年版,第101頁。對于大數據證據而言,它實際上是大量數據集和大數據技術的混合產物,因此,審查大數據證據的關聯性應主要包括兩個層面:一是數據與數據之間的相關性。值得注意的是,這種基于機器邏輯在數據與數據之間建立起來的相關關系往往是一種弱相關關系,甚至在邏輯結構上與基于人的經驗理性所能建立起來的相關關系有所區別。(39)參見劉品新:《電子證據的相關性》,載《法學研究》2016年第6期。在證據能力判斷的層面,應當對這種基于機器邏輯的相關關系保持開放態度,肯認這種機器邏輯的可采性。二是數據比對或分析結果與待證事實之間的相關性。這乃是法官經驗理性的范疇,可以參照一般證據類型的判斷原則。

第二,科學可靠性檢驗。作為一種以數據科學為依托的大數據證據,其證據能力的判斷還應當借鑒科學證據的可采性規則體系。在英美證據法上,一般有弗賴伊判例確立的普遍接受標準和多伯特判例確立的可靠性標準兩種。根據弗賴伊標準,科學證據只有在其所賴以成立的科學原理已得到普遍接受,才具有可采性。對于什么是普遍接受,判例要求該科學原理必須是公開發表且經過同行評議的,而且,這只是前提條件之一。也就是說,科學證據所依賴的科學原理在滿足上述條件的情況下,法院綜合考慮其它因素之后仍然可能作出該科學原理并未達到普遍接受的程度的判斷。(40)參見易延友:《證據法學:原則·規則·案例》,法律出版社2017年版,第260頁。但是,在多伯特標準下,法院審查科學證據可采性的標準有所放寬或更加靈活,法院列舉了五種參考因素:專家證言所依據的理論或技術是否能夠(且已經)被檢驗,控制和標準是否得到了保持,該理論是否已經受到了同行評議且已經發表,是否有已知的出錯率,該理論是否為科學界所一般接受。(41)參見[美]阿維娃·奧倫斯坦:《證據法要義》,汪諸豪、黃燕妮譯,中國政法大學出版社2018年版,第205-206頁。應當注意的是,該標準對于同行評議的發表并未作必須的要求。(42)參見[美]阿維娃·奧倫斯坦:《證據法要義》,汪諸豪、黃燕妮譯,中國政法大學出版社2018年版,第204頁。由于數據科學是一門新興的前沿科學,要求大數據分析所依賴的機器邏輯或算法模型能獲得普遍的同行認同似乎不太現實,因此,比較可行的是借鑒類似于多伯特判例中的可靠性標準。也就是說,依據科學可靠性來判斷大數據證據的證據能力。

表1:大數據證據的證據能力

那么,如何具體判斷大數據證據是否滿足科學證據的科學可靠性呢?這取決于大數據證據所依賴的算法模型是否以及在多大程度上能滿足可重復性、可解釋性和可公開性等要求。其一,可重復性,是指采取同樣的方法對同一對象重復進行測量時,其所得結果相一致的程度。“一個可靠的過程,是可重復、可信賴或具有一致性的過程。……只有當一個裝置反復應用后給出了同樣的讀數或圖像,這樣的裝置才是可靠的。如果該裝置沒有得到適當養護,就不能提供可靠讀數。”(43)[美]特倫斯·安德森等:《證據分析》,張保生等譯,中國人民大學出版社2012年版,第86頁。由于刑事司法遵循嚴格證明法則,若一種大數據比對或分析所依賴的處理方法或算法不具有可重復性,則顯然不能滿足多伯特判例意義上的可靠性標準,因此,不予考慮。其二,可解釋性和可公開性,主要是指算法模型是否可由開發者對其后臺原理進行充分說理,以及是否可公開其核心算法。在大數據領域,基于算法的可解釋性和透明性程度,可以將算法區分為以下三個等級:白箱算法、灰箱算法和黑箱算法。白箱算法是指算法可解釋強,而且算法透明度也高。基于成熟數據庫的身份、肖像、車輛等的數據庫比對,以及一些能夠合理解釋,而且也能公開算法的數據挖掘,可以稱之為白箱算法。通過白箱算法獲取的大數據證據(比對結果或分析結果)應認定為具有科學可靠性,可以作為間接證據使用。灰箱算法是指算法具有較強的可解釋性,但透明度卻較低。對于灰箱算法,其科學可靠性取決于某一個前沿領域的科學同行的評價和認定。若科學同行對其較強的可解釋性有所認同,同時又能提供其透明度低的合理原因,則可以認定其具有科學可靠性。對此,可以考慮作為輔助證據使用,用于彈劾或補強被告供述或證人證言的可信性。此外,這種灰箱算法應當得到重視,發揮其在偵查階段的證據生成功能。例如,經算法挖掘之后發現一些可疑的交易記錄,經核實之后,很容易通過其他傳統取證手段獲取到書證等重要證據。黑箱算法是指算法的可解釋性和透明度都較弱。對于黑箱算法,其雖然可以進行重復計算和分析,但是,因為涉及較難解釋的機器學習,算法模型和運算進程也幾乎無法公開,這種很大程度上還是應當將之作為偵查線索或情報信息對待。

(二)大數據證據的證明力評價

現代刑事訴訟針對證據評價普遍采行自由心證原則,即證據的證明力委諸于法官的自由判斷,但這并不意味著法官可以恣意擅斷、無所限制,相反,證明力評價還是要遵循論理法則和經驗法則的內在約束。(44)此外,還需要以具備證據能力為適用前提,以法律命定的評價法則為外在界限。參見林鈺雄:《自由心證:真的很“自由”嗎》,載《臺灣本土法學》2001年第27期。由于作為偵查破案線索、彈劾被告辯解和補強言詞證據的大數據證據并不致力于實體案件事實的證明,這里主要討論作為印證性間接證據的大數據證據。在事實證明上,間接證據蘊含著一定的悖論:雖然可靠性較高,但事實裁判者往往傾向于低估間接證據的證明力。(45)參見劉靜坤:《證據審查規則與分析方法:原理·規范·實例》,法律出版社2018年版,第57頁。然而,這一悖論并不適用于大數據證據。大數據證據可以作為間接證據使用,但由于其帶有數據科學的光環,一旦被事實裁判者所接受并采納為證據,其證明力就很容易被過度高估,從而強力影響甚至誤導事實認定者。對此,不能不引起學界和裁判者重視。在評價大數據證據的證明力時,宜斟酌以下幾個方面:

第一,信息連接點的選擇。大數據分析本質上是一種針對一系列重要信息點的關聯性分析,因此,首當其沖的乃是信息連接點的選擇是否契合數據的特性以及待證事實的特定需要。在分析美國911事件的時候,安德森等證據法學者就指出,事件發生后人們反復宣稱該事件本是能夠預測和避免的,因為美國情報機構此前已收到一些信息,但他們卻缺乏整理和分析這些信息的能力。他們沒有能力去連接信息點或者無法從大量數據中鑒別出某些有意義的信息。(46)[美]特倫斯·安德森等:《證據分析》,張保生等譯,中國人民大學出版社2012年版,第64頁。傳統偵查方法的局限也許恰恰是當前大數據分析的優勢。然而,在大數據分析逐漸流行之后,需要值得注意的也正是這些大數據分析所建立的連接信息點的選擇是否恰當。因此,事實認定者應重點審查個案中大數據應用的信息連接點(尤其是原始數據)本身的時新性、完整性和準確性。這些信息連接點的恰當合理性的選擇,由于具有一定的專業性,裁判者需要借助于對控辯雙方所提供鑒定人或專家輔助人等專業意見進行審查來實現。

第二,算法歧視的可能性。隨著信息點數量的增加,可能的組合數量會呈幾何數增加。算法模型的設計者需要決定采用哪些信息點以及采用何種組合模式,這其中,就要求在收集和審查判斷大數據證據時,數據庫的覆蓋范圍和算法模型的選擇要避免歧視性和強入罪化傾向。美國學者羅思就指出,算法的主觀性問題不僅在刑事司法之外的法律語境中很突出,例如,由大數據和人工智能技術進行的信用評分等看似客觀,但算法基礎幾乎總是與種族、性別和階級等相關聯,(47)參見趙萬一、侯東德主編:《法律的人工智能時代》,法律出版社2020年版,第190頁。其在刑事司法領域也很突出。偵查機關積極開發算法模型的核心目的,往往就是為了避免假陰性(錯放無辜),而非假陽性(誤判有罪)問題,“事實上,這些(算法)過程都存在隱藏的主觀性錯誤,這些主觀錯誤往往無法識別且不受控制,因此掩蓋了鏡像層和代理器背后的不合法或非法歧視。”(48)同①。為此,在進行大數據證據的證明力評估時,可以區分兩種類型的大數據證據:針對數據庫比對型的大數據證據,應注重對數據庫本身的樣本覆蓋范圍進行評估,如果數據庫中的數據僅代表某一些特定的人群,甚至是專門針對某一特殊群體建立的,則裁判者應對比對結論的可靠性保持謹慎態度;針對數據挖掘型的大數據證據,也應注重對算法模型的選擇是否存在歧視性和極端入罪傾向進行評估。

第三,邏輯架構的合理性。證據的證明力不僅取決于自身的可靠性,還取決于其與待證事實之間的關聯程度。在刑事司法中,涉及定罪量刑的待證事實被稱為終極待證事實,它也是承擔證明責任的控訴機關所需要證成的假說或主張。但是,終極待證事實的證明往往需要經由對一系列次級待證事實的證明得以實現。因此,一個證據的證明力乃取決于該證據與某一次級待證事實之間的推理鏈條是否牢固、合理和可靠;而對一批證據的證明力,不僅需要評估每一個推理鏈條(即每一個證據與次級待證事實之間的推理關系)的證明力,而且需要整合每一個單個證據的證明力,并進而決定這一批證據與最終待證事實之間的關聯程度。(49)[美]特倫斯·安德森等:《證據分析》,張保生等譯,中國人民大學出版社2012年版,第93頁。對于大數據證據而言,其證明力判斷同時涉及這兩個層面推理鏈條的審查判斷。一方面,裁判者需要保證每一個關鍵信息連接點與次級待證事實之間的推理關系為“真”,在大數據證據的審查判斷中也需要警惕,“一根熔斷的保險絲將要影響的,可不僅是造成其熔斷的插座”,(50)[美]特倫斯·安德森等:《證據分析》,張保生等譯,中國人民大學出版社2012年版,第321頁。還有可能導致整個案件的證明功虧一簣。另一方面,裁判者還應當審查該大數據比對或分析所依賴的整體邏輯架構。對此,似乎不宜停留在證據能力意義上的智能理性,建立在機器邏輯意義上的弱相關關系并不能滿足定罪量刑的證明要求。因此,為了保證刑事裁判結論的準確性和正當性,還是應當秉持法律理性,要求該邏輯架構能否符合一般有效的經驗法則。如林鈺雄所指出的,“如果法官想要采信某個并非一般有效的經驗法則,應該予以論證,說明法官為什么認為該經驗法則‘可以’作為導出結論的基礎。”(51)參見林鈺雄:《自由心證:真的很“自由”嗎》,載《臺灣本土法學》2001年第27期。

第四,算法結論的穩健性。在統計模型的建構中,為了保證統計結果的可信度,一般都會使用多種方法進行穩健性檢驗。在對大數據證據的可信性進行審查判斷時,也應當考慮穩健性檢驗問題。如果大數據分析結果能夠得到多種方法的檢驗,則說明該大數據證據的信度更佳。相應地,在用于證明待證事實時的證明力也相對更強。

結語

在域外,自從著名的科林斯案(52)關于科林斯案的介紹與闡述,參見[美]理察德·倫伯特編:《證據故事》,魏曉娜譯,中國人民大學出版社2011年版,第3-18頁。將“數字”引入以“文字”為主要論證工具的司法場域后,其所激起的漣漪就一直未曾平息過,只不過不一定能稱之為波瀾。固然,法律人可以以審慎而穩健的價值觀謬之以“數學審判”,并對帶著數學精確性光環的證據保持警惕。但是,無可否認的是,虛掩的法律之門已不能對概率、數學、數據的浪潮回避太久。在我國,在涉及海量視頻、文件或實物的案件(如快播案)中,或者某些有科學背景的被追訴人在辯護(如周文斌案)時,與數據和數學密切相關的抽樣取證方式或概率辯護策略也已經悄然登場。然而,從抽樣取證到大數據偵查,從概率統計到算法模型,這一切似乎來的太快,并未給司法工作者和理論學者過多的思考時間。隨著數據時代的到來,大量數據無可避免地需要進行大數據比對和分析,并形成大數據證據。本文只是對大數據證據在刑事司法的表現形態、作用方式、屬性定位、證據能力與證明力做了一個初步的討論,值得進一步挖掘的深層論題還很多。至少對于大數據證據來講,它仍然面臨著工具理性和價值理性兩個維度的悖論和困境,仍然需要大數據證據的收集者和審查者去面對。

首先,從工具理性的角度講,傳統偵查方法能獲取證據的數量不足,留給追訴者和審判者的案件信息點也較有限,而大數據取證著力解決的是更松散、更零星、更海量的數據的提取和分析,形成大量案件信息連接點的有效組合,可以說,大數據應用技術生成次級待證事實與形成推理邏輯鏈條的能力更強了。然而,在此之前,抽樣取證問題已經引發爭議,包括抽樣方法是否合理,抽樣程序是否規范,抽樣結論是否能推及整體,以及基于抽樣取證進行刑事司法證明的可行性、風險及限度,等等。同樣地,來源于大數據應用技術的大數據證據是否就一定能保證客觀、真實和準確呢?正如羅思所指出的,“許多犯罪偵查設備和軟件往往被‘晦澀的黑匣子’所掩蓋,這些‘黑匣子’程序在閃亮的鋼鐵裝置或計算機代碼中‘隱秘工作’。這些‘黑匣子’程序,因為他們的機械外觀和顯然簡單的輸出,表面上具有客觀性和確定性。”(53)參見趙萬一、侯東德主編:《法律的人工智能時代》,法律出版社2020年版,第190頁。抽樣取證建立在抽樣統計的基礎上,尚有一定的統計學基礎作為支撐,但是,大數據比對結果所依賴的數據庫以及大數據分析結果所依賴的算法模型(尤其是黑箱算法),其數理邏輯架構的合理性到底有多強,也十分值得審視。當然,并不能說大數據證據就一定劣于抽樣統計獲取的證據,至少在大數據時代,抽樣統計有其無法回應的現實問題,大數據應用技術有其不可或缺的實際功效。也許,今后我國刑事司法不得不面對的尷尬是:既需要走出傳統上嚴重依賴言詞證據的窠臼,又需要面對一些新型證據(如大數據證據)所帶來的困惑。對于后者,它是客觀證據,但相關性和可靠性又存疑;它是間接證據,但又很容易因其數據科學的光環而誤導裁判者的心證。

其次,從價值理性的角度講,不得不面對的是,以國家公權力為后盾的算法開發是否能足以保證算法模型的無歧視性,刑事司法機關所利用的大數據偵查方法是否符合正當程序的要求,以及由此獲取的大數據證據是否能經受住嚴格證明法則的合法性檢驗。此外,在大數據時代,追訴機關在大數據獲取和分析上占有絕對的和支配性的優勢,不僅享有國家巨額資金去建設的各種數據庫,同時也有權在必要時調取社會機構數據庫中的數據,相反,辯護方則處于明顯的劣勢。可以說,控辯雙方在數據比對、數據挖掘和數據處理能力等方面存在巨大的實力差距。這不可避免地會加劇我國以往偵查中心主義和控辯失衡情況。這同樣是檢視大數據證據時無法繞開之問,也呼喚著未來更具法律正當性的算法模型和控辯格局的到場。

主站蜘蛛池模板: 欧美日本二区| 情侣午夜国产在线一区无码| 亚洲中文无码h在线观看| 亚洲第一色视频| 欧美一区二区三区国产精品| 国产精品亚洲片在线va| 熟女日韩精品2区| 91亚洲影院| 久久一级电影| 毛片免费视频| 亚洲精品在线影院| 无码精油按摩潮喷在线播放| 欧美啪啪一区| 国产精品一区二区无码免费看片| 91麻豆国产视频| 久久精品国产免费观看频道| 一区二区欧美日韩高清免费| 欧美成人h精品网站| 五月婷婷导航| 欧美a在线看| 亚洲av综合网| 精品国产三级在线观看| av无码一区二区三区在线| 亚洲第一区精品日韩在线播放| 欧美性久久久久| 国产区在线观看视频| 国产乱人免费视频| 亚洲青涩在线| 麻豆精品视频在线原创| 青草精品视频| 欧美精品成人| 97在线国产视频| 色婷婷色丁香| 一级在线毛片| 欧美日韩中文国产va另类| 国产精品久线在线观看| 欧美综合区自拍亚洲综合天堂| 免费大黄网站在线观看| 亚洲视频在线观看免费视频| 日韩成人在线网站| 美美女高清毛片视频免费观看| 国产麻豆aⅴ精品无码| 亚洲第一国产综合| 日韩精品成人在线| 亚洲欧美日韩久久精品| 丁香婷婷在线视频| 91亚洲视频下载| 欧美yw精品日本国产精品| 亚洲成人精品在线| 午夜电影在线观看国产1区| 天天操天天噜| jizz在线免费播放| 99热这里只有精品2| 中文字幕调教一区二区视频| 国产91在线|日本| 中文字幕欧美日韩高清| 国产成人三级| 亚洲一级色| 欧美一级高清视频在线播放| 99精品国产高清一区二区| 9丨情侣偷在线精品国产| 亚欧美国产综合| 亚洲第一黄色网址| 欧美日韩国产系列在线观看| 精品乱码久久久久久久| 国产美女在线观看| 色九九视频| 伊人天堂网| 最新日本中文字幕| 亚洲av中文无码乱人伦在线r| 国产高清在线观看| 亚洲无码高清免费视频亚洲| 亚洲一区二区成人| 国产免费福利网站| 亚洲91精品视频| 国产一区二区三区在线观看免费| 高清久久精品亚洲日韩Av| 青青草国产在线视频| 日韩经典精品无码一区二区| 国产靠逼视频| 欧美在线视频不卡第一页| 国产丝袜丝视频在线观看|