阮堂輝,張 晟
(1.中南民族大學法學院,湖北武漢 430074;2.武漢市公安局洪山區分局,湖北武漢 430070)
網絡大數據時代的到來,已經深深影響乃至徹底改變了我們的生活和工作。將大數據技術運用于司法領域是值得研究與期待的。然而由于法學研究者對跨學科的大數據計算機學科不了解,現有法學研究對大數據、人工智能的運用解釋常常以“黑盒”無法展示一筆帶過。本文試圖打破這一“黑盒”慣例,針對定罪標準這一研究對象,將網絡現貨投資交易案這一新型網絡犯罪作為研究載體,將大數據這一新技術作為研究手段,通過數據挖掘決策樹CHAID 算法對案例進行定量分析,探討大數據技術在司法裁判定罪標準上的運用。近年來,“智慧法院”工程大力推進,為建立基于案例指導的司法審判制度提供了海量的決策數據,奠定了基礎。在此,筆者試圖將大數據技術運用到刑事訴訟定罪裁判中,通過算法對大量案例數據進行運算,實現基于審判規則和案例支持的新型定罪決策模式,使審判決策結果形成均衡統一的標準體系。
大數據技術,是一種先進的信息技術,是指在各種類型的海量數據中,運用各種方法快速獲得有價值信息并用于決策的技術。大數據運用于決策的概念如圖1 所示。

圖1 大數據運用于決策的概念示意圖
如圖1 示意,以具有4V特征的具體量、多種類的數據作為原料,通過數據挖掘算法進行高速度加工,從海量數據中提取規律,提升信息價值密度,用以智能決策。[1]
大數據的最大功能是預測。預測的原理基于數理統計定律——大數定律,即在一定條件下具有多種可能結果的現象可視為隨機事件。隨機事件的出現頻率將會在某數值附近波動,隨著樣本次數的增加,隨機事件的頻率近似于它的概率。數理統計學上的經典例子是拋一枚質地均勻的硬幣,在小樣本實驗中,正反面出現的次數是沒有規律的,然而當拋擲次數達到上千萬次等極大次數時,正反面出現概率達到各50%,這反映了實驗條件硬幣質地均勻。以司法定罪標準運用來分析,一個案件得到的判決結果是無罪、此罪、彼罪多種,其結果是或然的,然而大量重復進行這種判決實驗,判決結果就會顯現規律,其結果就會與固定事實構成的案件相對應。這種固定性規律便是預測依據。
大數據能否良好作用于定罪裁判,最終還是要看其能否有助于司法裁判價值的實現。下面,筆者以大數據技術的決策樹CHAID 算法在定罪裁判中的具體運用,結合司法裁判“準確、及時”兩個價值,論述實務意義。
準確的司法證明依靠邏輯法則和經驗法則。[2]從經驗法則運用上看,筆者認為大數據背景下的證明標準與傳統司法裁判天然統一。其一,裁判來源都是判例;其二,本質上都是類比推理,先歸類再相比。具體識別上分三步:(1)識別出一個可以進行推理的基點;(2)描述基點情況與問題情況相同或相似及不同或不相似的那些事實情況;(3)判斷這些事實上的相同點或不同點何者更為重要。[3]大數據背景下的證明標準具體運用中,算法恰恰是以類案判決為依托,通過層層計算迭代,推導出最終裁判結果的。同時需要指出的是,這種類比推理的基點就是證據鏈的節點,在網絡現貨投資交易類案中,修改后臺數據、平臺缺乏國家經營范圍批文、資金直接打入個人賬戶為詐騙罪定罪證據鏈中的中心節點,其他證據以此進行鏈式發散。
從邏輯法則運用上看,筆者認為大數據背景下的證明標準與傳統司法裁判有三個相通點。
一是邏輯基本規律相通。邏輯基本規律是邏輯抽象概括出來的思維活動必須遵循的原則,其歸納、概括的特征與司法證明相契合。首先,大數據背景下的司法證明滿足同一律。即同一思維過程中,必須保持自身確定、同一,公式表達為A=A。在當事人與法官圍繞說理和判斷所形成的控辯審三方協同制約關系中,要求對爭議問題予以明確界定,并在具體證明過程中保持前后一致。具體到本文研討的網絡現貨投資交易類案中,縱然案件事實紛繁復雜,然而一旦這種案件類別明確,核心爭議事實就是詐騙事實的認定,借助大數據手段對案件事實進行分解、組合、重構后,不難發現調控后的數據就是案件主要事實,并以此適用實體法解決糾紛。其次,大數據背景下的司法證明滿足排中律,公式表示為A V『A。排中律要求主體在同一思維過程中,在相互矛盾的思想之間必須作出明確的選擇,禁止在大是大非問題上騎墻居中、首鼠兩端。具體到本文研討的網絡現貨投資交易類案中,在根據大量案例產生的決策樹圖中,任何一個具體證據的輸入都對應唯一明確的輸出路徑,而不會“騎墻”。最后,大數據背景下的司法證明天然滿足充分理由律,公式表示為【A∧(A→B)】→B,充足理由律的邏輯要求理由必須真實且與推斷之間要有確定的邏輯聯系,從理由能夠推出所要論證的論題。具體到本文研討的網絡現貨投資交易類案中,就是在形成決策樹拓撲中,進行IF-THEN 語句的天然展示。
IF(修改盤口數據=是)THEN 詐騙罪=是
IF(修改盤口數據=否and 平臺經營批文=否)THEN 詐騙罪=是
IF(修改盤口數據=否and 平臺經營批文=是and 交易流水=是)THEN 詐騙罪=是
ELSE 非法經營罪=是
二是證據的關聯性闡發相通。證據必須具有關聯性。英國證據法學者墨菲認為:“關聯性不是一個法律概念,而是一個邏輯概念,它刻畫了證明中證據和證據指向的爭議事實之間的一種關系。如果從邏輯意義講,證據在某種程度上有助于證明或反證爭議事實,那么證據就與爭議事實相關,否則便是不相關。”美國證據學家威格摩爾致力于評估證據的證明價值,并引進了一個或然性比例表達式。該表達式被定義為:單一證據e 在假定被告人有罪時的可能性與假定被告人無罪時的可能性的比率,用公式表達就是∧e。若∧e=1.0,則假定被告人有罪的可能性和假定被告人無罪的可能性相等,此時證據e 不具有關聯性。如∧e >1.0,證據e 就是對被告人有罪的有利證據;如∧e <1.0,證據e 就是對被告人無罪的有利證據。[4]而在本文研究的網絡現貨投資交易類案的證據構成中,通過層層演算大量判例中輸入證據與輸出裁判的概率關系,從而判斷出各個證據與裁判結果的關聯性強弱,并迭代計算形成整體構成。在修改盤口數據、平臺經營批文、交易流水三個自變量中,之所以存在修改盤口數據>平臺經營批文>交易流水層次定量關系,是因為在信息增量運算中GAIN(修改盤口數據)>GAIN(平臺經營批文)>GAIN(交易流水)。即修改盤口數據這個要素最能區分詐騙和非法經營二罪,關聯性最強,其次是平臺經營批文,最后是交易流水。這既有局部證據與裁判結果的關聯性熵值,又反映了涉案構成證據的整體聯系。
三是司法證明事實發現階段的實質邏輯推理相通。任何一個證據和證明對象之間的關系實質上都是一種邏輯推論關系。這種推論依靠經驗法則,但也有其內在邏輯聯系。彼特·墨菲將這一推定結構稱之為“涵括”(generalisation),即:
如果A,那么B,除非C

王亞新教授系統地概括如下:“第一,經驗法則是根據已知事實來推導未知事實時能夠作為前提的任何一般的知識、經驗、常識、法則。第二,經驗法則應該是人們從個別經驗的積累中抽象、歸納出來的知識或常識。第三,經驗法則往往不能采用全稱判定的形式來陳述,而只是蓋然性的命題。”[5]而在本文探討的網絡現貨投資交易類案最終形成的決策模型中,其判決輸出結果恰恰是以這種涵括的方式呈現的。
法律推理上,演繹是從一般到個別的思維過程。司法上,經典三段論推理就是演繹,由可適用于該案的一般性法律規定的大前提、已確定的具體的案件事實的小前提和關于該案的法律結論構成,從大小前提出發得出某種必然結論。三段論演繹推理在法律推理過程中不可或缺,能夠維護法律的體系性、一致性和安全性,保證實現普遍形式正義的法律價值。然而,司法實踐也表明演繹推理也有不足之處,主要表現為演繹推理主要運用于法律適用階段,即在實在法范圍內的“找法”,而法律推理的小前提仿佛是從天上掉下來的一樣。實際上事實不僅是證據法的邏輯起點,也應該成為法律推理乃至整個法學的邏輯起點,而傳統三段論演繹推理在事實發現方面缺乏敘述。[6]
然而,大數據背景下的定罪標準恰恰是通過歸納類案中的大量判決,形成了對傳統三段論演繹推理的一種補充。歸納,是演繹的逆向思維,是從個別到一般的思維過程。筆者認為,裁判者在進行事實認定時,普遍是通過摘取可信度高的證據作為基礎,構建符合心理規律和證據敘事的故事來進行裁判的。法學家彭寧頓和黑斯蒂將其概括為故事模型,即“在處理證據信息時涉及到兩個背景信息,一是頭腦中對于完整的故事版本的概念認識和預期;二是他曾經驗過的與該案件事件類似的事件。”[7]其中第二個背景信息恰恰是基于生活經驗和司法經驗的對于某一類案事實構成的歸納,而本文探討的網絡現貨投資交易類案之所以成為疑難案件,就在于案件過于新穎,對于一個一時一地一事的裁判者而言,缺乏事實歸納經驗。大數據技術通過歸納海量案例,通過運算形成了一般事實架構,并且這種歸納是正反兩面的事實歸納,既歸納了什么樣的證據構成能夠證明成立此罪,又歸納了什么樣的證據構成不能證明成立此罪,而要成立彼罪。法官作為有著共同經驗的群體,借助大量經驗判例進行歸納完善事實構成,從或然走向必然。當然,歸納具有或然性,由于此種歸納是不完全歸納,確有可能被某一反例的出現而推翻結論。如圖2 所示。

圖2 具體類案下的歸納演繹推導
人類社會的發展途徑之一就是提高效率,各種科學技術的發明運用也多為提高效率服務,大數據技術在定罪標準上的運用也不例外。一方面,從執法角度看,大數據的運用有助于幫助執法辦案部門厘清事實輪廓,明確取證重點,提升辦案質量。另一方面,從司法角度看,法學家賈德·賽德和J·愛德華·羅素曾進行過如下實證研究:實驗組向被試者提供25 項與案件相關的證據主張,而被試者大都僅僅依據3 至5 個關鍵證據便作出了裁決。[8]也就是說,人們在作出判斷時會選取那些更具代表性的證據,并將其作為判斷基礎。大數據恰恰就是輔助裁判者選取代表性的關鍵證據,因此有助于統一證明標準,提升審判效率。
筆者以新近發生的一起案件為例:2017 年3 月,武漢市某區公安分局打掉一特大網絡犯罪團伙,該團伙以網絡現貨投資交易為包裝實施犯罪。現場抓獲涉案人員282 人,扣押涉案電腦上百臺,涉案手機上千部。經查,2014 年以來,犯罪嫌疑人崔某等人共同出資在武漢市某區成立“浙江昊鼎聚富商品經營有限公司”,其中,犯罪嫌疑人崔某為公司實際負責人,并以“昊鼎公司”的名義先后與“浙江新華大宗商品交易中心有限公司”(現已封停,后臺數據不可查)、“湖南久豐國際商品現貨交易市場有限公司”(現已封停,后臺數據不可查)等多家公司簽約,成為其加盟會員單位,由“浙江新華大宗商品交易中心有限公司”“湖南久豐國際商品現貨交易市場有限公司”提供現貨交易盤(現盤面已封停,后臺數據不可查),后陸續招聘犯罪嫌疑人謝某、陳某等同案共計282 人實施犯罪。上述人員在明知“昊鼎公司”與客戶之間的經濟利益“對賭”關系,仍通過QQ、微信等聊天工具發送虛假的盈利截圖、夸大客戶收益等手段,誘騙客戶到該公司簽約的交易平臺開戶以對貴重金屬、原油現貨等虛構的交易進行投資,再采取冒充專業投資分析師、引導客戶頻繁操作、故意提供反向行、止盈不止損、高杠桿重倉操作等方式,致使客戶快速虧損,并產生巨額手續費,從而達到非法占有客戶資金的目的。此后,根據客戶交易的手續費、虧損額、過夜費等給予公司股東、總監、經理、公司其他負責人及業務員相應比例的提成。經查,利用上述手段,該團伙僅通過“浙江新華大宗平臺”“湖南久豐國際商品有色平臺”就先后造成被害人鄧某等數萬名客戶虧損共計人民幣8 億余元。
從本案基本情形可以看出,網絡虛擬現貨交易案存在以下特征:一是涉案人數多,由于網絡虛擬現貨的平臺公司和加盟商均是以公司方式運作,犯罪人數動輒上百。二是被害人多,虛擬平臺面向社會開放,導致受害人眾多。這些導致了證據體量大,調查工作量大。如圖3 所示。
二是犯罪有層級,層級之間物理隔絕,數據隔離,風險隔斷。平臺在交易層級上設有特別會員和會員。特別會員,即“新華大宗現貨交易平臺”“湖南久豐國際商品有色平臺”掌握核心后臺行情走勢數據,可以在會員賭不過投資者時,為會員對沖風險敞口,甚至修改盤面走向,在本案中,由于在案件收網時,兩上級平臺已被舉報查封,無法獲取后臺行情數據。加盟會員單位“昊鼎”公司,以簽訂合同方式約束利益分成,會員單位是投資者的直接交易對手,投資者無論買入還是賣出都會與會員形成“對賭”。
三是平臺虛擬運營。所有交易平臺均不具有價格發現功能。平臺現行的做法是引入外部價格,這些價格實質上是將境外實時行情價格換算為人民幣價格。如“昊鼎”公司客戶的任何交易手買入賣出均不影響現貨價格走勢,走勢完全為外部數據導入。①參見該案訊問筆錄。

圖3 網絡現貨投資交易案犯罪層級圖
四是指導“老師”偽造資質,在封閉平臺虛擬提供交易信息,指導虛假的雙向交易、T+0 連續交易、保證金杠桿交易。
五是以各種費用名義,實現非法營利。犯罪交易平臺收入來源主要為交易商繳納的會員費,以及與交易商對投資者在平臺交易生成的各種交易費用(包括交易手續費、隔夜費、點差)的分成。所謂隔夜費,即客戶只要持有倉位隔夜,不論是買持倉還是賣持倉,都必須向自己的交易對手繳納一定費用。
本案焦點在于如何根據證據或有關事實進行定罪,涉及罪名是非法經營罪和詐騙罪。從中國裁判文書網公布的判決來看,網絡現貨投資交易案以非法經營罪判決的有32 例,以詐騙罪判決的有179 例。
分析網絡現貨投資交易案件的211 起判決,不難發現,商業化的同質運作使得這些平臺運作模式、盈利模式、人員管理模式大同小異。然而,卻出現了定罪標準不統一導致“同案不同判”的問題。例如,針對反向喊單,“對賭”協議的犯罪事實,浙江省寧波市江北區人民法院在一審周楊波、祝賀瓊、張清等詐騙案中認定為詐騙罪,①從全國判例來看,存在以下七種事實之一,可能適用詐騙罪:(1)指導交易“分析師”根本不具備金融從業資格;(2)平臺交易數據、K 線圖與國際正規現貨交易版完全同步,但是數據定期開放端口導入,交易數據封閉獨立;(3)明知公司與客戶之間的經濟利益“對賭”關系,公司要盈利客戶就要虧損,仍通過QQ、微信等聊天工具發送虛假的盈利截圖、夸大客戶收益等手段,誘騙客戶到該公司簽約的交易平臺開戶投資;(4)引導客戶頻繁操作、故意提供反向行情、止盈不止損、高杠桿重倉操作等方式,致使客戶快速虧損,并產生巨額手續費;(5)名為現貨交易平臺,實則完全虛擬買賣交割,沒有現貨實物、沒有現貨倉儲;(6)有的平臺為私自架設沒有省市政府批復備案,有交易平臺后臺商品價格數據可以修改;(7)有的平臺客戶在入金后,錢款沒有打入公共資金池,而是進入了私人銀行卡。而廣東省深圳市寶安區人民法院在一審吳筱、吳一帆非法經營案中面對同樣事實、證據采集時卻認定為非法經營罪。②對于非法經營罪的適用,國務院文件規定:除依法設立的證券交易所或國務院批準的從事金融產品交易的交易場所外,任何交易場所均不得將任何權益拆分為均等份額公開發行,不得采取集中競價、做市商等集中交易方式進行交易。現貨交易在國際市場是合法公認受保障的,但我國此類交易制度尚未建立。我國合法的交易所只有八家,分別為:上海證交所、深圳證交所、中金交易所、上海期貨交易所、鄭州商品交易所、大連商品交易所、全國中小企業股份轉讓系統、上海黃金交易所。然而,現貨交易的需求又是存在的,省市地方政府為活躍地方經濟,批文設置了一批現貨交易平臺。但是,金融創新不足和金融監管不到位導致現貨交易種種亂象的發生。“浙江新華大宗平臺”“湖南有色平臺”就是在浙江省杭州市、湖南省政府批文成立的交易平臺。按照相關法律規定,證券、期貨、保險業務,或者資金支付結算業務的批準部門為國家有關主管部門,因此,地方各級政府批文的現貨交易平臺均為非法經營。因此,非法經營罪可視為網絡虛擬現貨投資交易類案的兜底判決罪名。“同案不同判”不免導致司法機關將一些互聯網創新經營模式擴大為打擊對象,或者對應該予以嚴厲打擊的罪行,由于認識不到位而予以放縱。大數據技術介入,可能會有效解決上述問題。
大數據在刑事定罪標準上的運用以既有刑事判決書、起訴書為研究對象,采取數據挖掘決策樹CHAID 算法對類案判決進行運算,從中總結提煉概括,為審判定罪提供支撐。CHAID 算法,是決策樹分類算法的一種,通過采用自頂向下的遞歸方式構造,以實例為依據,從一組無序、無規則的實例數據中推理出用于決策樹形成的分類規則,并根據分類的結果進行預測。CHAID 算法對于離散型隨機變量較為有效。如圖4 所示。

圖4 數據挖掘流程
定罪的對象是行為,大數據就以100 起判例進行核心謂詞歸納,建立15 項多維數據,如表1 所示。

表1 實證數據項
參數項采用離散數據,設定選擇項為是否,如表2 所示。

表2 變量參數
適用IBM SPSS Statistics 26 軟件,對100 起網絡現貨投資交易案進行決策樹CHAID 分析,以判決結果為因變量,以證據詳項數據集為自變量。如圖5 所示。

圖5 SPSS 進行CHAID 決策樹生成
經遞歸迭代后得到決策樹輸出,如圖6 所示。
決策樹結構完整地展示了網絡現貨投資交易案的定罪標準,即修改后臺數據、平臺缺乏國家經營范圍批文、資金直接打入個人賬戶為此類案定罪規則。有必要從法理上解釋下大數據規則。
法理上看,詐騙罪基本犯罪構成是:行為人虛構事實、隱瞞真相導致被害人陷入錯誤認識,并基于錯誤認識處分財產,行為人獲取財產、被害人遭受財產損失。根據刑法理論,構成要件之間存在刑法上的因果關系,才能構成犯罪。行為人虛構事實或隱瞞真相亦可能是民事欺詐行為,并非刑法意義上的詐騙。相較于民法意義上的“欺詐”,“詐騙”的外延要窄得多,不僅強調行為人不法占有的目的,還強調行為造成他人錯誤認識從而錯誤處分財產。在相關交易中,如果行為人是在不明知的情況下利用虛擬交易平臺,不在經過政府部門批準的交易場所交易,或者通過修改交易軟件系統數據操縱行情等從中牟利,屬于虛構事實、隱瞞真相,造成虧損的,因二者之間具有直接的因果關系,應當構成詐騙罪。而關于手續費及客損,對于進行涉案交易需支付手續費是明知的,雖然業務員的鼓動和誘導對其高頻交易起到了一定的促進作用,但并非直接和主要的原因,并非因該行為對手續費的損失產生了錯誤認識進而作出相應處分。關于反向建議,分析師通過自己的分析,判斷行情趨勢,然后通過業務員向客戶給出其自認為的反向行情。但其給出的行情顯然并不必然與真實行情相反,因為分析師自認為判斷正確的行情是其主觀判斷,而不是確定的結果,任何人都不能保證對行情的判斷是百分之百準確的。具有正常、理性思維的成年人可以自主決定如何交易,且明知交易有風險。鼓動、誘導高頻交易以及提供反向建議只能影響客戶的判斷,而不嚴格約束客戶的交易行為。因此,提供反向建議與損失亦不存在直接的因果關系,并且還不能排除部分交易是未受上述的影響而自主決定的,從而,該部分交易費的損失以及交易損失更是與上述行為無直接關系。在案證據也證實了部分交易行為并未遵循分析師提供的建議,而是自主的操作。另外,關于業務員有采用虛假身份結識并取得信任的行為,但該行為與該損失亦無直接的因果關系,投資人的損失是因為進行涉案交易導致的,而任何交易行為都有風險,其對這一點應當是明知的。

圖6 生成決策樹
從運算上看,有兩個層面的問題需要解釋。一是根節點的提取意義。修改盤口數據、平臺經營批文、交易流水進入個人賬戶三個自變量中,修改盤口數據、平臺經營批文、交易流水層次定量高低關系,是因為在

信息增量運算中,GAIN(修改盤口數據)=0.4715(哈特利)①哈特利為10 為底的對數計量單位。,GAIN(平臺經營批文)=0.09766(哈特利),GAIN(交易流水)=0.0002(哈特利),GAIN(修改盤口數據)>GAIN(平臺經營批文)>GAIN(交易流水)。即修改盤口數據這個要素最能區分詐騙和非法經營二罪,在25 個自變量中,修改盤口數據對判決結果的影響最大,因此要掛在決策樹的根節點上。這種運算實際上定量分析了證據的關聯性,由于自變量和應變量反映的是某類證據與判決結果的關系,這實際上就是法學視角下證據關聯性的含義。在通過迭代算法,在剩余24 個證據中運算,發現平臺經營批文影響是剩余變量中信息增益最高的,作為二層根節點。迭代運算直到決策樹再無案例可分為止。經過運算處理后,羅列出來的節點就是最影響判決的、關聯性最大的證據類型。二是預測機理。大數據從大量判例中提取數據運算,實際上是把個案判決下的或然進行歸納,形成裁判職業群體的共同理性,或者類案的共同“自由心證”,由于判決案例極大,這使得數據分析的規律具有一種必然性。當再出現新的判例時,只需要對照決策樹,逐一核對條件,看是否有修改盤口數據、平臺經營批文、交易流水進入個人賬戶的證據,就可以預測裁判結果。
面向未來,在新一輪科技革命浪潮和“智慧法院”司法改革的基礎上,在刑事定罪領域引入大數據技術為時代所需,但其也不能“包治百病”,在未來運用中需注意以下幾個問題。
認識是行動的先導。最高人民法院在2019 年全國“兩會”報告上這樣闡述大數據的作用:“全面建設智慧法院。發揮司法大數據管理和服務平臺作用,為科學決策提供參考。上線‘類案智能推送’等系統,為法官辦案提供智能輔助。”這表明,我國推進大數據在司法裁判中的運用時,堅持了“全面建設”的態度以及“輔助決策”的定位。
論不破不立,理不辯不明。要明確大數據在司法裁判中的正確定位,就要指出目前存在的兩種片面認識:一是大數據運用會導致司法裁判變為判例法的技術恐慌認識。大數據技術運用到定罪標準時,是依靠具體類案的既往判例實現的。然而,大數據技術的運用并不會改變我國司法制度。原因有二,其一,制定法是我國基本的法律淵源,判例及習慣在我國沒有法律效力。大數據的司法運用沒有改變我國司法制度根本,此為根本。其二,由于判例獨有的靈活性和操作性,我國本來就有司法判例指導制度。自1985 年起,《最高人民法院公報》就開始公布典型性案例,2010 年11 月26 日,《最高人民法院關于案例指導工作的規定》直接聲明,“為總結審判經驗,統一法律適用,提高審判質量,維護司法公正”,發布指導性案例。大數據運用只不過是對既有判例進行了深加工,把單純的文字判決提煉抽象為拓撲結構模型以供指導。
另一片面認識,是大數據會導致陷入機械司法的技術崇拜認識。這種擔憂有一定的合理性。[9]首先,數據處理是基于模式化的公式運算,由運算匹配出特有證據與輸出判決之間的聯系,而對聯系背后的法理人情在所不問,親歷性才是司法裁判的本質,脫離真實法庭來對案件事實進行分析判斷往往如空中樓閣,搖搖欲墜。其次,司法裁判具有工具理性和價值理性的雙重要求。誠然,大數據在司法裁判的運用上提高了效率,符合工具理性,然而,世界上只有兩片相似的樹葉,卻沒有兩片相同的樹葉①選自德國哲學家萊布尼茨的法律諺語。。即使是類案,每個具體案件仍各有各的特點,個案的正確、適當裁量建立在法官長期經驗積累形成的理性基礎上,而這些確實是大數據的技術盲點。
域外實踐經驗表明,依靠法官自主裁判,而將大數據技術作為輔助工具,是彌補大數據機械裁判的有效方法。由德國人工智能技術在刑事案件辦理方面的運用模式可以看出,其將智能系統JURIS定位為輔助審判,法官掌握裁量自主權,大數據作為工具聽命于法官。而英國的智能審判輔助系統則會提醒法官在裁判前檢視證據鏈是否已經形成,還需要補充哪些證據材料。總之,通過大數據智能系統輔助決策,完成程序性和基礎性的證據鏈檢驗工作,再將全案推送法官裁判,使司法裁判質效提升,公正而又高效。
對大數據運用而言,數據輸入的完整性直接影響輸出結果的準確性,即“無輸入無輸出”“錯誤輸入錯誤輸出”。數據采集是司法大數據運用的基礎,是“源頭活水”,裁判結果的精確率與輸入案例的體量和質量密切相關。筆者認為,做好數據采集,要做到全覆蓋、全要素、全過程。[10]
數據采集全覆蓋,要求“量大”。與人類學習一樣,大數據必須借助大量數據判例,形成自己的“學習經驗”,才能變得智能,形成自主分析裁判。然而,現實情況卻并不理想,存在大量“部分文書不上網”的情況。筆者通過統計2012-2017 年的中國法律裁判文書網中公開的刑事一審判決發現,大多年份公開的判決書占當年案件數量半數以下,有的年份甚至不足兩成。如表3②數據來源于中國法律裁判文書網。所示。

表3 2012-2017 年判例采集表
由此可見,司法數據與實際數據之間差距較大,存在大量數據流失。因此,應結合《最高人民法院關于人民法院在互聯網公布裁判文書的規定》要求的法定應予公布和不予公布的14 種情形,“整合法院系統的案例研究資源,將中國裁判文書網、指導性案例、全國法院案例研究資源”,依法、及時、全面采集錄入。
數據采集全要素,要求“質高”。現實中,還大量存在“說理內容不全面”等問題。從中國裁判文書網的具體情況來看,由于文字記錄并不涵蓋庭審記錄、電子訴訟文書數據化、庭審視頻無法涵蓋全過程,再加上有的文字記錄對法官確定宣告刑“一步到位”直接給出結論,缺乏必要說理過程,這種判例質量不足以“喂養”“智慧裁判”。因此,有必要以“說理層次清晰、推理過程展示充分”為要求,從源頭上提高裁判文書質量;建立文書上傳管理機制,由專門機構或專門人員負責監督、管理上網文書數量和質量;實行上傳裁判文書質量責任倒查追究機制,提升上傳裁判文書工作質效。
數據采集全過程,要求“層清”。刑事訴訟階段分類上的偵查、捕訴、裁判定罪是伴隨著調查的深入及對犯罪事實認識掌握的深入而梯次遞進的,不同的階段所實行的證明標準顯然是不同的。因此,區分捕訴、審判不同階段是十分有必要的,要錄入具體類案不同階段采取強制措施或者不采取強制措施,判處有罪和無罪的正反案例,推廣運用刑事案件智能輔助辦案系統,以期豐富“大數據”預測輸出,形成入罪與出罪、此罪與彼罪在不同階段要達到的具體證明標準,作為大數據智能決策的重要參考。
從定罪標準上看,傳統印證模式不是排除合理懷疑的自由心證。印證模式是不等同于自由心證、也不違背自由心證的證明模式存在。相互印證已經是深深扎根于廣大中國執法、司法人員心中的刑事訴訟證明模式。不管是從筆者在實務部門工作經歷來看,還是從中國裁判文書網上公布的判決來看,確實如此。筆者并不反對印證模式,然而從實務來看,筆者在辦理網絡現貨投資交易類案中,遵循了傳統以口供為中心,“由供到證”的模式,但收效甚微;運用大數據對辦理網絡現貨投資交易類案進行的定量分析實驗中,口供反映出的是否具有明知故意的自變量對判決結果的因變量根本沒有影響。
從網絡現貨投資交易類案推而廣之,在今天愈演愈烈的互聯網犯罪、電信網絡詐騙犯罪等領域,辦案部門仍沿用“由供到證”的老模式,這種模式既是在浪費人力物力財力,也不利于不枉不縱地打擊犯罪。同時,在全國裁判文書網中,也不乏僅僅以嫌疑人交代,輔之一些交易記錄就定罪的判例,這種輸入必然會導致大數據在運用定罪標準時產生有毒輸出。
運用自由心證中的“心證”原則,“孤證”是可以定案的,因此其尤為強調取證的精準性,尤其強調對關鍵性證據事實的獲取以及由關鍵證據闡發的證據鏈。[11]因此,我們要理性地看待印證證明模式,要加大對其他證據規則的適用力度,提高主觀性標準的重要性。要轉變裁判思維慣性,不再片面地依賴多證據間的相互印證,在對待證明力強的單個證據定案時,敢于依據證據規則與內心確信做出判斷,從而真正適應當前司法證明標準的發展。
智能化是我國智慧法院的努力方向。盡管本文在大數據的司法定罪標準上做出了一些探索,但是相比大數據的發展速度和潛力,這種運用仍然有待拓展。實際上當前大數據運用已是方興未艾、百花齊放。本文探討的是定罪標準的大數據運用,上海“206”刑事案件智能輔助系統把基本證據標準指引轉化為數據模型,嵌入智能輔助辦案系統,通過采集2800 萬條判例數據,實現了71 個常見罪名的證據標準智能全指引、全覆蓋[12]。量刑方面,海南省法院更是以信息化新技術深化量刑規范化改革,研發了規范涵蓋2 個刑種、23 個罪名量刑的智能辦案系統,除具備上海206 系統的智能提取識別事實和類案推送法條的功能外,還可以根據歷史檢索推送量刑建議、自動生成裁判文書。系統上線后,法官辦案時間縮為原來的一半,制作裁判文書用時縮為原來的三成,制作程序性裁判文書用時縮為原來的一成。再比如評估訴訟風險,上海市徐匯區人民法院上線了全市首個訴訟風險評估系統,為了幫助當事人對自己起訴可能面臨的訴訟風險有個基礎的了解,合理調整期望和策略,訴訟風險指數細分為“重大風險”“中等風險”“一般風險”以及“較低風險”四級,直觀地提示當事人所面臨訴訟風險的嚴重程度。這些智慧訴訟服務、智能輔助軟件有力地緩解了司法“人少事多”的頑疾,切實減輕了人民群眾的訴累。
在大數據時代,建設“智慧法院”司法系統只搞外包,自己當“甩手掌柜”,是不行的,要有自己的人才隊伍才行。要推動人才發展體制機制改革,培養一批高素質的信息化人才,為智慧法院建設提供堅實的人才保障。要推動法律與大數據交叉學科建設,按照國務院印發《新一代人工智能發展規劃》的人才培養要求,重點培養掌握大數據+法律專業的橫向復合型人才,形成“大數據+X”的培養新模式;對于在職司法人員,要堅持以大數據運用為導向,善于把司法實踐中的“痛點、難點”與大數據技術對接,通過定期培訓、輪值輪訓等多種方式,使得司法人員能夠在一線實踐中運用大數據技術,努力產生經得起理論推敲、經得起實踐檢驗的成熟大數據技術方案。
作為互聯網犯罪,在網絡現貨投資交易類案判決中,其反應出來的證明標準體現了一種鮮明特點,那就是電子數據類證據而不是口供成為了此類非接觸的互聯網犯罪的核心證據。依據是通過大數據算法運算,熵值最高的是電子數據類證據,也就是說影響網絡現貨投資交易類案判決走向的是電子數據類證據的采集與運用,而不是數量最多的被害人詢問和嫌疑人訊問筆錄。這反映出對于互聯網犯罪,其定罪證明主要依托電子數據這一類證據的現狀。因此,研討電子數據的證據規則是有必要的。
筆者認為做好電子數據證據的工作,要做好以下幾點:一是取證上,要加強基層執法部門能力,為基層執法機構配備專業取證設備如只讀鎖、硬盤復制機、專業恢復軟件系統、遠程勘驗等專用軟硬件設備,下放取證資質到區縣級公安機關;二是質證上,實現必要案件中的電子數據司法鑒定人出庭,電子數據鑒定人作為“法官的輔助人”有義務出庭,其庭審地位和作用是明確的;三是認證上,電子數據作為法定證據已經有7 年了,然而實務中法官對電子數據的認識是非常有限的。法官在很多案件中,對電子數據證據的審查判斷還存在認知理解上的不到位,有必要培養專業領域的法官或者引入專家輔佐法官,以提升司法裁判對電子數據類證據的認證能力。
刑事定罪標準,作為審判為中心的改革核心要義,縱向來看,其承載了幾千年來中華民族不枉不縱、追求正義的真切追求;橫向來看,其吸收了大陸法系、英美法系“排除合理懷疑”的主觀標準。然而從實務上看,刑事定罪標準存在粗放、不精準的弊端。習近平總書記強調,要運用大數據提升國家治理能力現代化水平。因為“科學技術從來沒有像今天這樣深刻影響國家前途命運,從來沒有像今天這樣深刻影響著人民生活福祉”。對于法學而言,大數據作為一種外來的信息技術工具,其在算法適用上與司法裁判的邏輯法則、經驗法則具有內在統一性,有助于提高裁判質效、緩解人員緊張、提升案件質量、促進不枉不縱,有利于實現“讓人民群眾在每一起案件中感受到公平正義”的樸素目標。面對大數據智能化浪潮,我們應該主動擁抱時代變化,明確大數據技術在司法裁判中的輔助功能定位,全面采集數據,深化算法運用,培養法務智能人才,同時提升對電子數據的證據運用能力,以適應新時代的發展需要。