——以“套路貸”虛假訴訟智能預警系統的應用為視角"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

司法大數據的功能
——以“套路貸”虛假訴訟智能預警系統的應用為視角

2022-11-27 02:19:20沈明磊
法治現代化研究 2022年1期

沈明磊 張 龑

互聯網是這個時代最具發展活力的領域,大數據是國家重要的基礎性戰略資源。近年來,人民法院緊跟時代步伐,大力推動“智審、智執、智服、智管”建設,充分運用高科技手段,研發審判工作相關技術應用軟件和平臺,加大新技術對審判業務和審判監督管理的支持力度,向科技要人力資源,辦案質效不斷提高。(1)例如,江蘇高院依托與東南大學聯合成立的全國首家“人民法院司法大數據研究基地”,開發“類案不同判”預警系統,規范法官自由裁量權。上海高院建立的大數據審判輔助體系由智能輔助辦案、智能法庭、智能管理等35個子系統組成,為法官辦案提供系統服務,實現了執法辦案規范化、網絡化、移動化、智能化等等。參見《人民法院司法改革案例選編(一)》,載“中國法院網”,https://www.chinacourt.org/article/detail/2017/07/id/2916048.shtml,最后訪問日期:2021年3月7日。“大數據是人們獲得新知、創造新價值的源泉”,(2)[英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶:《大數據時代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第9頁。而大數據能夠創造新價值的關鍵,不在于數據的規模,而在于對海量數據所進行的挖掘提煉和加工處理。深入研究大數據對法官辦案有著積極的意義和作用。

一、 問題的提出

2016—2018年,江蘇全省法院的民間借貸案件數量一直處于各類民事案件首位,并呈逐年增長趨勢。(3)2016年,江蘇全省法院新收民間借貸案件159386件,占新收民事案件總數的17.03%。2017年,新收民間借貸案件177869件,占新收民事案件總數的18.09%。2018年,新收民間借貸案件202228件,占新收民事案件總數的19.70%。2019年,新收民間借貸案件228913件,占新收民事案件總數的21.11%。2020年,新收民間借貸案件136259件,占新收民事案件總數的14.81%。在民間借貸案件數量增長的同時,披著民間借貸外衣的“套路貸”虛假訴訟時有發生,不但嚴重妨害金融秩序和社會穩定,也嚴重損害訴訟秩序和司法公信力。

在司法實踐中,“套路貸”具有很強的隱蔽性和迷惑性,在外在形式上與民間借貸難以區分,準確識別“套路貸”虛假訴訟具有一定的難度。一是表面證據完備,在證據認定上識別難。在“套路貸”虛假訴訟中,放貸人通常能提供內容翔實的借據及資金交付憑證,形成“完整”的證據鏈條,案件事實真相難以查證。二是當事人不到庭應訴,在法庭審理上識別難。在“套路貸”虛假訴訟中,被告和原告本人往往不到庭,或者被告雖到庭但因受脅迫不敢作任何抗辯,庭審功能難以有效發揮。三是調查取證作用有限,在依職權審查上識別難。民事訴訟法對于法官依職權調查取證有明確的限定,且民事審判調查取證不同于刑事偵查調查取證,其發現案件事實真相的作用是有限的。四是案件分散審理,在工作機制上識別難。存在著相關聯的民間借貸案件在不同法院、不同審判部門、不同合議庭審理的情況,客觀上導致“套路貸”虛假訴訟識別難。五是“套路”手法不斷翻新,在法律規則上識別難。“套路貸”違法犯罪分子往往深諳法律規則,善于研究、采用新的“套路”手法,如目前各地出現了利用融資租賃、分期付款買賣以及借貸同時強迫借款人購買履約保證保險等掩蓋“套路貸”、非法高利放貸等新情況,給法院準確識別“套路貸”虛假訴訟帶來挑戰。(4)參見江蘇高院民五庭的調研報告《關于嚴厲打擊“套路貸”虛假訴訟情況的報告》《關于全省法院打擊整治“套路貸”等非法金融活動及虛假訴訟情況的調研報告》。

為了防范和懲治民間借貸涉“套路貸”與虛假訴訟,江蘇全省法院持續參與非法金融活動專項整治工作,建立防范和打擊“套路貸”及虛假訴訟“333”機制,(5)“333”工作機制:一是依托法院案件信息管理系統、執行指揮中心執行案件信息管理系統、“套路貸”虛假訴訟智能預警系統“三大系統平臺”,并對接省非法金融活動信息監測平臺,案件信息多維度立體檢索比對、串聯分析,為專項治理提供信息化支撐。二是強化立案、審理、執行三部門協同配合,嚴把“三大關口”,建立健全全流程全方位打擊防范工作機制。立案環節建立立案預警標識機制,進行疑似職業放貸人和“套路貸”虛假訴訟智能預警系統強制檢索查詢,預警標識移送審理部門。審理部門將立案預警標識案件作為高風險案件加強審理,加強實質性審查判斷,徹查借貸資金流向,嚴格界定合法民間借貸與“套路貸”違法犯罪的界限。執行環節重點加強對執行依據為仲裁裁決、賦予強制執行效力的公證債權文書的審查。三是建立“一檢索、二集中、三并案”的辦案機制,解決單一案件難以發現“套路貸”虛假訴訟犯罪線索問題,提高打擊懲治精準度。落實強制檢索制度,在立案、審理、執行各環節全面建立關聯案件強制檢索制度,經檢索后形成強制檢索報告入卷。堅持集中審理,三級法院均要將民間借貸案件集中到一個部門審理,不能適用速裁程序審理,人民法庭暫不審理民間借貸案件。堅持并案審查,將關聯案件集中到同一個合議庭進行審理,強化綜合審查判斷,類型化深入剖析,甄別發現借貸“套路”手法。全面排查放貸活動,堅決打擊“套路貸”。針對上述“套路貸”虛假訴訟識別難的問題,江蘇法院研發上線并升級了“套路貸”虛假訴訟智能預警系統,被最高法院確定為全國法院唯一試點。該系統運用大數據、人工智能技術,對民間借貸案件涉“套路貸”虛假訴訟風險進行測算。目前,系統按照風險從高到低設置了五星級到一星級五個預警級別,并用可視化方式進行展示。該系統主要開放全省法院概況,風險放貸人預警,已結案件預警,案件檢索,放貸人檢索,疑似職業放貸人名錄,重點關注,工作成果,態勢分析(綜合分析、人員分析、案件分析),人員畫像(放貸人群體畫像、訴訟代理人群體畫像),訴訟代理人分析等功能。自2019年8月30日系統上線至2020年12月31日,全江蘇法院使用“套路貸”虛假訴訟智能預警系統查詢信息共計270萬余次。

全省法院經過集中整治、多管齊下、靶向發力,取得了積極成效。2019年,全省法院一審新收民間借貸案件165727件,同比下降10.76%;2020年,全省法院一審新收民間借貸案件115732件,同比下降30.17%(含疫情影響因素),自2015年以來案件量首次出現負增長。全省13個地區法院收案均呈現同比下降態勢,絕大部分基層法院收案減少趨勢明顯。2020年案件量進一步下降,2019年9月1日—2020年12月31日,江蘇法院民間借貸一審共收案151040件,同比大幅下降31.99%。特別是,全省各級法院建立了一系列防范和打擊“套路貸”虛假訴訟制度機制,全省法院干警防范和打擊“套路貸”虛假訴訟的意識明顯增強。“套路貸”虛假訴訟甄別機制作用明顯,不法分子通過虛假訴訟掩蓋“套路貸”違法犯罪、實現非法利益的通道被有效切斷。

二、 司法大數據運用的具體實踐

當前,大數據時代已到來,與之相適應的商業模式、交易方式、生存方式都在發生變化,由此帶來的社會關系也在發生著變化,司法對此應當動態地作出回應,更加關注動態的、系統化的數據,也就是以不間斷的“流”的形式存在的、成片的、活的數據。一般認為,大數據具有“4V”特征,即巨量(Volume)數據,通常被認為是全樣本研究,前提是將一切量化為可供運算的數據;高速(Velocity),不僅指對巨量數據的高速運算,更重要的是數據收集和運算均可實現實時;多樣(Variety),大數據分析處理的是形式多樣的非結構化數據,或者可以稱為“混雜數據”;價值(Value),既指單一數據的低值,也指巨量數據分析所具有的高值,即能挖掘出傳統社會科學研究所無法發現的價值。(6)參見何挺:《刑事司法實證研究:以數據及其運用為中心的探討》,載《中國法學》2016年第4期。大數據的這些特征對司法運用既提供了便捷的途徑,也帶來了一定的難度。

如前述,由于“套路貸”虛假訴訟人工識別存在種種困難,再加上實踐中的一些“套路貸”虛假訴訟并未進入訴訟程序,需要通過大數據的運用,實現“套路貸”虛假訴訟的自動識別和源頭治理。通過對“套路貸”虛假訴訟智能預警系統的研究,筆者認為,大數據在司法中的運用主要體現在以下三方面。

(一) 大數據篩選

大數據篩選是大數據運用的基礎前提。有研究指出,大數據篩選首先要做的是數據信息采集,要求數據是全體數據,不是隨機數據;注重混雜性,不是精確性;注重數據之間的相關關系,不是因果關系,因此需要盡可能地采集各種數據信息。在采集內容上,不僅要采集傳統的案件信息數據,還要采集案件穩定風險、當事人對判決意見、公眾對法院判決認同度、司法熱點、不同社會群體司法需求等與審判執行工作相關的數據信息以及經濟社會發展數據信息。(7)參見張化冰:《加強大數據的司法應用》,載《人民法院報》2013年10月9日。“套路貸”虛假訴訟智能預警系統,就是匯集省公安廳、省市場監督管理局、省檢察院、省司法廳、省委網信辦、省地方金融管理局等外部數據,通過將案件信息分為涉法院刑事案件,涉公安(刑事案件、治安處罰、警情信息),原告起訴頻次,被告未出庭次數,被告負面答辯次數(裁判文書中出現“暴力”“脅迫”等關鍵詞),制式合同,現金方式支付,市場監管數據等36個“套路貸”虛假訴訟監督點來進行檢索、預警。

大數據篩選,包括“事實性知識”與“檢索技巧”兩部分的組合,也就是對法律圖景式的理解、定義具體法律問題的能力與檢索技巧的組合。對于司法工作者而言,檢索過程是發現案件爭點、調整辦案思路、優化文書寫作的過程,而檢索結果的優劣將對案件辦理結果產生直接影響。為了能夠成功地檢索,法官需要盡可能透徹地了解案件的細節,不僅要關注單一的案件,還要檢索與該案件有關的所有參考資料,如該案件涉及的法律法規施行之日,或者相關試點工作開始之時。數據信息采集之后需要進行大數據篩選。大數據分析或預測結果取決于數據的質量,作為源頭的數據質量瑕疵將直接導致誤導性甚至根本性的錯誤。因此需要通過檢索的方式,去除無用和冗余的信息,也就是要對數據進行清洗。數據清洗從檢索數據后的第一時間開始,將數據中那些由于誤傳、漏傳、迭傳等原因產生的失真部分摒棄在計算之外,保證進入下一步系統的數據是干凈的、準確的,同時歸納總結并整理成清洗規則。比如,不同情況下獲取的時間值數據可能不一致,有的數據集按一年365天計算,而另一個數據集按一年的工作日計算,還有的數據集可能按一年的小時數、分鐘數計算,只有一致的數據才能進行比較。再比如,有的法律術語可能被廢止或者其內涵外延已發生變化,但舊的表述仍保留,這樣會對后面的分析結果產生影響。除此之外,受各種利益因素影響,可能還會有作弊或者誤導的信息。如關鍵詞作弊,標題、分類或屬性中有與關鍵詞無關的詞語,如A的朋友是B,那么在搜索A的時候,B也會被匹配上;類目的錯放,如將普通盜竊放入暴力型犯罪范疇;特定時期的特點,如嚴厲打擊酒駕醉駕期間,相關犯罪多發;等等。這些都需要進行自動偵測,清洗此類數據。

(二) 大數據管理

大數據的運用要做到以下五個方面:一是標準化,即對數據元素的定義和理解必須一致;二是完整性,即所有必需的數據都要存在并且錄入;三是精確性,即數據應確定代表現實情況并且來源可靠;四是有效性,即數據的價值應處在可接受的范圍內;五是唯一性,即數據不能多次重復出現。(8)參見陳琨:《類案推送嵌入“智慧法院”辦案場景的原理和路徑》,載《中國應用法學》2018年第4期。由此,司法運用大數據涉及大數據管理。

大數據時代不僅需要對文字等進行識別,還需要對圖片、聲音、視頻等數據進行識別,而識別的前提是規范化和標準化。擁有高質量的數據,才能有大數據分析的基礎。裁判文書屬于格式文書,具有一定的結構性,對于技術處理來說,屬于半結構化文本。半結構化文本在經過技術處理之后,可以轉化為結構化文本,從而方便進一步地信息處理、特征抽取或者數據標注。收集篩選后的數據,只有在通過復雜的算法將這些數據流和標簽聯系起來的時候才能產生價值。大數據管理就是將篩選后與問題有關的數據內容進行標準化的整理,形成標簽,以便進一步使用。具體來說,就是在觀察與分析數據后,更好地將數據進行歸類和整理,打上標簽,從而更加清晰地識別出數據的價值。

而要想達到以上目標,就需要通過數據中間層,生成數據的個性化標簽,從而使數據能夠標準化、統一化。一般來說,建立標簽通常有以下三種方法:第一是通過規則結合數據分析來建立標簽,這一類型的標簽和司法人員的經驗緊密結合;第二是通過模型來建立標簽;第三是通過模型的組合來生成新的標簽。而這樣的分類整理也是根據司法人員的需要而來的。數據如何進行分類視不同的場景、不同的案件而定。例如,“套路貸”虛假訴訟智能預警系統中有疑似職業放貸人名錄,對同一出借人及其實際控制的關聯關系人作為原告一年內在全省各級法院起訴民間借貸案件5起以上的,將該出借人打上疑似職業放貸人的標簽,在立案環節自動提示。又如“動物”,如果把動物和植物進行比較,動物整體必然有不同于植物的特性,但如果對動物進行更深層次的分析,則需要對“動物”進行不同種類的分類和分析。在司法審判中,可以通過不同屬性對案件當事人進行深入細分,如根據企業規模,將企業分成超大型企業、大型企業、中小型企業、個體戶。而對于中小型企業,按照行業又可以細分為醫療行業、美容行業、教育行業、農產品行業等;按注冊資本分,又可以分成10萬元、50萬元、100萬元等;按地區分,又可以分為北京、上海、廣州、南京等。

但標簽是具有生命周期的,經過一段時間之后,標簽可能會發生變化,例如年齡、職業、家庭住址、企業資產規模等,這時候就需要更新標簽。上述對疑似職業放貸人名錄就實行動態管理,每年更新一次,自疑似職業放貸人名錄確定之日起一年內,該名錄中的人員及其實際控制的關聯關系人起訴民間借貸案件數量少于上述規定數量二分之一的,可以將其從疑似職業放貸人名錄中移出。更新需要在大數據管理階段,由法官扮演“老師”的角色,負責教會并訓練計算機這個“學生”最新的法律術語和習慣表達等,使計算機可以自動發現、細分每個數據,并與之前的標簽進行匹配或者創設新的標簽,這樣可以使大數據整理任務的重復執行和微調變得更簡單,不用每次都從頭開始。這可以借助物聯網技術發展趨勢,對接互聯網海量人機交互信息,實現關聯主題下涵蓋所有時空要素的全方位信息智能提取,并進行智能信息糾錯、及時性信息分類整合、噪點信息清洗等后續加工處理。

(三) 大數據分析

數據本質上是沒有意義的,但通過數據分析,可以使數據形成有意義的知識,并從知識中發掘出信息。數據分析是大數據應用最關鍵的工作。數據分析,是指通過特定的計算機算法對大量的數據進行自動分析,從而揭示數據之間隱藏的關系、模式和趨勢,為決策者提供新的知識。(9)參見涂子沛:《大數據》,廣西師范大學出版社2013年版,第98頁。數據分析是在沒有明確假設的前提下去分析信息、發現知識。也就是說,數據分析沒有既定的假設,也不能準確預測會有什么樣具體的結論。大數據時代,龐大的數據量、不規則的數據格式,使信息整合成為人力所不能及的復雜工程,需要從不規則的數據中分析有效信息,使輸出反饋結果與輸入信息條件完全匹配。大數據分析通過構建合理模型,依托人工智能的多項技術,如機器學習、知識圖譜和自然語言處理技術等,模擬人的思維過程對數據信息作出判斷,即對感知的信息進行學習或自我學習、信息抽取、邏輯判斷、決策,并產生相應的反應,使得大數據真正發揮價值。因此,要“有效分析獲取數據,管理萃取數據中所蘊含的重要價值,智能化運用數據,充分利用人工智能深度學習構建大數據社情民意和預警研判模型,增強社會治理工作的動態性、精細化水平”。(10)翟云:《人工智能+政務:開啟智慧治理新征程》,載《學習時報》2019年8月16日。

1. 案件規律分析

通過對大數據進行整理、加工及整合,司法大數據可以呈現司法領域中為我們所未知的具有規律性的各種情況抑或是提供新的知識參考。(11)參見單勇、阮丹微:《司法大數據的現狀、挑戰及應用改進》,載《凈月學刊》2018年第3期。2012年7月歐洲世界杯期間,各大網絡購物平臺成交量在球賽開始時突然增長,有機構就通過數據分析得出“男人一看球,女人就購物”的結論,推動電商對女性群體的推銷活動。(12)參見魏琳:《直面大數據 直面統計未來——國家統計局“直面大數據”青年論壇側記》,載《中國信息報》2013年6月17日。再如,共享單車公司通過大數據模型,測算在特定時間、地點、天氣下,共享單車的租用數量,包括季節、月份、時間、假日/工作日、星期、天氣、溫度、濕度、風速等,計算出小時租用數量,從而按量投放共享單車,增加營業額,避免資源浪費。從司法活動中也可以發現社會活動的一些規律或者傾向。通過對大數據的統計、分析,結合人工歸納和推理,分析出案件的規律,包括案件發生的時間、地域,手段,偵破,量刑方面的傾向性規律。比如,浙江省高院的大數據主題分析得出的結論:55歲前,女人起訴離婚多;55歲后,男人起訴離婚多。(13)參見《你知道嗎?55歲是離婚訴訟的神奇分割線》,載《今日早報》2013年11月9日。筆者認為,利用“套路貸”虛假訴訟智能預警系統,可以通過大數據發現全省某一地區“套路貸”案件頻發,或者某些疑似職業放貸人長期在某一區域進行活動,這樣有利于有針對性地加大對這些“套路貸”虛假訴訟行為的專項整治力度。

2. 案件分類

案件分類的主要目的是按照指定的規律將案件進行分組,分類的目的是便于整體把握案件的判決情況。案件分類的第一個重要功能是“異常檢測”,即及時發現審判的異常行為,正確進行審判公平性的評估,對審判行為進行控制和監測。“套路貸”虛假訴訟智能預警系統就是通過構建“套路貸”虛假訴訟案件分析模型,將36個監督點根據不同情形賦予職能算法模型,重點運用裁判文書語義分析技術,甄別出疑似“套路貸”虛假訴訟案件,按疑似程度和風險高低,從高到低設置五個預警級別,對疑似涉案人員和疑似“套路貸”虛假訴訟案件進行預警,并形成人員畫像、案件畫像和評估報告。案件分類的第二個重要功能是進行案件判決輔助參考。一是特定場景中的司法名詞界定。司法名詞界定往往對判決結果有著直接的影響。例如,在一個搶劫案件中,被告人是否構成“入戶搶劫”,是需要法官判斷的問題。而在已有“入戶搶劫”案件判決中,這些認定都有哪些特征,包含了什么信息,則可以通過對已有案件構成的大數據進行分析得出。二是對非傳統領域案件的判決參考。在現有的法律規定基礎上參考其他類似案件,有助于審判公正。三是對判決結果的參考和規制。通過對已有案件數據的分析,對法院各類案件的審判工作建構裁判模型,得到對相同客觀條件下同種案件的判決區間,對公正判決具有一定的意義。北京法院的“睿法官”系統和上海法院開發的“206”刑事案件智能輔助辦案系統,運用大數據與云計算充分挖掘分析數據資源,并對法官制作的裁判結果與預測之間發生重大偏離時進行系統自動預警,為法官判案提供統一、全面的審判規范和辦案指引。案件分類的第三個重要功能是進行智能分案,即運用大數據,對分配案件和收案法官的信息進行處理,包括案件信息與法官信息的識別與分類、獲取與分析、比對與評估等,建立和存儲正確的分案規則,有效克服傳統分案機制的弊端,實現辦案工作量與法官司法能力的有效識別。

3. 相關性分析

相關性分析是大數據分析的重要方法。法院審理的案件信息是經濟社會發展的晴雨表,全國法院幾十年積累的裁判文書形成海量信息,這又與海量的經濟社會信息產生很多關聯性。“建立在相關關系分析法基礎上的預測是大數據的核心”,(14)前引②,維克托等書,第95頁。“套路貸”虛假訴訟智能預警系統設置了“案件畫像”模塊,可查看該案件的基本案件信息,風險評估信息,外單位涉案情況,關聯案件星級分布,相似案例推送,關聯案件(法院民事、法院刑事、公安刑事案件、警情、治安)的詳細信息,同時支持案件關聯關系圖譜的在線查看。在審判實踐中,案件主體的各種因素是否對審判結果造成干擾,比如,犯罪嫌疑人的經濟收入、家庭背景、社會地位與審判結果是否有關聯,往往是目前社會上所關注的。關聯性分析可以作為司法裁判公平的依據,通過對混雜性數據的關聯分析,判斷司法工作中存在的被忽視問題以及趨勢,并通過提升審判態勢分析、案件狀態分析的及時性、全面性和準確性,規范司法行為,預防司法腐敗。

三、 司法大數據應用中存在的問題

在全面深化司法改革的新形勢下,開展司法大數據分析研判,是大數據時代助推人民法院審判體系和審判能力現代化的新思路、新探索。“但總體上看,對大數據的收集、研究與應用還處在一個比較粗淺的層面上,司法大數據可能具有的超凡價值遠遠沒有得到挖掘。”(15)倪壽明:《充分挖掘司法大數據的超凡價值》,載《人民司法》2017年第19期。

(一) 司法大數據的不充分、不客觀、結構化不足

以裁判文書為例,司法大數據的不充分主要體現在“中國裁判文書網”上的裁判文書并不能涵蓋所有審結案件的裁判文書,導致數據分析的不完整。法官裁判不僅是法律技術的體現,更是法律觀念、社會價值的映照,存在著很大差異。加之,法律適用具有主體性、主觀性與變遷性,導致無法獲得沒有任何意識形態與價值判斷的客觀化的法律信息數據。(16)參見龍飛:《人工智能在糾紛解決領域的應用與發展》,載《法律科學》2019年第1期。大數據能為計算機所識別的重要前提是數據具備結構化特征。對于機器而言,識別自然語言已屬不易,識別法律專業術語更是難上加難。法律語言本身非常復雜,要讓機器讀懂一句中文,涉及中文分詞、詞性標注、依存語法和情感分析,在中文法律語言中對同樣的事物可能還有不同表述,非結構化的數據表述為機器的學習造成了極大的障礙,也影響數據收集、分析的準確性。另外,有些司法領域的概念,并不等同于教科書上所下的定義,而是包括所有經過概念化后的抽象觀念。不同類型案件的訴訟程序、證據規則、審理標準、執行內容截然不同,民事案件、行政案件、刑事案件所承載的數據信息在司法屬性的基礎上包含其特有的數據屬性。實踐中,大數據應用還有待深化,專業化區分和有針對性的應用實踐開展還存在不完善之處。

此外,以往的結構化司法數據來源于人工填寫報表,近年來雖也推出了幾種數字化系統,但是當海量司法數據以音頻、視頻等非結構化、半結構化數據形式出現時,現有的系統結構化處理能力難免有些捉襟見肘。大數據分析所依靠的信息化需要同時具備數據提取、數據分類、數據重組、數據分析、趨勢預測等多項功能并形成一個完善的體系,而要全面實現這樣的信息化還存在較大的困難。同時,數據的混雜性與司法的精確性之間也存在矛盾。人們采取“抽樣”的方式,由于抽樣的數據量有限,所以對每個數據的質量要求都很高。而大數據采用“全數據”“整體性”的思維模式,由于數據量巨大,數據結構混雜,很難保證每一數據都精準無誤,(17)參見王燃:《大數據時代偵查模式的變革及其法律問題研究》,載《法制與社會發展》2018年第5期。這些都可能造成數據錯誤,如數據字段本身的錯誤或拼寫的錯誤;數據重復,即同一事物往往有著不同的數據表達形式,如偵查中錄入的地址編碼經常出現一址多名、地址重名等問題;數據缺失,如某一數據體系中丟失個別重要數據。此外,還有數據不一致、數據過時等問題。

(二) 司法大數據知識表示與抽取尚未有效開展

“大數據”分析的要義不是對數據的提取,而是對不同領域的信息進行重組、擴展,并基于非結構化、半結構化數據價值的深度挖掘,進而實現知識表示與抽取,實現由“數據→知識”的關鍵一步。目前數據采集范圍主要局限于以案件為中心,與案件審理不相關的數據大都被拋棄,造成了大量的數據資源浪費。單純收集與案件相關的數據,只是對原有人工填報數據的技術替代,實際上仍然停留在小數據時代對表面價值的淺層挖掘,并未達到深層知識發現。舉例而言,對海量裁判文書的分析如果停留在案件量、上訴率、發改率的層面,那只是淺層價值的分析,而如果從海量文書中挖掘法官對特定案件的裁判規則則屬于知識發現層面。例如,“我們可以通過這些數據,發現交通事故成訴的成因點、發現當事人對裁判規則的不服點、發現證據評價的矛盾突出點”。(18)姜強:《數據革命如何解放基層法官:以道交賠償案件為例》,載“法影斑斕微信公眾號”2015年12月21日。有學者通過對11984件知識產權侵權案例進行實證研究,發現了平均判賠額依然較低等普遍性問題。但是,深度分析發現,批量案件尤其是商業險維權案件的大量存在,對相關統計結果的干擾性影響十分顯著。(19)參見詹映:《我國知識產權侵權損害賠償司法現狀再調查與再思考——基于我國11984件知識產權侵權司法判例的深度分析》,載《法律科學》2020年第1期。

此外,傳統司法研究的對象是靜態法律數據。這些數據經過編輯處理從而成為人們所熟知的結構性數據,非常容易被利用。即使在數字化之后,雖然其改變了存儲數據的載體,但是仍然屬于靜態法律數據。而對于動態法律數據,傳統司法研究關注較少。盡管在研究過程中常常引用互聯網上出現的數據,但是這些數據依然屬于靜態法律數據。而互聯網實時產生的動態法律數據要求關注數據存在的特定時空條件,關注法律數據的演變過程,及時分析人們對法律問題認識和判斷的基本動向。加上動態法律數據往往和其他相關數據相混雜,使人們利用數據增加了新的難度。

(三) 對司法大數據分析的關注度不夠

大數據分析是大數據在司法領域應用的核心驅動力,其主要作用就在于認識、總結、提煉決策規律,歸納決策模型,從而提供具有參考價值的結論。以類案推薦為例,影響推送精確度的關鍵就在于相似度算法,如果嵌入的算法無法將目標案件情節與數據庫中的案件情節進行準確比對,那么這一應用工具就是低效的甚至錯誤百出。需要指出的是,從司法實踐來看,無論是基于保護商業秘密的考量,抑或是大數據分析本身的復雜性,技術的開發者很少對使用者說明算法的運行原理,卻可以輕易將“需求”編入數據算法中,形成隱藏的價值偏見,并通過科學方法為這種偏見披上合理的外衣,(20)參見前引,王燃文。而法院對大數據分析的關注度不夠,很少會去研究結論背后的依據。即使關注到司法大數據的運用,但運用的數據種類也較為單一,組合運用數據的原則尚未確立,大量的研究集中在典型案例或法律文書的案件情況與處理結果數據、源自個別地區辦案機關所記錄的原生數據、問卷調查所獲得的主觀性數據以及部分官方數據等方面,導致研究結果傾向于集中運用某一類數據得出結論,而非組合運用各種數據來彌補單一種類數據所具有的缺點。另外,大數據分析流程包括主題確定、數據集成、建模運算以及數據可視化等一系列環節,每一個環節都有出錯的可能,這會影響到最終的分析結果。

(四) 司法大數據資源條塊分割導致資源協同融合困難

如果說數據是土壤中的“水分”,那么,開放數據就會形成土壤上流淌的“河流”。數據共享是運用大數據技術的基礎和前提。當前,制約數據開放、共享、應用的一個重要癥結是缺乏統一的數據標準,大量數據以數據孤島的狀態被分割在各部門內部,無法被關聯與聚合。比如,不同司法機關之間的司法數據多用于內部使用而非數據共享,客觀上造成各機關之間存在數據交流壁壘,形成了數據孤島。這種數據孤島又自成數據體系,檢察院有檢察院的司法大數據,法院有法院的司法大數據,進而導致不同數據的信息重疊。(21)參見前引,單勇等文。而在法院內部,以往法院的司法統計數據和流程信息在審管辦,執行信息在執行局,訴訟服務和信訪信息在立案庭,人事數據在政治部,各個部門的數據都歸各自所有,互不共享。如此,數據的高效運用就無從談起。數據不能共享導致在法院工作中調取數據的過程煩瑣、費時費力。在傳輸方式上,現行法院系統的信息由各部門流向決策部門、由下級法院流向上級法院,再由上級法院或決策部門將決策信息向下傳播,也就是典型的“章魚型”傳輸方式,缺乏相互對話、形成共識的溝通,不能完全適應和滿足司法實踐的需要。

四、 完善司法大數據應用的設想

(一) 在辦案中運用的設想

對于當事人來說,大數據無疑為司法便民提供了更多可能性:可以借助大數據技術在分析人民群眾需求的基礎上,通過各類訴訟服務平臺和智能問答機器人提供包括當事人信用、流程指引、案例研判、信訪咨詢、司法建議、訴訟服務效果分析在內的大數據分析服務,為人民群眾提供更有價值的司法服務,讓人民群眾有更多參與感和獲得感;還可以通過提供典型性普遍性的案例信息、訴訟風險評估、案件勝敗因素分析報告等方式,方便當事人精準評估案件要素,準確引用案例,自行預判案件結果,引導當事人理性選擇,減少糾紛成訟。

對于法官來說,不斷有新的技術在試圖達成“算法裁判”的終極目標,(22)參見前引,龍飛文。未來可能需要研究“機器人法官”能否替代司法裁判等問題。(23)參見吳習彧:《司法裁判人工智能化的可能性及問題》,載《浙江社會科學》2017年第4期。在法官辦案中的運用主要體現在以下方面:一是可以依托大數據實現智能辦案,實現審判流程和審判體系的現代化重塑。例如,浙江高院與浙江大學、阿里巴巴進行戰略合作,探索人工智能技術在審判全流程的深度應用,研發了無實體的法官助理“小智”,從立案階段自動審查、自動排期、自動送達,到庭審階段提前推送庭前報告、同步語音識別、分析認定證據、歸納爭議焦點,再到裁判過程中預測結果、計算數額、實時生成裁判文書、當庭宣判送達、自動分類歸檔,實現了從案件的傳統審理模式向全流程智能審理的革命性轉變。二是可以通過對事件進行概率建模,輔助法官心證。大數據分析本身包含著概率統計的分析方法,展現出的結論亦系一種規律性的標準,而其能夠實實在在地呈現在法官與當事人面前,為當事人進行質疑、反駁和反證提供了可能,為司法認知中心證的顯現化提供了基礎。(24)參見李葳:《網絡大數據司法應用分析模型——以2017年福建省夫妻共同債務案件為例》,載《數字通信世界》2019年第1期。三是可以實現真正意義上的類案檢索程序透明化。通過數學模型或模擬算法,構造提取情節信息,使用輸血模型來描述數據的特征和規律,并計算最合適的數據,根據精準算法規則自動提取關鍵信息,從而與案件相匹配并推薦案件相關“要素”,如職業放貸中36%的利率紅線、2年10次的經常性放貸、放貸人數及標的數額等,甚至類案檢索系統可以根據法官選擇情節的方式推進案件數據,在處理案件的過程中,如果程序、證據、定性、裁判結果等存在偏差,系統會自動提醒。(25)參見谷昌豪、高新峰:《類案檢索程序透明化的實現路徑》,載《人民法院報》2019年11月24日。四是可以進行類案不同判預警。2019年,江蘇高院與東南大學共同承擔了最高法院兩個大數據課題的研究工作,并依托全國法院裁判文書大數據,按照“圖譜構建→情節解析→權重排序→類案識別→模型訓練→量刑預測→偏離預警”的基本步驟,整合相似案例推薦、法律知識推送、量刑智能輔助、文書智能糾錯、量刑偏離預警等五大功能模塊,構建了服務裁判尺度統一的“類案不同判預警平臺”。

(二) 在司法改革中運用的設想

目前司法改革已經從“立梁架柱”轉向了“精裝修”階段,既可以運用大數據手段推進司法改革,也可以運用大數據來檢驗改革效果。例如在審判權運行機制改革方面,可以借助大數據手段,對審判權運行過程中產生的數據進行全程記錄、融合分析,及時發現和控制可能存在的風險,挖掘分析出各類不作為、亂作為發生的概率和“蛛絲馬跡”,形成無縫化的“數據鐵籠”,倒逼法官自覺規范和約束權力運行,保障審判權依法、獨立、公正行使。在建立大數據與人工智能法官績效評估體系方面,可以通過甄選全省具有區域、類型、審級代表性的若干法院試點,抽樣挖掘結構化(標簽)和非結構化(OCR識別)的類型案件全過程數據(包括但不限于審理時間、庭審時間、法律文書、內卷文本),提取和篩選足以影響審理時間的案件要素,通過專家評估、模型訓練、模型應用,構建符合司法規律和司法實踐的案件權重體系。還可以通過大數據構建完整、全面的評估體系,將試點地區改革前后數據錄入數據庫,以樹形結構呈現,從而形成整體性數據評估結果。每一項信息都是“最小單元信息”,這些最小單元信息經過后期處理分析對比,將以遞進的方式計算出試點地區評估結果進而對整個試點作出評估,而非試點地區的最小單元信息也將通過處理,分析其與試點地區數據的契合度,從而評估改革成效,并決定試點是否合適“移植”到非試點地區。

(三) 在司法研究中運用的設想

作為社會現象的一部分,法律現象有著異質性和不確定性,同時法律現象的總體往往又是巨量的。在這種情況下,大數據就為司法研究提供了另一種理論與現實的對應樣本,它不僅可以為司法研究提供客觀的材料,還可以為司法研究提供科學的方法,因此,司法大數據研究將成為司法研究的一個創新領域。一方面,大數據帶來司法研究思維的轉變。長久以來,司法研究思維范式都拘泥于小數據時代的因果關系思維。然而,大數據卻強調事物之間的相關關系。大數據的相關性是通過量化數值之間的數理關系而得出的,這種數據邏輯上的相關性往往無法被主觀思維所理解,即只告知結果“是什么”,卻不解釋過程“為什么”。(26)參見前引,王燃文。相關關系為司法研究提供了廣闊空間,人們對因果關系的把握從既存結果推展到潛在結果,從過去時推展到將來時,(27)參見王天思:《大數據中的因果關系及其哲學內涵》,載《中國社會科學》2016年第5期。有效拓展了司法研究的思維和視野。另一方面,大數據從深層次驅動司法研究話語模式和研究范式的轉型。例如,可以結合工作實際深化對案件內容、程序運行等信息數據的分析,為加強公正司法提供有力支持;可以深化對審判過程中法律適用情況的信息數據分析,為積極回應人民群眾期待、提升司法水平提供有益參考;可以全面分析訴訟活動的內容、裁判結果等方面的信息數據,支持和促進法治政府和法治社會建設;可以深化對當事人在結案后的行為和滿意度進行分析,為評價案件質量提供數據支持;等等。

(四) 在完善法律體系和社會治理中運用的設想

2018年初,最高人民法院審判管理辦公室選取機動車交通事故責任糾紛中傷殘賠償金的計算標準作為研究對象,基于“中國裁判文書網”上公開的所有裁判文書,對法院審理機動車交通事故責任糾紛的相關裁判規則開展實證研究,發現實踐中存在多種裁判觀點并存,需要推動修改相關立法或者出臺司法解釋,進一步明確和統一裁判標準。有學者以“中國裁判文書網”上公開的31個省級行政區的年度行政裁判文書為分析樣本,進行法治政府的司法指數研究,通過階段性的數據庫建設、體系性評估及其衍生的基礎理論研究,為中國法治政府建設實踐提供有益的決策建議。(28)參見肖軍等:《法治政府的司法指數研究》,載《行政法學研究》2019年第1期。當前,影響社會治理決策的事項紛繁蕪雜,各類矛盾交織、各種變量融合的情況非常突出。借助大數據手段,基于海量數據基礎所進行的模塊化分析,可以掌握和預測社會人群越軌行為、社會矛盾風險隱患等關鍵節點動態,從而為社會治理提供更為系統、準確、科學的參考依據。例如,開發大數據分析系統,建立涵蓋毒品犯罪、危險駕駛、金融借款、勞動爭議、知識產權、行政機關敗訴分析等多個數據的分析模型,通過相關數據的收集、匯總、分析,可以為法律法規和司法解釋的制定提供更多決策參考;通過融合司法審判、區域發展、行業變化、經濟指標等內外數據,建立智能數據分析模型,從司法的視角為供給側結構性改革以及長三角一體化等國家戰略的推進部署及成效評估提供服務。

五、 結 語

通過“套路貸”虛假訴訟智能預警系統的應用,可以發現司法大數據發揮了積極作用,加強對司法大數據的研究和應用是今后發展的方向。我們應當因應大勢,以開放的理念、務實的心態去擁抱互聯網時代、擁抱“大數據時代”,以互聯網思維、大數據思維為法院工作注入創新的基因,進一步推動大數據、人工智能等科技創新成果同司法工作深度融合,促進人民司法事業實現新的更大發展。

主站蜘蛛池模板: 亚洲第一国产综合| 毛片久久网站小视频| 欧洲熟妇精品视频| 亚洲天堂.com| 成人夜夜嗨| 高清精品美女在线播放| 无码一区18禁| 日韩精品一区二区三区视频免费看| 亚洲色图在线观看| 国产精品伦视频观看免费| 国产福利不卡视频| 99re视频在线| 无码精品福利一区二区三区| 一区二区三区在线不卡免费| 日本草草视频在线观看| 99久久精品免费看国产电影| 九九精品在线观看| 亚洲二三区| 欧美一级爱操视频| 91视频区| 亚洲美女视频一区| 久久人搡人人玩人妻精品| 日本高清有码人妻| 欧美成人一级| 丁香综合在线| 久久情精品国产品免费| 国产欧美另类| 国产日韩AV高潮在线| 在线观看av永久| 日韩中文字幕免费在线观看| 波多野结衣中文字幕一区二区| 亚洲男人的天堂久久香蕉 | 免费av一区二区三区在线| 青青久久91| 无码日韩人妻精品久久蜜桃| 亚洲国产成人麻豆精品| 色婷婷色丁香| 无码高潮喷水在线观看| 欧美精品成人一区二区视频一| 国产福利小视频在线播放观看| 欧美日韩午夜| 精品1区2区3区| 久久精品娱乐亚洲领先| 国产丝袜无码一区二区视频| 国产系列在线| 久久久久国产一级毛片高清板| AV网站中文| 午夜啪啪福利| 永久天堂网Av| 日韩毛片基地| 久久毛片免费基地| 免费jizz在线播放| 熟妇无码人妻| 国产一级在线观看www色| 全部无卡免费的毛片在线看| 正在播放久久| 国产丝袜无码精品| 欧美日本激情| 亚洲综合色吧| 中文字幕人妻av一区二区| 国产69精品久久久久妇女| 日韩色图区| 日韩精品少妇无码受不了| 国产福利大秀91| 一级毛片在线播放免费| 国产日韩精品欧美一区灰| 无码有码中文字幕| 亚洲国内精品自在自线官| 日韩欧美国产精品| 亚洲国产成人综合精品2020 | 国产欧美日韩免费| 国产精品成| 精品少妇三级亚洲| 婷婷伊人五月| 国产高清免费午夜在线视频| 久久精品国产精品青草app| 丁香婷婷激情综合激情| 午夜高清国产拍精品| 国产拍在线| 污视频日本| 狠狠色成人综合首页| 91久久夜色精品国产网站 |