楊 燾,楊 寧
(1.吉林大學 法學院,吉林 長春 130012;2.四川省自貢市貢井區人民檢察院,四川 自貢 643101)
擁有人工智能則擁有未來,法律人工智能成為近兩年中國法學理論界和實務界的熱點話題。理論界探討人工智能對整個法律體系、法律制度及部門法等傳統法學理論方面的影響①例如,李晟教授認為人工智能的廣泛運用將會重構公眾認知法律的模式,重構法律規則本身的形態進而重構法律的價值導向,參見李晟:《略論人工智能語境下的法律轉型》,載《法學評論》2018年第1期,第98-107頁。王利民教授提出民事法律制度中的人格權制度、知識產權保護、侵權責任認定和承擔等都需要隨著人工智能技術的發展而進行必要的調整,參見王利民:《人工智能時代對民法學的新挑戰》,載《東方法學》2018年第3期,第4-9頁。馬長山教授提出人工智能在帶給人類巨大進步與福利的同時,也帶來了不可忽視的倫理風險、極化風險、異化風險、規制風險和責任風險,需要塑造風險社會的法律理念,參見馬長山:《人工智能的社會風險及其法律規制》,載《法律科學》2018年第6期,第47-55頁。,實務中最高人民檢察院檢察長張軍強調“要緊緊抓住信息化建設帶來的機遇,大力加強智慧檢務建設”,各地各級檢察機關紛紛研發種類繁多、功能各異的人工智能系統。然而,理論界對于這道熱題的研究路徑仍局限在話語層面反復討論司法人工智能的可能性、風險性等通用、概括的問題,對于司法人工智能的實踐運用現狀及效果的考察提之甚少。實際上,基于長期實證研究訓練得以成就的統計分析能力,能夠成為與人工智能界跨界合作的關鍵性助手②左衛民:《從通用化走向專門化:反思中國司法人工智能的運用》,載《法學論壇》2020年第2期,第22頁。。通過對S省Z市G區檢察院人工智能具體運用的實證分析,可以探究檢察機關的人工智能建設是否取得了實質性突破,從而正確認知話語層面轟轟烈烈的熱鬧景象背后司法人工智能的運用實踐。
為探究地方檢察機關在人工智能建設中的實際成效,本文選取了S省Z市G區檢察院的相關數據為樣本進行分析。G區檢察院位于Z市中西部,地處川南中心地帶,在全省215個檢察院中脫穎而出,被確定為全省唯一的智能語音識別系統建設試點單位,成為S省檢察機關推廣人工智能系統建設的經典模式,具備研究樣本選取的典型性與代表性要求。為了探究G區檢察院智能系統研發與運行的實際狀況,課題組采用文獻收集、閱卷、訪談、實地觀察以及問卷調查等多種調研方法,選取跨越智能系統適用前后的2017年1月至2019年8月為研究時間段,采用全樣本調查和隨機抽樣調查等方法,將動態數據與靜態數據相結合,盡量避免抽樣可能帶來的誤差,以保證數據的全面性與代表性。③通過對G區檢察院58位干警發放電子問卷的方式進行全樣本調研,問卷內容涉及智能系統的識別準確率、故障解決、使用培訓、對人工智能的態度等多個方面,調研對象包括檢察官、檢察官助理及行政人員,年齡涵蓋20歲到60歲群體,收回有效問卷58份。第一次隨機抽取10位檢察官,通過集體訪談與個別交流的方式了解其工作內容與時間分布,對使用智能系統前后的閱卷時間與訊問時間、智能系統使用率及參與智能系統研發等方面進行調研與訪談;第二次隨機抽取10位檢察官助理,通過集體訪談與個別交流的方式了解其工作內容與時間分布,對使用智能系統錄入盜竊罪與交通肇事罪等案件的錄入與修正時間進行訪談與統計;第三次隨機抽取10位檢察官,觀察其2017年至2019年檢察官個人收案、結案與所屬部門收案、結案之間的關系。G區檢察院截至目前已建立智能語音系統、要素式審訊系統等智能系統并投入運行,以機器換人力,以智能增效能。
智能語音系統通過機器學習聯想、語音識別,將輸入的語音實時轉寫為文字,并根據不同檢察工作場景生成特定化筆錄。目前已建設完成5個智能語音訊(詢)問室、4個智能語音會議室,70臺客戶端安裝智能檢務輸入法,廣泛應用于案件信息錄入、閱卷筆錄制作、法律文書起草、文字材料撰寫等檢務工作,快速精準定位和比對錄音錄像數據材料,幫助檢察官快速審理多個案件,縮短審訊周期,提高辦案效率。
國內使用智能語音系統的司法機關不在少數,但辦案人員和犯罪嫌疑人的普通話水平差異較大,在一定程度上影響語音識別的準確率,還有許多司法機關在實際工作中會大量使用方言辦公,并且在越接近群眾的基層機關使用方言辦公辦案的現象越普遍,例如G區檢察院88%的辦案人員在檢察業務中的第一工作語言為本地方言。①采用全樣本調研的方式對G區檢察院58位檢察干警發放調查問卷,調研其工作中適用的語言主要為自貢地區方言還是普通話或其他,51位被調查對象表示其工作中的第一語言為自貢地區方言。對此,G區檢察院在成功研發普通話智能識別技術的同時,將智能語音識別與本土方言相結合,成功研發自貢地區方言語音識別技術,每分鐘識別字數約為400字,識別準確率達85%以上,產生的垃圾信息控制在15%以內。②采用全樣本調研的方式對G區檢察院58位檢察干警發放調查問卷,調研智能系統產生垃圾信息的比例,47%的被調研對象表示垃圾信息控制在1%-5%,41%的被調研對象表示垃圾信息控制在6%-15%,10%的被調研對象表示控制在16%-30%,僅有2%的被調研對象表示垃圾信息會超過30%。這種將普通話與方言雙重語音識別系統創新運用于檢察實踐的舉措,促進了智能系統建設的人性化與科學化,實現了檢察辦公辦案智能高效化。
基于檢察工作審查證據、排除非法證據、合理懷疑,形成證據鏈的核心需要,G區檢察院與科技公司合作,通過與檢察統一業務平臺對接,自動同步錄入5000余例盜竊類案件材料,通過OCR自動識別將訊問筆錄整理成文字,并按照文書類型、卷宗文書段落內容等進行自動分類與歸檔處理,把文本中無結構化信息進行結構化或半結構化處理,由人工智能專家對關鍵要素進行詞法、句法、語義等標注并進行統計模型的訓練,通過關聯分析、序列挖掘等數據挖掘算法完成要素提取模型的構建,檢察官點擊鼠標選中目標筆錄,系統會自動識別其中的作案時間、作案地點、共同犯罪、作案手段、作案工具、財物損失、贓物去向等核心要素,直接生成要素明確的Excel列表,整個過程僅需幾秒鐘時間,即使一位從未閱卷的檢察官也能夠依據該要素表直接對案件進行針對性審訊。③課題組隨機抽取一份盜竊罪的六份訊問筆錄進行智能要素提取,整個過程耗時約5秒鐘,關鍵要素按照訊問次數、作案時間、作案地點、作案手段、作案工具、贓物去向等六個要素依次排列,案情清晰明了。相較于辦案人員依賴個人能力和經驗對幾百頁甚至幾千頁的案卷材料手工排查證據間矛盾的傳統提取方式,智能要素系統大幅度縮短辦案時間,提高提取精準性,提升訊問針對性。目前G區檢察院研發的要素式審訊系統已覆蓋所有類型的盜竊案件,并將繼續進行案由拓展,最終實現覆蓋基層檢察機關常用的二十多種案件類型的審訊工作,助力智慧檢務。
效率是刑事司法追求的目標之一,檢察工作效率的提高對于提升整體司法活動的效率具有重要意義。以G區檢察院為例,目前檢察機關致力于提升檢務工作效率,通過人工智能系統實現語言轉換、模板填充、要素提取等功能,大幅度縮短信息錄入時間,打破傳統庭審壁壘,減少因空間產生的非必要損耗,減少檢察人員在大量重復性、機械性事務中的時間損耗,將有限的精力集中于創造性與能動性事務。
1.案件辦理時間減少
隨機抽取10位檢察官進行訪談,了解檢察官的工作內容一般由閱卷、訊問、會見律師、匯報或討論案件、制作法律文書及出庭支持公訴等方面組成,其中閱卷、訊問、制作法律文書耗時占比高達60%,這類準備工作量大耗時且結構性特征明確,在這些領域借助人工智能語音識別、要素提取、模板填充等功能,能夠大幅度縮短準備工作耗時,縮短辦案周期。G區檢察院適用智能系統后,平均辦案周期縮短約20%-30%,大約縮短2-3個工作日。①課題組分別隨機抽取10位檢察官與檢察官助理進行調研與訪談,了解其辦案周期在智能系統適用前后的變化,80%的被調查對象表示辦案周期平均縮短20%-30%,大約縮短2-3個工作日,15%的被調查對象表示有些簡單案件能夠縮短5-7個工作日,5%的被調查對象表示縮短時間難以量化。
具體而言,交通肇事類案件貼近日常生活且難度較低,適用智能系統識別準確率較高,過去對交通肇事罪進行訊問一般需要2.5個工作日,形成2000-3000字的訊問筆錄,而適用智能系統后同類案件辦理時間相應縮短至1.5個工作日,節省40%的工作時間。②課題組隨機抽取了辦理交通肇事罪的三位檢察官與三位檢察官助理,就適用智能系統前后整理提綱及訊問時間的變化進行訪談,被調查對象均表示通過傳統方式對交通肇事罪進行訊問,需要耗費2個工作日進行提綱梳理,0.5個工作日用于路途往返及訊問,其中訊問的時間僅僅2小時左右,而適用智能系統后僅需1.5個工作日進行提綱整理工作,通過遠程訊問僅需1小時,節省了往返路途的不必要時間耗費。特別是針對基層檢察機關常見的盜竊罪研發智能要素提取模型后,將依靠工作人員手動對幾百頁甚至上千頁的案卷材料進行人工審查與要點提取的方式以系統自動提取犯罪金額、贓物去向、作案手段、作案方式等要素的方式替代,將工作耗時由2-3個工作日縮短至幾秒。調研統計了部分檢察官就盜竊罪適用系統前后閱卷時間與訊問時間的變化情況(參見圖一與圖二),對于簡單盜竊案件,適用系統之前的閱卷時間一般為4-8小時,訊問時間為1-4小時,適用系統后的相應耗時均縮短近一半,效率提高50%左右,對于某些復雜盜竊案件而言,節省閱卷時間的效果更為明顯。對于證據材料多的案件適用要素提取系統之后閱卷時間由15個工作日縮短至4個工作日,效率提高近70%。案件的閱卷與訊問耗時縮短,辦案周期縮短,效率提高。

圖一:簡單盜竊案件的閱卷與訊問時間(小時)

圖二:復雜盜竊案件的閱卷與訊問時間(工作日)
2.檢察官與檢察輔助人員比降低
檢察機關采用檢察官+檢察官助理及書記員(以下統稱檢察輔助人員)的工作模式,由檢察輔助人員負責接收案件、輔助閱卷及訊問、記錄、制作法律文書及文書送達等準備工作,此類輔助性工作量大耗時,導致檢察機關對檢察輔助人員的需求量較大,實踐中有的檢察院通過向法學院校臨時聘用法學生作為實習助理的方式分擔檢察輔助人員的工作。①例如筆者曾經實習過的C市某基層檢察院長期與法學院校建立長期的臨時實習助理合作,由法學院校派遣優秀的法學生前往檢察院擔任為期6個月的實習助理一職。G區檢察院2017年1月至11月檢察官與檢察輔助人員的比例為1,年底突擊清案階段對檢察輔助人員的需求量驟升,比例增加至1.29。當人工智能系統語音識別、模板填充等功能大范圍適用于筆錄、法律文書制作等機械性、重復性事務,解放了檢察輔助人員的雙手后,2018年適用人工智能系統后年末突擊清案階段檢察官與檢察輔助人員比例不升反降至0.91,與2017年同期相比降低0.38個百分點,特別是2019年要素式審訊系統運行后,同年7月與8月的檢察官與檢察輔助人員比例降至0.75,與2018年同期相比降低0.36個百分點(參見圖三),這一舉措大幅度降低了檢察官對檢察輔助人員的需求和依賴,提升了檢務工作效率,節省了人力資源。

圖三:檢察官與檢察輔助人員比①特別說明:調研數據統計截止至2019年8月,所以9月至12月的數據無法提供。
3.積存案件比降低
檢察院的收案數由上期未結案件數(以下簡稱積存案件)與新收案件數構成,積存案件的數量能反映一個檢察院的辦案效率。分析G區檢察院2017年至2019年8月的存案情況,發現該院往期存案主要有盜竊類、交通肇事類、侵犯財產類、妨害社會管理秩序類等9類案件,其中以盜竊、交通肇事及毒品犯罪等三類為主,各類型案件的積存案數在2017年至2019年總體呈現下降趨勢,2019年1月至8月積存案件數為148件,占總收案數的59.44%,與2017年同期相比降低9.73個百分點,總體下降趨勢較為平緩,但是盜竊類和交通肇事類案件呈大幅度下降趨勢。以交通肇事類案件為例,2017年1月至8月積存案件數為29件,占總收案數的80.56%,2018年1月至8月與2019年1月至8月的積存案件率分別比2017年同期降低20.56個百分點、37.7個百分點(參見圖四與圖五),經分析,此類大幅度下降是因為引入了智能系統。②2017年至2019年8月的新收案件變化不大,分別為90件、92件及101件,交通肇事罪的新收案數分別為7件、4件、8件,且案件難度較為穩定。通過前文的分析可知,檢察官與輔助人員的配比從1降至0.75,因此辦案人員、新收案件數及案件難度等因素對積存案件量變化的影響并不明顯,從而可以判斷這樣大幅度的下降趨勢由智能系統介入所引起。數據來源:G區檢察院內部案管數據庫。

圖四:G區檢察院2017年至2019年1-8月各類案件存案情況

圖五:G區檢察院2017年至2019年1-8月的積存案件情況
智能系統介入檢察業務縮短案件平均辦理時間,提升工作效率,使單位時間內辦理更多案件成為可能,從而使收案在規定時間內辦結,正常審限內結案率①正常審限內結案率=正常審限內結案數÷結案數。上升,減少了案件積存量。G區檢察院自從2018年逐步運用智能系統輔助辦案后,正常審限內結案率不斷上升,特別是2019年4月要素式審訊系統投入運營后,呈現智能語音、遠程提訊與指揮系統三位一體輔助檢察業務的模式,正常審限內結案率基本呈直線上升趨勢,2019年5-8月的正常審限內結案率增至72.88%,較2017年同期增長24.96個百分點(參見圖六),2019年5-8月盜竊類案件正常審限內結案率增長至95%,比2019年1-4月環比增長57.5個百分點(參見圖七)。正常審限內結案率提高,積存案件數則相應減少,從側面反映出智能系統對檢務工作效率的提升。

圖六:整體審限內結案數

圖七:盜竊罪正常審限內結案情況
智能系統對所有案件統一按照法律規定進行要素劃分與關鍵信息提取,從程序與實體層面保證同類案件所運用的標準為統一標準,按照法律規定的審限控制案件辦理進度,維護當事人的時限利益,在確保程序公正的前提下追求實體正義。
1.程序預警,嚴防違規
檢察實踐中存在部分檢察官為了節約辦案時間、節省精力而忽略某一程序、遺漏某一程序的現象,特別是員額制改革減少了檢察官數量,案多人少矛盾愈發凸顯,某個檢察官分擔部門大部分案件甚至一個部門只有一個辦案檢察官的情況較為普遍,為了節省辦案時間而忽略對某些信息核對或忽略審限的情況常有發生。隨機抽取10名檢察官了解其2017年與2018年個人收案與對應部門收案的情況,有兩名檢察官連續兩年的收案量占據部門收案量的一半以上,有三名檢察官連續兩年辦理整個部門的案件,案件量多時高達125件,80%的檢察官表示在案件辦理過程中曾遺漏對犯罪嫌疑人身份信息、是否委托律師、是否同意適用簡易程序以及是否有前科等情況的訊問與核對,60%的檢察官表示案件量較多的情況下會對某些案件的審限發生記憶混淆,以致有的案件超過審限而得不到處理。①在調研過程中隨機抽取10位辦案檢察官,了解其2017年與2018年的收案數、辦案過程中是否有遺漏當事人信息核對或超過審限等情形,8位檢察官表示曾遺漏對犯罪嫌疑人身份信息、前科情況、委托律師等信息的核對,6位檢察官表示其在辦案過程中曾存在超過審限的情形大約為50%,兩位檢察官表示超過審限的情形約為66.67%。
適用智能系統后,所有案件在平臺全程管控,自動對當事人信息進行核對與空缺填補,程序之間環環相扣,缺少上一環節則無法進入下一環節,確保每一個重要信息都經過辦案人員的核對,細化辦案流程,杜絕因為案件簡單、易辦而使檢察官在心理層面放松對案件關鍵信息的審查,導致遺漏或錯誤識別案件重要要素的情況。如果有違反程序的操作則會收到系統自動預警與提示。同時系統首頁顯示每個案件的辦理期限,自動向辦案人員推送臨近審限的案件,超過審限的案件必須進行情況說明并報請部門負責人批準才能延長。G區檢察院適用智能系統后,2019年1月至8月,在結案數保持基本穩定的情況下,審限延長率②審限延長率=審限延長數÷結案數。降至37%,比2017年同期降低14.3個百分點(參見圖八)。因此,我們必須承認沒有物質欲望和感情生活的機器可以比人更少地受到外界因素的干擾③參見張保生:《人工智能法律系統的法理學思考》,載《法學評論》2001年第5期,第14頁。,從辦案基本操作層面增強檢察官的規則意識,減少辦案過程中程序隨意省略與交叉的行為,保障程序公正。

圖八:2017年至2019年1-8月審限延長情況
2.辦案質量提升
智能系統介入檢察業務,將檢察官與輔助人員從大量煩瑣而重復性的各類文書制作、閱卷提取關鍵要素等工作中解放出來,檢察官將更多精力集中于檢察監督工作和提高案件質量上,在提升辦案效率的同時也保障了個案程序公正的實現。G區檢察院2017年的上訴率呈現直線上升趨勢,并在2018年1-4月達到最高值16%,2018年智能語音識別系統、遠程提訊與指揮系統投入運行后上訴率開始呈現下降趨勢,并于2019年1-4月降至最低點,與2018年同期相比下降16%。雖然2019年5-8月上訴率有上升趨勢,但是幅度較為平緩(參見圖九)。尤其是盜竊類案件,自2018年初智能語音識別系統投入運營后開始呈現下降趨勢,并在2019年1-4月與5-8月下降至最低點,與2017年9-12月相比降低了30.7個百分點(參見圖十)。雖然上訴率的大幅度下降難以排除其他因素的作用,但從一個側面反映了智能系統在提升辦案質量方面的效用。

圖九:2017年-2019年整體上訴情況

圖十:2017-2019年盜竊案的上訴情況
基于前文的描述與分析,發現當前法律人工智能在一定程度上增強了司法人員的規則意識,在技術性及輔助性工作中發揮了提高工作效率、節約司法資源的積極作用,但這并不意味著我國檢察領域的人工智能建設已取得實質性突破,實踐中真正有用并投入常態化運營的智能系統并不多,在關涉效率與公正等司法決策的真正難題上仍是淺嘗輒止,普遍存在盲目追求智能范圍的廣度而忽略深度、忽視司法活動的多元化與差異性、技術開發與一線需求斷層等問題。
在我國“要緊緊抓住信息化建設帶來的機遇,大力加強智慧檢務建設”與“將積極推動人工智能在司法領域應用”的背景之下,各地各級檢察機關獨立與科技公司合作研發智能產品數量多、涉獵范圍廣,但研究深度令人擔憂。首先,對人工智能的認識不足,導致市場上充斥著大量“偽人工智能”。所謂人工智能,其核心特征是能夠如人類一般進行自主思考的“擬人性”,人工智能的自主性不同于機械的自動化。①參見劉艷紅:《人工智能法學研究的反智化批判》,載《東方法學》2019年第5期,第120頁。當前,檢察機關的某些產品雖被冠以“智能”標簽,但“人+電子化”的運作模式揭示其僅僅是一種電子化的信息辦公方式,將辦案方式由線下轉化為線上,雖然信息化辦公方式是建立在人工智能運用基礎之上,是信息化時代糾紛在線解決的一種發展方向,尤其今年特殊的疫情形勢促使全國不少法院大力開展廣泛的在線訴訟②參見左衛民:《中國在線訴訟:實證研究與發展展望》,載《比較法研究》2020年第4期,第167頁。,但這并不意味著能夠等同于人工智能本身。例如,G區檢察院研發并投入使用的遠程庭審與指揮系統,突破傳統庭審模式的空間局限,實現法官在科技法庭內部、公訴人員在檢察院遠程庭審室、被告方在看守所遠程庭審室以網絡視頻的方式進行提審、庭審和宣判等活動的遠程同步,將公訴人從往返法院、等候開庭等環節中解脫出來,使各類訴訟數據流在法院、檢察院、看守所 “三點傳遞”實現跨界融合,號稱讓出庭公訴人具備連接“外腦”③趙志剛:《智慧檢務的五個“A”》,載《中國檢察官》2018年第6期,第37頁。的能力,能夠提升重大案件的公訴質量。但整個過程以網絡視頻、訴訟數據在線傳遞以節省“非必要時間損耗”為主,并未產生經過計算機自主思考的“額外知識”,其實質仍是信息化時代辦公方式的數字化或在線化。④參見左衛民:《從通用化走向專門化:反思中國司法人工智能的運用》,載《法學論壇》2020年第2期,第18頁。其次,個別化的投入模式使得投入產出率不高,甚至許多智能產品由于技術缺陷或違反訴訟規律而并沒有適用的土壤。例如,G區檢察院在盜竊罪智能要素提取模型投入使用并取得良好效用的情形下,進一步規劃研發非法吸收公眾存款罪的智能要素提取模型,但數據反饋該院2014年至2018年非法吸收公眾存款罪案件數僅3例,涉案人數僅8人⑤數據來源:G區檢察院內部案件管理系統。,即使耗費高昂的人力、財力突破技術障礙研發成功,也難以得到高效適用。申言之,忽略實踐適用的土壤,盲目追求智能產品的數量與范圍的廣泛性,耗費有限的人力、財力制造出無用武之地的科技產品,既無法充分滿足社會公眾對便捷化、個性化司法服務的需求,也無法有力回應司法人員對智能化司法的期待。①左衛民:《大數據與人工智能的司法實踐》,載《中國法律評論》2018年第2期,第25頁。
毋庸置疑,當前智慧檢務建設在文書制作、語音識別、要素提取等輔助性檢察活動中取得了一定的成功,大幅度提升了辦案效率,但是不論智能語音識別還是智慧要素提取,皆是對通用技術的直接復制,而非專門針對檢察活動開發的專業化法律人工智能,圍繞通用技術進行的外圍研發并未觸及檢察活動的核心業務,忽視了司法活動的多樣性與差異性。智能要素提取系統基于5000份判決進行結構化或半結構化處理,通過數據獲取、模型訓練、關聯分析、序列挖掘等數據挖掘算法完成要素提取模型的構建,其實質仍是對“通用技術+通用流程”的直接復制②參見王祿生:《論法律大數據“領域理論”的構建》,載《中國法學》2020年第2期,第263頁。,強調從海量數據中自動提取知識,追求算法的準確性而忽略了法律語言背后的法律條文及法學理論。就智能要素提取系統中證據提取及校驗審查功能而言,清單式指引雖然能夠為辦案人員收集、固定證據提供指引,對證據進行校驗、把關、提示與監督,確保偵查、審查起訴的案件事實及證據經得起法律檢驗,但不可否認,上述指引及校驗要素皆是利用通用技術對海量數據進行的表面化提取,將海量數據中的高頻要素進行瑣碎化與形式化列舉,至于這些要素在不同的犯罪構成要件說、不同案件程序之中的差異化表現則不予過問。其實,證明活動是刑事司法的核心,而刑事訴訟中的主要證明事項就是構成要件事實③參見[日]小野清一郎:《犯罪構成要件理論》,王泰譯,中國人民公安大學出版社,2004年版,第241頁。,當前智能要素提取系統按照“犯罪構成——證據分布——證據收集指引”的模式指導證據收集④參見馮俊偉:《刑事證據分布理論及其運用》,載《法學研究》2019年第4期,第182-183頁。,但是犯罪構成在理論界一直存在四要件說、三階層說及兩階層說的爭議,選取哪一種學說作為證據指引與校驗的起點,所對應的證據收集截然不同。側重于入罪的四要件與側重于出罪的三階層構成要件設計決定著證明的方向、證明范圍及舉證責任的分配。兩種學說各有利弊,在當前刑事司法中未形成通說認識,證據要素智能提取的制定者應該采用哪一種學說進行證據清單式列舉并無定論。再者,所有刑事案件都可以粗線條地劃分為認罪案件與不認罪案件,根據認罪與否決定其所要適用的訴訟程序,適用的訴訟程序不同,所要證明的程序性事實及實體性事實也不同,所對應的證明對象亦不同。普通程序需要對指控的犯罪事實進行嚴格證明,以法定證據形式及證據能力的證據作為證明的根據,而適用簡易程序的案件在證據范圍、證據調查程序及有罪證明標準等方面都出現了不同程度的松動,簡化證據調查程序⑤參見閔春雷:《嚴格證明與自由證明新探》,載《中外法學》2010年第5期,第695頁。,適用不同程序所需要收集的證據及審查校驗側重點顯然不同。當前“通用技術+通用流程”在存在犯罪要件學說爭議及案件程序適用多元化的情形下進行差異化的證據提取,忽視了法律領域對知識獲取過程因果性和可解釋性的特殊需求。
目前,我國法律人工智能系統主要由檢察院等司法機關與科技公司合作研發,研發人員以技術公司的專業技術人員與檢察院內部的技術人員為主,真正使用智能產品的一線辦案人員則幾乎沒有參與研發。例如,G區檢察院智能語音系統研發周期約為60天,研發人員主要為科技公司技術人員5人及檢察院內部技術人員10人,真正使用系統的一線辦案人員則很少參與研發,這就導致出現技術人員與法學專家脫節、技術開發與一線需求斷層的現象。①參見王祿生:《論法律大數據“領域理論”的構建》,載《中國法學》2020年第2期,第258頁。這種現象是直接復制“通用技術+通用流程”導致智慧檢務建設在方法論層面過度關注技術邏輯,忽視法學理論的嵌入與支撐的必然結果,技術主導需求,出現完全不考慮法學理論而進行應用開發的危險傾向,使得某些在通用領域取得巨大成功的技術在法律領域無用武之地。例如,現階段種類繁多的智能系統幾乎都包含類案檢索功能,通過設置關鍵詞進行類似案件的檢索以供司法人員參考,從而保證結果的一致性與司法的權威性,但不論是基于“詞頻—逆文本詞頻模型”(TF-IDF)②TF-IDF 模型將文本劃分為詞與詞的組合,根據不同詞出現的詞頻計算兩篇文本之間的相似度。進行詞向量維度案件的相似度計算還是“基于Transformer 的雙向編碼器表示模型”(BERT)③BERT模型把法律文本轉換為向量進行表示,關注詞、句子、段落、位置等信息,通過雙向編碼、三層嵌入等方式完成向量表示,進而通過不同文本之間的向量計算相似度。計算不同文本向量維度的相似度,均沒有實現法律領域專業知識的介入,不同法律表述、法律與事實之間復雜的相互作用并未得到揭示與分析,基于此得出的“類案”只是法律表述高度一致的相似案例,而非真正意義上的“類案”④參見王祿生:《論法律大數據“領域理論”的構建》,載《中國法學》2020年第2期,第264頁。。訪談過程中了解到該系統的實踐效果并不如預期,通過該系統檢索出大量法律表述相似的案例,需要耗費大量時間與精力進行法律角度的解讀與分析,以找到真正的類案予以參考。可以說,該智能系統僅發揮了從海量案例庫進行粗略信息篩選的初步作用,其準確性與可解釋性無從談起,在實踐中得到適用的機會與效果并不如預期。而脆弱性是人工智能系統的一個關鍵特征,人工智能系統能夠在非常狹窄的任務上勝過人類,也可能在看似微小的細節上轟然失敗⑤熊秋紅:《人工智能在刑事證明中的應用》,載《當代法學》2020年第3期,第88頁。,如果任由技術主導需求,過度關注技術邏輯而完全不考慮法學理論進行應用開發,必然會導致因某個數據細節干擾了其內在邏輯的錯誤結果卻通過人工智能的反復應用而予以固化,造成對犯罪嫌疑人、被告人、被害人不可估量的傷害。
從某種意義上而言,法律作業方式的工業革命已經展開,并逐步向縱深延展⑥左衛民:《關于法律人工智能在中國運用前景的若干思考》,載《清華法學》2018年第2期,第121頁。,可以預見在人工智能時代背景之下,法律領域人工智能化從處于輔助工具地位的“弱人工智能”階段發展至完全脫離人類而產生獨立意志的“強人工智能階段”甚至“超人工智能階段”將是時代發展的必然趨勢。法律人工智能未來到底怎么做、朝哪個方向前進、限度為何等問題,需要從增強頂層設計、推動專門化技術創新、提升法律人的參與度等方面進行探索。
目前,由地方獨立進行法律智能系統研發的模式使智能產品遍地開花,建設主體多元化、標準差異化的研發模式使得智能系統涉獵范圍廣度有余而深度不足,數量繁多的智能系統之間存在一定程度的重復性建設,研發深度欠缺,使檢察系統政策強調的一體化建設預設并未落地,智慧檢務的潛能未被充分挖掘。智能產品貴在質量精而非數量眾,因此,需要從地方、部門參與研發轉變為官方高層統一規劃,基于實踐需求統一規劃智慧檢務的發展目標,各地在頂層總體規劃的引導下結合本地實踐及本院辦理案件的特點進行特色化的針對性研究與創新。同時,“要緊緊抓住信息化建設帶來的機遇,大力加強智慧檢務建設”和“將積極推動人工智能在司法領域應用”的政策的大力支持并非意味著法律領域的人工智能建設不受限制。法律活動是在嚴格的三段論邏輯框架下進行的演繹推理,任何決定都必須在證明、推理與審議的基礎上作出①參見季衛東:《人工智能時代的司法權之變》,載《東方法學》2018年第1期,第132頁。,介入刑事司法系統的人工智能技術需要進行反復的法學理論論證,論證智能技術如何實現控、辯、審各方有效參與,對司法公正及人權保障的沖擊與影響,全面確保技術的穩健性與可靠性,這也是域外人工智能研究歷時已久且成果豐碩,但在刑事司法領域比其他領域更慢地采用人工智能技術的原因之一。因此,如何在智能技術與司法活動存在演繹思維沖突、說理思維沖突的情形下,尊重司法領域邏輯性與論證說理特殊性,明確法律領域人工智能化的限度,是需要法律人持續思考與探究的問題。
通用技術在其他領域獲得的巨大成功并不意味著其在法律領域也能夠大放異彩,法律尤其強調邏輯性與論證說理,是一門富含主觀性與客觀性的科學,既有可以量化的客觀內容,也有無法形成統一認識的主觀方面。直接復制“通用技術+通用流程”的研發方式,通過對海量數據進行表面化提取而將高頻要素進行瑣碎化與形式化列舉,并未觸及司法活動的核心,難以滿足社會公眾對便捷化、個性化司法服務的需求。今后,法律人工智能技術的發展應該立足于挖掘檢察活動的專業特性,就證據收集及校驗功能而言,需要遵循基本法理,承認司法活動的不確定性與復雜性,在“審判中心主義”與“認罪認罰從寬制度”二元機制的情形下,對數據庫中的案件按照認罪與不認罪進行抽取與分類,再根據一審程序及二審程序或者簡易程序、普通程序、速裁程序、特別程序進行二次篩選與分流,區分不同程序對應的證據數量、證明對象、事實性證據和程序性證據,對法律表述背后的法律條文與法學理論進行深度挖掘,對不同法律表述背后的法律關系、法律與事實認定的相互作用進行剖析,從而構建符合多元程序的差異化證據清單及校驗審查指引模型。再者,量刑推薦作為司法大數據和人工智能開發的核心模塊之一,實踐中已有根據罪名、情節分類進行智能系統的構建,但在大力推進認罪認罰從寬制度實施的背景之下,目前利用通用技術構建的粗線條智能系統難以滿足認罪案件量刑建議精準化的需求。量刑是一個非常復雜的問題,檢察院與法院之間、法官之間、檢察官之間產生的差異皆會影響量刑建議的精準性①參見左衛民:《量刑建議的實踐機制:實證研究與理論反思》,載《當代法學》2020年第4期,第53頁。,如何通過法律領域專門化智能技術將辦案中形成的影響量刑的因素進行收集與整理,進行大數據分析后嵌入公訴案件智能審查輔助系統,設置統一的量刑建議標準,應是未來法律領域人工智能技術發展的重中之重。
卡多佐大法官多次強調,“法學發展的真正源泉,法律真知的真正來源,必定是法律的實踐和社會現實”②[美]卡多佐:《司法過程的性質》,蘇力譯,商務印書館1997年版,第4頁。,而精通法律實踐與社會現實的無疑是法學專家、一線實務工作者。因此,應當注重提升法律人在智能建設中的參與度,以“需求主導,技術統籌”為原則,從法律人的真正需求出發,對表象數據背后的法律條文與法學理論進行深度挖掘與分析,讓技術研發從法學家、實務工作者的專業角度出發健康發展。值得注意的是,雖然當前我國檢察官的素質不斷提高,本科學歷已成為檢察官的基本學歷要求③左衛民,謝小劍:《檢察院內部權力結構轉型:問題與方向》,載《現代法學》2016年第6期,第18頁。,但是檢察人員的計算機水平差異較大,對智能系統幾乎是外行,缺乏對智能產品基礎知識與技術的掌握,96.55%的基層檢察人員表示人工智能系統出現問題時只能求助于專業的技術人員解決障礙④課題組對G區檢察院58位干警發放調查問卷,了解人工智能系統出現故障時的解決方式,收回有效問卷58份,其中約56人表示通過求助專業科技人員解決,占比96.55%。,維護與更新智能系統只能依賴于專業科技人員。因此,要重視通過培訓與宣傳等途徑增強法律人的大數據與人工智能意識,不斷提升法律人的科技水平,使法律人才與技術人才緊密結合、相互理解,充分獲知對方的需求與期待。同時,要注重革新法學研究方法,培育復合型人才。使用法律科技工具,或許未來成功的希望難以確定,但不使用法律科技工具,將永遠沒有成功的希望。⑤左衛民:《如何通過人工智能實現類案類判》,載《中國法律評論》2018年第2期,第32頁。傳統方式培育的法律人才缺乏人工智能及大數據知識,很難符合人工智能時代對人才的需求。而法律大數據的出現,使得基于法律大數據的司法實踐與新型實證研究成為可能,并可能帶來法學研究方式的革命性變化。⑥左衛民;《邁向大數據法律研究》,載《法學研究》2018年第4期,第139頁。法律研究者應搭乘大數據發展的快車,創新法學研究方式,從研究和教育的源頭培育符合新時代需求的法律與人工智能交叉的復合型人才。
法律人工智能建設在全國如火如荼地推進,智慧檢務建設要求抓住信息化發展的機遇,將人工智能科技與檢察工作深度融合,解決依托傳統方式難以解決或解決不好的問題,現階段檢察系統的智慧檢務建設與探索雖取得了一定成效,但智慧檢務建設是一項長期性的工程,機遇與挑戰并存。通過從類案大數據檢索、文書智能生成、程序智能預警、辦案質效提升等方面對G區檢察院人工智能系統建設現狀進行數據分析,破解基層檢察院人工智能建設進程中存在的盲目追求智能范圍廣度而忽略深度、忽視司法活動的多元化與差異性、技術開發與一線需求斷層等問題,從加強頂層設計,明確總體的發展目標與法律人工智能的限度,強化法律領域專門化技術創新,提升法律人參與度及人才培養等方面對法律人工智能未來到底怎么做、朝哪個方向前進進行探究,使未來法律人工智能建設更為科學化、智能化、人性化,更好地服務于基層檢察機關。