李大鵬, 趙琪琿, 邢鐵軍, 趙大哲
(1. 東北大學 計算機科學與工程學院, 遼寧 沈陽 110169; 2. 東軟集團股份有限公司, 遼寧 沈陽 110179)
近年來,隨著人工智能等新一代信息技術的發展,司法辦案智能化成為司法領域信息技術的研究熱點,尤其是案件判決預測(legal judgment prediction,簡稱LJP)日益受到關注[1].LJP使用自然語言處理等技術分析案件卷宗文本,預測案件罪名、刑罰和適用法律等判決結果,該技術是司法機關智能輔助辦案系統的核心關鍵技術之一,可以減少法官、檢察官等辦案人員的大量案件分析工作并輔助其作出決策,提高工作效率,減少犯錯的風險.同時,缺少法律知識的普通人也可通過該技術了解他們所關心案件的預期判決情況.
LJP包括罪名預測、刑期預測等多個子任務.近年來隨著計算能力的提高及深度學習技術的發展,卷積神經網絡、循環神經網絡等方法被廣泛地應用在LJP領域.2017年,Luo等[2]使用支持向量機和循環神經網絡預測案件的適用罪名和適用法律,為LJP任務提出了新的解決方法.同年Vaswani等[3]提出了基于多頭自注意力機制的Transformer模型,提高了文本特征的提取能力.2018年,Google公布BERT(bidirectional encoder representation from transformers)在11項NLP(natural language processing)任務中刷新紀錄[4],引起了業界的廣泛關注.陳劍等[5]在司法文書命名實體識別問題上引入BERT模型,有效提升了實體識別效果.近兩年,許多學者對深度學習在LJP領域的應用進行了深入的探索.Li等[6]在2019年設計了一個基于注意力循環神經網絡模型,同時完成案件的罪名預測、刑期預測和法條推薦……