







摘要:當前法院案件數量持續增加,而法官員額固定不變。為提高法官的辦案效率,利用計算機相關技術幫助或輔助法官對案件進行推理分析,是解決案件繁重的有效途徑。為解決上述問題,在詳細分析現有神經網絡模型及相關算法的基礎上,使用Word2Vec對案件樣本進行向量化處理,利用長短時記憶算法創建了案件智能推理輔助分析模型。首先介紹系統的各個組成部分及其實現邏輯和算法處理過程,而后對案件樣本進行訓練生成智能推理輔助分析模型,最后參考案件筆錄對案件進行輔助分析得出推薦結論。系統結合房屋租賃合同糾紛案例對案件推理分析結論被采納的情況進行了評估,通過實際使用和測試,案件推理分析結論被法官采納的有效率達到80%左右,有效地提高了法官的辦案效率。
關鍵詞:長短時記憶算法; 案件智能推理; 神經網絡; 數據挖掘
中圖分類號:TP391.3文獻標志碼:A
doi:10.3969/j.issn.16735862.2023.04.004
Research and implementation of an intelligent reasoning and analysis system for court cases based on LSTM network
ZHAO Yongyi1, WEI Xiaodong2
(1. Software College, Shenyang Normal University, Shenyang 110034, China;
2. Law School, Liaoning University, Shenyang 110136, China)
Abstract:With the continuous increase in the number of court cases and the fixed number of judge positions, in order to reduce the workload of judges and improve their efficiency in handling cases, the only effective way to solve the heavy workload of cases is the use of computer related technology to assist judges in thinking. To solve the above problems, based on the detailed analysis of existing neural network models and related algorithms, we use Word2Vec to vectorization the case samples, and use long short-term memory(LSTM) algorithm to create a case intelligent reasoning auxiliary analysis model. Firstly, the various components of the system, their implementation logic, and algorithm processing are introduced. Then, the case samples are trained to generate an intelligent reason-assisting analysis model, and combined with the case records, the case is analyzed to draw recommended conclusions. The system evaluated the adoption of case reasoning and analysis conclusions in combination with housing lease contract disputes. Through the practical use and testing, the effectiveness rate of the case reasoning and the analysis conclusions being adopted by judges achieve about 80%, effectively improving the efficiency of judges in handling cases and other issues.
Key words:long short-term memory algorithm; case intelligent reasoning; neural network; data mining
由于法院案件逐年增加,但法官員額固定不變,人均案件數量持續增加,法官的工作壓力越來越大。在體制方面暫時無法徹底解決的情況下,任何非裁判決策智能的輔助工作都不會從實質上提高司法效率。所謂結案是法官對案件結果的決策完成,這是思考的過程,是腦力工作的結果而不是體力工作的結果,是思維工作的結果而不是感知的結果,所以只有從根本上幫助或輔助法官對案件進行推理分析,才是解決案件繁重的有效途徑。
從深度學習的發展來看, 1986年, Hinton[1]在總結了傳統詞袋模型忽略的詞語順序信息及沒能很好解決數據稀疏問題的基礎上提出了詞向量的概念。 詞向量是指把一個維數為所有詞的數量的高維空間嵌入到一個維數低得多的連續向量空間中, 每個單詞或詞組被映射為實數域上的向量。 CBOW(continuous bag-of-words),Skip-gram等神經網絡語言模型是邏輯上的方法, Word2Vec是實現CBOW和Skip-gram的工具。 Word2Vec利用CBOW和Skip-gram這2種訓練模式可實現詞嵌入[2]。
適合自然語言處理的神經網絡模型有很多,其中,比較常用的包括遞歸神經網絡(recurrent neural networks, RNN)、卷積神經網絡(conrolutional neural networks, CNN)、長短時記憶(logn short-term memory, LSTM)和注意力機制(attention)等。LSTM與RNN同屬于循環神經網絡,但是當輸入序列過長時,RNN的權重矩陣要循環相乘就會產生梯度消失和梯度爆炸的問題,因而RNN不能解決長期依賴問題,而LSTM的記憶長短期信息的能力正好解決了這一問題[34]。
因此,本文通過對案件陳述中詞向量的生成,結合長短期記憶神經網絡模型,創建了法院案件智能推理輔助分析模型實現對房屋租賃案件的輔助推理分析,從而提高法官的辦案效率。
1系統結構
基于神經網絡的法院案件智能推理輔助分析系統(圖1)主要分為4個步驟。
1) 詞向量轉換。主要利用Word2Vec使案件樣本中文本內容簡化為向量空間中的向量,并計算出向量空間上的相似度來表示文本語義上的相似度。
2) 案情訓練規則。根據《中華人民共和國民法典》中相關法律條款制定出判斷規則。
3) 案件推理模型訓練。 將案件樣本中的句子中的每一個詞, 通過詞向量轉換形成詞向量, 按照案件樣本句子為單位形成新的詞向量句子, 這些句子成為神經網絡LSTM模型的輸入, 輸出則是所需要的基于案件樣本所得到的案件和案件結論所形成的關系矩陣。 這些關系矩陣是案件智能分析的基礎。
4) 案件智能推理分析。將案件陳述和筆錄內容進行詞向量轉換,根據查詢推理訓練模型中的關系庫,形成對照并進行相似度計算,從而形成智能推薦的過程。
2主要功能及算法
2.1詞向量轉換
詞向量轉換主要基于Word2Vec來實現。Word2Vec工具主要包含2個模型:連續詞袋模型(continuous bag-of-words, CBOF)和跳字模型(Skip-gram)。二者的區別在于,CBOW是根據上下文去預測目標詞來訓練得到詞向量,而Skip-gram是根據目標詞去預測周圍詞來訓練得到詞向量[56]。根據經驗,CBOW用于小型語料庫比較適合,而Skip-gram在大型的語料庫上表現得比較好。由于目前只使用房屋租賃案例樣本,所以選擇CBOW進行訓練,詞向量空間模型的建立過程如圖2所示。
CBOW中生成詞向量空間模型的步驟如下:
1) 讀取語料,統計詞頻信息;
2) 構建詞典,初始化哈夫曼樹及隨機初始化每個詞的對應向量(維度默認是200);
3) 以行為單位訓練模型(輸入文件都在一行上,會按照最大1000個詞切割為多行);
4) 獲取當前行中的一個輸入樣本(當前詞向量及相鄰幾個詞的詞向量);
5) 累加上下文詞向量中每個維度的值并求平均得到投影層向量X(w);
6) 遍歷當前詞到根節點(輸出層的Huffman樹)經過的每個中間節點;
7) 計算中間節點對應的梯度g*學習速率;
8) 刷新投影層到該中間節點的誤差向量(與梯度和中間節點向量相關);
9) 刷新中間結點向量(與梯度和投影層向量相關);
10) 刷新上下文詞向量(其實就是將誤差向量累加到初始向量中)。
2.2案情訓練規則
結合《中華人民共和國民法典》(以房屋租賃為例)建立案情訓練規則如下:
Rule:People(?x)∧rent(?x,?y)∧document(?y,?t)→Terminate(?x,?t)
規則的發展:當事人x租賃當事人y的房屋,當事人y約定了解除合同的要件t。當事人協商一致,可以解除合同。當事人可以約定一方解除合同的條件。當滿足解除合同條件時,解除權人可以解除合同。
解除合同的條件定義如下[713]:
1) 當事人協商一致,可以解除合同;
2) 因不可抗力致使不能實現合同目的的,可以解除合同;
3) 出租人未按約定交付租賃物,經承租人催告在合理期限內仍拒不交付租賃物的,承租人可以解除合同;
4) 因不可歸責于承租人的事由致使租賃物部分或全部毀損、滅失,致使合同目的不能實現的,承租人可以解除合同;
5) 不定期租賃,承租人有權隨時解除合同;
6) 租賃物危及承租人安全或健康的,即使承租人訂立合同時明知該租賃物質量不合格,承租人仍有權隨時解除合同;
7) 司法機關或者行政機關依法查封租賃房屋導致承租人不能使用的,承租人可以解除合同;
8) 租賃物權屬有爭議導致承租人不能使用的,承租人可以解除合同;
9) 不符合《中華人民共和國建筑法》《中華人民共和國消防法》等法律關于房屋使用條件的強制性規定并導致承租人不能使用的,承租人可以解除合同;
10) “一物數租”之有效合同不能實際履行的,承租人可以解除合同;
11) 承租人未按約定方法或者未根據租賃物的性質使用租賃物,致使租賃物受到損失的,出租人可以解除合同并請求損失賠償;
12) 承租人未經出租人同意轉租的,出租人可以解除合同;
13) 承租人逾期不支付租金的,出租人可以解除合同;
14) 法律規定的其他情形。
2.3案件推理模型訓練
將通過Word2Vec詞向量轉換而形成的句子作為神經網絡模型LSTM的輸入部分,每個詞向量的分量對應一個LSTM輸入層節點。推理模型流程圖如圖3所示。不斷調整損失函數、優化器、學習率、激活函數等參數,而后根據案情訓練規則,創建推理模型。
LSTM的學習率可以結合案件樣本先用較大的學習率,快速找到較優值,然后逐步減小學習率,使模型找到最優解以便模型在訓練后期穩定。指數衰減學習率公式如下:
指數衰減學習率=初始學習率×學習率衰減率(當前輪數/多少輪衰減一次)
LSTM的激活函數主要有3種:sigmoid函數、tanh函數和ReLU函數。經過綜合對比,激活函數選擇ReLU時測試集準確率較高。
損失函數顯示出預測值(y)與已知答案(y_)的差距,從而不斷調整使預測數據的真實值和實際值的誤差較小,通過對比均方誤差、自定義、交叉熵的方法,發現損失函數為均方誤差時,測試集的準確率較高。
由于在模型訓練過程中同一個學習率并不能很好地適應各個訓練階段的模型,所以選擇RMSProp模型擬合。
2.4案件智能推理分析
系統對案件陳述內容及筆錄進行分析,并結合2個指數指標實現分類,而后推理分析,案情內容指標如圖4所示[1415]。
案件陳述內容及筆錄與租賃合同內容相似性分析公式為
p(w|d)=p(w|t)×p(t|d)(1)
利用LDA(Latent Dirichlet allocation)算法進行計算,其中d是案件陳述內容及筆錄的關鍵詞,t是租賃合同部分內容的關鍵詞。
CS(u)=(simu(t,cu))(2)
利用余弦相似度算法進行計算,其中t是民法典租賃合同部分關鍵詞,cu代表的是第q條案件陳述內容及筆錄的關鍵詞。
案件樣本相似度RCS(radar cross-section)為
RCS(uj)=avg(simu(rmip,rmiq)),p≠q
0,其他(3)
其中:sim()是余弦相似算法; rmip代表的是與第p個案件樣本的相似度;rmiq代表的是與第q個案件樣本的相似度;avg()等于所有案件樣本相似度值的平均值。 如果沒有相似的案件, 則其相似度等于0。
案件推理過程是根據設定的規則強度,對照LSTM案情分類模型,從而推出結論等推薦輔助決策信息,具體算法如圖5所示。
3系統實現
本系統采用Win10+PyCharm IDE+Python 3.9+Tensorflow 1.0開發,其中Python 3.9中包含gensim,該包封裝了Word2Vec及其優化。結合數據庫技術存儲相關案件樣本、案件筆錄、案件推理模型、案情推理分析指標及其關聯關系模型等信息。對LSTM進行手動調參優化,相關參數設置見表1。
其中:batchSize代表批處理數據的大小,也可以說是訓練一輪數據所對應的案件樣本數;numClasses代表輸出的類別數,其對應14種案件訓練規則;Epoch代表訓練次數;IstmUnits代表LSTM的單元個數;Dropout代表Dropout算法的比率值。
案件推理模型訓練和案件智能推理分析為完全獨立的2個程序,案件推理模型訓練不影響案件智能推理分析,案件樣本更新后即時開展案件推理模型訓練進而實時更新案件推理模型,從而保證了案件智能分析系統推理結論的可用性和有效性,案件智能推理分析系統界面如圖6所示。
另外,本文也對系統智能推理分析結論被法官采納的情況進行了統計, 并結合訓練過程中案件樣本數量的變化形成了相關統計圖表, 如圖7所示。 圖7中數據表明, 當案件樣本數量在150件左右的時候推理結論被法官采納的有效性趨于穩定, 當案件樣本數量在200件以上的時候推理結論被法官采納的有效性穩定在80%左右。 經過分析,導致案件推理存在誤差的主要原因為案情陳述過程中的表述不規范、用詞不一, 筆錄中內容有些省略句或者缺字少詞需要分析上下文等會造成推理分析出現偏差。 當然案件樣本也需要經過精挑細選并結合法官經驗對不同涉案內容進行判別, 從而保證在一定數量的案件樣本中能反映出盡可能多的涉案內容, 以保證在盡可能少的案例訓練后得出較為理想的推理分析結論。
4結論
本文利用神經網絡技術實現了法院案件的智能推理分析,并做了初步的實驗。結果證明,該技術在解決現有法官工作量和工作強度的問題上有一定的幫助,在一定程度上可以實現法律推理決策的智能化,并且能夠實現對法官思維相對高度一致的模擬。隨著技術的發展進步,系統會越來越成熟高效,必將推動整個司法系統審判效率的提高,進而實現真正的智慧法院。
參考文獻:
[1]鄧智嘉. 基于人工智能的知識圖譜構建技術及應用[J]. 無線電工程, 2022(5):766-774.
[2]楊丹,邵玉斌,張海玲,等. 融合多特征的半監督并列結構識別[J]. 小型微型計算機系統, 2021(9):1818-1825.
[3]HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J]. Neural Comput, 1997,9(8):1735-1780.
[4]GERS F A,SCHRAUDOLPH N N,SCHMIDHUBER J. Learning precise timing with LSTM recurrent networks[J]. J Machine Learning Res, 2003,3(1):115-143.
[5]金楠,王瑞琴,陸悅聰. 基于Word2Vec與深度神經網絡的協同推薦模型[J]. 湖州師范學院學報, 2022(8):50-59.
[6]鄔明強,鄔佳明,辛偉彬. Word2Vec+LSTM多類別情感分類算法優化[J]. 計算機系統應用, 2020(1):130-136.
[7]法律出版社法規中心. 中華人民共和國民法典注釋本[M]. 北京: 法律出版社, 2020:388-406.
[8]鄭珺丹. 房屋租賃合同標的物及合同解除權的認定[D]. 綿陽: 西南科技大學, 2016.
[9]張新宇,方燦. 房屋租賃中優先承租權適用淺析[J]. 中國律師, 2022(3):79-81.
[10]楊亮. 房屋租賃合同違約方合同解除權的經濟考量[J]. 法制博覽, 2022(5):169-171.
[11]楊心雨. 房屋租賃合同承租人違約解除的司法適用[J]. 新疆開放大學學報, 2022(3):64-67.
[12]楊華. 房屋租賃合同中違約方解除權問題研究[J]. 法制與社會, 2020(5):53-54.
[13]梁小瓊. 房屋租賃合同中的違約方解除權問題研究[D]. 蘭州: 西北師范大學,2022.
[14]任智慧,徐浩煜,封松林,等. 基于LSTM網絡的序列標注中文分詞法[J]. 計算機應用研究, 2017,34(5):1321-1324.
[15]翟社平,李兆兆,段宏宇,等. 基于詞法、句法和語義的句子相似度計算方法[J]. 東南大學學報(自然科學版), 2019,49(6):1094-1100.