陸 萬 萬
(上海計算機軟件技術開發中心 上海 201100)
目前隨著計算機科學技術的快速發展,云計算和大數據計算也在飛速地發展,并且在各種行業中都得到了充分的應用。大數據技術主要表現在大數據分析及挖掘技術兩個方面,應用這兩種技術可以解決一些復雜的應用場景。本文以上海市第一中級人民法院為例,提出并自主設計了一套完整的基于大數據的案件信息智能分析系統[1]。這種案件信息智能分析系統作為輔助法院判決的參考系統,基于“統一整合,智能分析”的原則進行設計和開發。智能分析系統需要采集和充分整合法院內所有相關的裁判文書,以及部分大城市的法院裁判文書和最高法院、最高檢察院的精選案例、指導性案例數據,對文本數據進行相應的分析和處理,對文本內容信息進行結構化的處理,并且構建出整套的搜索引擎及文本數據分析體系,供法院用戶通過不同的查詢條件檢索文書、分析文書,大幅度地提高法院的辦事效率,積累辦案經驗,有助于達到高效協同調研的目的[2]。與此同時,智能分析系統還將不斷地吸收法院內所有用戶的調研經驗,為將來推進法院裁判文書進一步智能化解析體系的建設打下堅實基礎。
本文建立的案件信息智能分析系統以上海第一中級人民法院為例,通過收集現有的裁判文書信息、電子卷宗信息、庭審錄像信息等數據作為基礎的數據[3]。首先,對收集整合各類信息資源進行數據信息采集工作。其次,對數據信息進行存儲操作,包括基本的物理存儲和分布式存儲操作,這樣可以保障數據的基本安全性。最后,采用流處理和批處理的方式對數據進行處理,充分地保障數據處理的效率,使得數據使用效率也得到進一步的提高。當法院相關管理部門需要數據時,服務器會反饋基本的原始數據和系統通過大數據處理計算得到的相關聯的推薦案例數據,保證相關管理部門可以參考這些處理數據和基本數據[4],再作出相關的判斷,提升案例的評判效率。通過本系統,法院中的聯絡員、研究室、綜合部門、審管辦等不同級別的用戶及部門都可以檢閱到自己權限能夠見到的相關數據,進行合作協作,借以提高系統整體的辦案效率。
另外,本文設計的案件信息智能分析系統總體架構由基礎設施層、數據源層、數據服務層、數據存儲層、應用支撐層、應用層、門戶層共七個部分組成[5]。其中,案件信息智能分析系統在針對數據源進行處理時,采用了大數據技術對數據進行存儲、處理和維護。整個系統的軟硬件平臺統一采用了大數據處理技術,實現不同的終端都可以在基于大數據處理平臺的基礎之上,進行一系列的數據管理、查詢和維護等操作。
硬件系統主要包括數據庫雙機系統、文件備份系統和虛擬化系統。其中:數據庫雙機系統的硬件環境搭建主要包括搭建雙冗余的數據庫雙機系統和部署案件智能分析數據庫;文件備份系統主要包括搭建文件備份系統,主要備份Oracle T4-4的數據庫文件和RAC文件;虛擬化系統主要包括該系統安裝配置完成后,實現部分虛擬機系統通過VMware VCenter集群管理和Rose HA雙機,部署智能分析分發系統、FTP等應用。智能分析系統的總體硬件拓撲圖如圖1所示。
智能分析系統硬件集成活動及技術保障需要充分考慮到中間件、數據庫的安裝和數據備份保障工作。數據庫中的數據需要及時地備份并靈活地進行數據遷移工作。此外,還需進一步完善系統的集成方案、配置報告和應急預案等文檔。對硬件的基本保障工作還需要保障數據庫雙機系統的基本安裝配置如下:硬件有2臺Oracle T4-4主機、2臺Oracle 2540磁盤陣列和2臺博科300光纖存儲交換機[6],軟件有Oracle 11g R2數據庫、Oracle RAC雙機軟件和Oracle Solaris 10操作系統等。文件備份系統的基本安裝配置包括硬件有1臺Oracle X3-2服務器和Oracle L150磁帶庫[7],軟件有操作系統Oracle ole 5.9、備份軟件OSB 10.4、數據庫Oracle Database 11g等。虛擬化系統的基本安裝配置包括硬件有HP C7000刀片系統含10套刀片服務器BL460c、Oracle zfs 7320磁盤陣列和Dell S5000 IP SAN交換機,軟件有VMware ESXi 5.5虛擬機系統、VMware VCenter 5.5 虛擬機管理中心、RHEL 6.4紅帽系統和Rose HA雙機軟件等。
軟件系統主要架構采用了SpringMVC+Spring3+Hibernate4技術框架來設計和編碼[9]。數據庫采用MySql數據庫,項目中采用MVVC設計模型來實現和控制項目中顯示、控制和模型的分離。案件智能分析系統中,軟件系統的前端設計主要采用了jsp、html、css、javascript、jquery和React等[8]基本技術來實現界面響應式的布局設計,動態地響應用戶的操作事件。前端界面布局和展示采用組件化的設計思想,提高后期代碼的可維護性和健壯性。另外,系統的控制層采用Spring注解掃描等技術靈活配置客戶端請求的處理servlet,避免了在web.xml中進行servlet的配置[11],并且可以靈活配置修改servlet的實現;使用hibernate注解實現實體類和關系數據庫的映射,避免了繁瑣的配置文件,簡化了數據存儲操作[12]。系統軟件功能架構圖如圖2所示。

圖2 系統軟件功能架構圖
系統中首頁查詢的建設旨在向用戶提供最快捷、對工作場景最適用的查詢方式。通過“主題+文書范圍+全文搜索”的模式,用戶可在進行最少操作的前提下,快速查詢調研所需文書。另外,系統還可以通過添加查詢條件,為用戶提供最為豐富的文書查詢途徑。院外文書可根據城市名稱查詢,文書查詢信息項約60個,支持信息項間的并且、或者、不包含關系,查詢條件支持保存與導入,顯示內容支持配置。對于已查詢出來的文書,系統還支持收藏與分享等操作。系統便捷檢索功能界面如圖3所示。

圖3 系統便捷檢索功能圖
系統使用解析模板對裁判文書進行意義段劃分后,將每篇文書各自的意義段展示在查看全文界面的左側,并支持點擊意義段后迅速定位到對應文書內容。在文書解析意義段列表下方,分別添加電子卷宗、庭審錄像及原審文書鏈接。對于調研有價值的自然段或任意字句,用戶可對其進行打標簽等操作。同時,用戶還可將調研心得寫入個人歸納欄中。系統全文查閱功能如圖4所示。

圖4 系統全文查閱功能圖
系統收藏功能模塊用于統一管理用戶自己收藏的文書及相關收藏夾。界面左側需提供樹結構,主要用于展示收藏夾的層級關系,其余主界面用于展示當前收藏夾下收藏的文書(不包含該收藏夾下子收藏夾的文書)。點擊左側樹結構中的收藏夾名稱,則可打開該收藏夾,如果該收藏夾下包含子收藏夾,則此時樹結構中展示該收藏夾的子收藏夾,主界面展示收藏夾下的文書[10]。“我的收藏”下的所有收藏夾(未分組收藏除外)都支持新增子節點、修改名稱、刪除收藏夾、查詢收藏夾、移動收藏夾以及分享收藏夾等功能。同時,與“我的收藏”類似,“我收到的收藏”主要存放收到的分享收藏,即他人給當前用戶分享收藏夾或收藏的文書時,這些分享內容會保存于“收到的分享收藏”下,并且分享收藏夾的收藏夾名稱后面會顯示分享人名稱,如“分享收藏[張三]”。該功能下的收藏夾僅支持刪除、移動和分享功能。系統收藏功能如圖5所示。

圖5 系統收藏功能圖
系統分享模塊可以幫助用戶在該模塊下管理分享出去的或收到的分享信息,包括文書、查詢條件、個人歸納等。詳情見圖6。

圖6 系統分享功能圖
系統協同工作模塊可以協同調研模塊為多個用戶共同進行協同調研工作提供支持。用戶可在該模塊下創建調研小組,定義調研標簽,與小組成員共同完成調研任務,并通過導出功能完成對調研成果的統計。詳情見圖7。

圖7 系統協同工作功能圖
系統消息模塊將實現對用戶最新消息的準實時推送,同時,用戶可以在該模塊下查看發給自己的通知,也可以查看在特定事件(如其他人分享給自己某個消息時)造成平臺自動生成的通知消息。例如新發布的主題、新分享的信息等。用戶可以在這里看到關于自己的所有系統發送的消息。詳情見圖8。

圖8 系統消息模塊功能圖
通過本系統高級查詢中各類查詢條件的有效集成,用戶可進行不同查詢條件的搭配,以適應不同調研課題的查詢需求。與此同時,通過對展示內容的動態配置,用戶可根據自己在調研過程中的關注點的需求,對查詢結果的展示內容進行個性化配置[13],從而無須再像以往那樣打開文書逐篇查找,很大程度上提高了文書查詢的效率。另外通過查看全文中的段落快速定位功能,可幫助調研人員快速定位相關文書意義段,以節省全文通讀的無效工作時間。系統的標簽、個人歸納功能,結合分享與協同調研模塊,為用戶提供了更大的共享與合作空間,用戶之間可以分享彼此的調研成果,消除信息孤島,從而形成經驗共享、無紙化辦公的高效工作環境[14]。最后,法官在審理案件時,會遇到無法確定案件判決程度的情況。本系統的高級檢索能幫助他們根據當前審理案件快速查詢類案,通過對類案判決方式的參考,法官對案件的審判能夠更加明確,從而整體提高一中院的審判水平。
本文以上海市第一中級人民法院為例提出的案件信息智能分析系統,通過對各類案件的非結構化裁判文書進行結構化處理,可使文書中各項信息的粒度更細、更明確。配合打標簽以及個人歸納功能,一中院的調研成果能夠得到持續性的沉淀,為法院進行案件調研打下了扎實的信息化基礎。
在信息化的將來,案件信息智能分析系統將朝著更智能的方向發展。結合打標簽的文書段落以及標簽名稱、標簽內容形成標簽庫,通過語法語義解析以及強大的搜索引擎,將實現系統自學習以及自動標簽等智能化功能,從而進一步提升文書檢索能力和定位能力,使法院內用戶的調研、查詢更為簡便快捷,將信息化、智能化建設推向更高的水平。