999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本判決書的數據分析系統的設計與實現

2015-01-17 12:27:45姚家明葉榮華
電腦與電信 2015年4期
關鍵詞:文本用戶分析

姚家明 葉榮華 陳 醇

(浙江師范大學,浙江 金華 321004)

基于文本判決書的數據分析系統的設計與實現

姚家明 葉榮華 陳 醇

(浙江師范大學,浙江 金華 321004)

為了有效管理、分析海量判決書數據信息,設計和實現了判決書數據分析系統。判決書數據分析系統基于ASP.NET MVC開發模式和文本判決書信息,利用C#語言設計并開發。系統實現上傳原始文本判決書數據、導出判決書數據修改、上傳標準判決書數據、上市公司數據導入和管理、對判決書數據分析和統計、對判決書數據進行相關性分析等功能操作。應用結果表明判決書數據分析系統在實現上述功能上可以達到比較理想的結果,具有一定的應用前景。

判決書數據分析系統;ASP.NET MVC;C#

1 引言

改革開放以來,隨著市場經濟的快速發展和人民法律知識水平的不斷提高,由民事糾紛、商業糾紛和侵犯知識產權等原因引起的案件不斷增加,對判決書數據進行數據分析迫在眉睫。目前對判決書的數據分析大多采用SPSS(Statistical Product and Service Solutions,統計產品與服務解決方案軟件)、SAS(Statistics Analysis System,數據分析系統)、Microsoft Excel等軟件來進行各種數據的處理、統計分析和輔助決策等操作。上述幾種主流的軟件都需要安裝使用,且大多都要付費使用?;谝陨显?,開發出一款基于B/S結構(Browser/Server,瀏覽器/服務器模式)的判決書數據分析系統,使得科研人員可以通過瀏覽器登錄系統,直接對判決書進行自動獲取、數據分析和相關性分析等操作。通過海量的判決書數據來分析、統計判決書信息中重要且較為隱蔽的關聯,為科研團隊、企業公司提供幫助。

2 需求分析與關鍵技術分析

2.1 需求分析

需求分析的真正目標是確定什么樣的軟件是客戶所需的[1],本系統的用戶需求是系統管理員可以審核用戶注冊、創建新用戶、設置用戶權限和刪除用戶;內部用戶通過系統上傳原始判決書數據、導出判決書數據修改、上傳標準判決書數據、對判決書數據分析和統計、對判決書數據進行相關性分析等;而外部游客只能瀏覽判決書信息和上市公司等信息。系統的需求分析用例圖如圖1所示。

圖1 系統用例圖

2.2 關鍵技術分析

為了實現以上需求,判決書數據分析系統要解決的關鍵核心技術包括以下幾個方面:

(1)文本判決書的導入

作為人民法院最重要的法律文書,判決書具有不言而喻的重要意義[2]。判決書信息一般是以文本的形式存儲,且格式固定。系統的導入主要分為兩個階段,即判決書信息的自動獲取和自動獲取信息的修改和再導入。判決書信息的自動獲取先將文本格式的原始判決書數據進行數據流導入,導入的數據以換行符為分隔符,把原始數據按照每行存放到一組數組中,然后對數組進行遍歷,尋找到系統所需的數據。判決書信息的自動獲取流程圖如下圖2所示。盡管判決書信息格式固定,在遍歷數組尋找所需數據時,通常有這么幾種情況:①直接獲取型,即數據只有一種或幾種情況。例如判決書的類型只有7種,遍歷的時候只需找到對應數據即可直接獲取。②標簽型,即數據有固定的標簽標示。例如尋找法院名稱時,判決書信息中以“【法院名稱】”標示,當遍歷到這條數據時根據設置好的標簽就可獲取出法院名稱,之后去掉標簽就是所需的數據。③需判斷型,即數據可以通過判斷來確定。例如尋找法律意義時,判決書第一行末尾如果有精選字樣,則法律意義為精選,沒有則為普通。④復雜獲取型,即數據要從大段語句中獲取。例如獲取判決結果時,要從大段語句中搜索、獲取,因此準確率沒有之前幾種高。自動獲取后,由于過程中會存在一定的誤差,或者不完整、準確的情況,針對這種情況,我們設計了判決書信息自動提取的導出,這樣就可以批量對數據進行補充、修改,修改完成后進行標準數據導入,即自動獲取信息的修改和再導入,導入完成后就可進行數據的分析。

(2)判決書的數據分析

數據分析(Data Analysis)是指用戶對操作過程中所產生的數據進行的處理,并從中發現一些規律性信息的過程[3]。常用的數據分析方法有聚類分析、因子分析、相關分析、對應分析、回歸分析、方差分析等,本文主要采用了多元回歸分析和相關分析相結合的數據分析方法,對判決書進行數據分析。系統中判決書數據分析的主要方法,通常有這么幾種:①篩選②排序③統計④數值運算。判決書的數據分析的流程圖如下圖3所示。

(3)判決書的相關性分析

相關性分析是研究事物現象間的相關關系,主要是運用數理統計方法,研究錯綜復雜的客觀現象間的相互關系、相互聯系的性質和表現形式及聯系的密切程度等[4],相關性的元素之間需要存在一定的聯系或者概率才可以進行相關性分析。

相關性分析的主要內容是根據需求對相關性分析進行設計建模,對所要研究的結果作為因變量Y,對影響該結果變化或者有依存關系的幾個因素作為自變量Xi(i=1,2,…),則可以建立以下的模型:

Y=β1X1+…+βPXP+ε

其中β1,…,βP是P個未知參數(0≤βi≤1,i=1,2,…),ε是不可測的隨機誤差。

通過對導入的海量判決書信息的分析,我們可以得到β1,…,βP值以及Y和X的關系結果,這樣就可以對Y和X關系的現狀進行分析,也可以對Y和X之間的關系進行原因分析,這樣可以對以后判決書中Y和X的關系進行一定的相關性的預測分析。

下面我們以判決書里的幾個要素為例,來進行相關性分析。這里我們以“審判結果”為“原告勝訴”作為Y,即所要研究的結果,以“代理律師”作為X1,以“審理法院”作為X2,可以得出這樣的相關性公式:原告勝訴=β1*“代理律師”+β2*“審理法院”+ε。在理想情況下,我們默認ε為0。同時確定某位代理律師,即β1為1。這樣就可以確定出“原告勝訴”與“代理律師”、“審理法院”之間的相關性關系,原告可以通過這樣的分析,在審理法院固定的情況下,選擇勝率較高的律師為之辯護。判決書的相關性分析流程圖如圖4所示。

圖2 判決書自動獲取流程圖

圖3 判決書數據分析流程圖

圖4 判決書相關性分析流程圖

3 系統設計

3.1 總體設計

總體設計是完成系統的總體方案和總體技術途徑的設計過程,總體設計是項目開發過程中的一個重要階段。本系統基于B/S架構,按照ASP.NET MVC的體系架構和具體需求將系統分為3層:Web層、業務層、數據層。瀏覽器層為所有用戶提供登錄界面,并對用戶輸入信息及使用權限進行驗證,完成驗證后轉入相應的Web瀏覽界面,該層使用Razor視圖來實現;Web服務器接收到來自用戶的請求后,為不同身份的用戶分發不同的瀏覽信息,完成與用戶的交互,該層主要包含控制器以及部分視圖模型(View Model);業務層是將MVC中的模塊獨立出來實現的,該層組合了與數據庫的數據鏈路層(DAL)和面向具體業務模塊的業務邏輯層(BLL),在接收Web服務器的請求后,實現系統的業務邏輯處理功能;數據層為數據庫服務器負責數據的存儲并集中管理這些數據[5]。架構圖如圖5所示。

圖5 系統總體架構圖

3.2 詳細設計

系統主要由用戶登錄管理模塊、自動獲取管理模塊、判決書管理模塊、上市公司管理模塊、數據分析管理模塊和相關性分析管理模塊6個管理模塊組成。系統針對2類用戶:內部用戶、系統管理員,這2種用戶角色分別具有不同的權限。內部用戶可以自己注冊,系統管理審核后即可使用,也可以直接由系統管理員創建,登錄系統后可以進行上傳原始文本判決書數據、導出判決書數據修改、上傳標準判決書數據、對判決書數據分析和統計、對判決書數據進行相關性分析等操作;系統管理員可以進行內部用戶創建、審核、維護系統參數、設置用戶權限等操作。下面以自動獲取模塊為例,詳述其實現過程。

自動獲取模塊將原始文本判決書數據導入系統,按照每行將數據流文件截取存入數組中,然后將數組的值賦給設置好的導入模型中。詳細代碼如下:

StreamReader sr=new StreamReader(filePath,Encoding. GetEncoding("GBK"));

//獲取文本判決書數據流

string st=sr.ReadToEnd();

st=st.Replace(" "," ");//去除空行

string[]str=st.Split(new string[]{" "},

StringSplitOptions.None);

ImportTxtAcquisitionModel model=new

ImportTxtAcquisitionModel();

//將數組的值賦到導入模型中

判決書導入后,對導入模型中的每個值進行遍歷。在遍歷數組尋找所需數據時,通常有這么幾種情況:1直接獲取型,2標簽型,3需判斷型,4復雜獲取型。其中,標簽型數據遍歷獲取實現代碼如下:

foreach(string s in str)

{

string t=s.Trim(); //去除空格

if(t.StartsWith("【案例名稱】"))

{

model.CaseName=t;

//去除標簽

break;

}

else

{

model.CaseName="";

}

model.CaseName=model1.CaseName.Substring (model1.CaseName.IndexOf("】?")+1);

}

自動獲取遍歷之后,系統可以獲取到原始文本判決書中所需的信息。

4 系統實現

系統基于.NET平臺,采用C#語言開發,后臺數據庫使用SQL Server 2008[6]。根據系統的實際需求,在系統中設計了6個控制器類,通過控制器類來進行邏輯運算的處理。系統采用了ADO.NET Entity Framework和Linq to Entity來管理模型,設計了ViewData來管理View視圖,通過這種方式就可以對數據庫進行相應的讀寫操作。系統根據各個功能模塊的劃分,設計了對應的視圖類,每個視圖類對應Controllers中的一個控制器類文件。采用了行內代碼和Helper方法組的方式實現視圖的顯示。系統的自動獲取實現圖如圖6所示,系統的判決書數據分析實現圖如圖7所示,系統的判決書相關性分析實現圖如圖8所示。

5 結束語

系統根據ASP.NET MVC框架改變了傳統的ASP.NET中視圖與業務邏輯耦合的弊病,有助于將應用程序分割成若干邏輯部件,使程序設計變得更加容易。在判決書數據分析系統中采用ASP.NET MVC框架,可以形成清晰的程序框架,便于系統編碼階段的任務分工。同時,清晰的框架也為后期系統的維護以及功能擴展提供了良好的基礎和有利的條件。這個系統的創意之處在于采用了三層的結構。對數據庫的各種操作還有各種處理的函數都寫成類,然后封裝成DLL動態類庫。這樣的好處是數據庫的操作更加安全方便,頁面設計人員操作起來更加容易安全。同時也提高了運行的速度。該系統的設計與實現可有效解決了判決書數據的導入和數據分析工作,從而真正實現了對判決書數據的分析和管理。

圖6 自動獲取實現圖

圖7 數據分析實現圖

圖8 相關性分析實現圖

[1]梁博.基于MVC的人事招錄系統的設計與實現[D].北京:北京郵電大學,2009.

[2]魏勝強.當面說理、強化修辭與重點推進——關于提高我國判決書制作水平的思考[J].法律科學,2012,(5):48-60.

[3]蘇均生.面向產品生命周期的數據分析系統的研究與應用[D].浙江:浙江大學,2006.

[4]蔡智澄,何立民.相關性分析原理在圖書情報分析中的應用[J].現代快報,2005,(5):151-156.

[5]王程,李揮等.基于ASP.NET MVC3乳制品安全風險預警系統的設計與實現[J].電子設計工程,2013,21(14):67-70.

[6]劉源,鄧昀.基于FTPS的實時圖像傳輸軟件的設計與實現[J].計算機應用與軟件,2014,31(11):214-216.

Design and Implementation of DataAnalysis System Based on Text Verdict

Yao Jiaming Ye Ronghua Chen Chun
(Zhejiang Normal University,Jinhua 321004,Zhejiang)

In order to effectively manage and analyze massive judgment data information,this paper designs and implements the judgment data analysis system.This system is developed based on Asp.net mvc mode and the information of text verdict,using c# language.The system realizes to upload original information of text verdict,export the modified information,upload standard information,import and manage the information of listed company,analyze and count the judgment data,and complete the correlational analysis and so on.Application results show that the judgment data analysis system can achieve ideal result,and has a certain application prospect.

judgment data analysis system;ASP.NET MVC;C#

TP311.5

:A

:1008-66609(2015)04-0056-04

姚家明,男,江蘇連云港人,碩士研究生,研究方向:軟件開發。

猜你喜歡
文本用戶分析
隱蔽失效適航要求符合性驗證分析
在808DA上文本顯示的改善
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統及其自動化發展趨勢分析
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 国产一区二区三区在线精品专区| 中文字幕在线永久在线视频2020| 国产精品亚洲αv天堂无码| 成年人国产视频| 亚洲综合激情另类专区| 人妻丰满熟妇AV无码区| 中国成人在线视频| 伊人精品成人久久综合| 亚洲男人天堂网址| 中日韩一区二区三区中文免费视频 | 婷婷中文在线| 国产农村1级毛片| 国产精品永久免费嫩草研究院| 91丝袜美腿高跟国产极品老师| 国产成人91精品| 国产成人你懂的在线观看| 一本二本三本不卡无码| 毛片一级在线| 亚洲精品动漫| 99在线国产| 97免费在线观看视频| 又爽又大又黄a级毛片在线视频| 亚洲国产成人久久77| 久久精品视频一| 色综合中文| 一级成人欧美一区在线观看| 中文字幕66页| 国产成人亚洲毛片| 欧洲成人在线观看| 草草线在成年免费视频2| 91系列在线观看| 亚洲狼网站狼狼鲁亚洲下载| 91福利一区二区三区| 无码区日韩专区免费系列| 99热国产这里只有精品9九 | 国产福利影院在线观看| 高清久久精品亚洲日韩Av| 夜夜爽免费视频| 免费看黄片一区二区三区| 在线欧美一区| 国产1区2区在线观看| 亚洲中文字幕在线观看| 国产精品性| 国产精品污视频| 欧美日韩在线成人| 亚洲嫩模喷白浆| 在线网站18禁| 午夜国产精品视频黄| 国产偷国产偷在线高清| 久久伊人久久亚洲综合| 偷拍久久网| 亚洲视频四区| 青青草原偷拍视频| 伊人激情综合网| 亚洲人成影视在线观看| 欧美视频在线不卡| 久精品色妇丰满人妻| 99热精品久久| 久久免费精品琪琪| 国产第八页| 国产在线高清一级毛片| 999精品在线视频| 中文字幕资源站| 日韩中文无码av超清| 91色综合综合热五月激情| 91精品伊人久久大香线蕉| 国产成人无码久久久久毛片| a毛片免费在线观看| 国产h视频在线观看视频| 午夜影院a级片| 不卡午夜视频| 任我操在线视频| 老色鬼久久亚洲AV综合| 日韩在线播放中文字幕| 久久一级电影| 国产精品永久不卡免费视频| 亚洲天堂色色人体| 欧美激情第一区| 中文字幕无线码一区| 婷婷丁香在线观看| 无码在线激情片| 成人福利在线看|