999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于法律快車(chē)網(wǎng)的智能推薦與分析系統(tǒng)

2022-05-06 07:39:16王高佳晨林國(guó)鳳陳婷婷
關(guān)鍵詞:可視化法律用戶

王高佳晨 林國(guó)鳳 陳婷婷

(廈門(mén)華廈學(xué)院,福建 廈門(mén) 361024)

0 引言

隨著法制社會(huì)的推進(jìn),人民已經(jīng)學(xué)會(huì)拿起法律武器捍衛(wèi)自己的利益。由于法律行業(yè)具有專業(yè)性和區(qū)域性的特點(diǎn),因此人們?cè)趯ふ衣蓭煏r(shí)缺少可以參考的依據(jù),通常通過(guò)行業(yè)的口碑、熟人推薦等渠道尋求律師的幫助。雖然國(guó)內(nèi)有類似法律快車(chē)網(wǎng)在線的法律咨詢平臺(tái),但是由于互聯(lián)網(wǎng)規(guī)模和覆蓋面的迅速增長(zhǎng)會(huì)帶來(lái)信息超載的問(wèn)題,因此用戶很難在法律快車(chē)網(wǎng)找到感興趣的內(nèi)容,傳統(tǒng)的搜索算法只能為用戶呈現(xiàn)一樣的排序結(jié)果,無(wú)法針對(duì)不同用戶的需求提供個(gè)性化。

1 相關(guān)工作

該文針對(duì)用戶需求設(shè)計(jì)了一套智能推薦與分析系統(tǒng),該系統(tǒng)具備可視化大屏展示的功能。如圖1所示,該系統(tǒng)主要包括4個(gè)模塊:數(shù)據(jù)處理模塊、智能推薦模塊、數(shù)據(jù)分析模塊和數(shù)據(jù)可視化模塊。該文涉及的工作主要包括以下4個(gè)方面:1) 數(shù)據(jù)處理模塊。包括數(shù)據(jù)采集、數(shù)據(jù)清洗以及數(shù)據(jù)存儲(chǔ)。2) 智能推薦模塊。采用基于協(xié)同過(guò)濾的推薦算法實(shí)現(xiàn)推薦法律知識(shí)和律師服務(wù)的功能,根據(jù)當(dāng)事人對(duì)法律快車(chē)網(wǎng)的瀏覽記錄為用戶推薦相關(guān)的法律知識(shí)和律師服務(wù),從而實(shí)現(xiàn)提供個(gè)性化服務(wù)的目標(biāo)。3) 數(shù)據(jù)分析模塊。基于加權(quán)TFIDF算法和聚類分析算法研究某一段時(shí)間內(nèi)某地域的熱點(diǎn)事件,實(shí)現(xiàn)對(duì)地域熱點(diǎn)事件的追蹤,進(jìn)而實(shí)時(shí)把握、追蹤社會(huì)熱點(diǎn)。采用統(tǒng)計(jì)算法分析離婚案件與地域的關(guān)聯(lián)性,適當(dāng)?shù)貫橛脩籼峁┖侠淼膮⒖及咐瑸橛脩敉咨铺幚黼x婚事件提供法律支持。4)數(shù)據(jù)可視化模塊。對(duì)基于法律快車(chē)網(wǎng)的智能推薦結(jié)果與分析結(jié)果進(jìn)行前端大屏可視化展示。

圖1 基于法律快車(chē)網(wǎng)的智能推薦與分析系統(tǒng)架構(gòu)

2 數(shù)據(jù)處理模塊

使用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)訪問(wèn)法律快車(chē)網(wǎng)站并采集數(shù)據(jù),通過(guò)網(wǎng)絡(luò)爬蟲(chóng)相關(guān)的頁(yè)面解析技術(shù),從訪問(wèn)頁(yè)面中提取價(jià)值數(shù)據(jù),數(shù)據(jù)字段包括用戶ID、用戶所在省市、來(lái)源關(guān)鍵詞、來(lái)源網(wǎng)站、訪問(wèn)時(shí)間、訪問(wèn)頁(yè)面、頁(yè)面標(biāo)題、標(biāo)簽、網(wǎng)頁(yè)類別、關(guān)鍵詞、律師ID、律師姓名、擅長(zhǎng)領(lǐng)域以及律師所在省市等。

對(duì)采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與存儲(chǔ),清除關(guān)鍵詞段為空的數(shù)據(jù)以及律師和用戶不可用的數(shù)據(jù)。將清洗規(guī)整的數(shù)據(jù)拆分為5個(gè)表(開(kāi)展不同的分析工作),分別是律師表、用戶表、提問(wèn)信息表、法律知識(shí)表以及綜合信息表。

3 智能推薦模塊

用戶進(jìn)入法律快車(chē)網(wǎng)網(wǎng)站主頁(yè)查找資源,自行尋找位于不同欄目下的目標(biāo)資源相對(duì)困難,此時(shí)需要網(wǎng)站提供推薦功能,推薦用戶感興趣的頁(yè)面(例如讓有法律援助需求的公眾快速找到合適的律師)。該文通過(guò)數(shù)據(jù)建模分析用戶事件行為,設(shè)計(jì)了基于協(xié)同過(guò)濾的法律快車(chē)網(wǎng)推薦模型,該模型是基于計(jì)算用戶相似度的思想,根據(jù)用戶對(duì)信息類別的偏好找到相似用戶,再將相似用戶喜歡的推薦給當(dāng)前用戶。該系統(tǒng)所推薦的內(nèi)容分為2個(gè)部分,第一部分是為用戶推薦律師,第二部分是為用戶推薦法律知識(shí)。

首先,對(duì)常用用戶的瀏覽數(shù)據(jù)進(jìn)行分類,根據(jù)法律類別的不同來(lái)反映用戶的偏好,并對(duì)偏好程度進(jìn)行加權(quán),得到用戶對(duì)不同類別信息的總體喜好程度。其次,對(duì)目前登陸用戶的歷史瀏覽數(shù)據(jù)進(jìn)行分析,得到滿足當(dāng)前用戶需求的律師和法律知識(shí),根據(jù)用戶的需求程度計(jì)算相似用戶,從而基于相似用戶進(jìn)行推薦。相似度的基礎(chǔ)計(jì)算方法是基于向量的,也是計(jì)算2個(gè)向量之間的距離,距離越小表示相似度越高。在推薦場(chǎng)景中,可以將用戶瀏覽信息類別偏好看作二維矩陣,將1個(gè)用戶對(duì)所有物品的偏好作為1個(gè)向量,也可以將所有用戶對(duì)某個(gè)物品的偏好作為1個(gè)向量,從而計(jì)算物品的之間的相似度。

2個(gè)用戶的相似度如公式(1)所示。

式中:和分別為2個(gè)不同用戶的維向量,= [,,,...,X](X為向量),=[,,,...,Y](Y為向量);為用戶與用戶的夾角,=0°,其余弦值為1。

當(dāng)2個(gè)向量之間的夾角越小(越趨近于 0° ),2個(gè)用戶(和)越相似。

完成相似度的計(jì)算后,根據(jù)相似度找到用戶-瀏覽信息類別的鄰居。該文采用的算法是挑選固定數(shù)量鄰居的方法。根據(jù)鄰居的相似度權(quán)重以及他們對(duì)信息類別的需求,預(yù)測(cè)當(dāng)前用戶沒(méi)有瀏覽過(guò)的律師信息與法律知識(shí),計(jì)算網(wǎng)站的訪問(wèn)次數(shù)的權(quán)重。經(jīng)過(guò)加權(quán)計(jì)算得到1個(gè)排序的物品列表作為推薦,試驗(yàn)設(shè)置為5,表示將排名前五的律師或類別法律知識(shí)推薦給訪問(wèn)用戶。

4 數(shù)據(jù)分析模塊

4.1 熱點(diǎn)事件

需要嚴(yán)密地對(duì)網(wǎng)上的突發(fā)輿情信息進(jìn)行監(jiān)控,希望可以把握和跟蹤最新的社會(huì)熱點(diǎn),并分析其對(duì)人們生活造成的影響。發(fā)現(xiàn)熱點(diǎn)事件是要發(fā)現(xiàn)某個(gè)以前未知的熱點(diǎn)話題,可以通過(guò)不同的聚類算法來(lái)發(fā)現(xiàn)話題。但是單純通過(guò)聚類算法無(wú)法處理文本信息,該文提出的基于聚類分析和TF-IDF加權(quán)的算法能夠很好地解決區(qū)域熱點(diǎn)分析問(wèn)題。該方法比傳統(tǒng)的單一基于聚類的熱點(diǎn)事件分析方法擁有更高的準(zhǔn)確性。

熱點(diǎn)事件模塊設(shè)計(jì)分為以下4個(gè)步驟:1) 使用結(jié)巴分詞將數(shù)據(jù)集中提出問(wèn)題切成詞組。2)TF-IDF找出關(guān)鍵詞。TF詞頻(Term Frequency)和IDF反文檔頻率(Inverse Document Frequency)。TF表示詞條在文檔d中出現(xiàn)的頻率。IDF表示如果包括詞條t的文檔越少,也就是越小且IDF越大,則說(shuō)明詞條t具有很好的類別區(qū)分能力。反之,詞條t不具有區(qū)分能力。詞頻如公式(2)所示。反文檔頻率如公式(3)所示。為詞條對(duì)文檔的重要程度,如公式(4)所示。3)K-means聚類。通過(guò)從數(shù)據(jù)中隨機(jī)選取個(gè)詞條作為初始點(diǎn)質(zhì)心,計(jì)算質(zhì)心與數(shù)據(jù)點(diǎn)距離不斷迭代,當(dāng)質(zhì)心的距離小于設(shè)定的閾值,算法終止。4) 合并同類。將同一類別的文件合并,對(duì)每個(gè)同類文件進(jìn)行加權(quán)詞頻統(tǒng)計(jì)與排序,篩選出排名前位的詞條作為這段時(shí)間內(nèi)該區(qū)域的熱門(mén)事件。

式中:n為該詞在文件d中出現(xiàn)的次數(shù);∑n為在文件中所有詞出現(xiàn)次數(shù)的和;為文件d中所有詞的數(shù)量。

式中:||為語(yǔ)料庫(kù)中的文件總數(shù);|{︰td}|為包括詞語(yǔ)t的文件數(shù)目(即n的文件數(shù)目),如果該詞語(yǔ)不在語(yǔ)料庫(kù)中,就會(huì)導(dǎo)致被除數(shù)為0。

4.2 離婚案件

工業(yè)化與現(xiàn)代化的深入推進(jìn)給現(xiàn)代社會(huì)婚姻家庭關(guān)系所帶來(lái)的重大變化之一就是離婚問(wèn)題日益突出,離婚率趨向上升。該文使用大數(shù)據(jù)分析技術(shù)分析了中國(guó)省級(jí)與市級(jí)之間離婚水平的差別和離婚水平與用戶所在地區(qū)的關(guān)聯(lián)性。

離婚案件分析模塊設(shè)計(jì)如下:一個(gè)地區(qū)的離婚水平與該地區(qū)所有用戶訪問(wèn)法律快車(chē)網(wǎng)中有關(guān)離婚信息的次數(shù)和所有用戶訪問(wèn)網(wǎng)站所有信息的次數(shù)的比率與該地區(qū)訪問(wèn)離婚案件的用戶人數(shù)和總用戶數(shù)的比率有關(guān),地域離婚率,如公式(5)所示。

式中:N為統(tǒng)計(jì)離婚咨詢次數(shù);N為該地區(qū)咨詢總數(shù);N為咨詢離婚案件的用戶數(shù);N為總用戶數(shù);與為2個(gè)比率的權(quán)重系數(shù)。

在該試驗(yàn)中,初始化與,表示咨詢次數(shù)比率對(duì)地域離婚率的影響占比,用戶人數(shù)的比率對(duì)地域離婚率的影響占比,在試驗(yàn)中分別設(shè)為0.3與0.7。地域離婚率越大,該地區(qū)的離婚案件越多;地域離婚率越小,該地區(qū)的離婚案件越少。

5 數(shù)據(jù)可視化模塊

數(shù)據(jù)可視化將數(shù)據(jù)分析模塊進(jìn)行精美又直接的展示,該文采用可視化大屏的方式對(duì)分析與推薦結(jié)果進(jìn)行展示。在數(shù)據(jù)可視化模塊中展示熱門(mén)事件詞云圖、福建省各地區(qū)咨詢離婚次數(shù)、全國(guó)各省離婚率占比、用戶地區(qū)分布、相關(guān)律師和法律推薦。

從可視化大屏中直觀獲得用戶總?cè)藬?shù)為36 040人,其中律師總?cè)藬?shù)為6 206人。為了直觀地觀測(cè)用戶群體所在的地區(qū),繪制圓環(huán)圖與中國(guó)地圖,在地圖中則能夠觀測(cè)到各省份用戶的訪問(wèn)次數(shù)。

對(duì)用戶在法律快車(chē)網(wǎng)上提出問(wèn)題的數(shù)據(jù)進(jìn)行分析,得到時(shí)間段內(nèi)出現(xiàn)頻率較高的詞匯數(shù)據(jù),以廈門(mén)地區(qū)為例,分析近一個(gè)月內(nèi)的高搜索頻率詞條,將其作為熱點(diǎn)事件并通過(guò)詞云圖直觀地呈現(xiàn)出來(lái),如圖2所示。

圖2 熱門(mén)事件的詞條

圖3用柱狀圖形象地展示了福建省各地區(qū)離婚率的差異,可以直觀地了解離婚案件與地域的關(guān)聯(lián)性。以福建省為例,橫坐標(biāo)為福建省的部分城市,縱坐標(biāo)為訪問(wèn)離婚案件的次數(shù)(單位:次),福州市的離婚咨詢次數(shù)最高,其次為廈門(mén)市和泉州市。其中,三明市的離婚咨詢次數(shù)最低。

圖3 福建省各地區(qū)咨詢離婚次數(shù)

系統(tǒng)智能地為用戶推薦合適的律師與法律知識(shí),試驗(yàn)結(jié)果如圖4所示。當(dāng)用戶進(jìn)入網(wǎng)站時(shí),系統(tǒng)會(huì)識(shí)別用戶ID,匹配與該用戶ID最相似的其他用戶,將相似用戶曾經(jīng)多次訪問(wèn)過(guò)的律師信息推薦給給該用戶。方便用戶快速地查找自己符合自己需求的律師和答案。

圖4 推薦律師與法律知識(shí)

該文設(shè)計(jì)了基于協(xié)同過(guò)濾的法律快車(chē)網(wǎng)推薦模型,該模型基于計(jì)算用戶相似度的思想,分別對(duì)用戶-律師和用戶-法律知識(shí)數(shù)據(jù)進(jìn)行分析,從試驗(yàn)結(jié)果可知,該模型的推薦結(jié)果能夠滿足用戶的需求。

6 結(jié)語(yǔ)

該文提出基于法律快車(chē)網(wǎng)的智能推薦與分析系統(tǒng),該系統(tǒng)能夠幫助用戶簡(jiǎn)單快速地在法律快車(chē)網(wǎng)中找到感興趣的法律知識(shí)和專業(yè)律師。該系統(tǒng)使不同地域的用戶進(jìn)入系統(tǒng)之后都可以直觀地瀏覽近期該地域的熱點(diǎn)事件,發(fā)揮對(duì)社會(huì)事件的監(jiān)督作用,具有很大的應(yīng)用價(jià)值,還可以為其他網(wǎng)絡(luò)平臺(tái)的建設(shè)提供參考。

猜你喜歡
可視化法律用戶
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
法律解釋與自然法
法律方法(2021年3期)2021-03-16 05:57:02
基于CGAL和OpenGL的海底地形三維可視化
“融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
關(guān)注用戶
關(guān)注用戶
關(guān)注用戶
讓人死亡的法律
山東青年(2016年1期)2016-02-28 14:25:30
“互助獻(xiàn)血”質(zhì)疑聲背后的法律困惑
主站蜘蛛池模板: 亚洲性视频网站| 亚洲欧美精品一中文字幕| 亚洲Aⅴ无码专区在线观看q| 亚洲无线视频| 亚洲国产理论片在线播放| 国产成人三级| 国产成人综合亚洲网址| 国产chinese男男gay视频网| 亚洲狼网站狼狼鲁亚洲下载| 欧美在线伊人| 日韩无码精品人妻| a级免费视频| 精品无码一区二区三区在线视频| 伊人久综合| 国产麻豆精品久久一二三| 国产精品尤物在线| 国产日韩精品欧美一区灰| 久久99国产视频| 国产精品v欧美| 婷婷六月在线| 国产精品真实对白精彩久久| 中文字幕永久视频| 自拍偷拍欧美日韩| 日本五区在线不卡精品| 尤物精品国产福利网站| 国产丝袜无码一区二区视频| 国产无遮挡裸体免费视频| 91福利片| 亚洲v日韩v欧美在线观看| 欧美日韩在线国产| 国产黄网永久免费| 亚洲六月丁香六月婷婷蜜芽| 在线无码九区| 亚洲三级电影在线播放| 日韩大乳视频中文字幕| 91精品视频在线播放| 又大又硬又爽免费视频| 亚洲VA中文字幕| 日韩少妇激情一区二区| 欧美日韩国产在线播放| 免费看av在线网站网址| 制服丝袜无码每日更新| 亚洲av成人无码网站在线观看| 草草线在成年免费视频2| 色婷婷综合在线| 国内精品久久久久久久久久影视| 精品在线免费播放| 国产福利在线观看精品| 国产在线自在拍91精品黑人| 国产精品亚洲αv天堂无码| 国产午夜不卡| 精品国产电影久久九九| 日本在线视频免费| 精品黑人一区二区三区| 亚洲精品自拍区在线观看| 九色视频线上播放| 精品久久久久久久久久久| 亚洲乱强伦| 精品三级网站| 在线亚洲精品自拍| 欧美啪啪一区| 伊人丁香五月天久久综合 | 91色老久久精品偷偷蜜臀| 91午夜福利在线观看| 久久这里只有精品8| 97se亚洲综合在线| 国产青榴视频| 99精品热视频这里只有精品7 | 久久国产亚洲欧美日韩精品| 欧美日韩激情在线| 五月天在线网站| 色国产视频| 国产精品无码一区二区桃花视频| 人人91人人澡人人妻人人爽 | 狠狠色综合久久狠狠色综合| 婷婷六月在线| 久久精品国产999大香线焦| 国产草草影院18成年视频| 国内a级毛片| 亚洲成人一区二区| 色一情一乱一伦一区二区三区小说| 99re这里只有国产中文精品国产精品 |