胥曉莎,潘理,楊勃
(湖南理工學(xué)院信息與通信工程學(xué)院,岳陽 414006)
法律咨詢網(wǎng)站用戶行為分析與服務(wù)優(yōu)化
胥曉莎,潘理,楊勃
(湖南理工學(xué)院信息與通信工程學(xué)院,岳陽 414006)
針對某法律咨詢網(wǎng)站交互能力不足、查詢效率不高等問題,通過用戶行為分析,提出網(wǎng)站服務(wù)優(yōu)化方案。首先對網(wǎng)站訪問數(shù)據(jù)進(jìn)行數(shù)值化預(yù)處理,然后進(jìn)行用戶行為特征分析,找到影響服務(wù)效率的因素;然后,提出網(wǎng)站服務(wù)性能評價模型,從訪問成功率和訪問效率兩方面評估網(wǎng)站服務(wù)性能;最后,通過優(yōu)化常用關(guān)鍵字列表、組合條件查詢、內(nèi)容頁面鏈接等方案,使網(wǎng)站訪問成功率和訪問效率得到較大提高。所提網(wǎng)站服務(wù)性能評估模型具有較強(qiáng)的普適性,可為其他專業(yè)網(wǎng)站性能評估和優(yōu)化設(shè)計(jì)提供參考。
法律咨詢網(wǎng)站;用戶行為分析;訪問成功率;訪問效率
隨著我國社會經(jīng)濟(jì)發(fā)展,法律服務(wù)需求不斷增長,但法律資源總體稀缺,且地區(qū)分布不均衡。法律咨詢網(wǎng)站應(yīng)運(yùn)而生。但由于法律事務(wù)的復(fù)雜性、多樣性、專業(yè)性,與當(dāng)面咨詢相比,現(xiàn)有法律網(wǎng)站交互存在功能不足,無法與用戶形成有效互動。并且絕大多數(shù)用戶缺乏專業(yè)法律知識,難以通過網(wǎng)站導(dǎo)航、關(guān)鍵詞搜索等傳統(tǒng)方式準(zhǔn)確搜索,影響用戶體驗(yàn),限制網(wǎng)站發(fā)揮作用。因此,為了提高服務(wù)效率,高效、快捷地找到針對性的法律知識、相關(guān)案例或?qū)I(yè)律師至關(guān)重要。
隨著移動互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)搜索的用戶規(guī)模不斷增多,理解用戶行為模式和對網(wǎng)絡(luò)用戶行為分析對系統(tǒng)優(yōu)化至關(guān)重要。萬飛、趙溪等通過對查詢詞分析,會話分析和用戶點(diǎn)擊分析并與互聯(lián)網(wǎng)搜索引擎指標(biāo)進(jìn)行對比,分析得出移動搜索引擎算法改進(jìn)與系統(tǒng)優(yōu)化具有一定的參考意義[1]。岑榮偉,劉奕群等基于7.56億條真實(shí)網(wǎng)絡(luò)用戶行為日志,對用戶行為進(jìn)行分析和研究。主要考察了用戶搜索行為中的查詢長度,修改率,相關(guān)搜索點(diǎn)擊率,并考察了用戶在不同查詢需求下的行為差異[2]。榮國婷、王建冬等基于日志挖掘?qū)D書館主頁網(wǎng)站用戶行為[3]和用戶期刊數(shù)據(jù)庫檢索行為進(jìn)行分析[4]。上述研究對網(wǎng)站服務(wù)性能評估具有一定參考意義,但未對訪問成功率和訪問效率等服務(wù)性能指標(biāo)進(jìn)行深入探討,而這兩個指標(biāo)對于法律咨詢網(wǎng)站服務(wù)效率評估非常重要。
本文某法律網(wǎng)站提供的用戶訪問日志數(shù)據(jù)的基礎(chǔ)上,通過分析用戶行為特征,找到影響網(wǎng)站訪問效率的主要因素,然后從訪問成功率和訪問效率兩個方面,提出網(wǎng)站服務(wù)性能模型,評估網(wǎng)站目前的服務(wù)性能。最后,從關(guān)鍵詞、組合查詢、頁面鏈接等方面提出服務(wù)優(yōu)化改進(jìn)方案,通過實(shí)驗(yàn)數(shù)據(jù)對比發(fā)現(xiàn),新提出的改進(jìn)方案在訪問成功率和訪問效率方面均有明顯提高。
由于原始數(shù)據(jù)存在多源性、多樣性特點(diǎn),不利于數(shù)據(jù)的統(tǒng)一運(yùn)算和處理,需要通過對網(wǎng)站訪問數(shù)據(jù)進(jìn)行規(guī)整和預(yù)處理,找出反映網(wǎng)站服務(wù)效率和用戶體驗(yàn)的特征和規(guī)律,形成一種計(jì)算網(wǎng)站服務(wù)效率的評估方法,從而分析得到影響訪問成功率等性能指標(biāo)的主要因素。
1.1 數(shù)據(jù)預(yù)處理
本文分析的數(shù)據(jù)對象來源于某法律快車網(wǎng)站的用戶訪問數(shù)據(jù)記錄,時間范圍從2015年3月1日~2015年3月25日。提供的主要數(shù)據(jù)文件包括:經(jīng)過整理的網(wǎng)站訪問記錄文件:包含所有類別的網(wǎng)站訪問記錄文件4個,共189938條訪問記錄,每條記錄包含13項(xiàng)屬性。另外,還提供離婚類別的記錄文件5個,共293999條訪問記錄,列屬性項(xiàng)與所有類別的記錄文件相同。原始訪問日志文件:包含65535條原始訪問日志記錄,每條記錄包含20項(xiàng)屬性。常見關(guān)鍵詞列表文件:包含4850項(xiàng)常見法律專業(yè)關(guān)鍵詞。頁面分類信息文件:包含30條頁面分類信息,每條信息包括3項(xiàng)內(nèi)容:頁面分類編號、網(wǎng)址、頁面標(biāo)題。此外,還提供了部分律師信息文件和部分網(wǎng)站頁面文件。
數(shù)據(jù)預(yù)處理過程包含對網(wǎng)站提供的數(shù)據(jù)進(jìn)行合并、轉(zhuǎn)換等預(yù)處理操作。綜合主體數(shù)據(jù)文件中的各項(xiàng)數(shù)據(jù)采用數(shù)值類型。通過對各個不同來源的原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換和重塑,統(tǒng)一規(guī)整為數(shù)值類型,以方便數(shù)據(jù)的統(tǒng)計(jì)和分析。
1.2 用戶行為特征分析
主要從用戶關(guān)注領(lǐng)域,訪問時段分布,用戶會話次數(shù),前導(dǎo)鏈接使用,用戶地域分布,用戶訪問來源等幾個方面對用戶行為特征進(jìn)行分析。
通過數(shù)據(jù),可得用戶行為特征如下:(1)訪問量靠前的18類關(guān)注領(lǐng)域(占領(lǐng)域總數(shù)的23%)的訪問記錄數(shù)達(dá)到143994次,占用戶總訪問量的76%,而訪問量排名靠后的61類關(guān)注領(lǐng)域占總訪問量的24%。(2)工作日上升,休息日回落,周期性分布明顯。(3)對用戶會話次數(shù)統(tǒng)計(jì)分析發(fā)現(xiàn):該網(wǎng)站用戶更偏向于使用1次會話,說明網(wǎng)站并沒有引導(dǎo)好用戶進(jìn)行多次會話,反映該網(wǎng)站的交互功能不足。(4)對用戶前導(dǎo)鏈接使用統(tǒng)計(jì)分析發(fā)現(xiàn):絕大多數(shù)用戶沒有在日志中留下無前導(dǎo)鏈接,說明并沒有在網(wǎng)站中進(jìn)行多次路徑跳轉(zhuǎn),反映網(wǎng)站頁面導(dǎo)航或交互功能還有待進(jìn)一步改進(jìn)。(5)對用戶地域分布統(tǒng)計(jì)分析發(fā)現(xiàn):用戶地區(qū)分布明顯不均衡。(6)通過對用戶訪問來源可知:搜索引擎是用戶訪問該法律網(wǎng)站最常用的方式。
法律咨詢網(wǎng)站是為用戶提供法律信息服務(wù)的,用戶能否成功訪問到感興趣的頁面,用戶經(jīng)過多少次跳轉(zhuǎn)才訪問到感興趣的頁面是衡量網(wǎng)站服務(wù)質(zhì)量的兩個重要指標(biāo)。所以我們采取訪問成功率和訪問效率對網(wǎng)站服務(wù)進(jìn)行評價。

圖1 網(wǎng)站用戶行為特征分析
2.1訪問成功率
(1)內(nèi)容頁面訪問率
我們定義以下三類方式為成功訪問條件:①通過直接訪問到內(nèi)容頁面。②通過有關(guān)鍵詞記錄的搜索引擎訪問到內(nèi)容頁面并且內(nèi)容頁面與用戶的提問匹配。③通過無關(guān)鍵詞記錄的搜索引擎訪問到內(nèi)容頁面,我們假設(shè)匹配性符合隨機(jī)分布。
根據(jù)網(wǎng)頁分類信息文件,可以將該法律網(wǎng)站的頁面分為以下三種類型:法律咨詢相關(guān)頁面Nq,律師查詢相關(guān)頁面;其他法律知識頁面。類似地,該法律網(wǎng)站的內(nèi)容頁面也分為以下三種類型:咨詢內(nèi)容頁面;律師內(nèi)容頁面;其他知識內(nèi)容頁面。
特定頁面訪問率:

N為網(wǎng)站頁面訪問總量,NX為特定頁面訪問量,x∈{q,l,k},Nq為咨詢頁面訪問量,Nl為律師頁面訪問量,Nk為其他知識頁面訪問量。Rx為特定頁面訪問率。
內(nèi)容頁面訪問率:

特定內(nèi)容頁面訪問率:

Nc為內(nèi)容頁面訪問總量,Ncx為特定內(nèi)容頁面訪問量,Rcx為特定內(nèi)容頁面訪問率。
(2)搜索提問與內(nèi)容頁面的匹配率
該法律網(wǎng)站提供了常見法律專業(yè)關(guān)鍵詞。根據(jù)關(guān)鍵詞列表,定義問題和頁面的專業(yè)關(guān)聯(lián)性。我們將頁面與問題的匹配率定義為頁面與問題有匹配的訪問數(shù)與該頁面的訪問量的比值。
搜索提問與內(nèi)容頁面的關(guān)鍵詞匹配數(shù):

Mq表示搜索提問包含的關(guān)鍵詞的集合,Kq=|Mq|表示提問包含關(guān)鍵詞的數(shù)目,Mp和Kp表示頁面包含的關(guān)鍵詞的集合和關(guān)鍵詞的個數(shù)。Kq(或Kp)越大,表示該提問(或頁面)與法律專業(yè)的關(guān)聯(lián)程度越高。Kq(或Kp)大于0,表示提問(或頁面)與法律專業(yè)的關(guān)聯(lián)。Mqp表示提問與頁面共同包含的關(guān)鍵詞集合,用Kqp表示提問與頁面共同包含的關(guān)鍵詞個數(shù)。Kqp大于0,表示提問與頁面的有匹配。Kqp越大,表示提問與頁面的專業(yè)匹配度越高。
訪問特定內(nèi)容頁面條件下的匹配率:

Ncx為特定內(nèi)容頁面訪問數(shù),NX|cx是訪問特定內(nèi)容頁面條件下包含搜索提問的訪問記錄數(shù),則RN|cx是訪問特定內(nèi)容頁面條件下搜索提問與頁面內(nèi)容的匹配率。
(3)內(nèi)容頁面訪問成功率
特定內(nèi)容頁面的訪問成功率:

用SX|cx特定內(nèi)容頁面的成功率。特定內(nèi)容頁面訪問成功率SX|cx等于特定內(nèi)容頁面的訪問率Rcx和訪問特定內(nèi)容頁面條件下的匹配率RX|qx的乘積。

內(nèi)容頁面的平均訪問成功率:由式(7)計(jì)算可得:該網(wǎng)站內(nèi)容頁面平均訪問成功率Sc=36.97%。

表1 內(nèi)容頁面的訪問成功率
由此我們可推斷出:由于用戶缺乏專業(yè)法律知識,不能準(zhǔn)確使用恰當(dāng)?shù)年P(guān)鍵詞進(jìn)行搜索,導(dǎo)致搜索效率降低,無法有針對性地高效找到相關(guān)頁面,影響用戶體驗(yàn)。
2.2訪問效率
用戶進(jìn)入一個網(wǎng)站瀏覽網(wǎng)頁時,也會有一個“參觀順序”,這個順序就是用戶瀏覽網(wǎng)頁的路徑。訪客先瀏覽哪個頁面,后瀏覽哪個頁面,這些都包括在訪問路徑里。定義訪問路徑長度Lu為用戶u在網(wǎng)站中跳轉(zhuǎn)的頁面數(shù)。用戶u訪問路徑長度越大,說明用戶需要經(jīng)過更多次跳轉(zhuǎn)才能到達(dá)最終頁面,用戶訪問效率就越低。因此我們使用路徑長度的倒數(shù)定義為用戶這次訪問的效率。即訪問效率=1/路徑長度。
用Eave表示網(wǎng)站的平均訪問效率,則:
網(wǎng)站的平均訪問效率:

拓?fù)浣Y(jié)構(gòu),我們進(jìn)一步改善了網(wǎng)站訪問效率。根據(jù)式(8)計(jì)算可得:改進(jìn)后用戶成功時的平均路徑長度為1.5035,改進(jìn)后失敗訪問時的平均路徑長度為2.0894,改進(jìn)前平均訪問效率55.17%,改進(jìn)后平均訪問效率65.06%,優(yōu)化了約10個百分點(diǎn)。

表2 網(wǎng)站訪問效率

表3 訪問成功率改進(jìn)對比
根據(jù)(式8)計(jì)算可得:網(wǎng)站的平均訪問效率為55.17%。由于網(wǎng)站內(nèi)容頁面缺乏相關(guān)性鏈接,導(dǎo)致一些訪問需要經(jīng)過多次跳轉(zhuǎn)才能找到目標(biāo)頁面,增大了平均路徑長度,減低了訪問效率。

表4 改進(jìn)前后訪問效率對比
通過分析用戶在關(guān)注領(lǐng)域、用戶體驗(yàn)等方面的特征和規(guī)律,發(fā)現(xiàn)該網(wǎng)站在查找相關(guān)頁面或?qū)I(yè)律師的成功率和效率等方面還存在問題。
訪問成功率的改進(jìn)方案包括:(1)增加常用非法律關(guān)鍵詞列表,提升問題與頁面的匹配率。(2)增加關(guān)鍵詞的領(lǐng)域關(guān)聯(lián),提高關(guān)鍵詞之間的關(guān)聯(lián)性。
訪問效率的優(yōu)化方案為:(1)增設(shè)組合條件查詢功能,減少用戶查找的頁面跳轉(zhuǎn)數(shù),提高查詢效率,改善用戶體驗(yàn)。(2)優(yōu)化網(wǎng)頁鏈接結(jié)構(gòu),減少用戶回退次數(shù)。
通過增加非專業(yè)關(guān)鍵詞和增加關(guān)鍵詞的領(lǐng)域關(guān)聯(lián),明顯提高了對通過關(guān)鍵詞搜索進(jìn)入頁面的匹配度,從而改進(jìn)內(nèi)容頁面的訪問成功率。根據(jù)式(7)計(jì)算可得改進(jìn)前的內(nèi)容頁面平均訪問成功率Sc=36.97%,改進(jìn)后內(nèi)容頁面平均訪問成功率Sc=49.15%,提高了約12個百分點(diǎn)。通過增加組合條件查詢功能和優(yōu)化網(wǎng)頁鏈接
本文針對法律咨詢網(wǎng)站服務(wù)效率偏低的問題,提出網(wǎng)站服務(wù)性能評估模型,通過用戶行為分析和性能評估,給出相應(yīng)優(yōu)化改進(jìn)方案,使網(wǎng)站服務(wù)效率得到明顯提高。論文從訪問成功率和訪問效率兩個方面定義網(wǎng)站服務(wù)性能。訪問成功率反映用戶成功訪問到感興趣的內(nèi)容頁面的概率;訪問效率反映用戶需要經(jīng)過多少次跳轉(zhuǎn)才訪問到感興趣的頁面。通過對訪問數(shù)據(jù)進(jìn)行評估計(jì)算,找到現(xiàn)有網(wǎng)站服務(wù)效率偏低的主要原因,并通過增加常用關(guān)鍵詞列表、增設(shè)組合條件查詢等方式提高網(wǎng)站服務(wù)質(zhì)量。實(shí)驗(yàn)對比發(fā)現(xiàn),改進(jìn)后網(wǎng)站服務(wù)性能得到較大提升。
[1]萬飛,趙溪,梁循,等.基于移動互聯(lián)網(wǎng)日志的搜索引擎用戶行為研究[J].中文信息學(xué)報(bào),2014,28(2):144-150.
[2]岑榮偉,劉奕群,張敏,等.基于日志挖掘的搜索引擎用戶行為分析[J].中文信息學(xué)報(bào),2010,24(3):49-54.
[3]榮國婷,羅勇,孫建軍.基于日志分析的圖書館主頁網(wǎng)站用戶行為研究[J].圖書館雜志,2015(7):59-63.
[4]王建冬,王繼民.基于日志挖掘的高校用戶期刊數(shù)據(jù)庫檢索行為研究[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2012,48(1):29-36.
User Behavior Analysis and Service Optimization for Legal Advice Website
XU Xiao-sha,PAN Li,YANG Bo
(Department of Information and Communication Engineering,Hunan Institute of Science and Technology,Yueyang 414006)
Puts forward a service optimization solution for legal advice websites to make up the lack of interaction capacity and low query efficiency by the analysis of user behaviors.At first,makes the preprocessing of numerical normalization for the raw website data.Then,analyzes the user behaviors to find the factors influencing the efficiency of services,and defines the performance model of the website.Service performances include the success rate of accessing content page and the access efficiency.Finally,proposes an optimization solution to improve the two performance indexes by adding the common non-professional keywords and providing combination query.The proposed performance model has good suitability,and is applied to performance evaluation for other professional websites.
Legal Advice Website;User Behavior Analysis;Success Rate of Access;Access Efficiency
0 引言
1007-1423(2016)33-0018-05
10.3969/j.issn.1007-1423.2016.33.004
胥曉莎(1991-),女,湖南汨羅人,碩士研究生,研究方向?yàn)閺?fù)雜系統(tǒng)建模與分析
潘理(1975-),男,湖南平江人,博士,副教授,研究方向?yàn)橄到y(tǒng)建模與優(yōu)化、Petri網(wǎng)
楊勃(1974-),男,湖南岳陽人,博士,副教授,研究方向?yàn)槟J阶R別
2016-10-14
2016-11-20