999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Web日志挖掘的路徑補充算法改進

2015-05-30 20:37:05邵天會
中國新通信 2015年22期

邵天會

【摘要】 由于進行數據挖掘的Web日志來源不同,進行數據預處理時比較復雜,為了提高數據處理效率,結合網絡拓撲結構對用戶訪問路徑進行二叉樹的轉換,提出PFS(Path For Session)算法---消息路徑優化。研究表明該算法解決了Web日志用戶訪問路徑的補充問題,提高了數據預處理效率。

【關鍵詞】 訪問路徑 PFS 消息路徑優化

Web日志挖掘主要是針對用戶瀏覽信息進行分析,因此用戶會話的提取是首要任務。所謂的用戶會話就是某個用戶在某個時間段內請求頁面的集合[1]。在識別用戶會話過程中存在的一個問題是確定訪問日志中是否有重要的請求沒有被記錄。路徑補充保證了用戶訪問日志的完整性,從而保證Web日子挖掘的現實意義。

一、 路徑補充原理

路徑補充就是將由于本地或代理服務器緩存的影響而沒有產生日志記錄的請求頁增加到用戶會話中[2]。

得到用戶會話之后,要根據用戶會話得到訪問路徑。路徑補充涉及定義如下:

定義:用戶會話的路徑集合 PS=> ,其中,1≦k≦n,Resident 表示用戶在該頁面的停留時間[3]。算法輸入為 RS,RS 中的記錄是按 Rid 值分組按時間順序排列的,輸出為 PS,得到路徑 PS 后,根據引用信息進行路徑補充,如果一條記錄的ReferUrl 不是上一條記錄的 Url,則認為該用戶是點擊“后退”按鈕訪問了緩存中的頁面,需要進行路徑補充。

PS 中的記錄是按 Rid 值分組順序排列的;輸出為:PS。

二、消息路徑優化算法

2.1 消息路徑優化算法原理

結合本文的研究目的和Web日志數據源針對路徑補充的問題提出利用網絡拓撲結構從用戶訪問序列獲得用戶訪問事務數據的算法PFS(Path For Session)算法---消息路徑優化,PFS算法是首先把網站的樹形拓撲結構轉換為二叉樹的結構,然后在二叉樹結構上根據用戶的會話序列得到用戶訪問事務序列,PFS算法認為當前用戶的訪問序列中出現不連續的節點時,則用戶可能點擊了瀏覽器上的Back按鈕或重復點擊一個鏈接,當出現這種情況時,表明用戶在點擊Back按鈕或重復點擊鏈接時就結束了上次會話,重新開始了新一輪的會話。

2.2 消息路徑優化算法的實現

當前會話頁面分別為:A,C,D,I,對應的請求頁面分別為F,H,C,J。

這次會話的序列是:A--F--C--H--D--C--I--J使用路徑補充技術:A--B--F--B--A--C--H--C--A--D--A--I--D--J再利用最大向前引用路徑算法得出用戶的訪問事務為A--B--F,A--C--H,A--D--I--J,三個事務。在此過程中,必須對用戶的訪問序列進行補充得到完整的路徑后再應用最大向前應用路徑才能得到訪問事務。利用PFS算法轉換為二叉樹。

由此,不再需要對訪問序列補充路徑便可由用戶訪問序列直接獲得用戶的訪問事務A--B--F,A--C--H,A--D--I--J。

三、算法改進對比

用戶訪問會話使用路徑補充和PFS算法得到用戶訪問事務的時間進行對比,此對比是假設網站的結點鏈接已經由圖結構轉換為樹形結構,且樹形結構的擁有25個葉結點,樹的深度為分別為3,4,5,6時進行的。

實驗證明該算法在相同的路徑深度前提下,減少了Web日志數據預處理的時間,提高了效率。

四、結論

PFS算法改進了數據預處理階段的路徑補充步驟,從整體上提高了數據挖掘效率,但是算法基于網絡拓撲結構,隨著網站的頁面大量增加,網絡拓撲結構也隨之復雜,算法的復雜度同時增大,所以PFS算法對網絡拓撲結構復雜的網站需要更多的研究,以適應復雜的網絡拓撲結構。

參 考 文 獻

[1] 何坤鵬,郭海波.Web 日志挖掘技術及其應用研究[J],中國科技信息,2007-08-15:236-237.

[2] 劉明吉,王秀峰,黃亞樓.數據挖掘中的數據預處理[J]計算機科學,2000-04-15:3-9.

[3] E.F.Codd,S.B.Codd and C.T.Salley.Providing OLAP to User-Analysts:An IT Mandate.IBM Research Lab,Techni cal Report,1993.

[4] J.Qay,S.Chaudhuri,A.Bosworth,A.Layman,D.Reichart,M.Venkatrao,E Pellow,and H.Pirahesh.Data cube:A relational aggregation operatorgeneralizing group-by,cross-tab and sub-totals.Data Mining and Knowledge Discovery,1:29-54,1997.

主站蜘蛛池模板: 亚洲国产日韩在线观看| a亚洲天堂| 天堂网亚洲系列亚洲系列| 国产麻豆精品在线观看| 国产亚洲精品97在线观看| 91久久偷偷做嫩草影院电| 美女无遮挡免费视频网站| 区国产精品搜索视频| 国产青榴视频| 亚洲浓毛av| 亚洲国产综合精品中文第一| 欧美一级在线| 另类重口100页在线播放| 毛片免费网址| 久久黄色小视频| 久久免费观看视频| 欧美啪啪精品| 秘书高跟黑色丝袜国产91在线| 国产日韩欧美成人| 国模粉嫩小泬视频在线观看| 国产乱肥老妇精品视频| 国产欧美日韩在线一区| 国产成人精品18| 亚洲成人在线免费| 亚洲九九视频| 波多野结衣在线一区二区| 精品三级在线| 久久久久久尹人网香蕉| 精品国产中文一级毛片在线看| aa级毛片毛片免费观看久| m男亚洲一区中文字幕| 亚洲天堂福利视频| 亚洲天堂网在线观看视频| 秋霞一区二区三区| 亚洲国产天堂在线观看| 99精品欧美一区| 人妻丰满熟妇αv无码| 免费精品一区二区h| 三上悠亚在线精品二区| 91啦中文字幕| 午夜激情婷婷| 成年人免费国产视频| 国产精品久久精品| 国产精品七七在线播放| 亚洲视频免费在线看| 亚洲成人手机在线| 91在线中文| 成人免费视频一区| 国产一级在线播放| 亚洲色图欧美激情| 久久精品只有这里有| 久精品色妇丰满人妻| 日本午夜精品一本在线观看 | 亚洲国产成人麻豆精品| 亚洲国产成人超福利久久精品| 不卡国产视频第一页| 色综合天天综合中文网| 欧美成在线视频| 亚洲一区二区黄色| 国产黑丝一区| 久久成人18免费| 欧美色99| 九色在线观看视频| 这里只有精品在线播放| 露脸国产精品自产在线播| 999福利激情视频| 亚洲欧洲自拍拍偷午夜色| 成人在线不卡视频| 先锋资源久久| 九九视频在线免费观看| 男人天堂亚洲天堂| 美女裸体18禁网站| 亚洲欧美不卡| 97人妻精品专区久久久久| lhav亚洲精品| 日韩成人午夜| 亚洲精品视频免费看| 国产丰满成熟女性性满足视频| 国产亚洲美日韩AV中文字幕无码成人| 精品欧美一区二区三区在线| 亚洲天堂日韩在线| 国产成人精品优优av|