999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶訪問序列挖掘的站點路徑優化分析

2013-12-31 00:00:00
中外企業文化 2013年12期

【文章摘要】

本文利用Web挖掘的方法和技術對用戶所訪問的頁面序列進行挖掘,構建路徑優化的模型,實現對當前站點排序方式的優化,從而最大限度地優化用戶訪問體驗,提高當前站點信息獲取的整體效率。

【關鍵詞】

路徑優化;Web挖掘;訪問序列

傳統的Web網站以系統自身為中心,為了容納大量的信息,以圖結構組織網站,頁面之間存在著比較復雜的層次關系。這些預先設計好的瀏覽路徑(網站的結構)嚴格按照設計者編輯好的層次返回頁面,因此,為了獲取特定的信息,從同一頁面出發的所有用戶都不得不重復地經過很多與自己毫無關系的、不希望看到的中間鏈接頁面,使得用戶為了獲取少量的信息付出較大的代價。如果在確保網頁內容的前提下,實現網站物理結構的調整和再組織,就可以避免混亂。站點路徑優化實際上就是站點管理者優化其站點結構,它的出現就是為了提高用戶的訪問效率以及用戶對站點的忠誠度。

1 站點個性化與路徑優化

所謂站點個性化實質上就是為站點用戶提供個性化的站點訪問體驗。對于一般站點而言,站點管理者進行路徑優化的直接目的就是提高用戶點擊行為的效用度,最終目的是提高用戶滿意度與忠誠度。站點路徑的優化實際上就是優化站點結構,消除站點實際安排與用戶期望之間差異的過程,它為站點個性化提供了一種思路,即用戶一系列的瀏覽行為所遍及的頁面序列就是用戶針對目標頁面的尋找過程,此時站點設計可以考慮調整網站的結構、在頻繁訪問路徑處添加指向目標頁面的鏈接,或者是將常見瀏覽路徑加入緩存。

網站的頻繁瀏覽路徑體現了特定的用戶在特定時期內的活動規律,是站點路徑優化的依據。它包括兩個方面的內容:首先是個體用戶在其瀏覽歷史區域中多次重復出現的瀏覽路徑,另一方面即用戶群體在一定時期中瀏覽歷史區域內出現的瀏覽重復行為,即瀏覽模式。

前者可以為用戶提供“一對一”的具備自適應性的在線動態智能個性化服務,這種智能個性化服務可大大縮短用戶在網絡上的訪問延遲,使得提供給用戶的網絡信息服務質量得到最大限度的提高。后者則通過離線修改實施改進,用以優化用戶瀏覽體驗,提高當前站點信息獲取的整體效率,同時提高用戶滿意度和忠誠度。

2 基于Web挖掘的路徑優化模型

Web挖掘從數據挖掘發展而來,但Web挖掘與傳統的數據挖掘相比有許多獨特之處。首先,Web挖掘的對象是大量、不同和分散型的Web文件;其次,Web文件本身是半結構化或無結構的,因此Web挖掘所得到的模式可能是關于內容的,也可能是關于結構的;最后,有些數據挖掘技術并不適用于Web挖掘,即使可以用也需要建立在對Web文件進行預先處理的基礎之上。

2.1 訪問序列挖掘實現過程的理論分析

Web挖掘技術以Web日志為數據源。因為每當用戶在點擊鏈接向站點發出頁面瀏覽請求時,該用戶的IP地址、瀏覽日期和時間、瀏覽頁面URL及引用頁面等信息會被記錄在Web日志中,用戶瀏覽點擊頁面就按照時間順序以頁面URL序列的形式隱藏在Web日志中。用戶訪問序列挖掘即通過對Web日志進行系統的分析和預處理,將用戶以往的瀏覽序列從日志中提取及表示出來,并采用各種Web挖掘方法和算法從不同的角度獲得各類用戶可能的網頁瀏覽順序,探索總結出用戶瀏覽網頁的規則和模式。

從服務器的角度分析,挖掘發現的是提供服務的網站的信息,挖掘結果可以幫助改善網站的設計。從用戶的點擊序列分析,可以發現一個(或者一組)用戶的信息,可幫助實現網頁的預存取和緩存。

2.2 站點路徑優化的模型構建

以Web日志為數據源進行的站點路徑優化的挖掘模型,采用了數據挖掘及Web日志挖掘的相關技術和算法獲取用戶瀏覽規則與模式,為網絡結構優化、站點重構提供參考及個性化服務推薦設計提供了依據。據此站點路徑優化的模型可分為數據預處理和站點路徑優化實現兩個部分,站點路徑優化部分可從兩個方面來考慮:一是通過對Web日志的挖掘,發現用戶的期望位置。如果在期望位置的訪問頻率高于實際位置的訪問頻率,可考慮在期望位置和實際位置之間建立導航鏈接,從而實現對Web站點的優化。二是通過對Web日志的挖掘,發現用戶訪問頁面的相關性,從而對密切聯系的頁面之間增加鏈接,方便用戶使用。

3 站點路徑優化的實現

3.1 Web日志數據收集

Web服務系統是一個多層次的邏輯結構,包括客戶端、代理服務器端、Web服務器端。本文挖掘的是本站點用戶的頻繁訪問路徑、用戶聚類等,因此適合采用Web服務器端的用戶訪問模式挖掘。Web服務器日志由三部分組成:訪問日志、引用日志和代理日志,包括用戶訪問Web站點時,所訪問的頁面、時間、用戶ID等信息。

3.2 站點數據預處理

Web站點及訪問數據預處理部分主要包括站點結構數據預處理、內容數據預處理和Web日志數據預處理。其中,結構數據預處理的任務是描述站點的拓撲結構圖、站點頁面文件鏈接有向圖,并明確站點各個頁面文件鏈接的請求(Request)方法,如GET、POST、HEAD等。站點內容數據預處理包括將文本、圖片、腳本和其他多媒體文件轉變為用戶對站點瀏覽模式記錄信息的開發與利用有用的格式。

3.3 基于Web日志挖掘的路徑優化實現

站點路徑優化可以分為兩類:用戶群訪問模式挖掘的路徑優化和個性化挖掘的路徑優化。一般訪問模式挖掘的路徑優化通過分析在特定時間點的特定用戶群的訪問記錄來了解用戶的瀏覽模式和傾向,以改進站點的組織結構;而個性化挖掘的路徑優化則傾向于分析個別用戶的偏好,根據用戶的訪問模式,為其提供定制服務。

用戶群訪問模式的路徑優化是對用戶群訪問模式的問題,采用挖掘頻繁訪問的最大序列的方法可以挖掘出更有普遍意義的模式,算法包括有Apriori算法,最大向前序列法,參考長度法和樹形拓撲結構法等。它們先將日志中的用戶瀏覽歷史記錄轉換成一個瀏覽子序列集:最大向前序列法根據用戶折返的特性形成若干瀏覽子序列;參考長度法根據用戶在網頁上停留的時間形成若干個瀏覽子序列;樹形拓撲結構法則把整個日志當作瀏覽子序列。然后利用關聯規則法對瀏覽子序列進行挖掘找出頻繁訪問路徑。

4 結語

站點路徑優化可指導用戶的瀏覽行為,提高瀏覽信息效率,將頁面加入緩存提高訪問速度,提高用戶對站點訪問的滿意度。訪問規律的獲取對算法提出了較高的要求,可以借鑒現有模式發現算法實現瀏覽結構的優化。

【參考文獻】

阮備軍.Web使用挖掘若干關鍵問題研究[D].復旦大學,2004.

【作者簡介】

聞名(1982—),男,遼寧省瓦房店人,同濟大學軟件學院碩士研究生。

主站蜘蛛池模板: 久久久久国产精品嫩草影院| 久久国语对白| 人妖无码第一页| 久久精品最新免费国产成人| 一区二区三区四区日韩| 国产午夜精品一区二区三| 国产黄网站在线观看| 99精品国产自在现线观看| 18禁影院亚洲专区| 98精品全国免费观看视频| 日韩人妻少妇一区二区| 国产女人在线视频| 久久77777| 国产日韩欧美精品区性色| 亚洲国产精品一区二区第一页免| 狠狠色噜噜狠狠狠狠色综合久| 欧美成人看片一区二区三区 | 亚洲成人免费看| 成人在线欧美| 福利在线不卡一区| 97se亚洲综合不卡| 丝袜久久剧情精品国产| 久久无码av一区二区三区| 一本大道东京热无码av | 国产亚洲欧美另类一区二区| 亚洲欧洲AV一区二区三区| 久久久精品久久久久三级| 在线观看国产精美视频| 女人毛片a级大学毛片免费| 999精品视频在线| 日本欧美精品| 亚洲第一区在线| 亚洲三级色| 亚洲精品福利视频| 青青草原国产av福利网站| 欧美一级专区免费大片| 精品无码一区二区三区电影| 国产三级a| 麻豆精品在线播放| 国产香蕉在线| 国产丝袜第一页| 中国黄色一级视频| 色偷偷综合网| 99视频精品在线观看| 妇女自拍偷自拍亚洲精品| 亚洲不卡无码av中文字幕| 久久香蕉国产线| 激情六月丁香婷婷| 亚洲天堂区| 一本久道久综合久久鬼色| 欧美日韩中文字幕在线| 日韩欧美国产综合| 亚洲国产欧美国产综合久久| 久草视频精品| 真实国产乱子伦高清| 国产呦视频免费视频在线观看| 国产真实乱了在线播放| 9999在线视频| 亚洲国产精品无码AV| 亚洲欧美在线看片AI| 亚洲狠狠婷婷综合久久久久| 影音先锋丝袜制服| 国产欧美日本在线观看| 国产精品久久久久鬼色| 国产精品极品美女自在线网站| YW尤物AV无码国产在线观看| 欧美国产视频| 国内a级毛片| 456亚洲人成高清在线| 国产精品分类视频分类一区| 欧美第九页| 色妺妺在线视频喷水| 色哟哟国产精品一区二区| 亚洲国模精品一区| 最新国产你懂的在线网址| 亚洲天堂网在线视频| 激情无码视频在线看| 全裸无码专区| 99re热精品视频中文字幕不卡| 欧美色综合久久| 欧美国产三级| 中国美女**毛片录像在线|