999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Web挖掘與個性化服務研究

2007-12-31 00:00:00趙元媛
商場現(xiàn)代化 2007年17期

[摘要] 隨著互聯(lián)網(wǎng)內(nèi)容指數(shù)級的增長,以及數(shù)據(jù)挖掘等新技術(shù)的出現(xiàn),信息服務方式從傳統(tǒng)的“一對多”發(fā)展到“一對一”的個性化用戶服務方式。而利用web挖掘技術(shù)已經(jīng)成為個性化服務的一個研究熱點。

[關(guān)鍵詞] web挖掘 個性化服務 用戶建模 聚類

一、引言

web目前是一個巨大的、分布廣泛的、全球性的信息服務中心,它涉及新聞、廣告、消息信息、金融管理、教育、政府、電子商務和許多其他信息服務。Web還包含了豐富和動態(tài)的超鏈接信息,以及web頁面的訪問和使用信息,這為數(shù)據(jù)挖掘提供了豐富的資源。但如何滿足各種用戶不同的個性化需求,卻成為了新的信息服務系統(tǒng)面臨的挑戰(zhàn)性課題。

二、web挖掘技術(shù)

1.web內(nèi)容挖掘。web內(nèi)容挖掘是從web文檔的內(nèi)容或其描述中提取知識的過程,目的是實現(xiàn)web資源的自動檢索,提供web資源的利用率。基于web文檔的文本挖掘是web內(nèi)容挖掘的主要研究內(nèi)容。在文本挖掘中,通常利用向量來表示文檔。文本挖掘中主要有文本分析、文本解釋、文本分類和文檔可視化等挖掘技術(shù)。文本挖掘目前主要用于web頁面歸納和搜索結(jié)果歸納。

2.web結(jié)構(gòu)挖掘。web結(jié)構(gòu)挖掘可以被視為一種替網(wǎng)絡之間網(wǎng)頁的鏈接組織構(gòu)架建立一個模式,透過這個模式可以了解到網(wǎng)頁與網(wǎng)頁之間的關(guān)聯(lián)性,因而可用來提升網(wǎng)站瀏覽或搜索的效率。web結(jié)構(gòu)挖掘技術(shù)通常將網(wǎng)站鏈接結(jié)構(gòu)對應成有向圖或無向圖的形式,分析鏈接的各條路徑結(jié)構(gòu),整合網(wǎng)站路徑資源。此外,還可以結(jié)合網(wǎng)站使用者的瀏覽動態(tài),發(fā)現(xiàn)重要頁面,從而改進網(wǎng)站的鏈接結(jié)構(gòu)及內(nèi)容呈現(xiàn)的方式,如將重要頁面放在網(wǎng)站醒目的位置,簡化瀏覽路徑等。從而,提高網(wǎng)站架構(gòu)的合理性。

3.web日志挖掘。web日志挖掘是通過分析web服務器的日志文件,已發(fā)現(xiàn)用戶訪問站點的瀏覽模式,為站點管理員提供各種利于web站點改進或可以帶來經(jīng)濟效益的信息,web日志挖掘的過程一般分為4部分:數(shù)據(jù)預處理、挖掘算法實施、模式分析、可視化。如圖1所示。

三、利用web挖掘進行個性化服務

個性化服務技術(shù)是為不同用戶提供不同的服務,以滿足不同的需求。個性化服務通過收集和分析用戶信息來學習用戶的興趣和行為,從而實現(xiàn)主動推薦的目的。個性化服務技術(shù)能夠充分提高站點的服務質(zhì)量和訪問效率,以吸引更多的訪問者。

1.用戶建模。個性化服務的形式多種多樣,但無論何種形式,都需要首先建立對用戶的描述,然后才能據(jù)此提供針對不同用戶的個性化服務,因此用戶建模是個性化服務的基礎和核心。簡單地說,用戶建模是指根據(jù)訪問者對一個web站點上web頁面的訪問情況模型化用戶的自身特性。用戶建模主要有三種途徑:一是推斷匿名訪問者的人口統(tǒng)計特性。由于web訪問者大都是匿名的,所以需要根據(jù)匿名訪問者的訪問內(nèi)容推斷訪問者的特性。這類挖掘的最常用技術(shù)是分類和聚類方法。二是在不打擾用戶的情況下,得到用戶概貌文件。三是根據(jù)用戶的訪問模式來聚類用戶。

2.個性化服務系統(tǒng)。基于web挖掘的個性化服務系統(tǒng)的出現(xiàn)是對傳統(tǒng)的個性化服務系統(tǒng)的挑戰(zhàn),也是個性化服務發(fā)展的必然結(jié)果。基于web挖掘的個性化服務系統(tǒng)主要應用web挖掘中的內(nèi)容挖掘、結(jié)構(gòu)挖掘和日志挖掘,并根據(jù)挖掘所獲取的有趣的信息來為用戶提供個性化服務。

基于web挖掘的個性化服務系統(tǒng)一般由離線和在線兩部分組成,圖2給出通用的web個性化服務系統(tǒng)的服務過程。

離線部分主要用于挖掘用戶的特性信息,可以被看作個性化服務的準備部分,由兩個階段組成:第一個階段是對原始數(shù)據(jù)和相關(guān)數(shù)據(jù)進行預處理。高質(zhì)量的決策必然依賴于高質(zhì)量的數(shù)據(jù),因此數(shù)據(jù)預處理是web挖掘的重要步驟。數(shù)據(jù)預處理技術(shù)包括數(shù)據(jù)清理、會話識別、瀏覽頁識別、事務識別、路徑完善和用戶識別。第二個階段是模式提取階段,即使用數(shù)據(jù)挖掘技術(shù)對處理過的數(shù)據(jù)進行挖掘,進行模式獲取,以便以后在線部分的實時推薦。

在線部分為推薦引擎,主要是為用戶提供推薦從而實現(xiàn)個性化服務。推薦引擎的任務是計算出當前會話的推薦集,根據(jù)當前的用戶會話和挖掘結(jié)果,應用推薦機制產(chǎn)生實時的推薦集。

3.實現(xiàn)方法。

(1)離線聚類和動態(tài)鏈接結(jié)合。將用戶訪問模式進行聚類,系統(tǒng)將離線的模塊用于聚類,在線的模塊用于web頁面的動態(tài)鏈接產(chǎn)生。每個訪問站點的用戶根據(jù)其當前的訪問模式被指定到一個聚類中,在該聚類中其他用戶所選擇的頁面被動態(tài)地附加在該用戶當前所訪問的頁面下面,由此提供個性化的服務。

(2)識別感興趣的鏈接。監(jiān)測用戶對web頁面的瀏覽,為用戶識別出那些用戶可能感興趣的鏈接。利用互信息和MDL等作為相似性比較的手段,根據(jù)當前用戶的訪問和其他具有相似性興趣的用戶的訪問就可以來評估一個新頁面的興趣程度。

(3)自動定制不同的用戶訪問界面。利用用戶建模技術(shù)自動定制不同的用戶訪問界面,是個性化的一個重要方面。

(4)聚類推薦。根據(jù)服務器日志聚類用戶頁面,把和當前用戶事務最相近的聚類中的頁面推薦給用戶。

參考文獻:

[1]毛國君段麗娟:《數(shù)據(jù)挖掘原理與算法》,清華大學出版社

[2]蘇新寧楊建林:《數(shù)據(jù)殘酷和數(shù)據(jù)挖掘》,清華大學出版社

注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。

主站蜘蛛池模板: 亚洲最大在线观看| 午夜天堂视频| 欧美丝袜高跟鞋一区二区| 奇米精品一区二区三区在线观看| 毛片免费视频| 亚洲毛片在线看| 欧美一区日韩一区中文字幕页| 国产精品部在线观看| 狠狠久久综合伊人不卡| a色毛片免费视频| 国产一区二区精品高清在线观看| 国产精品19p| 日韩国产欧美精品在线| 国产精品免费露脸视频| 欧美精品在线免费| 欧美在线精品怡红院| 91小视频在线播放| 成人亚洲视频| 国产视频入口| 手机在线看片不卡中文字幕| 黄色免费在线网址| 成人无码区免费视频网站蜜臀| 国产成人综合日韩精品无码首页 | 亚洲成人高清在线观看| 在线观看热码亚洲av每日更新| 免费看一级毛片波多结衣| 国产又色又爽又黄| 中文字幕中文字字幕码一二区| 国产日韩欧美一区二区三区在线| 国产一区二区三区精品久久呦| 欧美日本视频在线观看| a级毛片免费看| 亚洲国产日韩在线成人蜜芽 | 日韩免费毛片视频| 亚洲成aⅴ人在线观看| www亚洲精品| 免费va国产在线观看| 毛片手机在线看| 成人在线观看一区| 亚洲六月丁香六月婷婷蜜芽| 这里只有精品在线播放| 国产微拍精品| 中国丰满人妻无码束缚啪啪| 久无码久无码av无码| 拍国产真实乱人偷精品| 亚洲日韩精品无码专区97| 亚洲男人天堂2020| 91精品啪在线观看国产91| 日韩 欧美 小说 综合网 另类| 亚洲精选无码久久久| 亚洲Aⅴ无码专区在线观看q| 亚洲精品爱草草视频在线| 亚洲经典在线中文字幕| 亚洲综合色婷婷| 成年网址网站在线观看| 中文字幕自拍偷拍| 爽爽影院十八禁在线观看| 亚洲愉拍一区二区精品| 91系列在线观看| 99热免费在线| 国产天天色| 18禁色诱爆乳网站| 日韩av无码DVD| 国产97公开成人免费视频| 亚洲中文精品久久久久久不卡| 亚洲成在线观看| 在线看免费无码av天堂的| 91免费国产在线观看尤物| 最新亚洲人成无码网站欣赏网| 91娇喘视频| 午夜啪啪福利| 欧美h在线观看| 亚洲综合激情另类专区| 国产性猛交XXXX免费看| 青青操国产视频| 欧美亚洲第一页| 中国一级特黄视频| 欧美成人A视频| 一级毛片免费不卡在线| 在线免费无码视频| 久久精品波多野结衣| 国产日韩AV高潮在线|