999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Web挖掘及其在電子商務中的應用

2008-04-29 00:00:00門國尊李雅軒
商場現代化 2008年35期

[摘 要] 電子商務網站向用戶提供及時有效的信息,是提高網站聲譽和效益的基礎。Web挖掘可以通過分析用戶的使用偏好,幫助用戶高效地檢索到所關心的信息。本文深入討論了Web結構挖掘、Web內容挖掘和Web使用挖掘等技術,并提出了商務網站基于Web挖掘技術為用戶提供個性化推薦的一種框架。

[關鍵詞] 電子商務 WEB挖掘 個性化服務

一、引言

電子商務站點的成功很大程度上取決于保持已有用戶和將隨意瀏覽者轉化為現實購買者的能力。因此,怎樣在電子商務環境中吸引新用戶,并確保自己可以提供足夠的產品或服務留住老用戶,成為許多電子商務站點所要關注的主要問題。另一方面,用戶面對電子商務站點所提供的眾多選擇,要從中挑選出自己真正需要的產品或服務猶如大海撈針。

人們為了實現從海量Web數據中,查找自己想要的數據和有用信息,提出了Web挖掘(Web Mining)。Web挖掘可以幫助人們從Web文檔和Web活動中發現和抽取潛在的、有意義的模式和知識。它將傳統的數據挖掘技術與Web結合起來,并綜合運用了統計學、計算機網絡、數據庫與數據倉庫、可視化等眾多領域的技術,形成了Web結構挖掘、Web內容挖掘和Web使用挖掘的研究與應用體系。

二、 Web結構挖掘

由于Web頁面具有比純文本更為豐富的結構,不僅具有文本信息,而且具有表示頁面之間關系的鏈接,所以Web結構挖掘主要是利用Web文檔之間的超鏈結構進行分析。大量的Web超鏈接信息提供了關于Web頁面內容相關性、質量和結構方面的信息,反映了文檔之間的包含、引用或者從屬關系。引用文檔對被引用文檔的說明往往更客觀、更概括、更準確。它有助于推斷出頁面的權威性。所謂權威頁面是在一個主題內被高度引用或參考的頁面,與其相關的另一個概念是樞紐頁面,即:那些指向許多權威頁面的頁面。權威頁面和樞紐頁面展示了強烈的互增強關系;一個好的樞紐頁面指向了許多好的權威頁面;一個好的權威頁面被許多好的樞紐頁面所指。在信息檢索中往往將高權威分和樞紐分的頁面視為高質量的頁面,可以考慮優先提供給用戶。

三、Web內容挖掘

Web內容挖掘主要有兩種策略:1.直接挖掘Web文檔的內容;2.在工具搜索的基礎上進行改進。采用第一種策略的有針對Web查詢語言利用啟發式規則的Ahoy等。采用第二種策略的方法主要是對搜索引擎的查詢結果進行進一步的處理,得到更為精確和有用的信息。共分為四個階段:

首先,對文本挖掘對象建立特征表示。為Web文本內容建立特征表示是Web文本挖掘中的基本問題,常用的特征表示方法有:向量空間模型、布爾模型、聚類模型、概率模型和基于知識模型等。

其次,提取文檔特征并縮減。在目前所采用的文檔表示方法中,共同存在的瓶頸就是文檔特征向量維數過高。常用的特征提取與縮減方法有:信息增益、互信息、文本證據權、特征頻度、文本頻度,以及特征熵等。

再次,在完成文檔特征向量維數的縮減后,利用數據挖掘的方法(如分類、聚類、關聯規則等)提取面向特定應用的知識模式。

最后,對挖掘結果進行評價,若評價結果滿足一定的要求則輸出,否則返回到之前的某個環節,分析改進后再進行新一輪的挖掘工作。

四、 Web使用挖掘

Web使用挖掘的結果通常是用戶群體的共同行為和共性興趣,以及個人用戶的檢索偏好、習慣和模式等,已經成為當前電子商務個性化推薦的主流方法。Web使用挖掘主要通過分析用戶訪問Web的記錄了解用戶的興趣和習慣,對用戶行為進行預測,以便提供個性化的產品信息和服務。Web使用挖掘的方法可以分為兩類:

1.基于Web事務的方法

基于Web事務的Web使用挖掘技術通常應用于Web服務器日志文件,引入最大向前引用算法MF,將用戶會話分割成一系列的事務,然后采用與關聯規則相類似的方法挖掘頻繁訪問序列,從而取得用戶訪問模式。Web使用數據的采集和預處理是Web使用挖掘過程中非常關鍵的步驟。

2.基于數據立方體的方法

基于數據立方體的技術是根據Web服務器日志文件,建立數據立方體,然后對數據立方體進行數據挖掘和聯機分析處理。這種方法從多角度、全面地進行挖掘和分析,有利于Web挖掘與數據挖掘技術的迅速融合與發展。

五、語義Web挖掘

語義Web模型的一個重要思想就是以本體來表示語義信息,通過在語義Web中引入本體層來實現語義信息的共享,從而提高網絡信息服務的智能化與自動化。語義Web挖掘的主要分為兩個層次:其一,探索能夠直接處理Web本體的Web挖掘算法;其二,在Web挖掘其他環節利用本體方法,以提高Web挖掘的效能。

要解決現有數據挖掘技術在語義Web環境下應用,關鍵的問題是要求數據挖掘算法具有幾種能力:第一是使用的算法應該具有處理比命題邏輯更有表達力的一階邏輯的能力;第二是在算法中具有利用背景知識數據進行數據挖掘。

六、結論

電子商務個性化推薦可以根據用戶的偏好、歷史訪問數據,以及相似用戶的相關信息,幫助用戶完成網上瀏覽、購買等過程,為用戶提供個性化服務。WEB挖掘技術可以從不同的角度和層次對網站信息和用戶的使用偏好進行分析,正在成為提高電子商務網站聲譽和效益的有效途徑之一。

參考文獻:

[1]石 琳 王刊良:網上購物與網上學習中的個人化推薦系統的比較.清華大學學報(自然科學版),2006,46(S1)

[2]陳文偉 黃金才:數據倉庫與數據挖掘.北京:人民郵電出版社,2004

主站蜘蛛池模板: 99视频在线观看免费| 影音先锋亚洲无码| 亚洲欧美日韩色图| 国产精品香蕉| 美女一级毛片无遮挡内谢| 国产国产人免费视频成18| 激情五月婷婷综合网| 色婷婷成人| 99热这里只有精品久久免费| 丝袜久久剧情精品国产| 亚洲精品福利网站| 久久鸭综合久久国产| 亚洲第一黄色网址| 久久亚洲精少妇毛片午夜无码| 国产福利在线免费观看| 国产一二视频| av在线手机播放| 高清不卡一区二区三区香蕉| 91精品啪在线观看国产| 国产中文一区二区苍井空| 亚洲精品桃花岛av在线| 久热re国产手机在线观看| 精品久久综合1区2区3区激情| 日韩小视频网站hq| 国产又粗又猛又爽| 国产免费a级片| 国产三级a| 毛片久久久| 国内精品久久久久鸭| 毛片a级毛片免费观看免下载| 欧美成人精品一区二区| 六月婷婷激情综合| 欧美区国产区| 国禁国产you女视频网站| 欧美成人怡春院在线激情| 伊人色综合久久天天| 91在线激情在线观看| 91精品专区国产盗摄| 毛片免费高清免费| 久久精品午夜视频| 色久综合在线| 操美女免费网站| 久久综合激情网| 依依成人精品无v国产| 国产亚洲精久久久久久久91| 久久久精品无码一二三区| 一本一本大道香蕉久在线播放| 久久免费成人| 欧美中文一区| 免费一级α片在线观看| 超清无码一区二区三区| 动漫精品啪啪一区二区三区| 久久精品国产亚洲麻豆| 欧美精品亚洲精品日韩专区va| 伊人天堂网| 亚洲人成色在线观看| 成人国产一区二区三区| 91在线视频福利| 国产原创演绎剧情有字幕的| 国内精品视频在线| 日韩AV手机在线观看蜜芽| 成人午夜天| 伊人色婷婷| 中文成人在线| 国产一级片网址| 91成人免费观看| 国内毛片视频| 久久99国产精品成人欧美| 日a本亚洲中文在线观看| 在线观看av永久| 亚洲无线国产观看| 欧美精品二区| 婷婷99视频精品全部在线观看| 538国产视频| 日韩高清中文字幕| 国产一二三区视频| 国产va在线| 国产免费久久精品99re丫丫一| 国产精女同一区二区三区久| v天堂中文在线| 国产经典免费播放视频| 亚洲第一香蕉视频|