摘 要:隨著Internet/Web技術的快速普及和迅猛發展,使各種信息可以以非常低的成本在網絡上獲得,如何在這個全球最大的數據集合中發現有用信息成為數據挖掘研究的熱點。Web數據挖掘是目前數據挖掘領域中的一個很重要的研究領域,文章介紹了Web數據挖掘研究領域的現狀及發展。
關鍵詞:數據挖掘;Web挖掘
中圖分類號:TP311.13文獻標識碼:A文章編號:1000-8136(2009)17-0131-02
數據挖掘(Data Mining,DM)是指從大量數據中提取或“挖掘”知識,即從存放在數據庫、數據倉庫或其他信息庫中的大量數據中挖掘知識的過程。隨著以數據庫、數據倉庫等數據倉儲技術為基礎的信息系統在各行各業的應用,海量數據不斷產生,隨之而來的問題,便是如此多的數據讓人難以消化,無法從表面上看出他們所蘊涵的有用信息。如何從大量的數據中找到真正有用的信息成為人們關注的焦點,數據挖掘技術也正是伴隨著這種需求從研究走向應用。各種類似Google、百度等的搜索引擎也層出不窮,Web數據挖掘的應用在現實中不斷體現。
1 Web挖掘概述
近年來,隨著Internet/Web技術的快速普及和迅猛發展,使各種信息能以非常低的成本在網絡上獲得,而從中取得的數據量便難以計算,而且Internet/WWW的發展趨勢繼續看好,特別是電子商務的蓬勃發展為網絡應用提供了強大支持,因此,如何在WWW這個全球最大的數據集合中發現有用信息,無疑將成為數據挖掘研究的熱點。而Web挖掘便是指使用數據挖掘技術在WWW數據中發現潛在的、有用的模式或信息。……