999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在Web信息檢索中的應用研究

2017-12-31 00:00:00屈慧潔
現代職業教育·中職中專 2017年10期

[摘 要] 將數據挖掘技術應用到Web信息檢索中,可以使網絡信息檢索更加準確化和智能化。介紹了Web數據挖掘的概念,分析了Web數據挖掘在Web信息檢索中的應用,最后對Web信息檢索未來發展進行了展望。

[關 鍵 詞] 數據挖掘;Web信息檢索;搜索引擎

[中圖分類號] P209 [文獻標志碼] A [文章編號] 2096-0603(2017)29-0033-01

Web現已成為一個巨大的知識庫、信息庫,Web信息檢索通過搜索引擎返回給用戶成千上萬個檢索到的網頁,但是滿足用戶檢索要求的網頁卻鳳毛麟角,用戶無法在第一時間得到滿足要求的有價值信息。因此,Web信息檢索的精度不能為客戶提供準而精的檢索信息,需要檢索精度更高的數據挖掘技術。

所謂數據挖掘(Data Mining)就是從海量的原始數據中提取信息和知識的過程,這些信息和知識隱含在原始數據中,事先未知,但是對用戶來說是很有用的。

一般的數據挖掘對象是結構化數據,而Web數據挖掘的對象是非結構化數據,在現有數據挖掘研究成果的基礎上,運用Web數據挖掘技術,可以提高信息檢索的精準率和有效率,Web信息檢索將會達到向一個新的高度。

一、Web數據挖掘技術概述

Web數據挖掘是一項綜合技術,是從WWW資源上抽取信息(或知識)的過程,是對Web資源中蘊涵的未知的有潛在應用價值的模式的提取[1]。按挖掘對象來分類,基于Web的數據挖掘分為3大類:基于Web內容的挖掘(Web Content Mining)、基于WEB結構的挖掘(Web Structure Mining)、基于WEB使用的挖掘(Web Usage Mining)。

(一)基于Web內容的挖掘

基于Web內容的挖掘,是在Web文檔以及相應的Web文檔描述中獲取知識。目前,WWW信息資源是網絡信息資源的主要組成部分,用戶直接從網上抓取這些資源,并為之建立索引,從而實現查詢服務,而那些被隱藏起來的數據,用戶無法進行有效的檢索,這就迫使我們把這些被隱藏的內容(比如數據庫系統中的數據,由用戶的提問而動態生成的結果等)挖掘出來。此外,Web的信息內容是由文本、音頻、視頻、圖片等非結構化的數據,因此基于Web內容的挖掘也是一種針對多媒體數據的挖掘[2]。

(二)基于Web結構的挖掘

基于Web結構的挖掘,主要挖掘Web潛在的鏈接結構模式,是從網頁上的相互鏈接和萬維網的整體結構中發現知識的過程。這種模式主要采用網頁歸類技術,在眾多的網頁中獲得不同網頁間的信息,比如相似度及關聯度。Web結構挖掘主要是幫助用戶找到所需要信息的權威站點,同時也會對Web信息檢索結果的排序產生影響。

(三)基于Web使用的挖掘

基于Web使用的挖掘,也可以稱之為Web Log Mining,Web日志挖掘,用戶在進行網絡訪問后,會留下一些重要的第二手數據,它們是Web使用挖掘的主要對象,從而分析用戶的網絡行為提供依據。

二、Web數據挖掘在Web信息檢索中的應用

(一)對Web信息源進行挖掘,形成信息源知識庫

對Web信息源內容的挖掘,主要是針對中多媒體數據等Web信息源的內容的特征進行挖掘,統計方法、機器學習、神經網絡、人工智能是最常使用的方法,通過抽取、分類、聚類網頁內容的特征,形成信息源知識庫。

對Web信息源結構的挖掘,主要通過相關算法對Web頁面的超鏈接關系、URL地址結構的進行挖掘,在Web的組織結構和鏈接關系中發現知識。

(二)對Web結構進行挖掘,形成權威網頁

搜索引擎的作用主要有兩個,一是搜索與主題相關的內容,二是篩選高水平的相關網頁,就是我們所說的權威網頁。第二個作用尤其重要,因為用戶更希望他們最需要的信息能在最短的時間內呈現在他們面前,而不是浪費大量的精力和時間從大量的檢索結果中找尋最需要的信息,采用Web結構挖掘的一些經典算法就能很好地識別出權威網頁。

(三)對用戶的訪問模式進行分析,為用戶提供更加人性化的服務

用戶在進行信息檢索時,會在網站上留下許多信息,比如檢索的時間、檢索詞以及瀏覽了哪些檢索結果等。基于Web使用的挖掘可以對其進行分析,采用各種算法對這些日志展開挖掘,從而延伸出更有價值的內容,形成用戶知識模型,并對用戶潛在相同的檢索行為模式進行歸納總結,對這些模式進行系統的研究,對搜索引擎的檢索效果進行反饋,從而改進搜索引擎,讓檢索結果更加智能化,使單個用戶感覺使用Web信息檢索更高效。

總之,隨著互聯網的發展,數據挖掘的一個主要應用領域就是Web數據挖掘,與Web信息檢索有著密切的關系,但是又比Web信息檢索有著更高的技術層次,可以使基于Web的信息檢索發展到一個更高的水平。

參考文獻:

[1]韓家煒,孟小峰,王靜,等.WEB挖掘研究[J].計算機研究與發展,2001,38(4):405-414.

[2]涂承勝,魯明羽,陸玉昌.Web內容挖掘技術研究[J].計算機應用研究,2003,20(11):5-9.

主站蜘蛛池模板: 精品91视频| 99久久精品美女高潮喷水| 美女被操黄色视频网站| 亚洲福利网址| 老司机午夜精品网站在线观看| 国产精品白浆在线播放| 成人小视频网| 黄色网页在线播放| 999精品免费视频| 一区二区三区在线不卡免费| 国产最爽的乱婬视频国语对白| 国产一级毛片高清完整视频版| 国产精品久久久久久久久久98| 中文字幕免费视频| 伊人色婷婷| 毛片久久久| 精品视频在线一区| 国产91久久久久久| 五月婷婷精品| 香蕉99国内自产自拍视频| a毛片在线播放| 亚洲国产日韩欧美在线| 国产精品yjizz视频网一二区| 一本一道波多野结衣av黑人在线| 婷婷99视频精品全部在线观看| 天天做天天爱天天爽综合区| 欧美一级片在线| 亚洲色图在线观看| 国产区成人精品视频| 看国产一级毛片| 欧美视频在线第一页| 国产在线观看成人91| 综合色区亚洲熟妇在线| 日本人妻一区二区三区不卡影院 | 黄网站欧美内射| 国产亚洲精品在天天在线麻豆| 毛片在线播放网址| 国产xx在线观看| 凹凸精品免费精品视频| 国产成人综合网| 无码一区二区波多野结衣播放搜索| 欧美日韩中文国产va另类| 亚洲国产AV无码综合原创| 国产h视频在线观看视频| 国产大片喷水在线在线视频 | 亚洲高清免费在线观看| 91在线精品麻豆欧美在线| 国产成人精品在线1区| 99精品国产电影| 欧美啪啪一区| 国产乱子伦一区二区=| 中国国产高清免费AV片| 一级毛片免费不卡在线| 亚洲成a人在线播放www| 国产成人永久免费视频| 久久精品人妻中文系列| 国产精品欧美激情| 伊人久久精品亚洲午夜| 狠狠色婷婷丁香综合久久韩国| 亚洲毛片一级带毛片基地| 亚洲视频四区| 国产精品成人免费视频99| 日本精品中文字幕在线不卡| 国产福利小视频高清在线观看| 国产网站黄| 国产极品美女在线播放| 亚洲三级网站| 波多野结衣久久精品| 日韩精品一区二区三区大桥未久| 午夜视频在线观看免费网站| 55夜色66夜色国产精品视频| 手机在线免费不卡一区二| 亚洲一区二区三区香蕉| 国产精品太粉嫩高中在线观看| 色婷婷综合激情视频免费看| 免费一级α片在线观看| 国产超碰一区二区三区| 国产人妖视频一区在线观看| 露脸一二三区国语对白| 欧美性天天| 欧美色视频日本| 欧美精品成人一区二区视频一|