999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘在網絡信息檢索中的應用

2013-04-29 00:44:03張欣郭廣楠張瑜
電腦迷 2013年5期
關鍵詞:信息檢索數據挖掘用戶

張欣 郭廣楠 張瑜

摘 要 本文闡述了數據挖掘的基本理論,及其在網絡信息檢索中的應用,分析了數據挖掘對網絡信息資源、網絡信息檢索結果、用戶檢索需求等方面性能的提升,并對網絡信息檢索未來發展進行了展望。

關鍵詞 數據挖掘 網絡信息檢索 數據挖掘

中圖分類號:TP311.138 文獻標識碼:A

目前,網絡信息資源數據形式豐富多樣,數量巨大,并呈幾何級數的速度增長,基本滿足了人們的信息檢索的量的需求,然而如何快速、高效地找到自己所需要的信息,網絡信息檢索在查全率和查準率上還相對欠缺。網絡搜索引擎通常會返回給用戶成千上萬檢索到的網頁,其中大部分與用戶的檢索要求無關,另外就網絡上的知識發現而言,即使檢索精度再高,搜索引擎也不能夠勝任。因此,人們需要比信息檢索更精確高效的、能包含網絡數據庫在內的新的數據挖掘技術,數據挖掘正是在這樣的應用需求下產生并迅速發展起來的。但是,數據庫領域采用的數據挖掘技術所涉及的多是結構化數據,為了處理網絡上的異質、非結構化或半結構化數據,網絡數據挖掘成為數據挖掘研究的一個重要分支。

1 網絡信息檢索

網絡信息檢索一般指因特網檢索,是通過網絡接口軟件,用戶可以在一處終端查詢各地上網的信息資源。網絡信息檢索主要依靠計算機科學技術、網絡技術和數據的確切特征來創建相應的索引結構、數據庫等,能很好地處理已經發生或存在的靜態信息。網絡信息檢索工具包括傳統的服務工具:遠程登錄、文件傳輸服務、電子郵件、電子公告牌、廣域消息服務、Gopher、WWW、基于Z39.50的信息檢索服務、代理服務器和NAT,以及搜索引擎和中外著名網絡數據庫檢索。這些工具都能有效地組織和檢索海量數據,但對數據未來的變化趨勢等動態信息缺乏有效的統計和預測。

2 數據挖掘及Web數據挖掘

數據挖掘(Data Mining),即從大量模糊的數據中發現隱含的規律性內容,解決數據的應用質量問題的技術,是一種還處于發展中,已經部分投入實際生產實踐的技術框架。

Web數據挖掘是從數據挖掘技術發展而來,簡單地說是將數據挖掘技術應用到Web上,也稱為Web挖掘。其技術性的定義是:Web數據挖掘,是一項涉及Web、數據挖掘、信息學、計算機語言學等多個領域的綜合技術。Web數據挖掘的目的是為了揭示網絡信息中隱含的知識,它是比信息檢索層次更高、更精確的一種技術。它能夠根據用戶個性化定義的要求,根據目標的特征信息在網絡上或者數據庫中進行有目的的信息檢索。Web數據挖掘中幾種常用的技術是:關聯規則技術、分類技術、聚類技術、路徑分析技術和序列模式技術。

3 數據挖掘在網絡信息檢索中的應用

目前,作為網絡信息檢索最重要最常用的工具:搜索引擎,只能處理用戶給出的特定關鍵詞形式表示的簡單目標,而無法處理用戶給出的樣本形式的復雜模糊目標,對網絡數據未來的變化趨勢等動態信息也缺乏有效的統計和預測。而將數據挖掘技術運用的網絡信息檢索中,可以使網絡信息檢索過程及結果更加快速、精確、個性化。

(1)數據挖掘提高網絡信息內容自動摘要的準確率。網絡信息資源一般都有關鍵詞和內容摘要供用戶檢索選擇之用,但大部分的自動摘要都是簡單的抽取網頁文檔的前幾句內容,而僅僅是通過位置來確定的,這種方式很不準確,不能精確的反映網頁的全部內容,所以保證自動摘要的正確性非常重要。數據挖掘中的文本抽取就是從文檔中抽出關鍵信息,對文檔本身的內容而不是位置來進行文本內容的總結,以自然語言理解為基礎,更可揭示網絡信息的主題特征知識及其之間的相互關聯知識,對文檔進行語義甚至語用的標注,因此它更能反映出Web文檔中的真正信息,然后以簡單的形式進行摘要或表示,可以提煉出文檔最重要的信息生成關鍵字或摘要,使自動摘要的質量和準確性很大的提高。

(2)數據挖掘拓寬網絡信息資源量。網絡信息資源數量眾多,分布范圍很廣,大部分可以直接用網絡信息檢索工具查詢到的信息都是網頁中的文字、表格、圖形、圖像、聲音、視頻或好友網頁的鏈接及目錄結構等。但是還有一些潛在網絡信息不容易被搜索引擎等工具查詢到,如用ASP,JSP或PHP生成的動態網頁;一些專業數據庫系統中的數據;在Robot Exclusion框架協議下被拒絕搜索訪問的網站;由用戶的提問而動態生成的結果;存在于商業數據庫管理系統中的數據等,它們無法被索引,從而無法提供有效的檢索方式,這些結構化的或用html標記的半結構化數據都可以用數據挖掘中的內容挖掘進行處理,網絡頁面內容挖掘常采用的技術是文本挖掘和多媒體挖掘,可為這些網絡信息提供明確的摘要或索引,使得本來不容易搜索到,潛在隱藏的信息能被明確的搜索到,從而大大拓寬了網絡信息的資源量。

4 網絡信息檢索的未來展望

數據挖掘能發現網絡中隱含的有價值的信息和知識,從而提高標引、自動摘要、自動分類和自動聚類等的準確率;能促進用戶興趣模型的構建,從而為用戶提供更好的個性化信息服務。此外,它獨特的分析方法能發現網絡數據知識之間的各種關系,使網站建設和檢索結果的分布更加合理。隨著本體、網絡、自然語言處理、信息可視化和人工智能等技術的發展,將數據挖掘與這些技術進行結合,未來的網絡信息檢索將朝這更加精準、個性和智能化方向發展。

參考文獻

[1] 陳維.網絡環境下的信息檢索與數據挖掘技術[J].現代情報,2009(5).

[2] 李村合.網絡信息挖掘技術及其應用研究[J].情報科學,2008.

猜你喜歡
信息檢索數據挖掘用戶
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于神經網絡的個性化信息檢索模型研究
一種基于Hadoop的大數據挖掘云服務及應用
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
教學型大學《信息檢索》公選課的設計與實施
河南科技(2014年11期)2014-02-27 14:10:19
主站蜘蛛池模板: 在线看国产精品| 蜜臀AV在线播放| 成人福利免费在线观看| 激情综合网激情综合| 性色生活片在线观看| 欧美日韩专区| 直接黄91麻豆网站| 日韩欧美在线观看| 亚洲成a∧人片在线观看无码| 久久99这里精品8国产| 亚洲欧美精品一中文字幕| 亚洲人精品亚洲人成在线| 亚洲女人在线| 久久美女精品| 国产人人乐人人爱| 成人免费视频一区| 久久香蕉国产线看观看精品蕉| 狠狠色综合网| 视频一区视频二区日韩专区| 91精品国产综合久久香蕉922| 凹凸精品免费精品视频| 在线观看国产网址你懂的| 夜夜高潮夜夜爽国产伦精品| 亚洲欧美在线综合图区| 欧美色综合网站| 国产在线精品美女观看| 欧美色香蕉| 91九色视频网| 欧美一级黄色影院| 久久久久久久蜜桃| 六月婷婷综合| 久久男人资源站| 国产无遮挡裸体免费视频| 国产亚洲欧美在线人成aaaa| 久久综合一个色综合网| 国产一区二区三区免费| 亚洲不卡无码av中文字幕| 在线免费亚洲无码视频| 欧美午夜网| 亚洲av片在线免费观看| av在线无码浏览| 午夜毛片免费观看视频 | 黄色免费在线网址| 扒开粉嫩的小缝隙喷白浆视频| 国产一区二区三区在线观看视频| 欧美成人免费午夜全| 亚洲精品视频网| 人妻无码AⅤ中文字| 亚洲中文字幕久久精品无码一区 | 國產尤物AV尤物在線觀看| 亚洲日产2021三区在线| 亚洲不卡网| 动漫精品啪啪一区二区三区| 国产日韩欧美一区二区三区在线| 国产91小视频在线观看| 国产视频一区二区在线观看| 蜜芽一区二区国产精品| 999精品色在线观看| 中文天堂在线视频| 一级高清毛片免费a级高清毛片| 久久semm亚洲国产| 国产午夜精品一区二区三| 激情综合网址| 国产精品第三页在线看| 亚洲国模精品一区| 毛片在线播放a| 新SSS无码手机在线观看| www.91在线播放| 国产精品一区二区不卡的视频| 国产福利拍拍拍| 青青青国产视频| 国产性生交xxxxx免费| 欧美日韩国产在线观看一区二区三区| 性色生活片在线观看| 免费一级毛片在线播放傲雪网| 国产美女免费网站| 亚洲成人免费在线| 亚洲福利片无码最新在线播放 | 人妻精品全国免费视频| 亚洲欧洲免费视频| 91在线中文| 国产91色在线|