999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于智能Agent的數(shù)據(jù)挖掘在數(shù)字圖書(shū)館中的應(yīng)用

2014-05-05 12:31:02任長(zhǎng)貴
教育教學(xué)論壇 2014年17期
關(guān)鍵詞:數(shù)據(jù)挖掘圖書(shū)館智能

任長(zhǎng)貴

(湖南女子學(xué)院,湖南 長(zhǎng)沙 410000)

【信息技術(shù)】

基于智能Agent的數(shù)據(jù)挖掘在數(shù)字圖書(shū)館中的應(yīng)用

任長(zhǎng)貴

(湖南女子學(xué)院,湖南 長(zhǎng)沙 410000)

文章分析了數(shù)據(jù)挖掘與智能Agent的含義及特點(diǎn),提出了利用智能Agent、數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)字圖書(shū)館中的用戶資料及訪問(wèn)web時(shí)的當(dāng)前請(qǐng)求進(jìn)行預(yù)測(cè)分析,據(jù)此獲取用戶興趣愛(ài)好、訪問(wèn)習(xí)慣,預(yù)測(cè)用戶行為,挖掘用戶潛在需求,減少用戶訪問(wèn)延遲,提高用戶獲取信息的效率,為其提供主動(dòng)的個(gè)性化信息服務(wù)。

數(shù)字圖書(shū)館;數(shù)據(jù)挖掘;智能Agent;用戶需求預(yù)測(cè)

隨著Internet的應(yīng)用與普及,互聯(lián)網(wǎng)已發(fā)展成當(dāng)今世界上最大的信息庫(kù)。網(wǎng)絡(luò)資源的急劇膨脹為數(shù)字圖書(shū)館提供了巨大的信息源,它在為用戶獲取信息提供途徑的同時(shí),也增加了用戶有效信息利用的難度及速度。數(shù)字圖書(shū)館如何利用先進(jìn)信息處理技術(shù),解決資源的無(wú)序性、分散性、冗余性,從web巨大的資源中快捷、準(zhǔn)確地挖掘出用戶所需信息及潛在需求,為用戶提供主動(dòng)的個(gè)性化信息服務(wù),已成為人們關(guān)注的焦點(diǎn)。其中數(shù)字挖掘、智能Agent技術(shù)便是解決這一問(wèn)題的重要技術(shù)之一。

近年來(lái),圖書(shū)情報(bào)界在數(shù)字圖書(shū)館建設(shè)中,對(duì)數(shù)字挖掘(Data mining)及智能Agent(Intelligent agent)有關(guān)理論與技術(shù)的應(yīng)用研究已紛紛開(kāi)展起來(lái)。本文擬對(duì)基于智能Agent的數(shù)據(jù)挖掘系統(tǒng)在數(shù)字圖書(shū)館中的應(yīng)用模式進(jìn)行分析探討。

一、數(shù)據(jù)挖掘與智能Agent含義及特征

1.數(shù)據(jù)挖掘(Data mining)又可稱作數(shù)據(jù)中的知識(shí)發(fā)展(Konwledge Database),是通過(guò)分析各種數(shù)據(jù)源,從中提取出有價(jià)值的、新穎的、有用的,并被人們理解的模式的處理過(guò)程。它融合了計(jì)算機(jī)學(xué)、數(shù)據(jù)庫(kù)、人工智能、文獻(xiàn)統(tǒng)計(jì)等多個(gè)領(lǐng)域的理論和技術(shù)。數(shù)據(jù)挖掘常用的算法有:聚類法(Chattering)、分類法(Chissifieation)、遺傳算法(Generic Algorithms)及關(guān)聯(lián)規(guī)則算法(Associationword)。

2.數(shù)據(jù)挖掘特征。(1)能對(duì)大量的待處理數(shù)據(jù)進(jìn)行分析處理,如抽取、轉(zhuǎn)換、過(guò)渡,以滿足用戶需求。(2)具有高效的查詢效率,為用戶提供決策支持。(3)能對(duì)不同類型的數(shù)據(jù)進(jìn)行分析處理。網(wǎng)絡(luò)文獻(xiàn)數(shù)據(jù)格式各異,如文本、聲音、圖像等。結(jié)構(gòu)模式有結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化。(4)可發(fā)現(xiàn)數(shù)據(jù)中規(guī)則動(dòng)態(tài)信息。(5)能有效地組織和管理數(shù)據(jù)。

3.智能代理含義及特征。智能代理(Intelligent agent)常被形象地稱作能思維的軟件,是指模擬人類行為,能夠根據(jù)所感知的環(huán)境自義運(yùn)動(dòng)并提供相互的程序。在網(wǎng)絡(luò)范疇內(nèi)定義為在網(wǎng)絡(luò)環(huán)境下代理用戶或其他程序,以主動(dòng)服務(wù)方式持續(xù)完成一組操作的機(jī)動(dòng)軟件實(shí)體。它可定時(shí)和交互地執(zhí)行與目的有關(guān)的計(jì)劃,對(duì)網(wǎng)絡(luò)環(huán)境變化做出反應(yīng)。智能Agent特征主要有:高度智能化、自主學(xué)習(xí)性、協(xié)作性和代理性。

二、基于智能Agent的數(shù)據(jù)挖掘在數(shù)字圖書(shū)館的應(yīng)用

數(shù)字圖書(shū)館(Digital library)即對(duì)信息進(jìn)行搜集、轉(zhuǎn)換、描述,并以計(jì)算機(jī)可處理的數(shù)字化形式存儲(chǔ)館藏信息和網(wǎng)絡(luò)化、數(shù)字化信息,以智能化的信息檢索方式和統(tǒng)一的檢索界面,利用先進(jìn)的信息處理技術(shù)和互聯(lián)網(wǎng),提供各種語(yǔ)言兼容的多媒體遠(yuǎn)程數(shù)字信息的信息服務(wù)機(jī)構(gòu)。數(shù)字圖書(shū)館含三大要素:數(shù)字化支持技術(shù)、數(shù)字化資源和數(shù)字服務(wù)。

近些年已有多種數(shù)據(jù)挖掘系統(tǒng)應(yīng)用于數(shù)字圖書(shū)館建設(shè)中,盡管他們各有特色,但智能性均不夠理想,需進(jìn)一步完善。多智能代理的出現(xiàn)因具有高度智能性、協(xié)作性和代理性等特點(diǎn),能完成較復(fù)雜的應(yīng)用而越來(lái)越受到人們的青睞。本文提出一個(gè)基于智能Agent的數(shù)據(jù)挖掘系統(tǒng)在數(shù)字圖書(shū)館中的應(yīng)用模式。該模式主要指數(shù)字圖書(shū)館根據(jù)本信息服務(wù)站點(diǎn)用戶的歷史數(shù)據(jù)(此數(shù)據(jù)包含用戶興趣愛(ài)好、訪問(wèn)習(xí)慣)及當(dāng)前請(qǐng)示,有針對(duì)性地預(yù)測(cè)用戶行為,即在用戶瀏覽Web當(dāng)前頁(yè)面時(shí),結(jié)合瀏覽軌跡,將預(yù)測(cè)內(nèi)容放至本地高速緩存cache中(用戶需要時(shí)可直接從高速度緩存中下載),利用智能Agent及數(shù)據(jù)挖掘的原理和技術(shù),挖掘出用戶感興趣的模式及潛在需求,從而減小用戶的訪問(wèn)延遲,提高檢索效率,為用戶提供主動(dòng)的個(gè)性化信息服務(wù)。由于智能Agent本身的特點(diǎn)融合于數(shù)據(jù)挖掘過(guò)程中,使數(shù)據(jù)挖掘模式具有智能性、協(xié)作性、使數(shù)據(jù)挖掘模式具有智能性、協(xié)作性、交互性等特點(diǎn)。基于智能Agent的數(shù)據(jù)挖掘系統(tǒng)在數(shù)字圖書(shū)館中的應(yīng)用模式及其功能模塊,如圖1所示。

圖1

1.數(shù)據(jù)源:主要來(lái)自數(shù)字圖書(shū)館高速緩存Cache中用戶的歷史數(shù)據(jù)。

2.數(shù)據(jù)預(yù)處理Agent:主要功能是分析數(shù)字圖書(shū)館中的用戶歷史數(shù)據(jù),在用戶瀏覽Web當(dāng)前頁(yè)面時(shí),將預(yù)測(cè)內(nèi)容放至本地高速緩存cache中,進(jìn)行預(yù)測(cè)分析,抽取出用戶感興趣的模式及潛在需求(從而減小用戶的訪問(wèn)延遲,提高檢索效率),數(shù)據(jù)預(yù)處理可完成任務(wù)確定、模型設(shè)計(jì)、數(shù)據(jù)分析、數(shù)據(jù)抽取、數(shù)據(jù)處理和數(shù)據(jù)交換。數(shù)據(jù)抽取和數(shù)據(jù)處理一般包括消除無(wú)用數(shù)據(jù)及重復(fù)記錄等操作,推導(dǎo)缺值數(shù)據(jù),完在詞干抽取、詞條切分等處理和數(shù)據(jù)交換。數(shù)據(jù)交換過(guò)程一般包括特征選擇過(guò)程和與具體實(shí)現(xiàn)有關(guān)的數(shù)據(jù)格式變換過(guò)程。(1)數(shù)據(jù)挖掘Agent:主要功能是完成對(duì)數(shù)據(jù)預(yù)處理模式的識(shí)別,即發(fā)現(xiàn)新的模式或規(guī)則,并將結(jié)果傳遞給人機(jī)界面Agent。挖掘的主要任務(wù)是分類、聚類和關(guān)聯(lián)規(guī)則發(fā)現(xiàn)等。(2)人機(jī)界面Agent:提供分析人員與用戶交互的友好界面,當(dāng)數(shù)據(jù)挖掘Agent發(fā)現(xiàn)用戶適用資源時(shí),人機(jī)界面Agent會(huì)即時(shí)將結(jié)果以可視化或自然語(yǔ)言的方式表現(xiàn)出來(lái),以便于用戶了解和觀察。(3)模式評(píng)估Agent:主要是實(shí)現(xiàn)對(duì)挖掘Agent得出的模式進(jìn)行評(píng)估和解釋。模式評(píng)估Agent實(shí)時(shí)監(jiān)測(cè)用戶的行為,對(duì)用戶的行為提供在線預(yù)測(cè),利用用戶行為預(yù)測(cè)法進(jìn)行分析。挖掘Agent所得模式,并非為用戶最終所需資源,模式有可能是冗余的,也可能是錯(cuò)誤的,數(shù)據(jù)挖掘是一個(gè)反復(fù)的過(guò)程。用戶可對(duì)模式進(jìn)行評(píng)判,如果不滿意,便通過(guò)人機(jī)界面Agent反饋于挖掘Agent,進(jìn)而調(diào)整挖掘內(nèi)核操作,對(duì)模式進(jìn)行優(yōu)化,直至滿足用戶的需求目標(biāo)。(4)挖掘模型知識(shí)庫(kù):它是數(shù)據(jù)挖掘的一個(gè)規(guī)則集合,能根據(jù)不同的挖掘要求選擇最有效的挖掘算法或幾處算法的序利組合。興趣關(guān)聯(lián)知識(shí)庫(kù)中的興趣關(guān)聯(lián)規(guī)則算法指出了從某一詞條(興趣)轉(zhuǎn)向其他詞條(興趣)的可能性,利用興趣關(guān)聯(lián)規(guī)則可對(duì)數(shù)字圖書(shū)館中的用戶行為預(yù)測(cè),預(yù)測(cè)用戶感興趣的頁(yè)面,設(shè)計(jì)智能型的用戶服務(wù)界面,由被動(dòng)服務(wù)變主動(dòng)服務(wù)。挖掘模型知識(shí)庫(kù)可不斷融入新的規(guī)則,以增加系統(tǒng)的智能性。

基于智能Agent的數(shù)據(jù)挖掘在數(shù)字圖書(shū)館中的應(yīng)用,可實(shí)現(xiàn)信息的搜集、預(yù)處理、挖掘、查詢?cè)u(píng)估、自動(dòng)提取等功能,可提供用戶瀏覽模式和潛在興趣等模式,使數(shù)字圖書(shū)館成為一個(gè)智能型、主動(dòng)性的信息提供庫(kù)。

三、結(jié)語(yǔ)

利用智能Agent與數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)字圖書(shū)館中的用戶歷史資料及訪問(wèn)Web時(shí)的當(dāng)前請(qǐng)求進(jìn)行預(yù)測(cè)、分析,以獲取用戶興趣關(guān)聯(lián)規(guī)則,預(yù)測(cè)用戶行為,挖掘用戶潛在需求,有助于提高用戶提供主動(dòng)的個(gè)性化信息服務(wù),有助于提升數(shù)字圖書(shū)館建設(shè)中對(duì)用戶行為的預(yù)測(cè)、分析與研究工具有廣泛的應(yīng)用前景。

[1]柳勝國(guó).我國(guó)互聯(lián)網(wǎng)信息挖掘研究現(xiàn)狀[J].圖書(shū)館學(xué)、信息科學(xué)、資料工作,2002,(7).

[2]韓立新,等.基于Agent的面向Internet的信息檢索系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J].情報(bào)學(xué)刊,2002,(3).

[3]張曉林,等.基于Web的個(gè)性化服務(wù)機(jī)制[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2001,(1).

[4]李曼,等.基于Agent的個(gè)性化主動(dòng)信息服務(wù)研究綜述[J].圖書(shū)情報(bào)工作,2002,(8).

[5]劉燕平,等.基于Agent的網(wǎng)絡(luò)信息智能檢索研究[J].圖書(shū)情報(bào)知識(shí),2003,(3)

[6]敖廣武.數(shù)據(jù)挖掘理論和開(kāi)發(fā)[J].信息技術(shù),2003,(6).

[7]吉根林,等.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].南京師范大學(xué)學(xué)報(bào),2002,23(2).

[8]鄒濤,等.www上的信息挖掘技術(shù)及實(shí)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,1999,(8).

[9]http://www.d-library.com.cn/index.isp

[10]http://www.csls.org.cn

[11]http://www.las.ac.cn/index.jsp

[12]http://www.c79.cnki.net.oldcnki/index4.htm

[13]http://www.Lib.ruc.edu.cn

G642.0

A

1674-9324(2014)17-0233-02

猜你喜歡
數(shù)據(jù)挖掘圖書(shū)館智能
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
圖書(shū)館
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
飛躍圖書(shū)館
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
圖書(shū)館里的是是非非
主站蜘蛛池模板: 久久大香伊蕉在人线观看热2| 91娇喘视频| 色综合色国产热无码一| 无码AV高清毛片中国一级毛片| 国产福利拍拍拍| 国产黄网永久免费| 亚洲水蜜桃久久综合网站| 麻豆精品在线播放| 日韩a级片视频| 中文字幕无线码一区| 国产成人精彩在线视频50| 91精品啪在线观看国产91| 成人精品视频一区二区在线| 亚洲欧洲日产国产无码AV| 久久久受www免费人成| 欧洲亚洲一区| 色婷婷狠狠干| 国产h视频免费观看| 日韩色图区| 五月激情婷婷综合| 欧美成人免费一区在线播放| 国产欧美日韩综合在线第一| 91精品网站| 国产电话自拍伊人| 亚洲无码不卡网| 九色视频在线免费观看| 国内精品免费| 亚洲男人的天堂久久香蕉网 | 欧美日韩精品一区二区视频| 99精品国产电影| 青青热久免费精品视频6| 国产精品手机在线观看你懂的 | 亚洲一级无毛片无码在线免费视频| 中文字幕不卡免费高清视频| 777国产精品永久免费观看| 四虎成人在线视频| 91精品综合| 久久无码av三级| 日本亚洲欧美在线| 免费日韩在线视频| 99热亚洲精品6码| 国产情侣一区| 亚洲第一极品精品无码| 制服丝袜 91视频| 国内精品久久久久鸭| 亚洲天堂啪啪| 欧美成人一级| 五月天综合婷婷| 国产91透明丝袜美腿在线| 国产性生交xxxxx免费| 精品少妇三级亚洲| 国产午夜福利在线小视频| 91欧美在线| 亚洲啪啪网| 国产在线精彩视频论坛| 香蕉精品在线| 四虎国产在线观看| 日本在线国产| 久久天天躁狠狠躁夜夜躁| 欧美日韩国产系列在线观看| 欧美一级黄片一区2区| 欧美成人午夜视频免看| 天堂亚洲网| 就去色综合| 国产精品中文免费福利| 国产原创第一页在线观看| 美女毛片在线| 国内a级毛片| 欧美日本在线观看| 欧美国产日韩在线播放| 亚洲欧美一区二区三区图片| 亚洲欧洲日韩国产综合在线二区| 国产午夜福利亚洲第一| 亚洲成a人片| 日韩中文字幕亚洲无线码| 亚洲性日韩精品一区二区| 亚洲成人动漫在线观看 | 亚洲床戏一区| 国产日产欧美精品| 精品久久久久久中文字幕女| 午夜一级做a爰片久久毛片| 91成人精品视频|