999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用關聯規則挖掘技術實現數字圖書館個性化推薦服務

2020-12-23 02:02:40李冬云
蘭臺內外 2020年23期
關鍵詞:數據挖掘

李冬云

摘 要:從數字挖掘的定義出發,分析利用關聯規則挖掘技術實現數字圖書館個性化推薦服務的必要性,介紹關聯規則的具體實現原理和求解過程?;诖耍敿毥榻B了關聯規則中的Apriori算法如何分析用戶歷史借閱記錄,挖掘出潛在的有針對性的有用信息,選擇出最適合推薦的圖書推薦給讀者,實現在數字圖書館環境下為讀者提供個性化服務。

關鍵詞:數字圖書館;數據挖掘;關聯規則;Apriori算法;個性化服務

數字圖書館作為一個電子化信息的倉儲,具有信息量大、更新速度快、信息存儲和用戶訪問不受地域限制等特點,給人們帶來了許多方便和快捷,但人們也深受其龐大且形式多樣的信息資源的困擾。由于存儲在計算機文件和數據庫中的數據量不斷增加,而用戶卻希望能夠從龐大的數據中獲得有針對性的有用信息,數據挖掘就應運而生了。近幾年,數據挖掘技術逐漸應用于數字圖書館領域,提高了數字圖書館的服務功能。本文探討了如何利用數據挖掘技術中的關聯規則Apriori算法對讀者的歷史閱讀情況進行分析,通過分析讀者的信息行為以及他們的需求特征,得出讀者的興趣偏好,從而為讀者提供個性化推薦服務。

一、關聯規則挖掘的定義

數據挖掘最早由Gregory Piatetsky-Shapir提出,它是從大量的、不完整的、有噪聲的、模糊的數據中,提取隱含在其中的,人們事先不知道的,但是又是可信的、潛在的和有價值的信息和知識的過程。數據挖掘是在統計學、人工智能和數據庫技術的基礎上發展起來的一門多學科交叉的新技術,本文主要是從數據庫的觀點來理解數據挖掘,指的是從存儲在數據庫、數據倉庫或其它信息倉庫中的大量數據中發現有用的知識的過程。數據挖掘主流的技術方法有很多,其中非常重要的方法之一就是關聯規則,它是由R.Agrawal等人于1993年首先提出,通過從大量數據中的項集之間發現有趣的關聯或相關,從而達到認識事物客觀規律的技術方法。關聯是指存在于兩個或多個變量的取值之間的某種規律性,關聯規則就是尋找在同一個事件中出現的不同項的相關性的技術方法。

二、利用關聯規則挖掘技術實現數字圖書館個性化推薦服務的必要性

隨著網絡圖書館、數字圖書館等技術在圖書館中廣泛應用,圖書館的管理理念和服務方式都發生了重大的變化。堅持“以人為本”的服務理念,更好地發揮圖書館的館藏服務職能,努力提高讀者的滿意度等,仍然是圖書館新的發展方向和工作原則。1979年,美國學者舒曼提出“圖書館和信息提供者應該提供迎合個人需求的新服務”的觀點,這就是個性化信息服務,也就是圖書館的服務方式不再是“圖書館提供什么,讀者就接受什么”,而是更注重“讀者需要什么,圖書館就提供什么”,重點考慮讀者的興趣和主動性這兩個方面。

如今,數字圖書館雖然能為讀者提供豐富的資源,但是也使讀者面臨著如何從這些海量信息資源中獲得具有針對性的有用信息的困擾。不同讀者的信息需求具有多樣化的特點,單個用戶不可能需要所有信息資源,信息也不能夠滿足所有讀者的需求,錯綜復雜的信息之間存在著某種關系。借閱的圖書與圖書之間、讀者和圖書之間也可能存在一定的關系。現有的圖書館管理系統還無法找到圖書館大量統計數據之間的關系和規律,因此無法精準預測讀者的信息需求,限制了讀者順利找到所需信息資源。這就需要我們利用數據挖掘的方法,來充分揭示這些數據背后所隱藏的關系。關聯規則挖掘通過分析讀者的歷史借閱數據,發現讀者的借閱模式,預測讀者的閱讀偏好情況,再及時主動地向讀者提供符合讀者需求的個性化推薦服務。

三、關聯規則挖掘的原理

1.關聯規則中涉及的重要概念

定義3-1? 設項的集合I={I1,I2,…,Im}(其中Ij稱為項,包含k個項的項集稱為k-項集)和事務集D={t1,t2,…,tm},其中ti={Ii1,Ii2,…,Iik}并且Iij∈I,即D中的每個事務都是I的子集。關聯規則是形如A?B的蘊含式,其中A?I,B?I是兩個項目集合,稱為項目集,并且A∩B=?(即項集A和項集B不能相交)。

定義3-2? 項集A的支持度support(A)是事務D中支持A的事物數占庫中所有事務的百分比。即support(A)=count(A)/D*100%.

定義3-3? 如果項集A的支持度support(A)不小于用戶指定的最小支持度閾值minsup,則稱A為頻繁項集,否則稱A為非頻繁項集。

定理3-1? 假設X?I,Y?I是兩個項目集合。

若X?Y,則support(X)≥support(Y);

若X?Y,如果X是非頻繁項集,則Y也是非頻繁

項集;

若X?Y,如果Y是頻繁項集,則X也是頻繁項集。

定義3-4? 關聯規則A?B的支持度是數據庫中包含A∪B的事務數占庫中所有事務的百分比,記為:support(A?B)。即:support(A?B)=count(A∪B)/D*100%.

關聯規則A?B的置信度(或強度)是包含A∪B的事務數和包含A的事務數的比值,記為:confidence(A?B)。即:confidence(A?B) =count(A∪B)/count(A)*100%.

定義3-5? 如果support(A?B)≥minsup且confidence(A?B)≥minconf,(其中minconf為用戶指定的最小置信度閾值)。則稱關聯規則A?B為強關聯規則,否則稱關聯規則A?B為弱關聯規則。

2.關聯規則挖掘求解過程

關聯規則挖掘目的是發現強關聯規則,也就是從數據庫中挖掘出滿足最小支持度minsup和最小置信度minconf的關聯規則。其中,minsup和minconf是根據數據情況和用戶需要設定。minsup表示項集在統計意義上需滿足的最低程度,minconf反映關聯規則需滿足的最低可靠度。關聯規則挖掘通過找出數據庫中的所有頻繁項集,再由頻繁項集找出關聯規則。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 久久久波多野结衣av一区二区| 亚洲午夜18| 久久超级碰| 天天视频在线91频| 曰AV在线无码| 狠狠色丁香婷婷| 亚洲无线观看| 为你提供最新久久精品久久综合| 99在线视频免费| 亚洲人成网址| www.亚洲一区| 欧美日韩国产一级| 国产福利免费观看| 日韩色图在线观看| 欧美性猛交一区二区三区| 青青草国产精品久久久久| 久久窝窝国产精品午夜看片| 亚洲午夜福利在线| 欧美伊人色综合久久天天| 人人91人人澡人人妻人人爽| 国产一级裸网站| 欧美成人a∨视频免费观看| 国精品91人妻无码一区二区三区| 91毛片网| 97狠狠操| 欧美成人午夜视频免看| 成人韩免费网站| 秘书高跟黑色丝袜国产91在线| 国产精品第一区| 美女毛片在线| 亚洲免费播放| 啪啪免费视频一区二区| 国产精品99在线观看| 亚洲欧美日韩中文字幕一区二区三区| 久久精品无码一区二区国产区| 国产福利一区视频| 亚洲高清免费在线观看| 91在线视频福利| 亚洲天堂网2014| 最近最新中文字幕在线第一页 | 欧美成人看片一区二区三区 | 天天综合色天天综合网| 国产成人精品日本亚洲77美色| 日韩精品久久久久久久电影蜜臀| 伊人精品视频免费在线| a在线亚洲男人的天堂试看| 国产精品免费露脸视频| 在线观看网站国产| 欧美日韩亚洲综合在线观看| 国产精品自拍合集| 国产激情无码一区二区三区免费| 午夜在线不卡| 九九久久99精品| 亚洲欧美激情小说另类| 试看120秒男女啪啪免费| 91九色国产在线| 九九热免费在线视频| 精品無碼一區在線觀看 | 国产精品国产主播在线观看| 免费在线观看av| 欧美日韩精品在线播放| 精品久久久久无码| 毛片视频网| 亚洲国产成熟视频在线多多| 亚洲永久免费网站| 97国产一区二区精品久久呦| 嫩草影院在线观看精品视频| 亚洲精品无码av中文字幕| aⅴ免费在线观看| 国产熟睡乱子伦视频网站| 精品久久高清| 国产一区二区三区日韩精品| 人妻21p大胆| 一级毛片基地| 在线精品视频成人网| 中文国产成人精品久久| 亚洲AV无码乱码在线观看裸奔| 最新国产网站| 日本在线免费网站| 亚洲一区二区无码视频| 免费A级毛片无码无遮挡| 中文字幕久久波多野结衣|