999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談如何做好建設工程檔案編研工作

2016-05-30 09:58:40李娜
卷宗 2016年4期
關鍵詞:數據挖掘

李娜

摘 要:介紹了關聯規則,應用Apriori算法對圖書館讀者借閱記錄進行分析,發掘存在其中的關聯規則,在圖書館提供的個性化服務中具有很大的價值。

關鍵詞:數據挖掘;關聯分析;Apriori算法

緊跟著教育體制的不斷改革深化的步伐,高等院校辦學的規模也隨之擴大,相應的圖書館藏書也日益豐富起來。不斷擴充的藏書容量在提供大量知識的同時,人們查找自己所需信息的難度也在逐漸增大,在信息時代迅猛發展的今天如何給讀者提供方便快捷的搜索方式也已擺在管理者眼前。鑒于高校圖書館目前廣泛采用了信息化的管理系統,會產生大量借閱數據資源,如果發掘這些海量數據資源中的關系和規則,尋找出背后隱藏的借閱信息,進而可對不同的讀者提供具有針對性的個性化服務。數據挖掘經過近些年的逐步發展,在提供關聯分析等方面能夠便于發現隱藏在大量數據后的有用資源,可為讀者提供更為主動地服務,提高知識的利用效率。

1 關聯規則的相關概念

1.1 關聯規則

關聯規則(association rule)是是數據挖掘的主要技術之一,它對數據庫中的數據項的依存性和關聯性進行描述,從而在已知項的基礎上對未知項進行預測,是形如X→ Y的表達式,其中X和Y是不相交的項集,即X ∩ Y= Ф。關聯規則的強度可以用它的支持度(support)和置信度(confidence) 來度量。支持度代表該規則所代表的事例(元組)占全部事例(元組)的百分比;而置信度代表該規則所代例占滿足前提條件事例的百分比。即:

使用支持度和置信度是由于一方面支持度是一種重要度量,低支持度概率的規則可能僅為偶然出現,多數是無意義的,通常可將其刪去。另一方面,置信度度量通過規則進行推理具有可靠性。對于給定的規則X Y,置信度越高,Y在包含X的事務中出現的可能性就越大。但由關聯規則做出的推論只表示規則前件和后件中的項明顯地同時出現,而不能說明其必然蘊涵因果關系。

關聯規則發現:給定事務的集合T,關聯規則發現是指找出支持度大于等于minsup并且置信度大于等于minconf的所有規則,其中minsup和minconf是對應的支持度和置信度閾值。

挖掘關聯規則的一種原始方法是:把每個可能存在的規則的支持度和置信度都計算出來。但是這種方法將會花費相當大的代價,從包含d項的數據集提取的規則的數目可以達指數級3395988.png ,但最終大部分規則將被丟棄。因此,對規則事先進行剪枝并拆分其支持度和置信度要求可免于將它們計算出來。例如,涉及同一個項集的{甲,乙,丙}的規則:{甲,乙} {丙},{甲,丙} {乙},{乙,丙} {甲},{甲} {乙,丙},{丙} {甲,乙},{乙} {甲,丙}。如果能夠判斷出項集{甲,乙,丙}是非頻繁的,則可以將這6個候選規則給剪掉,從而能夠有效地減少算法開銷。因此,通常釆用將挖掘任務分解為如下兩個主要的過程的挖掘算法:

(1)頻繁項集產生:尋找滿足最小支持度閾值的所有項集作為頻繁項集(frequent itemset)。

(2)規則的產生:從上一步發現的頻繁項集中提取所有高置信度的規則作為強規則(strong rule)。

1.2 Apriori算法

Apriori算法采用通過候選項集產生頻繁項集的基礎上再由頻繁項集產生關聯規則的方法,來達到系統地控制候選項集指數增長的目的。首先掃描事務數據庫,從中尋找出頻繁項集1的集合L1,然后用L1尋找頻繁二項集2的集合L2,再用L2找出L3,直到不能再找到頻繁項集K為止,來完成了頻繁項集的挖掘,其中連接和剪枝是兩個最關鍵的步驟。

1.2.1連接(join)

合并篩選后的候選k-項集與L k-1,產生下一個項集支持度。即為尋找L k,通過L k-1與自己合并候選k-項集的集合。

1.2.2剪枝(prune)

由于C k是L k的超集,可能有些元素不是頻繁的。C k很大是會帶來巨大的計算量,為減少C k的規模,Apriori遵從下列性質:任何非頻繁的(k-1)項集必定不是頻繁k-項集的子集。所以,當候選k-項集的某個(k-1)子集不是L k-1中的成員時,則該候選項集不可能是頻繁的,可以從L k-1中移去。

2 Apriori算法在圖書館推薦服務中的應用

2.1 數據預處理

對于大量的借閱數據來說,借閱次數較少的讀者產生的借閱記錄對于關聯分析分析沒有太大的參考價值,因此在錄入數據庫時要剔除借閱量少于十本的讀者記錄,而僅將活躍讀者的借閱數據信息錄入到數據庫中;將在架圖書按標準的中圖法進行編號歸類,分為基于類型的多個借閱記錄來避免出現一個較大的數據庫,減少一次數據庫掃描的容量;在借閱記錄中出現借閱兩本完全相同的概率很小,關聯中只考慮到類別的書籍,而推薦出在此類別中借閱記錄最高的一本來處理。設置最小支持度0.0255和最小置信度0.85。

以下是部分經提取后的讀者借閱信息:

將獲得到的數據進行變換和分類,得出每個讀者的借閱記錄

2.2 對處理的數據通過Apriori算法的處理,可得到以下規則

2.3 對規則作出分析

查閱書號從關聯規則中可知,有2.58%的人同時借閱了O182(數學建模、控制論、分析基礎類的書籍,而且在這些人中借閱了數學建模、控制論后有86.5%的人同時借閱了分析基礎類的書籍;有2.55%的人同時借閱了工程力學和機械原理類的書籍,而且在這些人中借閱了機械原理后有88.2%的人同時借閱了工程力學類的書籍;有2.59%的人同時借閱了考古學和世界史類的書籍,而且在這些人中借閱了考古學后有89.1%的人同時借閱了世界史類的書籍……通過對算法處理結果進行分析,我們可以很直觀地發現讀者借閱信息中存在的某些信息,讀者會傾向于在選擇某類書籍的同時捎帶上另一類或幾類需要的書籍。因此,我們可以建立一種數字化圖書館的推送業務,對借閱了數學建模、控制論后的讀者推送分析基礎;對借閱了機械原理的讀者推送工程力學;對借閱了考古學后的讀者推送世界史等等,這樣雖然可能不適用于小部分群體,但方便了大部分讀者,為他們創造了方便。同時,我們還可以嘗試調整這些書籍的放置位置,將具有關聯性質的書籍放置在互相靠近的地方,使讀者能夠一次性借閱到自己所需要的書籍,從而減少去各個不同類型的書籍場館借閱所帶來的不便,更好的發揮出這些數據的潛在價值。

3 總結

為找出存在于讀者中的譜遍性閱讀習慣,本文對圖書館的讀者借閱記錄采用Apriori算法分析了其中可能存在的關聯規則,為圖書館的讀者借閱提供方便的圖書推送業務和圖書關聯放置模式;同時,也要發現存在的某些不足:由于存在讀者幫別人借閱書籍的情況,會使相互關聯性存在誤差,影響到對個體行為的分析以及總體的關聯情況,導致降低了數據分析的普適性,因此,需要在數據的錄入階段需要對這種讀者的節借閱波動性建立濾波矩陣,予以濾除這種“噪聲”的干擾,以便更加精準的分析可能存在的關聯規則。后續的研究中還可對不同的年級的學生、教員建立單獨的借閱數據庫,以便能夠發現關聯性更強的準則,做出更加精準的預測,為廣大讀者提供針對性更強的服務。

參考文獻

[1] Mehmed Kantardzic 數據挖掘:概念、模型、方法和算法[M].閃四清,陳茵,程 雁,等譯.北京:清華大學出版社,2003

[2]李愛鳳.基于數據挖掘技術的課程相關性模式研究與實現[D].華南師范大學,2006

[3]許成香.基于數據挖掘技術的學生信息系統開發[J].硅谷,2009,16:57

[4]Han Jiawei,Kamber M.數據挖掘:概念與技術[M].北京:機械工業出版社,2008:150-167endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产在线一二三区| 天天干天天色综合网| 色亚洲激情综合精品无码视频 | 67194亚洲无码| 日本欧美成人免费| 在线看片国产| 国产 日韩 欧美 第二页| 女同国产精品一区二区| 全部无卡免费的毛片在线看| 九九九久久国产精品| 精品国产网站| 国产成人亚洲精品蜜芽影院| 玩两个丰满老熟女久久网| 精品无码一区二区在线观看| 亚洲婷婷六月| 不卡无码网| 伊人久久久久久久| 色婷婷成人| 国产成人1024精品| 国产第八页| 国产精品播放| 亚洲中文精品久久久久久不卡| 热久久国产| 精品无码视频在线观看| 一区二区三区四区日韩| 久久青青草原亚洲av无码| 日韩国产高清无码| 91精品国产自产91精品资源| 成人国产精品2021| 亚洲综合色在线| 亚洲水蜜桃久久综合网站| 一级毛片高清| www.亚洲一区| 国产精品丝袜在线| 国产精品无码作爱| 国产毛片网站| 国产极品粉嫩小泬免费看| 亚洲毛片一级带毛片基地| 久久人人97超碰人人澡爱香蕉| 亚洲全网成人资源在线观看| 国产精品手机视频一区二区| 一个色综合久久| 尤物视频一区| 国产青青草视频| 日韩欧美中文| 九九这里只有精品视频| 丰满人妻中出白浆| 麻豆精品视频在线原创| 青青热久麻豆精品视频在线观看| 亚洲va在线∨a天堂va欧美va| 日本精品αv中文字幕| 国产综合精品日本亚洲777| 91小视频在线观看免费版高清| 欧美在线观看不卡| 91在线一9|永久视频在线| 大陆精大陆国产国语精品1024| 在线观看欧美国产| 亚洲国产系列| 中文字幕有乳无码| 中文字幕无码电影| 亚洲一级毛片在线观播放| 久久亚洲国产最新网站| 狠狠ⅴ日韩v欧美v天堂| 亚洲视频a| 97视频精品全国免费观看 | 久久精品亚洲专区| 午夜国产大片免费观看| 在线高清亚洲精品二区| 国产精品手机在线观看你懂的| 日韩福利视频导航| 免费AV在线播放观看18禁强制| 伊人久久福利中文字幕| 乱系列中文字幕在线视频| 日本午夜视频在线观看| 久久五月视频| 久久黄色一级片| 少妇精品在线| 中文国产成人精品久久一| 欧美亚洲日韩中文| 中文字幕永久在线看| 欧美精品xx| 四虎影视8848永久精品|