侯燁 時圣宇
摘 要:高等院校內部圖書館系統設計和應用工作,在現代化科學技術和管理原則的共同作用下,已經產生了十分明顯的發展效果。本文首先對高校圖書館,圖書推薦系統當中,關聯規則的應用進行了簡單概述,分析了數據倉庫和聯機分析模塊的設計工作;隨后,在此基礎上,進一步探究了高校圖書館中,關聯規則的優化模式,旨在為關注這一領域的人士,提供一些可行性較高的參考意見。
關鍵詞:關聯規則;高校圖書館;圖書推薦
隨著我國國民經濟的發展,以及人民生活水平的提高,社會各界對于我國高等院校的圖書館管理模式,尤其是高校圖書館中,關聯規則的應用方面越來越關注。圖書館的信息服務模式,是面向全體讀者的,在高等院校內部的圖書館中,關聯規則的合理應用,可以為讀者們推薦更加適合的圖書信息,幫助學生們根據自己的實際需求,靈活地挑選和借閱圖書,提高圖書的可讀性。
1 關聯規則在高校圖書館圖書推薦中的應用
高校圖書館中,圖書借閱數據庫和聯機分析模塊的設計和管理,是關聯規則應用最為廣泛的項目。
1.1 數據倉庫設計
在進行數據倉庫的設計工作中,設計師要明確不同區域各自所具備的主題。將邏輯模型按照主題進行分化和管理,之后,再利用關聯規則,將其進行延伸,明確各個主題下,不同邏輯模型之間的關聯關系。比如,在實際的設計工作中,可以將粒度層次劃分方法,應用到其中。粒度層次劃分方法,是數據倉庫設計環節最為重要的內容。首先對數據倉庫的數量級進行分析,將數據倉庫的數量級應用到不同的管理管理模塊,采用多種數據粒度策略。當數據量較大時,應用雙重粒度;當數據量較小時,可以采取直接存儲細節的方式,并且定期進行數據庫綜合測試,優化數據粒度[1]。
1.2 聯機分析模塊
多維聯機分析數據倉庫中,數據分析模塊是其最重要的功能。例如,我國某地區的高校圖書館,在進行設計的過程中,應用了Oracle10g和Oracle Warehouse Builder組織數據庫,對模塊進行了集中數據管理。在具體的操作環節,工作人員分別建立了數據倉庫的圖書維、讀者維和時間維等三個模塊。建立讀者多維數據庫和圖書多維數據庫,通過時間軸,對讀者在不同時間段內查詢、瀏覽和借閱的圖書信息進行集中管理。在讀者共享的維度,可以按照讀者所在學院、專業、借閱組等方面的信息進行分類,形成具有遞進層次的數據信息,可以為聯機分析模塊的優化設計,提供更為準確的信息數據支持。
2 高校圖書館中關聯規則的優化研究
在對高校圖書館中,關聯規則的具體應用模式進行優化研究的過程中,筆者以某地區高等院校內部讀者在校期間的借閱數據作為主要的研究對象,開展了如下的研究工作:
2.1 研究流程
應用關聯規則和時間軸分析方法,對不同讀者的閱讀數據進行了分類管理。在這一過程中,將讀者所在學院和所學專業等變量信息考慮在內,以此得出讀者閱讀偏好和圖書類型的關聯關系。通過關聯規則分析的方法,重點掌握了以專業為單位的用戶群體,不同的閱讀需求、閱讀偏好與閱讀傾向等,將各項數據存儲到數據庫當中,為后續高校圖書館圖書推薦系統的個性化和私人化推薦,提供更為準確的信息數據支持。在大數據和云計算等科學技術的配合下,關聯原則在高校圖書館中的應用效果更為明顯,以行之有效的推薦方法,可以讓高校圖書館的圖書資源,發揮出最佳的應用效果。將科學的圖書信息服務,貫穿于用戶閱讀全過程。
在數據信息選取的過程中,筆者選取了抽樣調查的方法,將抽樣比例控制在30%。從圖書館的借閱管理系統,對抽樣用戶從一年級到四年級期間,在圖書館中借閱的數據進行了調取,共獲取了1200名用戶的27905條數據。抽樣的用戶專業覆蓋了管理、經濟、法學、醫學、文學、理學和工學等多個學科的71個專業。在數據處理階段,根據用戶的學號、專業、借閱操作日期、中圖分類號和圖書名稱等信息,將各項數據進行了集成處理。應用Apriori算法,對圖書借閱活動中的用戶維度、圖書維度和時間維度等內容進行了處理。運用Apriori算法,找出全部數據當中的頻繁項集,之后判斷最大頻繁項集中,沒有超過最小支持度的數據,將其進行剔除,得到的滿足條件的最小置信度,即為強關聯原則[2]。
2.2 研究結果
在筆者調查的1200名用戶的27905條數據中,用戶借閱的圖書類型共計22類,借閱密度為0.17。其中,最常借閱的圖書類型為B、H、I、K、T等五種類型。有155名用戶的借閱數據顯示,平時只借閱一種類型的圖書。并且,數據還顯示,用戶在一、二和四年級的學習中,借閱類型與自身專業匹配度較高。對此,在系統進行優化設計時,可以根據用戶的專業類型以及在不同年級的發展水平,為用戶推薦更適合的專業書籍。此外,用戶除了專業書籍之外,其他興趣愛好方面的發展總體呈現出較低的水平。對此,高校圖書館系統可以適當地在推薦項目中,增加用戶可能感興趣的課外閱讀材料,并根據用戶的點擊量,隨時進行優化調整。
3 總結
綜上所述,關聯規則在高校圖書館中,有著良好的應用效果。相關領域的工作人員,可以在日常的組織和管理過程中,深入系統地分析出,高校圖書館圖書推薦服務中,關聯規則的操作模式。通過設計出合理的研究流程,可以提升研究所得結果的科學性和準確性,從而可以為高校圖書館圖書推薦服務,更好地應用和發展關聯規則,更加便捷靈活地為讀者們服務,提供了可行的途徑。
參考文獻
[1]王娜,岳俊英.基于關聯規則的高校圖書信息數據挖掘[J].信息系統工程,2014(02):153-154.
[2]趙琳. 數據挖掘技術及其在高校圖書管理系統中的應用研究[D].中國海洋大學,2011.