任佩劍
摘 要:隨著圖書館事業的不斷發展,如何更好的提高用戶對圖書館資源的使用率,如何更好地、有針對性的為讀者提供服務,已經成為圖書館今后發展中所面臨的具體任務。應用數據挖掘技術將為圖書館的管理工作和個性化服務提供有效的技術支持,它可以從表面龐雜無序的數據中提取出重要的,可供參考的信息。
關鍵詞:信息檢索;教學改革
隨著高校信息化的建設,為了給老師和學生提供更好的服務,在圖書館中可以使用數據挖掘技術。數據挖掘是目前人工智能和數據庫領域研究的熱點問題,它通過分析每個數據,從大量數據中尋找其規律,幫助用戶做出正確的決策。因此,我們可以在圖書館的日常工作和各項信息服務中使用數據挖掘技術,將這些分散的信息整合起來,找出聯系并充分利用,來為圖書館管理者做出正確的決策提供幫助。
一、數據挖掘概述
(一)數據挖掘的定義。數據挖掘是通過一定的數據挖掘算法從海量的數據中發現潛在的、有效的、有用的知識的過程,是知識發現過程中的一個步驟。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。
(二)數據挖掘的過程。(1)數據準備。數據準備將會直接影響到數據挖掘的效率,在這個階段主要完成數據采集、數據的預處理工作。(2)數據挖掘。對經過數據準備階段之后所得到的數據,利用選定的數據挖掘工具和方法進行挖掘,用選定的算法或算法組合在模型空間中進行反復迭代搜索,從數據集中抽取出隱藏的、新穎的模式和知識。在數據挖掘過程中需要不斷的進行人機交互,以期得到更加符合實際情況的模式和知識。(3)結果表述和解釋。根據系統的目的和需求,對數據挖掘的結果進行分析,將最具價值的信息加以區分并提交給決策者。
二、數據挖掘中的幾種重要算法
(一)關聯規則算法。關聯規則是發現大量數據中項集之間有趣的關聯或相關聯系。它在數據挖掘中是一個最重要、最成熟的課題,這種算法已經被應用到很多領域中。
關聯規則挖掘的一個典型例子是購物籃分析。關聯規則研究有助于發現交易數據庫中不同商品(項)之間的聯系,找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。分析結果可以應用于商品貨架布局、貨存安排以及根據購買模式對用戶進行分類。
(二)聚類分析。所謂聚類分析是指將數據聚集成由類似的對象組成的多個類的分析過程,同一個類中的對象有很大的相似性,而不同類間的對象有很大的相異性。聚類與分類的不同在于,聚類所要求劃分的類是未知的。分類是根據事先知道的數據特征將事物進行分類,而聚類分析則是要找到這個數據特征。
三、數據挖掘技術在高校圖書館中的應用
(一)合理制定采購計劃。隨著時間的推移,讀者對圖書館資源的需求在發生變化,因此圖書館的館藏資源也要與時俱進,進行更新,圖書館必須不斷優化館藏資源來滿足讀者的需求。如何采購到讀者需要的圖書,在館藏資源建設中起著決定性作用。一般圖書館在制定采購計劃的時候主要采用以下兩種方法:(1)通過咨詢各專業教師,請他們列出有價值的圖書,圖書館采購人員據此來進行采購。(2)采購人員根據自己的經驗,自行制定采購計劃。這兩種方式最大的問題是主觀性強,因此采購回來的圖書很可能利用率不高,造成資源和資金的浪費。
利用數據挖掘中的聚類分析可以幫助分析人員從讀者的流通記錄中發現讀者對圖書的借閱情況,深入了解學科的走勢和讀者的需求,幫助采購人員制定更加合理的采購計劃,避免造成資源和資金的浪費。
(二)優化館藏資源。讀者在查詢書目和借閱圖書過程中會產生大量數據,通過對這些數據進行挖掘,可以獲知讀者對哪類圖書更感興趣,在哪段時間借閱更頻繁,可以及時從圖書館中剔除舊的、使用較少的圖書,不斷補充新的、需求量多的圖書資源。這樣可以使圖書館的館藏分配更加合理,更加科學,優化各類圖書資源,減少冗余,節約資源,合理引導圖書館的建設。
(三)為讀者提供個性化服務。不同的讀者對資源的需求是不同的。讀者在借閱圖書過程中會留下大量的信息,如讀者的個人信息、借閱信息、歸還時間等,可以利用數據挖掘對讀者的借閱數據進行關聯分析,挖掘出各專業、各年級層次、各職稱的讀者對圖書館資源的需求情況,從而為讀者提供個性化服務,例如,為讀者定制推薦服務,以建議或指導讀者的借閱行為;閱讀量大的讀者,為其擴大閱讀權限等。
總結:總之,通過對圖書館中產生的大量數據進行數據挖掘,從而使圖書館的館藏資源更加合理,提高資源利用率和讀者滿意度。另外,數字圖書館也是圖書館以后發展的一個方向,數據挖掘技術在數據組織、分析和知識發現等方面具有的巨大優勢和潛力,使其在數字圖書館建設中將發揮重要作用。
參考文獻:
[1] 賈輝.淺談數據挖掘技術在圖書館中的應用[J].經濟研究導刊.2012(27).