郭艾華++劉業亮

DOI:10.16661/j.cnki.1672-3791.2017.25.007
摘 要:本文將從數據挖掘在國內圖書館數據庫應用的領域進行研究,從數據挖掘在國內的數字圖書館、高校圖書館以及圖書館個性化服務等方面入手分析數據挖掘在國內圖書館數據庫應用的現狀,總結其中存在的問題,并找出解決問題的方法,提高數據挖掘在國內圖書館數據庫的應用效率。
關鍵詞:數據挖掘 圖書館數據庫 應用研究
中圖分類號: G25.73 文獻標識碼:A 文章編號:1672-3791(2017)09(a)-0007-02
隨著數據挖掘學科的不斷發展,很多領域都引進了數據挖掘知識,解決人們對數據分析、處理、應用的難題。數據挖掘是一項綜合性很強的學科,不但涉及到了數據庫的技術,還有統計學、人工智能、檢索信息等領域,適用范圍十分廣泛,當今國內的很多圖書館也關注到了數據挖掘,通過對數據挖掘在圖書館中的應用研究,提高數據挖掘應用效率。
1 數據挖掘在國內圖書館數據庫應用研究存在的問題
1.1 理論研究不夠深入
雖然從20世紀90年代至今,都有國內外的專家學者們對于圖書館數據挖掘相關理論的研究,但是這樣的研究還不夠深入和全面,沒有建立起系統的理論模型,這也是導致我國圖書館數據庫應用數據挖掘效率不高的原因之一。
1.2 圖書館數據庫應用研究不夠全面
數據挖掘是一門綜合性很強的學科,它集計算機、統計學、可視化以及人工智能等學科相關知識于一身,并且在很多領域包括金融、醫療、互聯網等都得到廣泛的應用。但是在國內的圖書館中,由于對數據挖掘學科認識的不足,數據挖掘并不能充分地發揮其強大的作用,所以在圖書館數據庫應用數據挖掘過程中出現多種問題,如對圖書館數據挖掘應用研究不夠全面的問題。
1.3 研究項目和經費支持少
數據挖掘在國內圖書館數據庫應用研究存在的又一難題是對于數據挖掘在圖書館數據庫應用的研究項目和經費支持少。國家對于研究項目的支持很少,從現有數據可以發現國家對于863計劃資助的研究項目只有1篇,這樣低的支持率造成了論文基金資助率低下的情況發生,僅僅只有3.47%的論文基金資助率,遠遠低于其他領域的資助水平。和其他研究領域相比,數據挖掘在圖書館數據庫應用的類型研究項目的支持經費不高。但是圖書館的發展和管理的推進都需要大量的經費作為后盾支持,特別是數據挖掘,此技術的研究和應用門檻高,研究人員需要有全面的知識,對計算機、統計學、數據庫等都精通,這樣的研究自然需要大筆的經費支持。
1.4 研究成果與圖書館管理信息系統開發不緊密聯系
雖然目前我國的數字圖書館、高校圖書館以及公共圖書館個性化管理等都進行數據挖掘的相關研究,然而對于這些研究結果卻不能結合到具體的圖書館信息系統建設工作當中。世界上已經開發出了具有數據挖掘功能的圖書館管理信息系統,這些系統把數據挖掘的優勢發揮出來,真正地應用到實際的圖書館發展中。但是相對于外國,我國的圖書館并不能研究開發出具有操作性強、易于實現并且能夠指導實際業務的成熟產品。造成這樣的情況發生很大一部分原因是研究成果與圖書館管理信息系統開發不緊密聯系,并且對于圖形圖像和用戶評論等非結構化的挖掘不夠深入。
2 加強圖書館數據挖掘應用的策略
通過加強圖書館數據挖掘應用,可以優化圖書館的管理。圖書館數據挖掘的利用展現見圖1。
2.1 進行資源建設,館藏優化
在圖書館信息資源的建設中,其文件的采訪是建設的關鍵,是否建設好文獻的采訪直接關系到文獻的資源共建、共享以及信息服務水準的提升。圖書館經常是通過學科的需要及專業制定購買方案,同時還需要結合圖書館藏書學科專業分布情況和發展趨勢、現有的藏書量來制定購買計劃,但這樣的購買計劃并不能很好地進行優化圖書館的藏書。所以最佳方法是通過數據挖掘的方法,客觀分析圖書館的現況,需求以及變化趨勢,再科學合理地進行資源建設,從而優化館藏,根據圖書館數據挖掘的應用,有針對性地對藏書進行補充,不斷豐富館藏資源,優化館藏的結構,進一步提高館藏的利用率。
2.2 利用數據挖掘提升服務質量
圖書館可以利用數據挖掘來提升數據資源服務的質量。通過信息服務的智能化,讓被動服務變成主動服務,改變傳統的服務方式,讓圖書館的服務質量得到提升。通過OPAC的服務智能化,支持概念檢索、模糊檢索、聯想檢索等功能,利用數據挖掘中的文本挖掘技術讓檢索結果質量提高。其次應用數據挖掘技術,在查詢咨詢中發揮優勢,通過對網絡信息的挖掘以及網絡信息的序化、網絡信息的應用加強和優化圖書館信息服務質量。圖書館的服務質量直接影響到了圖書館的運行效率,發展方向,所以要充分研究數據挖掘在圖書館中的應用,并發揮其優勢,幫助圖書館優化服務質量,提高各方面的綜合能力。
2.3 挖掘學科動向,發現學科之間的隱性關聯
各個學科的動向直接影響到了圖書館的新書購買及藏書的相關工作,因此學科動向與學科隱性關聯是圖書館文獻使用規律挖掘的重要方面之一,利用數據挖掘中的文本聚類、文本分類以及關聯挖掘等功能強化圖書館的購買規劃,通過挖掘學科動向,發現學科之間的隱性關聯,研究出在海量數據中存在的規則,而這些規則對于我們發現學科之間的隱性關聯很有幫助。有些學科之間的關聯并不容易發現,需要通過內在聯系、內涵分析等才能發現其隱性關聯。挖掘出了學科之間的隱性關聯,對于提高圖書館的藏書借閱和電子資源服務學科研究等工作的開展都有重大的意義。
3 數據挖掘研究熱點及趨勢
3.1 關聯挖掘
在以后的數據挖掘在國內的圖書館數據庫應用領域研究中,其研究的熱點以及趨勢是學科之間的關聯挖掘。通過對讀者與書籍、書籍與書籍之間的隱性關聯的研究,可以為圖書館的藏書建設提供重要的指導意見。數據挖掘技術在圖書館中最常見的是館藏建設的優化,館藏結構的優化以及藏書布局等。通過關聯挖掘的研究,可以找出圖書館中的圖書與圖書之間的隱性聯系,或者讀者與文獻之間的聯系。比如讀者借閱了文獻A,一段時間后又借閱了文獻B,通過研究文獻A與文獻B之間的聯系,不斷優化圖書館的藏書,使圖書館更好地服務于讀者。
3.2 讀者行為分析
圖書館中的讀者行為分析與挖掘對于圖書館的發展有著重要的作用。通過讀者行為的分析,可以優化館藏結構,提高讀者對圖書館的信息資源的利用率。比如圖書館挖掘在圖書館中的常活動讀者,對于讀者的身份和讀書習慣分析,對于文理科讀書群體的分析等,對這些讀者行為進行跟蹤與分析,通過分析和總結,發現圖書館存在的問題以及優化館藏資源結構,并且尋找出相應的調整方案,從而優化圖書管理和服務推送,讓更多的讀者喜歡圖書館,也讓圖書館的管理與發展更進一步。
3.3 個性化服務
每一個讀者的行為習慣都不同,閱讀的習慣也各不相同。如果圖書館能夠建立起個性化服務,并且對讀者對信息使用行為習慣的特定需求建立起完整的個性化服務體系,那么就能進一步提高圖書館的管理水平。而個性化服務也始終貫穿于數據挖掘在圖書館數據庫應用研究過程中。根據讀者的興趣、愛好、瀏覽模式等研究開發出適合不同讀者的個性化服務。比如閱讀推薦、個性化公告板、郵件訂閱等根據讀者的喜好推薦與之相符的書籍供讀者閱讀。
4 結語
當前數據挖掘技術在快速的發展當中,其在多個領域也得到廣泛的應用。數據挖掘技術為圖書館在海量信息資源中檢索有價值的信息從而為指導圖書館的工作提供了便利。優化了圖書館的藏書結構,信息管理結構等,它是圖書館革新的重要手段。雖然目前國內圖書館的數據挖掘應用還不夠完善,受到各種條件的制約,但是數據挖掘在圖書館中仍然有著廣闊的應用前景,有待我們進一步的挖掘和研究。
參考文獻
[1] 俞錦梅.數據挖掘在國內圖書館數據庫應用領域研究綜述[J].圖書與情報,2015(2):137-141.
[2] 田瑞雪.國內圖書館數據挖掘技術應用研究述評[J].科技信息,2014(1):167.
[3] 龐天丙.數據挖掘技術在圖書館系統中的研究現狀分析與研究[J].福建電腦,2012,28(2):72-74.endprint