摘 要:通過對數據挖掘技術以及圖書館個性化服務相關內容的介紹,探討了數據挖掘在數字化圖書館中的應用,說明數據挖掘技術在數字圖書館應用的必要性,以及在提升圖書館服務質量和服務水平方面的發揮的重要作用。
關鍵詞:數據挖掘;個性化服務;數字圖書館
數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、新穎的、可被人理解的、但又是潛在有用的模式的過程。其主要特點是對數據庫中的大量數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助決策的關鍵性數據。
⑴數值數據挖掘,通常稱為數據挖掘,它的任務一般可以分為描述和預測兩類,具體地說,挖掘功能包括發現概念/類描述、關聯、分類、預測、聚類、趨勢分析、偏差分析和類似性分析。常見的數據挖掘方法主要有:歸納學習方法、仿生物技術、公式發現、統計分析方法、模糊數學方法、決策樹、遺傳算法、貝葉斯信念網絡、粗糙集及可視化技術等,由于各種方法都有自身的功能特點以及應用領域。⑵文本數據挖掘是面向文本信息的數據挖掘。當數據挖掘的對象完全由文本類型組成時,結合使用數據挖掘算法與信息檢索算法對巨量文本信息進行自動化信息處理與分析的過程叫文本數據挖掘。它包括特征提取、文本摘要、文本分類與聚類、概念操作以及探索性數據分析等工作。⑶基于Web的數據挖掘。Web數據挖掘的定義是:針對包括Web頁面內容、頁面之間的結構、用戶訪問信息、電子商務信息等在內的各種Web數據,應用數據挖掘方法以發現有用的知識來幫助人們從WWW中提取知識,改進站點設計,更好地開展電子商務。
1 圖書館的個性化服務概述
所謂個性化服務,就是服務要體現個性,同時具有主動性的特點,實現個性化服務的關鍵是在“信息找人”過程中什么信息找什么人。其本質就是對于不同的人、不同的要求提供不同的服務,以滿足不同用戶的特定需求。常見的服務方式有個性化推薦、個性化檢索、個性化網站。個性化推薦服務如信息推送服務,一種按用戶指定時間或發生的事件把用戶選定的數據自動發送給用戶的技術,其本質就是主動性服務,幾乎不需要用戶做什么事,系統自動按照用戶的信息需求提供相應的服務。個性化主動服務將使用戶通過盡可能小的努力獲得盡可能好的服務。數字圖書館的個性化信息服務首先就是要為用戶創建個性化的信息資源庫,即個人數據庫。通過圖書館網絡,用戶向圖書館系統提交所定制的個性化信息,用于構建個人信息數據庫,建立個性化網站。針對不同的個人信息,即對不同的用戶采用不同的服務策略,提供不同的服務內容,如提供個人書架和信息檢索服務等,不同人的個人書架內容是不完全相同的;對于相同的檢索提問,系統反饋給專家的以及普通用戶的內容應該有所區別的。
2 數據挖掘在圖書館個性化服務中應用
2.1 優化館藏資源配置,提高資源利用率
傳統圖書館資源的配置、服務的提供,由于受人工采集信息的影響,因此不可避免的受到采集者的知識層次、知識結構以及個人愛好等因素的影響,而帶有主觀性。采用數據挖掘技術則可以較好的解決這一問題。(1)利用數據挖掘技術,對流通記錄、檢索請求等日志數據進行分析,就可以得到各類文獻流通借閱情況,了解讀者的借閱行為和愛好。根據這些信息,有針對性的補充和豐富文獻資源,剔除過時文獻資源,或減少文獻信息資源的副本數,甚至可以根據這些挖掘信息,調整圖書館的人力、物力資源的分配,從而達到資源優化配置,合理布局目的。(2)對數字圖書館的結構進行挖掘,目的是發現數字圖書館頁面的結構和結構模式,在此基礎上對頁面進行分類和聚類,或對相關網頁進行分析,從而可以評價網頁的質量,優化檢索方式,指導網站建設,便利用戶對數字圖書館使用,提高數字圖書館的利用率。
2.2 完善信息資源建設,提升個性化服務質量
通過對流通記錄、檢索請求等日志信息的挖掘,所得到的信息,可以對圖書館的讀者群有一定的了解,但對于完善信息資源建設,提升個性化服務質量,還是不夠的。完善信息資源建設,需要多方面的收集信息資源,提升個性化服務質量,就需要對讀者有一個比較準確和全面的了解,在前面提到的數據挖掘的基礎上,還要從以下幾個方面進行挖掘:
(1)對數字圖書館的內容進行挖掘。基于數字圖書館的內容的挖掘是通過對數字圖書館信息的模式識別和分析理解,從中發現有意義的知識。根據某一領域的信息需求,自動捕捉、采集和整理領域所需信息, 過濾無用冗余信息,通過信息推送等方式,直接數據挖掘所發現的知識,提供給讀者,主動提供個性化服務。
(2)對數字圖書館的用戶進行挖掘。從數字圖書館的大量訪問信息中挖掘用戶的訪問模式、訪問興趣,采用關聯性法則和聚類方法發現不同的用戶群體,然后對這些不同的群體提供信息定制服務。同時還可以利用web挖掘所得到的信息,動態地調整web頁面,更好地滿足讀者的需要。通過對用戶訪問信息、使用信息的挖掘,在數字對象和用戶、對象分類和主題之間進行模式匹配,采用不同挖掘技術自動提取知識,從而確定個性化服務內容,提高為用戶知識服務的自動化水平。
總之,隨著信息技術的發展,特別是數據挖掘技術和數據庫技術的在圖書館領域中的應用,對圖書館界產生了深遠的影響,不僅是觀念上的革新,而且潛移默化了傳統圖書館的用戶服務模式。伴隨智能化技術的進展,個性化服務有著相當廣闊的前景。如何提供優質的個性化信息服務應當是我們始終共同關注的焦點。
[參考文獻]
[1]牛根義.國內圖書館數據挖掘研究[J].現代情報.2009(01).
[2]駱穎.基于數據挖掘的數字圖書館個性化服務[J].硅谷.2009(02).