雷禮群/武漢城市職業學院
基于信息推薦的圖書管理系統實踐分析
雷禮群/武漢城市職業學院
圖書館數字化需求以及信息科技的發展導致了圖書管理系統的出現,它旨在通過網絡化信息管理為管理者和讀者提供更好的服務,提高圖書管理效率。但是,在當今大部分圖書管理系統中,其基礎服務較為簡單,一般只能提供基礎的圖書管理和信息檢索服務。隨著館藏日益龐大,針對每類圖書都存在成千上萬種版本,如何在海量的圖書信息中讓讀者找到需要的圖書已變得越來越困難。因此,為讀者提供個性化信息推薦成為讀者的迫切需求。
信息推薦;圖書管理系統
圖書管理系統是指通過計算機軟件的方式,對圖書進行信息化組織和管理,它使得管理人員能夠高效地管理海量圖書,并能讓用戶快速搜索和定位圖書,從而為兩者都提供快捷、方便的信息化服務。這種服務模式具有傳統人工管理方式不可比擬的優勢。因此,實現對圖書進行智能化管理和服務是當前一個必然的趨勢。
圖書館個性推薦是指以讀者的個人背景、專業、習慣、愛好和提出的特別要求等為依據,對每一位讀者提供個性化推薦服務。
個性化推薦是信息的重組過程,是信息資源的再分配,是一種基于用戶需求的個性化信息服務模式。其原理是以充分挖掘用戶的個性化需求信息為前提,主動組織信息資源,并向用戶推送其感興趣的信息資源和信息服務。一方面是社會進步與圖書館自身發展的需要,有利于提高圖書館的科技能力與服務水平。另一方面節省用戶獲取有效文獻信息時間,激發讀者閱讀興趣,提高圖書的使用效率,提高用戶的滿意度。
數據挖掘中的關聯規則方法,通過已經評分或用戶的借閱記錄向用戶推薦新的圖書。基于概念分層的方法定義人口統計學屬性,人口統計學屬性再把用戶特征化。根據分類法把圖書分為不同的類別,特定類別的用戶對特定類別的圖書感興趣,這種方法稱為knowledge generalized profile association rules。針對協同過濾推薦的數據稀疏性、冷啟動問題,將關聯規則應用到圖書推薦系統。利用聚類算法對圖書進行聚類,得到同一簇內圖書的相似性較高,不同簇相似性低,再結合余弦相似性計算用戶的相似性,得到目標用戶的最終圖書推薦。
模糊語言學在推薦系統得到廣泛的應用。等基于模糊語言學,提出了多規則的推薦系統,并應用于大學圖書館。該系統為專門領域的研究人員推薦專門的資源,發現協同的可能性,并形成多規則群體。但表示用戶的興趣偏好需要大量復雜的信息,因而獲取用戶概貌比較難。研發模糊語言學的推薦系統,幫助研究人員和公司自動獲取信息。不需要用戶直接提供用戶特征概貌的興趣偏好向量,而是通過計算用戶的不完整模糊語言興趣偏好關系,得到用戶的興趣偏好。
協同過濾分為基于用戶、基于項目、基于模型的算法。大致推薦過程為:
(1)建立m*n的用戶-評價模型。
(2)由皮爾森相關系數、余弦相似性或修正的余弦相似性等公式,計算目標用戶與其他用戶的相似性,得到目標用戶的最近鄰居N u=N1,N2…,N i。
(3)由最近鄰居計算目標用戶對目標項目的預測評分,將預測評分最高的TOP-N項目推薦給用戶。在有足夠的用戶數據的時候,可向具有相同興趣偏好的用戶推送受歡迎的推薦。但數據往往是稀疏的。針對此問題,研究人員提出基于鏈接預測的協同過濾、評價矩陣列向量的協同過濾,結合心理學的遺忘規律及用戶年齡、專業、職業、學歷、性別等特征向量,改進了基于用戶的協同過濾。
基于內容的推薦,在沒有足夠的數據下,可以向具有不同興趣偏好的用戶推薦非流行的項目。LIBRA是很早的基于內容的圖書推薦系統,由每位用戶提供的訓練例子,使用貝葉斯學習算法,從Web提取圖書的標題等信息,推薦圖書。
云模型是我國著名的李德毅院士提出的。云由期望值、熵、超熵表示,云模型轉換了定性概念和數值表示的不確定。一個云包含很多個云滴。云的整體形狀反映定性概念的特征。利用云計算模型計算項目間的相似性,解決數據稀疏性和算法的擴展性問題,有效提高基于項目協同過濾推薦算法的推薦質量。利用云模型計算知識層面的用戶相似性,有效克服傳統基于向量計算用戶相似性的缺點。
如圖1所示

圖1 圖書智能推薦系統框
這一部分是通過關聯規則的挖掘和數據的準備來完成的。關聯規則的挖掘是由頻繁項集的掃描和關聯規則生成這兩部分組成,而數據準備則是將圖書館的web服務器實時用戶文件和借閱歷史進行掃描并生成相應文件。
首先進行的是數據準備工作,這一工作過程中會對數據進行必要的預先處理,規則挖掘的正確度和效率也受這一結果的影響。另外由于圖書的歷史數據和實時數據都存在大量冗余,也需要對數據進行必要的去噪和整理。之后進行的是關聯規則的挖掘,這里會利用關聯模式來發現用戶瀏覽模式,通過對模式的分析得到讀者的借閱規則,存儲之后為后面的online部分服務。
Online部分運用Offline部分生成關聯規則的集合,并且在同一時間內記錄和檢測用戶的瀏覽過程,動態地為用戶推薦相應的鏈接或者書目操作等服務。由讀者推薦和圖書館服務器組成,服務器記錄用戶的操作數據,讀者推薦服務通過匹配讀者行為數據和Offline部分產生的有趣規則,給用戶進行圖書推薦服務。
隨著數字圖書館朝著越來越智能化的方向發展,圖書館需要提供給讀者更加有針對性的圖書自動推薦服務。通過本文的研究能夠得到,作為圖書智能推薦系統技術,可以提高圖書館的服務水平和質量,為圖書館管理提供數據支持。在今后的研究中還需要進一步深入研究,以期能夠更好的改進圖書館的服務質量和效率。
[1]陳宇亮,沈奎林.基于讀者評論的圖書推薦系統研究[J].圖書情報導刊,2016(9):6-9.
[2]欒旭倫.大數據環境下高校圖書館個性化信息服務系統研究[J].圖書館學刊,2014(8):118-121.
[3]曾子明,陳貝貝.融合情境下智慧圖書館個性化服務研究[J].圖書館論壇,2016(1):57-63