聶珍 王華秋 周建
〔摘要〕本文分析了圖書館服務中個性化推薦提出的背景、研究意義和圖書館發展的狀況,闡述了圖書館個性化系統設計思想、框架結構和各功能模塊的任務。詳細介紹了系統的實現,以某圖書館數據為例,進行聚類分析,獲得各簇的借閱模式,結合讀者信息,通過圖書喜好度計算,完成了圖書推薦的目標,并提供了可參考的建議。這一推薦服務系統的提出,提高了圖書館的使用率,提升了圖書館的服務水平,是網絡時代圖書館發展的新道路。
〔關鍵詞〕個性化推薦;圖書館服務;系統設計
DOI:10.3969/j.issn.1008-0821.2013.09.019
〔中圖分類號〕G252.6;TP301.6〔文獻標識碼〕A〔文章編號〕1008-0821(2013)09-0095-04
圖書館個性化推薦則是指以讀者的個人背景、專業、習慣、愛好和提出的特別要求等為依據,對每一個讀者提供個性化推薦服務[1]。讀者的個人信息是存儲在圖書館的數據庫里,借閱信息是存儲在讀者的借閱日志中,這就需要采用數據挖掘技術[2],在大量的隱藏信息中挖掘出讀者的喜好和借閱模式,便于進行個性推薦。各個高校開始這方面的研究,并各自推出了推薦系統,如中國人民大學、浙江大學及武漢大學,這才開啟了國內個性化推薦服務的研究[3]。
就理論發展而言,從多種角度和多種方向研究PRSL領域的文章很多,揭示了圖書館中發展個性化的推薦服務具有重要意義,預測了發展的良好態勢[4-5]。目前開展個性化的推薦服務的高校有中科院的文獻信息中心、浙江大學和中國人民大學等,甚至連清華大學網絡信息實驗室的研究課題中都有個性化的信息檢索系統,并發表了數篇基于該課題的論文[6]。
圖書館擁有大量圖書,是提供給讀者學習資料的重要場所。其服務對象各有特色,圖書館提供的服務應該滿足不同讀者的需要,才能真正有效的利用資源。采用文獻[7]的和聲模糊聚類算法(Harmony Fuzzy Clustering,HFC)的推薦系統主要是為圖書館的管理提供幫助。系統主要是通過記錄讀者的借閱行為、采集各個讀者的借閱數據,然后對采集的數據進行預處理,存儲在數據表中。利用HFC算法分析數據集,得到隱含的各類圖書的借閱模式和規則。最后根據讀者的相關信息,預測讀者可能喜愛的圖書資料,通過各種形式向其推薦感興趣的圖書資料,以達到為讀者提供個性化的信息服務的目標。
本文從設計思想、系統框架以及具體的實現來介紹系統,為圖書館工作提供參考意見。
1個性化推薦系統的框架
根據個性化推薦系統的設計思想,完成系統的框架結構設計。本節主要從系統的整體結構、各個功能模塊的工作和個性化推薦的工作過程詳細的介紹了系統的框架結構設計。
1.1整體結構
已有的大多數圖書館個性化推薦系統中,多采用輸入讀者喜好關鍵字和傳統的聚類算法對讀者借閱日志進行分析處理,效果較差。本文采用HFC算法來處理讀者借閱日志,不需要輸入讀者喜好關鍵字就能自動的進行個性化的推薦,在文獻[7]已經詳細的驗證了HFC算法較其他算法的高效性,在聚類中獲得了很好的效果。根據系統要完成的功能將系統結構分為三層,一是界面層;二是個性化推薦層;三是數據庫層,如圖1所示。界面層是跟讀者面對面的可視化層,向讀者推薦個性化的圖書資料。個性化推薦層主要是進行數據的采集和預處理,采用HFC算法處理數據,得到圖書借閱的模式,推薦個性化的圖書資料。這一層的功能模塊由讀者借閱日志的采集、數據的預處理、聚類分析和推薦個性化的圖書資料4個部分組成。基本數據庫層主要是存儲讀者、圖書和借閱日志的數據信息。