黃瑩



【摘 要】互聯網的飛速普及使數字圖書館變成現代圖書館建設的一個重要維度,為用戶供給越發優秀的圖書加工和組織方法成為了數字圖書館前進的一個重要方向。數字圖書推薦能夠結合讀者的歷史閱讀信息,個人的興趣喜好等數據,為讀者推薦他應該有興趣的書籍。數字圖書推薦能夠增加圖書資源的使用率,增多閱讀書籍的讀者。本文利用兩種半監督聚類算法,改進了一種數字圖書推薦系統模型。
【關鍵詞】數字圖書;推薦系統
0 引言
數字圖書推薦系統一般分為三個基本模塊:數據采集模塊、數據預處理模塊和數字圖書推薦模塊[1]。數字圖書推薦系統的簡要推薦過程一般可以歸為五步:(1)采集圖書信息,得到圖書數據。(2)通過讀者的個性化界面獲得讀者的行為日志,采集讀者的信息數據。(3)將書籍數據和讀者數據進行數據預處理。(4)將預處理之后的數據用于數字圖書推薦模塊,得到最終推薦。(5)把最終推薦結果在用戶個性化界面進行顯示。本文主要改進的是數字圖書推薦模塊。
1 數字圖書推薦模塊
本文主要用基于熵理論的馬氏距離與高斯模型的半監督混合聚類算法(SSCMG)和基于馬氏距離與主動學習成對約束的半監督模糊聚類(SSFCMAP)相結合,實現數字圖書的個性化推薦。
數字圖書推薦模塊的基本步驟為:
Step 1:將讀者行為數據采用數據預處理操作,獲得讀者的數據矩陣Si;
Step 2:使用SSCMG算法將讀者聚類處理,得到讀者類C;獲得和目標讀者同在一個類的其他讀者閱讀圖書的集合矩陣;……