吳婷婷,李孝忠,劉徐洲
(天津科技大學人工智能學院,天津 300457)
互聯網上信息資源的爆炸式增長給用戶帶來了信息過載問題,不明確的用戶需求更是對搜索引擎提出了更大的挑戰[1–2].針對這一問題,推薦系統作為一種高效便捷的自動化篩選信息工具受到廣泛關 注[3].已有的推薦系統可分為基于內容的推薦、基于關聯規則的推薦、協同過濾推薦、混合推薦[4].在目前的推薦系統中,基于協同過濾的推薦算法使用范圍最廣[5],具有較高的研究和發展價值.常用的協同過濾推薦算法主要有兩類[6-7]:(1)基于用戶的協同過濾(user-based collaborative filtering,User-based CF)算法,通過用戶的歷史行為判斷用戶對項目的喜愛程度,根據不同的用戶對同一項目的偏好計算用戶之間的關系,并在具有相同偏好的用戶之間進行項目的推薦;(2)基于物品的協同過濾(item-based collaborative filtering,Item-based CF)算法,根據計算不同用戶對不同項目的喜愛獲得項目之間的關系.但是在使用協同過濾推薦算法中存在著數據稀疏、用戶相似度不高等問題,導致推薦結果的準確度較低. Kanimozhi[8]通過對商品進行聚類,較大程度上縮小了商品的最近鄰居搜索范圍,提高了算法的運行效率.但是,該算法并沒有利用用戶對商品的評級信息,忽視了用戶的歷史行為記錄,從而導致了推薦結果準確性的提高存在一定程度的限制.Tsaic等[9]將協同過濾算法與聚類算法相結合,有效地提高了推薦系統的準確度,但是在計算用戶的相似度時僅使用了皮爾森相似度公式,存……