王茂華 郝云力 柏春松
摘要:針對傳統相似度忽略用戶局部偏好、用戶評分差異和非共同評分項等因素的影響,提出了一種基于損失因子和數據集劃分的協同過濾推薦算法.算法根據用戶對項目的偏好度來劃分數據集,并提出用兩個修正因子來改進傳統的相似度.在MovieLens數據集上將所提算法和Pearson算法、參考文獻[1]中的算法進行比較,實驗結果表明,基于損失因子和數據集劃分的協同過濾推薦算法更明顯地降低了MAE值.
關鍵詞:協同過濾;損失因子;劃分數據集;Pearson
中圖分類號:TP391? 文獻標識碼:A? 文章編號:1673-260X(2019)01-0051-03
網絡信息的爆炸式增長使得用戶越來越難以搜索到自己需要的信息.而推薦技術可以根據用戶的需求、歷史行為等數據,從大量的網絡信息中為目標用戶推薦感興趣的信息,因此得到了廣泛的應用[1].
在眾多的推薦算法中,基于協同過濾的算法是目前應用最廣的推薦算法[2-5].針對傳統的協同過濾算法的推薦準確度較低這一難題,國內外的學者提出了眾多的改進算法.李容等通過分析用戶共同評分項和用戶平均分的影響,用兩個修正因子來改進傳統相似度.張宏等[6]將用戶評分時間和商品流行度引入相似度計算中.鄭潔等[7]將用戶評分的活躍度和項目評價結果對平均值的偏差引入相似度的計算.何佶星等[8]提出以基于歐氏距離的KNN算法確定領域,以流行度閾值來劃分數據集.
從以上算法的實驗結果可以看出,推薦質量得到了不……