吳定諭 周從華 單田華 劉志鋒
(江蘇大學計算機科學與通信工程學院 鎮江 212013)
推薦系統能夠緩解由于互聯網快速發展所導致的“信息過載”的問題,幫助用戶從大量信息中找出用戶所需要的信息。傳統推薦系統大多依據用戶評分來判斷用戶喜好實現未評分項目預測,比如最為經典的矩陣分解(Matrix Factorization,MF)模型[1],將用戶和項目特征映射成同一隱空間的隱向量。然而,評分僅能大致表現用戶對項目的整體態度,無法對用戶喜好的原因進行挖掘,例如用戶喜歡某間餐廳是因為美食還是因為服務態度好,可解釋性較差。另一方面,評分矩陣一般情況下都十分稀疏,進行評分預測的精度較差。
基于以上原因,研究人員將研究重點轉移至基于評論文本的推薦模型,相比于評分僅能代表用戶的總體態度而言,評論信息能夠體現用戶喜好的原因,具有較強的可解釋性。許多推薦模型應運而生,例如CTR[2]、HFT[3]等,這些模型驗證了基于評論的推薦模型的有效性。但是這些以往的工作一般都是使用隱狄利克雷分配模型(LDA)[4]從評論文本中挖掘各種信息[5~7],這種方式忽略了評論上下文的語義信息。文獻[8]認為使用LDA 不能對除詞語級別以外的主題分布進行挖掘,提出了TopicMF 模型,通過非負矩陣分解得到評論隱藏主題信息,并通過主題分布體現用戶商品特性。
由于深度學習對文本信息的強大建模能力,研究人員將深度學習技術應用于基于文本的推薦系統的研究。……