999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA主題模型的矩陣分解推薦算法

2020-12-04 05:24:16楊彥榮李亞雨
數字通信世界 2020年11期
關鍵詞:特征用戶方法

楊彥榮,李亞雨

(1.西北農林科技大學網絡與教育技術中心,陜西 楊凌 712100;2.西北農林科技大學信息工程學院,陜西 楊凌 712100)

1 推薦算法

隨著大數據時代的來臨,網絡信息資源呈現井噴式的增長,為人們提供了豐富的資源數據,但是網絡資源具有海量無序、異構和碎片化等特點,也給用戶帶來信息超載。在浩瀚的數據中,用戶搜尋自己所需資源愈發困難,為解決用戶高效的獲取所需資源的問題,推薦系統應運而出,并迅速得到廣泛應用。

推薦算法可分為基于內容推薦、協同過濾推薦和混合推薦[1-3]。基于內容推薦選用特定的用戶或物品信息表征用戶喜好,進而篩選喜好相似度高的物品推薦給目標用戶。然而,基于內容的推薦方法依靠人工經驗選擇物品特征,然而人工選擇的特征往往無法全面、準確刻畫物品的內涵,同時也無法挖掘用戶的潛在興趣,推薦的都是差異不大的相似物品,導致推薦效果不佳。協同過濾算法是一種通過“近鄰”查找并進行預測目標用戶評分的方法,可分為用戶或是物品“近鄰”過濾。協同過濾推薦具有適應性強、易于實現和推薦結果可解釋性等優點而被廣泛應用于不同領域。然而協同過濾推薦僅利用用戶評分數據,依據“近鄰”的評分預測目標用戶的評分,未考慮用戶和物品的屬性信息,然而在一個推薦系統中不是所有用戶都對物品進行評價反饋,相比于龐大的用戶和物品數量,有評分的數據是非常稀疏的,難以找到相似的用戶或是物品,導致相似度計算結果不夠準確,推薦效果也隨之下降。針對上述問題,本文提出一種潛在狄利克雷分布(LDA)的矩陣分解推薦方法,該方法使用 LDA主題模型學習項目潛在特征向量,然后將其融合到矩陣分解模型中,最后產生預測評分進行推薦。

2 相關工作

2.1 矩陣分解

協同過濾推薦算法利用已有的用戶評分生成推薦,然而推薦系統中無論是用戶數量還是物品的數量都是非常龐大,在這種大級別數據量的情況下,依據生成的表征用戶或是物品的特征相量維度非常高,從而導致推薦的時間消耗呈現爆炸時增長,推薦的時效性受到限制。為解決該問題將矩陣分解應用到協同過濾推薦中,利用矩陣分解將評分矩陣拆解兩個低秩矩陣,再利用這兩個矩陣相乘還原評分矩陣,從而補全評分矩陣中不可觀察值[4-5]。具體為:首先利用用戶和物品交互數構建用戶-物品的評分矩陣,假定用戶-物品的評分數據為m個用戶對n個物品進行評分,一般評分為0至5分,0表示用戶為對該物品評分,1–5表示用戶對物品進行評分,并表示對該物品的喜愛程度,通過用戶為行和物品為列構建用戶評分矩陣R=[rij]∈Rmn;其次,在一個k維因子空間中,分別學習用戶和物品的潛在特征矩陣U∈Rmk,U∈Rnk,使得R≈UV,每一個物品j 都得到一個潛在特征向量qj∈Rk,每一個用戶i也得到一個向量pi∈Rk;最后,通過用戶和物品的潛在特征向量線性組合(內積)擬合用戶評分,由式(1)線性組合。

為尋找最優用戶特征U和物品特征V,通過構造并最小化目標函數來優化分解模型,為防止模型過擬,引入正則化參數λ>0,目標函數為:

式中,Rij表示真實評分,表示預測評分。

2.2 LDA主題模型

LDA是一種非監督學習算法[6],包括文檔 -主題和主題 -詞語概率分布。基本思想認為寫一篇文檔時,先選定文檔主題,然后再依據選定的主題生成詞語。假定文檔集 D有M個文檔,一篇文檔包括 N個詞語,文檔集 D包括K個主題,利用θ和 φ分別表示文檔 -主題和主題 -詞語概率分布,則 LDA結構如圖1所示:

圖1 LDA生成模型

圖1中,α是一個K維向量,為θ的先驗分布參數;β為φ的先驗分布參數,α和β服從Dirichlet分布。LDA概率模型生成文檔的過程如下:

第一步:為生成一篇文檔Di,首先在先驗分布α采樣得到生成文檔 -主題分布θi,θi是一個 K維向量,表示主題K與Di之間的分布,θi服從Dirichlet分布,即 θi~Dirichlet(α);

第二步:從主題的多項式分布θi中取樣生成文檔i第n個詞的主題Zi,n;

第三步:從在先驗分布β中采樣Zi,n對應的詞語分布 φk;

第四步:從詞語的多項式分布 φk中取樣生成第 i個文檔的第 n個詞Wi,n,不斷重復第四步生成整個文檔。

基于吉布斯采樣(Gibbs)和基于變分推斷 EM是主題模型學習參數的主要方法。

3 基于LDA主題的矩陣分解推薦算法

在個性化推薦中,矩陣分解模型能夠學習用戶和物品潛在特征,在學習潛在特征中對評分矩陣進行降維,在一定程度上緩解數據稀疏,從而推薦的效果有所提高。然而矩陣分解模型學習潛在特征時僅利用用戶評分數據,未考慮用戶和物品的屬性以及其他大量的其他輔助信息,如用戶性別、職業、年齡、物品名稱和標簽等。基于此本文提出結合 LDA主題模型和矩陣分解的推薦算法,充分利用用戶評分數據和物品的屬性信息提高推薦準確率。首先使用基于線性關系的 LDA主題模型對所有物品的屬性信息進行物品的潛在特性學習,一個物品的所有屬性信息相當于一篇文檔,使用項目在 K個主題上的分布表征物品的潛在特征θ;然后將物品潛在的主題特征作為約束向量融入到矩陣分解過程中。其結構如圖 3所示。

圖2 基于LDA主題的矩陣分解模型結構

圖2中,基于 LDA主題的矩陣分解模型結構分為兩部分,上半部分為 LDA模型,θ為物品的主題分布,通過θ約束物品的隱因子;下半部分為矩陣分解模型,R為評分,u和v分別為用戶特征和物品特征,用u和v的內積擬合用戶評分R。為優化模型,構建最終目標函數為:

4 實驗結果與分析

4.1 實驗評價標準

本文選用平均絕對偏差RMSE和均方根誤差MAE評估模型的性能。將目標用戶u對物品v的真實評分定義為ru,將推薦算法預測的目標用戶u對物品v的評分定義為preuv。RMSE和MAE能夠從不同的統計學角度衡量預測評分和實際評分之間的差距,其計算公式分別為(4)和(5)。

4.2 實驗數據

本文實驗數量采用MovieLen電影網站的數據集MovieLen(1M),該數據集是900多個用戶對1,600多部電影的10萬多條評分,評分范圍1–5,被廣泛用于電影推薦系統。在實驗中,將實驗按照8∶2的比例分為訓練集和測試集。

4.3 結果分析

為了評測不同推薦算法的性能,在本文的實驗中,選用常用的3種推薦算法作為實驗對比。在實驗中,選用不同的物品主題數K進行多次實驗,當LDA的主題數K采用5時,本文的方法的RMSE和MAE達到最小值,此時推薦效果最好,因而在后續的實驗中將LDA主題數K設置為5。表1為本文方法與其他3種方法推薦算的RMSE和MAE值。

表1 本文方法與其他3種方法推薦算的RMSE和MAE值

從表1中可以看出,本文方法的RMSE和MAE分別為0.8762和0.6809,均低于其他3種方法,尤其與基于內容推薦算法相比,RMSE和MAE分別降低了0.1388和0.2256,RMSE和MAE減小顯著。這表明本文提出的方法是有效的,結合LDA和矩陣分解推薦方法可以更加準確獲得項目特征表示,從而提升推薦算法的準確性。

5 結束語

本文提出一種基于LDA主題模型的矩陣分解推薦算法。該方法充分考慮物品屬性信息,通過LDA主題模型學習物品的主題特征向量,并將其應用到矩陣分解推薦中,預測用戶評分從而產生推薦列表,在一定程度上緩解了評分數據稀疏對推薦結果的影響。在MovieLen(1M)上的實驗結果表明,與基于內容推薦、基于用戶協同過濾和PMF方法相比,本文算法的RMSE和MAE值最小,與基于內容推薦算法相比,RMSE和MAE分別降低了0.1388和0.2256,RMSE和MAE減小顯著,表明本文方法的推薦效果最佳。然而本文僅考慮物品的輔助信息,未考慮用戶屬性信息,而且沒有對項目的隱含向量進行優化,這將是下一步研究工作的重點。

猜你喜歡
特征用戶方法
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 婷婷成人综合| 国产一区在线观看无码| 日韩免费无码人妻系列| 青青久在线视频免费观看| 欧美精品二区| 久久五月天国产自| 久久a毛片| 男人的天堂久久精品激情| 亚洲不卡影院| 国产精品爆乳99久久| 欧美亚洲欧美| 国产精品亚洲一区二区三区z| 一区二区三区四区精品视频| 国产成人精品一区二区| 日韩一二三区视频精品| 成人福利在线视频| Jizz国产色系免费| 国产成人精品优优av| 成人一区在线| 97狠狠操| 美女扒开下面流白浆在线试听| 亚洲无码精彩视频在线观看| 女人av社区男人的天堂| 亚洲人成网站色7799在线播放| 亚洲精品国产自在现线最新| 午夜福利在线观看入口| 一级黄色网站在线免费看| 亚洲福利网址| 91在线一9|永久视频在线| 伊人久综合| 国产麻豆精品久久一二三| 91精品网站| 91久久国产成人免费观看| 欧美一区中文字幕| 久久精品无码专区免费| 无码人妻免费| 欧美第九页| 四虎影视库国产精品一区| 精品国产亚洲人成在线| 欧美精品啪啪| 高清无码一本到东京热| 亚洲国产第一区二区香蕉| 精品三级网站| 国产精品久久自在自线观看| 中文字幕天无码久久精品视频免费 | 在线观看网站国产| 亚洲二区视频| 手机精品视频在线观看免费| 美女无遮挡免费视频网站| 色久综合在线| 久久无码高潮喷水| 手机精品视频在线观看免费| 美女被躁出白浆视频播放| 国内精品小视频福利网址| 国产一区二区三区在线观看视频 | 国产精品hd在线播放| 亚洲IV视频免费在线光看| 国产欧美高清| 久热这里只有精品6| 成人国产三级在线播放| 亚洲日本精品一区二区| 成人福利在线观看| 国产精品乱偷免费视频| 国产资源免费观看| 免费福利视频网站| 欧美亚洲一二三区| 亚洲bt欧美bt精品| 欧美成人综合在线| 中文字幕有乳无码| 精品一区二区三区无码视频无码| 国产成人欧美| www欧美在线观看| 欧美高清三区| 一本久道久久综合多人| 亚洲欧美综合另类图片小说区| 欧美成人国产| 欧美a在线看| 国产在线视频欧美亚综合| 一本大道无码高清| 欧洲成人在线观看| 国产在线无码一区二区三区| 57pao国产成视频免费播放|