999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶興趣和項目分類的協同過濾推薦算法

2018-11-22 12:02:50叢洪杰李華昱帥訓波
計算機技術與發展 2018年11期
關鍵詞:用戶

叢洪杰,龔 安,李華昱,帥訓波

(1.中國石油大學(華東) 計算機與通信工程學院,山東 青島 266580; 2.中國石油勘探開發研究院 計算機應用技術研究所,北京 100083)

0 引 言

互聯網和移動互聯網的蓬勃發展,帶來了信息快速增長,在海量數據中獲取對自己有價值的信息更加困難,個性化推薦算法成為解決這一問題最有效的技術之一[1]。在個性化推薦算法中,協同過濾推薦在工業界和學術界都取得了很大的成功[2]。

隨著大數據時代的來臨,協同過濾的弊端也越發突出,包括數據稀疏性、冷啟動、可擴展性差、小規模數據離線處理算法無法應用到大規模數據處理等[3]。針對這些問題,學者們提出了許多解決辦法。鄧愛林等[4]為減小數據稀疏性帶來的推薦精度低的問題,提出了一種基于項目評分預測填充空缺值的方法,然后采用一種新穎的相似性度量獲得目標用戶更加準確的最近鄰居,使得推薦質量有所提升。Melville P等[5]在緩解評分數據的稀疏性方面,則采用基于內容的方法預填充用戶評分矩陣中的未評分項,從而提高推薦精度。

韋素云等[6]考慮了項目類別和興趣度等因素,提出一種改進的協同過濾推薦算法。該算法首先計算項目之間的類別距,然后結合項目類別信息,考慮不同項目之間的相關程度,構造出項目類別相似性矩陣,衡量項目間相似性的標準采用改進的條件概率的方法。孟祥武等[7]提出大數據時代的推薦系統,充分利用豐富的用戶反饋、社會化網絡等信息進一步提高推薦系統的性能和用戶滿意度。國琳等[8]提出通過構建和分析用戶興趣分布曲線以發現興趣領域專家,并甄別狀態不正常的偽專家。

王立才等[9]提出上下文感知的推薦系統,利用上下文信息,改善推薦系統的推薦精確度和用戶滿意度,從面向過程的角度論述了上下文感知推薦系統的研究進展和難點。劉平峰等[10]提出用戶興趣圖譜,建立興趣領域本體,集成興趣圖譜的動態性,實現用戶興趣匹配與定位,進而提高推薦系統的精度。Pessemier T D等[11]提出個性化的混合推薦模型,該模型更多考慮了用戶的偏好、約束限制和用戶反饋等因素,使得推薦個人旅行線路更加符合用戶興趣。Oh J等[12]提出一種個性化流行趨勢匹配算法,計算目標用戶的個性化趨勢,匹配用戶興趣偏好,提升預測評分,產生更加精準的推薦列表。

以上所述研究雖然對推薦算法做出了改進,并且取得了不錯的效果,但對于項目類別和用戶興趣沒有加以充分挖掘利用。對此,文中算法引入用戶興趣分布預測填充評分矩陣空缺值,緩解數據稀疏性,改進相似性度量方法計算項目相似性,以減小預測評分的誤差。

1 項目分類

1.1 評分矩陣

基于項目的協同過濾算法中,計算項目的相似性是關鍵步驟。項目類別數據和用戶評分數據為文中推薦算法的基礎數據,由此可構建項目類別分布矩陣、用戶興趣分布矩陣和用戶評分矩陣。

(1)項目類別分布矩陣。

項目類別分布矩陣由n×k的矩陣C(n,k)表示,如表1所示,其中n為項目的個數,k為項目類別的個數。

(2)用戶興趣分布矩陣。

用戶興趣分布矩陣由m×k矩陣D(m,k)表示,見表2,其中m為用戶的數目,k為用戶興趣種類數。

表1 項目類別分布矩陣C(n,k)

表2 用戶興趣分布矩陣D(m,k)

(3)用戶評分矩陣。

用戶評分矩陣由m×n的矩陣R(m,n)表示,見表3,其中用戶數目用m表示,項目數目用n表示,Ri,j表示用戶i對項目j的評分。

表3 用戶評分矩陣R(m,n)

1.2 相似性度量方法

傳統的基于鄰域的協同過濾算法,度量用戶或項目間的相似性是關鍵的一步。以下是計算項目之間相似性主要采用的三種方法:

(1)余弦相似性(cosine similarity):把項目看作m維用戶的空間向量。設向量i和向量j分別代表用戶對項目i和項目j的評分,則項目i和項目j之間的相似性sim(i,j)定義如下:

(1)

其中,Ru,i、Ru,j分別為用戶u對項目i和項目j的評分;U表示用戶對項目i和項目j都有評分的用戶集合。

(2)皮爾森系數(Pearson correlation)。

(2)

(3)修正余弦相似性(adjusted cosine similarity)。

(3)

2 基于項目分類的修正余弦相似性

用戶規模和項目數目的增加,使得評分矩陣的數據稀疏性逐漸增加,從而導致預測評分精度低。目前解決辦法就是對用戶未評分項進行預填充,固定缺省值是最簡單且常用的方法之一,該方法可以有效地提高系統的推薦精度。但實際生活中評分矩陣中的缺省值顯然不可能都一樣,因此填充固定缺省值的方法沒有從根本上解決數據稀疏性問題。文中以用戶興趣分布評分矩陣求相似用戶,對空缺值進行預測填充,減小用戶評分數據的稀疏性。

傳統的修正余弦相似性的度量方法是對用戶的評分去中心化,通過減去用戶的平均評分,改善了用戶評分尺度不同的問題。評分尺度問題主要由用戶評分的標準不同而導致,比如評分區間為1~5分時,用戶對于項目評分A可能是3分以上喜歡,而B則4分以上才為喜歡。但是上述方法僅僅考慮了用戶評分尺度問題,對于項目的類別用戶的評分標準也是有所不同的,比如用戶對動作類或科幻類的電影更加偏好,那么用戶會普遍給這一類別的電影更高的評分。文中提出對項目進行分類,計算用戶在項目的每種類別中的評分標準,以此來改進計算項目相似性的過程,以尋找更加準確的K近鄰。

2.1 用戶興趣分布填充空缺值

基于項目的協同過濾,主要由計算項目的相似鄰居,預測目標用戶對項目的評分和生成推薦列表等過程組成,其中計算項目的相似鄰居需要用戶對項目i、j同時具有評分。求用戶對項目i和對項目j分別有評分的并集公式表示為:

U=Ui∪Uj

(4)

其中,U表示所有用戶的集合;Ui和Uj分別表示對項目i和項目j有過評分的用戶集合。

對用戶集合中分別對項目i、j未評分的項進行填充預測評分,定義P{pu,i,pu,j,…}。

預測填充策略,本階段采用用戶興趣分布矩陣作為求最近鄰居的輸入數據,通過基于用戶的協同過濾算法進行預測評分。

(5)

其中,Pu,i為預測評分;simD(u,v)為用戶u和用戶v通過用戶興趣分布矩陣求得的相似度;rv,i為相似用戶對項目i的評分。

2.2 項目分類修正余弦相似性

sim(i,j)=

(6)

(7)

2.3 算法描述

輸入:用戶的項目評分矩陣R,項目類別信息,項目集合Items,目標用戶集合U,項目鄰居數目K,推薦列表長度N

輸出:目標用戶u對項目的預測評分,且生成目標用戶u的推薦列表

(1)根據數據集中項目分類信息構建項目類別分布矩陣C(n,k);

(2)根據項目分類信息和用戶項目評分矩陣R,計算用戶興趣分布矩陣D(m,k);

(4)求用戶對項目i和項目j分別有評分的用戶的并集;

(5)對并集中用戶對項目i或項目j未評分項,采用用戶興趣分布的協同過濾算法進行預填充值;

(6)構建用戶項目評分矩陣,求得項目i和項目j有著共同評分的用戶集U;

(7)利用基于項目分類的修正余弦相似性來計算項目之間的相似度,生成相似度最大的k個項目鄰居;

(8)通過求得的相似鄰居和相似度值來預測目標用戶對項目的評分;

(9)通過對預測評分的排序,推薦top N項目給目標用戶。

3 實驗結果與分析

3.1 實驗數據集

3.2 評價指標

實驗采用平均絕對誤差(mean absolute error,MAE)來評價算法的推薦精度[13]。假定目標用戶的預測評分集為P{p1,p2,…,pn},與其對應測試集中的真實評分集為Q{q1,q2,…,qn},則MAE表示為:

(8)

3.3 實驗方案

首先對數據進行預處理,構建用戶的興趣分布數據以及項目分類數據,然后使用Java編程語言對推薦算法進行實現,分別對傳統的余弦相似性、修正余弦、改進的修正余弦進行實現,對目標用戶和電影進行預測評分,評估推薦精度;最后對比文中算法與其他兩種算法的推薦精度。

3.4 實驗結果分析

為了驗證算法的有效性,在使用相同數據集規模及驗證方法上,對傳統協同過濾算法中使用的余弦相似性、修正余弦相似性的相似性度量方法與文中提出的改進修正余弦相似性進行實驗對比。最近鄰居的規模從10到100遞增,實驗結果如圖1所示。

圖1 推薦算法的MAE值比對

從圖1可以看出,文中提出的方法隨著最近鄰居的增加MAE值逐漸減小,且低于傳統協同過濾方法。因為文中方法考慮了項目的類別以及對于用戶興趣分布的因素,在此基礎上計算的用戶的最近鄰居相似度更加符合現實,更加準確,而通過更加準確的最近鄰居用戶群體,可以獲得更加符合目標用戶的預測評分。所以該算法可以有效提升推薦質量,為用戶提供滿意的個性化推薦列表。

4 結束語

針對協同過濾算法所面臨的數據稀疏性、推薦精度低等[14]問題,采用了基于用戶興趣分布方法初步填充評分矩陣中的未評分項;在計算項目相似性階段,提出一種基于項目分類改進修正余弦相似性度量方法,即由用戶平均評分去中心化的方法改為對用戶興趣類別平均分去中心化,求出最近鄰居并生成推薦列表。實驗結果表明,該方法具有較小的MAE,在一定程度上提高了推薦質量。

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 伊人国产无码高清视频| 国产区91| 国产成人精品免费视频大全五级 | 波多野结衣第一页| 性喷潮久久久久久久久| 午夜无码一区二区三区| 亚洲第一页在线观看| 亚洲综合亚洲国产尤物| 2020国产免费久久精品99| 怡红院美国分院一区二区| 99国产精品国产| 97视频在线精品国自产拍| 亚洲综合二区| 青青国产成人免费精品视频| AV天堂资源福利在线观看| 久久久精品国产SM调教网站| 5388国产亚洲欧美在线观看| 日本不卡在线| 久草视频中文| 精品少妇人妻一区二区| 男女性色大片免费网站| 五月天综合婷婷| 成人国产精品2021| 伊人网址在线| yjizz国产在线视频网| 亚洲最猛黑人xxxx黑人猛交| 精品国产福利在线| 综合人妻久久一区二区精品 | 色偷偷一区二区三区| 久久精品国产免费观看频道| 综合久久久久久久综合网| 国产精品男人的天堂| 波多野结衣第一页| 国产精品久久精品| 91年精品国产福利线观看久久| 中文无码影院| 中文字幕66页| 99久久精品免费看国产免费软件| 亚洲日韩精品综合在线一区二区| 香蕉eeww99国产在线观看| 天天激情综合| 性喷潮久久久久久久久| 久久先锋资源| 伊人天堂网| 国产精品白浆在线播放| 免费在线观看av| 重口调教一区二区视频| 免费国产无遮挡又黄又爽| 91亚洲精选| 狠狠色综合久久狠狠色综合| 少妇高潮惨叫久久久久久| 午夜精品久久久久久久99热下载| 最新亚洲人成无码网站欣赏网 | 综合人妻久久一区二区精品| 亚洲欧美日韩成人高清在线一区| 国产va欧美va在线观看| 国产白浆一区二区三区视频在线| 孕妇高潮太爽了在线观看免费| 三上悠亚在线精品二区| 国产成人你懂的在线观看| 99在线小视频| 欧美日韩成人在线观看| 国产乱子伦手机在线| 美臀人妻中出中文字幕在线| 在线亚洲小视频| 午夜国产在线观看| 国产一区免费在线观看| 国产00高中生在线播放| 亚洲精品爱草草视频在线| 亚洲精品第一页不卡| 国产精品原创不卡在线| 国产91在线|日本| 亚洲an第二区国产精品| 国产精品999在线| 久久国产高潮流白浆免费观看| 国产精品尹人在线观看| 亚洲国产成人久久精品软件| 五月天福利视频| 精品無碼一區在線觀看 | 国产永久免费视频m3u8| 欧美成在线视频| 国产成人亚洲无吗淙合青草|