999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合用戶評分和屬性相似度的協同過濾推薦算法

2017-04-24 10:40:37王三虎王豐錦
計算機應用與軟件 2017年4期
關鍵詞:用戶

王三虎 王豐錦

1(呂梁學院計算機科學與技術系 山西 呂梁 033000)2(同方股份有限公司 北京 100083)

融合用戶評分和屬性相似度的協同過濾推薦算法

王三虎1王豐錦2

1(呂梁學院計算機科學與技術系 山西 呂梁 033000)2(同方股份有限公司 北京 100083)

為了提高協同過濾推薦系統的推薦效率和準確性,更好地向用戶提供個性化的推薦服務,提出一種用戶評分和屬性相似度的推薦算法。首先分析當前協同過濾推薦研究的現狀,設計相似度、興趣傾向相似度、置信度等指標作為評分標準,使得用戶相似度的計算更加準確、有區分度。然后根據用戶屬性來衡量用戶之間的相似度,利用MovieLens數據集和Book-Crossing數據集做對比實驗,對比精度、通用性和不同稀疏度及冷啟動情況下的性能。實驗結果表明,本文算法不僅提高了推薦精度,而且明顯優于其他協同過濾推薦算法,具有更高的實際應用價值。

推薦系統 協同過濾 相似性度量 稀疏性問題

0 引 言

近十年,電子商務得到長足的發展,商戶之間的競爭也逐步需要商戶本身主動去掌握更準確的用戶的需求和偏好,從而有針對性地為客戶提供服務者。因此一種高準確定、高性能的推薦過濾算法顯得十分重要[1]。協同過濾推薦可以充分利用信息間的聯系,執行效率高,可以得到較好的推薦結果,因而成為當前研究的熱點[2]。

針對協同過濾推薦問題,國內外學者和專家進行了大量深入的研究。迄今為止,協同過濾推薦算法眾多[3-6],每一種協同過濾推薦算法的工作思想不同,在實際應用,這些協同過濾推薦算法均存在各自的優勢,同時缺陷也十分明顯:如數據稀疏、冷啟動、可擴展性差等[7-9]。為了解決這些不足,一些學者提出了采用關聯規則數據挖掘、貝葉斯網絡、神經網絡、支持向量機等技術[10-12],以提高推薦系統的推薦精度,獲得了不錯的推薦效果。然而用戶興趣受到多種因素的綜合作用和影響,當前協同過濾推薦算法的相似度值計算不科學,缺乏合理性,忽略了用戶的興趣信息,推薦精度有待進一步提高[13]。

為了提高協同過濾推薦系統的推薦效率和準確性,設計了一種基于用戶評分和屬性相似度相融合的協同過濾推薦算法。利用MovieLens數據集和Book-Crossing數據集做對比實驗,對比精度、通用性和不同稀疏度及冷啟動情況下的性能。

1 經典協同過濾推薦算法

1.1 經典協同過濾推薦算法

經典協同過濾推薦算法工作過程如下:

(1) 建立用戶對項目評價的評分矩陣R={rij}m×n,其中,m、n分別表示用戶數和項目數,rij為用戶i對項目j的評分,其可以描述用戶的判斷和偏好,具體如表1所示。

表1 用戶-項目評分矩陣

(2) 根據評分值得到用戶的相似度值,然后對相似度值進行排序,從中選擇k個近鄰。

(3) 根據k個近鄰對用戶與項目評分值進行估計。設i的“最近鄰居”集為Si,i對項目x的評分值為Pix,那么有:

(1)

1.2 傳統相似度計算方法

傳統相似度計算方法主要有:余弦相似度、相關相似度。

(1) 余弦相似度:用戶評分為一個向量,當用戶不對具體項目進行評分時,那么就認為該評分值等于0,用戶i和j間的相似度sim(i,j)計算公式為:

(2)

其中:rix、rjx分別為用戶i和j對項目x的評分值。

(2)Pearson相似度:Pearson相似度只考慮兩個用戶共同評分的項目集合,去掉全部評分的平均值。兩個用戶i和j的共同評分為Iij(Iij=Ii∩Ij),Pearson相似度計算公式為:

(3)

2 協同過濾推薦算法

經典算法存在相似度值計算不科學,缺乏合理性,忽略了用戶的興趣信息等缺陷,導致推薦誤差大,推薦結果不可靠[14]。為提高推薦精度,挖掘用戶評分中的興趣信息,本文提出了一種新的相似度計算方法。

2.1 用戶評分相似度

用戶評分相似度可以描述兩個用戶對同一項目評分的非線性變化趨勢,為此,引入非線性函數描述用戶評分相似度,那么兩個用戶對同一項目評分的相似度計算公式為:

(4)

2.2 興趣的傾向相似度

每個用戶有自己的評分習慣,對一個具體項目,有的用戶給高分,然而有的用戶卻給低分,這樣用戶的平均評分描述了用戶對某目標的興趣,用戶i和j對同一個項目興趣傾向相似度計算公式為:

(5)

2.3 用戶評分相似度的置信度

當兩個用戶對某一個項目給出相近的分數時,但是也不完全表示兩個用戶是相似的,因為相似度還有一個置信度,為此選擇Jaccard函數度量置信度,具體計算公式為:

(6)

其中,Ii表示用戶i評價的項目集合。綜上所述,相似度最終計算公式為:

sim3(i,j)

(7)

2.4 用戶屬性相似度

經典協同過濾推薦算法僅通過已有用戶相關信息實現推薦,無法對新用戶信息進行精確評價,導致產生冷啟動的概率十分高。在用戶評分數目不多時,通過用戶屬性相似度進行推薦,隨著用戶評分項目的增多,通過用戶評分來進行推薦。為此,引入sigmoid函數將用戶屬性推薦和用戶評分推薦進行融合,實現兩者的平滑過渡。設用戶i的特征向量為Attri=(ai1,ai2,…,ain),n是用戶屬性的個數,如果用戶i和j的第m個屬性相同,simAttr(i,j,m)=1,不然simAttr(i,j,m)=0,這樣用戶i和j屬性的相似度計算公式為:

simAttr(i,j)=∑m∈Attrwm·simAttr(i,j,m)

(8)

其中,wi是第i個屬性的權值。

2.5 用戶屬性相似度與用戶評分相似度融合

用戶屬性相似度與用戶評分相似度融合的計算公式為:

sim(i,j)=α·simAttr(i,j)+β·simscore(i,j)

(9)

(10)

β+α=1

(11)

2.6 本文算法的工作步驟

Step1 收集用戶的屬性維度和對應數據值,同時建立屬性矩陣。

Step2 收集用戶的屬性評分數據及對應的值,同時計算評分的值,建立相似度評分矩陣。

Step3 對兩種矩陣進行分析,綜合兩者可以得到用戶相似度矩陣。

Step4 通過相似度矩陣得到用戶i的K個近鄰,通過式(12)估計未評分項目x的值,并根據結果得到相應的推薦方案。

(12)

其中,NK是與用戶最相似的K個鄰居;rki是用戶k對x的評分。

3 仿真實驗

3.1 數據集

在Intel(R)Corei5-3337U3.0GHzCPU,4GBRAM,WindowsXP操作系統計算機上,采用VisualC++編程進行仿真測試。數據來自公開數據集MovieLens,其描述具體見文獻[11]。

3.2 對比算法及評價標準

為了使本文算法實驗結果更具說服力,選擇文獻[15]、文獻[16]的協同過濾推薦算法進行對比實驗,選擇平均絕對誤差(MAE)作為算法性能優劣的評價標準,其定義如下:

(13)

式中,N為測試集大小,pi為推薦算法的預測評分值,qi為用戶的實際評分值。

3.3 結果與分析

推薦精度比較 最近鄰數為35時,采用推薦算法對問題進行求解,具體結果圖1所示。從圖1可以清楚看出,本文協同過濾推薦算法的MAE值低于對比算法,有效提高了推薦的精度,獲得了比較理想的推薦結果。

圖1 不同算法的推薦精度對比

冷啟動條件下的結果分析 為了模擬冷啟動條件,選擇10個用戶,并刪除其評價信息,結果如圖2所示。對圖2進行詳細分析可知,本文融合用戶評分和屬性相似度的協同過濾推薦算法能解決當前存在的冷啟動情況下推薦算法無法施行的難題,提高了推薦精度,獲得更優的推薦結果。

圖2 冷啟動條件下的算法性能對比

不同稀疏度下的性能對比 不同數據稀疏度的推薦誤差如圖3所示。數據稀疏度與MAE之間是一種近似線性變化關系,但是在同等條件下,與文獻[15]和文獻[16]的對比結果發現本文算法推薦結果的MAE值更小。因此本文算法的推薦精度優于同樣條件下的文獻[15]和文獻[16]的算法。

圖3 稀疏度不同情況下三種算法的性能對比

通用性測試 為了驗證本文融合用戶評分和屬性相似度的協同過濾推薦算法的通用性,選擇Book-Crossing數據集進行仿真測試,有287 558個用戶信息及他們對231 797本電子書的1 491 807評分數據。我們采取[0,10]區間內數據對評價建模采取評分制,1:評價最高,0:評價最低。不同算法的實驗結果如圖4所示。從圖4可知,相對于其他協同過濾推薦算法,本文協同過濾推薦算法的MAE也最小,推薦精度更高,再次證明了本文算法的優越性以及良好的通用性。

圖4 與經典算法的性能對比

4 結 語

過濾推薦系統一直是電子商務研究中的重點和熱點,為了得到高準確度、高性能、通用性和適應性更強的推薦結果,本文設計了一種融合用戶相似度和評分屬性的協同過濾推薦算法。首先收集用戶的屬性維度和對應的值,再收集描述用戶對項目的興趣信息的評分信息,以增強用戶相似度的區分度。然后采用用戶屬性來衡量用戶之間的相似度,最后采用多個數據集進行仿真測試。仿真實驗結果表明,本文方法利用了用戶依靠,能夠大幅度提高推薦質量,推薦可以滿足用戶實際要求,具有一定的實際應用價值。

[1]MichaelJ,AndreasT,RobertL.Combiningpredictionsforaccuraterecommendersystems[C]//Proceedingsofthe16thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining,2010:693-702.

[2]CachedaF,CarneiroV,FernA,etal.Comparisonofcollaborativefilteringalgorithms:Limitationsofcurrenttechniquesandproposalsforscalable,high-performancerecommendersystems[J].ACMTransactionsontheWeb,2011,5(1):2-10.

[3]BellogínA,CastellsP,CantadorI.Self-adjustinghybridrecommendersbasedonsocialnetworkanalysis[C]//Proceedingsofthe34thinternationalACMSIGIRconferenceonResearchanddevelopmentinInformationRetrieval,2011:1147-1148.

[4]HeZ.ThestudyofpersonalizedrecommendationbasedonWebdatamining[C]//IEEE,InternationalConferenceonCommunicationSoftwareandNetworks.IEEE,2011:386-390.

[5]DouGQ,ZhuYS,HanYM.ResearchonselectionsystembasedonBayesianrecommendationmodel[C]//InternationalConferenceonAdvancedMechatronicSystems.IEEE,2011:35-38.

[6]MaiJ,FanY,ShenY.ANeuralNetworks-BasedClusteringCollaborativeFilteringAlgorithminE-CommerceRecommendationSystem[C]//InternationalConferenceonWebInformationSystemsandMining.IEEE,2009:616-619.

[7] 韋素云,業寧,朱健,等.基于項目聚類的全局最近鄰的協同過濾算法[J].計算機科學,2012,39(12):149-152.

[8]ChenZhiMin,JiangYi,ZhaoYao.Acollaborativefilteringrecommendationalgorithmbasedonuserinterestchangeandtrustevaluation[J].InternationalJournalofDigitalContentTechnologyanditsApplications,2010,4(9):106-113.

[9]WangMJ,HanJT.Collaborativefilteringrecommendationbasedonitemratingandcharacteristicinformationprediction[C]//InternationalConferenceonConsumerElectronics,CommunicationsandNetworks.IEEE,2012:214-217.

[10]WuYK,TangZH.CollaborativefilteringsystembasedonclassificationandextendedK-meansalgorithm[J].AdvancesinInformationSciencesandServiceSciences,2011,3(7):187-194.

[11]WuYK,YaoJR,TangZH,etal.CollaborativeFilteringBasedonMulti-levelItemCategorySystem[J].JournalofConvergenceInformationTechnology,2012,7(7):64-71.

[12] 李鵬飛,吳為民.基于混合模型推薦算法的優化[J].計算機科學,2014,41(2),68-71.

[13] 孫金剛,艾麗蓉.基于項目屬性和云填充的協同過濾推薦算法[J].計算機應用,2012,32(3):658-660,668.

[14] 韋素云,業寧,朱健,等.基于項目聚類的全局最近鄰的協同過濾算法[J].計算機科學,2012,39(12):149-152.

[15]QiL,EnhongC,HuiX,etal.EnhancingcollaborativefilteringbyuserinterestexpansionviapersonalizedRanking[J].IEEETransactionsonSystems,Man,andCybernetics,PartB:Cybernetics,2012,42(1):218-233.

[16] 鄒永貴,望靖,劉兆宏,等.基于項目之間相似性的興趣點推薦方法[J].計算機應用研究,2012,29(1):116-118,126.

A COLLABORATIVE FILTERING RECOMMENDATION ALGORITHM BASED ON USER SCORE AND ATTRIBUTE SIMILARITY

Wang Sanhu1Wang Fengjin2

1(DepartmentofComputerScienceandEngineering,LvliangUniversity,Lvliang033000,Shanxi,China)2(TongfangCo.,Ltd,Beijing100083,China)

In order to improve the recommendation efficiency and accuracy of collaborative filtering recommendation system, and to provide personalized recommendation service, a recommendation algorithm based on user score and attribute similarity is proposed. Firstly, the current status of collaborative filtering recommendation research is analyzed, and the similarity, similarity of interest tendency, confidence and other indicators are used as the scoring criteria, which makes the calculation of user similarity more accurate and discriminative. Then the similarity between users is measured according to the attributes of the users. The comparison is made between the MovieLens data set and the Book-Crossing data set, and the accuracy, versatility and performance under different sparsity and cold start conditions are compared. Experimental results show that the proposed algorithm not only improves the recommendation accuracy, but also is superior to other collaborative filtering recommendation algorithms, and has higher practical application value.

Recommendation system Collaborative filtering Similarity measurement Sparsity problem

2016-11-09。山西省教育廳教學改革項目(J2014120,J2015121)。王三虎,副教授,主研領域:數據庫應用技術,算法設計,數據挖掘。王豐錦,高工。

TP3

A

10.3969/j.issn.1000-386x.2017.04.052

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 视频二区国产精品职场同事| 伊人无码视屏| 亚洲国产AV无码综合原创| 人妻无码中文字幕一区二区三区| 久久国产精品无码hdav| 婷婷激情亚洲| 精品久久久无码专区中文字幕| 伊伊人成亚洲综合人网7777| 五月天综合婷婷| 亚洲天堂网在线视频| 国产成人乱码一区二区三区在线| h视频在线观看网站| 欧美亚洲第一页| 国产成人8x视频一区二区| 国产男女免费视频| 激情成人综合网| 国内毛片视频| 欧美五月婷婷| av一区二区三区在线观看| 永久天堂网Av| 四虎影视无码永久免费观看| 无码内射中文字幕岛国片| 久久这里只精品热免费99| 久久国产亚洲偷自| 亚洲国产综合自在线另类| 青青热久免费精品视频6| 久久香蕉国产线看精品| 亚洲小视频网站| 在线色国产| 91福利在线看| 久久久久亚洲精品成人网 | 亚洲人妖在线| 国产美女主播一级成人毛片| 国产91特黄特色A级毛片| 狠狠色狠狠综合久久| 欧美一级专区免费大片| 亚洲欧美人成电影在线观看| 中美日韩在线网免费毛片视频| 69av免费视频| 青青草原国产av福利网站| 亚洲AⅤ波多系列中文字幕| 中字无码精油按摩中出视频| 99re热精品视频中文字幕不卡| 四虎影视库国产精品一区| 精品国产亚洲人成在线| 国产在线观看一区精品| 亚洲中字无码AV电影在线观看| 新SSS无码手机在线观看| 91精品国产麻豆国产自产在线| 99er这里只有精品| 色噜噜狠狠色综合网图区| 亚洲综合片| 小13箩利洗澡无码视频免费网站| 色哟哟国产精品| 国产美女免费网站| 亚洲AV无码久久精品色欲 | 天堂中文在线资源| 亚洲a免费| 蜜桃臀无码内射一区二区三区| 中文无码日韩精品| 国产玖玖玖精品视频| 国产麻豆福利av在线播放| 日韩视频免费| 日韩在线欧美在线| 亚洲天堂首页| 亚洲狼网站狼狼鲁亚洲下载| 就去色综合| 最新精品久久精品| swag国产精品| 99久久精品国产自免费| 91网址在线播放| 欧美日韩资源| 潮喷在线无码白浆| 国产精品尤物在线| 91麻豆精品国产91久久久久| 国产成a人片在线播放| a级毛片毛片免费观看久潮| 国产黄网站在线观看| 99精品一区二区免费视频| 午夜少妇精品视频小电影| 欧美色综合网站| 91成人在线观看|