999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合用戶偏好和信任關系的混合群組餐廳推薦

2021-11-16 01:43:52史艷翠齊嘉琳
天津科技大學學報 2021年5期
關鍵詞:融合用戶

史艷翠,齊嘉琳

(天津科技大學人工智能學院,天津 300457)

隨著推薦系統技術的不斷發展,現已廣泛應用于各種領域,如在電子商務領域中可根據用戶的購物記錄為用戶推薦可能需要的物品,在新聞推薦領域中根據用戶經常瀏覽的內容為其推薦相似新聞等.現如今,生活質量的不斷提高使得人們在飲食方面也有著更高的要求,這給餐飲業的發展提供了良好的條件.常用的餐廳點評網站有大眾點評、Yelp、Foursquare等.面對海量的用戶和餐廳信息,傳統個性化推薦存在著計算量大等問題,為了降低計算時間和提高效率,常使用群組推薦技術.

在推薦算法中,無論是個性化推薦還是群組推薦,使用原始的用戶–評分矩陣進行計算的情況占多數.任志波等[1]在進行個性化推薦時,對評分信任和社交信任賦予自適應權重,提高了推薦的效果.徐芳[2]提出一種新穎的雙自編碼器矩陣分解模型,利用評分矩陣和用戶項目評論信息提高推薦準確率.這些算法中使用的矩陣均為原始的評分矩陣,雖能夠提高算法的準確率,但仍存在數據稀疏的問題.

隨著社交網絡的出現和發展,研究者們將社會化關系引入到推薦系統中.Capuano等[3]提出根據組內用戶的社會化關系和社交網絡估算等相關信息計算群組內各個用戶之間的影響力,形成影響力網絡,并基于這種網絡和現有的評估偏好的方法預測用戶的偏好,模擬了用戶的偏好是否受到其所處的社會化關系網絡.鄧志彬等[4]提出了一種融合社會網絡用戶相似度的社會推薦算法SRSUS,利用社會關系計算用戶的社會信任度,并通過實驗表明該算法總體上優于其他社交推薦算法.有的學者將用戶間的信任關系引入到用戶偏好獲取模型中,以獲得更準確的用戶偏好.劉輝等[5]提出一種融合用戶相似度、地理位置和信任關系的混合推薦算法,在信任關系方面根據社會地位的計算方法重構信任度,提高推薦的準確性.李衛疆等[6]提出一種融合項目流行度和用戶信任關系的矩陣分解推薦算法,通過矩陣分解同時傳遞信任和推薦項目,使覆蓋率得到了提升.上述推薦算法考慮了用戶間的信任關系,但在計算用戶間的信任度時只考慮了單一因素的影響,沒有從多角度考慮其他因素對用戶信任度的影響.

在進行偏好融合時,胡川等[7]分析了推薦模型和模型融合的群組偏好融合方法后,提出增強的群組偏好融合方法,提高了推薦的準確性與多樣性.吳云昌等[8]介紹了幾種不同的融合策略,并比較了它們的優缺點,得出策略的選擇由不同的應用場景而定的結論.在偏好融合方法的選擇上,每一種融合策略都有其各自的優缺點,在一些組推薦系統的典型應用中,偏好融合策略一般是根據實際情況得出的.

通過分析發現,現有的研究工作大多集中于個性化推薦,對群組推薦的研究偏少,在計算用戶關系時,忽略了影響信任度的因素,且存在數據稀疏的問題.因此,為了解決上述問題,更好地實現群組偏好融合,本文提出一種融合用戶偏好和信任關系的混合群組餐廳推薦算法,通過計算用戶對不同餐廳類別的偏好,得到用戶–餐廳類別偏好矩陣,代替原始的用戶–餐廳評分矩陣,降低數據的稀疏性;從公平性、準確性、影響力三方面考慮用戶的信任度,提高準確性;融合群組偏好時,采用改進比重融合策略.

1 用戶偏好獲取

獲取用戶偏好的方法主要有兩種,顯示獲取和隱式獲取.前者使用用戶對項目的評分作為依據,后者需要通過分析用戶的行為特征得到用戶的偏好.通過計算用戶對不同餐廳類別的偏好程度,代替原始的用戶-餐廳評分矩陣,能更直觀地了解用戶的口味和偏好,并緩解數據的稀疏性問題.

原始的用戶-餐廳評分矩陣可以用m×n階矩陣表示為Qm,n.為了更清晰地描述用戶對餐廳的偏好程度,引用用戶偏好模型,用戶u對某一餐廳類別Si的偏好可以通過式(1)進行計算.其中:pref(u,Si)為用戶u對餐廳類別Si的偏好評分;N(u,Si)為用戶u去過餐廳類別Si的次數;|Nu|為用戶u去過的所有餐廳的次數.

計算出用戶對每個去過的餐廳類型的偏好后,將得到的值代替原先的用戶-餐廳評分矩陣,得到一個全新的用戶-餐廳偏好矩陣.但該矩陣中元素的值僅代表用戶對該餐廳所屬類別的偏好值,并不能代表用戶對該餐廳的實際評分.得到的新矩陣用Rm,s表示.

在新矩陣中,S表示餐廳類別的數量,在原始矩陣中,n表示所有的餐廳.比較可知,S遠小于n,這就大大降低了數據的稀疏性.

2 用戶信任度計算

用戶選擇餐廳就餐時,不僅會受到朋友等社會關系的影響,用戶間的信任關系也是影響用戶選擇餐廳的重要因素.如果僅根據用戶間的偏好的相似度進行群組劃分,可能會導致推薦結果不準確.在實際情況下,用戶對餐廳的選擇會因為對不同用戶的信任程度的差別而有所不同,所以用戶對其鄰居用戶的信任程度也是影響推薦質量的重要因素.

在傳統的推薦算法中,對用戶評分的相似度關注較多,但前提是鄰居用戶的評分數據都是真實且可靠的,在實際生活中,這個前提很難得到保證.例如某些不良的經營者為獲取利潤,采取一些不正當的手段偽造評價提高自己產品的好評率.如果使用這些數據進行預測評分或推薦餐廳,會嚴重影響推薦結果.因此,使用用戶間的信任度增加推薦的可靠性.本文主要從用戶的公平性、準確性和影響力對信任度進行衡量.

2.1 公平性

每個用戶都有不同的打分習慣,這種習慣的差異性會直接影響到餐廳的整體評分,從而導致推薦質量下降.因此,利用公平性這一指標歸一化用戶的評分.如果該用戶的所有評分項目的差異較小,則說明該用戶的評分較為單一,對所有去過的餐廳,無論口味是否滿意,評分都沒有太大變化,這種情況下,該類用戶的評分不具有參考性;相反,如果該用戶對餐廳的評分的差異較大,則很有可能說明該用戶是按照餐廳的實際情況進行評分的.這些用戶的評分對于未去過該餐廳的用戶來說,參考價值較高.若用戶u的評分公平性記為F(u),則可通過式(2)進行計算.

其中:Eu為用戶u對所有評分的餐廳類別的集合,|Eu|為集合的大小;Ru,i為用戶u對該集合Eu中某類餐廳i的偏好評分;Ru為用戶u對集合Eu中所有類別餐廳評分偏好的平均值.

2.2 準確性

該性能用來衡量用戶對某餐廳評分的準確程度,如果用戶對某類餐廳的偏好評分與該餐廳的平均評分越接近,說明該用戶的評分越準確,該用戶的信任度會提高.將用戶評分的準確性記為C(u),通過式(3)進行計算.

其中Ri為所有用戶對某類餐廳i的評分的平均值,即某類餐廳i的平均偏好評分.

2.3 影響力

考慮到在實際生活中,有的用戶較為主動積極,愿意對就餐的餐廳發表意見和感受,而有的用戶很少或幾乎不愿意對所就餐的餐廳進行評價,這些用戶的人氣值往往很低,并且會逐漸失去其他用戶的信任.因此,可以認為評價數量較多的用戶影響力高于評價數量少的用戶影響力.將用戶的影響力記為I(u),通過式(4)進行計算.

由于Eu為用戶u對所有評分的餐廳類別集合,在計算影響力時,如果只考慮餐廳類別不考慮其他因素,是不合理的.比如用戶A熱衷于火鍋,去了500次火鍋類的餐廳,用戶B去了5種不同類別的餐廳各1次,如果按照式(4)計算,則用戶B的影響力大于用戶A的影響力.但顯然,用戶A要比用戶B更具影響力.因此,在計算用戶影響力時還需考慮用戶對不同類別餐廳的偏好程度,改進后的用戶影響力按式(5)計算.

綜合考慮用戶去過的餐廳類別數量和用戶對不同類別餐廳的偏好程度可知,這兩者的乘積越大,說明該用戶的影響力越大,被信任的程度越高;反之,影響力越小,用戶越不被信任.

在整個推薦的過程中,用戶評分越公平、準確,并且影響力高,則該用戶越值得信任,用戶的最終信任度T(u)可以由上述3個指標表示,計算公式見式(6).

其中λ為權重值,且λ1+λ2+λ3=1.

3 用戶相似度計算

3.1 Pearson相似度

相似度計算的準確性是影響推薦質量的重要因素.使用較多的相似度計算方法包括歐式距離相似度、Jaccard相似度、余弦相似度、Pearson相似度等.其中Pearson相似度計算方法見式(7).

其中:Ru,i為用戶u對餐廳類別i的評分;為用戶u對所去餐廳的平均評分;Iuv為用戶u和用戶v共同評分過的餐廳類別的交集;sim(u,v)為求得的用戶u與用戶v之間的相似度.

3.2 時間懲罰函數

在計算用戶相似度時,考慮到用戶對相同餐廳類別的簽到時間間隔可能會影響用戶間的相似度,因此設計一種時間懲罰函數模擬這種情況.在相似度計算方法中引入了用戶評分間隔時間,用戶評分時間間隔越久,其對相似度計算結果的影響就越大,因此受到的時間懲罰就應該越大.懲罰機制通過時間懲罰函數式(8)實現.

在計算用戶間的相似度時,用戶對餐廳類別的偏好度將代替原始的用戶對餐廳的評分,同時考慮了時間、兩位用戶共同評分過的餐廳所屬類別的相似度對用戶相似度的影響,改進后的用戶相似度計算公式見式(9).

其中:sim(u,v)為求得的用戶u與用戶v之間的相似度;K(u)和K(v)分別為用戶u和用戶v評分過的餐廳所屬的類別.

為了同時考慮用戶信任關系與相似關系,提高用戶偏好預測及推薦的整體性能,通過調整用戶的信任度和相似度的參數,控制這兩種關系在用戶的相關度評分score(u,v)中所占的比重,計算公式見式(10),其中θ為控制相似度的權重值.

4 算法分析

4.1 用戶聚類

通過計算n個用戶之間的相似度,得到用戶相似度矩陣.通過K-means算法對用戶進行聚類,步驟如下:

(1)在同城的n個用戶中,隨機抽取k個用戶的相關數據作為初始的聚類中心 Sλ= {s1,s2,…,sk}.

(2)計算其他用戶與這k個初始中心點的距離di,j,根據距離決定用戶所屬的初始聚類中心簇.

(3)初次距離計算完成后,得到初始用戶聚類群,計算每個群內距離的均值點,并把新計算的均值點與上一次聚類的均值點作差.如果差值量在允許范圍內則聚類結束,得到群組的劃分;否則,當前均值點將作為新中心簇重復第二步與第三步.

4.2 偏好融合策略

通過比較均值融合、痛苦避免均值、最開心和最小痛苦策略發現,這些偏好融合策略有各自的缺點.如均值策略選擇評分均值作為群組評分,會引起群組中有較高評分用戶的不滿;痛苦避免均值策略通過設置痛苦閾值過濾一部分評分,但閾值的選擇會影響結果;最開心策略和最小痛苦策略分別建立在群組成員最樂觀和最悲觀的情況下,且用戶滿意度較低.

通過占比的不同,使用不同的偏好融合策略.首先,設置一個偏好評分閥值ε,將群組中偏好評分大于ε的成員為高評分組,小于ε的為低評分組.統計群組g中餐廳類別i的偏好評分情況,根據餐廳類別i中高評分所占比重的不同,使用式(11)中不同的計算式作為群組g對某類餐廳i的偏好評分.

其中:rg,i為群組g對餐廳類別i的偏好評分,hi為餐廳類別i中偏好評分大于ε的高評分組成員,li為餐廳類別i中偏好評分小于ε的低評分組成員,gi為群組g中去過餐廳類別i的成員.這種融合策略通過分組和所占比重的不同,能夠較好地避免均值策略等其他策略中存在的不足,從而進行更好的偏好融合,提高推薦的準確率.

4.3 相似群組推薦

使用Pearson相似度公式(式(12))計算兩兩群組間的相似度.

其中:rg,i為群組g對餐廳類別i的偏好評分,為群組g對所有餐廳類別的平均偏好評分,Iuv代表用戶u和用戶v共同評分過的餐廳類別的交集.

找到每個群組的相似度最高的群組g’,群組g對餐廳類別i的預測評分可用式(13)表示.

5 實驗結果及分析

5.1 數據集

實驗部分使用的數據集是大眾點評數據集,包括用戶信息和商家的屬性信息.用戶信息包括用戶的ID、對餐廳的評分、評論時間等信息,商家的屬性信息包括商家的ID、餐廳名稱、位置(城市、經緯度等)、餐館的種類以及標簽等信息.數據集包含13218個用戶對170類餐廳的評分.實驗采取隨機劃分的方式將數據集中80%的數據作為訓練集,20%的數據作為測試集.

5.2 評價指標

準確度在目前群組推薦算法中使用頻繁,但由于群組推薦與傳統推薦在推薦對象上有所不同,所以需改進原始的準確度公式以適應滿足群組推薦的要求.在餐廳群組推薦中,使用均方根誤差(RMSE)進行衡量.

5.3 實驗及分析

5.3.1 K-means聚類的K值對SSE的影響

聚類中聚類數目(K)對誤差平方和(SSE)的影響如圖1所示.群組劃分的數量會影響最終推薦的效果,圖1中SSE的值隨著K的增加而下降,在K為25時,SSE的降幅逐漸趨于平穩,聚合效果達到最佳. 因此,后續實驗中將K設置為25.5.3.2 用戶信任度影響因素對RMSE的影響

圖1 聚類中K值對SSE的影響Fig. 1 Influence of K value on SSE in clustering

該實驗分別單獨考慮了用戶的公平性(λ1)、準確性(λ2)和影響力(λ3)因素,并與綜合考慮這3個因素得到的實驗結果進行對比(圖2).

從圖2中可以得出,單獨考慮用戶的公平性、準確性或影響力得到的實驗結果較差,綜合考慮用戶信任度的3個影響因素可以得到更優的實驗結果.這也驗證了前面提到的從多方面考慮用戶信任度的影響因素比傳統的單方面考慮用戶信任度的推薦方法結果更好.綜合考慮的最優實驗結果的λ值分別為λ1=0.4,λ2=0.4,λ3=0.2.

圖2 用戶信任度影響因素的RMSE比較Fig. 2 Comparison of RMSE values of influencing factors of user trust

5.3.3 用戶相關度中的參數θ對RMSE的影響

用戶相關度中的參數θ對RMSE的影響如圖3所示.當θ=0.6,即相似度權重為0.6時,信任度權重為0.4時,RMSE取得最小值,此時推薦結果最準確.這從側面說明在該數據集中,用戶間的相似度對推薦結果有決定性作用.

圖3 用戶相關度中的參數對RMSE的影響Fig. 3 Influence of parameters in user relevance on recommendation results

5.3.4 不同融合策略的比較

不同融合策略的RMSE比較如圖4所示.

圖4 不同融合策略的RMSE比較Fig. 4 Comparison of RMSE values of different fusion strategies

從圖4可以看出,4種融合策略的RMSE的值隨著聚類數目的增加而降低,在相同的聚類數目下,本文提出的改進比重融合策略得到的RMSE值低于其他3種常見的融合策略,并在聚類數目為25時取得最佳RMSE值,推薦結果達到最優.

5.3.5 不同推薦算法的比較

為了驗證本文提出的融合用戶偏好和信任關系的混合群組推薦算法(UPTGRR),實驗選取文獻[9]中提出的融合傳統信任關系的協同過濾算法(TUBCF)、傳統協同過濾算法(UBCF)、基于Kmeans聚類的協同過濾推薦算法(K-UBCF),以及文獻[10]提出的結合用戶特性和群組興趣變化的組推薦算法(GRAUG),比較不同算法的RMSE,結果如圖5所示.

圖5 不同算法的RMSE值比較Fig. 5 Comparison of RMSE values of different algorithms

從圖5中可以看出,這幾種算法隨著聚類數目的增加RMSE的值逐漸減小,并在聚類數目達到25時趨于穩定.與其他算法相比,本文提出的融合用戶偏好和信任關系的混合群組推薦算法在RMSE值上更小,說明該算法可以提高推薦準確性,產生更好的實驗結果.

6 結 語

本文研究了用戶對餐廳類別偏好度和用戶間信任關系的影響因素,提出了融合用戶偏好和信任關系的混合群組餐廳推薦算法.將用戶對不同餐廳類別的偏好評分代替原始的用戶對餐廳的評分,降低了數據的稀疏性;在計算用戶信任度時,從公平性、準確性和影響力方面考慮其對用戶信任度的影響;計算用戶間相似度時,考慮了時間以及用戶共同評分過的餐廳所屬類別的相似度的影響;對同城的用戶進行聚類后,使用改進的比重偏好融合策略預測群組偏好,改善了群組推薦的性能.下一步的研究工作是挖掘用戶更多的信息獲取用戶偏好,提高推薦的準確度.

猜你喜歡
融合用戶
一次函數“四融合”
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
從創新出發,與高考數列相遇、融合
寬窄融合便攜箱IPFS500
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 自拍中文字幕| 国产视频只有无码精品| 国产第四页| 亚洲三级视频在线观看| 91视频青青草| 亚洲视屏在线观看| 九九线精品视频在线观看| 国内精品小视频福利网址| 久久99热这里只有精品免费看| 成人va亚洲va欧美天堂| 日本草草视频在线观看| 亚洲日韩第九十九页| 亚洲精品天堂自在久久77| 国产99热| 日本不卡在线播放| 99在线观看免费视频| 欧美日韩一区二区在线免费观看| 国产男人的天堂| 免费在线不卡视频| 欧美日韩高清在线| 91网红精品在线观看| 日韩二区三区无| 在线看AV天堂| 精品福利视频导航| 欧美人在线一区二区三区| 欧美成人日韩| 欧美 国产 人人视频| 日本三级黄在线观看| 国产精品私拍99pans大尺度| 99久久精品国产精品亚洲| 国产伦精品一区二区三区视频优播| 精品国产成人三级在线观看| 亚洲天堂.com| 欧美性猛交一区二区三区| 亚洲视频四区| av在线5g无码天天| 拍国产真实乱人偷精品| 亚洲天堂视频网站| 又爽又大又黄a级毛片在线视频 | 99久久亚洲综合精品TS| 久久久久久高潮白浆| 久久无码av三级| 韩国福利一区| 精品无码一区二区三区在线视频| 在线日韩一区二区| 国产一区二区精品福利| 亚洲欧美日韩高清综合678| 免费在线不卡视频| 91福利国产成人精品导航| 91口爆吞精国产对白第三集| 国产国语一级毛片在线视频| 白浆视频在线观看| 日本午夜在线视频| 老色鬼久久亚洲AV综合| h视频在线观看网站| 激情无码视频在线看| 欧美成人精品一区二区| 精品人妻AV区| 亚洲成人网在线观看| 国产极品粉嫩小泬免费看| 天天干伊人| 午夜高清国产拍精品| 欧美亚洲国产视频| 女人爽到高潮免费视频大全| 手机精品视频在线观看免费| 午夜国产大片免费观看| 欧美综合区自拍亚洲综合绿色| 日本成人一区| 亚洲天堂网在线播放| 一区二区三区四区在线| A级毛片高清免费视频就| 国产精品妖精视频| 成人永久免费A∨一级在线播放| 国产精品播放| 亚洲欧洲日韩综合色天使| 国产精品播放| 亚洲综合精品第一页| 亚洲AV永久无码精品古装片| 久久性视频| 91视频区| 熟妇丰满人妻| 亚洲视频无码|