999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合概率矩陣分解與ER規則的群組推薦方法

2023-03-13 10:05:20王永貴
計算機工程與應用 2023年5期
關鍵詞:融合用戶實驗

王永貴,張 鑒

遼寧工程技術大學 電子與信息工程學院,遼寧 葫蘆島 125105

推薦系統是一種優秀的信息過濾器,它能夠迅速而準確地找到用戶所需數據,有效緩解信息超載問題,是目前最受歡迎的研究領域之一[1]。推薦系統可分為兩類,分別是生成個人推薦的個性化推薦系統和提供組推薦的群組推薦系統,在這兩者之間,個性化推薦在技術和應用方面已非常成熟,然而在很多情況下推薦系統需要為群組提供推薦,如家庭聚餐、旅行團興趣點以及其他娛樂目的等活動需要考慮群組內所有成員的偏好進行推薦。因此,群組推薦系統正在受到越來越多的關注,并逐漸成為學術界的研究熱點之一[2]。

與面向個人的推薦不同,在群組推薦中,推薦結果需要使絕大多數組成員對推薦結果感到滿意,而群組推薦的結果是基于對單個用戶的偏好擬合和所有用戶的偏好融合[3]。

對于單個用戶偏好的擬合,常用的方法是將個性化推薦技術應用到群組推薦中。協同過濾是當前個性化推薦技術中應用最為廣泛、發展最為成熟的個性化推薦技術之一[4]。它利用興趣相投、喜好相似的群體的偏好來推薦用戶感興趣的項目與信息,通過個人所給予信息的反饋記錄達到過濾的目的,從而幫助其他人來篩選信息。例如,陸航等人[5]提出了一種融合用戶興趣和評分差異的協同過濾推薦算法,將用戶興趣相似性和評分差異相似性進行加權融合,獲取更加準確的用戶鄰居,從而預測項目評分并進行推薦,能夠有效緩解單一評分相似性計算不準確的問題且具有良好的可擴展性,但是當面對大規模數據集或稀疏數據集時,算法表現較差。為了解決這些問題,概率矩陣分解(probabilistic matrix factorization,PMF)方法被提出,它是一種流行的基于模型的協同過濾方法,該方法通過將評分矩陣分解為兩個低維潛在因子矩陣,并使其乘積接近評分矩陣,從而預測未知評分,具有準確和穩定的預測性能,并且可以利用邊信息來有效緩解數據稀疏和冷啟動問題[6]。但是,PMF方法在計算過程中忽略了用戶之間的關系信息,而用戶之間的交互關系往往會對用戶的偏好產生較大影響,預測結果的準確性仍有待提高。本文提出了聯合用戶關系的概率矩陣分解算法,在經典概率矩陣分解算法中加入了用戶關系信息,具有更好的偏好擬合效果。

完成單個用戶的偏好擬合后,群組推薦中的另一個問題是群組成員偏好的融合,完成融合的方法有兩類,分別是模型融合方法(PA)和推薦融合方法(RA)。PA方法是將組用戶的偏好轉化為整個群組的偏好,然后將整個群組作為虛擬用戶,通過個體預測模型計算預測值。換句話說,這種方法在預測所有項目的評分之前,為整個群組構建一個偏好模型。例如,楊麗等人[7]提出了一種基于ranking的混合深度張量分解群組推薦算法,基于成對張量分解模型來捕獲群組偏好模型,有效提高了推薦效率,但是由于一些特殊群組成員的意見可能會被忽略使得整個群體的偏好無法有效地代表;毛宇佳等人[8]提出了一種縮小群組推薦列表的方法,該方法通過劃分子組來縮小群組規模并減少群組偏好屬性數量,保證了推薦的公平性,具有較好的群組推薦效果,但是在數據集稀疏的情況下,由于缺乏大量原始評級信息,構建群組偏好模型的能力較差,數據越稀疏,融合越困難;Ding等人[9]提出了一種基于模糊聚類的隨機群推薦模型,通過分析組中所有用戶的項目評分,推薦模型可以將群組抽象為虛擬用戶,然后應用個人推薦算法為虛擬用戶推薦前K個最吸引人的項目,并采用偏好評分和基于多類的模糊聚類算法對群推薦模型的推薦結果進行優化,與傳統的群組推薦相比,該群組推薦模型推薦的項目用戶滿意度更高,但是付出了多樣性和公平性方面的代價,導致推薦精度不高,并且在大規模群組內算法準確度仍有待提高。總而言之,對于PA方法,它只是簡單地合并用戶偏好構建群組模型,這種做法并不嚴格,因為一些特殊群組成員的意見可能會被忽略,整個群組的偏好無法有效地代表。

群組推薦的另一種方法是RA方法,該方法首先為每個組成員生成預測,然后將這些預測合并為最終群組推薦結果。它有兩個主要分支,分別是基于預測評分的推薦融合方法(PRA)和基于推薦列表的推薦融合方法(RRA)。PRA方法匯總了各組成員對一組中所有項目的預測評分,并將其作為該組對相應項目的預測評分,RRA方法則是將每個組成員的排名列表融合為整個群組的最終排名列表。

對于RRA方法的研究,李曉鵬等人[10]提出一種基于MedRank排序算法的群組推薦方法,該方法順序訪問每個群組用戶排序列表,通過順序排序算法輸出最終的群組推薦列表,這種方式可以避免當群組規模擴大時,群組推薦結果滿意度降低現象的產生,但是未考慮項目的具體排名信息,推薦精度較低;Du等人[11]提出了一種基于學習排序算法的群體活動推薦框架,使用貝葉斯群組排序算法將每個組成員的排名列表融合為整個群組的最終排名列表,該方法可擴展性強,但是同樣未考慮項目的具體排名信息,導致不精確的組排名列表??偠灾捎赗RA方法只使用排名信息,而不知道列表中兩個推薦項目的差異細節,可能會導致不精確的群組排名列表。相反,利用預測值進行融合的PRA方法可以被視為更具體、更準確的群組推薦方法。因此,本文的研究主要集中在PRA方法上。

對于PRA方法的研究,Liu等人[12]提出了一種基于群內發散協同過濾的群組推薦方法,考慮用戶對時間和項目類別的偏好構建用戶偏好向量,然后建立群體特征得到群組與其他用戶特征偏好的相似度,最后基于群體內散度計算群組的偏好評分,該方法適合為大規模群組推薦,但是當群組規模較小,用戶偏好不足時,推薦效果會很差;葉柏龍等人[13]提出了一種基于評分與項目特征相結合的方法,通過計算群組在項目特征和評分上的綜合相似度進行預測評分并產生推薦,該方法可以考慮每個成員與項目之間的關系,但數據的稀疏性影響推薦結果;楊金勞等人[14]提出了一種基于改進矩陣分解的群組推薦算法,首先根據用戶共有群信息計算用戶間的相關性并將其集成到矩陣分解中以生成單用戶的偏好評分,然后采用基于均值與最小辛苦策略融合的修正滿意平衡策略進行評分融合,該算法能夠考慮到用戶與群組之間的關系,但是忽略了個別影響力因子大的用戶對整個群組的影響,且在大規模的群組中推薦的滿意度與準確率偏低;尹青山[15]提出一種基于改進矩陣分解的群組推薦算法,以融入群組特有信息的矩陣分解為基礎模型生成群內單用戶的偏好評分,然后采用群推薦中傳統融合策略進行個人評分融合,該方法能夠很好地獲取個人預測評分,但是在群組偏好融合的過程中使用傳統融合策略只是簡單地將群組內所有成員的評分進行合并,未考慮用戶權重應不同,偏好融合效果欠佳;Guo等人[16]提出了一種基于偏好關系的群組推薦模型,使用多元回歸和極端學習程序預測每個用戶的預測評分,偏好融合則使用borda規則實現,實驗表明該模型適用于大規模群組推薦,緩解了群組推薦的數據稀疏性問題,但是borda規則是傳統融合策略的一種變式,偏好融合表現較差,導致推薦的準確度較低。

綜上可知,群組推薦方面的研究雖然眾多,但是仍然存在以下方面需要進一步研究:一方面是對于單個用戶的偏好擬合,概率矩陣分解雖然具有穩定的預測性能,并且可以利用邊信息來有效緩解數據稀疏問題,但是在計算過程中忽略了用戶之間的關系信息,而用戶之間的交互關系往往會對用戶的偏好產生較大影響,因此預測結果的準確性仍有待提高;另一方面是對于群組用戶的偏好融合,當群組成員之間存在偏好沖突時,傳統融合策略無法提供良好的群組推薦,而且將相同的權重分配給組中的所有個體,不能反映不同組用戶在實踐中的實際貢獻。事實上,群組中所有成員都應該有不同的影響,在群組中有重要地位或能夠為群組做出更多貢獻的人,在偏好融合的過程中應該擁有更高的權重,而且考慮到在群組中會有一些不可靠成員隨意評分,可能導致不準確的推薦結果,用戶的可靠性也是一個必須考慮的因素。

為解決上述問題,本文提出了融合概率矩陣分解與ER規則的群組推薦方法(FPMF-ER),該方法通過聯合用戶之間的關系信息對經典概率矩陣分解算法進行改進,不僅能夠有效緩解數據稀疏問題,而且能夠獲得更加準確、完整的單個用戶預測評分,為后續群組推薦工作奠定良好的基礎;隨后,在群組成員偏好融合的過程中引入ER規則,利用ER規則合理地將權重和可靠性分配給不同的群組成員,保證了沖突偏好之間的準確融合,能夠更加真實合理地反映偏好融合的過程。本文的主要貢獻可概括如下:

(1)提出了一種融合概率矩陣分解與ER規則的群組推薦方法,有效提升了群組推薦系統性能;

(2)在單個用戶偏好擬合階段,聯合用戶關系信息對PMF方法進行改進,提出聯合概率用戶關系的概率矩陣分解方法,以獲取更完整、更準確的單個用戶偏好擬合結果;

(3)在群組偏好融合階段,提出一種基于ER規則的偏好融合方法,通過ER規則根據群組成員的權重和可靠性識別群體成員的重要性和影響力,使偏好融合過程更加科學合理;

(4)為了評估所提出的群組推薦方法的性能,在Book-Crossing數據集上進行了對比實驗,實驗結果證明了所提出方法的有效性。

1 聯合用戶關系的概率矩陣分解

在本章中,使用聯合用戶關系的概率矩陣分解方法獲取完整且準確的個人預測評分,完成單個用戶偏好的擬合。擬合過程分為兩步:首先,構建用戶關系矩陣,并通過經典概率矩陣分解算法對用戶關系矩陣進行補全;隨后,將補全后的用戶關系矩陣和用戶-項目評分矩陣引入改進后驗概率的概率矩陣分解獲取個人預測評分。

1.1 構建用戶關系矩陣

對于群組中的用戶,根據公式(1)計算得到用戶之間的關系信息,并將關系信息儲存在一個M×M維的矩陣S中,M表示用戶數量,矩陣的元素Sl,r表示用戶l和用戶r之間的關系信息。

其中,rl,i、rr,i分別表示用戶l對項目i的評分和用戶r對項目i的評分;、分別表示用戶l的平均評分和用戶r的平均評分。Sl,r的值在?1到+1之間,值越接近1,表示兩個用戶之間的關系越緊密。

但是,由于關系信息是基于評分信息得到,而一般情況下用戶傾向于只對大量項目中的少數進行評分導致數據稀疏,所以需對關系信息進行補全。

假設關系信息矩陣S是由用戶l的潛在向量L和用戶r的潛在向量R的內積來決定,且服從高斯分布,如式(2)所示:

則關系信息矩陣的條件分布可表示為如式(3)所示,其中Il,r為指標函數,如果用戶l與用戶r之間存在關系信息值,則為1,否則為0。

再假設,用戶l的潛在向量L和用戶r的潛在向量R都服從均值為0的高斯分布,即:

則對于用戶l的潛在向量L和用戶r的潛在向量R,其后驗分布的對數函數如式(6)所示。其中,C是一個不依賴參數的常量。

最大化后驗分布的對數函數等價于最小化含有二次正則項的平方誤差和的目標函數,目標函數如式(7):

最后,目標函數E分別對Ll、Rr求導,如式(8)、式(9)所示:

迭代更新完成后,用戶l和用戶r的關系可通過Ll與Rr相乘取得,從而獲得補全后的關系信息矩陣F,且矩陣F的第r行表示用戶r與其他用戶之間的關系信息。

1.2 獲取個人預測評分

假設在一個群組中有M個用戶和N個項目,形成一個M×N維的用戶-項目評分矩陣R,矩陣的元素Ri,j表示用戶i對項目j的評分值。

再假設評分矩陣R是由用戶潛在向量U(M×D)與項目潛在向量V(N×D)的內積求得,且服從均值為,方差為的高斯分布,其中D是潛在特征矩陣,則矩陣R的概率分布如式(10)所示:

在1.1節中,經過計算得到補全后的用戶關系信息矩陣F,根據式(11)對矩陣F的每行值進行歸一化。

則用戶i的潛在向量Ui可表示為矩陣F中其他用戶的潛在向量乘以權重求和得到,如式(12)所示:

于是,用戶潛在向量U的高斯先驗分布如式(13)所示,項目潛在向量V的高斯先驗分布如式(14)所示:

則對于用戶潛在向量U和項目潛在向量V,其后驗分布的ln對數函數如式(15)所示:

而最大化該后驗分布的對數函數,等價于最小化含有二次正則項的平方誤差和的目標函數L,如式(16)所示,其中λU=σR2/σU2,λV=σR2/σV2,λF=σR2/σF2。

最后,目標函數L分別對Ui和Vj求導,如式(17)、式(18)所示:

在計算潛在特征向量后,獲得值=UiTVj,其中表示用戶i對物品j的預測偏好得分。至此,形成補全后的用戶-項目評分矩陣R,并獲得每個單個用戶對所有項目的預測值,將用于為后續偏好融合階段做準備,是群組偏好融合過程中的重要組成部分。

2 基于ER規則的偏好融合方法

2.1 群組推薦過程

本文在群組偏好融合的過程中引入ER規則,它是一種多準則決策分析的通用方法,使用統一的信念結構來建模各種類型的不確定性,可以被視為一種概率方法,并充分利用所有用戶生成的數據,屬于人工智能范疇,常用于信息融合、專家系統、多準則決策分析等方面。ER規則通過合理地分配證據的權重和可靠度,使得證據在不同的決策場景中具有與之相適應的特性,保證了高沖突證據之間的準確融合,而且它在計算過程中采用正交和算子進行證據組合,通過迭代計算,大大減小了傳統證據組合的計算量,避免了組合爆炸問題[17-20]。

基于ER規則的偏好融合方法細節描述如下:在第1章中獲得了完整的用戶-項目評分矩陣R,可以顯示各組成員對項目的預測值,群組中的每個用戶對項目的預測值都可以作為一個證據用來預測整個群組的真實偏好,通過ER規則識別每個用戶權重以及可靠性,然后將所有用戶的預測值融合生成群組對項目的預測值,最終得到群組的推薦結果?;贓R規則的偏好融合方法的工作原理如下。

定義1(識別框架)對于一個群組,認為項目集合Θ={v1,v2,…,vN}一個識別框架,其中Θ是一組相互排斥且詳盡的待推薦候選項目,識別框架的vj代表第j個項目。此外,Θ的所有子集構成冪集p(Θ),如式(19)所示:

定義2(證據)證據ei由信任分布來表示,如式(20)所示:

其中,(v,pv,i)表示支持假設v的證據,其概率為pv,i,由群組中第i個成員形成,概率pv,i由群組成員對項目的預測值表示,這里v可以是除空集之外Θ的任何子集或p(Θ)的任何元素。

定義3(權重和可靠性)假設wi(0≤wi≤1)和Ri(0≤Ri≤1)分別是任意用戶i的權重和可靠性,wi表示用戶i的重要程度,越接近0表示越不重要,越接近1表示越重要,Ri表示用戶i的可靠程度,越接近0表示越不可靠,越接近1表示越可靠。

若某個用戶在一個群組中有重要的位置,或者可以為推薦工作做出更多的貢獻,那么他的權重應比較高。一般情況下,為了使推薦結果盡可能地滿足群體的偏好,所有用戶都對同一個目標做出了貢獻,而某個用戶的推薦召回率越高,說明這個用戶可以從群組的實際偏好中取回更多的項目,同時也說明這個用戶對社群的貢獻越大,因此將用戶的推薦召回率作為權重,用戶i的權重設置如式(21)所示:

其中,Qt表示用戶i正確推薦項目的數量,Q表示訓練集中的項目總數。

因為權重反映了用戶i相對于其他用戶的相對重要性,所以需要將用戶i的權重歸一化,歸一化公式如式(22)所示:

對于群組成員的可靠性,則根據每個成員的推薦準確率來設置。如果一個群組成員的推薦準確率非常低,那么就認為他不可靠,反之,推薦準確率越高,則越可靠,任意用戶i的推薦精確率rpi如式(23)所示:

其中,Qt表示用戶i正確推薦項目的數量,Qu表示用戶i正確推薦列表上的項目數。

然而,大多數情況下沒有人能夠完全代表一個群組,這意味著沒有人是完全可靠的,用可靠性的閾值S來限定用戶的可靠性,用戶i的可靠性如式(24)所示:

用戶i的權重與可靠性的混合權重如式(25)所示:

基于上述條件,偏好融合的過程如下,將完整的用戶-項目評分預測矩陣RM×N={ri,j}轉化為證據資料矩陣PN×M=RTM×N={pv,i}。

若一個群組中只有兩個用戶,則融合結果可表示為如式(26)~(28)所示。其中,pv,E(2)表示群組對于項目v的預測值。

若一個群組中有兩個以上用戶,則使用遞歸方法進行融合,根據式(29)~(31)計算融合社群對項目的預測值pv,E(i)。

經過上述步驟,最終得到群組對項目的預測值pv,E(i),然后按照預測值高低將項目進行推薦,預測值越高,用戶越有可能滿意。本文提出的FPMF-ER群組推薦方法框架如圖1所示。

圖1 FPMF-ER群組推薦方法框架Fig.1 FPMF-ER group recommendation method framework

2.2 算法復雜度

下面對提出的FPMF-ER算法計算復雜度進行分析。本文算法主要由概率矩陣分解和基于ER規則的偏好融合兩個部分組成,故算法的主要計算部分是更新潛在特征矩陣和證據融合時的遞歸運算。對于更新潛在特征矩陣,矩陣會反復更新,直至收斂,這一過程幾乎與王英博等人[21]定義的過程相似,由此可知概率矩陣分解的時間復雜度是O(kDMN),其中,k是收斂所需的迭代次數,用戶和項目分別由M和N的對應行表示,D是潛在特征向量。由于本文在經典概率矩陣分解算法的基礎上聯合了用戶關系信息,所以每次迭代都需要額外的計算步驟。因此,上述優化過程的總計算復雜度為O(k(DMN+LM2))。其中,L是用戶潛在特征向量。對于ER規則,它在偏好融合過程中采用正交和算子進行證據組合,此部分的計算主要是遞歸運算,時間復雜度為O(K(logn)),其中K是遞歸次數。通過ER規則進行偏好融合,能夠大大減小傳統證據組合的計算量,有效避免了組合爆炸問題,而且當面對大規模數據集時,算法的優勢更明顯。

3 實驗

3.1 數據集簡介

本文在實驗中使用了Book-Crossing數據集,該數據集包含278 858個用戶、271 379本圖書和1 149 780條評論,評論信息不僅包括文本,還包括用戶對圖書的數字評分,數字評分從1~10。

但是,該數據集并不包含分組信息,本文借鑒文獻[22]的方式對數據集重構、進行群組劃分:如果用戶ui和用戶uj評價了相同的圖書,則將用戶ui和用戶uj劃分到以該圖書建立的一個群組。通過群組劃分,重構的數據集中的278 858名用戶共形成18 619個群組,規模最大的群組有29個成員,規模最小的群組有3個成員。本文從重構的數據集中隨機選擇80%的數據作為訓練集,20%的數據作為測試集,數據集群組信息如表1所示。

表1 數據集群組信息Table 1 Data set group information

3.2 評價指標

對于推薦效果的評估,本文采用均方根誤差RMSE作為評估推薦質量好壞的指標,采用歸一化折損累計增益nDCG作為衡量生成Top-n推薦列表準確率的指標,采用滿意度指標GSM衡量用戶的滿意度,具體計算方式如下所示。

RMSE的計算如式(32)所示:

其中,N表示社群中參與預測的項目數目;ri表示用戶對項目i的實際評分;ri′表示用戶對項目i的預測評分。RMSE結果的值越小,表示推薦的準確度越高。

nDCG的計算如式(33)、式(34)所示:

其中,{i1,i2,…,ik}是項目的評分列表;g表示社群,n表示推薦列表的前n個;rg,ik表示社群對項目ik的真實評分。nDCG是DCG的真實值與DCG的最大值的比值,DCG的最大值即推薦列表的最佳DCG值,nDCG的數值越大,表示推薦的準確度越高。

GSM的計算如式(35)所示:

其中,Nir表示推薦項目的個數,N表示社群中參與預測的項目數目,Ir表示推薦的項目。另外,為了提高實驗的準確性和效率,需設置一個用戶的滿意度閾值,根據文獻[23],滿意度閾值過低,可能導致社群推薦整體準確性產生偏差,閾值設定過高,則不能真實地反映推薦項目與用戶偏好情況。由于本文采用數據集評分為1~10,故將滿意度閾值設置為7,即評分大于或等于7的成員對推薦的結果表示滿意,故Isu表示7分以上的項目。

3.3 實驗設計與結果分析

3.3.1 參數λU、λV和λF的選擇

本文在聯合用戶關系的概率矩陣分解中有3個參數分別是λU、λV和λF,其中,λU和λV可以起到正則化系數的作用,相較于λF,λU和λV的取值較小,通常在0.001到0.01之間。為了探究上述參數對推薦效果的影響以及最優值,采用RMSE作為評價指標進行實驗,在其他參數不變的情況下,參數λU和λV對推薦效果的影響如圖2所示,λF對推薦效果的影響如圖3所示。

圖2 參數λU和λV對推薦效果的影響Fig.2 Parameters λU and λV on recommendation effect

圖3 參數λF對推薦效果的影響Fig.3 Parameter λF on recommendation effect

從實驗結果可以看出,當參數λU取值為0.002,λV取值為0.004時,RMSE值最小,此時推薦質量最高,故在后續實驗中將參數λU的值設置為0.002,將λV的值設置為0.004。對于參數λF,當λF取0時,RMSE值最高,說明推薦的質量最差,此時FPMF將退化為經典PMF算法,而隨著λF逐漸增大,RMSE值逐漸下降,推薦質量有所提高,當λF取值為8時,此時RMSE值最小,此時推薦效果最佳,故在后續實驗中,將λF取值為8。

3.3.2 可靠性閾值實驗

對于基于ER規則的偏好融合方法,用戶的可靠性是一組相互沒有影響的絕對值。它表示每個成員的可靠程度。雖然可靠性等于1代表“完全可靠”,但是幾乎沒有人能夠完全能夠代表一個群組,為了減弱這種影響,采用可靠度閾值S來約束群組內可靠性最高的成員。由于用戶可靠性的取值范圍是[0,1],且閾值設置不能太低,于是選擇在[0.5,0.9]之間進行實驗,探究最佳的可靠性閾值以及可靠性閾值對算法精度的影響,實驗結果如圖4所示。

圖4 可靠性閾值S對算法精度的影響Fig.4 Influence of reliability threshold S on algorithm accuracy

從實驗結果可以看出,隨著可靠性閾值的增大,算法精度的變化趨勢是先增后降,當可靠性閾值取0.8時,nDCG達到峰值82.9%,此時算法精度最高,取得最佳性能,故在后續實驗中,將可靠性閾值S設置為0.8。

3.3.3 潛在特征矩陣維度分析

潛在特征矩陣的維度會影響群推薦性能以及所提出模型的訓練時間。在本小節中,分析不同維度對模型性能影響,實驗測試在潛在特征矩陣維度d取不同值時,FPMF-ER模型的性能。設定潛在特征矩陣維度d的取值范圍為10到100,選擇nDCG作為評價指標,在Book-Crossing數據集上進行實驗,實驗結果如圖5所示。

圖5 不同潛在特征矩陣維度下的模型性能對比Fig.5 Comparison of model performance in different dimensions of potential feature matrix

從實驗結果可以看出,隨著潛在特征矩陣的維度d的逐漸增加,nDCG指標逐漸升高,說明FPMF-ER模型的性能有所提升。當潛在特征矩陣維度d達到80時達到飽和,模型的性能不再隨著潛在特征矩陣維度d的增加而提升。

3.3.4 優化算法分析

本文在優化過程中使用了隨機梯度下降(SGD)技術,為了探究不同優化算法對性能的影響,在本小節中選取了SGD、Momentum、RMSprop和Adam進行實驗,實驗結果如圖6所示。從實驗結果可以看出,相比與其他優化器,Momentum的效果較差,本文認為主要原因是Momentum積累之前的動量來代替真正的梯度,在訓練初期時對訓練速度雖有提升,但是比較難學習一個較好的學習率,導致較差的優化效果。RMSprop可以較好地修正收斂幅度,使各維度的擺動都較小,但是在應對稀疏矩陣時優化效果不佳,并且依然依賴一個不穩定的全局學習率。Adam能夠動態調節每個參數的學習率,但是有可能會陷入局部最小值,最終會一直在最小值附近波動,并且面對大規模數據集時達不到較好的收斂效果。綜合來看,對于本文來說SGD是效果最好的優化算法,它的每一步更新的計算時間不依賴于訓練樣本數目的多寡,對于大規模數據集或較為稀疏的數據集,SGD會在處理整個訓練集之前就收斂到最終測試機誤差的某個容錯范圍內,收斂速度和收斂程度均有較好的效果。

圖6 不同優化算法的實驗結果Fig.6 Experiment result of different optimization algorithms

3.3.5 算法復雜度比較分析

對于算法的時間復雜度方面,將本文算法與先進的群組推薦方法GROD和WBF進行對比分析。WBF方法首先將加權方案引入到評分矩陣中,然后將用戶的偏好合并,并以一個虛擬用戶來表示以構建群組偏好模型,最后通過矩陣分解算法獲取群組推薦結果[24]。GROD方法通過在群組成員之間達成共識來考慮群組推薦中群組成員之間的關系,它的具體實現如下:首先使用SVD獲得缺失的個人評分,然后使用獲得的評分獲得個人推薦并且獲得群組用戶之間的相似性矩陣,該相似矩陣用于在群組成員之間達成共識,最后使用意見動力學模型過濾與群組最相關的項目以產生推薦[25]。對于WBF方法,t1為迭代次數,K代表潛在因子矩陣大小,Ig是群組中至少一個用戶評分的項目數,它的時間復雜度為O(t1(K2,Ig,K3))。對于GROD方法,t2表示迭代次數,k代表潛在因素矩陣的大小,I表示項目數量,Rg表示群組成員的最高評分量,該方法的計算復雜度為O(t2(gIk,g2Rg,g3))。分析可知WBF和GROD與本文算法在運行時間性能上的差異主要取決于迭代的運算復雜度與群組規模大小,WBF和GROD隨著群組規模的增大效果降低較快,且迭代次數越高,時間復雜度越高,相較于WBF和GROD,FPMF-ER的時間復雜度更低,并且在大規模模數據集的實際應用中更為合適,具有較大的優勢,時間復雜度比較如表2所示。

表2 算法復雜度比較Table 2 Comparison of algorithm complexity

3.3.6 準確度結果分析

本文使用4個對比方法,分別是PR-VU-GA-GR、LFM-AGRT、GRS-IT和LDA-GRS。

(1)PR-VU-GA-GR:采用推薦融合方法,單個用戶偏好的擬合使用矩陣分解技術,偏好融合階段使用一種基于虛擬用戶的權重融合策略進行推薦[26]。

(2)LFM-AGRT:采用LFM隱語義模型對用戶數據進行矩陣分解,通過將分解矩陣再次相乘獲得用戶對未評分項目的評分數據,然后采用加權混合融合策略對群組偏好進行融合[27]。

(3)GRS-IT:引入領導者影響的方法,結合皮爾遜相關性與一種隱式信任度計算找出組內領導者并獲取領導者與成員、成員彼此之間的影響權重,然后采用均值策略對群組偏好進行融合[28]。

(4)LDA-GRS:采用模型融合方法,將組用戶的偏好轉化為整個群組的偏好,綜合考慮群組用戶的偏好以及信任關系構建了群組模型,基于此模型生成推薦列表[29]。

為了評估本文所提出方法在推薦結果準確度方面的整體表現,選取最優參數,使用RMSE和nDCG作為評價指標,在重構數據集上進行實驗,分別比較群組規模在5、10、15、20、25時推薦結果的準確度。并且為了保證實驗結果的公平性,實驗進行5次測試再取平均值作為最終結果,選取RMSE作為評價指標的對比實驗結果如圖7所示,選取nDCG作為評價指標的對比實驗結果如圖8所示。

圖7 推薦準確度的RMSE對比圖Fig.7 RMSE comparison chart of recommended accuracy

圖8 推薦準確度的nDCG對比圖Fig.8 nDCG comparison chart of recommended accuracy

由圖7和圖8的實驗結果可以看出,五種方法在群組規模擴大的過程中RMSE值均逐漸升高,nDCG值均逐漸降低,這說明隨著群組規模擴大,推薦結果準確度有所降低。

其中,GRS-IT方法整體表現較差,原因在于該方法在偏好融合的過程中采用了傳統融合策略中的均值策略,這種做法只是簡單地將群組成員的評分取平均值,在融合過程中可能會丟失掉大量的有價值的信息,因此推薦結果并不可靠;LDA-GRS方法采用的偏好模型融合方法在面臨群組規模擴大的情況時,構建偏好模型的能力下降,導致推薦準確度下降,并且該方法未考慮群組中不同用戶的權重應該不同,因此該方法在推薦結果準確度方面表現一般;PR-VU-GA-GR和LFM-AGRT方法整體表現接近,且均優于前兩種對比方法,原因在于在獲取個人預測評分時,都采用了矩陣分解方法,預測單個用戶的偏好擬合結果能力更強,因此推薦結果也更加準確,但是這兩種方法在偏好融合時都同樣設置了固定權重,隨著規模的擴大成員關系會減弱,推薦準確度隨著規模的擴大而降低;FPMF-ER方法整體表現最優,原因在于該方法在單個用戶偏好擬合階段采用聯合用戶關系信息對概率矩陣分解進行改進,相比其他四種方法能夠得到更加準確的個人預測結果,而且在偏好融合的過程中引入ER規則,為群組中不同用戶設置有不同的權重和可靠性,隨著群組規模的擴大仍然能夠保持較高的準確度,避免了有價值信息丟失的問題,保證了用戶偏好的準確融合,因此推薦結果的準確度更高。

3.3.7 用戶滿意度結果分析

用戶對于推薦結果的滿意度是評估的主要部分,因為群組推薦的目標是向群組推薦合適的項目,以最大限度地提高組成員的滿意度,用戶滿意度實驗將FPMF-ER與PR-VU-GA-GR、LFM-AGRT、GRS-IT和LDA-GRS進行比較,采用GSM作為評價指標,分別重復進行5次實驗再將實驗結果取平均值作為最終結果,并分別比較群組規模在5、10、15、20、25時群組成員的滿意度,實驗結果如圖7所示。

由圖9的實驗結果可以看出,隨著群組規模的逐漸擴大,各個方法的用戶滿意度均逐漸降低,FPMF-ER在規模為5、10、15、20、25時的GSM值分別為82.71%、79.54%、76.31%、74.22%、72.21%,且均高于其他四種方法的GSM值,原因在于FPMF-ER在偏好融合過程中能夠為不同用戶分配不同的權重和可靠性,識別出每個組成員的不同重要程度再進行偏好融合,能夠更加真實地反映社會群體偏好選擇過程,故而組成員的滿意度較高。另外,五種方法的最高GMS值均是在群組規模為5時,分別為82.71%、79.27%、78.35%、74.32%、69.12%,且隨著規模的擴大GSM逐漸降低。實驗結果可以看出五種群組推薦方法的用戶滿意度排序為:FPMF-ER>LFMAGRT>PR-VU-GA-GR>LDA-GRS>GRS-IT。

圖9 用戶滿意度對比圖(GSM)Fig.9 Comparison of user satisfaction(GSM)

4 結束語

本文提出了一種新的融合概率矩陣分解與ER規則的群組推薦方法,在單個用戶偏好擬合階段,采用聯合用戶關系的概率矩陣分解方法獲取個人預測評分,能夠準確而穩定地預測單個用戶的偏好。在群組用戶的偏好融合階段采用一種基于ER規則的偏好融合方法,該方法能夠根據不同用戶的權重和可靠性,準確識別出用戶的重要性,使融合過程更加準確合理。在真實數據集Book-Crossing進行了實驗,以驗證本文所提出方法的有效性。結果表明,相對于其他方法,本文所提出的FPMF-ER方法在推薦結果的準確性和用戶滿意度方面有較大的提升,具有較高的推薦質量。

本文工作的局限性在于所使用的數據集針對性較強,不能保證算法的普適性,下一步的研究方向是選取其他數據集和評價指標進行更有力的驗證。另外,在未來的研究中,仍有許多其他有效的偏好融合方法有待發現和改進,接下來將繼續從偏好融合方面進行研究,提出更高效的偏好融合方法,不斷提高群組推薦的效果。

猜你喜歡
融合用戶實驗
記一次有趣的實驗
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
從創新出發,與高考數列相遇、融合
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
做個怪怪長實驗
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 亚洲丝袜第一页| 日韩小视频网站hq| 中国一级特黄视频| 国产鲁鲁视频在线观看| 久久国产精品嫖妓| a欧美在线| 亚洲伦理一区二区| 人人爱天天做夜夜爽| 欧美日韩一区二区三区四区在线观看| 91午夜福利在线观看| 国产精品成人久久| 亚洲午夜久久久精品电影院| 国产无码制服丝袜| 午夜日b视频| 国产自在线拍| 中文字幕66页| 国产青榴视频| 国产成人精品免费av| 色丁丁毛片在线观看| 日韩午夜片| 欧美亚洲一区二区三区导航| 亚亚洲乱码一二三四区| 日韩视频福利| 免费在线国产一区二区三区精品| 成人欧美在线观看| igao国产精品| 国产综合日韩另类一区二区| 欧美亚洲第一页| 久久国产精品麻豆系列| 国产成人免费| 国产亚洲精品无码专| 不卡网亚洲无码| 亚洲天堂视频在线播放| 999福利激情视频| 新SSS无码手机在线观看| 亚洲无码日韩一区| 国产男女免费视频| 91香蕉国产亚洲一二三区| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产成人精彩在线视频50| 亚洲伊人久久精品影院| 国产一二三区视频| 91精品在线视频观看| 亚洲h视频在线| 国产成人无码AV在线播放动漫| 国产精品久久久久无码网站| 国产香蕉国产精品偷在线观看| 国产黄色片在线看| 国产精品嫩草影院av| 久久毛片网| 免费视频在线2021入口| 亚洲经典在线中文字幕| 99久久精品久久久久久婷婷| 亚洲乱码视频| 中文字幕亚洲专区第19页| 国产大片喷水在线在线视频| 99热这里只有精品免费| 欧美一区二区三区香蕉视| 国产成人1024精品| 在线精品视频成人网| a国产精品| 日韩性网站| 人妻21p大胆| 国产男女XX00免费观看| www.亚洲色图.com| yjizz视频最新网站在线| 国产H片无码不卡在线视频 | 国产亚洲精品97在线观看| 亚洲国产天堂久久九九九| 亚洲人精品亚洲人成在线| 日韩毛片免费观看| 成人毛片免费观看| 97在线碰| 欧洲精品视频在线观看| 日本a级免费| 日本三级欧美三级| 欧美日韩国产精品va| 四虎影视8848永久精品| 美女一级免费毛片| 99re在线免费视频| 中文字幕日韩欧美| 婷婷综合亚洲|