999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

引入興趣穩(wěn)定性的時間敏感協同過濾算法

2018-06-01 10:50:36孫福振
計算機工程與應用 2018年11期
關鍵詞:用戶實驗評價

張 旭,孫福振,方 春,郭 蕊

ZHANG Xu,SUN Fuzhen,FANG Chun,GUO Rui

山東理工大學 計算機科學與技術學院,山東 淄博 255049

College of Computer Science and Technology,Shandong University of Technology,Zibo,Shandong 255049,China

1 引言

《中國互聯網絡發(fā)展狀況統計報告》顯示,截至2015年6月,中國互聯網網民規(guī)模達6.68億[1]。伴隨著信息技術飛速發(fā)展,信息量也發(fā)生著爆炸式的增長,信息過載問題也日益突出。在海量信息中用戶很難發(fā)現自己需要的,感興趣的部分。而推薦系統是在用戶沒有明確需求的情況下,通過分析用戶歷史行為數據給用戶進行興趣建模,然后將用戶可能感興趣的信息推薦給用戶。

協同過濾推薦是迄今應用最成功、最成熟的技術之一,其主要分為兩類:基于用戶的協同過濾和基于物品的協同過濾[2]。基于物品的協同過濾推薦算法的思想是根據用戶的歷史行為數據分析計算得出用戶的行為偏好,據此用戶偏好給用戶做出推薦。其前提假設是,在未來的一段時間內用戶的興趣偏好是不變化的。而傳統的基于用戶的協同過濾推薦算法的思想是根據用戶A的行為數據計算出和用戶A具有相似偏好的鄰居用戶,然后將鄰居用戶感興趣的物品且用戶A還沒有發(fā)現的物品推薦給用戶A。雖然協同過濾取得了很大成功,但也存在時間動態(tài)性問題,物品流行偏執(zhí)等問題。

針對協同過濾技術中的動態(tài)性問題,文獻[3]加權時間權重和資源相似度的數據權重,提出了適應用戶興趣的推薦算法,沒有考慮用戶短期興趣和長期興趣的穩(wěn)定性。文獻[4]提出了一種動態(tài)推薦技術,考慮了時間信息,并沒有涉及用戶興趣穩(wěn)定性。隨著移動設備蓬勃發(fā)展,文獻[5]提出了一種SUCM模型來學習細粒度的用戶偏好給用戶做推薦,沒有考慮時間敏感和用戶興趣穩(wěn)定性。本文從時間和興趣穩(wěn)定性角度出發(fā),考慮用戶興趣穩(wěn)定的情況下引入時間敏感因子,進而給用戶產生動態(tài)推薦,實驗表明,該模型降低了推薦誤差。

針對物品流行偏執(zhí)問題,文獻[6-8]提出了運用近鄰度、影響力和普及性三方面綜合考慮用戶評分對用戶之間相似度的影響。文獻[9]提出了一種啟發(fā)式相似度計算模型,提高了用戶之間的相似度。文獻[10-12]通過使用自編碼方式來提高topN推薦質量。文獻[13]利用社交網絡,分析社交群體中的強弱關系,提出一種EM算法來提高推薦質量。文獻[14-15]不是從相似度計算模型而是通過改變推薦結果的流行度分布來緩解偏執(zhí)問題。而本文在相似度建模階段通過將所有物品流行度進行“裝箱化”,然后根據用戶實際評分映射“箱子”,映射生成三維的基于物品流行度的用戶興趣特征向量——“向量化”,進而計算用戶之間的相似度。

綜上所述,針對協同過濾中的流行偏執(zhí)問題和時間動態(tài)性問題,本文考慮時間敏感的用戶興趣穩(wěn)定性,以及物品流行度因素對用戶之間相似度的影響,提出了一種引入興趣穩(wěn)定性的時間敏感協同過濾算法。實驗表明,該算法能夠有效降低推薦誤差,挖掘長尾物品,緩解物品流行偏執(zhí)現象。

2 方法介紹

2.1 基于物品流行度的用戶興趣特征相似度模型

定義1(物品i的流行度定義)所有用戶對物品i的評價次數之和與物品總數的比值。公式如下:

其中,counti表示有多少個用戶對物品i進行了評價,countI表示物品總數。

算法描述:

(1)取三個物品流行度區(qū)間[a1,a2),[b1,b2),[c1,c2)。

(2)用公式 popularityi計算用戶u已經評價的所有物品的流行度。

(3)將步驟(2)中用戶計算的所有物品的流行度先裝箱,然后映射到步驟(1)。

裝箱偽代碼為:

說明:a1,a2,b1,b2,c1,c2是根據實驗取得的閾值數據。

映射偽代碼為:

(4)將步驟(3)中生成的 featurevector用戶特征向量采用余弦相似度公式來計算用戶A和用戶B的基于物品流行度的用戶興趣特征相似度。公式描述如下:

上述模型稱為Item_pop_sim模型,簡稱IPS模型。

2.2 引入興趣穩(wěn)定性的時間敏感相似度模型

在實際應用過程中,用戶的興趣通常具有易變性,不僅與用戶對物品評分數值有關,還與物品的流行度有關,這兩者加權構成了用戶的興趣度。用戶興趣度定義如下:

定義2(用戶u的興趣度)是由用戶u對i個物品的興趣向量組成的向量集合Pu=(Pu1,Pu2,…,Pui)。

定義3(用戶u的第i個物品興趣向量)用戶u評價的第i個物品的實際評分值與滿分值的比值再加權該物品的流行度。公式描述如下:

其中,Pui表示用戶u對第i個項目的興趣程度,Rui表示用戶u對物品i的打分值,Rmax表示該物品的滿分值,popularityi表示公式(1)中定義的物品i的流行度,popularitymax表示所有物品的最大流行度,popularitymin表示所有物品的最小流行度。α,β表示參數,且α+β=1,該參數可以通過實驗驗證得出。同樣,使用余弦相似度來計算用戶u和用戶v之間的興趣相似度,公式描述如下:

該模型通過引入帶權值的物品流行度可以有效地緩解用戶打分偏置的問題。

定義4(用戶u的興趣穩(wěn)定性)用戶u評價的所有物品評分數值的方差。公式描述如下:

其中,ui表示用戶u評價的第i個物品的評分值,n為用戶u評價的所有物品的總數,μ為用戶u評價的所有物品評分值的平均值。方差的大小來衡量用戶興趣的穩(wěn)定性,即方差越小用戶興趣越穩(wěn)定。

現實中,用戶的興趣往往不是一成不變的,可能受自身因素的影響,周圍環(huán)境,興趣會隨著時間的流逝潛移默化,很早之前的興趣可能會逐漸淡忘或者消失。本文從影響用戶興趣的因素出發(fā),給出了時間敏感的表征。

定義5(時間敏感)在兩個用戶興趣穩(wěn)定的基礎上,兩用戶對物品的評分時間越相近則用戶間的興趣相似度就越高,即用戶的興趣相似度對時間敏感。

考慮到用戶興趣隨著時間的增長可能會發(fā)生變化,本文引入 e-φ| |tui-tvi為時間敏感因子,以天為單位且兩用戶評分時間越相近,表明用戶的區(qū)域時間段內興趣相似度就越高。

為建模用戶興趣的時間敏感動態(tài)性,本文提出了一種時間敏感的用戶興趣穩(wěn)定性相似度計算模型。公式如下:

其中,σu=σu-σmed,σv=σv-σmed,σu和 σv分別表示用戶u和用戶v分別去中心化后的評分方差,σmed是指評分方差的中值,通過統計分析可以得出,方差大部分在0.5到1.5之間,所以σmed=1,δ表示實驗取得的參數,其中,δ∈(0,1)。Iu?Iv表示用戶u和用戶v共同評分的物品交集,tui和tvi分別表示用戶u和用戶v對物品i的評價時間。φ表示實驗取得的參數,其中,φ∈(0,1)。∑X2和∑Y2表示用戶u和用戶v對物品評分值的平方和。上述公式(8)中的模型稱為Stability_Time_Sim模型,簡稱為STS模型。

2.3 兩種相似度模型的融合

上面介紹了兩種相似度模型各有各的優(yōu)點,其中基于物品流行度的用戶興趣特征相似度模型可以有效地緩解物品偏置問題,引入時間敏感的用戶興趣穩(wěn)定性的相似度模型可以實時抓住用戶興趣,挖掘長尾物品,提高推薦系統的新穎度。所以為了使推薦效果更好,不增加算法時間復雜度且易于實現起見,將兩種模型進行線性加權,提出了Item_Pop_Stability_Time_Sim函數模型。公式描述如下:

其中,λ為實驗取得的參數且λ∈[0,1]。關于λ取值對于模型的影響,見本文3.3.3節(jié)詳細分析。

上述模型簡稱IPSTS模型,IPSTS模型綜合考慮了用戶興趣的穩(wěn)定性、時間敏感情況,以及物品流行度等因素。綜合這些因素進行建模,實驗表明,加權后的相似度模型在推薦質量上有明顯提高。

3 實驗設計及分析

3.1 實驗數據集

本文實驗所用的數據集是美國Minnesota大學GroupLens小組開發(fā)的MovieLens站點所提供的數據集。MovieLens建立于1997年,是一個基于Web的推薦系統,目前,該站點提供三種不同數量級的數據集,分別為:943個用戶對1 682部電影的10萬條評分的數據;6 040個用戶對3 900部電影評分的100萬條數據;71 567個用戶對10 681部電影做出的1 000萬條評分數據。

本文實驗采用了943個用戶對1 682部電影的10萬條評分數據集,其中每個用戶至少對20部電影進行了評價。該數據集的稀疏等級為1-100 000/(943×1 682)=0.937,本文將實驗數據集劃分為訓練集和測試集,其中訓練集占80%,測試集占20%。

3.2 評價標準

本文采用的推薦質量的評價標準分別是平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)[16]。平均絕對誤差(MAE)公式如下:

均方根誤差(RMSE)公式如下:

3.3 實驗結果

實驗比較了IPSTS模型與Pearson(皮爾森)模型以及Euclide(歐幾里德)模型在推薦質量上的差異,第一步先考查當參數δ和參數λ固定時,隨著鄰居數量逐漸增多,三種模型在RMSE和MAE兩個評價標準上的效果。第二步固定鄰居數量,考查當參數δ和參數φ以及參數λ按照相應的步長逐漸增長時,三種模型在RMSE和MAE兩個評價標準上的效果。

3.3.1 IPSTS模型實驗結果

圖1顯示出取不同鄰居時,各個相似度計算模型對RMSE的影響。其中鄰居數量分別為10,20,30,40,50,60,70,80,90。分析得出,IPSTS模型計算的均方根誤差(RMSE)比Euclide和Pearson模型計算的均方根誤差(RMSE)都要低(例如:當鄰居數量為20時,本文提出的IPSTS模型比Pearson模型要低6%左右,比Euclide模型要低30%左右)。所以,降低了誤差,提高了推薦質量。

圖1 IPSTS、Pearson、Euclide三種模型RMSE對比圖

圖2 顯示出取不同鄰居時各個相似度計算模型對MAE的影響折線圖。其中鄰居數量分別為55,60,65,70,75,80,85,90。分析得出,IPSTS模型計算的平均絕對誤差(MAE)比Euclide和Pearson模型計算的平均絕對誤差(MAE)都要低(例如:當鄰居數量為80時,IPSTS模型比Pearson模型要低1%左右,比Euclide模型要低8%左右)。所以,提高了推薦質量。

圖2 IPSTS、Pearson、Euclide三種模型MAE對比圖

在實驗中,參數的選取是至關重要的,為了讓實驗達到滿意的效果,同時充分測試算法的健壯性和適用性,更為了優(yōu)化算法,本節(jié)對δ取值選取進行了實驗,為了盡可能地排除其他因素干擾,僅僅檢驗δ對IPSTS模型的影響,取鄰居數量為50,參數λ取0.2時,檢驗隨著δ的遞增,IPSTS模型在RMSE評價標準上的效果。如圖3所示。

圖3 參數δ變化對IPSTS模型的影響

3.3.3 參數λ對IPSTS模型的影響

同時,為了檢驗權重參數λ對IPSTS模型的影響,結合上一節(jié)實驗結果取鄰居數量為50,參數δ取0.014時,檢查隨著λ的增長,IPSTS模型在RMSE評價標準上的效果。

圖4顯示,從0.1開始,隨著λ的增長,RMSE是先減少后增長,然后增長到一定的數值后再下降,之后,隨著λ的增長,RMSE基本上趨于緩和。由圖4可知,當λ取0.2時,RMSE最小。所以,在IPSTS模型中,參數λ取0.2最優(yōu)。

圖4 參數λ變化對IPSTS模型的影響

3.3.4 參數φ對IPSTS模型的影響

為了檢驗參數φ對IPSTS模型的影響,結合上一節(jié)實驗,鄰居數量固定為50,λ取0.2,δ取0.014。

圖5顯示,當φ取1.0時,RMSE最小。因此,在IPSTS模型中,參數φ取1.0最優(yōu)。

3.3.5 IPSTS模型對長尾物品的影響

圖5 參數φ對IPSTS模型的影響

由圖6可知,這些物品存在長尾現象。其中,物品ID越靠前,流行度越高,ItemID在1 000之后的為長尾物品。為檢驗IPSTS模型對長尾物品的挖掘能力,實驗如下:隨機選取3個用戶,對3個用戶分別進行top5(推薦前5個)推薦,用戶ID分別為80,800,888。userID為需要進行推薦的用戶編號,RecommenderSize=5為推薦列表大小,NeighborSize(鄰居數量)=90。Pearson模型中RMSE=0.335 60,IPSTS模型中RMSE=0.329 65。

銀行業(yè)的發(fā)展離不開創(chuàng)新技術的支持,當前銀行業(yè)要想提升自身的競爭力,同樣需要借助新技術的支持與應用。但是,在應用新技術的時候需要能夠適應銀行的高風險、高收益、運轉周期長的特點,并形成一個新型的金融服務方式,以此來促使更多的資金支持技術創(chuàng)新。同時,銀行業(yè)還需要不斷的提升互聯網技術的更新,運用人工智能、云技術等現代化的科技來提升銀行業(yè)的服務效率,降低成本,以此來提升銀行業(yè)的服務實體經濟能力,促使銀行業(yè)更好的發(fā)展。

圖6 物品ID與物品流行度散點圖

表1(ItemID為推薦的物品編號)顯示,IPSTS模型在降低了RMSE的基礎上,提高了推薦質量的同時,能夠挖掘出物品編號為1 467,1 189的長尾物品給用戶進行推薦,對長尾現象起到了一定的緩解作用,可以給用戶帶來驚喜。

表1 userID為80時Pearson模型與IPSTS模型推薦比較

同樣,表2(ItemID為推薦的物品編號)顯示,采用IPSTS模型相比Pearson模型而言,挖掘出了1 159,1 121,1 103三個長尾物品推薦給用戶,能夠給用戶帶來新鮮感。

表2 userID為800時Pearson模型與IPSTS模型推薦比較

表3(ItemID為推薦的物品編號)顯示,在給編號為888的用戶進行推薦時,IPSTS模型在降低了RMSE的基礎上,給用戶做出的推薦策略為1 467,1 368,1 512,615,169。其中的前三個物品為長尾物品。但是,Pearson模型不僅均方根誤差比IPSTS模型要高,而且給出的推薦策略也沒有挖掘出長尾物品。因此,IPSTS模型對長尾現象有所緩解,能夠挖掘出長尾物品給用戶進行推薦。

表3 userID為888時Pearson模型與IPSTS模型推薦比較

4 結束語

推薦系統是在用戶沒有明確需求的情況下,從海量的數據中幫助用戶尋找感興趣的信息,進而以合適的方式給用戶展現和推薦。本文圍繞降低預測評分誤差以及挖掘長尾物品問題,引入興趣穩(wěn)定性,同時關注時間敏感因子,構建了引入興趣穩(wěn)定性的時間敏感相似度融合模型。實驗表明該模型能夠實現用戶興趣的實時動態(tài)推薦,且進一步提高了推薦質量。然而,影響用戶興趣的因素還包括外部環(huán)境因素等其他關鍵因素,隨著移動設備的蓬勃發(fā)展和定位系統的成熟,可以將這些因素引入到模型中。其次,融合后的模型是線性加權的,下一步還可以考慮構建一個非線性模型進行推薦。

參考文獻:

[1]佚名.第36次《中國互聯網絡發(fā)展狀況統計報告》[J].網絡傳播,2015(7):54-59.

[2]Resnick P,Iacovou N,Suchak M,et al.GroupLens:An open architecture for collaborative filtering of netnews[C]//Acm Conf on Computer Supported Cooperative Work,1994:175-186.

[3]邢春曉,高鳳榮,戰(zhàn)思南.適應用戶興趣變化的協同過濾推薦算法[J].計算機研究與發(fā)展,2007,44(2):296-301.

[4]項亮.動態(tài)推薦系統關鍵技術研究[D].北京:中國科學院自動化研究所,2011.

[5]Liu B,Wu Y,Gong N Z,et al.Structural analysis of user choices for mobile app recommendation[J].Acm Transactions on Knowledge Discovery from Data,2016,11(2):17.

[6]Koren Y.Factorization meets the neighborhood:A multifaceted collaborative filtering model[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Las Vegas,Nevada,USA,August 2008:426-434.

[7]Kim D,Yum B J.Collaborative filtering based on iterative principal component analysis[J].Expert Systems with Applications,2005,28(4):823-830.

[8]Ahn H J.A new similarity measure for collaborative filtering to alleviate the new user cold-starting problem[J].Information Sciences,2008,178(1):37-51.

[9]Liu H,Hu Z,Mian A,et al.A new user similarity model to improve the accuracy of collaborative filtering[J].Knowledge-Based Systems,2014,56(3):156-166.

[10]Li S,Kawale J,Fu Y.Deep collaborative filtering via marginalized denoising auto-encoder[C]//Acm Int Conf on Information&Knowledge Management,2015:811-820.

[11]Wu Y,Dubois C,Zheng A X,et al.Collaborative denoising auto-encoders for top-N recommender systems[C]//ACM International Conference on Web Search and Data Mining,2016:153-162.

[12]Strub F,Mary J,Gaudel R.Hybrid recommender system based on autoencoders[C]//Workshop on Deep Learning for Recommender Systems,2016:11-16.

[13]Wang X,Lu W,Ester M,et al.Social recommendation with strong and weak ties[C]//Acm Int Conf on Information&Knowledge Management,2016:5-14.

[14]Vuurens J B P,Larson M,De Vries A P.Exploring deep space:Learning personalized ranking in a semantic space[C]//Workshop on Deep Learning for Recommender Systems,2016:23-28.

[15]Adomavicius G,Kwon Y O.Improving aggregate recommendation diversity using ranking-based techniques[J].IEEE Transactions on Knowledge&Data Engineering,2012,24(5):896-911.

[16]Herlocker J L.Evaluating collaborative filtering recommender systems[J].Acm Transactions on Information Systems,2004,22(1):5-53.

猜你喜歡
用戶實驗評價
記一次有趣的實驗
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
做個怪怪長實驗
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于Moodle的學習評價
如何獲取一億海外用戶
主站蜘蛛池模板: 99热这里只有精品免费国产| 综合五月天网| www.av男人.com| 国产流白浆视频| 91探花国产综合在线精品| 精品超清无码视频在线观看| 久久久成年黄色视频| 久久熟女AV| 免费看美女自慰的网站| 青青青视频蜜桃一区二区| 999国产精品永久免费视频精品久久 | 国产农村妇女精品一二区| 色婷婷电影网| 欧美亚洲一二三区| 五月综合色婷婷| 国产成人乱码一区二区三区在线| 久久精品免费看一| 日韩大片免费观看视频播放| 亚洲成人精品在线| 自拍偷拍欧美| 午夜高清国产拍精品| 国产大全韩国亚洲一区二区三区| 国产在线观看精品| 人妻夜夜爽天天爽| 日韩AV无码免费一二三区| 国产成人综合日韩精品无码不卡| 99视频在线观看免费| 制服丝袜亚洲| 国产亚洲欧美在线专区| 青青网在线国产| 欧美伊人色综合久久天天| 亚洲欧美日韩精品专区| 亚洲三级视频在线观看| 韩日午夜在线资源一区二区| 亚洲色图欧美一区| 毛片免费网址| 免费无码在线观看| 亚洲开心婷婷中文字幕| 国产成人乱无码视频| 伊人久综合| 九九香蕉视频| 久久婷婷色综合老司机| 欧美97欧美综合色伦图| 国产精品密蕾丝视频| 精品无码日韩国产不卡av | 国产成人乱无码视频| 三区在线视频| 五月婷婷精品| 国产成人精品亚洲77美色| 一级一级特黄女人精品毛片| 国产理论一区| 欧美日韩成人| 免费观看男人免费桶女人视频| 精品国产中文一级毛片在线看 | a毛片在线播放| 国产激爽大片在线播放| 欧美性爱精品一区二区三区 | 国产福利观看| 日本免费a视频| 小说 亚洲 无码 精品| 亚洲一级毛片免费观看| 久久精品国产免费观看频道| 久久午夜夜伦鲁鲁片无码免费| 国产主播在线一区| 国产在线观看第二页| 亚洲综合色区在线播放2019 | 试看120秒男女啪啪免费| 88国产经典欧美一区二区三区| 国产天天射| 久久国产精品波多野结衣| 免费A级毛片无码免费视频| 无码福利日韩神码福利片| 美女高潮全身流白浆福利区| 欧美中文字幕无线码视频| 无码乱人伦一区二区亚洲一| 乱人伦视频中文字幕在线| 毛片视频网| 无码有码中文字幕| 亚洲色欲色欲www网| 婷婷开心中文字幕| 在线国产毛片手机小视频| 欧洲av毛片|