999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時間因子的個性化推薦系統的算法改進

2015-01-16 03:19:45浙江工業職業技術學院
電子世界 2015年24期
關鍵詞:資源用戶方法

浙江工業職業技術學院 方 杰

基于時間因子的個性化推薦系統的算法改進

浙江工業職業技術學院 方 杰

如何根據用戶自身特征準確地向其反饋個性化的推薦,一直是學術界和產業界研究的重點和熱點。本文提出了一種新的個性化推薦方法,該方法在計算兩個資源相似度時考慮了標簽的時間因子,設計了合理的時間衰減函數,并以此對已有的推薦算法進行了改進,并在實際數據集中對改進前后的個性化推薦算法結果進行了對比,最終的結果表明了我們提出的方法具備可行性和優越性。

時間因子;個性化推薦;社會標簽系統

0 引言

目前,社會標簽已經成為web2.0的主要應用之一,用戶可以自由地對網絡上各種類型的資源,比如視頻、照片等做出個性化的標簽。這些標簽可以在一定程度上反映用戶的興趣愛好和操作習慣。而個性化推薦系統恰恰是針對用戶的特點給予推薦,不同的用戶會得到不同的推薦。因此,用戶標注的標簽在個性化推薦系統中的地位舉足輕重,國內外的一些論文對此已經做了較深入的研究,并提出了許多有價值的算法。

目前的個性化推薦系統大多是基于資源、標簽和用戶的三元關系,并以此設計了多種不同的推薦系統。通常,這些推薦系統都是根據用戶對資源的評價情況,來獲取用戶的特征,從而做出對用戶興趣的判斷并反饋推薦。但僅憑資源、標簽和用戶所設計的個性化推薦系統存在著一定的局限性,因為用戶對一個資源的態度和評價通常會隨著時間的推移而改變。比如用戶幾年前對某一地區房價的價格評價是“較低”,而現在的評價是“較高”,其實該用戶更關心的是當前的價格;再比如用戶對某一部科幻電影幾年前的評價是“效果很好”,而隨著特技特效的快速發展,該用戶對該電影的評價換成了“效果一般”。所以標簽能夠反映用戶的興趣和特點的變化,而這個變化是由時間的推移而造成的。

受到這一思想的啟發,在這篇文章中,我們提出了一個新的個性化推薦方法,把時間因子與標簽綁定,在已有的個性化推薦系統的基礎上,融入“最新的標簽最能反映用戶的特征”的想法,從而在一定程度上提高推薦的準確度。

本文的主要貢獻有:

(1)提出了個性化推薦系統加入時間因子的思想。

(2)設計了加入時間因子后的推薦系統模型。

(3)使用真實數據集,對所設計的模型進行驗證。

本文第二節介紹了相關的基礎工作,第三節詳細描述了本模型的設計過程,第四節給出了實驗的方法和結果,第五節介紹了文章的結論和下一步的工作思路。

1 相關工作

當前的標簽系統大多是由用戶、標簽和資源這三個實體組成,并且這三個實體間互相關聯,即用戶對資源注釋標簽,我們把這種關系記為A,那么標簽系統可以描述為一個四元組,即存在一個用戶集U,標簽集T,資源集R,以及對用戶來說,一個注釋集合A。這樣可以用D來表示整個標簽系統,并定義。注釋集合A定義為一個三元組的集合,其中包含用戶,標簽,以及資源,即:

個性化推薦系統由標簽系統演化而來,秉承“以用戶為中心”的原則,重點研究用戶興趣的獲取方式和獲取效果。在獲取了用戶興趣以后,建立用戶模型,以方便把用戶興趣和資源對應起來,最后通過該用戶模型和資源的匹配,進行個性化的推薦。

基于經典的余弦相似度的算法,Durao和Dolog[1]提出了一個個性化推薦的計算方法,把一些標簽的自身因素融入到了算法中,如標簽的代表性和標簽的流行度等等。此外,他們的文獻中還給出了兩個資源A和B之間的相似度計算公式:

其中cos_similarity(TA,TB)是根據標記在A和B兩個資源上的標簽所計算的余弦相似度,而TA={TA1,TA2,TA3……TAn}。DA和DB是資源的評分,其計算方式為:

其中weigh(Tagi)表示標簽的權重,與該標簽在數據集中出現的次數成正比。而其中的representativness(Tagi)表示標簽的典型度,類似與資源檢索中的詞頻概念。

2 基于時間因子的個性化推薦方法

基于時間因子的個性化推薦方法就是在使用標簽時考慮到每個標簽的時間因子,因此我們提出了如下資源相似度的計算方法:

這與(2)中DA的計算方法有所不同,這樣能夠防止同一標簽出現次數過多而導致該標簽在相似度的計算過程中起到過度決定性作用的情況。

而(3)中的cos_similarity(XATA,XBTB)所表示的是帶有時間因子的余弦相似度計算方法,其計算方式為:

其中XAi的表示所對應標簽的時間因子取值。

對于個性化推薦系統中的所有標簽,它們之間的標注時間肯定是有差異的。因此,如何合理設計時間因子是我們工作的重點。

遵循“最新的標簽最能反映用戶的特征”的思想,我們為時間因子X設計了一個衰減函數:

其函數曲線如下:

其中通過函數計算所得的時間因子X的值的范圍為[1,2],即函數能把最新的標簽所產生的效果翻倍,而最舊的標簽的保持不變。t表示一個時間值,其可取值的區間為[0,1]。為此,我們需要把個性化推薦系統中每個標簽的時間戳si對應到t的[0,1]區間中,數據中最新的時間戳記為s0,對應到[0,1]區間中的0;而最舊的時間戳記為sn對應到1。則系統中的某一時間戳si對應到[0,1]區間中的值ti的計算方法為:

下面的例子能直觀的說明該方法的效果:

上面的例子描述了三部電影之間的關系,它們分別為《木乃伊》、《木乃伊歸來》和《加勒比海盜:黑珍珠的詛咒》。前兩部電影有3個相同的標簽:“John Hannah”、“egypt”和“mummy”,而后兩部的電影有4個相同的標簽:“sequel”、“action”、“adventure”和“comedy”。按照改進前的方法,《木乃伊歸來》和《加勒比海盜:黑珍珠的詛咒》的相似度比《木乃伊》和《木乃伊歸來》的相似度要高。而加入時間因子改進以后,《木乃伊》和《木乃伊歸來》的相似度則相對更高,符合它們是同一系列更相似的常理。

3 實驗

為了驗證本論文提出的方法,我們用Movielens數據展開實驗。MovieLens是歷史最悠久的推薦系統。它由美國Minnesota大學計算機科學與工程學院的GroupLens項目組創辦,是一個非商業性質的、以研究為目的的實驗性站點。MovieLens主要使用Collaborative Filtering和Association Rules相結合的技術,向用戶推薦他們感興趣的電影。Movielens數據集中的每一個標簽均帶有時間戳,為我們的研究提供了條件。

MovieLens數據集包含有10000054個評分,10681部電影,以及71567個用戶對這些電影的所做的95580個標簽。由于標簽是用戶憑自己的喜好所標注,因此對標簽的研究存在著很多的局限性,比如用戶拼寫的錯誤、多義詞等都會對實驗帶來噪音。因此我們必須通過適當的過濾來提高標簽的有效性,提高數據的質量。這里,定義了兩個過濾條件,以提高實驗中數據的質量。首先,只考慮標簽數量至少有15個的電影,其次,只有至少對10部電影做過評價的用戶才會認為是有效的用戶。按照這樣的條件,最終采用的數據的統計信息如表四所示,即有3390部電影,1151個用戶,以及他們所做出的2645個標簽,如表2所示。

表1 實驗數據集統計

在通過我們提出的方法計算完所有電影之間的相似度以后,便采用信息檢索領域的標準度量來評價本文所提出的方法。把數據集分成訓練集和驗證集兩部分,對每一個用戶,我們選取了帶有時間因子的相似度的最高的N部電影作為推薦。然后與該用戶數據集中的電影做對比,來計算推薦的精度。在我們的實驗中,N的取值為5。

基于以上的方法,我們對兩種方法進行了對比:

表2 兩種方法的整體精度

其中 TBR-CS是通過簡單余弦相似度的計算方法:

Similarity(A,B)=(DA+DB)*cos_similarity(TA,TB)。

TBR-TF是基于時間因子的相似度計算方法:

Similarity(A,B)=(DA+DB)*cos_similarity(XATA,XBTB)。

4 結論

實驗比較了兩種方法下,個性化推薦系統的推薦準確度。

從實驗的結果來看基于時間因子的個性化推薦方法有一定的優越性。在今后的工作中,我們將進一步改進時間衰減函數,并考慮更多的影響因素,采用更先進的方法來展開研究。

[1]F.DuraoandDolog,Apersonalizedtag-basedrecommendationin socialwe systems,WorkshoponAdaptationandPersonalizationforWeb2.0,UMAP,09,2009.

[2]F.GedikliandD.Jannach,Ratingitemsbyratingtags,RecSys,10,2010.

[3]S.Zhao,N.Du,A.Nauerz,X.Zhang,Q.Yuan,andR.Fu,Improvedrec ommendationbasedoncollaborativetaggingbehaviors,IUI,08,2008.

[4]A.Shepitsen,J.Gemmell,B.Mobasher,andR.Burke,Personalize drecommendationinsocialtaggingsystemsusinghierarchicalclustering,R ecSys’08,2008.

[5]G.Xu,Y.Gu,P.Dolog,Y.Zhang,andM.Kitsuregawa,SemRec: ASemanticEnhancementFrameworkforTagbasedRecommendation,A AAI’11,2011.

[6]C.Leung,S.Chan,F.Chung,andG.Ngai,Aprobabilisticratinginferencefra meworkformininguserpreferencesfromreviews,www’11,2011.

[7]J.Wiebe,T.Wilson,R.Bruce,M.Bell,andMMartin,Learningsubj ectivelanguage,Comput.Linguist.,Vol.30,pp.277–308,2004.

[8]C.Whitelaw,N.Garg,andS.Argamon,Usingappraisalgroupsfors entimentanalysis,CIKM’05,pp.625–631,2005.

[9]J.KampsandM.Marx,Wordswithattitude,InProc.oftheFirstInte rnationalConferenceonGlobalWordNet,pp.332–341,2002.

[10]B.Pang,L.Lee,andS.Vaithyanathan,Thumbsup?sentimentclass ifcationusingmachinelearningtechniques,InEMNLP,2002.

[11]B.Liu,M.Hu,andJ.Cheng,Opinionobserver:analyzingandcom paringopinionsontheweb,InWWW,pp.342–351,2005.

[12]C.Scaffidi,K.Bierhoff,E.Chang,M.Felker,H.Ng,andC.Jin,RedOpal:product-featurescoringfromreviews,Proceedingsofthe8thAC MconferenceonElectroniccommerce,2007.

[13]L.Zhuang,F.Jing,andX.Zhu.Moviereviewminingandsummar ization,,InProceedingsofthe15thACMinternationalconferenceonInfor mationandknowledgemanagement,pp.43-50,2006.

[14]P.Heymann,D.Ramage,andH.Molina,Socialtagprediction, InSung-HyonMyaeng,DouglasW.Oard,FabrizioSebastiani,Tat-SengChua, andMun-KewLeong,editors,SIGIR,pp.531–538,2008.

猜你喜歡
資源用戶方法
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产激爽大片在线播放| 国产在线拍偷自揄拍精品| 亚洲成aⅴ人在线观看| 黄色三级网站免费| 国产内射在线观看| 国产在线精彩视频论坛| 国产精品一区二区无码免费看片| 免费中文字幕一级毛片| 国产精品无码AV中文| 国产亚洲精久久久久久无码AV | 在线观看视频99| 日韩国产综合精选| 国产精品久久久久久影院| 日本人又色又爽的视频| 不卡无码网| 天堂岛国av无码免费无禁网站| 无码免费的亚洲视频| 高清无码手机在线观看| 亚洲愉拍一区二区精品| 亚洲成人网在线播放| 亚洲精品片911| 原味小视频在线www国产| 久久网欧美| 免费亚洲成人| 毛片视频网| 久久精品最新免费国产成人| 在线精品自拍| 真实国产乱子伦视频| 亚洲午夜综合网| 国产免费a级片| 四虎永久在线视频| 日韩第九页| 亚洲第一极品精品无码| 无码AV高清毛片中国一级毛片| 青青青国产在线播放| 韩国v欧美v亚洲v日本v| 免费国产小视频在线观看| 精品综合久久久久久97超人该| 国产乱子伦手机在线| 久久精品国产精品青草app| 拍国产真实乱人偷精品| 免费一极毛片| 就去吻亚洲精品国产欧美| 欧美午夜小视频| 亚洲久悠悠色悠在线播放| 国产精品香蕉| 色网站在线视频| 中文字幕人妻无码系列第三区| 大香网伊人久久综合网2020| 最新无码专区超级碰碰碰| 精品在线免费播放| 国产福利不卡视频| 亚洲区视频在线观看| 午夜久久影院| 免费黄色国产视频| 亚洲欧美成人综合| 国产又爽又黄无遮挡免费观看| 三级视频中文字幕| av一区二区人妻无码| 欧美a级完整在线观看| 日本高清有码人妻| 欧美精品另类| 国产一级二级在线观看| 亚洲乱强伦| 国产人免费人成免费视频| 91精品免费高清在线| 一级爱做片免费观看久久| 欧美一区福利| 中文成人无码国产亚洲| 高清免费毛片| 色哟哟精品无码网站在线播放视频| 色噜噜综合网| 久久综合五月婷婷| 97免费在线观看视频| 一级毛片a女人刺激视频免费| 国产精品一区不卡| 日本人真淫视频一区二区三区| 99久久精品国产麻豆婷婷| 亚洲色图欧美在线| 5555国产在线观看| 2020精品极品国产色在线观看| 亚洲第一综合天堂另类专|