999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶相似度加權的Slope One算法

2017-01-20 09:44:28田松瑞
軟件 2016年4期
關鍵詞:數據挖掘

摘要:SlopeOne算法基于簡單的線性回歸模型,通過減少響應時間和維護難度,顯著提高了推薦性能。然而SlopeOne算法沒有考慮用戶內部的關聯,同等地使用各個用戶數據進行預測,容易造成偏差,影響推薦質量。本文提出了一種改進的Slope One算法,它將用戶相似度納入考慮并且對評分偏差計算公式進行了修正。基于項目的Slope One算法結合基于用戶的協同過濾算法,提出新的混合推薦算法US-Slope One。在MovieLens數據集上的實驗結果表明,該算法與原Slope One算法相比具有更好的預測準確度和推薦質量。

關鍵詞:協同過濾;用戶相似度;SlopeOne;數據挖掘;個性化推薦

中圖分類號:TP391 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2016.04.015

0 引言

當今互聯網信息量不斷擴大,網絡經濟發展迅猛,信息過載成為社會性問題。個性化推薦系統是解決這一問題的一種有效工具。協同過濾技術在推薦系統,尤其是在電子商務中得到了廣泛的應用,幾乎所有大型電子商務平臺都使用了各種推薦系統,對用戶的特征和喜好進行分析,并提供更具個性化的推薦。協同過濾利用具有相似經驗的用戶群體的偏好信息為特定用戶進行商品或信息的推薦。根據模型的不同,協同過濾可分為基于用戶的協同過濾和基于項目的協同過濾。

Slope One算法是一種基于項目的協同過濾算法,它使用一個線性回歸模型進行預測,在與其他復雜的協同過濾推薦具有同等推薦精度的前提下,花銷更少,更加易于實現。它的簡潔高效使得采用Slope One算法的推薦系統更加易于實現和維護。然而,Slope One算法在進行推薦時,沒有考慮到用戶的作用,用戶間的內在關聯對預測結果起著重要影響。Slope One算法不加區分地采用所有用戶評分數據來計算項目之間的偏差,這就導致一些與當前活躍用戶偏好不同甚至相反的用戶數據同等參與了預測,這會削弱擁有高相似度的用戶的作用效果,使得預測精度降低。采用聚類或動態k近鄰可以去除部分噪聲數據,但卻造成了數據丟失。數據稀疏性問題是當前推薦系統所面臨的主要問題之一。在數據極端稀疏的情況下,數據的缺失將使得推薦效果很不理想。

因此本文提出了一種改進的Slope One算法(US-Slope One),利用用戶相似度對用戶評分差值進行加權,使得擁有不同相似度的用戶數據以不同權重參與預測,實現在盡可能保證不丟失評分信息的前提下,在非稠密數據集中的推薦精度得到提升。

1 Slope one算法理論

1.1 SlopeOne算法

假設推薦系統中有m個用戶和n個項目,分別建立兩個集合U={u1,u2,…,um}和I={i1,i2,…,in},U代表用戶集合,I代表項目集合。推薦算法常用矩陣Rm×n來表示不同用戶對每個項目的評分。行向量Rm表示每個用戶的評分,列向量Rn表示每個項目的得分。為了使計算更加明確,采用ri,j(1≤i≤m,1≤j≤n)表示用戶i對項目j的評分。

SlopeOne算法采用f(x)=x+b進行預測,其中參數6是用戶對兩項目的平均評分偏差。Slope One算法先計算項目ii與其他項目ik之間的平均評分偏差devjk,再預測當前活躍用戶u對目標項目,的可能評分Predictionu,j。定義Sjk為給項目ij和項目ik都評過分的用戶集合,Rj為與項目ij同時被評分的項目集合,count(X)為集合X中的元素個數。SlopeOne算法如下:

(1)

(2)

1.2 加權Slope One算法

為平衡每個項目對目標項目的影響,同時對項目ij和ik評過分的用戶數目sjk將作為權重加入兩項目評分偏差的計算,其中sjk=count(Sjk)。

(3)

1.3 雙極Slope One算法

雙極Slope One算法考慮到用戶對物品的喜好,將項目集合Ijk府劃分為兩部分,一個是用戶評分高于其評分均值的項目集合Ilikejk,剩下的構成Idislikejk。從而分別計算出喜歡偏差devlikejk和不喜歡偏差devdislikejk

(4)

同樣的方法,我們可以計算不喜歡偏差devdislikejk。最后得出評分預測如下:

(5)

2 US-Slope one算法設計

如前一章所述,Slope One算法采用所有用戶評分數據而不考慮相似度問題,當存在大量噪聲數據時,預測準確度會大大降低,導致最終的推薦結果不理想。然而在數據極度稀疏的情況下,往往又希望保留盡可能多的數據,US-Slope One算法針對這一問題,采用用戶相似度進行加權,使得相似度不同的用戶數據以不同權重加入預測。常用的用戶相似性度量方法有余弦相似性,修正余弦相似性,皮爾遜相關系數以及斯皮爾曼相似性等。考慮到不同用戶的評分尺度問題,本文采用修正余弦相似性計算用戶間相似度。若用戶ua和ub的共同評分的項目集合為Iab,用戶ua和ub對項目ic的評分分別為rac和rbc,ra和rb分別表示用戶ua和ub的評分均值,則用戶ua和ub之間的相似度sim(ua,ub)為:

(6)

將用戶相似度作為評分偏差計算的權值,US-Slope One算法如下:

(7)

3 實驗結果及分析

3.1 實驗所用數據集

本實驗所用的數據集是由GroupLens研究產品組田松瑞:基于用戶相似度加權的Slope One算法提供的電影評分數據集Movielens(http://movielens.umn.edu),該數據包括943個用戶對1682部電影的共計100000條評分記錄,其中每位用戶至少對20部電影進行了評分。評分值范圍是1到5分,分值越高代表用戶對電影的評價越好。該數據稀疏度為6.30%。實驗時從該數據集中按一定規則隨機抽取80%的數據作為訓練集,其余20%作為測試集。

3.2 度量標準

用于推薦系統的推薦質量評價的度量標準主要包括統計精度度量方法和決策支持精度度量方法兩種。其中統計精度度量方法的平均絕對誤差MAE(Means AbsoIute Error)和均方根誤差RMSE(RootMean Square Error)由于更易于理解并且能夠更直觀地對推薦質量進行度量,因此成為推薦質量評價最常用的方法。MAE和RMSE的值越小,代表推薦質量越高。本文實驗采用MAE和RMSE作為推薦質量的度量標準。

假設兩個分組P和Q分別代表預測評分集合和實際評分集合,P={p1,P2,…,pN},Q={q1,q2,…,qN}。MAE和RMSE的定義如下:

(8)

(9)

3.3 實驗結果

本實驗將US-slope One算法與基本Slope One算法和加權slope One算法以及雙極Slope One算法進行比較,得到的MAE值和RMsE值分別如圖1和圖2所示。經統計學分析,實驗結果具有代表性。

實驗結果表明,在稀疏數據集上,US-slope One算法的MAE值和RMsE值均明顯低于Slope One算法、加權Slope One算法和雙極Slope One算法,其推薦精度更高。US-Slope One算法總體推薦性能更好,使用用戶相似度進行加權能夠在保證數據量盡可能完整的基礎上顯著提高了預測精度。

4 結論

本文分析了Slope One推薦算法及其改進算法,針對其在數據稀疏情況下利用有限用戶評分數據做出更合理的推薦問題,提出了將用戶相似度作為權重融入預測的US-Slope One算法,在盡可能保證不丟失原始數據的基礎上,更加合理地運用數據。最后,對本算法以及已有算法在稀疏數據集上進行試驗,比較結果表明本算法提升了現有算法對于稀疏數據集的適應性,提高了預測精度和推薦性能。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 综合网天天| 亚洲免费三区| 男人天堂亚洲天堂| 国产精品久久久久婷婷五月| 国产精品手机视频一区二区| 无码专区第一页| 波多野结衣一区二区三区四区视频 | 亚洲欧洲AV一区二区三区| 欧美激情视频一区| 视频二区亚洲精品| 国产精品自在在线午夜区app| 精品久久综合1区2区3区激情| 国产乱人伦偷精品视频AAA| 国产精品香蕉在线| 亚洲日本精品一区二区| 青青草久久伊人| 亚洲动漫h| 国产在线一区视频| 夜夜爽免费视频| 在线无码私拍| 一级不卡毛片| 国产91av在线| 国产福利免费观看| 亚洲av日韩综合一区尤物| 青草免费在线观看| 欧洲熟妇精品视频| 91在线激情在线观看| 国产精品入口麻豆| 亚洲日韩精品欧美中文字幕 | 精品综合久久久久久97| 国产欧美综合在线观看第七页| 国产精品尤物铁牛tv| 人妖无码第一页| 色综合成人| 国产精品黄色片| 久久大香伊蕉在人线观看热2| 精品国产女同疯狂摩擦2| 国产精品亚洲一区二区在线观看| 色噜噜在线观看| 国产农村妇女精品一二区| 亚洲欧美日韩中文字幕在线一区| 看国产毛片| 天堂在线视频精品| 国产精品永久免费嫩草研究院| 一级毛片不卡片免费观看| 亚洲国产天堂在线观看| 国产真实乱子伦视频播放| 国产正在播放| 国产丝袜91| 国产精品高清国产三级囯产AV| 在线亚洲小视频| 国产午夜福利在线小视频| 欧美一级在线| 5555国产在线观看| 亚洲精品在线观看91| 国产尤物在线播放| 亚洲天堂日韩在线| 国产迷奸在线看| 国产96在线 | 人与鲁专区| 久久 午夜福利 张柏芝| 99精品视频播放| 精品久久久久久成人AV| 久久国产乱子伦视频无卡顿| 99re热精品视频国产免费| 四虎永久免费地址| 亚洲午夜福利精品无码| 一级成人a毛片免费播放| 啦啦啦网站在线观看a毛片 | 国产女人综合久久精品视| 这里只有精品在线播放| 国产99视频精品免费视频7| 亚洲综合狠狠| 午夜国产精品视频黄| 色综合日本| 九九九久久国产精品| hezyo加勒比一区二区三区| 在线观看网站国产| 亚洲熟妇AV日韩熟妇在线| 香蕉精品在线| 欧美伊人色综合久久天天| www.日韩三级|