黃 凱,張曦煌
(江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214122)
基于階段時(shí)序效應(yīng)的奇異值分解推薦模型
黃 凱*,張曦煌
(江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214122)
(*通信作者電子郵箱569261386@qq.com)
針對(duì)傳統(tǒng)基于時(shí)序效應(yīng)的奇異值分解(SVD)推薦模型在對(duì)用戶預(yù)測(cè)評(píng)分建模過程中只考慮評(píng)分矩陣,采用復(fù)雜的時(shí)間函數(shù)擬合項(xiàng)目的生命周期、用戶偏好的時(shí)序變化過程,造成模型難于解釋、用戶偏好捕獲不準(zhǔn)、評(píng)分預(yù)測(cè)精度不夠高等問題,提出了一種改進(jìn)的綜合考慮評(píng)分矩陣、項(xiàng)目屬性、用戶評(píng)論標(biāo)簽和時(shí)序效應(yīng)的推薦模型。首先,通過將時(shí)間軸劃分時(shí)間段,利用sigmoid函數(shù)將項(xiàng)目的階段流行度變換為[0,1]區(qū)間上的影響力來改進(jìn)項(xiàng)目偏置;其次,利用非線性函數(shù)將用戶偏置的時(shí)序變化轉(zhuǎn)變?yōu)殡A段評(píng)分均值與總體均值偏差的時(shí)序變化來改進(jìn)用戶偏置;最后,通過捕獲用戶對(duì)項(xiàng)目的階段興趣度,結(jié)合其相似用戶在此時(shí)間段對(duì)該項(xiàng)目的好評(píng)率,生成用戶項(xiàng)目交互作用影響因子,實(shí)現(xiàn)用戶項(xiàng)目交互作用的改進(jìn)。在Movielence 10M和20M電影評(píng)分?jǐn)?shù)據(jù)集上的測(cè)試表明,改進(jìn)模型能更好地捕獲用戶偏好的時(shí)序變化過程,提高評(píng)分預(yù)測(cè)準(zhǔn)確性,均方根誤差平均提高了2.5%。
推薦系統(tǒng);時(shí)序效應(yīng);奇異值分解;項(xiàng)目流行度;協(xié)同過濾
推薦系統(tǒng)作為解決互聯(lián)網(wǎng)“信息過載”的一種有效手段,已得到人們的普遍關(guān)注和高速的發(fā)展,并已發(fā)展成一門獨(dú)立的學(xué)科[1]。尤其自2006年Netflix推薦系統(tǒng)比賽以來,大量關(guān)于推薦系統(tǒng)的算法接踵而至,掀起了推薦系統(tǒng)研究的熱潮。近年的研究中,許多研究員開始關(guān)注時(shí)序效應(yīng)對(duì)用戶興趣愛好的影響,并在傳統(tǒng)的協(xié)同過濾[2-4]、二部圖[5]等推薦算法的基礎(chǔ)上進(jìn)行改進(jìn),取得了一定成果:文獻(xiàn)[6]認(rèn)為項(xiàng)目的最新評(píng)分?jǐn)?shù)據(jù)對(duì)用戶評(píng)分的影響比歷史數(shù)據(jù)更大,提出了一種加權(quán)皮爾遜相關(guān)系數(shù)度量項(xiàng)目相似性的協(xié)同過濾推薦算法,有效提高了用戶最新評(píng)分?jǐn)?shù)據(jù)對(duì)用戶推薦結(jié)果的影響;文獻(xiàn)[7]根據(jù)用戶消費(fèi)項(xiàng)目的時(shí)序行為構(gòu)建用戶(項(xiàng)目)關(guān)系結(jié)構(gòu)圖,并將其成功融合到基于概率矩陣分解的協(xié)同過濾算法中,不僅提高了預(yù)測(cè)精度,而且因子向量也具備一定的解釋性;文獻(xiàn)[8]基于矩陣奇異值分解(Singular Value Decomposition,SVD)技術(shù)提出了一種融合時(shí)序效應(yīng)的奇異值分解推薦模型(TimeSVD),該模型引人時(shí)間函數(shù)擬合用戶偏置、項(xiàng)目偏置、用戶項(xiàng)目交互作用的時(shí)序變化過程,但模型中并未融入引起這些變化的主要因素;文獻(xiàn)[9]將時(shí)間效應(yīng)看成與用戶、項(xiàng)目特征向量同維度的隱因子向量融入到加入偏置的SVD推薦模型(BiasSVD)[10]中,雖精度得到一定的提高,但過多的隱因子容易造成模型的過擬合現(xiàn)象;文獻(xiàn)[11]對(duì)上下文(包括時(shí)間上下文)相關(guān)推薦算法進(jìn)行了階段性綜述,闡述了時(shí)間上下文等信息能對(duì)推薦結(jié)果產(chǎn)生積極的作用。
值得注意的是,現(xiàn)有的各種考慮時(shí)序效應(yīng)的推薦算法大多只針對(duì)評(píng)分矩陣建模(如文獻(xiàn)[7-9]),而忽略了項(xiàng)目本身屬性和用戶評(píng)論標(biāo)簽對(duì)用戶評(píng)分預(yù)測(cè)的影響。本文主要針對(duì)文獻(xiàn)[8]中提出的TimeSVD模型利用復(fù)雜的時(shí)間函數(shù)對(duì)用戶偏好建模,造成模型解釋困難、用戶偏好捕獲不準(zhǔn)、評(píng)分預(yù)測(cè)精度不夠高等一系列問題,在充分挖掘評(píng)分矩陣,項(xiàng)目屬性和用戶評(píng)論標(biāo)簽等有用資源隱藏信息的基礎(chǔ)上,將影響項(xiàng)目偏置、用戶偏置、用戶項(xiàng)目交互作用時(shí)序變化的主要因素融入模型,從而提高模型的評(píng)分預(yù)測(cè)精度。下面先對(duì)BiasSVD和TimeSVD模型進(jìn)行介紹,并在其后章節(jié)詳細(xì)闡述本文改進(jìn)模型的建模思想。

1.1 加入偏置的SVD推薦模型(BiasSVD)
(1)

1.2 考慮時(shí)序效應(yīng)的SVD推薦模型(TimeSVD)
TimeSVD模型在BiasSVD模型的基礎(chǔ)上考慮了時(shí)間t對(duì)基準(zhǔn)預(yù)測(cè)和用戶項(xiàng)目交互作用的影響。模型如下:
bi(tui)=bi+bi,Bin(tui)
(2)
(3)
devu(t)=sign(tui-tu)·|tui-tu|β
(4)
(5)
(6)

TimeSVD模型雖已取得較好的預(yù)測(cè)精度,但整個(gè)模型建立在復(fù)雜的時(shí)間函數(shù)之上,并不能解釋項(xiàng)目的生命周期、用戶興趣愛好隨時(shí)間的變化為何會(huì)是這樣的一個(gè)函數(shù)關(guān)系。與TimeSVD建模思想完全不同的是,本文將這種時(shí)序變化的關(guān)系建模在其主要影響因素基礎(chǔ)之上,從而精確擬合用戶真實(shí)的評(píng)分過程。
2.1 項(xiàng)目偏置bi(tui)的改進(jìn)
不同于TimeSVD模型對(duì)項(xiàng)目偏置的建模,本文認(rèn)為項(xiàng)目的流行度(popularity)在一定程度上影響著項(xiàng)目的基準(zhǔn)得分,因此本文將項(xiàng)目偏置的時(shí)序變化建模在項(xiàng)目的階段流行度基礎(chǔ)之上。


圖1 項(xiàng)目偏置時(shí)間軸時(shí)間段的劃分Fig. 1 Phase division of item bias time axis
項(xiàng)目的階段流行度直接反映為此階段項(xiàng)目得到的評(píng)分和評(píng)論數(shù)的總數(shù), 因此直接對(duì)評(píng)分矩陣和評(píng)論標(biāo)簽進(jìn)行統(tǒng)計(jì),獲取項(xiàng)目i的階段流行度,計(jì)算方法如式(7)所示:
(7)
其中:card{·}為求取集合元素個(gè)數(shù),集合κ(i)、TAG(i)分別為項(xiàng)目i的評(píng)分集合和評(píng)論集合。階段流行度表示為本階段內(nèi)評(píng)分和評(píng)論的人數(shù),不能直接作為項(xiàng)目偏置的影響力,因此需要找到合適的變換方式將流行度值變化為[0,1]區(qū)間上。慶幸的是sigmoid函數(shù)正好滿足這樣的變換,計(jì)算公式為:f(x)=1/[(1+exp(-x))],其能實(shí)現(xiàn)(-∞,+∞)的數(shù)值變換到[0,1]區(qū)間。變換前需要將流行度值作適當(dāng)調(diào)整,調(diào)整方法如式(8)所示:
(8)
其中常數(shù)C對(duì)變換結(jié)果起縮放作用,取值根據(jù)數(shù)據(jù)庫中用戶評(píng)分?jǐn)?shù)量的多少而定。為了使每個(gè)項(xiàng)目流行度影響力幅度可以動(dòng)態(tài)調(diào)整,以適應(yīng)不斷變化的項(xiàng)目偏置,本文為每個(gè)項(xiàng)目引入一個(gè)流行度影響力變換因子γi,則流行度的階段影響力可表示為式(9):
(9)


圖2 項(xiàng)目階段流行度對(duì)項(xiàng)目偏置的影響力Fig. 2 Influence of item phase popularity to item bias
從圖2可以看出,項(xiàng)目階段流行度的影響力隨著時(shí)間的增大呈衰減震蕩的形式,這正符合項(xiàng)目的生命周期過程。考慮到除流行度外還有其他因素對(duì)項(xiàng)目偏置產(chǎn)生影響,本文為每個(gè)項(xiàng)目引入一個(gè)參數(shù)δi表示其他因素造成的項(xiàng)目偏置的變化。這樣項(xiàng)目偏置的時(shí)序變化最終被建模為:
(10)
式(10) 把時(shí)序?qū)?xiàng)目偏置的影響建模為階段流行度對(duì)目偏置的影響,這樣更能反映項(xiàng)目生命周期隨時(shí)間的變化過程,其中bi為項(xiàng)目偏置變化的基準(zhǔn)。
2.2 用戶偏置bu(tui)的改進(jìn)
TimeSVD算法在對(duì)用戶偏置建模時(shí)利用兩種非線性函數(shù)模擬用戶偏置隨時(shí)間可能的變化過程,雖已取得一定效果,但也有其不妥之處。其中式(4)的主要缺點(diǎn)在于隨著時(shí)間的不斷推進(jìn)|tui-tu|的值將不斷增大,這勢(shì)必造成參數(shù)β調(diào)整幅度變得很大,若初始化不恰當(dāng)極有可能造成訓(xùn)練時(shí)均方根誤差不收斂;而式(5)極其復(fù)雜,需對(duì)每個(gè)用戶u指定ku個(gè)控制點(diǎn)(也稱為控制核),一方面ku的值較難確定,另一方面算法復(fù)雜度也大,很難用于實(shí)際的推薦系統(tǒng)。

用戶偏置本身被定義為用戶的評(píng)分均值與總體均值的偏差,此偏差自然反應(yīng)用戶偏置的變化。類似于式(3),用戶偏置階段時(shí)序變化被建模為:
(11)
(12)
式(12)為用戶階段評(píng)分均值,式(11)中各參數(shù)的含義與式(3)相同。這樣建模的好處在于充分利用用戶評(píng)分的階段統(tǒng)計(jì)信息來模擬用戶偏置的變化過程,使模型更加合理可靠。
2.3 用戶項(xiàng)目交互作用的改進(jìn)
本文認(rèn)為正是用戶與項(xiàng)目的交互作用才產(chǎn)生了千變?nèi)f化的評(píng)分。用戶與項(xiàng)目的交互作用,一方面受用戶興趣愛好的影響,另一方面與其相似用戶對(duì)該項(xiàng)目的喜好有很大的關(guān)系。用戶喜歡一個(gè)項(xiàng)目,首先要對(duì)這種類型的項(xiàng)目感興趣,其次是其相似用戶群也覺得這個(gè)項(xiàng)目好,那么這個(gè)項(xiàng)目可能會(huì)得到目標(biāo)用戶的青睞。
基于這種想法,本文對(duì)評(píng)分矩陣、項(xiàng)目屬性進(jìn)行深度挖掘,捕獲用戶在不同時(shí)間段對(duì)不同類型的項(xiàng)目的興趣度以及在此時(shí)間段內(nèi)其相似用戶群對(duì)該項(xiàng)目的好評(píng)率,融合二者以得到用戶項(xiàng)目交互作用影響因子。
為了捕獲用戶在不同時(shí)間段對(duì)不同類型的項(xiàng)目的興趣度,參照文獻(xiàn)[12]為所有項(xiàng)目建立項(xiàng)目屬性表。屬性表為每個(gè)項(xiàng)目附屬了一個(gè)長(zhǎng)度為p的屬性向量(ai,1,ai,2,…,ai,p),i∈[1,m],屬性值1代表該項(xiàng)目具有此屬性,0則無。基于屬性表,結(jié)合用戶評(píng)分矩陣,可以統(tǒng)計(jì)用戶在不同時(shí)間段上對(duì)各個(gè)屬性的評(píng)價(jià)次數(shù),注意這里的時(shí)間段的劃分應(yīng)和用戶偏置時(shí)間段的劃分保持一致。這樣便得到一個(gè)與屬性向量同維度的項(xiàng)目屬性階段評(píng)價(jià)次數(shù)向量:
(13)
其中,wu,i(i=1,2,…,p)為用戶在項(xiàng)目屬性上的評(píng)價(jià)次數(shù)。通過用戶階段屬性評(píng)價(jià)次數(shù)向量,可以了解用戶近期對(duì)項(xiàng)目各個(gè)屬性的感興趣程度,從而進(jìn)一步了解到用戶對(duì)項(xiàng)目的綜合興趣度。
為了消除不同時(shí)間段內(nèi)評(píng)價(jià)次數(shù)大小不一帶來的差異,將用戶階段屬性評(píng)價(jià)次數(shù)向量進(jìn)行歸一化處理,如式(14):
(14)

(15)
(16)

(17)
其中:N1為用戶u的K近鄰中評(píng)分了項(xiàng)目i的用戶數(shù);N2為N1中4分以上評(píng)分的用戶數(shù)(對(duì)于5星級(jí)評(píng)分項(xiàng)目,4分以上為好評(píng))。這樣用戶項(xiàng)目交互作用影響因子為:
ω(u,i,tui)∈[0,1],用戶項(xiàng)目交互作用部分被建模為:
(18)

2.4 改進(jìn)模型的確定
通過前面對(duì)項(xiàng)目偏置、用戶偏置、用戶項(xiàng)目交互作用三部分的改進(jìn),用戶預(yù)測(cè)評(píng)分最終被建模為式(19):
(19)
本文把這個(gè)模型稱作TimeSVD#。為了學(xué)習(xí)模型中的參數(shù)bi、γi、δi、bu、αu、qi、pu、xi、yu,可以最小化以下平方誤差:

‖xi‖2+‖yu‖2)
常量λ控制正則化程度,一般通過交叉驗(yàn)證獲得,最小化過程通過隨機(jī)梯度下降法實(shí)現(xiàn),算法偽代碼如下:
輸入 評(píng)分矩陣、電影屬性、評(píng)論標(biāo)簽;迭代次數(shù)Iter、學(xué)習(xí)步長(zhǎng)η、正則化參數(shù)λ;CI、C、CU;模型參數(shù)bi、γi、δi、bu、αu、β、qi、pu、xi、yu初始化值。
輸出 TimeSVD#模型參數(shù)。
1)
forcount=0;count≤Iter;Iter++ do
2)
foreach (u,i,tui)∈κdo
3)
4)

5)
δi=δi+η·(eui-λδi)
6)
bu=bu+η·(eui-λbu)
7)

8)
fork=0;k 9) qi,k=qi,k+η·(eui·pu,k·ω(u,i,tui)-λ·qi,k) 10) pu,k=pu,k+η·(eui·qi,k·ω(u,i,tui)-λ·pu,k) 11) xi,k=xi,k+η·(eui·yu,k-λ·xi,k) 12) yu,k=yu,k+η·(eui·xi,k-λ·yu,k) 13) η=0.9η 2.5 時(shí)間復(fù)雜度分析 TimeSVD#模型的計(jì)算過程主要包括兩個(gè)步驟:第1步計(jì)算項(xiàng)目的階段流行度影響力、用戶階段評(píng)分均值與總體均值偏差、用戶階段項(xiàng)目屬性評(píng)價(jià)次數(shù)向量和用戶相似性系數(shù)等信息;第2步利用第1步獲得的數(shù)據(jù)計(jì)算各變量的導(dǎo)數(shù),對(duì)模型進(jìn)行訓(xùn)練。 3.1 評(píng)價(jià)標(biāo)準(zhǔn) 本實(shí)驗(yàn)采用推薦系統(tǒng)廣泛使用的均方根誤差(Root Mean Square Error,RMSE)作為性能評(píng)判指標(biāo)。定義為: 3.2 實(shí)驗(yàn)數(shù)據(jù)集 實(shí)驗(yàn)采用著名電影評(píng)分?jǐn)?shù)據(jù)集Movielens 10M和20M,該數(shù)據(jù)集由Minnesota大學(xué)研究項(xiàng)目組GroupLens團(tuán)隊(duì)提供(http://www.gouplens.org),供推薦系統(tǒng)學(xué)習(xí)和科研使用。該數(shù)據(jù)集由ratings.txt、movies.txt、tags.txt三個(gè)文件組成,分別存儲(chǔ)用戶評(píng)分、電影屬性、用戶評(píng)論標(biāo)簽信息。具體信息見表1。 表1 實(shí)驗(yàn)數(shù)據(jù)集Tab. 1 Experimental datasets 本文采取兩種方法提取訓(xùn)練集和測(cè)試集。方法一分別提取每個(gè)用戶最新的20%的數(shù)據(jù)作為測(cè)試集,剩余的80%的數(shù)據(jù)作為訓(xùn)練集;方法二隨機(jī)提取每個(gè)用戶20%的數(shù)據(jù)作為測(cè)試集,剩余的80%的數(shù)據(jù)作為訓(xùn)練集。 3.3 模型參數(shù)的設(shè)置 3.3.1 參數(shù)初始化 3.3.2 學(xué)習(xí)速率η和正則化參數(shù)λ的選取 學(xué)習(xí)速率η不僅影響模型的訓(xùn)練時(shí)間而且影響模型的預(yù)測(cè)精度。其值設(shè)置過大,雖然訓(xùn)練誤差下降快,但是模型參數(shù)調(diào)整粗糙,容易產(chǎn)生過擬合現(xiàn)象;設(shè)置過小,模型參數(shù)調(diào)整精細(xì),但訓(xùn)練時(shí)間較長(zhǎng)。正則化參數(shù)λ也稱懲罰因子,用來避免過擬合現(xiàn)象發(fā)生。圖3顯示了Movielens 20M數(shù)據(jù)集上提取用戶最新的20%的數(shù)據(jù)作為測(cè)試數(shù)據(jù),在不同學(xué)習(xí)率η和正則化參數(shù)λ交叉作用下的RMSE三維圖。圖3呈多波峰多波谷狀,二者對(duì)RMSE的影響并沒有嚴(yán)格的規(guī)律可循,一般的做法是選取效果較好的學(xué)習(xí)率η和正則化參數(shù)λ的組合用于模型的訓(xùn)練。本文設(shè)置η=0.020、λ=0.028,能取得較為理想的效果。 圖3 不同學(xué)習(xí)率η和正則化參數(shù)λ交叉作用下的RMSEFig. 3 Test RMSE under cross influence of different learning rate η and regular parameter λ 3.4 比較實(shí)驗(yàn) 本文選取BiasSVD、TimeSVD1、TimeSVD2(用戶偏置分別使用式(3)和式(5))與TimeSVD#模型進(jìn)行實(shí)驗(yàn)對(duì)比。 圖4顯示了不同測(cè)試集上,訓(xùn)練RMSE降到0.80時(shí),各模型隱因子數(shù)(f)與測(cè)試RMSE的關(guān)系曲線。可以看出,TimeSVD#模型在較少的隱因子數(shù)目下已能取得比其他模型較優(yōu)異的性能,從圖(a)與圖(b)或圖(c)與圖(d)的對(duì)比看出,TimeSVD#對(duì)用戶最新評(píng)分的預(yù)測(cè)更為精準(zhǔn),與其他三個(gè)模型相比,性能平均提高了3.7%,2.5%和1.4%左右, 說明此模型比TimeSVD模型對(duì)用戶近期興趣愛好的捕獲更加準(zhǔn)確,具有更好的實(shí)際應(yīng)用價(jià)值。 圖4 Movielens 10M和20M數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Fig. 4 Experimental results tested on Movielens 10M and 20M datasets 圖5顯示了Movielens 20M數(shù)據(jù)集上,選取用戶最新20%的作為測(cè)試集,f=50時(shí), RMSE與迭代次數(shù)的變化關(guān)系曲線。可以看出TimeSVD#在5次迭代后即表現(xiàn)出比其他模型優(yōu)秀的性能,誤差能收斂到0.82~0.83,與TimeSVD2模型相比,性能平均提高了2.5%; 而且隨著迭代次數(shù)的增加,RMSE仍有下降趨勢(shì),而其他模型幾乎已經(jīng)收斂。主要原因在于TimeSVD#建立在影響項(xiàng)目生命周期和用戶偏好變化的主要因素之上,能有效捕獲它們的變化過程,而TimeSVD模型直接利用函數(shù)進(jìn)行擬合,對(duì)項(xiàng)目生命周期和用戶興趣漂移的正確捕獲具有一定局限性。 圖5 不同迭代次數(shù)下的RMSE變化曲線Fig. 5 RMSE curves under different number of iterations 本文從影響項(xiàng)目偏置、用戶偏置和用戶項(xiàng)目交互作用的主要因素對(duì)用戶偏好建模,通過劃分時(shí)間段的方式充分挖掘評(píng)分矩陣、項(xiàng)目屬性和評(píng)論標(biāo)簽中的有用信息,能有效地捕獲項(xiàng)目生命周期和用戶興趣愛好變化的過程。實(shí)驗(yàn)表明,該模型能有效提高用戶評(píng)分預(yù)測(cè)精度,取得較好的推薦結(jié)果。在接下來的研究中,將嘗試對(duì)模型引入社交網(wǎng)絡(luò)、項(xiàng)目結(jié)構(gòu)網(wǎng)絡(luò)等方面的信息,解決推薦系統(tǒng)用戶冷啟動(dòng)和項(xiàng)目冷啟動(dòng)兩大經(jīng)典難題,同時(shí)尋求并行化策略,使算法在性能和效率兩方面得到進(jìn)一步提升。 References) [1] 王國霞,劉賀平.個(gè)性化推薦系統(tǒng)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2012, 48(7):66-76.(WANG G X, LIU H P. Survey of personalized recommendation system[J]. Computer Engineering and Applications, 2012, 48(7): 66-76.) [2] SARWAR B, KARYPIS G, KONSTAN J, et al. Item-based collaborative filtering recommendation algorithms[C]// Proceedings of the 10th International Conference on World Wide Web. New York: ACM, 2001: 285-295. [3] SALAKHUTDINOV R, MNIH A, HINTON G. Restricted boltzmann machines for collaborative filtering[C]// Proceedings of the 24th International Conference on Machine Learning. New York: ACM, 2007: 791-798. [4] KOREN Y. Factorization meets the neighborhood: a multifaceted collaborative filtering model[C]// Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2008: 426-434. [5] ZHOU T, REN J, MEDO M, et al. Bipartite network projection and personal recommendation[J]. Physical Review E, 2007, 76(4): 046115. [6] DING Y, LI X. Time weight collaborative filtering[C]// Proceedings of the 14th ACM International Conference on Information and Knowledge Management. New York: ACM, 2005: 485-492. [7] 孫光福,吳樂,劉淇,等.基于時(shí)序行為的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào), 2013,24(11):2721-2733.(SUN G F, WU L, LIU Q, et al. Recommendations based on collaborative filtering by exploiting sequential behaviors[J]. Journal of Software, 2013, 24(11): 2721-2733.)[8] KOREN Y. Collaborative filtering with temporal dynamics[J]. Communications of the ACM, 2010, 53(4): 89-97. [9] XIANG L, YANG Q. Time-dependent models in collaborative filtering based recommender system[C]// Proceedings of the 2009 IEEE/WIC/ACM International Joint Conferences on Web Intelligence and Intelligent Agent Technologies. Piscataway, NJ: IEEE, 2009: 450-457. [10] KOREN Y, BELL R, VOLINSKY C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8): 30-37. [11] ADOMAVICIUS G, TUZHILIN A. Context-aware recommender systems[M]// Recommender Systems Handbook. Berlin: Springer, 2011: 217-253. [12] 楊興耀,于炯,吐爾根·依布拉音,等.考慮項(xiàng)目屬性的協(xié)同過濾推薦模型[J].計(jì)算機(jī)應(yīng)用, 2013, 33(11):3062-3066.(YANG X Y, YU J, TURGUN I, et al. Collaborative filtering recommendation models considering item attributes[J]. Journal of Computer Applications, 2013, 33(11):3062-3066.) [13] RESNICK P, IACOVOU N, SUCHAK M, et al. GroupLens: an open architecture for collaborative filtering of netnews[C]// Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work. New York: ACM, 1994: 175-186. HUANG Kai, born in 1988, M. S. candidate. His research interests include data mining, recommender system. ZHANG Xihuang, born in 1962, Ph. D., professor. Her research interests include embedded system, computer networking. Singular value decomposition recommender model based on phase sequential effect HUANG Kai*, ZHANG Xihuang (CollegeofInternetofThingsEngineering,JiangnanUniversity,WuxiJiangsu214122,China) The traditional Singular Value Decomposition (SVD) recommender model based on sequential effect only considers scoring matrix and uses complicated time function to fit item’s life cycle and user’s preferences, which leads to many problems, such as difficult to explain model, inaccurate to capture user’s preferences and low prediction accuracy. In view of the drawbacks, an improved sequential effect model was proposed which considered scoring matrix, item attributes and user rating labels comprehensively. Firstly, the time axis was divided into different phases, the project’s popularity was converted to influence in [0,1] to improve project bias by sigmoid function. Secondly, the time variation changes of the user bias were transformed into time variation changes of user rating mean and overall rating mean by nonlinear function. Finally, the influence factors of the user project interaction were generated to achieve the user project interaction improvement by capturing the user’s interest, combining with favorable rate of the similar users. The tests on the Movielence 10M and 20M movie scoring data sets show that the improved model can better capture the time variation change of user preferences, improve the accuracy of scoring prediction, and improve the root mean square error by 2.5%. recommender system; sequential effect; singular value decomposition(SVD); item popularity; collaborative filtering 2016-09-27; 2016-11-26。 黃凱(1988—),男,貴州畢節(jié)人,碩士研究生,CCF會(huì)員,主要研究方向:數(shù)據(jù)挖掘、推薦系統(tǒng); 張曦煌(1962—),男,江蘇無錫人,教授,博士,主要研究方向:嵌入式系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)。 1001-9081(2017)05-1392-05 10.11772/j.issn.1001-9081.2017.05.1392 TP311.13 A3 實(shí)驗(yàn)評(píng)估





4 結(jié)語