999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聯(lián)合用戶興趣矩陣及全局偏好的推薦算法*

2018-02-05 03:46:11張以文艾曉飛崔光明錢付蘭
計(jì)算機(jī)與生活 2018年2期
關(guān)鍵詞:差異用戶服務(wù)

張以文,艾曉飛,崔光明,錢付蘭

1.安徽大學(xué) 計(jì)算智能與信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室,合肥 230031

2.安徽大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,合肥 230601

1 引言

隨著科技的進(jìn)步、時(shí)代的發(fā)展,大量的相似服務(wù)和新用戶出現(xiàn)在推薦系統(tǒng)中。傳統(tǒng)的推薦算法已經(jīng)很難從如此龐大的候選服務(wù)集中選出滿足用戶個(gè)性化偏好的服務(wù)。如何從用戶的歷史行為中更深層次地挖掘出用戶的個(gè)性化偏好,做出更精確的推薦,已成為研究的熱點(diǎn)問題。協(xié)同過濾作為應(yīng)用最為廣泛、研究最為深入的推薦算法,已得到廣泛應(yīng)用[1-2],其主要分為基于用戶的協(xié)同過濾推薦算法和基于項(xiàng)目的協(xié)同過濾推薦算法。基于用戶的協(xié)同過濾推薦算法的核心在于計(jì)算用戶間的相似度,從而求得目標(biāo)用戶的鄰居用戶集;基于項(xiàng)目的協(xié)同過濾推薦算法的核心在于計(jì)算項(xiàng)目之間的相似度,從而求得目標(biāo)項(xiàng)目的鄰居項(xiàng)目集,因此相似度計(jì)算是關(guān)鍵。目前常用的相似度計(jì)算方法主要有皮爾遜相似度、余弦相似度、歐幾里德距離相似度等。

然而,傳統(tǒng)的相似度計(jì)算方法存在各自的缺陷,例如現(xiàn)有方法往往僅考慮兩個(gè)用戶共同調(diào)用的服務(wù)集合,未考慮用戶的個(gè)性化偏好信息等。一般而言,兩個(gè)用戶的服務(wù)評(píng)分集合中會(huì)存在未重合部分,即只有一方調(diào)用過的服務(wù)集合,而傳統(tǒng)的相似度計(jì)算方法忽略了這一部分的隱藏偏好。如何深層次地挖掘用戶的個(gè)性化偏好信息,對(duì)于推薦系統(tǒng)推薦精度的提高至關(guān)重要。用戶個(gè)性化偏好信息中比較重要的兩種信息分別是用戶認(rèn)知差異和用戶行為差異,其中用戶認(rèn)知差異主要反映用戶對(duì)一系列服務(wù)的認(rèn)同情況,行為差異主要反映用戶的不理性打分情況。因此,如何運(yùn)用好用戶的個(gè)性化隱藏偏好,對(duì)推薦算法的精確度至關(guān)重要。

基于上述問題,本文提出了一種融合用戶興趣矩陣及全局偏好的推薦算法,主要貢獻(xiàn)如下:

(1)在建立服務(wù)興趣標(biāo)簽機(jī)制的基礎(chǔ)上,提取出用戶興趣矩陣模型。具體而言,對(duì)用戶服務(wù)評(píng)分集合中未評(píng)價(jià)服務(wù)進(jìn)行填充,對(duì)已評(píng)價(jià)服務(wù)進(jìn)行互補(bǔ),得到了每位用戶的興趣矩陣,并取每?jī)晌挥脩舻呐d趣矩陣歐幾里德距離作為局部相似度。本文模型可有效地減少數(shù)據(jù)集稀疏性,同時(shí)融入了用戶的個(gè)性化偏好信息。

(2)引入用戶認(rèn)知差異和用戶行為差異機(jī)制。認(rèn)知差異采用余弦相似度計(jì)算,行為差異采用用戶服務(wù)評(píng)分集合的平均值和方差來反映,并結(jié)合二者作為全局偏好相似度,能夠更深層次地挖掘用戶的個(gè)性化偏好信息。

(3)綜合局部相似度和全局偏好相似度形成最終的用戶相似度,進(jìn)行鄰居用戶選擇和評(píng)分預(yù)測(cè)。在MovieLens 1M真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明本文的推薦算法具有更高的精確度和穩(wěn)定性,同時(shí)實(shí)現(xiàn)起來簡(jiǎn)單、快速。

本文組織結(jié)構(gòu)如下:第2章介紹了推薦系統(tǒng)中的相關(guān)工作;第3章是問題建模;第4章重點(diǎn)描述了本文算法框架及其實(shí)現(xiàn)過程;第5章給出了實(shí)驗(yàn)結(jié)果與分析;最后對(duì)全文工作進(jìn)行了總結(jié)與展望。

2 相關(guān)工作

協(xié)同過濾推薦相對(duì)成熟并已被廣泛應(yīng)用于各種推薦場(chǎng)景。除此之外,目前流行的推薦技術(shù)還包括基于內(nèi)容的推薦[3-5]以及混合推薦[6]?;趦?nèi)容的推薦主要是根據(jù)用戶以往的歷史使用記錄來推薦相似的服務(wù),它簡(jiǎn)單易于實(shí)現(xiàn),但效果一般,普適性不高?;旌贤扑]算法主要是使用不同方法結(jié)合協(xié)同過濾推薦算法和基于內(nèi)容的推薦算法。

Sarwar等人首次提出基于項(xiàng)目相似性的協(xié)同過濾推薦算法[7],使用Person和余弦作為相似度計(jì)算依據(jù)。近年來,很多改進(jìn)算法相繼提出。鄧愛林等人提出了基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過濾推薦算法[8],該算法同樣基于項(xiàng)目評(píng)分填充的思想,運(yùn)用基于項(xiàng)目的協(xié)同過濾算法進(jìn)行評(píng)分填充,再利用基于用戶的協(xié)同過濾算法產(chǎn)生推薦。Tan等人提出了基于項(xiàng)目分類的協(xié)同過濾算法[9],算法利用項(xiàng)目標(biāo)簽對(duì)項(xiàng)目進(jìn)行聚類,產(chǎn)生多個(gè)子數(shù)據(jù)集,然后在子數(shù)據(jù)集中進(jìn)行協(xié)同過濾推薦。以上算法雖然實(shí)現(xiàn)簡(jiǎn)單,但并沒有融入用戶個(gè)性化偏好信息,推薦精度較差。

現(xiàn)在也有很多工作傾向于去挖掘出用戶更多的個(gè)性化偏好。例如:Fletcher等人提出了一種基于用戶個(gè)性化偏好的推薦系統(tǒng)[10],為每個(gè)用戶都定義了一個(gè)滿意區(qū)間,將用戶評(píng)分映射到該區(qū)間內(nèi),用映射之后的評(píng)分值代替原有評(píng)分值進(jìn)行相似度計(jì)算。Ahn提出了一種新的相似度計(jì)算方法以緩和冷啟動(dòng)問題[11],引入了一種混合相似度計(jì)算方法,包括Proximity、Impact、Popularity三部分,Proximity考慮了用戶評(píng)分積極性和消極性的影響,Impact考慮了用戶的認(rèn)知差異,Popularity考慮了用戶的行為差異,較好地融入了用戶個(gè)性化信息。Liu等人提出聯(lián)合用戶信息、服務(wù)信息以及服務(wù)潛在相關(guān)性的服務(wù)推薦算法[12],算法從用戶、服務(wù)以及服務(wù)之間的關(guān)系中挖掘用戶個(gè)性化偏好信息。上述算法較好地融入了用戶的個(gè)性化偏好信息,但算法實(shí)現(xiàn)時(shí)間復(fù)雜度過高,有的需要額外的訓(xùn)練數(shù)據(jù),而且都不能在緩和數(shù)據(jù)集稀疏性問題的同時(shí)實(shí)現(xiàn)用戶的個(gè)性化推薦。為此,本文提出了興趣矩陣填充互補(bǔ)數(shù)據(jù)集以減少數(shù)據(jù)集稀疏性,同時(shí)融入了用戶個(gè)性化信息,最后聯(lián)合用戶全局偏好信息產(chǎn)生更為有效的個(gè)性化推薦。

3 問題建模

假設(shè)用戶集合表示為U={u1,u2,…,un},服務(wù)集合表示為S={s1,s2,…,sm},那么可定義n個(gè)用戶對(duì)m個(gè)服務(wù)的評(píng)分矩陣為。其中表示用戶ui對(duì)服務(wù)sj的評(píng)分,服務(wù)的評(píng)分區(qū)間定義為[r1,r2],用戶ui的服務(wù)評(píng)分集合為USi={[s1,r1],[s2,r2],…,[sc,rc]}。下面首先給出若干相關(guān)定義。

定義1(興趣標(biāo)簽集合I)興趣標(biāo)簽集合記為I={i1,i2,…,ip},其中:

(1)ik(k∈[1,p])表示第k個(gè)興趣標(biāo)簽;

(2)p表示集合的模長(zhǎng)。

針對(duì)每一種推薦系統(tǒng),相應(yīng)的興趣標(biāo)簽集合I都是不同的。具體而言,電影推薦系統(tǒng)的集合I通常包含恐怖、喜劇、愛情、動(dòng)作等,而服裝類推薦系統(tǒng)主要包含顏色種類、材質(zhì)種類、大小等。一般由服務(wù)提供商提供,是規(guī)定好的固定集合。

定義2(服務(wù)興趣鏈SI)服務(wù)興趣鏈集合記為SI={[i1,1],[i2,1],…,[ia,1]},其中:

(1)ik∈I(k∈[1,a])表示服務(wù)所包含的標(biāo)簽歸屬于興趣標(biāo)簽集合I;

(2)[ik,1](k∈[1,a])表示對(duì)興趣標(biāo)簽ik的偏好值為1;

(3)a表示集合的模長(zhǎng);

(4)SIj表示服務(wù)sj的服務(wù)興趣鏈。

每一個(gè)服務(wù)都存在一個(gè)SI,描述了它們的屬性、特征等信息,一般由服務(wù)運(yùn)營(yíng)商提供。

定義3(用戶興趣鏈UI)用戶興趣鏈集合記為UI={[i1,p1],[i2,p2],…,[ib,pb]},其中:

(1)ik∈I(k∈[1,b])表示用戶感興趣的標(biāo)簽歸屬于興趣標(biāo)簽集合I;

(2)[ik,pk](k∈[1,b])表示對(duì)興趣標(biāo)簽ik的偏好值為pk;

(4)b表示集合的模長(zhǎng);

(5)UIi表示用戶ui的用戶興趣鏈。

每一個(gè)用戶都存在一個(gè)UI,描述了用戶對(duì)他感興趣的興趣標(biāo)簽的偏好值集合,反映了該用戶的個(gè)性化偏好。

4 基于興趣矩陣和全局偏好的推薦算法

4.1 推薦算法框架

根據(jù)前文的描述,本文的推薦算法主要由兩部分組成:

(1)生成興趣矩陣相似度作為局部相似度;

(2)生成全局偏好相似度。

具體推薦流程如圖1所示。

Fig.1 Recommendation algorithm process圖1 推薦算法流程

本文算法具體思路描述如下:

(1)首先基于目標(biāo)用戶得到候選用戶集合,即調(diào)用過待預(yù)測(cè)項(xiàng)目的用戶集合,并且對(duì)目標(biāo)用戶和候選用戶集合中的所有用戶求得用戶興趣鏈;其次基于用戶的服務(wù)評(píng)分集合對(duì)于目標(biāo)用戶和候選用戶集合中的每一位用戶分別求出興趣矩陣,同時(shí)對(duì)已評(píng)分服務(wù)進(jìn)行融合,未評(píng)分服務(wù)進(jìn)行填充;最后與目標(biāo)用戶分別求解得到興趣矩陣的歐幾里德距離作為用戶之間的局部相似度Interest(ui,ui)。

(2)基于用戶的服務(wù)評(píng)分集合,首先求得目標(biāo)用戶與候選用戶集合中的每一位用戶的余弦相似度作為認(rèn)知差異;其次求解得到全局行為差異;最后綜合認(rèn)知差異和全局行為差異作為用戶之間的全局偏好相似度sim(ux,uy)gi。

(3)將用戶之間的局部相似度Interest(ui,ui)和全局偏好相似度sim(ux,uy)gi相加作為目標(biāo)用戶和候選用戶集合中的每一位用戶的最終相似度,進(jìn)而解得鄰居用戶集合,最終得到預(yù)測(cè)評(píng)分,從而形成推薦。

4.2 興趣矩陣的建立

4.2.1 用戶興趣鏈的提取

前文已經(jīng)提到了興趣標(biāo)簽通常都是由服務(wù)運(yùn)營(yíng)商所提供的,并且應(yīng)用也較為廣泛[13-14]。例如網(wǎng)易云音樂中的歌曲就提供了標(biāo)簽信息,可供用戶選擇;豆瓣電影也提供了諸多的標(biāo)簽信息。因此興趣標(biāo)簽的提取也較為簡(jiǎn)單易行,興趣標(biāo)簽的提取也就是為每個(gè)用戶建立起用戶興趣鏈UI,其生成過程用算法1描述。

算法1用戶興趣鏈的生成

針對(duì)于USi里的每個(gè)服務(wù)sj(j∈[1,m])都會(huì)有相應(yīng)的服務(wù)興趣鏈SIj(j∈[1,m]),累計(jì)所有的服務(wù)興趣鏈的各興趣標(biāo)簽的偏好值可以得到用戶ui(i∈[1,n])的用戶興趣鏈UIi。同時(shí)為了標(biāo)準(zhǔn)化,用每個(gè)興趣標(biāo)簽偏好值占總偏好值的比例來代替興趣標(biāo)簽偏好值,得到最終用戶興趣鏈UIi={[i1,p1],[i2,p2],…,[ib,pb]},這里pk(k∈[1,b])在[0,1]之間,同時(shí)滿足。例如用戶u1的歷史調(diào)用服務(wù)集合US1為{s1,s2,s3},然后服務(wù)s1、s2、s3的服務(wù)興趣鏈SI1、SI2、SI3分別為 {[a,1],[b,1],[c,1]}、{[b,1],[c,1],[d,1]}、{[a,1],[c,1],[d,1]},那么可以得到用戶u1的用戶興趣鏈為UI1={[a,2],[b,2],[c,3],[d,2]},標(biāo)準(zhǔn)化為{[a,0.222],[b,0.222],[c,0.333],[d,0.222]}。

4.2.2 用戶興趣鏈的提取

用戶興趣鏈建立完成之后,傳統(tǒng)推薦算法在計(jì)算兩個(gè)用戶相似度時(shí)一般只考慮其共同調(diào)用服務(wù)部分,而忽略了只有一個(gè)用戶調(diào)用過的服務(wù)集合,因此要用隱性評(píng)分對(duì)另一個(gè)用戶相應(yīng)的未調(diào)用服務(wù)集合進(jìn)行填充。兩個(gè)用戶之間興趣矩陣缺失值填充算法如算法2所示。

算法2兩個(gè)用戶之間興趣矩陣缺失值填充

其中,Ci表示用戶ui需要評(píng)分填充的部分,即在用戶ui和uj的服務(wù)評(píng)分集合之間,用戶uj評(píng)分過而ui未評(píng)分過的項(xiàng)目。Cj同理。I和J分別表示屬于用戶ui和uj的隱性評(píng)分。算法實(shí)現(xiàn)機(jī)制主要是針對(duì)填充部分中的待填充服務(wù)sj。首先遍歷sj的服務(wù)興趣鏈SIj,對(duì)于每一個(gè)興趣標(biāo)簽,從該用戶的用戶興趣鏈中找出該用戶對(duì)其的偏好值,全部累加可得到該用戶對(duì)待填充服務(wù)的隱性評(píng)分,用隱性評(píng)分填充該服務(wù)評(píng)分值。

4.2.3 興趣矩陣的互補(bǔ)以及局部相似度的生成

獲得了填充之后的用戶興趣矩陣之后,還要對(duì)用戶調(diào)用過的項(xiàng)目進(jìn)行互補(bǔ),即加入隱性評(píng)分來使用戶的評(píng)分更加個(gè)性化,從而更全面地反映用戶的興趣偏好。并取最后的興趣矩陣的歐幾里德距離作為局部相似度。用戶間完全興趣矩陣及局部相似度生成算法如算法3所示。

算法3完全興趣矩陣以及局部相似度的生成

這里采用用戶的評(píng)分即顯性評(píng)分和隱性評(píng)分取平均值的方法作為用戶最終的評(píng)分信息。又因?yàn)轱@性評(píng)分信息的區(qū)間是在[r1,r2]之間,所以這里除以r2將顯性評(píng)分標(biāo)準(zhǔn)化到[0,1]之間。同時(shí)在求解歐幾里德距離時(shí),也考慮到了共同調(diào)用服務(wù)部分所占比例的影響。具體措施為:在計(jì)算服務(wù)sj時(shí),若該服務(wù)是共同調(diào)用的服務(wù),那么評(píng)分差值系數(shù)為1;相反若是單個(gè)用戶調(diào)用的項(xiàng)目,評(píng)分差值的系數(shù)為exp(1-共同調(diào)用服務(wù)比例)。

4.3 全局偏好

4.3.1 基于余弦相似度的用戶認(rèn)知差異

傳統(tǒng)的相似度計(jì)算方法往往只考慮了用戶評(píng)分之間的差異性,而忽略了用戶對(duì)服務(wù)集合的認(rèn)知差異,這里引入了余弦相似度來反映用戶之間的認(rèn)知差異。余弦相似度主要利用兩個(gè)用戶之間的服務(wù)評(píng)分集合所形成的評(píng)分矩陣的夾角余弦值來反映它們的認(rèn)知程度,也即是它們的偏離程度。例如用戶u1和u2的評(píng)分矩陣的相同部分分別為[3,3,3]和[5,5,5],那么它們的偏離程度為0,也就是他們的認(rèn)知程度完全一樣,他們認(rèn)為這3樣物品同樣好。其計(jì)算方式如式(1):

4.3.2 基于全局行為的用戶偏好

同時(shí)也注意到在實(shí)際運(yùn)行的推薦系統(tǒng)中,肯定存在這樣一群用戶,他們擁有自己的打分習(xí)慣,不管這樣物品有多么令他不滿意,他還是會(huì)打一個(gè)不低的分?jǐn)?shù);相反的不管這樣物品多么令他滿意,他也只是會(huì)打一個(gè)不高的分?jǐn)?shù),這種用戶全局行為的差異也要在推薦系統(tǒng)中反映出來。另外,一個(gè)用戶也可能是一個(gè)極其隨意的用戶,根據(jù)他當(dāng)時(shí)的心情隨意地打分,這樣的用戶難以成為試驗(yàn)對(duì)象,他的評(píng)分集合方差勢(shì)必極大,因此也要將這些用戶和正常的用戶區(qū)分開來。為此引入了全局行為誤差[15],其計(jì)算方式如式(2):

4.3.3 全局偏好的生成

最后用戶全局偏好相似度的生成應(yīng)該基于用戶認(rèn)知程度差異和全局行為差異,這里采用的是將兩者相加的方法,因?yàn)閮烧叨际桥c用戶相似度正相關(guān),所以相加后也是與用戶相似度正相關(guān)。同時(shí)也考慮到因?yàn)橛嘞蚁嗨贫却嬖跒?的情況,此時(shí)兩個(gè)用戶之間認(rèn)知程度無法估計(jì),所以為0,如果采用相乘的話,會(huì)導(dǎo)致整個(gè)用戶全局偏好差異也為0,就抹殺了全局行為差異。最后的用戶全局偏好差異計(jì)算方式如下:

5 實(shí)驗(yàn)結(jié)果與分析

5.1 數(shù)據(jù)集

本文實(shí)驗(yàn)采用的是GroupLens提供的MovieLens數(shù)據(jù)集作為各個(gè)對(duì)比算法的訓(xùn)練集以及測(cè)試集。它包含了6 040個(gè)用戶對(duì)3 900部電影的1 000 209條評(píng)分信息,它是一個(gè)評(píng)分?jǐn)?shù)據(jù)集,其中用戶的評(píng)分區(qū)間在[1,5]之間。

同時(shí)為了模擬數(shù)據(jù)集的稀疏性問題,本文隨機(jī)分割數(shù)據(jù)集,使得訓(xùn)練集和測(cè)試集的比例分別為5∶5、6∶4、7∶3、8∶2、9∶1。同時(shí)在鄰居用戶數(shù)量為5、10、15、20、25時(shí)分別進(jìn)行實(shí)驗(yàn),得到最終結(jié)果。

5.2 評(píng)測(cè)指標(biāo)

本文實(shí)驗(yàn)采用了已經(jīng)獲得的評(píng)分集合進(jìn)行離線訓(xùn)練與評(píng)估,同時(shí)為保證從各個(gè)方面來驗(yàn)證本文算法的準(zhǔn)確性,劃分了多個(gè)訓(xùn)練集與測(cè)試集的比例,也在不同鄰居用戶數(shù)量的基礎(chǔ)上進(jìn)行全面實(shí)驗(yàn)。主要采用以下兩種常用的評(píng)測(cè)指標(biāo)。

(1)平均絕對(duì)誤差(mean absolute error,MAE)[16]

(2)均方根誤差(root mean squared error,RMSE)[17]

其中,N代表測(cè)試集要測(cè)試的服務(wù)數(shù)量;Ru,v代表用戶u對(duì)服務(wù)v的真實(shí)評(píng)分;代表推薦系統(tǒng)所推薦的分?jǐn)?shù)。

Fig.2 Change of MAE on train set∶test set=5∶5圖2 訓(xùn)練集和測(cè)試集比例為5∶5時(shí)MAE變化

5.3 實(shí)驗(yàn)結(jié)果分析

以下實(shí)驗(yàn)主要是對(duì)本文的推薦算法(dem)與相似度計(jì)算方法為皮爾遜相似度(person)、余弦相似度(cos)、歐幾里德相似度(em)3種傳統(tǒng)的基于用戶的協(xié)同過濾推薦算法進(jìn)行比較,驗(yàn)證算法的精確度和穩(wěn)定性。

(1)鄰居用戶數(shù)量的影響

為驗(yàn)證本文算法在精確度上的提升,在設(shè)定訓(xùn)練集與測(cè)試集不同比例的情況下,變化鄰居用戶數(shù)量從5到25,分別計(jì)算求得4種算法的MAE和RMSE,實(shí)驗(yàn)結(jié)果如圖2~圖11所示。

從上述實(shí)驗(yàn)結(jié)果圖中可以看出,在相同的訓(xùn)練集和測(cè)試集比例下,對(duì)于不同鄰居數(shù)量,本文算法的MAE和RMSE均明顯低于其他算法,因此本文算法具有更好的精確度。

這是因?yàn)楸疚脑谟脩麸@性評(píng)分中融入基于用戶興趣鏈得到的隱性評(píng)分,從而綜合得到了用戶最終的評(píng)分。基于此求得了用戶興趣矩陣,這樣就有效減少了數(shù)據(jù)集稀疏度,并且使得用戶的評(píng)分更加符合用戶的個(gè)性化偏好。同時(shí)用戶認(rèn)知差異的引入使得那些認(rèn)知相似但是評(píng)分差距較大的用戶變得更加相似,全局行為差異的加入也剔除了那些隨意打分或者打分習(xí)慣不好的用戶。因此本文推薦算法的精確度有了較大提升。最后隨著鄰居用戶數(shù)量的增加,4種算法誤差逐步減小,并趨于穩(wěn)定,這是樣本容量增加的結(jié)果。

(2)訓(xùn)練集與測(cè)試集比例的影響

Fig.3 Change of RMSE on train set∶test set=5∶5圖3 訓(xùn)練集和測(cè)試集比例為5∶5時(shí)RMSE變化

Fig.4 Change of MAE on train set∶test set=6∶4圖4 訓(xùn)練集和測(cè)試集比例為6∶4時(shí)MAE變化

Fig.5 Change of RMSE on train set∶test set=6∶4圖5 訓(xùn)練集和測(cè)試集比例為6∶4時(shí)RMSE變化

Fig.6 Change of MAE on train set∶test set=7∶3圖6 訓(xùn)練集和測(cè)試集比例為7∶3時(shí)MAE變化

Fig.7 Change of RMSE on train set∶test set=7∶3圖7 訓(xùn)練集和測(cè)試集比例為7∶3時(shí)RMSE變化

Fig.8 Change of MAE on train set∶test set=8∶2圖8 訓(xùn)練集和測(cè)試集比例為8∶2時(shí)MAE變化

Fig.9 Change of RMSE on train set∶test set=8∶2圖9 訓(xùn)練集和測(cè)試集比例為8∶2時(shí)RMSE變化

Fig.10 Change of MAE on train set∶test set=9∶1圖10 訓(xùn)練集和測(cè)試集比例為9∶1時(shí)MAE變化

Fig.11 Change of RMSE on train set∶test set=9∶1圖11 訓(xùn)練集和測(cè)試集比例為9∶1時(shí)RMSE變化

Table 1 Effect of dataset sparsity on algorithm stability表1 數(shù)據(jù)集稀疏性對(duì)算法穩(wěn)定性的影響

為測(cè)試本文算法能在多大程度上緩和數(shù)據(jù)集稀疏性問題,同時(shí)驗(yàn)證算法穩(wěn)定性,本文在固定鄰居用戶數(shù)量情況下,分別求得在訓(xùn)練集占不同比例情況下4種算法的MAE和RMSE,實(shí)驗(yàn)結(jié)果如表1所示。

從表1中可知,在訓(xùn)練集所占比例相同的情況下,本文算法擁有最好的推薦精確度。同時(shí)隨著訓(xùn)練集所占比例的增加,本文算法精確度穩(wěn)定提升,而其他算法基本不變化甚至有所下降。

這是因?yàn)楸疚睦糜脩襞d趣鏈生成了用戶的隱性評(píng)分,對(duì)用戶已評(píng)分服務(wù)進(jìn)行糅合,未評(píng)分服務(wù)進(jìn)行填充,有效降低了數(shù)據(jù)集稀疏性;并且使得用戶評(píng)分更加真實(shí)有效,符合用戶興趣。同時(shí)全局行為差異的引入將那些不可靠用戶剔除,有效地選取鄰居用戶。因此本文算法具有較好的穩(wěn)定性,不會(huì)受到數(shù)據(jù)集稀疏性較大的影響,同時(shí)又具有較好的精確度。

綜上所述,相對(duì)于傳統(tǒng)的推薦算法而言,本文算法具有更高的精確性和穩(wěn)定性,能夠充分地從用戶的服務(wù)評(píng)分集合中挖掘出用戶個(gè)性化偏好信息。

6 總結(jié)

本文在利用用戶興趣鏈對(duì)用戶服務(wù)評(píng)分集合進(jìn)行填充互補(bǔ),形成用戶興趣矩陣基礎(chǔ)上,基于用戶興趣矩陣的歐幾里德距離進(jìn)行局部相似度計(jì)算,運(yùn)用余弦相似度形成認(rèn)知差異和全局行為差異構(gòu)成全局偏好相似度,并聯(lián)合局部相似度和全局偏好相似度形成最后的用戶相似度得到鄰居用戶,產(chǎn)生推薦結(jié)果。相對(duì)于傳統(tǒng)的協(xié)同過濾算法,本文推薦算法在緩和了數(shù)據(jù)集稀疏性的同時(shí),可有效地進(jìn)行用戶個(gè)性化推薦。接下來的研究中,進(jìn)一步驗(yàn)證本文算法在大數(shù)據(jù)環(huán)境下的有效性和穩(wěn)定性。

[1]Bobadilla J,Ortega F,Hernando A,et al.Recommender systems survey[J].Knowledge-Based Systems,2013,46(1):109-132.

[2]Jiang Shuhui,Qian Xueming,Shen Jialie,et al.Author topic model-based collaborative filtering for personalized POI recommendations[J].IEEE Transactions on Multimedia,2015,17(6):907-918.

[3]Adomavicius G,Tuzhilin A.Context-aware recommender systems[M]//Ricci F,Rokach L,Shapira B,et al.Recommender Systems Handbook.Boston:Springer,2011:217-253.

[4]Zheng Yong,Mobasher B,Burke R D.The role of emotions in context-aware recommendation[C]//Proceedings of the 3rd Workshop on Human Decision Making in Recommender Systems in Conjunction with the 7th ACM Conference on Recommender Systems,Hong Kong,China,Oct 12,2013.New York:ACM,2013:21-28.

[5]Lu Zhongqi,Dou Zhicheng,Lian Jianxun,et al.Contentbased collaborative filtering for news topic recommendation[C]//Proceedings of the 29th Conference on Artificial Intelligence,Austin,Jan 25-30,2015.Menlo Park:AAAI,2015:217-223.

[6]de Campos L M,Fernández-Luna J M,Huete J F,et al.Combining content-based and collaborative recommendations:a hybrid approach based on Bayesian networks[J].International Journal ofApproximate Reasoning,2010,51(7):785-799.

[7]Sarwar B M,Karypis G,Konstan J A,et al.Item-based collaborative filtering recommendation algorithms[C]//Proceedings of the 10th International World Wide Web Conference,Hong Kong,China,May 1-5,2001.New York:ACM,2001:285-295.

[8]Deng Ailin,Zhu Yangyong,Shi Baile.A collaborative filtering recommendation algorithm based on item rating prediction[J].Journal of Software,2003,14(9):1621-1628.

[9]Tan Hengsong,Ye Hongwu.A collaborative filtering recommendation algorithm based on item classification[C]//Proceedings of the 2009 Pacific-Asia Conference on Circuits,Communications and Systems,Chengdu,May 16-17,2009.Washington:IEEE Computer Society,2009:694-697.

[10]Fletcher K K,Liu X F.A collaborative filtering method for personalized preference-based service recommendation[C]//Proceedings of the 2015 International Conference on Web Services,New York,Jun 27-Jul 2,2015.Washington:IEEE Computer Society,2015:400-407.

[11]Ahn H J.A new similarity measure for collaborative filtering to alleviate the new user cold-starting problem[J].Information Sciences,2008,178(1):37-51.

[12]Liu Xumin,Fulia I.Incorporating user,topic,and service related latent factors into Web service recommendation[C]//Proceedings of the 2015 International Conference on Web Services,New York,Jun 27-Jul 2,2015.Washington:IEEE Computer Society,2015:185-192.

[13]Sun Hongfei,Wu Huijuan,Zhou Lanping.Research on personalized information recommendation model based on the label[J].Information Science,2013,31(4):24-27.

[14]Zheng Yong,Mobasher B,Burke R D.Context recommendation using multi-label classification[C]//Proceedings of the 2014 International Joint Conferences on Web Intelligence and Intelligent Agent Technologies,Warsaw,Aug 11-14,2014.Washington:IEEE Computer Society,2014:288-295.

[15]Liu Haifeng,Hu Zheng,Mian A,et al.A new user similarity model to improve the accuracy of collaborative filtering[J].Knowledge-Based Systems,2014,56(3):156-166.

[16]Tang Mingdong,Dai Xiaoling,Cao Buqing,et al.WSWalker:a random walk method for QoS-aware Web service recommendation[C]//Proceedings of the 2015 International Conference on Web Services,New York,Jun 27-Jul 2,2015.Washington:IEEE Computer Society,2015:591-598.

[17]Zhou Zuojian,Wang Binbin,Guo Jie,et al.QoS-aware Web service recommendation using collaborative filtering with PGraph[C]//Proceedings of the 2015 International Conference on Web Services,New York,Jun 27-Jul 2,2015.Washington:IEEE Computer Society,2015:392-399.

附中文參考文獻(xiàn):

[8]鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003,14(9):1621-1628.

[13]孫鴻飛,武慧娟,周蘭萍.基于標(biāo)簽的個(gè)性化信息推薦理論模型研究[J].情報(bào)科學(xué),2013,31(4):24-27.

猜你喜歡
差異用戶服務(wù)
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
找句子差異
服務(wù)在身邊 健康每一天
服務(wù)在身邊 健康每一天
服務(wù)在身邊 健康每一天
生物為什么會(huì)有差異?
招行30年:從“滿意服務(wù)”到“感動(dòng)服務(wù)”
商周刊(2017年9期)2017-08-22 02:57:56
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 一本大道AV人久久综合| 一级成人a毛片免费播放| 国产剧情无码视频在线观看| 国语少妇高潮| 天天综合网在线| 久久亚洲天堂| 久久国产精品夜色| 国产乱人伦精品一区二区| 午夜爽爽视频| 亚洲色中色| 亚洲精品天堂在线观看| 亚洲中文字幕手机在线第一页| 亚洲性视频网站| 综合社区亚洲熟妇p| 成人夜夜嗨| 亚洲色图在线观看| 97在线碰| 麻豆精品在线| 伊人久久大香线蕉成人综合网| 中文字幕佐山爱一区二区免费| 亚洲日韩在线满18点击进入| 日韩精品无码免费一区二区三区| 日韩a级毛片| 久久亚洲日本不卡一区二区| 欧美中文字幕一区| 亚洲精品另类| 欧洲亚洲欧美国产日本高清| 国产精品无码久久久久AV| 青草午夜精品视频在线观看| a级毛片毛片免费观看久潮| 国产成人精品18| 精品国产美女福到在线直播| 欧美一级专区免费大片| 国产欧美视频一区二区三区| 日韩精品一区二区三区swag| 欧美综合激情| 久久成人国产精品免费软件| 一级毛片网| 国产理论精品| 色偷偷av男人的天堂不卡| 国产精品3p视频| 干中文字幕| 欧美区一区二区三| 久青草免费在线视频| 久久情精品国产品免费| 国产导航在线| 国产成人永久免费视频| 亚洲精品图区| 91精品在线视频观看| 国产成人高清精品免费| 国产精品亚洲一区二区三区z| 国产美女精品人人做人人爽| 国产亚洲欧美日韩在线观看一区二区| 久久黄色视频影| 无码 在线 在线| 伊人成人在线| 操美女免费网站| 99爱视频精品免视看| 日韩精品高清自在线| 国产成人禁片在线观看| 精品无码国产一区二区三区AV| 久久国产精品波多野结衣| 欧美日韩资源| 97成人在线视频| 99福利视频导航| 亚洲成AV人手机在线观看网站| 亚洲成人一区二区| 国产日韩欧美中文| 老色鬼欧美精品| 91福利国产成人精品导航| 五月天久久婷婷| 国产香蕉在线| 不卡午夜视频| 色哟哟国产精品一区二区| 欧美啪啪一区| 国产高清精品在线91| 久久亚洲高清国产| 国产一线在线| 国产精鲁鲁网在线视频| 91麻豆久久久| 亚洲国语自产一区第二页| 性网站在线观看|