999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于社交網絡信息的協同過濾推薦算法

2017-12-20 10:05:12張朝恒何小衛陳勇兵
計算機技術與發展 2017年12期
關鍵詞:用戶信息模型

張朝恒,何小衛,陳勇兵

(浙江師范大學 數理與信息工程學院,浙江 金華 321000)

基于社交網絡信息的協同過濾推薦算法

張朝恒,何小衛,陳勇兵

(浙江師范大學 數理與信息工程學院,浙江 金華 321000)

隨著互聯網數量的不斷增多,海量的數據信息為互聯網用戶帶來了便利,同時也給推薦系統帶來了技術性的挑戰。用戶-評分矩陣對傳統的協同過濾算法具有關鍵性的作用,然而在大數據時代的背景下,用戶面對海量的數據信息,很難對自己喜歡的項目全部進行評分,這就造成了評分數據的稀疏,從而影響推薦算法的精度性。針對數據稀疏問題,利用社交網絡信息,分別從用戶評分、興趣標簽、社交關系三個方面分別建立用戶相似度模型,然后采用協同過濾算法將三個模型進行融合,以進行推薦預測。在KDD CUP 2012 Track1數據集上進行實驗。實驗結果表明,該算法相比傳統的協同過濾算法,算法精確度有較好的提高,對于數據稀疏問題也有較好的緩解作用。

協同過濾;推薦系統;相似度模型;標簽信息;社交關系

0 引 言

隨著互聯網技術的日趨成熟,以信息化服務產業以及電子信息產業為代表的互聯網數量越來越多,如新聞資訊、百科系統、電子商務以及社交網絡等。這些網站大多擁有巨大的用戶量,隨之帶來的是海量的數據信息。現如今,人們已經進入大數據時代,用戶很難從海量的數據信息中快速找到自己所需要的信息,不同的用戶利用搜索引擎往往得到的是相同的推薦排名結果,然而用戶更希望根據自己的興趣喜好得到個性化推薦。以亞馬遜網上書店、淘寶網、京東商城,天貓超市等為代表的電子商務網站,以及以YouTube、騰訊微博、FaceBook、人人網等為代表的社交網絡平臺大都采用個性化推薦,而傳統的推薦系統已經很難滿足用戶需求。因此,許多學者提出了多種推薦算法,其中協同過濾算法以其良好的擴展性和可實現性[1],在推薦系統中被廣泛應用。然而協同過濾推薦自身也存在著許多缺點,主要包括:(1)數據稀疏問題。由于用戶-項目評分矩陣數據的稀疏性,計算出的用戶或項目相似度必定是不準確的,進而影響到推薦精度以及用戶的體驗效果。(2)冷啟動問題。在推薦系統中由于新用戶沒有對項目的評分信息,而新項目也沒有被用戶評分,這就無法計算其相應的最近鄰,因此無法推薦。(3)傳統算法計算只能區分用戶間的興趣程度,對于用戶間的朋友關系與陌生程度卻不能區分。

一方面,傳統的協同過濾算法過分依賴評分信息,而忽略其他因素,如用戶的標簽信息,這些標簽信息本質上體現了用戶對某些項目上的偏好程度[2-3]。如何更好地利用這些信息,建立用戶相似度模型,對實現個性化推薦以及提高算法的精確度有著重要作用。

另一方面,許多推薦系統都基于這樣一個假設:用戶對于項目的評分是相互獨立的,用戶主觀地根據自己的興趣愛好對項目進行評分,而不會受到其他用戶的影響。然而,在現實生活中,大多數用戶當決定選擇某項項目時,一般都會向自己信任的朋友或社交網絡中親密的好友征求意見,人們的興趣愛好通常容易受到朋友圈中好友或現實中親人的影響。用戶的社交關系在一定程度上反映了他們在興趣愛好上的相似程度以及他們在現實世界的相似程度。社交網絡作為一種信息傳播媒介,為人們提供了一個交流、學習、娛樂的社會平臺,其中比較出名的有騰訊微博、FaceBook、YouTube、微信、朋友圈等。這些網絡平臺提供了豐富的用戶關系以及朋友關系信息。近年來,利用社交網絡信息來提高推薦系統的性能越來越受到學者們的關注[4-6]。例如:Ziegler和Lausen發現在社交平臺中用戶間的信任度與相似度成正相關性[7-9];Massa和Avesani利用Epinions網絡上的信息計算用戶的信任關系來預測用戶興趣偏好[10]。如何合理地利用社交網絡信息,產生個性化推薦,對推薦系統精度的提高以及用戶體驗都有重要意義[11-13]。

1 相關工作

1.1 傳統算法介紹

目前大多數網站都是根據用戶的喜好為其提供個性化的推薦,例如亞馬遜、易趣網等,這些網站大都采用協同過濾算法[14]。基于用戶的協同過濾算法的主要步驟如下:

(1)計算用戶間的相似度。

(2)依據目標用戶與其他用戶的相似度從大到小排序,選出前N個用戶作為其最近鄰。

(3)利用最近鄰對其進行評分預測。

用戶間的相似度計算可采用多種方式,其中最常用的是皮爾遜相關系數[15]。給定用戶a與用戶b,相似度計算如式(1)所示:

(1)

通過皮爾遜相關系數計算用戶間相似度,然后選取目標用戶最近鄰,記Nur是其最近鄰,最后計算其對項目i的預測評分,如式(2)所示:

(2)

(3)

其中,Si為所有項目集合;ruj為用戶u對項目j的評分。

傳統的推薦算法基于用戶之間的評分是相互獨立的,忽略了社交網絡中用戶間的信任關系以及現實生活中用戶間的朋友關系,然而通常情況下,用戶選擇某項項目時,一般會征求其好友的建議或意見。為了提高推薦精度,社交網絡信息與用戶評分信息在社交推薦系統中應該同時被考慮[16-18]。在現實生活中,用戶可以向自己關系密切,并且信任的好友表達自己的興趣偏好,同樣,他們的興趣愛好也會對其所信任的好友有不同程度的影響,因此通過用戶間信任度,可以對用戶偏好進行預測。Golbeck在社交網絡中研究了用戶間的信任度,并且通過用戶間信任度進行預測推薦[19],這些利用信任關系的推薦系統比傳統推薦更具個性化。

1.2 模型定義

傳統的協同過濾通常利用評分信息計算用戶間相似度,記SR={Sij},其中Sij表示用戶i與用戶j的相似度,SR表示用戶間相似度矩陣。根據協同過濾,用戶u對項目j的預測評分可以表示成關于SR的函數,記為Puj=f(SR)。

提取用戶標簽信息,計算基于用戶標簽信息的相似度矩陣,記Sk={Sij},然后采用協同過濾算法,用戶u對項目j的評分預測記為Puj=f(Sk)。

同樣依據用戶社交關系信息,計算基于社交關系的用戶相似度矩陣,記Ss={Sij},然后同樣采用協同過濾算法,用戶u對項目j的評分預測可記為Puj=f(Ss)。

為了能夠得到較好的推薦結果,將三種模型進行融合。為了方便表示,每個模型定義如下:

UB:基于評分矩陣模型。

KW:基于社交網絡用戶標簽模型。

SNS:基于社交網絡用戶社交關系模型。

UK:結合UB模型與KW模型。

US:結合UB模型與SNS模型。

UKS:結合UB模型、KW模型與SNS模型。

文中提取社交網絡中的標注信息,其中用戶對項目的標注信息均為二值標注,這里的標注值相當于用戶對項目的評分值,然后采用基于用戶的協同過濾算法進行評分預測。

1.3 基于用戶標簽信息相似度模型的推薦(KW模型)

在社交網絡中,用戶通常會選用一些關鍵詞來表示自己的職業、興趣愛好以及觀點,這一系列的關鍵詞被稱為用戶的標簽。用戶的標簽是用戶的自我描述,例如:運動、乒乓、游泳、唱歌、旅游等。用戶的標簽信息反映了用戶的興趣趨向,在某種程度上用戶標簽的相似性反映了用戶興趣的相似性。提取所有的用戶關鍵詞形成一個用戶-關鍵詞字典,令N表示字典中關鍵詞的總個數,給定一個用戶a,其關鍵詞的向量形式如式(4)所示:

uka={ka1,ka2,…,kan}

(4)

利用杰卡德相關系數計算基于用戶標簽信息相似度,用戶a與用戶b的相似度計算如式(5)所示:

(5)

然后選取目標用戶u最近鄰,記Nuk為基于用戶標簽最近鄰,然后預測評分,如式(6)所示:

(6)

1.4 基于用戶社交關系的相似度模型的推薦(SNS模型)

社交網絡中用戶的社交關系主要反映在用戶的關注關系上。關注關系在社交平臺上普遍存在,例如:騰訊QQ、微信、微博等社交平臺。除了關注關系,還包括點贊、打賞、綁定賬號等特殊的社交關系方式。關注關系作為一種普通的社交關系,在某種程度上反映了用戶間的相互支持認同、信任等關系。如果用戶a關注用戶b,具體說來主要有兩個原因:第一,在現實世界中,用戶a與用戶b本來就是朋友關系;第二,用戶a對用戶b發表或轉發的內容感興趣,因此關注了用戶b,而用戶b發表或轉發的內容本身也反映了b的興趣。a關注了b,在一定程度上反映了a與b具有相近的興趣偏好。

同樣地,如果用戶a關注了用戶c,用戶b關注了用戶c,那么就可以認為一定程度上用戶a與用戶b也有相似的興趣愛好。根據用戶間的關注信息進行建模,給定一個用戶a,記用戶a在一段時間內關注過其他用戶的集合為:

fa={fa1,fa2,…,fan}

(7)

同樣利用杰卡德相關系數計算用戶社交關系的相似度,如式(8)所示:

(8)

同樣選取與目標用戶u最近鄰,記為Nus為基于社交關系的最近鄰,然后依據協同過濾算法預測評分,如式(9)所示:

(9)

2 基于社交網絡信息的協同過濾算法

通過評分信息可以很容易找到目標用戶的最近鄰,但由于評分矩陣的稀疏性,利用式(1)計算用戶間的相似度存在一定的偏差。

2.1 融合社交網絡用戶標簽信息的協同過濾模型(UK模型)

如果用戶a與用戶b共同評論的數量非常少而且評價的分值又高度相近,由式(1)計算的用戶a與用戶b的相似度就很高[20]。例如:a與b只對項目i進行評分,且評分分值相同,通過式(1)計算得到a與b的相似度為1。如果把b作為a的最近鄰用戶,利用b的評分信息來預測a的評分,這就會對a的預測評分造成一定的影響,也就是說,a與b雖然擁有相同的項目評分,但是只利用單一的用戶-項目評分矩陣計算用戶相似度無法準確地反映用戶間的興趣愛好程度。

基于上述情況,從社交網絡中提取用戶標簽信息,挖掘用戶的興趣偏好,建立用戶相似度模型。給定一個用戶u,記Nuk為利用社交網絡中用戶關鍵詞信息計算的用戶u的最近鄰,然后利用Nur和Nuk兩個最近鄰進行評分預測,將基于評分信息的協同過濾與基于用戶標簽的協同過濾相融合,如式(10)所示:

(10)

在一定程度上,該算法能夠對上述情況起到緩解作用,其中參數λ表示KW模型在UK模型中的權重。

2.2 融合社交網絡用戶社交關系信息的協同過濾模型(US模型)

相反地,如果用戶a與用戶b在現實世界中是好朋友,但由于矩陣稀疏,用戶a與用戶b沒有評分的項目非常少甚至沒有,通過式(1)計算出用戶a與用戶b的相似度就相當低。因為用戶b是用戶a的朋友,用戶b的評分對用戶a的預測評分有著重要影響,但是用戶a與用戶b的相似度過低,使得用戶b不在用戶a的最近鄰內,這就造成了用戶a最近鄰用戶的缺失,進而影響推薦精度。

基于上述可能出現的情況,運用社交網絡中用戶的社交關系信息建立用戶相似度模型,然后獲取目標用戶的最近鄰。給定一個用戶u,記Nus為基于用戶社交關系計算的最近鄰,然后在傳統協同過濾算法的基礎上融合基于用戶社交關系的協同過濾,利用Nur和Nus兩個最近鄰進行評分預測,對傳統的協同過濾算法進行補充,如式(11)所示:

(11)

其中,參數δ表示SNS模型在US模型中的權重。在一定程度上,該算法能夠對上述情況起到緩解作用。

2.3 融合社交網絡信息的協同過濾算法(UKS模型)

基于上述兩種情況,融合基于評分矩陣相似度模型(UB模型)、基于用戶標簽相似度模型(KW模型)、基于用戶社交關系相似度模型(SNS模型)來提高推薦精度,如式(12)所示:

(12)

其中,α,β,γ為參數,有α+β+γ=1。

3 算法的時間復雜度與精度分析

3.1 算法時間復雜度分析

傳統的協同過濾算法,即UB模型算法的時間復雜度是O(n2),而基于KW模型算法與SNS模型算法的時間復雜度也都為O(n2),所以KW模型、SNS模型、UB模型的時間復雜度相當。由于UKS模型是由以上三種模型進行線性組合,因此,基于UKS模型的算法時間復雜度與傳統的UB模型算法的時間復雜度相當。

3.2 數據集

為了驗證算法的有效性,選取KDD CUP 2012 Track1(www.kddcup2012.org)作為數據集。該數據集是2012年騰訊公司提供的關于騰訊微博用戶數據的一個真實采樣,其中主要使用三個數據集。

標注信息數據集:包含1 392 873個用戶,4 710個項目,以及42 118 498條標注信息,標注信息均采用二值標注,其中標注值均為1或-1,每個標注信息還有一個時間戳。

用戶關鍵詞數據集:包含2 320 895個用戶的關鍵詞信息,每個用戶不同的關鍵詞都用不同特定的正整數表示。

用戶社交關系數據集:包含50 655 143條用戶關注信息,每個用戶與被關注的用戶都用特定的數字作為其索引號。

標注信息數據集稀疏程度計算如下:

由此可以看出該數據集十分稀疏。

由于原數據集中數據規模過于龐大,因此從中選取10萬條標注信息作為訓練集,其中包括3 162個用戶,3 365個項目。在原測試集中缺少真實的評分數據,為了確保實驗的精確度,將對選出的數據做以下處理:從10萬條數據信息中隨機篩選出90%作為訓練集,剩下10%作為測試集,為了實現算法的實驗評估,在測試集中確保每個用戶至少有3個正標注信息。

3.3 算法評估

在實驗中,采取平均精度(Mean Average Precision atN,MAP@N)來評價推薦算法的精度。首先計算測試集中每個測試用戶的精度,然后將每個測試用戶的精度進行累加,最后尋求精度平均值。具體來說:給定一個測試用戶u,L是按照推薦算法預測評分高低排序為用戶u推薦的項目列表,每個測試用戶精度AP@N定義如式(13)所示:

(13)

其中,M為推薦列表L中被測試用戶標注過的項目總數;p(k)為推薦列表L中第k位置處的精度,定義如式(14)所示:

(14)

(15)

其中,U表示測試集中所有用戶的集合。

在KDD CUP 2012 Track1任務中,N值取3作為實驗評估標準。為了更好地與其他實驗進行比較,文中也取N為3作為實驗評估標準。

3.4 模型最佳TOP-N及模型參數分析

為了尋找每個模型最近鄰最佳個數,將運用訓練集對UB,KW,SNS三種單因素模型進行訓練,通過改變最近鄰個數來觀測對算法精度的影響,進而尋找每個模型的最佳鄰居個數。選取TOP-N從2到20來觀察精度的變化,實驗結果如圖1所示。

圖1 三種模型TOP-N對精度的影響

從圖1中可以看出,在KW,SNS模型中,算法精度MAP@3先隨著TOP-N的增加而增加,然而當TOP-N超過某個值后精度反而減少,最后趨于平穩。而在UB模型中,當TOP-N從0到6逐漸增加時,算法精度有所提高,但當TOP-N從6到20變化時,算法精度大體呈現下降趨勢。同時還可以觀察出,當TOP-N分別為6、6、12時,UB,KW,SNS模型算法精度MAP@3相應最高,因此UB,KW,SNS三種模型的最佳TOP-N分別為6,6,12,對應UB,KW,SNS三種模型最佳精度值分別為0.340 2,0.240 0,0.173 0。由此可知,UB模型有著較高的推薦精度,KW模型次之,然后是SNS模型。為了提高算法的推薦精度,將對UK模型中的參數λ,US模型中的參數δ,以及UKS模型中的參數α,β,γ進行實驗,尋找各個模型中的參數最佳值。

3.4.1 尋找UK,US模型中的最佳參數λ,δ

在UK模型中,為了評估KW模型在UK模型中所占的權重,將對模型中參數λ值取步長為0.1進行實驗。當λ=0時,表示只依賴于UB模型進行評分預測;當λ=1時,表示只利用KW模型進行評分預測;當參數λ∈(0,1),表示融合UB模型與KW模型來進行評分預測。

在US模型中,參數δ為SNS模型在US模型中的權重。當δ=0時,表示只依賴于UB模型進行評分預測;當δ=1時,表示只利用SNS模型進行評分預測;當參數δ∈(0,1),表示融合UB模型與SNS模型進行評分預測。對于參數δ,步長也取0.1,實驗結果如圖2所示。

圖2 UK模型中參數λ,US模型中參數δ對精度的影響

從圖2中可看出,在UK模型下,當參數λ從0到0.3變化時,算法精度MAP@3逐漸呈上升趨勢,當參數λ進一步從0.3到1不斷增大時,算法精度反而逐漸下降,然后趨于平穩。同時還可以觀察到,當λ=0時,算法精度明顯高于λ=1的算法精度值,說明單一的UB模型在精度上要高于KW模型。從算法精度MAP@3變化趨勢來看,當參數λ在0.2到0.4之間的范圍內時,基于UK模型的算法精度較高,當參數λ=0.3時,算法精度MAP@3最高。

在US模型下,當參數δ從0到0.2變化時,算法精度逐漸呈上升趨勢,隨著參數δ進一步從0.2增加到1,算法精度MAP@3逐漸降低,然后趨于平穩。當δ=0時,算法精度MAP@3明顯高于δ=1時的算法精度,這也說明單一的UB模型精度也要高于SNS模型精度。從算法精度MAP@3的變化趨勢來看,當參數δ在0.1到0.3之間,基于US模型算法的精度較高,當參數δ=0.2時算法精度MAP@3最佳。

3.4.2 尋找UKS模型中的最佳參數α,β,γ

在UKS模型中,為了評估UB,KW,SNS模型各自在UKS模型中的權重,將分別對參數α,β,γ進行實驗。考慮到在UB,UK,US模型中,UB模型的推薦精度相比KW,SNS模型較高,且由α+β+γ=1,只需尋求β,γ兩個參數即可。

根據圖1,選取UB,KW,SNS每個模型最佳鄰居數進行實驗,即UB模型TOP-N為6,KW模型TOP-N為6,SNS模型TOP-N為12。當尋求參數α最佳值時,先固定參數α,γ,參數β步長采用0.1來進行實驗;同樣對于參數γ,先固定參數α,β,步長也采用0.1,實驗結果如圖3所示。

圖3 UKS模型中參數β,γ對精度的影響

從圖3可以看出,當參數β從0到0.2逐漸增加時,算法精度MAP@3也隨之增加,隨著β從0.2到1繼續增加,算法精度先降低,然后趨于平穩。而對于參數γ,當從0到0.1范圍內變化時,精度MAP@3提高較快,當從0.1到1逐漸增加時,精度MAP@3先降低,然后趨于平穩。同時還可以觀察到,當參數β,γ從0.4到1變化時,算法精度MAP@3趨于平穩,也說明隨著參β,γ數值的增大,KW模型與SNS模型對UKS模型的影響逐漸減弱。因此得到如下結論:在UKS模型下,當參數β=0.2,參數γ=0.1時,算法精度最高。

3.5 實驗結果分析

為了檢驗各個模型的最佳精度,將在各個模型參數取得最佳的情況下進行測試。在UK模型中參數λ取0.3,在US模型中參數δ取0.2,在UKS模型中參數α,β,γ分別取0.7,0.2,0.1。仍然選取TOP-N從2到20來觀察算法精度的變化,實驗結果如圖4所示。

圖4 UB,UK,US,UKS的TOP-N對精度的影響

從圖4中可以看到,當TOP-N從4到20變化時,模型UK,US,UKS的精度都大于UB模型的精度,表明融合社交網絡信息的UKS模型算法要比單一的依據評分信息的UB模型算法,在推薦精度方面有較好的提高,并且UKS模型的算法精度最優,UK模型次之,然后是US模型。也驗證了表1中單因素KW模型較優于單因素SNS模型。同時還可以觀察到,在UB模型中,隨著TOP-N從12到20變化,算法精度MAP@3急劇下降,然而在UK,US,UKS模型中,算法精度相對趨于平穩,表明基于社交網絡信息的KW,SNS模型對UB模型有較好的補充作用。

為了精確計算UK,US,UKS模型對于UB模型提高的精度,定義計算方式如下:

(16)

表1US,UK,UKS三種模型與UB模型的精度比較及提高比率

從表1中可以看出,US模型相比UB模型提高了8.70%,UK模型相比UB模型提高了10.50%,顯然UK模型要優于US模型。表明在UB模型的基礎上融合不同的單因素模型對算法會有不同的影響,也驗證了圖1中在單因素模型下KW模型要優于SNS模型。隨著影響模型因素的增加,算法精度也有不同程度的提高,其中UKS模型精度最高,相比UB模型精度提高18.01%。UKS模型在UB模型的基礎上融合了KW和SNS,而UK,US兩個模型相比UB模型,只分別融合了KW,SNS單個模型。實驗結果表明:在UB模型上融合KW,SNS兩個模型要優于融合單因素模型。

通過以上實驗可以得出如下結論:融合多因素模型的算法精度要優于單因素模型,然后將多因素UKS模型與另外兩種算法—SHANDA[21]和UST[22]作比較。UST,SHANDA也相應融合了多因素分解模型,比較結果如圖5所示。

ModelUSUTUSTMAP@30.3460.3640.394ModelUSUKSHANDAMAP@30.36880.38870.3911ModelUSUKUKSMAP@30.36980.37680.4015

圖5 UKS、SHANDA、UST三種模型的精度比較

通過比較可知,在UK模型中的文中算法精度高于UST模型中UT模型的精度,而略低于SHANDA模型中UK模型的精度,然而在US和UKS模型中,文中算法精度仍然比其他兩種模型算法的精度要高。相比其他兩種算法,UKS模型對于推薦精度有較好的提高。相比傳統的協同過濾算法,在用戶評分數據稀疏的情況下,提取用戶的標簽信息、用戶社交關系信息來計算用戶間的相似度,進而預測評分,對傳統算法中數據稀疏問題有很好的補充作用,對于推薦精度也有很好的提高。

4 結束語

分析了多種因素模型對推薦精度的影響,包括用戶標注信息、用戶標簽信息,以及用戶在社交平臺上的社交關系信息,利用這些信息提出一種融合社交網絡信息的協同過濾算法。實驗結果表明,相比傳統的UB模型,在數據稀疏的情況下,UKS模型對其有很好的緩解作用,與SHANDA和USTCF兩種推薦算法相比,算法精度都有所提高。不足之處在于參數的尋找問題。對于不同的數據集,取得參數的最佳值可能存在一定的偏差,這就需要抽取不同的數據集進行實驗,才能尋求更加準確的最佳值。下一步的工作將是抽取不同的數據集對算法中的參數進行多次實驗,尋找更加精確的參數值,進一步提高算法推薦精度。

[1] Herlocker J L,Konstan J A,Terveen L G,et al.Evaluating collaborative filtering recommender systems[J].ACM Transactions on Information Systems,2004,22(1):5-53.

[2] 陳博文,劉功申,張浩霖,等.融合標簽傳播和信任擴散的個性化推薦方法[J].計算機工程,2014,40(12):33-38.

[3] 張艷梅,王 璐.適應用戶興趣變化的社會化標簽推薦算法研究[J].計算機工程,2014,40(11):318-321.

[4] Ma H,Yang H,Lyu M R,et al.Sorec:social recommendation using probabilistic matrix factorization[C]//Proceedings of the 17th ACM conference on information and knowledge management.[s.l.]:ACM,2008:931-940.

[5] Ma H,King I,Lyu M R.Learning to recommend with social trust ensemble[C]//Proceedings of the 32nd international ACM SIGIR conference on research and development in information retrieval.[s.l.]:ACM,2009:203-210.

[6] Liu F,Lee H J.Use of social network information to enhance collaborative filtering performance[J].Expert Systems with Applications,2010,37(7):4772-4778.

[7] Ma H,Zhou D,Liu C,et al.Recommender systems with social regularization[C]//Proceedings of the 4h ACM international conference on web search and data mining.[s.l.]:ACM,2011:287-296.

[8] Ziegler C N, Lausen G. Analyzing correlation between trust and user similarity in online communities[C]//Second international conference on trust management.[s.l.]:[s.n.],2004.

[9] 定明靜.基于信任網絡的推薦技術研究及應用[D].成都:電子科技大學,2013.

[10] Massa P,Avesani P.Trust-aware recommender systems[C]//Proceedings of the 2007 ACM conference on recommender systems.[s.l.]:ACM,2007.

[11] 蔡 浩,賈宇波,黃成偉.結合用戶信任模型的協同過濾推薦方法研究[J].計算機工程與應用,2010,46(35):148-151.

[12] 朱麗中,徐秀娟,劉 宇.基于項目和信任的協同過濾推薦算法[J].計算機工程,2013,39(1):58-62.

[13] 楊興耀,于 炯,吐爾根·依布拉音,等.基于信任模型填充的協同過濾推薦模型[J].計算機工程,2015,41(5):6-13.

[14] Linden G,Smith B,York J.Amazon.com recommendations:item-to-item collaborative filtering[J].IEEE Internet Computing,2003,7(1):76-80.

[15] Adomavicius G, Tuzhilin A. Personalization technologies:a processoriented perspective[J].Communication of the ACM,2005,48(10):83-90.

[16] Shardanand U,Maes P.Social information filtering:algorithms for automating word of mouth[C]//Proceedings of the SIGCHI conference on human factors in computing systems.[s.l.]:ACM,1995:210-217.

[17] Ma H.An experimental study on implicit social recommendation[C]//Proceedings of the 36th international ACM SIGIR conference on research and development in information retrieval.[s.l.]:ACM,2013:73-82.

[18] Wu L,Chen E,Liu Q,et al.Leveraging tagging for neighborhood-aware probabilistic matrix factorization[C]//Proceedings of the 21st ACM international conference on information and knowledge management.[s.l.]:ACM,2012:1854-1858.

[19] Golbeck J.Generating predictive movie recommendations from trust in social networks[C]//International conference on trust management.[s.l.]:[s.n.],2006:93-104.

[20] Wang Bailing,Huang Junhen,Qu Linbing,et al.A collaborative filtering algorithm fusing user-based,item-based and social network information[C]//IEEE international conference on big data.[s.l.]:IEEE,2015:2337-2343.

[21] Chen Y,Liu Z,Ji D,et al.Context-aware ensemble of multifaceted factorization models for recommendation prediction in social networks[C]//Proceedings of the KDD-Cup workshop.Beijing,China:[s.n.],2012:1-7.

[22] Wang Rui,Wang Bailing,Huang Junhen.A collaborative filtering algorithm based social network information[C]//IEEE international conference on big data.[s.l.]:IEEE,2015:2384-2389.

ACollaborativeFilteringRecommendationAlgorithmBasedonSocialNetworkInformation

ZHANG Chao-heng,HE Xiao-wei,CHEN Yong-bing

(School of Mathematics and Information Engineering,Zhejiang Normal University,Jinhua 321000,China)

With the increasing number of Internet,massive data information offers convenience for Internet users and also brings a technical challenge to the recommendation system.User rating matrix plays a key role on the traditional collaborative filtering algorithm.However,in the age of big data,it is difficult for users to score all items they love when facing massive data information,resulting in the sparse rating data,which affects the accuracy of the recommendation algorithm.For data sparsity,the user similarity models are established respectively from three aspects of user score,interest tags and social relationship by using the social network information and then collaborative filtering algorithm is applied to complete the three models integration for recommending prediction.It is experimented in the data set of KDD CUP 2012 Track1 that the algorithm proposed is improved in the accuracy compared with the traditional one,and also has good ease for the data sparsity.

collaborative filtering;recommendation system;similarity model;tags information;social relationships

TP301.6

A

1673-629X(2017)12-0028-07

10.3969/j.issn.1673-629X.2017.12.007

2016-12-03

2017-04-12 < class="emphasis_bold">網絡出版時間

時間:2017-08-01

國家自然科學基金資助項目(61572023);浙江省自然科學基金(LY14F010008)

張朝恒(1990-),男,碩士研究生,研究方向為協同過濾、機器學習;何小衛,副教授,碩士生導師,研究方向為機器學習、圖像視頻處理。

http://kns.cnki.net/kcms/detail/61.1450.TP.20170801.1556.072.html

猜你喜歡
用戶信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产香蕉在线视频| 国产一区在线视频观看| 欧美特级AAAAAA视频免费观看| 在线国产毛片手机小视频| 国产区在线看| 成人午夜天| 成人在线观看不卡| 久久男人资源站| 久久美女精品国产精品亚洲| 国产视频欧美| 亚洲日韩AV无码一区二区三区人| 亚洲第一精品福利| 免费欧美一级| 538国产视频| 日韩美毛片| 扒开粉嫩的小缝隙喷白浆视频| 成人免费视频一区| 国产一级毛片网站| 色有码无码视频| 亚洲,国产,日韩,综合一区| 欧美人人干| 国产三级视频网站| 亚洲国产av无码综合原创国产| 91在线无码精品秘九色APP| 国产SUV精品一区二区6| 无码一区二区波多野结衣播放搜索| 亚洲成人黄色网址| 四虎综合网| 伊伊人成亚洲综合人网7777| 国产91成人| 日日拍夜夜操| 亚洲天堂.com| 久久久精品无码一区二区三区| 日韩欧美国产成人| 91九色国产porny| 亚洲国产91人成在线| 亚洲AV无码乱码在线观看代蜜桃| 成人夜夜嗨| 欧美色图第一页| 亚洲一区色| 最新国产精品第1页| 国产精品毛片一区| 国产精品丝袜视频| 亚洲日本中文字幕天堂网| 精品视频一区二区三区在线播| 色婷婷综合在线| 欧美成人精品欧美一级乱黄| 女人18毛片一级毛片在线| 国产乱视频网站| 一区二区三区四区日韩| 免费观看无遮挡www的小视频| 欧美激情视频二区三区| 老司机久久精品视频| 四虎影视库国产精品一区| 欧美日韩v| 亚洲成人77777| 久久超级碰| 亚洲清纯自偷自拍另类专区| 中文字幕久久亚洲一区| 日韩中文欧美| 麻豆AV网站免费进入| 麻豆精品在线播放| jizz在线免费播放| 亚洲人成网站18禁动漫无码| 久久77777| 中文字幕在线日韩91| 97免费在线观看视频| 欧美一区二区人人喊爽| 亚洲精品综合一二三区在线| 日韩午夜伦| 亚洲天堂日本| a级毛片在线免费观看| 精品国产欧美精品v| 国产肉感大码AV无码| 久久久噜噜噜| 精品91在线| 亚洲成av人无码综合在线观看| 国内99精品激情视频精品| 亚洲自拍另类| 色AV色 综合网站| 中文字幕乱码二三区免费| 色综合激情网|