999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類層次模型的視頻推薦算法

2017-12-14 05:36:10楊興耀王躍飛國冰磊
計算機應用 2017年10期
關鍵詞:排序用戶模型

金 亮,于 炯,,楊興耀,魯 亮,王躍飛,國冰磊,廖 彬

(1.新疆大學 軟件學院,烏魯木齊 830008; 2.新疆大學 信息科學與工程學院,烏魯木齊 830046;3.新疆財經大學 統計與信息學院,烏魯木齊 830012) (*通信作者電子郵箱yujiong@xju.edu.cn)

基于聚類層次模型的視頻推薦算法

金 亮1,于 炯1,2*,楊興耀1,魯 亮2,王躍飛2,國冰磊2,廖 彬3

(1.新疆大學 軟件學院,烏魯木齊 830008; 2.新疆大學 信息科學與工程學院,烏魯木齊 830046;3.新疆財經大學 統計與信息學院,烏魯木齊 830012) (*通信作者電子郵箱yujiong@xju.edu.cn)

目前推薦系統存在評論數據稀疏、冷啟動和用戶體驗度低等問題,為了提高推薦系統的性能和進一步改善用戶體驗,提出基于聚類層次模型的視頻推薦算法。首先,從相關用戶方面著手,通過近鄰傳播(AP)聚類分析得到相似用戶,從而收集相似用戶中的歷史網絡視頻數據,進而形成視頻推薦集合;其次,利用用戶行為的歷史數據計算出用戶對視頻的喜好值,再把視頻的喜好值轉換成視頻的標簽權重;最后,通過層次分析模型算出視頻推薦集合中用戶喜好視頻的排序,產生推薦列表。基于MovieLens Latest Dataset和YouTube視頻評論文本數據集,實驗結果表明所提算法在均方根誤差和決策精度方面均表現出良好的性能。

視頻推薦;稀疏性;冷啟動;層次模型;聚類分析

0 引言

伴隨著網絡費用的下降以及4G網絡的完善和5G網絡的到來,視頻數量將變得越來越龐大,其網絡視頻數據如表1所示,如何在大量的視頻中推薦出用戶喜歡的視頻是一個巨大的挑戰。就目前而言,傳統的推薦系統主要分為基于內容推薦[1]、協同過濾推薦[2-3]和混合過濾推薦[4]。基于內容推薦是通過機器學習的方法從訓練集中提取出內容特征,再與用戶的興趣特征相比通過內容特征與興趣特征的相似度來產生推薦。這其中存在內容難以提取有意義的特征和無法得到其他用戶的判斷情況等問題。基于關聯規則推薦則是以項目的相關性為基礎,通過大量的數據統計找出項目的相關性,但是關聯規則的發現耗時和項目的同義性問題有待解決。基于效用推薦需要為每個用戶創建一個有效函數,這樣存在用戶有效函數的創建問題和屬性重疊問題。協同過濾推薦是通過用戶評價的方式來建立用戶和項目之間的聯系,把用戶評價轉換成用戶對項目的喜好程度來預測用戶對項目的喜好從而形成推薦。但是后來研究發現僅憑這樣產生的推薦結果很難反映出用戶的喜好[5]。

表1 中國網絡視頻用戶規模和使用率

為此,本文提出基于聚類層次模型的視頻推薦算法(Video Recommendation algorithm Based on Clustering and Hierarchical model, VRBCH),首先通過相關用戶屬性標簽的近鄰傳播(Affiliation Propagation, AP)聚類[6]得到與推薦用戶相似的其他用戶集合;然后通過其他用戶的歷史數據獲得視頻推薦集合;最后通過被推薦用戶歷史數據信息分析得出視頻分類標簽權重,利用視頻推薦集合和視頻分類標簽權重算出視頻推薦集合中視頻的順序,推薦給用戶。本文通過對推薦用戶歷史數據進行訓練,調整PageRank[7]模型參數,通過反復迭代得到用戶歷史視頻的重要性,然后通過視頻重要性確定視頻中分類標簽的權重。PageRank模型偏向于歷史數據,然而人的興趣愛好是通過實踐逐漸產生的,短時間內不會出現興趣愛好大幅度改變問題,所以得到的興趣愛好數據無需頻繁更新。本文通過推薦用戶行為算出視頻分類標簽權重,降低了用戶自己定義視頻分類標簽權重的誤差。另外,在分析視頻集合中的某個視頻傾向于某個分類標簽時采用視頻專家的建議,避免了用戶自己分析時存在不確定誤差。

1 相關工作

當前,推薦系統研究最多的是協同推薦模型,其原理是相似的用戶都會有共同點,不相似的用戶各有各的不同。例如,相似的兩個人他們會在某一觀點、某一愛好或某些事物都有相似或相同的興趣愛好。協同過濾推薦主要包括基于模型的協同過濾推薦和基于近鄰的協同過濾推薦。

楊興耀等[8]利用用戶評分的奇異性和擴散性對原有用戶相似性模型進行改進、擴展,找出與用戶相似的近鄰集合Ku;利用評分預測函數,通過近鄰用戶對項目的評分計算出用戶對項目的預測評分從而得到用戶的推薦集合。尹路通等[9]通過用戶評論利用情感詞分析技術,計算出用戶的興趣傾向度,再利用興趣傾向度建立用戶虛擬評分矩陣,來彌補現實評分的不足;同時建立用戶興趣模型,利用隱語義模型把傳統的二元推薦擴充為三元推薦來預測用戶的喜好產生推薦。孫光福等[10]通過用戶消費的先后時間順序得到用戶與產品、用戶與用戶、產品與產品的影響關系,來構建用戶與產品、用戶與用戶、產品與產品的結構關系,并以此為基礎計算出它們的相似度,再利用概率分解模型來重構評分矩陣,利用評分矩陣產生相應的推薦。張付志等[11]利用核主成分分析法提取用戶評分矩陣的非線性特征,最大限度地保留了用戶和項目的特征信息;最后,還引入了Cauchy加權M-估計量函數,雖然損失了部分精度,但是在滿足需求下提高了算法的魯棒性。張燕平等[12]利用歷史記錄的評分矩陣得到用戶信譽,對于信譽低的用戶通過抑制其推薦影響來達到降低精度影響。胡勛等[13]引入圖像檢索中常用的推土機距離計算方法,融入項目特征計算出用戶的相似性,降低了協同推薦算法中稀疏性帶來的挑戰,避免了評分矩陣的稀疏性對用戶相似性的影響;此外還引入了社會用戶關系計算信任權重得到近鄰用戶,提高了混合推薦的精度。郭磊等[14]從推薦對象間的關聯關系出發,融合了用戶的社會關系、項目間關系和評分信息三種不同類型的信息,利用共享特征空間的方法對推薦結果進行優化,起到了優化推薦結果的作用。陳克寒等[15]利用兩階段用戶聚類的方法先從稀疏數據中聚類出密集子集形成核心聚類,然后對其提取用戶特征再進行聚類,最后將聚類結果用于推薦。

這些算法的優缺點如表2所示,它們都是在用戶相似度和評分上直接操作來產生推薦,并未對推薦結果進行排序處理,在一定程度上限制了算法性能的進一步提升。好的推薦排序模型必將獲得好的推薦結果[16],好的推薦結果必將產生好的用戶體驗,達到用戶對推薦產生依賴的效果。利用推薦用戶歷史數據和瀏覽行為把視頻喜好程度分解成視頻喜好標簽權重,然后再結合視頻推薦集合算出用戶對視頻的喜好值,形成推薦。

表2 協同過濾推薦算法的優缺點

2 VRBCH算法詳述

總體上說,VRBCH大致可分為以下三個階段:對相關用戶進行AP聚類分析、將推薦用戶歷史數據行為轉換成視頻喜好標簽權值和用層次排序模型產生推薦。

2.1 聚類分析

對視頻用戶的聚類算法有很多,比如k-均值、模糊集等。本文通過AP聚類分析[6]找出相似用戶進而找到他們喜愛的視頻,是因為AP聚類不需要指定聚類數目,與其他聚類算法相比誤差平方和較低。本文通過分析用戶的性別、年齡、學歷、住址(手機號碼)、興趣愛好等用戶屬性找出相似用戶,現設有n個用戶,每個用戶有p個屬性,則用戶矩陣為:

其中:xij(i=1,2,…,n;j=1,2,…,p)為第i個用戶第j個屬性數據。

第1步 先對用戶數據進行歸一化處理。本文通過式(1)把數據壓縮到[0,1]閉區間上:

(1)

第2步 構建相似度矩陣S。

第3步 利用式(2)~(4)迭代更新吸引度矩陣R和歸屬度矩陣a。計算公式如下:

(2)

如果i≠k時:

(3)

(4)

式(2)是用相似度矩陣S=[s(i,k)]和歸屬度矩陣a=[a(i,k)]更新吸引度矩陣R=[r(i,k)];式(3)是用吸引度矩陣R=[r(i,k)]更新歸屬度矩陣a=[a(i,k)]。其中S[s(i,k)]是點i到k的相似度。

第4步 判斷是否達到預設迭代次數:如果已達到迭代次數,則進行第5步。如果沒有達到迭代次數,則判斷a(i,i)+r(i,i)是否大于0,若小于0,則重復第3~4步;若大于0,則進行第5步

第5步 迭代更新結束選擇聚類中心,并分配聚類輸出聚類集合P。

其算法如下。

算法1 相似用戶AP聚類的核心算法。

輸入 相似用戶集合C,阻尼系數λ。

輸出 相似用戶集合P。

BEGIN

1)

初始化a(i,j)=r(i,j)=0;

2)

建立相似矩陣S;

3)

計算吸引度矩陣:

4)

5)

計算歸屬度矩陣:

6)

ifi≠k

7)

a(i,k)←

8)

else

9)

10)

ifa(i,i)+r(i,i)gt;0

11)

選擇聚類中心;

12)

else

13)

返回3)重新計算;

END

2.2 層次排序模型

層次排序模型[17]是為了解決視頻排序過程中用戶對一些視頻標簽無法準確估量和量化的分析模型,用于解決用戶難以準確定位自身需求和興趣權重的問題。其本質是根據具體需求決定分類標簽的影響權重從而求出最優解。首先將決策問題分解成多個層次,如圖1所示,再構造成對比較矩陣,計算權重向量并作一致性檢驗,最后得出最優解。

圖1 選擇視頻的層次結構

層次分析往往將一些難以量化的分類標簽通過人的主觀判斷實現量化處理。但是在人的主觀判斷中往往存在誤差,因此本文引入PageRank[7]排序模型,計算出用戶歷史視頻的重要性值,構建成對比較矩陣計算出分類標簽的權重,最終從視頻推薦集合中找出最優視頻集合。

對于成對比較矩陣的構建,假設歷史數據中有n個視頻,每個視頻相當于一個節點,根據用戶行為信息建立視頻與視頻之間的互連模型,如圖2所示。則視頻的排序值(Rank值)的計算公式[18]為:

(5)

其中:R(pi)表示第i個視頻的排序值;d是阻尼因子,1-d是隨機瀏覽新的視頻的概率;L(pj)是視頻pj的鏈出視頻數;r是歷史數據中相同視頻重復的個數。

圖2 用戶行為網絡圖

在n個歷史視頻中找出分類標簽,例如視頻的地域、年份、動作、科幻、戰爭、主演、導演等為w1,w2,…,wm,利用式(5)算出每個視頻的Rank值并賦給對應視頻下的分類標簽,若不同視頻中含有相同分類標簽則取該相同分類標簽中的最大值。

定義1 設pi視頻對應的Rank值為ri,其含有的分類標簽為w1,w2,…,wi,則其分類標簽對應的值為w1=w2=…=wi=ri;pj視頻對應的Rank值為rj,其含有的分類標簽為w1,w2,…,wj則其分類標簽對應的值為w1=w2=…=wj=rj;如果rigt;rj則w1=w2=w3=ri。

定義2 比較m個視頻標簽對上一層視頻標簽的影響用aij表示,則aij=wi/wj,其尺度含義如表3所示。

定義3 由于式(5)計算出視頻重要值為非整數,為了減少計算量和計算誤差,本文在四舍五入的基礎上進行同步取整。例如,wi=4.3,wj=5.3,aij=wi/wj=4/5;wi=4.6,wj=5.6,aij=wi/wj=5/6;wi=4.3,wj=5.6,aij=wi/wj=5/6;wi=4.6,wj=5.3,aij=wi/wj=5/6。

表3 1~9尺度aij的含義

在視頻標簽權重的計算過程中,通過上面規則構建成對比較矩陣:

本文采用冪法逐步迭代對成對比較矩陣進行特征值和特征向量的求解并作一致性檢驗。

首先,選取n維歸一化初始向量w(0);計算出w(k+1)=Aw(k),k=0,1,…;然后歸一化w(k+1)。即:

(6)

如果|wi(k+1)-wi(k)|lt;ε(i=1,2,…,n)時,則為所求的特征向量;否則返回w(k+1)=Aw(k)。其中ε為預先給定的常數精度。

最后計算出最大特征根:

(7)

為了確定特征向量是否適合為分類標簽的權重,必須對特征向量w作一致性檢驗。其一致性比率CR計算公式如下:

CR=CI/RIlt;0.1

(8)

其中:CI為一致性指標。CI=0時,A為一致陣。CI越大A越偏離一致陣,其公式如式(9)所示。RI為不同的n利用正互反矩陣算出CI的平均值作為隨機一致性指標,如表4所示。

(9)

表4 隨機一致性指標RI的數值

2.3 推薦流程

視頻推薦流程步驟如下。

輸入 相關用戶數據集合C。

輸出 針對用戶集合中用戶所觀看視頻的推薦集合I。

1)收集所有相關用戶、標注屬性,利用AP聚類得到相似用戶。

2)收集所有相似用戶觀看的歷史視頻數據形成預推薦集合,并按照觀看時長和視頻出現的時間進行整理。

3)判斷推薦用戶是否是新用戶,如果是則按照第2)步整理的視頻進行推薦。

4)利用推薦用戶觀看的歷史數據進行PageRank排序分析,通過用戶行為形成網絡圖計算出用戶對歷史視頻的喜愛程度。

5)分解歷史視頻數據的受喜愛標簽,構建標簽成對比較矩陣。

6)計算標簽權重,利用第2)步得到的視頻預推薦集合進行計算形成推薦集合。

3 實驗評估與分析

實驗部分,本文先選定所用數據集,介紹評定標準,然后用現有數據模擬現實環境,再利用歷史數據優化參數。最后介紹VRBCH算法與其他算法的對比實驗并作相應的分析。

3.1 實驗數據集

為了綜合評估算法性能,實驗采用MovieLens Latest Datasets和YouTube視頻評論文本[19]數據集,基本參數如表5所示。

表5 評分數據集的基本參數

3.2 評估標準

為了更好地驗證VRBCH算法的性能,本文采用均方根誤差(Root Mean Square Error, RMSE)、F-measure來作為評價標準。RMSE通過計算預測的用戶行為和實際的用戶行為之間的偏差來衡量預測的準確性。假設對n個用戶行為進行預測,得到的預測結果集合為P={p1,p2,…,pn},對應的實際用戶行為集合為Ur={r1,r2,…,rn},則算法RMSE表示為:

(10)

本文的準確率采用準確率和召回率的加權調和平均即F-measure作為衡量標準,其定義為:

(11)

(12)

(13)

其中:precision為準確率;recall為召回率;P為預測結果集合;Ur為實際用戶行為集合。

另外,確保最大限度地利用數據集,實驗采用十折交叉驗證法(10-floder cross validation),實驗中將選中的數據分成10份,輪流將其中9份作為訓練集,1份作為驗證集。10次結果的正確率的平均值作為對算法精度的估計。

3.3 推薦算法參數優化

就聚類算法和排序模型而言,恰當的參數選擇對推薦算法的性能有很大影響。AP聚類中的所有數據初始相似度的p值決定聚類數目的多少,p值越大輸出聚類數目越多,p值越小輸出聚類數目越少,所以p值為所有數據相似度的均值。

(14)

其中:s(i,k)是數據相似度。

AP聚類中阻尼系數λ的大小決定著聚類過程中迭代的次數:λ減小,迭代次數減少但容易引起震蕩;λ增大迭代次數增加,增加系統時間開銷。

從圖3所示的λ系數對比圖可以看出:當λ=0.6,0.7時,其震蕩效果相似,即λgt;0.6時其震蕩效果相似,所以本文為了降低時間開銷λ取0.6。

圖3 不同λ取值時系統的震蕩情況

對于Pagerank模型來說,阻尼因子d的正確選擇不僅影響著Pagerank模型的冪法收斂速度還影響著排序的公正性,其d值減小雖然提高了Pagerank的收斂速度,但是降低了其排序的公正性。所以本文取不同的d值分別測試對推薦結果的影響,其結果如圖4所示。

圖4 不同d值對推薦模型的影響

從圖4可以看出在PageRank模型中,阻尼系數d取0.78時VRBCH推薦算法的RMSE值取得最小,且F-measure值取得最大,此時推薦效果較為理想,下節在比較不同推薦算法的性能優劣時均采用此設置。

3.4 實驗結果比較

為了精準評估本文所提出的VRBCH算法性能,本節選取基于時序行為的矩陣分解(Sequential Matrix Factorization, SequentialMF)算法[10]、基于用戶的協同過濾(User Collaboration Filter, UserCF)算法、不確定近鄰的協同過濾(Uncertain Neighbors’ Collaborative Filtering, UNCF)算法[20]作對比實驗。其中,SequentialMF中,在關系影響參數λ=5,數據稀疏性為99%的情況下通過用戶觀看視頻的時間構建用戶關系網絡,利用網絡圖進行關系計算,再通過概率矩陣分解模型挖掘出推薦視頻。在UserCF中,把數據集分成測試集和訓練集,利用訓練集計算出K=10個用戶的相似性獲得相似性矩陣usersim,再計算出這10個鄰居對視頻的興趣集合,推薦20個視頻給用戶。在UNCF中,利用視頻或用戶的相似性計算產生近鄰因子,通過近鄰因子在調和參數Ф=20的情況下計算視頻的預測評分產生推薦。

通過不同數據集數據量的百分比,利用RMSE和F-measure評價指標進行實驗,percentage值取區間[10,90],實驗結果如圖5~6所示。

圖5 不同推薦算法的RMSE性能比較

在圖5中,隨著實驗數據量百分比的不斷增加RMSE整體呈下降趨勢,當實驗數據量達到50%以后下降趨勢緩慢,數據量達80%后其RMSE性能基本不變。從圖5中可以看出,VRBCH算法與SequentialMF、UserCF、UNCF算法的RMSE性能相比,雖然前期有較大波動但最終結果較為理想,前期波動主要由于數據量過小而誤差較大。從圖6可以看出各算法F-measure性能隨著數據集百分比的遞增均呈上升趨勢,其中VRBCH算法的F-measure性能最高。當數據量達到80%時VRBCH算法性能上升趨勢平穩,所以VRBCH算法在不同數據量情況下的F-measure性能仍較為理想。在圖6中UNCF算法在數據量在30%到35%之間上升較緩,因為YouTube視頻評論文本評分稀疏度為98.37%,數據量較少,存在實驗誤差。相比較而言,前期由于數據量過少,SequentialMF、UserCF、UNCF算法對數據稀疏性問題要求較高,所以其F-measure性能比VRBCH性能低。

由于VRBCH算法中提出層次排序概念,通過用戶自己的行為來決定用戶自己的興趣愛好值,避免視頻關注點存在模糊多變的性質從而影響用戶興趣愛好評估的準確性,所以VRBCH算法在視頻推薦上擁有良好的推薦性能。

圖6 不同推薦算法的F-measure性能比較

4 結語

推薦系統是數據挖掘領域中一大熱點,本文改變了傳統推薦算法利用項目評分來計算相似用戶的方式,改為利用被推薦用戶瀏覽視頻的行為計算出用戶對歷史數據中視頻的喜好程度,通過被推薦用戶的歷史數據找出用戶對視頻的喜好標簽,從而成功地實現用戶行為和喜好標簽權重的轉換,避免了傳統層次分析中用戶自定義權重值。另外,考慮到用戶可能是新用戶,沒有歷史數據,本研究從相似用戶中找出最新最受喜愛的視頻推薦給用戶,有效地避免了冷啟動問題。最后形成的推薦集合中采用排序的形式,提高了用戶的體驗度。實驗結果表明,本模型在RMSE、F-measure這兩個方面的性能獲得提高,基于MovieLens Latest Datasets和YouTube 視頻評論文本數據集與其他模型進行實驗對比,結果表明本文模型取得了良好的推薦效果。

值得注意的是,本文算法還有許多要改進的方面:1)聚類時計算量問題,本文僅對少量的低維數據進行聚類,在大數據環境中則需要引入分布式計算方法,下一步會考慮在Spark平臺下進行聚類嘗試;2)在用戶聚類過程中為了提高聚類效果,在數據歸一化過程中對某些用戶屬性進行人為處理,例如用戶性別,未來應從分類的角度出發提高分類精度,由于可以離線計算,節約大量實時計算資源;3)在排序模型中針對歷史數據處理粗糙,降低了推薦精度和用戶體驗度;4)在構建視頻層對標簽層影響過程中由于是非專業人士操作導致推薦結果誤差較大。下一步計劃利用機器學習內容構建自我學習的排序算法,充分利用歷史數據從而為推薦模型的實際應用起到促進作用。

References)

[1] ARORA G, KUMAR A, DEVRE GS, et al. Movie recommendation system based on users’ similarity[J]. International Journal of Computer Science and Mobile Computing, 2014, 3(4): 765-770.

[2] DESHPANDE M, KARYPIS G. Item-based top-Nrecommendation algorithms[J]. ACM Transactions on Information Systems, 2014, 22(1): 143-177.

[3] CAI Y, LEUNG H F, LI Q, et al. Typicality-based collaborative filtering recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2014, 26(3): 766-779.

[4] KAGITA V R, PUJARI A K, PADMANABHAN V. Virtual user approach for group recommendation systems using precedence relations[J]. Information Sciences, 2015, 294(294): 15-30.

[5] KARATZOGLOU A, BALTRUNAS L, SHI Y. Learning to rank for recommender systems[C]// RecSys 2013: Proceedings of the 7th ACM Conference on Recommender Systems. New York: ACM, 2013: 493-494.

[6] FREY B J, DUECK D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814): 972-976.

[7] PAGE L, BRIN S, MOTWANI R, et al. The PageRank citation ranking: bringing order to the Web [EB/OL]. [2017- 01- 10]. http://ilpubs.stanford.edu: 8090/422/1/1999-66.pdf.

[8] 楊興耀, 于炯, 吐爾根·依布拉音, 等. 融合奇異性和擴散過程的協同過濾模型[J]. 軟件學報, 2013, 24(8): 1868-1884. (YANG X Y, YU J, IBRAHIM T, et al. Collaborative filtering model fusing singularity and diffusion process[J]. Journal of Software, 2013, 24(8): 1868-1884.)

[9] 尹路通, 于炯, 魯亮, 等. 融合評論分析和隱語義模型的視頻推薦算法[J]. 計算機應用, 2015, 35(11): 3247-3251. (YIN L T, YU J, LU L, et al. Video recommendation algorithm fusing comment analysis and latent factor model[J]. Journal of Computer Applications, 2015, 35(11): 3247-3251.)

[10] 孫光福, 吳樂, 劉淇, 等. 基于時序行為的協同過濾推薦算法[J]. 軟件學報, 2013, 24(11): 2721-2733. (SUN G F, WU L, LIU Q, et al. Recommendations based on collaborative filtering by exploiting sequential behaviors[J]. Journal of Software, 2013, 24(11): 2721-2733.)

[11] 張付志, 孫雙俠, 伊偉華. 基于非線性特征和Cauchy加權M-估計量的魯棒推薦算法[J]. 計算機學報, 2015, 40(6): 1453-1469. (ZHANG F Z, SUN S X, YI W H. Robust recommendation algorithm based on nonlinear characteristics and Cauchy weighted M-estimator[J]. Chinese Journal of Computers, 2015, 40(6): 1453-1469.)

[12] 張燕平, 張順, 錢付蘭, 等. 基于用戶聲譽的魯棒協同推薦算法[J]. 自動化學報, 2015, 41(5): 1004-1012. (ZHANG Y P, ZHANG S, QIAN F L, et al. Robust collaborative recommendation algorithm based on user’s reputation[J]. Acta Automatica Sinica, 2015, 41(5): 1004-1012.)[13] 胡勛, 孟祥武, 張玉潔, 等. 一種融合項目特征和移動用戶信任關系的推薦算法[J]. 軟件學報, 2014, 25(8): 1817-1830. (HU X, MENG X W, ZHANG Y J, et al. Recommendation algorithm combing item features and trust relationship of mobile users[J]. Journal of Software, 2014, 25(8): 1817-1830.)

[14] 郭磊, 馬軍, 陳竹敏, 等. 一種結合推薦對象關聯關系的社會化推薦算法[J]. 計算機學報, 2014, 37(1): 219-228. (GUO L, MA J, CHEN Z M, et al. Incorporation item relations for social recommendation[J]. Chinese Journal of Computers, 2014, 37(1): 219-228.)

[15] 陳克寒, 韓盼盼, 吳健. 基于用戶聚類的異構社交網絡推薦算法[J]. 計算機學報, 2013, 36(2): 349-359. (CHEN K H, HAN P P, WU J. User clustering based social network recommendation[J]. Chinese Journal of Computers, 2013, 36(2): 349-359.)

[16] XIE B, TANG X, TANG F. Hybrid recommendation base on learning to rank[C]// Proceedings of the 2015 9th International Conference on Innovative Mobile and Internet Services in Ubiquitous Computing. Piscataway, NJ: IEEE, 2015, 53-57.

[17] SAATY T L. The Analytic Hierarchy Process[M]. New York: McGraw-Hill, 1980: 22-71.

[18] ABDERRAHMEN M, MARTIN M, CHRISTOPHE D, et al. PeopleRank: social opportunistic forwarding[C]// Proceedings of IEEE INFOCOM 2010. Piscataway, NJ: IEEE, 2010: 1-5.

[19] O’CALLAGHAN D, HARRIGAN M, CARTHY J, et al. Network analysis of recurring YouTube spam campaigns[C]// Proceedings of the 2012 International Conference on Weblogs and Social Media. Dublin: ICWSM, 2012: 531-534.

[20] 黃創光, 印鑒, 汪靜, 等. 不確定近鄰的協同過濾推薦算法[J]. 計算機學報, 2010, 33(8): 1369-1377. (HUANG C G, YIN J, WANG J, et al. Uncertain neighbors’ collaborative filtering recommendation algorithm[J]. Chinese Journal of Computers, 2010, 33(8): 1369-1377.)

Videorecommendationalgorithmbasedonclusteringandhierarchicalmodel

JIN Liang1, YU Jiong1,2*, YANG Xingyao1, LU Liang2, WANG Yuefei2, GUO Binglei2, Liao Bin3

(1.SchoolofSoftware,XinjiangUniversity,UrumqiXinjiang830008,China;2.SchoolofInformationScienceandEngineering,XinjiangUniversity,UrumqiXinjiang830046,China;3.SchoolofStatisticsandInformatiion,XinjiangUniversityofFinanceandEconomics,UrumqiXinjiang830012,China)

Concerning the problem of data sparseness, cold start and low user experience of recommendation system, a video recommendation algorithm based on clustering and hierarchical model was proposed to improve the performance of recommendation system and user experience. Focusing on the user, similar users were obtained by analyzing Affiliation Propagation (AP) cluster, then historical data of online video of similar users was collected and a recommendation set of videos was geberated. Secondly, the user preference degree of a video was calculated and mapped into the tag weight of the video. Finally, a recommendation list of videos was generated by using analytic hierarchy model to calculate the ranking of user preference with videos. The experimental results on MovieLens Latest Dataset and YouTube video review text dataset show that the proposed algorithm has good performance in terms of Root-Mean-Square Error (RMSE) and the recommendation accuracy.

video recommendation; sparseness; cold start; hierarchical model; clustering analysis

2017- 04- 05;

2017- 06- 07。

國家自然科學基金資助項目(61262088,61462079,61562086,61363083,61562078)。

金亮(1992—),男,安徽滁州人,碩士研究生,CCF會員,主要研究方向:推薦系統; 于炯(1964—),男,新疆烏魯木齊人,教授,博士生導師,博士,CCF會員,主要研究方向:網絡安全、網格與分布式計算; 楊興耀(1984—),男,湖北襄陽人,博士,CCF會員,主要研究方向:推薦系統; 魯亮(1990—),男,新疆烏魯木齊人,博士研究生,CCF會員,主要研究方向:云計算、分布式計算; 王躍飛(1991—),男,新疆烏魯木齊人,博士研究生,主要研究方向:分布式計算、云計算; 國冰磊(1992—),女,湖北襄陽人,博士研究生, CCF會員,主要研究方向:綠色計算、云計算; 廖彬(1986—),男,新疆烏魯木齊人,副教授,博士,CCF會員,主要研究方向:大數據、綠色計算。

1001- 9081(2017)10- 2828- 06

10.11772/j.issn.1001- 9081.2017.10.2828

TP181

A

This work is partially supported by the National Natural Science Foundation of China (61262088, 61462079, 61562086, 61363083, 61562078).

JINLiang, born in 1992, M. S. candidate. His research interests include recommender system.

YUJiong, born in 1964, Ph. D., professor. His research interests include network security, grid and distributed computing.

YANGXingyao, born in 1984, Ph. D. His research interests include recommender system.

LULiang, born in 1990, Ph. D. candidate. His research interests include cloud computing, distributed computing.

WANGYuefei, born in 1991, Ph. D. candidate. His research interests include cloud computing, distributed computing.

GUOBinglei, born in 1992, Ph. D. candidate. Her research interests include green computing, cloud computing.

LIAOBin, born in 1986, Ph. D., associate professor. His research interests include big data, green computing.

猜你喜歡
排序用戶模型
一半模型
排序不等式
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
恐怖排序
節日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 国产主播一区二区三区| 一区二区日韩国产精久久| 在线观看亚洲国产| 国产尤物jk自慰制服喷水| 国产资源免费观看| 播五月综合| 在线亚洲精品自拍| 国产成人精品高清不卡在线 | 国产黄网永久免费| 国产在线精品人成导航| 亚洲精品国产日韩无码AV永久免费网 | 亚洲精品老司机| 免费观看精品视频999| 日本不卡在线视频| 91精品国产一区| 亚洲Aⅴ无码专区在线观看q| 色综合中文| 国产在线小视频| 香蕉网久久| 亚洲日韩久久综合中文字幕| 国产福利微拍精品一区二区| 日本91视频| 人妖无码第一页| 午夜无码一区二区三区在线app| 特级欧美视频aaaaaa| 欧美日本视频在线观看| 一级高清毛片免费a级高清毛片| 亚洲一区二区成人| 精品一区二区三区自慰喷水| 亚洲伊人天堂| 啪啪国产视频| 亚洲日本精品一区二区| 免费观看亚洲人成网站| 国产91视频免费观看| 人妻21p大胆| 国产美女在线免费观看| 四虎永久免费网站| 五月天综合婷婷| 2021国产v亚洲v天堂无码| 青青青国产视频| 国产女人18水真多毛片18精品 | 久久综合亚洲鲁鲁九月天| 久久精品国产精品青草app| 色综合a怡红院怡红院首页| 日韩成人午夜| 亚洲欧美成人| 国产制服丝袜91在线| 青青草综合网| 午夜国产大片免费观看| 国产精品高清国产三级囯产AV| 97国产精品视频人人做人人爱| 亚洲熟妇AV日韩熟妇在线| 日韩午夜伦| 欧美亚洲国产一区| 玖玖免费视频在线观看| 日本少妇又色又爽又高潮| 国产欧美日本在线观看| 精久久久久无码区中文字幕| 国内精品小视频福利网址| 91精品啪在线观看国产| 91无码人妻精品一区二区蜜桃| 制服丝袜无码每日更新| 毛片免费在线视频| 免费观看国产小粉嫩喷水| 亚洲婷婷丁香| 在线观看免费黄色网址| 亚洲国产成熟视频在线多多| 噜噜噜久久| 国产综合亚洲欧洲区精品无码| 国产精品综合色区在线观看| 青青青视频蜜桃一区二区| 日韩欧美国产另类| 国产福利免费在线观看| 精品剧情v国产在线观看| 在线观看亚洲天堂| 999福利激情视频| 人妻丰满熟妇啪啪| 久久精品国产一区二区小说| 国产精品人人做人人爽人人添| 深夜福利视频一区二区| 亚洲精品国产乱码不卡| 亚洲一区二区三区麻豆|