999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Logistic函數的貝葉斯概率矩陣分解算法

2014-11-18 03:10:44方耀寧郭云飛蘭巨龍
電子與信息學報 2014年3期
關鍵詞:用戶模型

方耀寧郭云飛 蘭巨龍

(國家數字交換系統工程技術研究中心 鄭州 450002)

1 引言

當前,推薦系統(Recommender Systems, RS)是電子商務領域的研究熱點之一。與基于內容的(Content-based)推薦算法相比,協同過濾(Collaborative Filtering, CF)推薦算法無須對內容進行解析,只利用歷史行為信息便可以進行個性化推薦,在過去十年中取得了豐富的研究成果。其中,基于矩陣分解(Matrix Factorization, MF)的潛在因子模型(latent factor model)在預測準確性和穩定性上得到了最為廣泛的認可[1]。

核矩陣分解算法(kernelized matrix factorization)雖然能夠表征潛在因子間的非線性聯系,但是計算量較大并不實用[8,9]。此外,項目間的隱含關系,用戶的社交信息,上下文也可以用來提高矩陣分解算法的性能[10,11]。最近,Mackey等人[12]提出“分而治之”的思想,把原始矩陣拆分成多個小矩陣分別進行分解。與之類似,文獻[13]假設原始矩陣是局部低秩的,把原始矩陣分解為多個低秩矩陣,然后再進行分解。文獻[14]和文獻[15]在 Netflix和MovieLens數據集合上對主流的推薦算法進行了較為詳細的對比分析。

本文利用 Logistic函數來表征潛在因子間的非線性關系,在不增加計算復雜度的前提下,建立了L-BPMF(Logistic Bayesian Probabilistic Matrix Factorization)模型,并使用馬爾科夫鏈蒙特卡羅方法訓練L-BPMF模型。在兩種真實數據集合上的實驗結果表明,L-BPMF比主流推薦算法的預測準確性都要好,能夠明顯緩解數據稀疏性問題[15]。

2 貝葉斯概率矩陣分解

概率矩陣分解(Probabilistic Matrix Factorization, PMF)假設用戶和項目的特征向量矩陣都服從高斯分布,不同用戶、項目的概率分布相互獨立[6]。

進而,把用戶對項目的評分變成一個概率問題:

圖1 Bayesian PMF模型[7]

BPMF模型一般用馬爾科夫鏈蒙特卡羅方法進行訓練,雖然預測誤差較小,但仍然是一種線性模型。線性模型不能反映用戶特征U和項目特征V之間的非線性關系,這一定程度上限制 BPMF的性能,特別是在數據稀疏條件下提取潛在信息的能力。

3 基于Logistic函數的BPMF算法

3.1 Logistic BPMF模型

Logistic函數是機器學習領域中常用的一種 S型函數,定義域為,值域為。Logistic函數在定義域內單調連續,呈現出先緩慢增長,然后加速增長,最后逐漸穩定的趨勢,能夠較好反映生物種群發展、神經元非線性感知、人類認知學習過程等[16]。受數理情感學中情感強度第一定律啟發,本文用Logistic函數的橫軸表示用戶感知到的“刺激”,縱軸表示用戶評分:用戶受到的“刺激”為正,則評分大于評分均值;“刺激”越強烈,評分越高;原點附近評分隨“刺激”變化較快,屬于敏感區域;偏離原點處評分隨“刺激”變化緩慢,屬于麻木區域[16,17]。

Logistic BPMF模型如圖2所示,其核心改進是假設用戶 i對項目 j的評分 Rij服從均值為方差為的高斯分布,即

圖2 Logistic BPMF模型

3.2貝葉斯推斷與吉布斯抽樣

. 貝葉斯推斷(Bayesian inference)是將先驗的思想和樣本數據相結合,得到后驗分布,然后根據后驗分布進行統計推斷。貝葉斯推斷的精度受到樣本數量和先驗分布準確性的影響。在先驗分布一定的情況下,樣本數量越大則推斷精度越高。本文在訓練Logistic BPMF的過程中,使用吉布斯抽樣進行貝葉斯推斷。吉布斯抽樣(Gibbs sampling)是一種典型的 MCMC方法,適用于聯合概率未知,但條件概率容易獲取的情況。首先利用條件概率構造平穩分布為所求聯合概率的馬爾科夫鏈,然后進行T次抽樣,此時的樣本可以近似認為是來自聯合概率的抽樣,最后利用式(7)進行評分預測。

使用吉布斯抽樣方法進行貝葉斯推斷,條件后驗概率必須要有顯示解,即明確的新樣本產生規則。L-BPMF模型中,在已知其它參數的條件下,Ui的條件后驗概率為

為了簡化式(9)的形式,本文對Logistic函數進行麥克勞林展開, 于是

根據共軛先驗分布理論:若方差已知,高斯分布均值的共軛先驗分布是高斯分布[7],利用配湊平方和的方法可以得到

已知樣本B,超參數BΘ的條件后驗概率可以利用高斯-威沙特分布的性質得到。

3.3 算法復雜度分析

4 實驗設計及結果分析

4.1 數據集合及評價標準

為了測試L-BPMF算法的有效性,本文采用推薦系統常用的兩種數據集合:Netflix和MovieLens。Netflix數據集合是Netflix Prize比賽中使用的標準測試數據集,本文從中隨機抽取了包含8662名用戶對 3000部視頻的約5310×條評分信息(評分密度為1.1%)作為測試集合。MovieLens數據集合由GroupLens提供,MovieLens 1M數據集包含了6039名用戶對 3883部電影的610條評分信息(評分密度為4.3%);MovieLens 100K數據集包含了943名用戶對 1682部電影的條評分信息(評分密度為6.3%)。

文獻[18]全面總結了推薦系統領域各種不同的評價標準,文中采用檢驗推薦算法最常用的預測誤差MAE和RMSE 作為評價依據,預測誤差越小則表示算法性能越好。其中是測試集合,是testS 中的元素個數。

4.2 實驗設計及結果

本文在上述兩種數據集合上,以 MAE和RMSE為評價標準,設計了3組實驗從不同方面對L-BPMF的性能進行測試,每組結果都是10次實驗結果的平均值。

A組實驗在Netflix和MovieLens 1M數據集合上,隨機選取不同比例的訓練集合,對L-BPMF和經典 BPMF進行了對比(特征維度 10d= ),使用RSVD(學習率lr 0.005= ,正則化因子的預測誤差作為參考。實驗結果如圖3,圖4所示。在Netflix數據集合上,L-BPMF比BPMF的預測誤差小約1%,而且在訓練比例較低時優勢更明顯,在訓練比例為 20%時能夠降低約 1.5%;在MovieLens 1M數據集合,L-BPMF比RSVD的預測誤差小1%~2%,L-BPMF和BPMF預測準確性基本一致,在訓練比例較低時L-BPMF略好一點。分析發現,Netflix數據集合的評分密度只有1.1%,而MovieLens 1 M的評分密度為4.3%。一種可能的解釋是,評分密度較大時L-BPMF與BPMF的性能基本一致,評分較稀疏時L-BPMF比BPMF的預測誤差更小。

為了驗證上述結論,利用MovieLens 100K數據集合產生評分密度<1.5%的訓練環境,進行B組測試。實際應用中的評分密度都在1%以下,稀疏條件下的實驗更能反映算法提取潛在信息的能力。從圖5中可以看出,L-BPMF的RMSE預測誤差比BPMF低約2%,在最壞的情況下也能夠降低約1%的預測誤差。這說明L-BPMF提取潛在信息的能力要大于BPMF,能夠有效緩解數據稀疏性問題。

C組以MAE為指標對比了L-BPMF和其它主流推薦算法(RSVD, SVD++, KNN, Slope One[19]),實驗結果如圖6所示[20]。其中,RSVD的參數與A組實驗相同;SVD++算法中學習率lr 0.005= ,正則化因子; RSVD, SVD++的特征空間維度d為20, L-BPMF算法的特征維度為10。都只記錄了訓練過程中的最優值,并未記錄過擬合現象。KNN算法中以皮爾森相似度公式計算相似性,選擇與目標用戶最相似的20個用戶作為鄰居進行預測。一般來說,KNN算法中鄰居數目小于20時預測準確性會明顯下降[14]。

圖3 Netflix上L-BPMF與BPMF的對比

圖4 MovieLens 1M上L-BPMF 與BPMF的對比

圖5 稀疏條件下L-BPMF 與BPMF的對比

從圖6中可以看出,L-BPMF和SVD++是預測誤差最小的兩種算法,L-BPMF的MAE誤差比RSVD低約0.5%~1.5%。因為L-BPMF特征維度為10, SVD++的特征維度為20,而且L-BPMF的性能略高于SVD++,這說明L-BPMF能夠用較小的特征維度d獲得更高的預測準確性。

圖6 主流推薦算法的MAE預測誤差比較

5 結束語

本文針對經典貝葉斯概率矩陣分解模型不能表征潛在因子間非線性關系的問題,提出一種利用Logistic函數的L-BPMF模型,并使用MCMC方法對模型進行訓練。在兩種真實數據集合上的實驗表明,L-BPMF能夠明顯提高預測準確性,用較小的特征維度獲得比RSVD和SVD++更好的性能。在稀疏條件下的測試結果表明,L-BPMF比BPMF提取信息的能力更強,能夠有效緩解數據稀疏性問題。

[1] Koren Y, Bell R, and Volinsky C. Matrix factorization techniques for recommender systems[J]. IEEE Computer,2009, 42(1): 30-37.

[2] Billsus D and Pazzani M J. Learning collaborativeGranada, 2012: 1134-1142.

[13] Lee J, Kim S, Lebanon G, et al.. Local low-rank matrix approximation[C]. Proceedings of the 30th International Conference on Machine Learning (ICML-13), Atlanta, 2013:82-90.

[14] Cacheda F, Carneiro V, Fernandez D, et al.. Comparison of collaborative filtering algorithms: limitations of current techniques and proposals for scalable, high-performance recommender systems[J]. ACM Transactions on Web, 2011,5(2): 1-33.

[15] Lü Lin-yuan, Medo M, Yeung C H ,et al.. Recommender systems[J]. Physics Reports, 2012, 1(3): 159-172.

[16] Jordan M I. Why the logistic function? a tutorial discussion on probabilities and neural networks[J]. MIT Computational Cognitive Science Report , 1995, 9503: 1-13.

[17] 仇德輝. 數理情感學[M]. 長沙: 湖南人民出版社,2001:55-60.Qiu De-hui. Mathematical Emotions[M]. Changsha, Hunan People’s Publishing House, 2001: 55-60.

[18] 朱郁筱, 呂琳媛. 推薦系統評價指標綜述[J]. 電子科技大學學報, 2012, 41(2): 163-175.Zhu Yu-xiao and Lü Lin-yuan. Evaluation metrics for recommender systems[J]. Journal of University of Electronic Science and Technology of China, 2012, 41(2): 163-175.

[19] Lemire D and Maclachlan A. Slope one predictors for online rating-based collaborative filtering[J]. Society for Industrial Mathematics, 2005, 5(1): 471-480.

[20] 方耀寧, 郭云飛, 丁雪濤, 等. 一種基于局部結構的改進奇異值分解推薦算法[J]. 電子與信息學報, 2013, 35(6): 1284-1289.Fang Yao-ning, Guo Yun-fei, Ding Xue-tao, et al.. An improved Singular Value Decomposition recommender algorithm based on local structures[J]. Journal of Electronic& Information Technology, 2013, 35(6): 1284-1289.

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 91视频国产高清| 亚洲专区一区二区在线观看| 国产一区二区三区夜色| 亚洲欧美精品在线| 国产亚洲高清在线精品99| 日韩精品专区免费无码aⅴ | 五月婷婷伊人网| 国产精品无码久久久久AV| 婷婷色一二三区波多野衣| 亚洲国产成熟视频在线多多| AV天堂资源福利在线观看| 日韩中文无码av超清| 亚洲AV成人一区二区三区AV| 欧美特级AAAAAA视频免费观看| 亚洲女同欧美在线| 国产青榴视频在线观看网站| 最新国语自产精品视频在| 精品免费在线视频| 亚洲日韩AV无码一区二区三区人| 亚洲一区精品视频在线| 99这里精品| 欧洲在线免费视频| 久久精品女人天堂aaa| 99精品热视频这里只有精品7| 国产一区二区人大臿蕉香蕉| 欧美成a人片在线观看| 中文字幕调教一区二区视频| 天天综合网亚洲网站| 视频一本大道香蕉久在线播放| 欧美成人精品在线| 国内精品自在欧美一区| 国产精品永久在线| 久综合日韩| 亚洲人成成无码网WWW| 午夜性刺激在线观看免费| 亚洲第一天堂无码专区| 亚洲日韩精品无码专区| 香蕉视频在线观看www| 99re在线免费视频| 色婷婷在线影院| 九色综合视频网| 国产精品一区二区久久精品无码| 国产午夜精品鲁丝片| 国产日韩精品一区在线不卡| 久久青草热| 国产综合另类小说色区色噜噜| 在线看AV天堂| 久久永久视频| 亚洲AⅤ无码国产精品| 最新国产你懂的在线网址| 亚洲精品国产精品乱码不卞| 在线无码私拍| 青青青草国产| 国产成人永久免费视频| 国产成人av一区二区三区| 美女黄网十八禁免费看| 久热精品免费| 成年女人18毛片毛片免费| 日韩美一区二区| 91探花在线观看国产最新| 在线国产综合一区二区三区| 欧美成a人片在线观看| 91免费观看视频| 福利在线不卡一区| 日本高清免费不卡视频| 三上悠亚精品二区在线观看| 香蕉网久久| 狠狠亚洲五月天| 99视频只有精品| 成人在线不卡| 91探花国产综合在线精品| 亚洲成a人片在线观看88| 欧洲日本亚洲中文字幕| 国产精品午夜福利麻豆| 免费看一级毛片波多结衣| 伊人久久综在合线亚洲91| 在线国产资源| 国产91全国探花系列在线播放 | 亚洲最新地址| 成人国产三级在线播放| 国产农村妇女精品一二区| 三级视频中文字幕|