999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于物品的改進協(xié)同過濾算法及應(yīng)用①

2019-01-18 08:30:24鄧園園吳美香潘家輝
計算機系統(tǒng)應(yīng)用 2019年1期
關(guān)鍵詞:用戶產(chǎn)品系統(tǒng)

鄧園園, 吳美香, 潘家輝

(華南師范大學 軟件學院, 南海 528225)

1 引言

1.1 研究背景

當今時代, 互聯(lián)網(wǎng)發(fā)展迅猛, 帶動了電視產(chǎn)業(yè)的發(fā)展, 電視信息資源爆炸式增長導致了人們接觸的電視產(chǎn)品信息量過載, 使用戶多樣化需求與電視產(chǎn)品海量資源之間的矛盾日益突出. 此時, 各種基于用戶喜好的電視產(chǎn)品推薦系統(tǒng)應(yīng)運而生, 推薦精準度成為衡量各大推薦系統(tǒng)的關(guān)鍵手段, 而推薦精準度依賴于推薦算法. 現(xiàn)流行的推薦算法有基于內(nèi)容推薦、基于協(xié)同過濾推薦、基于關(guān)聯(lián)規(guī)則推薦以及組合推薦等算法, 其中, 基于協(xié)同過濾的推薦算法對推薦對象無結(jié)構(gòu)要求,廣泛應(yīng)用于電影推薦中.

1.2 研究現(xiàn)狀

(1) 國內(nèi)外研究現(xiàn)狀

國外的協(xié)同過濾算法首次提出是在二十世紀九十年代, 根據(jù)用戶評分進行推薦, 這是最原始的推薦依據(jù).當時的用戶數(shù)據(jù)還是比較稀疏的, 為了解決稀疏性問題, 專家們提出了可以利用用戶的歷史行為信息來間接獲取數(shù)據(jù)的技術(shù)[1]. 至今, 推薦系統(tǒng)已經(jīng)成為數(shù)據(jù)挖掘的主要服務(wù)對象. 國外著名的推薦系統(tǒng)有GroupLens、PHOAKS和Ringo. 其中GroupLens是一個基于群體的共同偏好的新聞推薦系統(tǒng). PHOAKS通過記錄在線用戶所發(fā)帖子中的網(wǎng)站數(shù)量, 進行排名, 給相關(guān)用戶推薦數(shù)量較高的網(wǎng)站, 達到網(wǎng)站推薦目的. Ringo是一個音樂推薦系統(tǒng), 通過對音樂人的評分對用戶進行分組,根據(jù)用戶組內(nèi)互推達成推薦目的. 由此可見, 國外的協(xié)同過濾技術(shù)已經(jīng)較為成熟和先進.

雖然推薦系統(tǒng)已經(jīng)應(yīng)用在我國的電子商務(wù)和社交方面, 但是我國的推薦系統(tǒng)相關(guān)技術(shù)還處于初步階段,以推薦系統(tǒng)為關(guān)鍵詞的論文發(fā)表也大大落后于國外,并且大部分是參考國外的先進成果[2]. 2009年, 國內(nèi)首個個性化推薦系統(tǒng)團隊成立, 主要致力于個性化推薦系統(tǒng)的研究. 目前, 我國推薦系統(tǒng)做得較好的有豆瓣網(wǎng)、淘寶網(wǎng)、愛奇藝等各大視頻網(wǎng)站等.

(2) 關(guān)于協(xié)同過濾算法的改進研究

傳統(tǒng)的協(xié)同過濾算法存在冷啟動、稀疏等問題導致推薦精度偏差. 為了提高推薦精度, 相關(guān)學者也進行了一些優(yōu)化處理. 重慶理工大學黃賢英等人[3]提出結(jié)合用戶興趣度聚類的協(xié)同過濾算法, 將用戶-項目矩陣、項目-關(guān)鍵詞矩陣結(jié)合成用戶-關(guān)鍵詞矩陣, 使系統(tǒng)發(fā)現(xiàn)隱藏的用戶間的關(guān)系, 平均絕對誤差(MAE)值降低到0.643, 提高了推薦準確率. 浙江大學劉曉等人[4]提出電視劇推薦系統(tǒng)計算相似度時引入熱門電視劇的熱門程度考慮, 避免熱門電視劇與其他電視劇相似度偏高, 獲得大量推薦的問題, 準確率提高至39.7%. 上海理工大學實驗室[5]提出在皮爾遜相似度原理上添加熱門因子來優(yōu)化皮爾遜相似度計算, 改進后算法的MAE值減少到了0.758, 推薦準確率得到提高.

基于以上的研究成果, 同樣考慮到電視產(chǎn)品推薦的冷門項目問題, 本文提出基于物品的協(xié)同過濾算法在電視產(chǎn)品推薦系統(tǒng)中的研究應(yīng)用, 并在此基礎(chǔ)上根據(jù)用戶的歷史點播記錄引入了點播金額權(quán)重這一個隱式特征進行改進, 使得推薦精度更加準確.

2 基于協(xié)同過濾的推薦算法

由于協(xié)同過濾的推薦算法對推薦對象無結(jié)構(gòu)要求,廣泛應(yīng)用于電影推薦中, 本文采用基于協(xié)同過濾的推薦算法來解決電視產(chǎn)品推薦問題. 協(xié)同過濾推薦算法主要分為兩類: 基于用戶的協(xié)同過濾算法和基于物品的協(xié)同過濾算法[6].

2.1 基于用戶的協(xié)同過濾算法

基于用戶的協(xié)同過濾推薦算法的基本思想是基于用戶對物品的偏好找到用戶的鄰居用戶, 然后將鄰居用戶的偏好推薦給當前用戶, 偏好可以通過對用戶的歷史行為數(shù)據(jù)(如商品購買、收藏、分享、評分、觀看時長等)挖掘而來. 在計算上, 根據(jù)不同用戶對相同物品的偏好程度計算用戶之間的關(guān)系, 利用有相同偏好的用戶來預測當前用戶的偏好, 然后選擇預測喜愛程度最高的若干個推薦對象反饋給用戶. 基于用戶的協(xié)同過濾算法的推薦流程如圖1所示.

圖1 基于用戶的協(xié)同過濾算法的推薦流程圖

2.2 基于物品的協(xié)同過濾算法

基于物品的協(xié)同過濾推薦算法的原理和基于用戶的協(xié)同過濾推薦算法相似, 將物品和用戶對換. 在計算時計算的是物品之間的關(guān)系, 而不是用戶之間的關(guān)系,從物品本身出發(fā), 基于用戶對物品的偏好找到相似的物品, 然后利用K個最近鄰居物品的加權(quán)來預測當前用戶對這K個鄰居物品的喜好程度, 從而將喜好程度高的若干個物品推薦給用戶. 基于物品的協(xié)同過濾算法的推薦流程如圖2所示.

圖2 基于物品的協(xié)同過濾算法的推薦流程圖

2.3 兩種協(xié)同過濾推薦算法的比較

基于用戶的協(xié)同過濾推薦算法和基于物品的協(xié)同過濾推薦算法都各有優(yōu)勢, 對于電視產(chǎn)品的推薦來說,客戶量的數(shù)據(jù)遠遠少于產(chǎn)品(物品)數(shù)據(jù), 在這種非社交網(wǎng)絡(luò)的電視產(chǎn)品推薦引擎中, 內(nèi)容內(nèi)在的聯(lián)系的推薦原則比基于相似用戶的推薦原則更加有效, 故在電視產(chǎn)品推薦上選擇基于物品的協(xié)同過濾算法. 在給用戶推薦電視產(chǎn)品時, 給用戶推薦與該用戶歷史觀看的電視節(jié)目相似度高的電視產(chǎn)品, 和推薦相似用戶觀看的電視產(chǎn)品給用戶相比, 顯然前者更加具有說服力.

3 引入點播金額權(quán)重后的協(xié)同過濾推薦算法

本文采用基于物品的協(xié)同過濾推薦算法來解決給用戶推薦電視產(chǎn)品的問題, 并在傳統(tǒng)的基于物品的協(xié)同過濾推薦算法中引入點播金額權(quán)重進行改進, 用于提高推薦系統(tǒng)的準確率. 首先根據(jù)用戶的收視信息來分析用戶的收視偏好, 將用戶觀看某個電視節(jié)目的時間長短作為用戶喜好的顯式特征, 根據(jù)電視產(chǎn)品的營銷特性, 建立好數(shù)據(jù)模型后加入電視產(chǎn)品的點播金額權(quán)重, 再計算相似度. 然后根據(jù)電視產(chǎn)品之間的相似性和用戶的歷史觀看記錄來預測目標用戶對未觀看過的電視產(chǎn)品的觀看時長, 產(chǎn)生推薦結(jié)果, 尋找k最近鄰構(gòu)成推薦矩陣. 算法流程圖如圖3所示.

3.1 收集用戶偏好

用戶收視信息數(shù)據(jù)主要包括用戶的機頂盒號、電視節(jié)目名稱, 對應(yīng)電視節(jié)目觀看時長、電視產(chǎn)品點播金額, 將用戶觀看某個電視節(jié)目的時長作為衡量用戶喜好程度的依據(jù). 根據(jù)用戶機頂盒號、電視節(jié)目名稱、觀看時長這三個數(shù)據(jù)生成矩陣, 作為基于物品的協(xié)同過濾算法模型的輸入數(shù)據(jù), 建立數(shù)據(jù)模型.

在建立完數(shù)據(jù)模型后, 對構(gòu)建好的初始矩陣(用戶-觀看時長矩陣X)采取矩陣相乘的方式進行點播金額權(quán)重(電視產(chǎn)品-點播金額權(quán)重矩陣M)的賦權(quán), 得到最終數(shù)據(jù)矩陣W, 如式(1). 因為流行物品往往和任意物品的相似度都很高, 現(xiàn)實中基于物品的協(xié)同過濾推薦算法應(yīng)用往往會增加對流行物品的懲罰度[7]. 對于電視產(chǎn)品的推薦來說, 有些電視產(chǎn)品是需要點播金額才可以觀看的, 根據(jù)用戶的消費心理, 點播金額小的電視節(jié)目往往會更受歡迎, 也就是所謂的“流行產(chǎn)品”, 在進行推薦時, 這些流行產(chǎn)品會對推薦結(jié)果引起干擾, 造成推薦結(jié)果不準確. 而且點播金額還能在一定程度上反映用戶的偏好, 點播金額昂貴的電視產(chǎn)品用戶仍愿意點播說明用戶很喜愛這個電視產(chǎn)品. 所以在構(gòu)建數(shù)據(jù)模型時引入點播金額權(quán)重, 可使推薦結(jié)果更加準確.

圖3 引入點播金額權(quán)重后協(xié)同過濾算法的流程圖

3.2 計算相似度

計算物品相似度是基于物品的協(xié)同過濾算法的核心, 計算電視產(chǎn)品之間的相似度即為計算向量間的距離, 距離越近相似度越大, 主要有歐幾里得距離、皮爾遜相關(guān)系數(shù)、余弦相似度[8]這三種方法.

由于電視產(chǎn)品推薦和其他用評分作為用戶偏好的推薦系統(tǒng)不同, 不存在“分數(shù)膨脹”的問題, 電視產(chǎn)品的收視數(shù)據(jù)比較密集和完整, 距離數(shù)據(jù)非常重要, 故最終選擇歐幾里德距離法計算電視產(chǎn)品之間的相似度.

歐幾里德距離法: 最初用于計算歐幾里德空間中兩個點的距離, 假設(shè)x,y是n維空間的兩個點, 它們之間的歐幾里德距離是:

當用歐幾里德距離表示相似度, 一般采用式(3)進行轉(zhuǎn)換: 距離越小, 相似度越大.

3.3 尋找K最近鄰

計算出電視產(chǎn)品之間的相似度后, 保留與目標電視產(chǎn)品相似度最大的K個電視產(chǎn)品作為其最鄰居電視產(chǎn)品集合.

3.4 獲得推薦指數(shù)

根據(jù)上一步獲得的最鄰居電視產(chǎn)品集合, 結(jié)合鄰居電視產(chǎn)品對目標用戶未觀看過的電視產(chǎn)品的觀看時長以及相似度來計算目標用戶觀看未看過的電視產(chǎn)品的預測觀看時長, 通常采取中心加權(quán)平均值[9]的方法計算目標用戶v對未看過電視產(chǎn)品的預測觀看時長p(v,i),記ri、rj分別表示觀看過電視產(chǎn)品i、電視產(chǎn)品j的用戶的觀看時長平均值, 如式(4).

將預測的觀看時長歸一化后作為電視產(chǎn)品的推薦指數(shù), 將推薦指數(shù)的Top10作為推薦結(jié)果反饋給用戶.

4 實驗結(jié)果及效果分析

4.1 實驗數(shù)據(jù)集

本文的實驗采用Python語言, 泰迪杯比賽提供的廣電平臺收視信息數(shù)據(jù)作為實驗數(shù)據(jù), 共452 455條數(shù)據(jù), 主要是用戶觀看電視產(chǎn)品的數(shù)據(jù), 包含用戶機頂盒號、電視節(jié)目名稱, 對應(yīng)電視節(jié)目觀看時長等數(shù)據(jù)(如表1), 還有電視產(chǎn)品對應(yīng)的點播金額數(shù)據(jù)(如表2). 將這些數(shù)據(jù)的80%作為訓練集, 20%作為測試集.

表1 廣電平臺的收視信息數(shù)據(jù)表

表2 電視產(chǎn)品點播金額數(shù)據(jù)表

4.2 評估標準

通過比較推薦結(jié)果和實際觀看的電視產(chǎn)品集的偏差, 來衡量一個推薦系統(tǒng)的好壞. 本文用平均絕對誤差(MAE)[3]和平均預測覆蓋率(APC)[10]兩個評估指標來對比分析傳統(tǒng)的基于物品的協(xié)同過濾算法和優(yōu)化后算法的效果.

(1)平均絕對誤差

平均絕對誤差是一種常用的用于衡量統(tǒng)計的準確性和比較的度量方法, 通過計算預測的用戶觀看時長與實際用戶觀看時長之間的偏差度來度量預測的準確性.MAE值越小, 推薦準確度就越高. 假設(shè)系統(tǒng)預測推薦的電視產(chǎn)品集合為 (x1,x2,…,xn), 用戶實際觀看電視產(chǎn)品集合為 (y1,y2,…,yn), 計算公式如下:

(2)覆蓋率

覆蓋率表示一個推薦系統(tǒng)對長尾商品的挖掘能力,設(shè)推薦給一個用戶的電視產(chǎn)品集合為R, 該用戶實際觀看電視產(chǎn)品集合為A, 采用APC(平均預測覆蓋率)計算平均整體的推薦效果, 如式(6).

4.3 實驗結(jié)果及效果分析

本文設(shè)置兩組實驗, 實驗1用來確定最優(yōu)的點播金額權(quán)重值以達到最佳效果, 實驗2用來驗證優(yōu)化后算法的有效性.

實驗1在其他參數(shù)相同的條件下, 只改變點播金額權(quán)重, 點播金額權(quán)重值從0開始取值到1, 步長為0.1, 使用MAE指標來衡量不同點播金額權(quán)重下的推薦效果. 實驗結(jié)果如圖4所示, 由圖4可看出, 當點播金額權(quán)重值為0.3時MAE值最小, 推薦精度最高.

圖4 不同點播金額權(quán)重的平均絕對誤差對比圖

實驗2在相同參數(shù)的環(huán)境下, 將本文改進算法(點播金額權(quán)重取實驗1得到的最優(yōu)值0.3)同時與傳統(tǒng)協(xié)同過濾算法和文獻[5]改進算法進行對比, 產(chǎn)生推薦結(jié)果(如表3). 將三種算法得到的推薦結(jié)果與實際興趣集合進行比較, 用MAE和APC兩個評估指標衡量, 實驗結(jié)果如圖5和圖6所示.

由圖5可知, 相似鄰居數(shù)目的變化對三種算法均有影響, 隨著鄰居數(shù)目的增加MAE達到最小值并逐漸趨于穩(wěn)定. 在鄰居數(shù)目為15時, 三種算法的MAE均達到最小值, 此時推薦準確度最高. 無論鄰居數(shù)目為何值,本文改進算法和文獻[5]改進算法都比傳統(tǒng)算法的MAE值低, 而本文改進算法的MAE值總體上略優(yōu)于文獻[5]改進算法, 說明準確率較高. 由圖6可看出, 本文改進算法的平均預測覆蓋率均高于傳統(tǒng)算法和文獻[5]改進算法, 說明引入點播金額權(quán)重后能夠提高推薦系統(tǒng)的覆蓋率. 文獻[5]改進算法引入物品熱門因子來改進協(xié)同過濾算法, 達到優(yōu)化相似度的計算的目的, 但在本文電視產(chǎn)品推薦應(yīng)用中, 由于電視產(chǎn)品的特性, 點播金額比物品熱門因子衡量物品熱門程度的效果更好, 故推薦效果更佳.

表3 推薦結(jié)果部分示例數(shù)據(jù)表

圖5 優(yōu)化前后平均絕對誤差對比圖

圖6 優(yōu)化前后平均預測覆蓋率對比圖

5 結(jié)束語

本文主要研究了基于物品的協(xié)同過濾算法在電視產(chǎn)品推薦系統(tǒng)中的改進及應(yīng)用, 在傳統(tǒng)的協(xié)同過濾算法中引入點播金額權(quán)重來避免流行物品對推薦結(jié)果產(chǎn)生的干擾, 使推薦結(jié)果更加準確. 實驗表明, 優(yōu)化后的推薦算法的平均絕對誤差和平均預測覆蓋率均比傳統(tǒng)的協(xié)同過濾算法高, 說明優(yōu)化后算法的推薦結(jié)果準確率得到提高. 個性化電視產(chǎn)品的推薦不僅能夠給用戶帶來獲取信息的便利性, 還能給運營商帶來巨大的經(jīng)濟利益, 達到一石二鳥的效果.

猜你喜歡
用戶產(chǎn)品系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
2015產(chǎn)品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
如何獲取一億海外用戶
新產(chǎn)品
玩具(2009年10期)2009-11-04 02:33:14
主站蜘蛛池模板: 乱人伦99久久| 欧美三級片黃色三級片黃色1| 天堂中文在线资源| 亚洲国产成人无码AV在线影院L| 国产二级毛片| 精品99在线观看| 2020久久国产综合精品swag| 国产精品网址在线观看你懂的| 亚洲经典在线中文字幕| 欧美国产在线一区| 天堂成人在线| 国产在线小视频| 国产v精品成人免费视频71pao| 毛片在线播放网址| 手机看片1024久久精品你懂的| 国产综合精品日本亚洲777| 天天综合亚洲| 蜜芽一区二区国产精品| 国产综合日韩另类一区二区| 国产乱子伦无码精品小说| 成人av手机在线观看| 亚洲国产在一区二区三区| 重口调教一区二区视频| 国产午夜不卡| 美女国产在线| 不卡视频国产| 99国产精品免费观看视频| 欧美亚洲中文精品三区| 亚洲中文字幕精品| 国产浮力第一页永久地址| 成人另类稀缺在线观看| 一级毛片视频免费| 2020国产精品视频| 日本国产精品一区久久久| 天堂久久久久久中文字幕| 女人18毛片久久| 激情爆乳一区二区| 色网站免费在线观看| 四虎亚洲精品| 第一区免费在线观看| 精品国产网| 欧美精品亚洲二区| 国产日本视频91| 国产伦片中文免费观看| 日本a∨在线观看| 91无码人妻精品一区| 亚洲国产欧美国产综合久久 | 国产一区二区网站| 暴力调教一区二区三区| 色妞www精品视频一级下载| 99精品在线视频观看| 天天色综网| 亚洲第一区在线| 国产黄色爱视频| 视频二区亚洲精品| 国产SUV精品一区二区6| 欧美久久网| 亚洲无码高清免费视频亚洲| 九色视频在线免费观看| 456亚洲人成高清在线| 天天综合网色| 久久精品无码国产一区二区三区| av天堂最新版在线| 99资源在线| 五月综合色婷婷| 99re在线观看视频| 在线亚洲精品自拍| 国产免费羞羞视频| 性色生活片在线观看| 国产交换配偶在线视频| 中文字幕在线一区二区在线| 天堂av高清一区二区三区| 国产精品粉嫩| 国产精品免费p区| 国产成人精彩在线视频50| 国产精品.com| 波多野结衣中文字幕久久| 美女裸体18禁网站| 色亚洲成人| 国产成人高清精品免费| 成人伊人色一区二区三区| 久久精品国产免费观看频道|