999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

協(xié)同過濾算法在新聞推薦系統(tǒng)中的比較研究

2018-08-22 08:07:48魏茂
東方教育 2018年14期
關(guān)鍵詞:用戶系統(tǒng)

魏茂

摘要:本文首先對(duì)基于用戶、項(xiàng)目和模型的協(xié)同過濾算法在新聞推薦系統(tǒng)中的應(yīng)用進(jìn)行對(duì)比;接下來,著重對(duì)基于關(guān)聯(lián)規(guī)則、聚類、分類、回歸、矩陣分解模型的協(xié)同過濾算法在新聞推薦系統(tǒng)中的應(yīng)用進(jìn)行對(duì)比;最后,闡述了協(xié)同過濾算法在新聞推薦系統(tǒng)中的運(yùn)用所面臨的挑戰(zhàn)及今后需努力的方向。

關(guān)鍵詞:新聞推薦協(xié)同過濾算法算法比較

一、引言

隨著互聯(lián)網(wǎng)的飛速發(fā)展,上網(wǎng)瀏覽新聞已成為網(wǎng)民們的習(xí)慣,然而海量的新聞并不一定都是網(wǎng)民們所關(guān)注的,廣泛的閱讀會(huì)嚴(yán)重影響閱讀效率,因此新聞推薦應(yīng)運(yùn)而生[1]。新聞推薦是指通過用戶信息和新聞內(nèi)容,根據(jù)一定的推薦算法,智能地找到與用戶興趣偏好相匹配的新聞,盡可能多地主動(dòng)推薦給用戶,以提高用戶閱讀新聞的效率和質(zhì)量。

推薦算法是新聞推薦最核心和關(guān)鍵的部分,其性能的優(yōu)劣直接影響推薦的質(zhì)量,目前常用的推薦方法包括:基于內(nèi)容的推薦,基于協(xié)同過濾的推薦等,其中協(xié)同過濾推薦(Collaborative Filtering Recommendation)是目前應(yīng)用最為成功的個(gè)性化推薦技術(shù),包括在線和離線過濾兩部分,具體又涵蓋多個(gè)分支,其應(yīng)用促進(jìn)了新聞推薦系統(tǒng)的發(fā)展。

二、新聞推薦系統(tǒng)的過程體系

新聞推薦系統(tǒng)的核心過程為:數(shù)據(jù)的收集和預(yù)處理,選用適合的推薦算法,推薦效果評(píng)價(jià),如圖1所示。

1.數(shù)據(jù)的收集和預(yù)處理包括:1)形成用戶檔案和候選新聞集,包括:用戶的個(gè)人相關(guān)信息、用戶瀏覽新聞的數(shù)據(jù)、傳感器感知的上下文數(shù)據(jù),如:時(shí)間、地理位置、情緒等等;2)對(duì)收集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清理、轉(zhuǎn)換,最終形成用戶對(duì)各新聞的二維評(píng)價(jià)矩陣。

如表1所示:其中Rij表示第i個(gè)用戶對(duì)第j條新聞的評(píng)分(0≦Rij≦10),一般說來,分?jǐn)?shù)越高,表示用戶對(duì)該新聞的喜好程度越高。

2.選用推薦算法。一般先對(duì)預(yù)處理后的數(shù)據(jù)再進(jìn)行最近鄰居搜索,計(jì)算目標(biāo)用戶與用戶檔案集里面的其他用戶的相似度,相似度最高的作為最近鄰居集。其次,通過一定的推薦算法和最近鄰居集的評(píng)價(jià)值,產(chǎn)生推薦。目前己有的協(xié)同過濾算法有兩個(gè)主要的研究方向:基于用戶或項(xiàng)目(新聞)的協(xié)同過濾算法和基于模型的協(xié)同過濾算法。

3.對(duì)推薦效果的評(píng)價(jià)。基于用戶反饋,利用點(diǎn)擊率、精確度、響應(yīng)時(shí)間等評(píng)估指標(biāo)評(píng)價(jià)新聞推薦的性能[2]。

三、協(xié)同過濾算法比較

1.基于用戶或項(xiàng)目(新聞)的協(xié)同過濾算法

基于用戶的協(xié)同過濾算法主要考慮用戶之間的相似度,利用用戶間需求的相似性,智能的為用戶篩選有用信息。只要找出相似用戶偏好的新聞,并預(yù)測(cè)目標(biāo)用戶對(duì)此新聞的評(píng)分,就可將評(píng)分較高的新聞推薦給用戶。而基于項(xiàng)目(新聞)的協(xié)同過濾算法則是找到新聞之間的相似度,只有找到目標(biāo)用戶對(duì)這些新聞的評(píng)分,就可以將相似度高的新聞推薦給用戶。

兩種算法的主要區(qū)別在于前者需要在線計(jì)算用戶的相似度,計(jì)算復(fù)雜度較高。而后者,在考慮新聞的相似性在一定時(shí)間內(nèi)不變的前提下,可離線計(jì)算,精確度要求不高,推薦的多樣性較差。

2.基于模型的協(xié)同過濾算法

基于模型的協(xié)同過濾算法是目前用的較多的算法,它的優(yōu)勢(shì)在于可以利用現(xiàn)有數(shù)據(jù),構(gòu)建出新的預(yù)測(cè)和偏好數(shù)據(jù),通過機(jī)器學(xué)習(xí)的分類方法,或采用技術(shù)降維手段抽取特征數(shù)據(jù),映射到低維空間,使原始數(shù)據(jù)變得更為稠密。另外還可以利用原數(shù)據(jù)中的潛在結(jié)構(gòu)進(jìn)行數(shù)據(jù)壓縮,以達(dá)到減少維度。能很好的解決數(shù)據(jù)稀疏性等問題。具體可分為:基于關(guān)聯(lián)規(guī)則、聚類、分類、回歸、矩陣分解等模型的算法。

2.1 基于關(guān)聯(lián)規(guī)則的協(xié)同過濾

找出用戶查看的所有新聞數(shù)據(jù)中頻繁出現(xiàn)的項(xiàng)集活序列,來做頻繁集挖掘,找到滿足支持度閾值的關(guān)聯(lián)新聞的頻繁N項(xiàng)集或者序列。如果用戶查看了頻繁N項(xiàng)集或者序列里的部分新聞,則可將頻繁項(xiàng)集或序列里的其他新聞按一定的評(píng)分準(zhǔn)則推薦給用戶,這個(gè)評(píng)分準(zhǔn)則可以包括支持度,置信度和提升度等。常用的關(guān)聯(lián)規(guī)則算法有Apriori,F(xiàn)P Tree等。

2.2 基于聚類的協(xié)同過濾

用聚類算法做協(xié)同過濾與基于用戶或項(xiàng)目(新聞)的協(xié)同過濾類似。可以基于一定的距離來聚類。如果基于用戶聚類,則可以將用戶分成不同的目標(biāo)人群,將在同樣目標(biāo)人群中評(píng)分較高的新聞推薦給目標(biāo)用戶。基于新聞的聚類,則是將與目標(biāo)用戶評(píng)分高的新聞相似的新聞推薦給他。常用的聚類推薦算法有K-Means, BIRCH等。

2.3 基于分類的協(xié)同過濾

對(duì)用戶的評(píng)分設(shè)置閾值,評(píng)分高于閾值的新聞進(jìn)入推薦范疇,低于閾值不予推薦。常見的分類推薦算法有邏輯回歸和貝葉斯,基于分類的協(xié)同過濾不但解釋性強(qiáng),而且可以對(duì)數(shù)據(jù)的特征再進(jìn)行訓(xùn)練,不斷達(dá)到優(yōu)化。

2.4 基于回歸算法的協(xié)同過濾

用回歸算法做協(xié)同過濾比分類算法看起來更為直觀。通過回歸模型可以得到目標(biāo)用戶對(duì)某新聞的預(yù)測(cè)打分,而此評(píng)分可以是一個(gè)連續(xù)值。常用的回歸推薦算法有回歸樹、支持向量回歸等。發(fā)

2.5 基于矩陣分解的協(xié)同過濾

代表算法是奇異值分解(SVD),它利用特征提取,對(duì)隱含語義的檢索有較好的效果。但缺點(diǎn)在于經(jīng)過預(yù)處理的二維評(píng)價(jià)表是典型的稀疏矩陣,SVD必須經(jīng)過算法的改進(jìn)變種才能處理,比如FunkSVD、SVD++等[3],此外分解機(jī)(Factorization Machine)和張量分解(Tensor Factorization)也將成為矩陣分解的新趨勢(shì)。

四、結(jié)束語

協(xié)同過濾作為一種經(jīng)典的推薦算法,應(yīng)用廣泛,通用性強(qiáng)。近幾年來,協(xié)同過濾算法在新聞推薦系統(tǒng)中的運(yùn)用已取得了一定的成績(jī),在一定程度上解決了數(shù)據(jù)的可擴(kuò)展性、稀疏性、冷啟動(dòng)和強(qiáng)健性等問題,但隨著網(wǎng)絡(luò)應(yīng)用規(guī)模的不斷擴(kuò)大,用戶對(duì)系統(tǒng)使用要求的不斷提高,推薦系統(tǒng)的在安全性、實(shí)時(shí)性、計(jì)算效率、推薦的精確性等方面還需進(jìn)一步發(fā)展。

參考文獻(xiàn):

[1]張同啟. 基于關(guān)聯(lián)規(guī)則和用戶喜好程度的綜合電子商務(wù)推薦系統(tǒng)的研究[D]. 北京郵電大學(xué), 2015:32-33.

[2]彭菲菲,錢旭.基于用戶關(guān)注度的個(gè)性化新聞推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用研究,2012,29(3):1005-1006.

[3]孫小華,陳洪,孔繁勝.在協(xié)同過濾中結(jié)合奇異值分解與最近鄰方法.計(jì)算機(jī)應(yīng)用研究,2006,23(9):206-208.

猜你喜歡
用戶系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
基于PowerPC+FPGA顯示系統(tǒng)
半沸制皂系統(tǒng)(下)
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
主站蜘蛛池模板: 超碰免费91| 中文成人在线视频| 欧美啪啪网| 国产97色在线| h视频在线播放| 久久国产成人精品国产成人亚洲| 日本欧美视频在线观看| 中国丰满人妻无码束缚啪啪| 日本精品视频一区二区 | 国产va在线| 一级毛片免费观看久| 久久天天躁狠狠躁夜夜2020一| 久久综合亚洲色一区二区三区 | 91视频国产高清| 538精品在线观看| 美女毛片在线| 欧美日韩国产综合视频在线观看| 成人日韩视频| 毛片在线看网站| 视频二区国产精品职场同事| 91精品情国产情侣高潮对白蜜| 国产精品亚洲一区二区在线观看| 国产成人乱无码视频| 国产精品爽爽va在线无码观看 | 亚洲大学生视频在线播放| 国产免费精彩视频| 国产男女XX00免费观看| 奇米精品一区二区三区在线观看| 国产精品不卡永久免费| 国语少妇高潮| 无码中文字幕乱码免费2| 成人午夜天| 久久一级电影| 久青草网站| 亚洲最大福利网站| 亚洲精品视频在线观看视频| 伊人久久婷婷五月综合97色| 国产丰满大乳无码免费播放| 色婷婷成人网| 中文字幕2区| 免费看a级毛片| 在线a视频免费观看| 国产一级毛片网站| 亚洲欧洲日产国产无码AV| 国产国语一级毛片| 国产网友愉拍精品| 最新精品久久精品| 日韩一二三区视频精品| 亚洲an第二区国产精品| A级毛片高清免费视频就| 少妇精品在线| 国产精品专区第一页在线观看| аⅴ资源中文在线天堂| 日本高清在线看免费观看| 中日无码在线观看| 久久久成年黄色视频| 国产麻豆精品久久一二三| 国产一区二区色淫影院| 色天天综合| 亚洲天堂久久久| 99精品影院| 亚洲婷婷丁香| 五月综合色婷婷| 亚洲欧美日韩中文字幕一区二区三区 | 亚洲精品欧美日韩在线| 不卡视频国产| 国产小视频在线高清播放| 久久99国产精品成人欧美| 亚洲人视频在线观看| 欧美精品亚洲精品日韩专| 亚洲va欧美va国产综合下载| 啊嗯不日本网站| 欧美性精品| 国产69精品久久| 中文字幕 91| 久久无码免费束人妻| 久久久四虎成人永久免费网站| 欧美综合中文字幕久久| 免费人成网站在线观看欧美| 伊人激情综合| 国产啪在线| 91青青视频|