999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Mahout的圖書推薦系統的設計與實現

2018-12-21 17:59:16吳昌雨劉東旭
無線互聯科技 2018年17期
關鍵詞:用戶系統

張 淼,吳昌雨,劉東旭

(滁州職業技術學院,安徽 滁州 239000)

網絡信息技術的高速發展使得書籍擺脫了傳統的紙媒方式,電子圖書也越來越受到人們的認可。2016年全國共出版圖書、期刊、報紙、音像制品和電子出版物512.53億冊[1]。對于大部分用來來說,如何在浩瀚的圖書資源中找到自己感興趣的圖書,對自身的檢索能力是一個很大的挑戰。因此,幫助用戶更快地找到感興趣的圖書是當前首要解決的問題。

本文主要完成了基于Mahout的圖書推薦系統的設計與實現,通過Mahout框架為用戶提供書籍推薦服務,使得傳統的“人找書”變為“書推薦給人”。協同過濾算法的使用讓用戶更快速地找到自己需要的書籍,節省了大量的時間。

1 相關概念

1.1 協同過濾推薦算法

協同過濾推薦算法是一種主流的、目前廣泛應用在工業界的推薦算法。一般分為基于用戶的協同過濾(user-based)和基于項目(item-based)的協同過濾[2]。

基于用戶的協同過濾算法,主要考慮的是用戶和用戶之間的相似度,首先找出與目標用戶相似度高的其他用戶,也就是鄰居。把鄰居喜歡的物品推薦給用戶。而基于項目的協同過濾是通過尋找物品和物品之間的相似度,向目標用戶推薦與他自己喜歡的物品相似度高的其他物品。

1.2 Mahout

Mahout是Apache Software Foundation(ASF)旗下的一個開源項目,提供了一些經典的機器學習算法,幫助研發工作者更方便地進行研發[3]。其中Mahout中的Taste提供了一系列組件讓開發者根據自身的需求構建推薦系統。

Taste主要有5個組件構成[4]:Data Model,User Smiliarity和Item Similarity,User Neighborhood和Recommender。

(1)Data Model:用于讀取用戶的偏好數據。Taste目前提供了3種讀取數據源的方式,分別是從數據庫、從文件、從內存對用戶的偏好信息進行讀取。

(2)User Similarity和Item Similarity:相似度是推薦系統的核心部分, 它主要分為用戶相似度(User Similarity)和項目相似度(Item Similarity)。User Smilarity用于定義兩個用戶之間的相似度,Item Similarity用于計算兩個項目的相似度。

(3)User Neighbourhood:和(2)中提到的User Smilarity一起使用,定義尋找鄰居的方法。

(4)Recommender:Recommender是推薦系統的核心,決定了系統采用何種推薦算法。Recommender是一個接口,它的主要實現類有Generic User Based Recommender和Generic Item Based Recommender。

2 系統設計

本系統主要基于Mahout框架為用戶提供推薦服務,在開發中采用C/S框架,前端負責用戶界面交互,后端負責核心推薦算法。系統架構采用分層設計,以下分別對表示層、推薦算法層以及存儲層進行介紹。

(1)表示層:負責與用戶進行交互,在本系統中主要負責把用戶的請求傳遞給推薦算法層,經過后臺計算后返回推薦結果,最后展示在界面。

(2)推薦算法層:是整個系統的核心,用于處理用戶請求并返回計算結果。本系統中使用基于項目的協同過濾推薦,所以當該層收到用戶請求時,會首先找到與當前用戶喜歡的圖書相似度較高的其他圖書,把這些圖書返回給表示層。

(3)存儲層:存儲系統中的數據,主要包括用戶基本信息數據(性別、年齡),圖書數據以及其他數據等。

3 系統實現

在1.2節中提到過Taste組件主要由5部分組成,依次對應著推薦結果產生的幾個過程。下面介紹實現整個系統中最重要的3步。

3.1 建立數據模型

推薦系統進行推薦的前提是了解用戶過去,根據用戶的過去行為預測他的偏好。因此首先要對用戶行為進行建模。以圖書推薦系統為例,用戶的行為主要為瀏覽、搜索、收藏、借閱,針對不同的行為設置分值,從而得到用戶—物品評分矩陣。

對于偏好數據的處理可以有多種方式。Taste提供了Preference接口來封裝用戶的偏好信息,常用的實現類為Generic Preference,數據格式為<userid,itemid,value >。在1.2節中提到Data Model用于讀取用戶偏好,其中Generic Data Model支持從內存中讀取用戶偏好信息,和Generic Preference搭配使用。

本系統采用File Data Model,直接從文件中讀取用戶偏好信息,文件每行是簡單的三元組樣式:userID,itemID,preference,分別表示用戶ID,圖書ID,偏好值,中間用逗號分隔。

3.2 定義相似度算法

相似度計算是用于計算對象之間的相似程度,是涉及推薦系統中重要的一環。相似度計算的越準確,推薦結果的質量也越好。

目前Taste中提供的相似度計算方法,大多為基于向量的計算,即把一個用戶對所有商品的喜好或者把所有用戶對一個商品的喜好處理為一個向量。通過計算兩個向量之間的距離,來推測用戶或者商品之間的相似度,距離越近相似度越大。

Taste中相似度算法按照計算對象不同,分為User Similarity和Item Similarity兩種。本文使用基于項目的協同過濾推薦,因此采用Item Similairty下的實現類Pearson Correlation Similarity通過皮爾遜相關系數計算圖書和圖書之間的相似度。

3.3 選擇推薦算法

Recommender是推薦引擎最核心的模塊,決定采用何種推薦算法進行推薦。沒有完美的推薦算法,只有適合的推薦算法。因此,首先要了解每個推薦算法的優缺點和不同的使用場景。基于用戶的協同過濾推薦和基于項目的協同過濾推薦的主要區別如下[5]。

(1)基于用戶的協同過濾:首先找到和當前用戶有相同興趣愛好的用戶,即鄰居。把鄰居喜歡的商品推薦給當前用戶。因此,該算法在計算用戶相似度這一環節會有大量計算,適合于用戶較少的、實時性要求不高的場景。

(2)基于項目的協同過濾:推薦和用戶之前喜歡的物品類似的物品,比如用戶之前產生過借閱歷史書A的行為,系統就會給用戶推薦歷史書B。所以該種推薦算法在計算物品相似度這一環節會有大量計算,適合于物品數量明顯小于用戶數的場合,比如音樂、圖書、電子商務的網站。

通過以上分析,我們知道對于圖書推薦來說,應該選擇基于項目的推薦算法。

通過以上幾個環節,我們即構建出一個推薦系統。本系統中使用File Data Model存儲用戶偏好評分,調用Pearson Correlation Similarity計算書本之間的相似度,使用基于項目的推薦算法Generic Item Based Recommende產生推薦結果,最后把結果傳遞給表現層。

4 結語

本文設計實現了一個基于Mahout的圖書推薦系統系統,系統通過基于項目的協同過濾的推薦算法進行推薦。系統采用分層設計,易于開發和維護,穩定性強,有利于對用戶興趣度的后續數據挖掘研究。關于推薦系統中的冷啟動問題以及時間因素對于推薦結果的影響是本文還沒有完成的,冷啟動和時間因素是下一步主要解決的問題。

猜你喜歡
用戶系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 中文字幕一区二区人妻电影| 99re热精品视频国产免费| 国产午夜精品一区二区三| 国产成人精品视频一区视频二区| 国产麻豆aⅴ精品无码| 国产精品自在拍首页视频8| 国产国产人在线成免费视频狼人色| 欧美一级夜夜爽www| 亚洲综合狠狠| 亚洲男人的天堂在线| 亚洲激情区| 亚洲Av激情网五月天| 99无码熟妇丰满人妻啪啪| 天堂成人在线视频| 99偷拍视频精品一区二区| 国产丝袜无码精品| 91年精品国产福利线观看久久| 久久美女精品| 性69交片免费看| 99热精品久久| 免费全部高H视频无码无遮掩| 日韩久久精品无码aV| 亚洲制服丝袜第一页| 精品91自产拍在线| 国产在线高清一级毛片| 国产情侣一区二区三区| 在线观看无码av免费不卡网站| av一区二区三区高清久久| 91精品国产91久久久久久三级| 国产欧美精品专区一区二区| 在线免费观看AV| 国产无遮挡猛进猛出免费软件| 亚洲 成人国产| 亚洲AV人人澡人人双人| 欧美色图久久| 亚洲精品无码抽插日韩| 亚洲综合狠狠| 国产91丝袜| 国产偷国产偷在线高清| 91成人试看福利体验区| 欧美激情网址| 婷婷亚洲视频| 国产成人亚洲无码淙合青草| 国产欧美视频在线观看| 很黄的网站在线观看| 波多野结衣在线se| 99久视频| 国产无码高清视频不卡| 国产尤物在线播放| 成年人福利视频| 久久99精品国产麻豆宅宅| 久久一本精品久久久ー99| 久精品色妇丰满人妻| 草草影院国产第一页| 国内精品久久久久久久久久影视| 欧美人与牲动交a欧美精品 | 亚洲AⅤ波多系列中文字幕| 国产女人在线视频| www.91在线播放| 国产精品福利导航| 亚洲黄色视频在线观看一区| 国产欧美在线观看精品一区污| 毛片久久网站小视频| 亚洲黄色片免费看| 在线无码av一区二区三区| 欧美午夜网| 久久久久国产一区二区| 亚洲最大情网站在线观看| 色综合手机在线| 免费看a级毛片| 国产午夜一级淫片| 91久久国产综合精品女同我| 99精品免费在线| 日本亚洲欧美在线| 国产幂在线无码精品| 九九香蕉视频| 国产麻豆va精品视频| 亚洲精品自在线拍| 天天综合天天综合| 亚洲国模精品一区| 久久永久精品免费视频| 久久人搡人人玩人妻精品|