999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶特定特征及內容的景點推薦模型研究?

2019-11-12 06:38:36張少茹
計算機與數字工程 2019年10期
關鍵詞:特征內容用戶

李 川 張少茹

(1.西安航空學院計算機學院 西安 710077)(2.西安交通大學醫學部 西安 710061)

1 引言

旅游旅行度假一直是很多人向往的生活模式,隨著國民經濟、教育的發展,旅游旅行度假體驗生活已經成為國民日常生活中的一個重要環節,更多的人希望通過旅游放松心情、體驗生活。但旅游作為一種產業,很多地方為了追求利益,過度商業化,導致旅游偏離了本質,景點的自然、生態、人文因素失真,交通、食宿等保障措施落后,諸如游客滯留、天價飯、宰客、環境衛生差、強制消費等現象頻繁出現,這些問題導致景點和游客之間出現巨大鴻溝,游客擔心被宰、服務差,景點被五花八門的宣傳、評論導致無法將真實情況呈現給游客[1]。這使得人們選擇旅游景點時受到很大的影響,難以抉擇。

隨著網絡的普及,微博、朋友圈、個人空間等形式給網民提供了一個廣闊的自媒體平臺,很多游客在去過一個景點以后,會對景點發表的評價評論、旅游攻略等信息,這類信息成為很多用戶了解景點情況的重要信息來源,大多數評論都能客觀準確地反映景點真實情況,但網絡中的評論參差不齊,也有少部分評論會帶有一定的主觀意識,甚至存在網絡水軍,這對用戶獲取有用信息帶了一定的干擾。而網絡中的旅游評價信息量龐大,用戶往往只瀏覽很少一部分,這些不準確的評論很可能對用戶帶來錯誤導向。用戶從大量信息中獲取準確有用的信息是極其困難的,一般可以采用信息技術方法從大量信息中提取有用信息。游客評價內容,代表了游客真實的內心體會,這類信息屬于非結構化信息,一般需要采用數據挖掘技術獲取有效數據[2]。

2 研究現狀

一般推薦系統是針對商品推薦的,其基本思想是在用戶和商品之間建立聯系,根據用戶的歷史購買記錄,再根據用戶與商品的聯系,將用戶可能感興趣的商品推薦給用戶。商品推薦系統的的組成如表1所示。

表1 商品推薦系統組成

個性化推薦算法主要可以分為Collaborative Filtering Recommendations(協同過濾,CF)和Content-based Recommendations(基于內容,CB)的推薦算法。CF 是當前廣泛使用的推薦算法,但是往往真正使用時一般都不會只有CF,CB 也會經常用到,即常用的是CF+CB的混合推薦算法[3]。

CF 是一種廣泛應用的推薦系統,算法的過程分為3步:

1)根據用戶特征計算用戶間的關聯度;

2)根據用戶關聯度高的其他用戶的偏好預測該用戶的偏好;

3)根據預測出來的偏好對用戶進行合理推薦。

協同過濾的推薦依據主要是根據用戶間的關聯度和用戶對item 的評價,該算法能有效地挖掘item 的潛在需求者。但協同過濾推薦算法存在期初評價數據量少,矩陣稀疏等問題,導致推薦結果不合理等情況[4~6]。

基于內容的推薦算法應用較早,常用于信息檢索及信息過濾[7]。根據用戶已選item 內容計算用戶間的關聯度,然后進行推薦。CB 記錄item 信息,通過分析已選item 內容,記錄用戶信息。CB 根據用戶信息與item信息的相似度,向用戶推薦相似度較高的item,它不受期初評價稀疏性問題的影響,發現隱藏信息。CB的過程如圖1所示。

圖1 CB的過程

整個過程可以分為3步:

1)Item Representation:從item 信息中對每個item 進行內容分析,抽取一些特征將item 結構化處理,生成結構化的項目庫;

2)Profile Learning:從用戶資源信息中對每個用戶進行偏好分析,將一個用戶的偏好結構化處理,生成用戶偏好庫;

3)Recommendation Generation:根據用戶偏好與item信息特征計算相似度,為用戶推薦相關性高的item[8]。

綜上所述,協同過濾推薦算法適用于用戶、item 及用戶選擇item 數量都龐大的情況,諸如網絡購物推薦系統,而旅游并非日常剛需,相對而言歷史數據有限,且用戶偏好類型比較單一,因此采用基于內容的推薦算法更加合適。本文提出一種基于用戶特定特征及內容的旅游景點推薦模型,根據景點評價數據及用戶歷史數據預測用戶偏好。

3 建立基于內容的熱門景點推薦模型

3.1 Item Representation

旅游景點作為推薦系統中的item,需要提取一些屬性,一般item的屬性可以分為結構化和非結構化屬性,結構化屬性,即可以被計算機直接表示、存儲的數據,比如門票、星級等,推薦系統可以直接使用;而非結構化數據,首先需要結構化處理,才能在推薦系統中使用,例如景點評價、旅游攻略等信息,這些信息是本文所述推薦算法的主要數據來源,如何將其結構化是本文的重點研究內容之一,本文采用VSM 進行旅游評價信息結構化處理[9]。VSM(Vector Space Model),即向量空間模型,是一種向量運算,可以將文本內容處理為向量空間,并且通過向量空間分解計算文本相似度[10]。

旅游評價文本集合為P→(p1,p2,p3,p4,…pi,…pn),因本算法主要針對中文文本,需要對每篇評價文本pi 進行分詞,中文分詞可采用jieba 工具[11],其基本過程如圖2 所示,分詞得到分詞集合,即詞典W→(w1,w2,…wk…wl)。

圖2 jieba分詞過程

定理1:TF-IDF(term frequency-inverse document frequency),即詞頻-逆文檔頻率,是一種衡量一個詞對于一篇文章的重要程度的統計算法,其計算公式如下:

其中TF(wj,pi)表示pi評論中wj詞出現次數,n 表示評論數,nj表示出現wj詞的評論數。采用定理1 計算wji可能會出現偏差,一般需要歸一化處理[13]。

定理2:評論pi中詞wj的權重歸一化計算公式如下:

3.2 Profile Learning

一般的偏好分析是通過用戶過去對一些item的喜好情況,計算出一個模型,根據此模型來預測一個新的item 用戶是否喜歡。由于旅游項目類型數量有限,因此在傳統偏好分析方法的基礎是增加用戶選擇偏好的指標,這樣可以避免一些新用戶數據稀缺,無法計算偏好模型的問題。本文采用Rocchio算法計算用戶偏好[14]。

定理3:用戶偏好的Rocchio計算方法:

3.3 Recommendation Generation

根據Profile Learning 的結果,利用余弦相似度(Cosine similarity)計算各個item 的相似度[15],余弦相似度計算方法如下。

定理4:Cosine similarity計算兩個向量相關性

Cosine similarity 是把ωu作為n-維坐標系中的一個向量,與item 的向量間夾角的余弦值即代表了相似度,兩個向量余弦值越大,即夾角越小代表兩個向量越相似,反之相似度越小。

根據定理4 循環計算所有item 的Cosine similarity,將Cosine similarity 結果最高的Top-K 個item推薦給用戶。

4 實驗過程

為了獲取實驗測試評論數據集,采用網絡爬蟲提取,經過去重降噪處理后,最終獲得20000 條景點評論數據,其數據結構如表2 所示。從數據集中隨機抽取15000條數據進行實驗訓練,其余5000條數據用于測試,分別對協同過濾推薦算法、基于內容的推薦算法進行了實驗。實驗首先采用jieba 進行中文分詞,再根據觀點元素類別屬性權重表進行觀點分析、選取觀點特征。在提取用戶特征值時,可以根據數據集提取,也可以加入用戶選定的特定特征。最后利用Cosine similarity 計算用戶與評論之間的相關性,并將相關度最高的Top-K個item 推薦給用戶。

表2 實驗數據結構

5 實驗結果及分析

協同過濾推薦算法與基于用戶特定內容的推薦算法的實驗結果在精度P、召回率R 及綜合評價指標F對比如圖3所示。

圖3 實驗結果PRF值對比

從圖4 實驗結果PRF 值對比可以看出,在景點評論的觀點分析時,基于用戶特定內容的推薦算法在P值、R值及F值等方面都有提升。

再將兩種方法按照PR 及ROC 進行多次實驗,結果如圖4、圖5所示。

圖4 兩種方法PR對比

從圖4、圖5實驗結果可以看出,在根據評論進行景點推薦時,基于用戶特定及內容的景點推薦算法在PR曲線、ROC曲線效果較好。

圖5 兩種方法ROC對比

6 結語

本文通過對協同過濾推薦算法及基于內容的推薦算法進行了分析,針對用戶選擇旅游景點的特征,提出一種基于用戶特定內容的熱門景點推薦模型,根據用戶選擇的特定特征,通過自建的旅游景點評論數據集提取評價觀點集和用戶特征,結合用戶選擇的特定特征生成用戶特征集合,避免了新用戶特征稀疏的問題,再根據評論觀點和用戶特征計算Cosine similarity,將相似度高的item 推薦給用戶。通過實驗結果表明,基于用戶特定特征及內容的景點推薦模型研究方法較常見的協同過濾方法在準確率、召回率方面有所提升,PR及ROC曲線效果良好,同時,基于內容的推薦算法在用戶獨立性(User Independence)、可解釋性(Transparency)、新的item 易推薦(New Item Problem)等方面都有較大優勢。本研究的局限在于基于內容的推薦算法無法挖掘用戶的潛在興趣。

猜你喜歡
特征內容用戶
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 毛片在线播放a| 91在线日韩在线播放| 国产一级片网址| 成人久久精品一区二区三区| 久久亚洲高清国产| 午夜a视频| 精品福利一区二区免费视频| 亚洲人成网站在线观看播放不卡| 久久伊人久久亚洲综合| 色综合网址| 欧美全免费aaaaaa特黄在线| 久久a级片| av在线5g无码天天| 亚洲国产看片基地久久1024| 97国产成人无码精品久久久| 久久99国产乱子伦精品免| 爽爽影院十八禁在线观看| 精品久久久久成人码免费动漫| 永久成人无码激情视频免费| 免费中文字幕在在线不卡| 国产另类乱子伦精品免费女| 免费A级毛片无码免费视频| 日本成人精品视频| 欧美日韩另类国产| 亚洲丝袜第一页| igao国产精品| 青青青视频蜜桃一区二区| 人妻丰满熟妇av五码区| 色一情一乱一伦一区二区三区小说| 免费在线不卡视频| 亚洲成人77777| 欧美激情福利| 亚洲黄色视频在线观看一区| 欧美一区日韩一区中文字幕页| 亚洲最大福利网站| 亚洲国产日韩视频观看| 亚洲人成网址| 免费国产福利| www.国产福利| 国产男女免费视频| 欧美v在线| 九九九久久国产精品| 午夜国产大片免费观看| 亚洲有无码中文网| 色综合中文字幕| 色婷婷成人网| 亚洲色偷偷偷鲁综合| 国产高清在线精品一区二区三区 | 成年人视频一区二区| 一区二区在线视频免费观看| 72种姿势欧美久久久久大黄蕉| 一级福利视频| 欧美日韩中文国产va另类| 国产乱子伦无码精品小说| 免费国产在线精品一区| 999精品视频在线| 专干老肥熟女视频网站| 欧美中文字幕无线码视频| 日本精品αv中文字幕| 亚洲国产午夜精华无码福利| 国产91丝袜在线观看| 国产成人精品亚洲日本对白优播| 曰AV在线无码| 波多野结衣无码AV在线| 18禁影院亚洲专区| 中国精品久久| 精品三级网站| 国产精鲁鲁网在线视频| 亚洲国产精品一区二区第一页免 | 91色老久久精品偷偷蜜臀| 在线欧美国产| 日韩在线永久免费播放| 全部无卡免费的毛片在线看| 久久特级毛片| 婷婷色一区二区三区| 日韩中文字幕免费在线观看| 国产精品七七在线播放| 国产一级做美女做受视频| 中文无码日韩精品| 亚洲高清日韩heyzo| 伊人激情综合网| 青青草原偷拍视频|