牟進軍+羅國寬+熊志斌


摘要:旅游電子商務與網絡社交媒體發展導致旅游信息爆炸式增長,用戶面臨信息過載問題。為使用戶快速獲取并甄別信息,將傳統協同過濾推薦算法應用于景點推薦,游客對景點評分構成評分矩陣,計算景點之間相似度,根據相似景點評分預測游客對目標景點評分。實驗結果顯示,景點預測評分平均絕對誤差為0.696,Itembased景點推薦算法能根據游客偏好推薦景點。
關鍵詞關鍵詞:協同過濾;個性化推薦;景點推薦;Itembased
DOIDOI:10.11907/rjdk.171818
中圖分類號:TP319
文獻標識碼:A文章編號文章編號:16727800(2017)011018603
0引言
隨著國民經濟發展,旅游業成為朝陽產業,各類旅游電商平臺與旅游社交媒體應運而生,如攜程、藝龍、去哪兒、旅人網、螞蜂窩、窮游網等,這些旅游電子商務平臺與社交媒體為游客提供機票與酒店預定服務、景點信息、旅游攻略與游記分享平臺。網絡查詢已成為游客獲取資訊的主要方式,游客規劃旅游路線時,通常會在旅游電子商務平臺與社交媒體上查閱景點信息、游客評分及點評。
游客能夠快速在旅游電商平臺與社交媒體獲取景點信息,同時遭遇“信息過載”問題[1]。游客在網絡上獲得海量信息,相應需要花費額外時間查閱并甄別信息。這不僅增加了游客時間成本,還提高了線路規劃難度。推薦系統作為解決信息過載、滿足用戶個性化需求的有效工具,已在淘寶、亞馬遜等電商平臺成功應用[2]?;谟脩粜枨筇峁┚包c推薦的國內旅游電商平臺與社交媒體為數不多[34]。推薦算法有多種,其中基于協同過濾的推薦算法在個性化系統中應用最廣[5],如高明虎等[6]改進傳統協同過濾算法解決冷啟動問題,并應用于酒店推薦;婁小風[7]提出基于酒店多維度屬性打分的協同過濾推薦算法提高了推薦準確度;王益[8]將協同推薦算法應用于旅游路線推薦。本文研究協同過濾算法在景點推薦中的應用,為游客提供個性化數據服務。
1協同過濾推薦算法概述
協同過濾推薦算法誕生最早,基本思路是如果用戶過去物品偏好一致,將來偏好仍將一致[7]。算法通過挖掘用戶歷史行為數據發現用戶偏好,以此為依據計算得到相似用戶或物品并進行推薦。協同過濾推薦算法有2個重要分支:一個是基于用戶的協同過濾算法,另一個是基于物品的協同過濾算法。Itembased算法得出的結果具有較好說服力,因此,本文將該算法應用于景點推薦[9]。
基于用戶的協同過濾算法思路是根據用戶物品偏好找到相似用戶,然后將相似用戶喜歡物品推薦給目標用戶?;谖锲返膮f同過濾算法思路類似基于用戶協同過濾算法,通過計算不同物品相似關系,找到相似物品推薦給當前用戶。
數字化描述用戶物品偏好是協同過濾算法數據基礎,用戶物品偏好量化方法一般有2種形式:一種是量化成離散整數值,不同值代表偏好程度;一種是量化成布爾值0或1,代表喜歡或厭惡二值偏好。電子商務網站通常為用戶提供對物品評分、投票及評論功能,評分值與票數代表了用戶物品偏好程度。用自然語言處理方法處理用戶評論,可得到用戶情感取向,量化成布爾值0或1。用戶對物品購買與否,也可量化成布爾值0或1。除電子商務網站外,社交媒體用戶也用多種行為表達偏好,如自媒體訂閱數、信息轉發數、好友關注數,需要根據具體應用量化用戶偏好。
3.2數據來源
實驗數據源于“攜程旅行網”,攜程網向會員提供酒店、機票預訂、旅游資訊、景點評分、攻略分享等線上旅行服務,網站會員超過1億8千萬。選擇攜程網作為數據源,可獲取足夠景點評分數據。
攜程網旅游目的地攻略欄目中,游客分別從“景色”、“趣味性”、“性價比”3個指標對景點評分,分值區間為5(最高)至1(最低)。用網絡爬蟲采集海南省景點點評數據,原始數據按“景點名”+“用戶名”+“景色評分”+“趣味性評分”+“性價比評分”項目保存。由于數據量非常大,只選擇點評數10條以上景點進行編號處理,得到評分數據133 864條,含343個景點、32 587名游客。
3.3結果及分析
原始數據含“景色”、“趣味性”、“性價比”3個評分指標,測試選取“景色”評分作為數據項。為測試算法可行性,將數據分為2組,10萬條數據為訓練數據,余下33 864條為測試數據,相似景點個數K取10。實驗結果為平均絕對誤差MAE=0.696,表明Itembased景點推薦算法是可行的。
4結語
互聯網“信息過載”現象日益突出,用戶需花費大量時間查閱、篩選信息。本文將Itembased協同過濾算法應用于景點推薦,使游客能快速找到滿足個性化需求的景點與旅游資訊。旅游社交媒體上,游客從多個指標對景點進行評分,并附加文字評論。開發推薦系統時,需要綜合考慮各指標下評分,利用自然語言處理技術從文字評論中挖掘游客情感傾向,以提高推薦精度。實驗過程發現,旅游社交媒體游客與景點數量太大,計算景點相似性非常耗時,很難做到實時推薦,而Itembased協同過濾算法可利用“游客-景點”評分矩陣,離線計算出景點相似矩陣,然后實時計算,預測游客對景點評分,向游客推薦景點。
參考文獻參考文獻:
[1]李聰.電子商務推薦系統中協同過濾瓶頸問題研究[D].合肥:合肥工業大學,2009.
[2]洪亮,任秋圜,梁樹賢.國內電子商務網站推薦系統信息服務質量比較研究——以淘寶、京東、亞馬遜為例[J].圖書情報工作,2016(23):97110.
[3]令狐紅英,姜季春.改進的貝葉斯算法在旅游景點推薦中的應用[J].貴州師范學院學報,2012(3):2226.
[4]皇蘇斌,王忠群.景區智能空間下的實時景點推薦技術[J].安徽工程大學學報,2011(4):6163.
[5]馬騰騰,朱慶華,曹菡,等.基于Hadoop的旅游景點推薦的算法實現與應用[J].計算機技術與發展,2016(3):4752.
[6]高虎明,李偉麗.基于協同過濾和Rankboost算法的酒店推薦系統[J].微計算機信息,2010(36):206208.
[7]婁小豐.基于多屬性打分的酒店推薦算法研究[D].哈爾濱:哈爾濱工業大學,2012.
[8]王益.基于用戶興趣特征變化的旅游路線個性化推薦技術研究[D].武漢:武漢理工大學,2015.
[9]冷亞軍,陸青,梁昌勇.協同過濾推薦技術綜述[J].模式識別與人工智能,2014(8):5064.
[10]侯新華,文益民.基于協同過濾的旅游景點推薦[J].計算技術與自動化,2012(4):116119.
責任編輯(責任編輯:何麗)endprint