999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于旅游用戶數(shù)據(jù)和評(píng)論的推薦系統(tǒng)的設(shè)計(jì)

2019-12-19 02:07:13周家昊李民
軟件 2019年11期
關(guān)鍵詞:數(shù)據(jù)挖掘

周家昊 李民

摘? 要: 隨著國(guó)民生活水平的提高,旅游業(yè)蓬勃發(fā)展,旅游業(yè)與互聯(lián)網(wǎng)的結(jié)合促進(jìn)了在線旅游業(yè)的形成,也就是當(dāng)代所說的“智慧旅游”。用戶可以通過互聯(lián)網(wǎng)了解各種各樣的旅游信息,但是,日趨嚴(yán)重的過載旅游數(shù)據(jù)現(xiàn)象讓旅游商們難以準(zhǔn)確的挖掘出符合用戶興趣的個(gè)性化旅游信息,推薦出一個(gè)智慧的旅游路線更是如同大海撈針,而旅游推薦系統(tǒng)是解決這一問題的關(guān)鍵技術(shù)。本文基于個(gè)性化推薦算法的研究,將用戶信息,用戶評(píng)論,用戶行為,用戶歷史訂單,用戶未來訂單等多項(xiàng)數(shù)據(jù)作為算法的訓(xùn)練測(cè)試集,對(duì)功能性需求進(jìn)行分析,開發(fā)了基于用戶數(shù)據(jù)的推薦系統(tǒng)。

關(guān)鍵詞: 旅游數(shù)據(jù);推薦算法;數(shù)據(jù)挖掘

【Abstract】: With the improvement of the living standards of the people and the booming tourism industry, the combination of tourism and the Internet has promoted the formation of online tourism, which is also known as “smart tourism”. Users can learn a variety of travel information through the Internet. However, the increasingly serious phenomenon of overloaded travel data makes it difficult for travellers to accurately mine personalized travel information that suits their interests. It is more like recommending a smart travel route. A needle in a haystack, and a travel recommendation system is the key technology to solve this problem. Based on the research of personalized recommendation algorithm, this paper uses user data, user comments, user behavior, user history orders, user future orders and other data as the training test set of the algorithm, analyzes the functional requirements, and studies the system summary design.

【Key words】: Travel data; Recommendation algorithm; Data mining

0? 引言

伴隨著旅游產(chǎn)業(yè)收入快速增長(zhǎng),行業(yè)互聯(lián)網(wǎng)化逐漸加深,在線旅游市場(chǎng)也快速增長(zhǎng)。據(jù)Analysys監(jiān)測(cè)數(shù)據(jù),2008-2017年,中國(guó)在線旅游交易規(guī)模逐年遞增,2017年交易規(guī)模達(dá)8923.3億元;2018年前三季度中國(guó)在線旅游交易規(guī)模為7342.62億元,逼近中國(guó)2016年全年在線度假旅游交易規(guī)模。此外,2018年全年中國(guó)在線旅游交易規(guī)模將達(dá)9900萬(wàn)億元,萬(wàn)億規(guī)模指日可待。從2009-2018年在線旅行預(yù)訂用戶規(guī)模變化情況看,用戶規(guī)模逐年遞增,通過線上渠道進(jìn)行旅游預(yù)訂的用戶數(shù)量越來越多;截至2018年6月,在線旅行預(yù)訂用戶規(guī)模達(dá)到3.93億,較2017年末增長(zhǎng)1707萬(wàn)人,增長(zhǎng)率為4.50%;約一半的網(wǎng)民會(huì)通過在線業(yè)務(wù)進(jìn)行旅行預(yù)訂。

旅游推薦系統(tǒng)利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)一個(gè)模擬用戶與旅行社交流的平臺(tái),通過獲取并分析用戶的旅游需求、偏好等信息,主動(dòng)為用戶推薦盡可能符合其需求的旅游信息或產(chǎn)品(包括單個(gè)旅游產(chǎn)品,如景點(diǎn)、酒店等;旅行包以及旅游線路),為用戶制定各套更加智慧的,符合興趣的旅游方案和產(chǎn)品。

對(duì)于旅游路線的推薦技術(shù)研究,在國(guó)內(nèi)外已有一些基于旅游資訊,結(jié)合景點(diǎn)信息進(jìn)行推薦。張晗等[1]人使用MD_Apriori算法對(duì)已有數(shù)據(jù)信息進(jìn)行挖掘,設(shè)計(jì)出旅游服務(wù)智能推薦系統(tǒng)。王顯飛等[2]人以會(huì)話的形式與用戶進(jìn)行交互,在不斷的交流中提取出用戶的興趣點(diǎn),結(jié)合用戶的興趣設(shè)計(jì)出基于約束的旅游推薦系統(tǒng)。朱全[3]設(shè)計(jì)的利用加權(quán)關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘的智慧旅游推薦系統(tǒng)。呂紅亮等[4]人提出基于PageRank的一種改進(jìn)算法來提供個(gè)性化旅游路線推薦服務(wù),是以用戶,景點(diǎn),線路三者為頂點(diǎn),相互關(guān)聯(lián)為邊來表達(dá)用戶與物品間的偏好關(guān)系,計(jì)算出其頂點(diǎn)相對(duì)推薦用戶頂點(diǎn)的相關(guān)度,并對(duì)其進(jìn)行排名,最后將名次靠前的旅游路線推薦給目標(biāo)用戶。國(guó)外學(xué)者Krumm[5]于2004年提出利用地理信息系統(tǒng)對(duì)旅游信息進(jìn)行分析和推薦的系統(tǒng)服務(wù),運(yùn)用最短徑算法向用戶推薦個(gè)性化旅游路線。HUANG.Y和Bian.L[6]在2009年,提議使用異構(gòu)在線信息分析來推薦目標(biāo)用戶的旅行路線,該研究主要使用貝葉斯網(wǎng)絡(luò)技術(shù),還涉及旅游和旅游興趣的信息指標(biāo)。Chodhury等[7]人于2010年以Web Albums為數(shù)據(jù)支撐,對(duì)Web Albums進(jìn)行分析,提取相關(guān)信息數(shù)據(jù),系統(tǒng)根據(jù)提取出的信息自動(dòng)向用戶推薦旅游線路。當(dāng)前的各種研究對(duì)旅游路線推薦系統(tǒng)的發(fā)展作出了很大的貢獻(xiàn),但是依然有一些問題或者某些領(lǐng)域上的困難需要我們?nèi)スタ耍鐚⒂脩魝€(gè)人信息作為興趣點(diǎn)的一個(gè)參考因素,以及對(duì)于新的旅游路線的出現(xiàn)等冷啟動(dòng)問題。

1? 個(gè)性化推薦算法介紹

1.1? 基于內(nèi)容的推薦算法

基于內(nèi)容的推薦根據(jù)用戶過去喜歡的物品,為用戶推薦和這些物品內(nèi)容相似的其它物品。該方法在文本類推薦領(lǐng)域(如新聞、文檔、網(wǎng)頁(yè)、書籍等)得到了廣泛應(yīng)用。在本文中通過對(duì)用戶歷史訂單評(píng)論文本數(shù)據(jù)的提取,對(duì)未來訂單的預(yù)測(cè)。

1.2? 基于協(xié)同過濾的推薦算法

協(xié)同過濾推薦是構(gòu)建推薦系統(tǒng)最常用的一項(xiàng)技術(shù),它可以直接通過用戶過去的行為(如用戶對(duì)訂單的評(píng)分)來預(yù)測(cè)用戶的偏好,它默認(rèn)用戶未來的興趣愛好是和過去的興趣愛好一致的,這項(xiàng)技術(shù)不需要其他任何領(lǐng)域知識(shí)作為參考。現(xiàn)有的協(xié)同過濾可分為基于模型(Model based)與基于記憶(Memory based)兩種。其中,基于模型的協(xié)同過濾的目標(biāo)就是從可觀測(cè)評(píng)分?jǐn)?shù)據(jù)中找到一些潛在的影響因子,利用數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)從訓(xùn)練數(shù)據(jù)中找到模式(patterns),利用產(chǎn)生的這些模式去計(jì)算用戶對(duì)商品的評(píng)分。

基于記憶的協(xié)同過濾又可分為基于用戶與基于物品兩種:

第一種是基于用戶(User-based)的協(xié)同過濾是推薦系統(tǒng)中最古老的算法[8]。其主要思想就是找到與目標(biāo)用戶偏好相似的鄰近用戶,并利用其鄰近用戶對(duì)目標(biāo)物品的評(píng)分來預(yù)測(cè)目標(biāo)用戶對(duì)目標(biāo)物品的評(píng)分。其具體步驟如下:

(3)推薦階段:在預(yù)測(cè)目標(biāo)用戶對(duì)所有未評(píng)分物品的評(píng)分后,也可采取Top-K方法,將評(píng)分值最高的K個(gè)物品推薦給目標(biāo)用戶。

2? 系統(tǒng)需求分析

2.1? 應(yīng)用場(chǎng)景介紹

(1)推薦結(jié)果的展示

前端的頁(yè)面將會(huì)展示多種基于各種算法下對(duì)旅游用戶數(shù)據(jù)的挖掘結(jié)果,這些挖掘結(jié)果將以訂單服務(wù)的形式供用戶瀏覽以及查詢,此類典型的頁(yè)面場(chǎng)景即“猜你喜歡”、“您是不是在找”。

(2)業(yè)務(wù)員用戶的后臺(tái)管理

業(yè)務(wù)員主要分析每一個(gè)用戶的歷史行為數(shù)據(jù)以及個(gè)人信息,包括點(diǎn)擊、瀏覽、搜索、評(píng)論、交易等,挖掘用戶的興趣偏好數(shù)據(jù),包括偏好列表、物品類別、物品標(biāo)簽等。另外,利用分類和聚類等機(jī)器學(xué)習(xí)方法對(duì)用戶群體進(jìn)行細(xì)分,以進(jìn)行更精準(zhǔn)的推薦,最終得到每個(gè)用戶全方位的精準(zhǔn)畫像。使用多種推薦算法,得到待推薦的物品列表,使用機(jī)器學(xué)習(xí)的方法進(jìn)行重新排序,得到最終的推薦物品集合,快速響應(yīng)用戶復(fù)雜行為操作,綜合各種維度的分析挖掘結(jié)果呈現(xiàn)給用戶。

(3)管理員用戶的用戶管理

管理員用戶可以對(duì)任務(wù)和權(quán)限進(jìn)行分配,普通用戶只能進(jìn)行瀏覽推薦內(nèi)容,而業(yè)務(wù)員可以執(zhí)行算法部分。

2.2? 系統(tǒng)實(shí)現(xiàn)目標(biāo)

系統(tǒng)實(shí)現(xiàn)的目標(biāo)有:

(1)旅游用戶可以查詢推薦結(jié)果。

(2)系統(tǒng)業(yè)務(wù)員可以執(zhí)行數(shù)據(jù)爬取、協(xié)同過濾、主客觀分析、情感分析等綜合算法模塊,將相關(guān)結(jié)果導(dǎo)入數(shù)據(jù)庫(kù)中并查看各階段的執(zhí)行進(jìn)度。

(3)管理員可以對(duì)用戶信息進(jìn)行編輯、查看、增加以及刪除。

2.3? 系統(tǒng)性能需求

緩解評(píng)分矩陣稀疏性問題。雖然目前旅游業(yè)迅猛發(fā)展,產(chǎn)生了很大的在線旅游數(shù)據(jù),但是這些數(shù)據(jù)集中表現(xiàn)為用戶的信息數(shù)據(jù)以及瀏覽數(shù)據(jù),因?yàn)槟稠?xiàng)旅游服務(wù)難以有大量的訂單,或者說用戶在享受完某項(xiàng)特定訂單服務(wù)之后沒有產(chǎn)生評(píng)論,也就是文本數(shù)據(jù)的缺失,因此本系統(tǒng)可以引導(dǎo)和收集用戶的文本數(shù)據(jù),并有效的緩解數(shù)據(jù)稀疏所帶來的預(yù)測(cè)模型難以建立問題。

改善新的旅游訂單服務(wù)和新的用戶冷啟動(dòng)問題。在服務(wù)-用戶兩個(gè)端都可能出現(xiàn)新的單位,由此產(chǎn)生的歷史數(shù)據(jù)的缺失,本系統(tǒng)會(huì)優(yōu)化改善冷啟動(dòng)問題。

基于興趣的時(shí)效性推薦。雖說人的興趣在短期類不會(huì)發(fā)生改變,但是“說走就走的旅行”反應(yīng)了用戶在一定時(shí)間內(nèi)的未來可能性訂單是緊緊依附的它時(shí)下所產(chǎn)生的旅游數(shù)據(jù)的,如果系統(tǒng)的響應(yīng)時(shí)間比較長(zhǎng),就會(huì)給用戶造成不好的體驗(yàn),因此要在短時(shí)間內(nèi)抓住用戶的胃口,也就是保證在推薦上的時(shí)效性。

3? 系統(tǒng)概要設(shè)計(jì)與實(shí)現(xiàn)

本論文基于用戶歷史數(shù)據(jù)及用戶評(píng)論的推薦系統(tǒng)主要采用MVC模式,結(jié)合Struts和Hibernate框架進(jìn)行開發(fā)。

MVC是三個(gè)單詞首字母縮寫,它們是Model(模型)、View(試圖)和Controller(控制)。這個(gè)模式認(rèn)為,程序不論簡(jiǎn)單還是復(fù)雜,從結(jié)構(gòu)上看,都可以分為三層。最上面的一層,是直接面向最終用戶的“視圖層”(View)。它是提供給用戶的操作界面,是程序的外殼。最底下的一層是核心的“數(shù)據(jù)層”(Model),也就是程序需要操作的數(shù)據(jù)或信息。中間的一層,就是“控制層”(Controller),它負(fù)責(zé)根據(jù)用戶從“視圖層”輸入的指令,選取“數(shù)據(jù)層”中的數(shù)據(jù),然后對(duì)其進(jìn)行相應(yīng)的操作,產(chǎn)生最終結(jié)果。這三層是緊密聯(lián)系在一起的,但有時(shí)相互獨(dú)立的,每一層內(nèi)部的比那花不影響其他層。每一層都對(duì)外提供接口(Interface),供上一層進(jìn)行調(diào)用。這樣一來,軟件就可以實(shí)現(xiàn)模塊化,修改外觀或者變更數(shù)據(jù)都不用修改其他層,大大方便了維護(hù)的和升級(jí)。在本基于旅游用戶歷史數(shù)據(jù)及評(píng)論的推薦系統(tǒng)中,采用Struts實(shí)現(xiàn)View層和Controller層的交互,Hibernate則用于數(shù)據(jù)持久化。使用JSP頁(yè)面來制作前臺(tái)頁(yè)面,后臺(tái)系統(tǒng)代碼使用JAVA,使用python腳本來寫算法部分代碼,而數(shù)據(jù)庫(kù)使用My SQL進(jìn)行信息的存儲(chǔ)。另外,服務(wù)器采用tomcat。

3.1? 功能模塊設(shè)計(jì)

本論文結(jié)合用戶需求,將基于用戶歷史數(shù)據(jù)和用戶評(píng)論的推薦系統(tǒng)劃分為登陸注冊(cè)模塊,查詢推薦結(jié)果模塊,算法執(zhí)行模塊,管理用戶模塊等。總框架圖如圖1。

3.2? 算法執(zhí)行模塊的實(shí)現(xiàn)

在前面章節(jié)已經(jīng)介紹了基于協(xié)同過濾推薦算法的原理,主要是根據(jù)過往評(píng)分記錄計(jì)算用戶與用戶之間的相似度和訂單與訂單間的相似度來預(yù)測(cè)用戶對(duì)商品可能的評(píng)分。

基于用戶的協(xié)同過濾相關(guān)代碼如圖2。

4? 結(jié)語(yǔ)

基于用戶旅游數(shù)據(jù)的推薦系統(tǒng)能夠?yàn)槁眯猩涕_發(fā)一個(gè)信息化以及智能化的旅游APP,這是智慧旅游的一個(gè)重要體現(xiàn)。本論文研究了基于用戶信息數(shù)據(jù),用戶評(píng)論,用戶歷史訂單數(shù)據(jù)等相關(guān)數(shù)據(jù)的挖掘,也運(yùn)用了情感分析,協(xié)同過濾等多種算法,從設(shè)計(jì)實(shí)驗(yàn)的預(yù)期效果來看系統(tǒng)基本上實(shí)現(xiàn)了預(yù)期需求,能夠?yàn)橛脩籼峁┫嗨贫容^高的旅游服務(wù),但同時(shí)也存在不足。例如對(duì)于情感表達(dá)不明確的評(píng)論數(shù)據(jù)無法進(jìn)行情感詞的抽取,這對(duì)數(shù)據(jù)分析的準(zhǔn)確性有一點(diǎn)折扣。總體而言,本系統(tǒng)的設(shè)計(jì)研究為智慧旅游,從旅行商角度,在給用戶提供更加個(gè)性化和人性化的旅游線路獲取了關(guān)鍵思路了關(guān)鍵思路,另一方面,旅游用戶能獲取一種接近理想化的旅游? ?線路。

參考文獻(xiàn)

[1]張晗, 潘正運(yùn), 張燕玲. 旅游服務(wù)智能推薦系統(tǒng)的研究與設(shè)計(jì)[J]. 微計(jì)算機(jī)信息, 2006, 22(5-3): 170-171.

[2]王顯飛, 陳梅, 李小天. 基于約束的旅游推薦系統(tǒng)的研究與設(shè)計(jì)[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2012, 22(2): 141-145.

[3]朱全. 基于加權(quán)關(guān)聯(lián)規(guī)則挖掘的智慧旅游推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 湖北: 武漢科技大學(xué), 2004.

[4]呂紅亮, 王勁林, 鄧峰. 一種個(gè)性化旅游推薦算法[J]. 網(wǎng)絡(luò)新媒體技術(shù), 2015. 5, 1(3).

[5]Krumm J Where will they turn: predicting turn propor-tions at intersections. Pers Ubiquit Comput. 2010, (14): 591-599.

[6]Huang Y, Bian L A Bayesian network and analytic hier-archy process based personalized recommendations for tourist attractions over the Internet. Expert Syst Appl. 2009, (36): 933-943.

[7]Chodhury MD, Feldman M, Amer-Yahia S, Golbandi N, Lempel R, Yu C Automatic construction of travel itineraries using social breadcrumbs. In: Proceedings of HT 2010, pp35-44.

[8]項(xiàng)亮. 推薦系統(tǒng)實(shí)踐[M]. 北京: 人民郵電出版社, 2012.

[9]Tang J L, Hu X, Liu H. Social recommendation: a review[J]. Social Network Analysis and Mining, 2013, 3(4): 1113-1133.

[10]Jannach D, Zanker M, Felfernig A, et al. Recommender systems: an introduction[M]. Cambridge University Press, 2010.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 亚洲啪啪网| 亚洲人成网站18禁动漫无码| 欧美翘臀一区二区三区| 波多野结衣一区二区三区四区视频| 真实国产乱子伦高清| 国产区精品高清在线观看| 久久久久亚洲精品成人网| 精品国产三级在线观看| 精品一区二区三区视频免费观看| 久久精品日日躁夜夜躁欧美| 国产va在线观看免费| 亚洲激情99| 22sihu国产精品视频影视资讯| 日韩免费视频播播| 成人一区专区在线观看| 最新亚洲人成无码网站欣赏网| 99视频在线免费| 免费激情网站| 国产综合网站| 真人免费一级毛片一区二区| 中字无码精油按摩中出视频| 亚洲区第一页| 亚洲视频色图| 国产精品不卡片视频免费观看| 爱色欧美亚洲综合图区| 一级毛片免费不卡在线| 日韩在线永久免费播放| 欧美一区二区丝袜高跟鞋| 欧美成a人片在线观看| 国产成人综合日韩精品无码不卡| 国产高清在线精品一区二区三区| 久久99国产综合精品1| 欧美亚洲香蕉| 亚洲天堂高清| 操国产美女| 青青极品在线| 91九色最新地址| 日本黄色不卡视频| 成人中文字幕在线| 午夜视频www| 亚洲黄色成人| 亚洲精品福利视频| 国产主播一区二区三区| 日韩AV手机在线观看蜜芽| 毛片视频网| 国产情侣一区| 高清色本在线www| 亚洲AⅤ波多系列中文字幕| 国产午夜看片| 成人小视频在线观看免费| 国产精品片在线观看手机版| 亚洲精品va| 久青草免费在线视频| 亚洲欧美日韩动漫| 国产资源免费观看| 成人免费一级片| www.国产福利| 波多野结衣视频网站| 免费一级毛片在线观看| www.狠狠| 99热国产在线精品99| 国产超碰在线观看| 久久毛片网| 国产精品久久久久婷婷五月| 一区二区欧美日韩高清免费| av无码久久精品| 国产精品白浆无码流出在线看| 91最新精品视频发布页| 亚亚洲乱码一二三四区| 日日拍夜夜嗷嗷叫国产| 久久久精品国产亚洲AV日韩| 久久精品无码一区二区日韩免费| 国产丝袜精品| 日韩av在线直播| 高清亚洲欧美在线看| 国产91小视频| 国产成+人+综合+亚洲欧美| 国产99视频在线| 国产99精品久久| 在线观看国产一区二区三区99| 少妇人妻无码首页| 欧美精品啪啪|