999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于動態聚類的旅游線路推薦

2017-10-21 08:10:13肖春景夏克文喬永衛張宇翔
計算機應用 2017年8期
關鍵詞:旅游用戶

肖春景,夏克文,喬永衛,張宇翔

(1.河北工業大學 電子信息工程學院,天津 300300; 2.中國民航大學 計算機科學與技術學院,天津 300300;3.中國民航大學 工程技術訓練中心,天津 300300)

(*通信作者電子郵箱kwxia@hebut.edu.cn)

基于動態聚類的旅游線路推薦

肖春景1,2,夏克文1*,喬永衛3,張宇翔2

(1.河北工業大學 電子信息工程學院,天津 300300; 2.中國民航大學 計算機科學與技術學院,天津 300300;3.中國民航大學 工程技術訓練中心,天津 300300)

(*通信作者電子郵箱kwxia@hebut.edu.cn)

基于會話的協同過濾用固定時間窗劃分交互歷史并將用戶興趣表示為這些階段的序列,但是旅游數據的高稀疏性會導致某些階段內沒有交互行為和近鄰相似度計算困難的問題。為了緩解數據稀疏,有效利用數據特性,提出了基于動態聚類的旅游線路推薦算法。該方法首先分析了旅游數據不同于其他標準數據的特性;其次利用動態聚類得到的變長時間窗口對游客交互歷史進行劃分,利用潛在狄利克雷分布(LDA) 抽取每個階段的概率主題分布,結合時間懲罰權值建立用戶興趣漂移模型;接著,通過反映年齡、線路季節、價格等因素的游客特征向量為目標游客選擇近鄰和候選線路集合;最后根據候選線路和游客的概率主題相關度完成線路推薦。該方法通過采用變長時間窗口不但緩解了數據稀疏,而且劃分的階段數目不需提前指定,而是根據數據特性自動生成;近鄰選擇時采用特征向量而非旅游數據進行相似度計算,避免了由于數據稀疏無法計算的問題。在實際旅游數據上的大量實驗結果表明,該方法不僅很好適應了旅游數據特征,而且提高了旅游線路的推薦精度。

動態聚類;潛在狄利克雷分布; 興趣模型; 時間懲罰; 特征向量

0 引言

隨著人們生活水平的提高,旅游已經成為休閑娛樂的重要方式。據統計近幾年來旅游人數和收入都在以10%以上的速度增長。為了爭取客源,旅游公司需了解游客的需求,制定各式各樣具有吸引力的旅游線路,但是游客從大量的線路中選出適合自己的線路是一件困難的事情。推薦系統成為解決“信息過載”的主要手段,將其應用到旅游線路的推薦將極大提升游客的體驗并給旅游公司帶來收益。

推薦系統已經貫穿了旅游的整個過程,包括旅游前的線路推薦[1-2],旅游中利用移動設備進行的個性化服務推薦[3-6]以及旅游結束時的信息反饋[7]。目前的線路推薦一般是根據游客的位置,利用地理信息系統(Geographic Information System,GIS)和移動設備對周邊線路或地點進行推薦[3-6]。但是由于游客出游往往受到氣候、時間的限制并且用戶的興趣也會隨時間而變化,因此時間對于路線的選擇至關重要。Liu等[8]以在一定時間段內花費最少、但是到達更多的目的地為前提進行線路推薦;Shen等[9]設計了個性化相似模型并利用用戶的異構旅行信息在某一時刻的某一地點位置進行推薦;Hasuike等[10]利用時間依賴網絡解決了旅游和景點次數的隨機變化問題,并通過條件概率來選擇下一個景點;孫煥良等[11]提出了基于動態轉移圖的時間敏感的旅游路線推薦方法為用戶準確地推薦適合其出行時間的最佳旅游線路;She等[12]設計了兩步貪心啟發式算法來進行下一個目的地的預測,它不但考慮了時空沖突,而且解決了數據稀疏的問題;陸國鋒等[13]提取景點的開放時間、門票、GIS坐標、景點的評價信息等提出一種基于多約束的K貪心算法,可以為游客推薦較好的旅游線路,并有效消除了推薦系統對先驗知識的依賴。這些推薦模型雖然都考慮了時間因素,但是僅作為約束條件或考慮了景點間的時間依賴關系。但在實際的線路選擇過程中,一條線路是否會被某用戶選擇,往往受線路主題和用戶興趣的共同影響。潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)概率主題模型是文本挖掘領域用來發現文本主題的重要方法,并已擴展和應用到推薦領域挖掘用戶的潛在興趣。He等[14]利用LDA從文檔中挖掘隱主題并根據協同過濾得到的預測評分決定哪個線路是最適合用戶的,但它沒有考慮用戶興趣隨時間的變化。基于會話的協同過濾(Session-based Collaborative Filtering, Session-based CF)模型利用固定的時間窗劃分用戶的交互歷史以捕獲用戶興趣模式的變化[15-16];而將基于會話的協同過濾與LDA模型相結合挖掘每個會話的概率主題分布來建立用戶的動態興趣模型[17-18],可以更好地捕獲用戶興趣主題的變化。但是與商品、電影等的推薦相比,旅游數據的稀疏性更高,這使得利用固定窗口對交互歷史進行劃分的過程中,某些窗口的歷史數據很少甚至沒有歷史數據,無法用來進行用戶興趣模型建立,更加劇了數據的稀疏性;而且由于數據稀疏使得選擇近鄰時的相似度計算變得十分困難。

為了緩解數據稀疏,通過結合LDA和時序信息提出了基于動態聚類的旅游線路推薦方法。該方法利用動態聚類采用變長時間窗口對游客交互歷史進行劃分,不但緩解了數據稀疏,而且聚類個數不用事先指定,而是根據游客數據自動形成,更好地適應了數據特點;結合時間懲罰權值和概率主題分布很好地描述了用戶興趣模式隨時間的變化趨勢;根據游客年齡、出行季節特點和線路價格建立用戶特征向量解決了由于數據稀疏導致的近鄰選擇困難的問題。在實際旅游數據集上大量實驗結果表明,該方法有效地利用了旅游數據的特點,能較準確地為游客進行線路推薦。

1 旅游數據特性分析

旅游數據來源于廈門航空旗下的某旅游公司,共包括從2009年1月到2014年10月間的732 019條旅游記錄。本文抽取了4 737個游客對1 436條旅游線路的25 717條旅行記錄,每個游客至少旅行過3次。每條記錄包括旅客信息和線路信息,其中旅客信息包括旅游團號、姓名、性別、身份證號、出發時間、價格等;線路信息包括出發時間、價格及景點的詳細介紹。

1.1 高稀疏性

游客每年旅行的次數非常有限,但是用戶購物或看電影卻非常普遍,因此旅游數據相比其他的推薦標準數據集稀疏度更高。將本文采集的旅游數據集與標準電影推薦數據集(Movelens_100K)進行比較,而且為了更好地進行對比,電影評分數量是旅游次數的10倍,即圖1中旅游次數是橫坐標數值的1/10;同時采用人數百分比(即對應橫軸數值相應的人數占總人數的比例)作為稀疏性的衡量指標,旅游或電影評分數量少的人數占比越大,說明數據越稀疏。具體對比情況如圖1所示,可以看出隨著旅游次數的增加,游客的人數百分比快速下降,超過95%的游客的旅行次數都少于10(在橫坐標在100附近);而Movielens數據集隨著電影評分數量的增加用戶評分的百分比也在下降,但是下降速度要明顯慢于旅游數據,而且數量越大,差距越明顯。

圖1 旅游數據集與標準電影推薦數據集的稀疏度對比Fig. 1 Comparison of sparsity between tourism data and standard movie recommendation data

1.2 時序特性

旅游是休閑娛樂的重要方法,容易受到季節、空閑時間等因素的影響。將游客的旅游線路按照月份進行劃分統計的結果如圖2所示,可以看出,游客更愿意在氣候宜人的春秋兩季出游。就每個游客而言,選擇出游的時間分布比較集中。

圖2 游客出游月份統計Fig. 2 Statistics of tourist travel month

圖3對每個游客的出行時間進行了統計,可以看出超過70%的游客旅行集中在4個月份以內,說明游客會在每年相對固定的時間出游。因此可以看出游客對線路的選擇受到季節的影響,并且每個人出行的時間相對固定。

圖3 旅客出游月份分布特征Fig.3 Distribution of tourist travel month

1.3 游客年齡及線路價格特征

游客的年齡分布與是否有閑暇時間和是否有較強的經濟實力兩個主要因素有關,根據這兩個因素將年齡按6段分別進行了統計,結果如圖4所示。從圖4可以看出,游客的主力軍集中在1~18歲,26~35和36~50歲,占比超過游客總數的70%。分析可能原因是1~18歲多為求學階段的學生,有時間充裕的寒暑假,他們更可能會跟隨父母或自己結伴去旅游;而他們的父母年齡多集中在26~50歲,并且26~35和36~50歲這兩個群體經濟能力相對較強,旅游成為了他們休閑娛樂的重要方式。

圖4 游客年齡分布Fig. 4 Distribution of tourist age

電影、購物等價格往往和時間是無關的,而旅游線路價格的高低往往與旅游時長相關:旅游時間越長,價格越高;相反,旅游時間越短,價格越低。圖5統計了游客選擇線路的價格情況,可以看出隨著價格的增長,選擇的游客人數逐步減少,約70%的游客選擇了價格在500元以下的線路,500~2 000元的比例基本持平,3 000及3 000元以上的百分比也較接近。因此可以認為人們更喜歡價格便宜、時間短的短途旅游線路,而線路價格達到一定數值之后,價格因素的影響變小。

圖5 線路價格分布Fig. 5 Distribution of route price

從以上分析可以看出,旅游數據相比其他標準數據集有更高的稀疏性,游客選擇線路受到季節、線路價格的影響,并且游客的年齡也是影響其出行的重要因素。因此,在線路推薦過程中應充分考慮到旅游數據的特點,設計合適的推薦算法,以得到更好的推薦效果。

2 游客興趣漂移模型的建立

2.1 基于動態聚類的旅行記錄的劃分

基于會話的協同過濾用固定時間窗將用戶的交互歷史劃分成不同的階段,并將用戶的興趣模型表示成這些階段的序列表示。但是由于旅游數據的高稀疏性及游客出行時段的相對固定,固定大小時間窗的劃分不適用于旅游數據。因為采用固定時間窗進行劃分不但要用非常大的時間窗,而且會導致部分階段內完全沒有旅游行為,這將加劇數據的稀疏性。因此本文考慮按照每個游客實際交互歷史的特點將其動態劃分成不同的階段。

定義游客集合U={u1,u2,…,um},旅游歷史記錄集合H={Hu1,Hu2,…,Hum},旅游線路集合L={l1,l2,…,ln}。首先計算所有旅客的平均旅游時間并作為最小時間窗口γ,對每個游客計算每個線路的密度并按降序排序。接著選擇密度最大的線路作為第一個聚類中心,并計算已有聚類中心與其他節點(按密度降序)的距離,如果它們之間的距離大于γ,則產生一個新的聚類中心;否則將兩個類進行合并,產生新的聚類中心,并重新計算各類間的距離,直到類間距離和聚類數都不再變化。算法偽碼如下所示。

算法1 基于動態聚類的線路劃分。

輸入 游客的旅游歷史記錄H={Hu1,Hu2,…,Hum},最小的時間窗口γ;

輸出 游客劃分結果S={Su1,Su2,…,Sum},聚類結果C={Cu1,Cu2,…,Cum}。

1) forui∈Udo

2) 計算小于時間窗γ的線路密度并按降序排序得到列表

5) do 計算已有聚類中心與D中其他節點的距離

6) if 距離大于γthen

7) 這個點作為一個新的聚類中心

8) else

9) do{兩個類進行合并形成新的聚類中心,計算新類與其他已有類間距離}

10) until(任何兩類類間距離大于γ)

11) end if

12) until (D為空)

13) 返回Sui和Cui

14) end for

15) 輸出S,C

2.2 基于LDA的概率主題分布生成

(1)

(2)

2.3 游客興趣漂移模型的建立

(3)

(4)

width—An example of Lijin hydrologic station of the Yellow River

3 旅游線路推薦

3.1 近鄰游客選擇

由于旅游數據高稀疏性的特點,游客間共同旅游線路非常少,圖6給出了隨著共同旅游線路的數目增加游客頻次變化的情況。從圖6中可以看出超過95%游客參加過的共同旅游線路少于3次,在一個月內參加過相同線路的游客隨著共同線路數目的增加先增大后減小,幾乎所有游客的共同次數也不多于5,這一特點為游客相似性計算帶來了巨大挑戰。

從而計算游客ui與us的相似性如式(5):

(5)

這樣按照用戶的特征向量計算用戶間的相似性,避免了直接用高稀疏性的旅游數據難以計算相似度的問題,解決了近鄰選擇困難的問題。

圖6 相同旅游線路的游客占比Fig. 6 Proportion of tourists with common routes

3.2 候選線路集合生成

(6)

(7)

其中Nui為3.1節得到的近鄰用戶集合。

3.3 旅游線路推薦

對于游客ui候選線路集合Sui中的每條候選線路利用LDA得到其概率主題分布PLl,利用式(8)計算候選線路Ll與游客ui的|Hui|+1階段的興趣偏好的相似度:

(8)

其中Ll∈Sui。通過相似度大小對候選線路進行排序,為游客ui推薦相似度較大的Top-k線路。

4 實驗結果及分析

4.1 度量標準

在Top-k推薦中常用準確率(Precision)、召回率(Recall)及有效地平衡了準確率和召回率的F評分進行結果評價。在實驗過程中,將每個游客的前|Hui|-1次旅游記錄作為訓練集,第|Hui|次旅游線路信息作為測試數據,線路推薦成功的數量非0即1,因此準確率的值為0或1/k,召回率為0或1,它們不再適合作為評價分類質量衡量標準,因此提出準確覆蓋率作為評價指標,計算如式(9)。

(9)

其中:|U|為游客總數目,ρui定義如式(10)。

(10)

4.2 實驗結果及分析

4.2.1 主題數K的影響

主題是LDA的潛在變量,基于LDA的推薦中,K往往是事先設定,而不是通過數據學習獲得。本文中將準確覆蓋率作為評價標準來學習最佳的主題數K,并記錄了隨著K增加的運行時間,結果如圖7所示。從圖7可知,隨著K的增加準確覆蓋率先增大后減小,因為K太小不能發揮LDA發現潛在興趣的能力,而K太大得到的概率主題分布又被平均化。而且由于K越大,得到概率主題分布的計算量越大,因此運行時間呈增長趨勢。最佳的K是效率和精度的平衡,選取50作為主題數目。

圖7 主題數K的影響Fig. 7 Influence of topic number K

4.2.2 近鄰數n的選取

在所有基于鄰近的方法中,近鄰數目都非常重要。將近鄰數從10變化到100來評估它對結果的影響,如圖8所示。由圖8可以看出,隨著近鄰數目的增加,準確覆蓋率先增大后減小。這是因為游客共同旅游線路相對較少:如果近鄰數目太小,近鄰與目標的相似度很高,由近鄰而得到的可選候選線路集合也就越小;而近鄰的數目太大時,近鄰間的相似度較差,候選線路集合與游客實際興趣相差較大。因此本文后面的實驗選取近鄰個數為40。

圖8 近鄰數目的影響Fig. 8 Influence of neighbor number

4.2.3 與其他方法對比

為了說明本文方法的效果和預測能力,將本文方法時序潛在狄利克雷分布(Temporal Latent Dirichlet Allocation, TLDA)與以下三種方法進行了對比:

1)基于用戶的協同過濾(User-based Collaborative Filtering, UCF)[19],它作為基于近鄰的推薦算法的代表;

2)LDA[14]:基于LDA的用戶興趣建模方法及推薦方法;

3)基于項目的隨機游走(ItemRank)[20]:建立旅線路的關聯圖,通過隨機漫步得到線路的排序。

實驗中,LDA參數α=50/K,β=0.01,ItemRank的重啟動概率為0.15。圖9給出了不同算法的結果。從圖9可以看出,TLDA、LDA和ItemRank方法都優于UCF,因為UCF僅利用共同旅游的線路尋找近鄰用戶,但是由于旅游數據的高稀疏性使得它很難找到相似度較高的近鄰用戶,影響了推薦精度。TLDA方法優于LDA與ItemRank方法,LDA與ItemRank的性能較為接近,因為TLDA針對旅游數據的高稀疏性采用了動態聚類對線路進行聚類,緩解了數據稀疏,在用戶興趣建模階段考慮了用戶的潛在興趣及時序影響,更好地描述了用戶的動態偏好,在近鄰的選擇過程中根據旅游數據特征建立游客特征向量,并將其作為近鄰選擇衡量標準,既挖掘了用戶的潛在興趣偏好,建立了其漂移模型,又避免了近鄰游客選擇可信度不高的問題。而LDA方法雖然利用LDA挖掘了游客潛在興趣偏好,但是忽略了偏好隨時間的變化。ItemRank盡管增加了線路選擇的隨機性,但是在建立線路間的轉移關系時只利用了共同旅游線路,沒有考慮時間、價格、游客年齡等因素。

圖9 旅游線路推薦結果對比Fig. 9 Comparison of recommended results of tourist routes

5 結語

本文提出了基于動態聚類的旅游線路推薦算法。通過統計分析旅游數據的特性,說明了它不同于其他數據集的特點。利用動態聚類對游客的交互歷史采用變長窗口劃分成不同的階段,而且劃分個數不需事先指定,通過實驗說明其很好地適應了數據特性,緩解了數據的高稀疏性。在每個階段利用LDA抽取用戶的潛在興趣主題并利用時間懲罰權值以建立游客興趣漂移模型,更好地挖掘了游客興趣的變化趨勢。利用游客的特征向量為游客尋找近鄰用戶,很好地解決了用數據本身計算相似度困難的問題。通過在實際旅游數據上的實驗表明,本文方法得到了較好的推薦精度。但是本文在用戶興趣建模的過程中只考慮了興趣隨時間的變化,沒有考慮游客年齡、線路價格等其他因素,因此下一步將更加充分地挖掘數據特點,更準確地對游客建模。此外,在游客特征向量建立過程中可進一步挖掘游客間隱式社交關系和線路價格-時間等關系來更好地描述其近鄰關系。

References)

[1] DEVASANTHIVA C, VIGNESHWARI S, VIVERK J. An enhanced tourism recommendation system with relevancy feedback mechanism and ontological specifications [C]// Proceedings of the 2016 International Conference on Soft Computing Systems, AISC 398. New Delhi: Springer-Verlag, 2016: 281-289.

[2] AL-HASSAN M, LU H, LU J. A semantic enhanced hybrid recommendation approach: a case study of e-government tourism service recommendation system [J]. Decision Support Systems, 2015, 72: 97-109.

[3] XUE A Y, ZHANG R, ZHENG Y, et al. Destination prediction by sub-trajectory synthesis and privacy protection against such prediction [C]// ICDE 2013: Proceedings of the IEEE 2013 29th International Conference on Data Engineering. Washington, DC: IEEE Computer Society, 2013: 254-265.

[4] XUE A Y, QI J, XIE X, et al. Solving the data sparsity problem in destination prediction [J]. The VLDB Journal, 2015, 24(2): 219-243.

[5] ZHU L C, LI Z J, JIANG S X. LBSN-based personalized routes recommendation [J]. Applied Mechanics and Materials, 2014, 644-650: 3230-3234.

[6] 馬磊.基于智能解決方案的自助旅游系統[J].計算機系統應用,2017,26(3):57-62. (MA L. Independent travel system based on intelligent solution [J]. Computer Systems Applications, 2017, 26(3): 57-62.)

[7] SU H, ZHENG K, HUAN J, et al. A crowd-based route recommendation system — CrowdPlanner [C]// Proceedings of 2014 IEEE 30th International Conference on Data Engineering. Washington, DC: IEEE Computer Society, 2014: 1178-1181.

[8] LIU H-L, LI J-H, PENG J. A novel recommendation system for the personalized smart tourism route: design and implementation [C]// Proceedings of the 2015 IEEE 14th International Conference on Cognitive Informatics and Cognitive Computing. Washington, DC: IEEE Computer Society, 2015: 291-296.

[9] SHEN J, DENG C, GAO X. Attraction recommendation: towards personalized tourism via collective intelligence [J]. Neurocomputing, 2016, 173: 789-798.

[10] HASUIKE T, KATAGIRI H, TSUBAKI H, et al. A route recommendation system for sightseeing with network optimization and conditional probability [C]// Proceedings of 2015 IEEE International Conference on Systems, Man, and Cybernetics. Piscataway, NJ: IEEE, 2015: 2672-2677.

[11] 孫煥良,崔晨,劉俊嶺.基于動態轉移圖的時間敏感的旅游路線推薦[J]. 鄭州大學學報(理學版),2017,49(1):50-57. (SUN H L, CUI C, LIU J L. Time-sensitive travel route recommendation method based on dynamic transfer graph [J]. Journal of Zhengzhou University (Nature Science Edition), 2017, 49(1): 50-57.)

[12] SHE J, TONG Y, CHEN L. Utility-aware event-participant planning [C]// SIGMOD ’15: Proceedings of the 36th ACM International Conference on Management of Data. New York: ACM, 2015: 1629-1643.

[13] 陸國鋒,黃曉燕,呂紹和,等.基于互聯網信息的多約束多目標旅游線路推薦[J].計算機工程與科學,2016,38(1):163-170. (LU G F, HUANG X Y, LYU S H, et al. Multi-constraint and multi-objective trip recommendation based on Internet information [J]. Computer Engineering & Science, 2016, 38(1): 163-170.)

[14] HE Z, WU Z, ZHOU B, et al. Tourist routs recommendation based on latent Dirichlet allocation model [C]// Proceedings of 2015 12th Web Information System and Application Conference. Washington, DC: IEEE Computer Society, 2015: 201-206.

[15] YU J, ZHU T. Combining long- term and short-term user interest for personalized hashtag recommendation [J]. Frontiers of Computer Science, 2015, 9(4): 608-622.

[16] XIANG L, YUAN Q, ZHAO S, et al. Temporal recommendation on graphs via long- and short-term preference fusion [C]// KDD ’10: Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2010: 723-732.

[17] HONG W, LI L, LI T. Product recommendation with temporal dynamics [J]. Expert Systems with Applications, 2012, 39(16): 12398-12406.

[18] RICARDO D, FONSECA M J. Improving music recommendation in session-based collaborative filtering by using temporal context [C]// ICTAI ’13: Proceeding of IEEE 25th International on Tools with Artificial Intelligence. Washington, DC: IEEE Computer Society, 2013: 783-788.

[19] RESNICK P, IACOVOU N, SUCHAK M, et al. GroupLens: an open architecture for collaborative filtering of netnews [C]// CSCW ’94: Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work. New York, ACM, 1994: 175-186.

[20] GORI M, PUCCI A. ItemRank: a random-walk based scoring algorithm for recommender engines [C]// IJCAI ’07: Proceedings of the 20th International Joint Conference on Artifical Intelligence. San Francisco, CA: Morgan Kaufmann Publishers Inc., 2007: 2766-2771.

This work is partially supported by the National Natural Science Foundation of China (U1533104), the Natural Science Foundation of Hebei Province (E2016202341), the Natural Science Foundation of Tianjin (14JCZDJC32500), the Fundamental Research Funds for the Central Universities (ZXH2012P009).

XIAOChunjing, born in 1978, Ph. D. candidate, lecturer. Her research interests include recommendation system, data mining.

XIAKewen, born in 1964, Ph. D., professor. His research interests include intelligent information processing, data mining.

QIAOYongwei, born in 1976, M. S., lecturer. His research interests include machine learning, intelligent information processing.

ZHANGYuxiang, born in 1975, Ph. D., associate professor. His research interests include machine learning, data mining, artificial intelligence.

Tourismrouterecommendationbasedondynamicclustering

XIAO Chunjing1,2, XIA Kewen1*, QIAO Yongwei3, ZHANG Yuxiang2

(1.SchoolofElectronicsandInformationEngineering,HebeiUniversityofTechnology,Tianjin300300,China;2.SchoolofComputerScienceandTechnology,CivilAviationUniversityofChina,Tianjin300300,China;3.EngineeringandTechnicalTrainingCenter,CivilAviationUniversityofChina,Tianjin300300,China)

In session-based Collaborative Filtering (CF), a user interaction history is divided into sessions using fixed time window and user preference is expressed by sequences of them.But in tourism data, there is no interaction in some sessions and it is difficult to select neighbors because of high sparsity. To alleviate data sparsity and better use the characteristics of the tourism data, a new tourism route recommendation method based on dynamic clustering was proposed. Firstly, the different characteristics of tourism data and other standard data were analyzed. Secondly, a user interaction history was divided into sessions by variable time window using dynamic clustering and user preference model was built by combining probabilistic topic distribution obtained by Latent Dirichlet Allocation (LDA) from each session and time penalty weights. Then, the set of neighbors and candidate routes were obtained through the feature vector of users, which reflected the characteristics of tourist age, route season and price. Finally, routes were recommended according to the relevance of probabilistic topic distribution between candidate routes and tourists. It not only alleviates data sparsity by using variable time window, but also generates the optimal number of time windows which is automatically obtained from data. User feature vector was used instead of similarity of tourism data to select neighbors, so as to the avoid the computational difficulty caused by data sparsity. The experimental results on real tourism data indicate that the proposed method not only adapts to the characteristics of tourism data, but also improves the recommendation accuracy.

dynamic clustering; Latent Dirichlet Allocation (LDA); preference model; time penalty; feature vector

TP391; TP181

A

2017- 02- 08;

2017- 04- 10。

國家自然科學基金資助項目(U1533104);河北省自然科學基金資助項目(E2016202341);天津市自然科學基金資助項目(14JCZDJC32500);中央高校基本科研業務費資助項目(ZXH2012P009)。

肖春景(1978—),女,河北唐山人,講師,博士研究生,主要研究方向:推薦系統、數據挖掘; 夏克文(1965—),男,湖南武岡人,教授,博士,主要研究方向:智能信息處理、數據挖掘; 喬永衛(1976—),男,山西祁縣人,講師,碩士,主要研究方向:機器學習、智能信息處理;張宇翔(1975—),男,山西大同人,副教授,博士,主要研究方向:機器學習、數據挖掘、人工智能。

1001- 9081(2017)08- 2395- 06

10.11772/j.issn.1001- 9081.2017.08.2395

猜你喜歡
旅游用戶
我們一起“云旅游”
少兒科技(2022年4期)2022-04-14 23:48:10
小A去旅游
好孩子畫報(2018年7期)2018-10-11 11:28:06
旅游
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
旅游的最后一天
主站蜘蛛池模板: 亚洲国产中文精品va在线播放| 男人的天堂久久精品激情| 欧美一级夜夜爽| 97国产成人无码精品久久久| 国产人人射| 国产黄色片在线看| 午夜不卡视频| 老司机aⅴ在线精品导航| 欧美爱爱网| 一级做a爰片久久免费| 第一页亚洲| 欧美一级视频免费| 午夜免费小视频| 国产精品无码制服丝袜| 在线国产毛片手机小视频| 欧美成一级| 宅男噜噜噜66国产在线观看| 免费看黄片一区二区三区| 午夜精品影院| 成人福利免费在线观看| 一级爱做片免费观看久久| 欧美高清视频一区二区三区| 国产欧美日韩91| 欧美日本激情| 欧美v在线| 国产麻豆精品手机在线观看| 欧美成人h精品网站| 亚洲国产欧美国产综合久久| 欧美一区二区人人喊爽| 亚洲Aⅴ无码专区在线观看q| 免费A∨中文乱码专区| 高清无码手机在线观看| 婷婷亚洲天堂| a天堂视频在线| 亚洲天堂视频在线免费观看| 国产91蝌蚪窝| 成人综合在线观看| 综合色88| 国产区福利小视频在线观看尤物| 国产黄网站在线观看| 丝袜美女被出水视频一区| 色吊丝av中文字幕| 成人午夜视频在线| 中文字幕免费视频| 99ri国产在线| 在线中文字幕网| 国产无遮挡裸体免费视频| 亚洲国产精品国自产拍A| 欧美一区福利| 麻豆精品在线视频| 亚洲成年人片| 精品三级网站| 亚洲日韩国产精品综合在线观看| 亚洲一级毛片| 国产主播福利在线观看| 亚洲欧美不卡中文字幕| 亚洲最黄视频| 992tv国产人成在线观看| 日韩色图区| 精品无码国产一区二区三区AV| 日韩精品专区免费无码aⅴ| 天天干天天色综合网| 精品一区二区三区自慰喷水| 麻豆国产在线不卡一区二区| 国产拍揄自揄精品视频网站| 亚洲欧洲日产无码AV| 2021国产在线视频| 色综合久久综合网| 色婷婷久久| 欧美97色| 色综合中文综合网| 欧美成人手机在线观看网址| 精品福利网| 1024国产在线| 多人乱p欧美在线观看| 欧美性精品| 亚洲无码高清一区二区| 91一级片| 国产超薄肉色丝袜网站| 内射人妻无码色AV天堂| 啪啪永久免费av| 欧美日韩专区|