999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于向量自回歸模型的旅游熱門景點預測方法研究

2020-08-04 12:27:53任婕
現代電子技術 2020年3期
關鍵詞:旅游模型

任婕

摘? 要: 常規的預測方法變量之間的皮爾遜相關值較低,造成預測的結果出現偏差,為此,設計基于向量自回歸模型的旅游熱門景點預測方法。綜合不同的搜索引擎數據,計算旅游景點關鍵詞網絡搜索指數,對其進行預處理并篩選出與旅游景點熱度相關性較強的關鍵詞,利用向量自回歸模型對變量進行均值化處理,確定影響最大的網絡搜索指數,實現對旅游熱門景點的預測。實驗結果表明:與常規的灰度預測方法和SVR模型預測方法相比,基于向量自回歸模型的預測方法的皮爾遜相關值能夠保持在0.8~1.0之間,變量之間具有極強的相干性,適合應用在旅游熱門景點預測中。

關鍵詞: 旅游熱門景點預測; VAR模型; 關鍵詞搜索指數; 皮爾遜相關系數; 搜索指數計算; 客流量預測

中圖分類號: TN911.1?34; TP181? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)03?0158?04

Research on popular tourist spot prediction method

based on vector auto regression model

REN Jie

(Ningxia Academy of Social Sciences, Yinchuan 750021, China)

Abstract: Since the Pearson′s correlation coefficient between the variables in conventional prediction methods is low, which leads to the deviation of predicted results, a popular tourist spot prediction method based on vector auto regression (VAR) model is designed. In combination with the data of different search engines, the internet search indexes of tourist spot keywords are calculated. The keywords are preprocessed, and those with strong correlation for tourist hot spots are screened out. The vector auto regression model is used to average the variables and determine the most influential internet search index to predict the popular tourist spots. The experimental results show that, in comparison with the conventional gray prediction method and the SVR model based prediction method, the Pearson′s correlation coefficient of the prediction method based on vector auto regression model keeps in the range of 0.8~1.0, and the variables are of strong coherence. Therefore, the proposed method is suitable for the prediction of popular tourist spots.

Keywords: popular tourist spot prediction; VAR model; keyword search index; Pearson′s correlation coefficient; search index calculation; tourist flow prediction

0? 引? 言

隨著經濟的高速發展,現代人們的生活水平不斷提高,人們開始追求更高層次的體驗,比如旅游。旅游行業是一個綜合性的新興行業,其突出的特點就是投入成本較少,經濟價值回報較高,能夠滿足人們對精神層面上的需求[1]。一般旅游業具有綜合性和季節性特性,可以帶動文化教育業、交通運輸業以及服務行業等的發展,因此應重視旅游業的發展[2]。

旅游景區因旅游人數的迅速遞增,帶來了可觀經濟效益的同時,也考驗旅游景區的科學管理能力。根據大量旅游產品的調查資料,對旅游游客流量的走勢進行分析,利用合理的方法對旅游熱門景點進行預測[3]。目前常規的預測方法有:灰度預測、SVR模型預測法和線性回歸法等,但是這些方法存在一定的缺陷,如影響因素過于單一、沒有與客流量預測相關的因素、變量之間皮爾遜相干值較低、分析和篩選存在外界干擾等,缺少一定的實用性[4]。因此設計基于向量自回歸模型的旅游熱門景點預測方法,解決常規方法中存在的問題。

1? 基于向量自回歸模型的旅游熱門景點預測方法

預測旅游熱門景點與網民的搜索行為相關,通過關鍵詞網絡搜索指數的變化趨勢,了解潛在游客前往不同旅游景點的需求和意愿,使用向量自回歸模型進行預測。

1.1? 計算關鍵詞搜索指數

游客搜索某景點的相關詞匯較多,使用一定方法篩選出關鍵詞。如果關鍵詞的數量過多,將關鍵詞搜索指數和實際游客量作為內生變量,分析相關詞匯搜索指數對實際游客量的影響,并以此預測未來的游客量[5]。大部分人在旅行前都會通過電腦或手機搜索與旅游目的地相關的關鍵詞信息,基本都圍繞著旅游六要素,也就是是“吃住行游購娛”,將其擴展開來搜索的關鍵詞有景點、特產、酒店、交通方式和天氣等[6]。以去年的數據為例,搜索引擎使用率達到了84.5%,通過互聯網進行旅游相關操作的網民使用率達到了41.3%。每一個旅游景點搜索關鍵詞都被相應的搜索引擎收錄并累計,形成網絡搜索指數[7]。綜合不同的搜索引擎數據,根據搜索引擎指數修正,旅游景點的關鍵詞搜索指數計算公式如下:

式中:[Qs]表示綜合所有搜索引擎的旅游景點關鍵詞的網絡搜索指數;[Qi]表示個體搜索引擎的關鍵詞搜索指數;[W]表示與[Qi]對應的搜索引擎使用率[8]。

與個體的旅游景點關鍵詞搜索指數相比,綜合的旅游景點關鍵詞搜索指數更能準確地反映關鍵詞在全網的搜索變化趨勢[9]。

1.2? 數據預處理及變量篩選

以旅游六要素為參考依據,將與旅游景點相關的小吃、酒店、地圖、旅游及景點和購物作為基準關鍵詞。圍繞著設定好的基準關鍵詞找出相關性較高的網絡搜索關鍵詞,如地圖查詢、購物攻略、酒店預訂以及特色小吃等[10]。獲取每個關鍵詞的網絡搜索指數,利用式(1)計算各個變量的網絡搜索指數。完成后驗證不同的關鍵詞與該景點每個月客流量的相關性,盡可能避免偽回歸現象[11]。假設包含[n]個關鍵詞的隨機變量[K=K1,K2,…,Kn],由[m]組樣本數據組成,得到相對應的樣本矩陣:

式中:[kij]表示第[i]個樣本對應的第[j]個觀測值,對其進行標準化,避免不同指標的數量級不同對預測結果造成影響。假設對樣本矩陣標準化處理后的矩陣為[X],[X=x1,x2,…,xn=xijm×n] ,其中,[i=1,2,…,m] ,[j=1,2,…,n] 。則矩陣[K] 的相關系數矩陣就是[X] 的協方差矩陣[H=hijm×n] 。將相似系數矩陣與Spearman系數檢驗法和Pearson系數檢測法相結合進行變量篩選,Pearson系數和Spearman都大于0.6的變量才是能夠反映旅游六要素的變量[12]。選定的關鍵詞及相關性檢驗結果如表1所示。

從表1中數據可以看出,篩選出的旅游景點關鍵詞與景點每個月的客流量相關性比較顯著。之后使用向量自回歸模型實現旅游熱門景點的預測。

1.3? 利用向量自回歸模型實現熱門景點預測

以旅游景點關鍵詞網絡搜索指數與景點實際客流量的關系為依據,預測旅游景點的客流量,判斷該景點是否為旅游熱門景點。利用向量自回歸模型將旅游景點客流量與6個關鍵詞變量均值化后通過軟件實現,獲得的均值化主變量如表2所示。

從表2中可以看出,大多數均值化變量的累積貢獻率超過了0.9,這就意味著該變量能夠反映出原始變量的大部分信息[13]。將[a2]標記為第一綜合網絡搜索指數,[a3]作為第二綜合搜索指數。從中提取最大特征值和次大特征值對應的特征向量:

利用向量自回歸模型得到對應的網絡搜索指數,表達式如下:

式中:[k1~k6]表示對應的6個關鍵詞,觀察以上內容,均值化以后的變量對第一綜合網絡搜索指數和第二綜合網絡搜索指數的解釋都是負值,其中,旅游景點大全對[a2]影響最大,對[a3]影響最大的是旅游地圖。從中能夠看出潛在游客的搜索行為,體現了潛在游客對旅游比較傾向的搜索行為是景點大全和路線搜索[14]。因此,可以利用[a2]主變量和[a3]主變量進行預測,最大程度地反映游客對綜合搜索行為與實際游客量的影響[15]。將相關數據輸入至Excel軟件中,利用向量自回歸模型求得的景點大全和旅游地圖兩個相關主變量實現旅游熱門景點的預測。

2? 仿真實驗

2.1? 實驗環境

選擇Hadoop云計算平臺作為實驗環境,該平臺具有較高的擴展性,能夠更好地處理大量數據。使用6臺PC機的小型Hadoop集群實驗平臺。其中,1臺作為主節點,其他5臺作為從節點,各個節點配置相同,參數配置如表3所示。節點之間通過100M的以太網交換機相連進行通信。

2.2? 實驗數據

獲取游客相關屬性,通過搜索平臺的API獲取30天內搜索過旅游景點關鍵詞的游客信息,將其保存在HDFS分布式存儲文件中,在HDFS中新建兩個文本文件,一個保存游客信息,一個保存旅游景點關鍵詞匯。將采集的數據用于預測一段時間旅游景點熱度。搜索界面如圖1所示。

2.3? 實驗內容

對于旅游熱門景點的預測,與之相關的兩個變量就是旅游景點關鍵詞網絡搜索系數,以及以此為依據的客流量預測,旅游景點關鍵詞網絡搜索系數越大,對應的旅游景點未來一段時間的客流量就會增大,則該旅游景點即為旅游熱門景點。由此可以看出,關鍵詞網絡搜索系數與客流量兩個變量之間存在著較強的關聯性,符合皮爾遜相關系數分析條件,實驗中首先計算皮爾遜相關值,確定關聯性的強弱。皮爾遜相關值在0.8~1.0之間,變量之間具有極強相干;相關值在0.6~0.8之間時,強相干;0.4~06是中等程度相干;0.2~0.4是弱相干;0.0~0.2是無相干或極弱相干。皮爾遜相干性實驗設置界面如圖2所示。

在進行實驗過程中,引用常規的灰色預測方法以及SVR模型預測方法進行對比實驗,并根據實驗結果進行分析。

2.4? 結果及分析

利用基于向量自回歸模型的旅游熱門景點預測方法、常規的灰色預測方法以及SVR模型預測方法進行多次對比實驗,獲取對應的皮爾遜相關值結果如圖3所示。

從圖3中可以看出,常規的預測方法中灰度預測方法皮爾遜相關值逐漸降低,其波動趨勢在相干值0.2~0.6之間,關鍵詞網絡搜索指數與客流量之間的關系趨向于中等程度相干偏弱相干;而SVR模型預測方法獲得的皮爾遜相干值大約在0.5~0.7之間,關鍵詞網絡搜索指數與客流量之間的關系趨向于中等相干;與前兩者相比,基于向量自回歸模型的預測方法獲得的皮爾遜相干值在0.7~1.0之間,關鍵詞網絡搜索指數與客流量之間具有極強的相干性,能夠準確地對旅游景點的熱度進行預測。這是由于向量自回歸模型對參數不施加零約束,能夠通過確定滯后期[K],使模型反映出變量間相互影響程度,有助于對旅游熱門景點的預測。

3? 結? 語

本文利用向量自回歸模型對旅游熱門景點進行預測,采取均值化主變量分析對旅游景點關鍵詞網絡搜索指數進行定義,并將其與旅游景點客流量一起作為內生變量進行預測,避免與旅游景點相關的關鍵詞較多時不能更好地使用向量自回歸模型的弊端。同時,引入傳統的預測方法進行對比實驗,證明了基于向量自回歸模型的旅游熱門景點預測方法能夠很好地反映游客量的變化規律,準確進行預測。但是該方法中還是存在不足之處,沒有考慮到天氣等外界因素對旅游熱門景區造成的影響,在后續的研究中,將以此為基礎進行更進一步的研究,并解決方法中存在的問題。

參考文獻

[1] 李雅美,王昌棟.基于標簽的個性化旅游推薦[J].中國科學技術大學學報,2017,47(7):547?555.

[2] 朱亮,張建萍.基于Bernstein Copula函數的中國入境旅游需求預測[J].旅游學刊,2017,32(11):41?48.

[3] 胡曉琴.基于支持向量機的旅游需求量預測模型[J].現代電子技術,2017,40(15):105?107.

[4] 梅梅,劉穎,唐小利,等.微博非結構化數據的情緒挖掘方法及在旅游預測中的應用[J].情報資料工作,2019,40(1):66?74.

[5] 汪威.最優組合預測線性模型在旅游需求預測中的應用:以中國大陸赴澳門游客量預測為例[J].數學的實踐與認識,2018,48(12):68?77.

[6] 陳美璘,何清龍.基于熵權法混合模型的貴州省旅游人數預測研究[J].數學的實踐與認識,2018,48(21):307?313.

[7] 黨婷,彭乃馳.基于GM?ES?GASVR組合模型的麗江國內旅游需求預測[J].數學的實踐與認識,2017,47(8):279?287.

[8] 陳榮,梁昌勇,陸文星,等.面向旅游突發事件的客流量混合預測方法研究[J].中國管理科學,2017,25(5):167?174.

[9] 段莉瓊,宮輝力,劉少俊,等.基于客源地的聚類?ARIMA模型的短期旅游需求預測:以天津歡樂谷主題公園為例[J].地域研究與開發,2017,36(3):108?112.

[10] 徐翠蓉,張廣海.中國文化產業與旅游業發展的交互動態響應分析[J].統計與決策,2018,34(23):145?148.

[11] 陳文捷,高雪.基于VAR模型的旅游業與區域經濟發展動態關系研究:以廣西為例[J].廣西社會科學,2018(2):38?44.

[12] 李維維,虞虎,王新歌,等.消費需求與國內旅游消費需求的周期性波動同步嗎:基于MS?VAR模型時變特征的分析[J].商業經濟與管理,2018(1):49?60.

[13] 孫燁,張宏磊,劉培學,等.基于旅游者網絡關注度的旅游景區日游客量預測研究:以不同客戶端百度指數為例[J].人文地理,2017(3):152?160.

[14] 劉飛,李柯青,項清,等.基于大數據分析的旅游景點承載力模型設計[J].現代電子技術,2018,41(12):52?55.

[15] 郭旭東,劉永平,王遠回.以旅游功能為主的城市軌道交通線路客流預測方法[J].城市軌道交通研究,2018,21(1):49?52.

猜你喜歡
旅游模型
一半模型
我們一起“云旅游”
少兒科技(2022年4期)2022-04-14 23:48:10
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
小A去旅游
好孩子畫報(2018年7期)2018-10-11 11:28:06
旅游
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
旅游的最后一天
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
主站蜘蛛池模板: 久久久精品久久久久三级| 亚洲黄色激情网站| 日韩免费毛片视频| 欧美日韩成人| 国产无人区一区二区三区| 国产理论精品| 国产精品网拍在线| 欧美精品综合视频一区二区| a毛片在线播放| 亚洲婷婷在线视频| 欧类av怡春院| 国产特级毛片aaaaaa| 亚洲国产无码有码| 日韩 欧美 小说 综合网 另类| 无码中字出轨中文人妻中文中| 精品午夜国产福利观看| 色呦呦手机在线精品| 日本人妻丰满熟妇区| 美女被操黄色视频网站| 欧美色视频日本| 国产日本欧美亚洲精品视| 99精品国产自在现线观看| 国产成人亚洲欧美激情| 欧美日韩福利| 国产美女91视频| 国产手机在线ΑⅤ片无码观看| 国产丝袜无码一区二区视频| 久久国产av麻豆| 国产人免费人成免费视频| 一级毛片不卡片免费观看| 亚洲精品少妇熟女| 精品久久人人爽人人玩人人妻| 一本一道波多野结衣av黑人在线| 99999久久久久久亚洲| 手机永久AV在线播放| 久久99这里精品8国产| 亚洲精品欧美重口| 青青草原偷拍视频| 亚洲日产2021三区在线| 91系列在线观看| 99伊人精品| 亚洲91在线精品| 丁香婷婷激情网| 亚洲成人一区二区| av一区二区无码在线| 成人小视频在线观看免费| 精品久久高清| 伊人精品成人久久综合| 伊人蕉久影院| 2024av在线无码中文最新| 精品国产Ⅴ无码大片在线观看81| 天天综合色天天综合网| 九月婷婷亚洲综合在线| 99在线小视频| 亚洲首页国产精品丝袜| 久久精品国产精品国产一区| 18禁高潮出水呻吟娇喘蜜芽| 日本在线国产| 精品国产免费观看一区| 波多野结衣第一页| 日韩视频免费| 国产簧片免费在线播放| 无码视频国产精品一区二区| 欧美日韩国产在线播放| 午夜国产不卡在线观看视频| 久久亚洲黄色视频| 99久久99视频| 国产在线观看一区二区三区| 99福利视频导航| 日韩区欧美国产区在线观看| 一级毛片网| 1769国产精品免费视频| 99这里只有精品在线| 久热中文字幕在线| 69综合网| 波多野结衣久久高清免费| 91久久国产综合精品| 免费中文字幕一级毛片| 久久久久亚洲av成人网人人软件| 亚洲成人精品久久| 亚洲天堂免费在线视频| 国产尤物在线播放|