戴 文1,丁 蕾1,劉培學,馬 莉
(1.南京財經大學 工商管理學院,江蘇 南京 210023;2.南京大學 地理與海洋科學學院,江蘇 南京 210093)
在當前旅游研究的領域中,旅游流可以說是核心問題之一[1]。從本質上來說,旅游流是一種較為復雜的空間動態流[2]。狹義的旅游流是指游客流,而廣義的旅游流還包括與游憩流相關的或應運而生的資本流、文化流、信息流等關聯流。對旅游流而言,以游客在目的地的移動為主體的旅游客流的研究更是重中之重。
近年來,國內外越來越多的學者投入到旅游流的研究中,由淺逐漸深入。國外研究大多與旅游流的特征及其影響[3]、旅游流的空間移動規律[4]、空間移動的影響因素[5]以及旅游流的驅動力[6]有關。國內關于旅游流的研究則多集中于時空演變以及影響因素這一角度。研究內容涉及多方面,如旅游流的特征[7]、旅游流空間演變的規律[8]、影響旅游流空間擴散的因素[9]等。國內外學者較早開始重視旅游流客源地特征的研究,大多是從旅游目的地的角度研究旅游流的空間分布和結構,而對旅游流客源地分布,即旅游流流向目的地的動態規律方面研究較少。國際上的研究多著重于客源地與目的地之間的聯系模式,通過時間序列模型、引力模型等來尋找最合理的客源地分布規律模型[10,11]。同時,國外還就旅游流的客源地分布影響因素進行了研究,從內在因素、外在因素以及綜合因素三方面進行了分析[12]。國內對旅游流客源地分布也給予了一定的重視,保繼剛、楚義芳等是國內研究的先驅。保繼剛[1]對旅游流客源地分布的影響因素與特征進行了分析;吳必虎[13]對上海市民“一日游”的緣由進行了研究,發現市民出游受到距離、可達性、目的地旅游資源的吸引力等因素的限制。
在旅游流的空間預測方面,國內外起步較晚,因此研究結果相對較少。2001年,Witt、Kulendran[14]首先開發出了自相關模型,隨后Webber[15]研究出了集聚模型。近幾年,許多學者開始運用位移模式、效用最大化模型等不同的方法對旅游流進行了預測和計算。2005年,Kima[16]通過實證研究對旅游流的不同計算和預測方法進行了對比分析,總結出適合不同條件的預測方法。國內對有關預測的研究較少,比較有名的是保繼剛[17]首次建立了可以預測全國各地前往北京的旅游流量數學模型,綜合考慮了距離、文化程度和經濟發展程度;李君軼[18,19]從數字足跡的角度研究了旅游流的空間變化,并運用Web和GIS對旅游流進行了預測研究,這是目前國內較為新穎的研究方向。
隨著我國旅游業的迅速發展,國內大多數景區的游客量呈井噴式增長。在重要的節假日期間,有些景區的游客量甚至超出了景區的最大承載力?;谶@種情況,如何找出最科學的方法,進而對景區游客量做出準確的預測,避免對景區環境造成破壞成為旅游景區發展中面臨的重要問題??驮吹胤植嫉难芯繉皡^合理開發旅游資源、解決旅游設施的空間布局問題是至關重要的。而對有關政府部門和相關旅游企業的決策者而言,正確了解目的地與客源地之間的關系,并對旅游流量進行準確預測是一件非常重要的事情。本文在前人研究的基礎上,主要將重點放在從大數據視角對旅游流的空間擴散進行研究,并運用百度指數對旅游流進行了預測。
南京市是國內較早投入使用智慧旅游項目的城市?!澳暇┲腔勐糜未髷祿\行監測平臺”的數據監測范圍較廣,包括全市4A級以上的景區、景點和商圈、交通樞紐等40個點,本文的數據就來源于該平臺。
本文就平臺上2016年南京市旅游流的有關數據進行了分析,下載了境內的旅游流數據、具體景區的旅游流數據和旅游流客源地的數據。根據不同的研究目的,更改所下載數據的類型、包含的時間段,并對數據進行分類、整合、加工,從而對南京游客客源地分布規律、游客流量動態等方面進行深層次探索與挖掘。
本文將下載的節假日南京市外地游客統計數據運用軟件SPSS19.0對客源地距離和旅游流量進行了回歸,可以看出兩者之間有著負相關關系;運用軟件EXCEL(2010),將節假日與客流量進行歸類、整理、回歸、分析,得出兩者存在正相關關系。
基于南京市智慧旅游大數據運行監測平臺提供的相關數據,本文主要采取了對比分析方法和聚類分析方法研究了南京市旅游流客源地的空間分布模式。對比分析方法主要用于揭示旅游流的客源地分布差異和時間分布差異,聚類分析方法主要用于研究幾個重要節假日的旅游流客源地分布模式。在客流量預測方面,本文主要利用南京市旅游相關關鍵詞的百度指數和利用格蘭杰因果檢驗方法對百度指數和南京的實際游客量進行分析,從而建立自回歸移動平均模型進行預測。
在本研究中,關鍵詞的選擇對預測模型的構建起到重要作用。由于研究對象的尺度存在差異,在關鍵詞的選擇時會有所不同。在數據整理階段可知:某一具體景區游客量與該景區關鍵詞的百度指數之間有較高的相關性;當研究尺度擴大至南京市總體游客時,其關鍵詞的選擇更加趨向于對南京市旅游的總體概括,對部分網絡知名度較低的南京市景點不能全面覆蓋,所以預測結果會產生一定的誤差。
本文以南京市的總體游客量作為研究對象,通過分析與南京市旅客總量相關的關鍵詞,建立了南京市總游客量的預測模型。本文通過構建的預測模型可以預測節假日期間各旅游景區的旅游流,有效避免了景區游客超出景區的最大承載力造成對景區環境的破壞,為各景區管理提供了相關決策意見。
我國獨特的節慶假日形成獨具我國特色的節假日旅游流,本文以春節、元旦、“十一”等7個獨特的節慶假日和幾個節假日期間的旅游流為研究對象,通過對南京智慧旅游監測平臺上2016年南京市各景區旅游流客源地的數據進行對比分析,探討旅游流客源地的分布特征。
從圖1、圖2可見,在重要的節慶期間,來南京市的游客在客源地分布空間上呈現出并非一種均衡狀態。從區域來看,離南京市較近的長三角區域和珠三角片區的游客密度指數明顯高于其他地方;而與此形成鮮明對比的是西北地區,密度指數相當低,且顯著低于全國的平均水平。從省市來看,來南京市游客中的客源地密度指數較高的分別是江蘇、浙江、上海?;谏鲜銮闆r,可以推測出兩個層次原因:一方面,交通不便利和氣候不適宜阻礙了來南京市旅游的遠方游客;另一方面,經濟落后使西藏、新疆等外出的較少??傮w來看,節慶期間來南京市旅游的游客發展呈現層次分布格局,即由長三角區域向周邊、內陸遞減,這進一步驗證了距離衰減規律。
由于江蘇省是南京市旅游的主要客源地,與其他省市相對比游客量遠多于其他省市,所以在剔除江蘇省的情況下,對比7類不同時段的節假日期間南京市各景區客源地地理集中指數G值和客源吸引半徑AR值的結果發現,只有兩天假期的中秋節G值為29.63,AR值為490.27km;具有三天小長假的端午、元旦、清明、“五一”的G值均在30以上,分別為30.48、36.94、35.86、35.26,AR值分別為138.99km、433.24km、425.88km、363.95km;具有7日假期的黃金周“十一”、春節的G值均小于30,分別為28.97、28.86,AR值分別為464.87km、541.30km。
綜上可見(表1),中秋、“十一”、春節客源地地理集中指數G值偏小,客源吸引半徑AR值偏大;三天小長假端午、元旦、清明、“五一”的G值偏大,客源吸引半徑AR值偏小。由于2015年中秋節臨近“十一”國慶節,居民出游行為在一定程度上受“十一”黃金周的影響。以上分析表明,除中秋節假期外,假期時間越長,南京市客源地地理集中指數的G值越低,客源吸引半徑AR值越大,說明我國居民出游行為受到休假制度的限制,休假時間越長,居民出行距離越遠,客源地吸引范圍越廣泛。

圖1 南京市景區各節假日期間客源地游客量分析對比

圖2 南京市景區節假日期間客流量距離衰減曲線
2016年南京市夫子廟元宵燈會于2月4日(臘月二十六)—2月25日(正月十八)舉行,為期22天。根據從大數據平臺獲得的監測數據,分析研究2月1日至2月29日夫子廟游客量(圖3),數據顯示2月1日至2月3日期間,外地游客較少,日游客量低于1萬人次;2月4日,夫子廟元宵節開幕當天,外地游客量激增,達到峰值的6.4萬人次,且日游客量首次高于南京本地游客量的5.8萬人次;春節期間,外地游客量有所增加,2月8日至2月14日期間,日游客量均達到1萬人次以上,并于2月10日達到高峰的2.6萬人次,此后日游客量開始逐步減少;2月22日(農歷正月十五元宵節)外地游客量再一次達到高峰的5.4萬人次,且日游客量在3萬人次以上一直持續到2月27日,2月28日以后游客量開始逐步下降。

圖4 夫子廟元宵節期間游客客源地分布
從元宵節期間夫子廟游客客源地分布來看(圖4),外地游客客源地主要以長三角一帶為中心,輻射至珠三角、環渤海片區、成渝片區和新疆地區;游客量排名前十的客源地依次是江蘇、安徽、浙江、上海、河南、山東、廣東、北京、新疆,分別占比95.9%、1.06%、0.43%、0.38%、0.32%、0.23%、0.23%、0.21%、0.13%。
在傳統的預測中,數據大多來自統計年鑒或者統計公報,這些數據從收集、統計到公布需要較長的時間,存在明顯的滯后性,數據也存在較大的誤差?;诖祟悢祿?即使研究者們采用最先進的預測方法和工具,也無法得到較準確的結果,因此極大地影響了預測的準確性。搜索引擎尤其是百度便成為網民重要的獲取信息和服務的平臺,利用后臺記錄的網絡搜索數據來研究實際需求與網絡關注度之間的聯系,從而展開預測,有效避免了數據的滯后性和誤差性,使預測結果更加有效、更加準確。
通過以“南京+旅游要素”的結構選取與南京旅游相關的關鍵詞(共14個),運用關鍵詞挖掘工具如站長工具確定6個搜索量較高的關鍵詞,分別為:南京旅游、南京機票、南京中山陵、南京夫子廟、南京酒店、南京旅游攻略。限于南京智慧旅游平臺數據和百度指數的可獲性與完整性,選取2015年6月1日到2016年5月1日的游客量數據。首先對時間序列數據進行單位根檢驗和協整檢驗(表2),檢驗時間序列的穩定性;其次用格蘭杰因果檢驗方法對時間序列(6個關鍵詞的百度指數和游客量)進行檢驗(表3),得出與南京市游客量存在因果關系的變量共4個:南京旅游(X1)、南京夫子廟(X2)、南京酒店(X3)和南京機票(X4)。

表2 ADF檢驗

表3 變量的格蘭杰因果關系檢驗
在南京市總體游客的時間序列內,存在元宵節前后兩天(2月23日和24日)游客人數極高的異常值(圖5),為保證數據最佳的擬合效果,將這兩天數據予以剔除。剔除后的數據具有較高的波動性,以此序列作為最終序列(游客人數Y)與四個關鍵詞的百度指數進行擬合分析,構建預測模型的估計期為2015年6月1日至2016年4月31日。

圖5 2015—2016年游客數量的變動趨勢
本文通過將“滯后一期”與“滯后二期”的Y、本期直至“滯后二期”的各自變量對Y進行逐步回歸(回歸過程中保持常數項存在),剔除無效變量,加入顯著變量,建立ARMA預測模型。通過不斷測試,最終得到以下結果(括號中的值為變量t的值):

(1)
在10%顯著水平下,檢測的全部變量都是顯著的,所以可以認為模型是有效的,且在自相關的LM檢驗中的F統計量為2.140079,對應概率值為0.1445,大于10%,接受了“不存在自相關”的假定,即認為該模型不存在著自相關,為有效的模型。
通過方程1可知,預測客流量受到游客實際數量和關鍵詞百度指數的共同影響。在其他因素不變的前提下,預測期前1天和前2天的實際游客數量(Y)、提前2天的“南京機票”百度指數(X4)、提前1天的“南京夫子廟”百度指數(X2)對預測期的游客量有正向影響。即該類數據的增加代表游客量的增加,且其影響程度主要受到前面系數的影響——提前1天的“南京夫子廟”百度指數(X2)影響最大,該數據的增加將顯著提高南京游客,其次為提前2天的“南京機票”的百度指數(X4),最后是提前1天和提前2天的實際游客數量。相反,“南京機票”的當天百度指數(X4)、提前2天“南京夫子廟”(X2)的百度指數對預測期的游客量有負面影響。即該類數據的增加代表游客數量的減少,且其影響程度受到前面系數的影響 ——“南京機票”的當天百度指數影響最大,該數據的增加將顯著降低當日游客,其次為提前2天的“南京夫子廟”百度指數。
利用方程1對樣本時間外的2016年5月南京市總游客進行預測,現實游客數與預測游客數見圖6。從圖6可見,該模型具有良好的預測能力。由于平臺數據在5月27號、28號、31號缺失,導致30號游客量無法預測,預測數據缺失或低于實際游客。

圖6 2016年5月南京市級旅游人數與預測人數對比
本文討論了南京市旅游流節假日客源地分布特征,得出各節假日南京旅游流客源地距離衰減規律、節假日長度與客源的影響半徑負相關等結論。在此基礎上,利用百度指數,對各景區的客流量進行預測,并計算其漏損指數。即判定該方法預測的準確程度,合理預測各景區的高峰期,為景區發展提供了保證。同時,對有關政府部門以及相關旅游企業的決策者而言,及時準確的預測也為他們管理和保護景區提供了依據。
但本文依然存在著一些不足,如對客流量影響因素的研究不全面,沒有充分考慮到天氣因素、經濟狀況、交通便利程度等對客流量的影響;沒有具體到每一天、每一時間的旅游流流量預測,不能預測實時客流量,實時找出應對措施,有時間差;基于百度指數的預測存在著一定的延遲和誤差。因此,未來我們應進一步深入研究,以期找出更精確和便利的方法進行預測。
本文基于南京智慧旅游數據監測平臺,以南京市的旅游流為例,從微觀角度探究了城市旅游流客源地的分布,利用百度指數對旅游流進行了預測。研究發現,旅游流受到多因素的影響。
具體的研究結論為:①南京市各明顯的距離衰減傾向。即客源地距離越遠,旅游流的流量越少,但在少數特定的地區,存在不同程度的波峰。②假期的長度與景區游客的集中程度負相關,與客源吸引范圍正相關。即假日越長,景區游客集中程度相對越小,客源吸引范圍相對越廣,游客客源地相對越分散。反之,景區游客集中程度相對越大,客源吸引范圍相對越小,游客客源地相對越集中(中秋節除外)。③傳統的特色節日會帶來旅游流量的激增,如南京特色節日夫子廟元宵燈會外地游客量在一兩天達到高峰,景區嚴重超負荷,容易造成安全隱患,因此需要相關工作人員進行疏導。④由于距離南京的空間距離、交通成本、時間成本相對較低,旅游轉換率較高等因素的限制,基于百度指數的預測,雖然比傳統預測方法更準確。
參考文獻:
[1]保繼剛,楚義芳.旅游地理學[M].北京:高等教育出版社,1999.
[2]唐順鐵,郭來喜.旅游流體系研究[J].旅游學刊,1998,13(3)∶38-41.
[3]Prideaux B.Factors Affecting Bilateral Tourism Flows[J].Annals of Tourism Research,2005,32(3)∶780-801.
[4]Williains A T,Zelin Sky W.On Some Patterns of Internationals Tourist Flows[J].Economic Geography,1970,46(4)∶549-567.
[5]Haldrup M.Laid-back Mobilities∶Second-home Holidays in Time and Space[J].Tourism Geography,2004,6(4)∶434-454.
[6]Cho V.A Comparison of Three Different Approaches to Tourist Arrival Forecasting [J].Tourism Management,2003,24(3)∶323-330.
[7]黃泰,張捷.基于旅游流特征分析的旅游區域影響研究——以淮安市為例[J].旅游科學,2006,20(2)∶18-24.
[8]李志飛,夏磊.中國特殊時段旅游流時空分布特征研究——以“十一”黃金周為例[J].旅游學刊,2013,28(10)∶37-46.
[9]汪德根.京滬高鐵對主要站點旅游流時空分布影響[J].旅游學刊,2014,29(1)∶75-82.
[10]Hagerstrand T.The Propagation of Innovation Waves[J].Human Geography,1952,(4)∶3-9.
[11]Huybers T.Modeling Short-break Holiday Destination Choices[J].Tourism Economics,2002,9(4)∶389-405.
[12]Yeong Hyeon Hwang,Ulrike Gretzel,Daniel R.Fesenmaier.Multi-city Trip Patterns:Tourists to The United States[J].Annals of Tourism Research,2006,33(4)∶1057-1078.
[13]吳必虎.上海城市游憩者流動行為研究[J].地理學報,1994,49(2)∶117-127.
[14]Kulendran N,Witt S F.Co-integration Versus Least Squares Regression[J].Annals of Tourism Research,2001,28(2)∶291-311.
[15]Webber A.Exchange Rate Volatility and Co-integration in Tourism Demand[J].Journal of Travel Research,2001,39(4)∶398-405.
[16]Kima J H,Moosa I A.Forecasting International Tourist Flows to Australia:A Comparison Between the Direct and Indirect Method[J].Tourism Management,2005,26(1)∶69-78.
[17]保繼剛.引力模型在游客預測中的應用[J].中山大學學報(自然科學版),1992,31(4)∶133-136.
[18]李君軼.旅游數字足跡:在線揭示游客的時空軌跡[J].思想戰線,2013,39(3)∶103-107.
[19]唐佳,李君軼.基于微博大數據的西安國內游客日內時間分布模式研究[J].人文地理,2016,31(3)∶151-160.