王潤源,程紹文
(1.華中師范大學 城市與環境科學學院,湖北 武漢 430079;2.中國旅游研究院武漢分院,湖北 武漢 430079)
旅游者的時空行為是旅游地理學研究的熱點問題。當前,信息技術深刻地影響著人們的出游方式和旅游行為,許多游客從網絡獲取、分享和交流旅游信息,為旅游者行為研究提供了大量開放和易獲取的數據源。人們在各類社交媒體、網站發布的行程信息即產生“數字足跡”[1]。“數字足跡”是人們在網絡上或其他信息系統上所留下的與其行為相關的信息,通過對這些信息的分析可以反映出用戶的某些行為現象和規律[2]。在國外,Girardin 等[3]較早采用旅游數字足跡,通過在Flickr 社區上收集的4280 名拍攝者在佛羅倫薩拍攝并公開分享的帶有地理信息的照片,利用地理可視化方法揭示了游客集中區域和時空流向。在我國,李君軼[4]最早提出“要利用旅游數字足跡數據開展游客時空行為的數字足跡模型、游客旅游行為的時空規律、高效的旅游行為智慧化支持機制和旅游目的地空間結構優化研究,以揭示游客的時空軌跡。此后,學者借助各大旅游平臺、網站獲取游客的“數字足跡”對其時空行為進行分析的研究不斷增多。如:有學者以省域、城市或景區為研究案例地,基于帶有地理信息的照片[3,5]、手機信令[6]、網絡游記[7-9]、微博簽到數據[10,11]、微信“朋友圈”[1]等開展旅游者時空行為模式及特征研究;也有學者利用旅游數字足跡探討了旅游者旅行的“時空體驗流”特征,分析了旅游者的時空行為與難忘旅游體驗[12]和 情 緒[13]、保 護 教 育 感 知[14]、游 客 旅 游 消費[15]之間的關系,或將GPS 或GIS 空間分析技術應用于旅游者時空行為研究,進行旅游熱點分析和網絡分析,從海量數據中發現規律,進而提升對旅游者行為的認識[16]。
城市是重要的旅游目的地,隨著城市旅游化發展,旅游深刻地改變著城市的發展,但目前對城市旅游者的空間行為研究卻十分有限[17]。傳統上,人們主要是通過問卷調查方法來研究城市旅游者空間行為,但調查方法樣本量小,無法在城市旅游者的空間行為數據中同時注入時間和空間屬性,調查數據也缺少準確性和有效性[18]。網絡大數據可為城市旅游研究提供充分的時間和空間數據,提示和反映城市大規模游客流的時空模式。利用網絡大數據研究城市旅游者時空行為分析對厘清城市旅游空間結構,優化城市規劃布局,加強城市旅游吸引要素與服務設施之間的聯接配套,進行高效的智慧旅游目的地和智慧城市管理具有重要意義[18]。目前,學術界基于數字足跡研究了青島[8]、北京[13]、馬德里[17]、南京[19]、成都[20]等城市的旅游者時空行為特征,有學者利用網絡數據分析了北京、西安、重慶、蘇州、廣州城市夜間旅游游客體驗[21]。
廣州市是國家和粵港澳大灣區中心城市,是華南地區的海陸空交通中心。作為國內重要的旅游城市,廣州擁有豐富的旅游資源,3A 級以上景區共69個。2019 年,廣州市接待過夜游客6773.15 萬人次,旅游業總收入4454.59 億元[22]。當前,廣州旅游業正處在轉變發展方式、轉換增長動力的關鍵時期,如何提升服務質量,滿足游客多樣化的需求,是增強其旅游競爭力面臨的重要問題[23]。截止目前,對廣州游客的研究主要集中在游客體驗質量、滿意度和旅游地形象和旅游影響感知等方面(如李培奇等[24]對廣州流溪河國家森林公園生態體育旅游者的行為進行了定量研究),鮮見探討廣州城市旅游者的時空行為及城市旅游空間結構的研究文獻。本文基于網絡大數據,采集旅游者數字足跡數據,運用文本分析與GIS空間分析方法對來穗游客的時空行為特征進行了探究,以期為廣州城市旅游規劃管理和高質量發展提供理論依據和決策參考。
本文數據來源于馬蜂窩網站,該網站是我國著名的旅游社交平臺,擁有眾多用戶,許多游客在此實時發布旅游游記、攻略、點評等信息[25]。采用八爪魚采集器,以“廣州市”為關鍵詞,從馬蜂窩網站進行網絡游記數據采集,游記數據時間范圍為2016 年1 月1 日至2021 年4 月30 日。基于下列標準對獲取的原始游記樣本數據進行篩選:①游記內容完整,出現明確的出游時間和游玩天數,且時間范圍必須在2016年1 月1 日—2021 年4 月30 日之間。②游記內容出現旅游景點,能判斷游玩順序,且至少有兩個及以上的旅游節點信息。③剔除帶有商業營銷和推薦的游記。最終篩選出有效游記1863 篇,同時爬取相應游記中的出發時間、出行天數和同伴類型,建立廣州市旅游者時空行為特征數據分析庫。在此基礎上,依據用戶的行程日期順序確定旅游流流向,以此分析游客出行時的旅行軌跡。
由于低頻率旅游節點的分析意義較小,因此不納入本文統計分析。部分旅游節點存在包含關系,如長隆野生動物世界、長隆水上樂園、長隆飛鳥樂園在統計時歸為長隆旅游度假區,廣東省博物館、廣州圖書館、廣州大劇院在統計時歸為花城廣場,廣州博物館、五羊雕像、中山紀念碑在統計時歸為越秀公園。此外,參考劉益等[25]的研究,將珠江夜游也歸于旅游節點。
內容分析法:內容分析法是將非系統和非定量的符號內容(如文本、圖像、圖片等)轉化為定量數據,并針對數據里面的內容進行定量分析、判斷與推理,是文獻研究中經常采用的一種方法[26]。本文借助ROST Content Mining 6 文本分析軟件對游記文本進行了詳細分析。首先,對相關網絡游記文本進行篩選整合;其次,利用軟件對網絡游記進行分詞處理;第三,對分詞處理后的文本進行詞頻分析,同時對游記內容進行語義網絡分析,結合詞頻分析和語義網絡分析結果來揭示游客在廣州市的旅游行為選擇特征。
核密度分析:核密度分析可反映地理要素空間的分布規律,本文采用核密度分析法探究游客在廣州市的空間集聚特征。計算公式為[27]:


赫芬達爾指數:運用赫芬達爾指數分析不同同伴類型的游客在游玩季節分布上的集中程度,計算公式為[28]:

式中:Pi為第i 個季節某一同伴類型游客的數量占該同伴類型游客總數的比值。H 值越接近于1,表示該類型游客在出行季節的選擇上越集中;反之,則越分散。
基于游記內容,運用ROST Content Mining 6 軟件進行詞頻和語義網絡分析,采用停用詞表與自定義詞表排除無意義的詞匯,同時對某些相似詞匯進行合并,最終生成前30 個高頻詞統計表(表1)與語義網絡分析圖(圖1)。結合表1 和圖1 可見,這些高頻詞匯和語義網絡圖直觀體現了游客在廣州吃、游、行、住等方面的行為特征。
在飲食方面,表1 中出現“好吃”“味道”“早茶”“美食”“餐廳”等眾多相關的高頻詞匯。其中,早茶是廣州飲食文化中最重要的一環,來廣州飲早茶是游客十分青睞的旅游行為選擇。在語義網絡分析圖中,節點詞越靠近,表示它們之間有著越密切的關系[8]。從圖1 可見,與飲食相關的節點詞與中心詞“廣州”鄰近,再次印證了“吃”是游客在廣州的重要行為,“食在廣州”的印象深入人心。在景點選擇上,“沙面”“上下九步行街”“廣州塔”“石室圣心大教堂”“陳家祠”等是廣州游客選擇最多的游覽景點。在語義網絡中,“建筑”與多數旅游景點詞相近,說明游覽景點中各種特色建筑是游客在廣州又一重要的旅游行為特點。游客游覽的主要景點中既有陳家祠那樣的古典廣式建筑,也有石室圣心大教堂那樣的哥特式建筑,還有廣州塔那樣的現代化地標建筑,這些旅游資源豐富了廣州的旅游形象。在出行交通選擇上,“地鐵”的詞頻遠高于“步行”“公交”“打車”,說明地鐵是游客游覽廣州最主要的交通方式,從側面體現了廣州發達的地下交通網絡系統。在住宿上,游客主要的選擇是“酒店”,且在語義網絡中該節點詞和“地鐵”這一交通方式和“沙面”“廣州塔”“石室圣心大教堂”“陳家祠”等景點距離較近,說明游客更傾向選擇在景點周邊或靠近地鐵站的酒店,以方便第二天的游覽。此外,“晚上”與“廣州塔”和“上下九步行街”鄰近,說明游客喜歡在夜間游覽這些景點;“拍照”一詞也是游客旅游行為的重要特征詞,可見游客在旅行時習慣用照片進行記錄。

表1 廣州旅游游記高頻詞Table 1 High frequency words in Guangzhou online travel notes

圖1 廣州旅游游記語義網絡Figure 1 Semantic network of online travel notes for Guangzhou
根據游記中提取的時間信息對廣州游客出行月度特征進行分析。受新冠肺炎疫情的影響,全國旅游業在2020 年初遭遇重大打擊,對游客的出行選擇造成了影響。因此,提取2020 年5 月—2021 年4 月游記的時間信息探究疫情后游客出行的月度特征,并與總體的月度特征進行對比分析(圖2)。由圖2可知,總體研究時段上廣州游客出行有3 個高峰時間段,分別是2 月、4 月和10 月,對應春節、勞動節、清明節和國慶節幾個假期,說明節假日是游客來廣州旅游的高峰時段。但受新冠疫情的影響,疫情后游客出行的月度特征發生了一定變化,原本高峰時間段的2 月出現旅游人次的“低谷”,這主要是由于2021年春節假期鄰近時人口流動增大,給各地防疫帶來了極大壓力,許多地區紛紛倡導“非必要不出省”“就地過年”,由此影響了旅游地的客流量。直到3 月,游客流量出現明顯回升,4 月成為客流量高峰期,旅游人次占比最大,而剩余時間段與總體趨勢較為吻合。
在季節特征分析上,依據中國氣象局的劃分標準,春季為3—5 月,夏季為6—8 月,秋季為9—11月,冬季為12—2 月。為進一步分析同伴類型對游客出行時間的影響,結合馬蜂窩網站所提取的游客同伴類型,將其劃分為個人、朋友/同學、情侶/夫妻和家庭/親子4 種。通過對最終網絡游記文本中提取的時間屬性數據的統計分析(圖3),廣州客流主要集中在冬季,其次是春季和秋季,夏季的旅游人次最少。出現此現象的原因與廣州“夏季高溫多雨,冬季溫和少雨”的亞熱帶季風氣候有關:夏季戶外溫度較高,不適宜外出游玩;冬季,廣州相較于全國大部分地區較為溫暖,吸引了眾多游客。4 種伴侶類型出行時間與總體季節特征較為相似,冬季所占的比重最大,夏季所占的比重最小,僅在春秋兩季有所差異。

圖3 廣州游客出行季度特征Figure 3 Seasonal characteristics of tourists in Guangzhou
為進一步探究不同同伴類型出行季度特征的差異,根據公式(2)計算了不同同伴類型游客游玩季節分布上的赫芬達爾指數。可以發現,家庭/親子游類型的游客赫芬達爾指數最大(H = 0.323),隨后依次是情侶/夫妻(H =0.274)、朋友/同學(H =0.264),個人游的季節集中指數值最小(H = 0.260)。家庭/親子游的出行人數較多,出游時間的選擇受限較大,一般選擇在節假日旅游。冬季的時間段孩子正逢寒假,大人也有春節假期,且此時廣州氣候適宜,因此家庭游的游客會更集中在此時間段出行。個人既可以利用節假日出游,也可以利用周末進行短期游,出游時間選擇上更加自由,因此個人游在旅游的季節選擇上相對更分散。
對游客總體和不同伴侶類型游客的出行天數進行統計分析(圖4),結果顯示:游客在廣州的停留時間整體偏長,主要為3—5d,占比超過72.82%,說明廣州旅游資源豐富,許多游客要花費較長的時間進行游覽和體驗。從游客同伴類型看,朋友/同學、情侶/夫妻的日度特征與總體特征類似。個人游類型中,“一日游”的比重較高,達到33.15%,69.56%的個人游游客到廣州游玩的天數在3d以內,說明個人游的游客更偏向短期旅游。與此相反,家庭/親子游的游客集中在長期游,出行天數在5d及以上的游客占比達41.09%。

圖4 廣州游客出行天數特征Figure 4 Characteristics of travel days of tourists in Guangzhou
經過數據整理,最終得出32 個來穗游客到訪的景點(表2)。運用百度地圖查詢廣州游客主要到訪景點的坐標,以廣州市行政區劃矢量圖為底圖,將整理后的各景點坐標系導入ArcGIS 軟件,形成游客到訪景點的空間分布圖(圖5)。同時,以旅游人數為統計字段,對廣州市各個景點進行密度分析,得到游客到訪景點的密度分布圖(圖6)。

圖5 游客到訪景點空間分布Figure 5 Spatial distribution of tourist attractions

圖6 游客空間集聚密度分布Figure 6 Spatial concentration density distribution of tourists

表2 廣州游客到訪景點頻率統計Table 2 Statistical ranking of the occurrence frequency of online travel nodes in Guangzhou
結合表2 和圖5 可知,游客到訪景點的分布具有明顯的空間差異性,主要集中在荔灣區、越秀區、天河區和海珠區等中心城區。其中:荔灣區和越秀區是廣州著名的老城區,擁有眾多歷史文物古跡和民國時期建筑,區域內有著眾多老字號,是品嘗地道廣州美食的重要去處;天河區是廣州的商業和文化中心,交通便利、基礎設施完善、高樓眾多;海珠區旅游景點類型豐富,廣州塔、海珠湖濕地公園、琶醍啤酒文化創意藝術區等各具特色。近郊區的白云區、黃埔區和番禺區等由于距離市中心較遠,交通不便,其到訪景點數量明顯少于上述3 個核心區。遠郊區的增城區、花都區和南沙區由于開發歷史較晚、知名度低、基礎設施相對落后、旅游景點匱乏、游客數量較少、游記中游客提及稀少,故未納入統計。這也反映出廣州遠郊區的旅游發展與中心城區和近郊區有著巨大的差距,尚未形成城郊一體的旅游發展格局。
從圖6 可知,廣州游客的空間密集特征與到訪景點空間分布類似,呈現“城市中心區高,城市邊緣區低”的特征,集聚的密度值大致由中心城區向外圍減少。其中,在越秀區和荔灣區的交界處和天河區的西南部形成較大范圍的集聚中心,該集聚中心內景點眾多、知名度高、交通便捷,吸引了大量游客。而在番禺區的北部與南部、黃浦區與海珠區的交界處和白云區的南部也形成了小范圍的集聚,這些集聚區的景點包括長隆旅游度假區、黃埔軍校舊址紀念館、嶺南印象園、白云山風景區等,受中部集聚中心的輻射帶動作用,具有一定的客流量,但集聚程度遠低于中部地區。
為了解游客在日間和夜間出游的差異,以18:00為界,對日間游客(游客旅游活動主要發生在白天,截止18:00 結束)和夜間游客游客(18:00 以后開始游玩)的出游行為特征進行統計(表3),并運用ArcGIS軟件進行密度分析,可直觀揭示廣州游客在日間和夜間集聚特征差異(圖7 和圖8)。由表3 可知,日間和夜間游客主要的旅游節點有明顯差異。在日間,游客多喜歡造訪人文歷史類景點,這些景點在夜間多數不開放,排名前三的沙面、石室圣心大教堂和陳家祠,其頻率均超過10%。此外,還包括中山紀念堂、西漢南越王博物館、黃埔軍校舊址紀念館等。夜間,游客最喜歡游玩的景點和活動包括廣州塔(頻率達到26.53%)、珠江夜游、長隆旅游度假區、花城廣場、海心沙、琶醍等,這些景點提供夜游活動項目和服務,游客夜間去這些景點旅游會有更好的游玩體驗,廣州的燈光節也主要在這些景點展開。從圖7 和圖8 可見,日間游客主要集聚在荔灣區和越秀區,而夜間游客集聚中心主要集中在海珠區、天河區和越秀區。此外,廣州日間游客的集聚密度明顯高于夜間游客,其密度差異可以達到10 倍,說明廣州夜間旅游發展有較大的發展空間。

表3 日間和夜間游客主要到訪景點Figure 3 Day and night tourists mainly visit tourism attractions

圖7 日間游客空間集聚密度分布Figure 7 Spatial concentration density distribution of tourists in daytime

圖8 夜間游客空間集聚密度分布Figure 8 Spatial concentration density distribution of tourists at night
本文基于數據庫中的游記內容,提取每個游客在廣州市的旅行軌跡,運用ArcGIS 軟件進行可視化表達(圖9),并采用ROST軟件的社會網絡分析和語義網絡分析功能構建廣州游客旅游流網絡結構(圖10)。圖9 和圖10 中,線條的粗細代表了旅游流量的大小,線條越粗,旅游人次越多,反之則旅游人次越少[8]。

圖9 廣州游客旅游軌跡空間分布Figure 9 Spatial distribution of travel trajectory in Guangzhou

圖10 廣州旅游流網絡Figure 10 Network of tourism flow in Guangzhou
從圖9 可見,廣州游客的旅游軌跡存在明顯的區域差異,其旅游軌跡主要圍繞荔灣區、越秀區、天河區、海珠區4 個中心城區為中心向周圍輻射,這4個區域集中了廣州最精華的旅游資源,且區域內交通便利,形成巨大的旅游流量;而白云區、黃埔區、番禺區的景點距離中心城區較遠,客流量較少。
從圖10 可見,沙面為一級節點,該景點知名度高、周邊交通便利,兼具娛樂觀光和休閑就餐的功能,因此游客的旅游活動主要圍繞其展開。石室圣心大教堂、上下九步行街、廣州塔、陳家祠為二級節點,一級節點和二級節點之間聯系較密切,形成龐大的客流量。越秀公園、北京路步行街、中山紀念堂、中山大學南校區、西漢南越王博物館、花城廣場、永慶坊、海心沙公園、中山大學南校區、紅磚廠創意園為三級節點,這些旅游節點有一定的客流量,且與一、二級節點存在較為緊密的聯系。而永慶坊、黃埔軍校舊址紀念館、西關大屋、長隆旅游度假區、白云山風景區為旅游的四級節點,其客流量明顯少于一級和二級節點。
本文以廣州市為例,以馬蜂窩網站游客分享的網絡游記為基本數據源建立數據庫,運用內容分析與GIS空間分析和可視化的方法探究了廣州游客的旅游行為特征。主要結論如下:①廣州游客旅游行為選擇具有多元性,游客不僅喜歡品嘗廣州美食,還喜歡游玩廣州各具特色的建筑。出行選擇上,地鐵是游客出行的主要交通工具;住宿選擇上,廣州游客旅游消費行為具有選擇上的集聚性,出于便利原因,游客更傾向于以景區景點為中心來選擇住宿酒店,也更傾向于去距離地鐵站點較近的景區游玩。②不考慮疫情因素,受氣溫和假期的影響,游客喜歡在冬春和秋季來廣州旅游,表現為冬季最旺,春秋次之,夏季則為淡季。家庭游的游客喜歡在冬季特別是寒假、春節期間來廣州旅游,出行天數較長,多在4d 以上;個人游游客的季節分布更為分散,多為3d 以內的短期游。疫情的出現改變了廣州旅游的月度分布特征,作為旅游高峰的2 月不再成為旅游高峰月。③由于廣州中心城區的景點數量遠多于近郊區和遠郊區,因此游客的旅游活動空間主要集中在中心城區,即越秀區、海珠區、荔灣區和天河區,游客空間聚集具有明顯的極化特征。此外,日間游客主要在荔灣區和越秀區集聚,夜間游客則在天河區、海珠區和越秀區集聚。④游客旅游流網絡主要圍繞沙面、石室圣心大教堂、上下九步行街、廣州塔、陳家祠等旅游節點向外展開,其中,一級節點和二級節點聯系緊密,相互間的客流量大。
基于研究結論,為實現廣州旅游的優化發展,提出以下建議:①積極推動餐飲與文旅結合。“美食”是對廣州游客重要的吸引要素,政府應扶持具有廣府特色的餐飲企業,充分借助各大新媒體平臺(如微信、微博、抖音等)加大宣傳營銷力度,打造一批網紅品牌和餐飲店,提升知名度,吸引更多的客流量;線下可推出美食旅游線路,如沙面—上下九—荔枝灣涌—陳家祠—永慶坊一線的荔灣區美食文化之旅。同時,各景點應依據自身特色和周邊餐飲點的集聚情況,建設美食文化區或美食街,豐富游客的旅游體驗。②積極發展夜間旅游經濟。廣州夜生活豐富,天河區、越秀區和海珠區等夜間客流量大的區域,可依托珠江夜景、廣州塔、花城廣場、北京路步行街等夜間旅游熱點開展豐富多彩的夜游活動,鼓勵周邊餐飲、娛樂場所延長營業時間,打造多個夜間旅游消費區,以吸引更多的游客集聚。③建立區域旅游合作網絡。荔灣區、越秀區、天河區和海珠區四大區域游客聚集程度高,旅游景點之間聯系度較高,應強化這些區域各景點之間的合作,推出多條旅游線路,打造區域性旅游消費集聚區。對于旅游發展較落后的區域,一方面要加大資金投入,完善基礎設施,提高各景點間的通達性;另一方面應充分發揮片區聯動的作用,通過聯動營銷的方式引導游客從高聚集區向周邊擴散,提高客流量,同時加強中心城區與近郊區、遠郊區間的人文、商貿和交通聯系,以推動整個廣州旅游發展空間格局及質量的提升。
本文基于社交媒體發布的網絡文本大數據對游客時空行為特征進行研究,突破了傳統問卷調查的形式,迎合了當前旅游者行為研究潮流。但研究也存在不足之處:首先,受旅游者文化水平和可能的記憶偏差、日記習慣的影響,游記文本質量難免參差不齊,影響了數據的有效性。后期應結合多種數據源,如手機信令、微博簽到數據GPS 定位數據等進一步掌握游客的時空軌跡數據,使研究結果更加全面。同時,如何將互聯網大數據與GIS 時空數方法進行深度結合,分析總結出游客行為基本規律以指導區域旅游發展,將是未來研究的重點。其次,研究內容不夠深入,研究結果僅從整體上反映了廣州游客的時空行為特征。雖然本文分析了不同同伴類型游客在時間行為上的特征,但是仍不夠全面,對目的地旅游發展的參考價值有限。今后的研究可采用線上與線下結合的方式搜集數據,從游客個人特征(如年齡、性別、受教育程度等方面)探討不同類型旅游者的時空行為特征及差異。最后,本次研究數據從馬蜂窩網站進行爬取,數據來源較為單一,缺乏多樣性,對研究分析會產生一定的影響。未來應拓寬數據面,從多個旅游網站進行數據搜集和篩選,確保數據的代表性和一般性。
互聯網時代,如果將網絡大數據與GIS 時空分析方法進行深度結合,分析總結出游客行為的基本規律以指導區域旅游發展,將是未來研究的重點。2019年底出現的新冠肺炎疫情給人們的生產生活帶來了巨大的沖擊與變化,也給人們外出旅游觀光帶來了不利影響。疫情發生后,游客的時空行為特征會發生怎樣的變化,目的地將采取怎樣的措施來應對這種變化,以促進疫后旅游業的恢復與發展,這同樣是未來值得研究的方向。