(南京大學 地理與海洋科學學院,江蘇 南京 210023)
旅游流一直是旅游地理學關注的焦點問題[1]。旅游流網絡結構能反映旅游流時空特征,對旅游規劃方向和旅游環境容量的確立具有指導意義[2]。社會網絡分析理論是研究旅游流網絡結構較為成熟的理論框架,研究尺度可分為國家、區域、省、市、景區等層面。國外學者最早將社會網絡分析理論用于旅游流時空特征研究[3,4],國內學者同樣較為關注這一領域,研究內容涵蓋了旅游流網絡構建[5,6]、省際旅游流時空特征[7]、城市間旅游流時空特征[8,9]、城市內旅游流時空特征[10]、旅游流空間結構與經濟的聯系[11]、入境旅游流網絡結構特征[12-15]等方面。
當前的研究中多用非加權的社會網絡方法構建旅游流網絡,通過設置斷點值將多值矩陣轉化為非加權的二分網絡矩陣,其中斷點值的設置主要由個人決定,因此缺乏科學依據。在基于此方法構建的網絡中,邊的權值為定值,即存在聯系的節點之間的聯系強度均相同。但在現實網絡中,邊的權值是衡量節點間聯系強度非常的重要指標[16],在構建二分網絡矩陣的過程中會造成信息丟失,使網絡結構難以被詳細描述[17]。
鑒于此,本研究以定量描述邊的權值為主要切入點,依托南京市智慧旅游大數據的監測平臺,運用加權方法對南京市旅游流網絡進行了深入分析,在驗證方法有效性的基礎上,探究網絡的結構特征,為旅游流網絡研究在方法上提供了改進。
本研究采用2015年7月1日至2016年6月30日共366天的南京市景區組合線路數據。該數據由已經過清洗、匯總和統計的手機信令數據生成,來源于南京市智慧旅游大數據監測平臺。平臺監測范圍覆蓋了南京市34個主要景區(表1),基本涵蓋了南京市所有熱門景區。手機信令數據具有規模大、時效性強的特點,因此監測平臺的數據具有較好的代表性,有助于有效分析旅游流網絡特征。

表1 平臺監測覆蓋的景區構成
本研究使用以復雜網絡理論為基礎的加權方法,通過計算節點結構參數和網絡同配性對南京市旅游流網絡進行分析。在加權方法的有效性得到驗證的基礎上,對每日數據按月份整合,探究南京市旅游流網絡結構時序變化特征。
網絡矩陣構建:由于景區組合線路數據是無向的,需要將組合線路數據拆分為無向節點對,匯總后得到節點對之間的客流量,并進一步建立網絡矩陣,數據處理流程見圖1。

圖1 數據處理流程
如在一條線路中,景區A到景區B客流量為50,在另一條線路中,景區B到景區A的客流量為20,且其他組合線路中不含景區對(A,B)之間的客流,則景區對(A,B)間的客流量為70。在驗證加權方法的有效性方面,需分別基于加權方法和非加權的社會網絡方法構建加權網絡矩陣與非加權的二分網絡矩陣,對比各項結構參數的分析結果。為了統一數據處理口徑,預設相同的斷點值構建加權網絡矩陣與二分網絡矩陣。考慮到單條景區組合線路客流量的最小值為1,最大值可達43291。本研究假設客流量小于20人的景區對不具代表性,即設置20為斷點值。若景區對A、B間的客流量小于20人,則二分網絡矩陣中(A,B)與(B,A)單元的值為0,反之為1;加權網絡矩陣中(A,B)與(B,A)單元的值為0,反之為邊權。邊權按其意義可劃分為相似權與相異權,相似權與相異權用于構建不同的加權網絡以支持結構參數的計算。節點對之間的相似權越大或相異權越小,則節點對之間的聯系越強。在邊權計算方面,采用景區對之間的客流量作為相似權,取相似權的倒數作為相異權。在計算度數中心性、集聚系數、網絡同配性時,構建相似權網絡矩陣;計算接近中心性與中介中心性時,構建相異權網絡矩陣。
結構參數計算:基于Python語言,采用復雜網絡分析工具包NetworkX[18]完成各參數的計算與數據處理。設無向網絡G=(V,E)。式中,V為節點集合;E為邊集合;N為節點個數。各項參數計算方法如下[19-22]:
度數中心性:節點vi的鄰邊數ki稱為該節點vi的度,在加權網絡中與非加權網絡中節點度相對應的是點權,點權是節點度的自然推廣。節點vi的點權Si定義為與它關聯的邊權之和,計算公式為:
(1)
式中,Ni為與節點vi鄰接的節點集合;wij為節點vi與節點vj所成的邊上的權重。在非加權網絡中,節點vi的度數中心性CD(vi)為其度數ki除以網絡中其他節點個數(N-1);在加權網絡中,節點vi的度數中心性CD(vi)為其點權Si除以(N-1)。度數中心性描繪了節點與其他節點聯系的強度,是節點在網絡中集散作用的體現。
接近中心性:節點vi的接近中心性Cc(vi)可表示為:
(2)
式中,dij為節點vi到節點vj的最短路徑長度。接近中心性Cc(vi)即節點vi到其他所有節點最短路徑之和的倒數乘以其他節點個數;在非加權網絡中,路徑的長度為所經過邊數之和;在加權網絡中,路徑長度為所經過邊的長度之和。該參數反映了節點在網絡中居于中心的程度,指標越大,說明該節點與其他節點的聯系越密切,在網絡中地位越高。
中介中心性:節點中介中心性CB(vi)是指網絡中某一節點與其他各點之間相間隔的程度,可表示為:
CB(vi)=2Bi/[(N-2)(N-1)]
(3)
式中,Bi為通過節點vi的最短路徑數目。該參數反映一個點幫助不相鄰點間建立連接的程度,指數越高說明節點對網絡連接建立的貢獻越大,對其他節點的控制作用越強。
集聚系數:設節點vi的度為ki,在非加權網絡中,節點vi的集聚系數可表示為:
Ci=2Mi/[ki(ki-1)]
(4)
式中,Mi表示與節點vi鄰接的ki個節點間實際存在的邊數。在加權網絡中,集聚系數的計算公式[21]為:
(5)

同配性:同配性用以考察度值相近的節點是否傾向于互相連接。同配性的計算公式為:
(6)
式中,ki、kj分別表示邊eij的兩個節點vi、vj的度(加權網絡中為點權);M表示網絡的總邊數。若r<0,則網絡為負相關;若r>0,則網絡為正相關;若r=0,則網絡為不相關。在非加權網絡中,同配性描述的是度—度相關性。如果度大的節點傾向于與度大的節點連接,則網絡為正相關;反之,若度大的節點傾向于與度小的節點連接,則網絡為負相關。在加權網絡中,與非加權網絡的度—度相關性類似,可用點權—點權相關性來描述網絡的同配性。
為使驗證過程具有代表性,避免隨機性,在結構參數計算方面選取研究時段中的整月數據進行分析;在反映整體網絡特征的同配性計算時,選取所有日期的數據進行分析。基于原始數據分別使用加權方法與非加權的社會網絡方法構建旅游流網絡,對各個參數的計算結果進行比較,驗證加權方法的有效性,總結加權方法的優勢。
網絡結構參數分析:選取2016年1月份的數據進行分析,計算各景區節點每日網絡結構參數并進行極差標準化,將結果換算為百分數,考察景區節點的月平均值。利用基于景區位置構建的泰森多邊形代表景區節點,便于各項結構參數的表達。為了得到各項結構參數的空間分布格局,在ArcMap中使用自然斷點法,按數值大小將景區節點劃分為高值、較高值、較低值、低值4類。圖2中I—IV為非加權網絡分析結果,V—VIII為加權網絡分析結果。

注:A為夫子廟;B為玄武湖;C為南京市博物館;D為總統府;E為金牛湖;F為明文化村;G為南京博物院;H為梅園新村;I為南京科技館;J為南京大屠殺遇難同胞紀念館;K為牛首山;L為棲霞山;M為求雨山文化園;N為天生橋景區;O為紅山動物園;P為銀杏湖;Q為游子山;R為雨花臺;S為閱江樓;T為珍珠泉;U為鐘山風景區;V為周園;W為紫清湖;X為高淳老街。
圖2南京市旅游流網絡結構參數空間分布
由圖2可知,在非加權網絡各項結構參數的計算中,絕大部分節點對應的參數值分布在100或0附近,具有集中化、二極化的特點,而加權網絡的計算結果可改善這種狀況。結合圖2中加權網絡和非加權網絡除中介中心性外的各項參數的空間分布狀況進行對比分析可知,非加權網絡中除中介中心性外的各參數高值與較高值節點群在加權網絡中被進一步劃分為三類,分別為位于主城區東的高值集群、主城區西的較高值集群和主城區外圍較低值集群,且相比于非加權網絡,加權網絡呈現出清晰的主城區東—主城區西—主城區外圍—郊區的由高值到低值的空間分布格局。在中介中心性方面,非加權網絡中的高值節點集群在加權網絡中被精簡,有5個節點對應非0值,其中夫子廟、玄武湖為高值集群,因加權網絡在描述節點間最短路徑時,能夠脫離非加權網絡用邊的數量描述路徑長度的局限,節點間路徑長度衡量了聯系強度,與其他節點聯系更密切的少數節點占據了網絡中的控制位置。據此,加權網絡比非加權網絡在描述網絡結構上更為具體、清晰,更有利于探究旅游流網絡特征。

圖3 鐘山風景區結構參數與網絡中游客量的時序變化
以鐘山風景區為例,對其在網絡中各月份游客量和結構參數的時序變化情況進行分析,圖3a、3b分別為加權網絡和非加權網絡的分析結果。從圖3可見,網絡中景區游客量的變化不足以充分描述節點在網絡中的地位和作用的波動,網絡結構參數的時序變化特征在加權網絡中得到了更清晰、明確的體現。加權網絡結構參數是客流分布的具體表達,與網絡中游客量這一指標相比,含義更豐富,其時序特征反映了節點在網絡中地位和作用的變化。
網絡同配性分析:結合度數與點權指標,分別計算每日旅游流網絡的同配性。由表2可知,南京市旅游流網絡同配性在兩種方法下均為負,說明網絡中較熱門的景區傾向于與較冷門的景區相連,熱門景區對冷門景區具有促進效應。相關系數時間序列的波動幅度均較小,加權網絡的序列更為穩定。在非加權網絡的同配性計算中,共出現139個無效日期,原因是在當日的旅游流網絡中,每個節點都與其他節點存在連接,所有節點度數相同,不存在Pearson相關系數。因此,加權方法有助于避免非加權網絡中因相關系數不存在造成的無效性問題。
綜上可知,加權方法由于保留了絕大部分有效信息,在一定程度上避免了非加權的社會網絡方法帶來的集中化、二極化和無效化等問題,有助于更加具體清晰地描繪網絡結構特征,有效性已得到驗證。同時,加權網絡結構參數的時間序列有助于反映節點在網絡中地位和作用的波動,因此可基于加權方法進一步探究南京市旅游流網絡結構的時序變化特征。

圖4 度數中心性時序變化特征
基于加權方法計算景區各月的結構參數,歸納其時序變化特征。各景區度數中心性、接近中心性、中介中心性和集聚系數時序變化特征的不同類型見圖4—7。度數中心性是節點在網絡中集散作用的體現。由圖4可知,各景區度數中心性的時序變化特征主要分為波動型和穩定型(由于零值型節點數值為0或接近0,集散作用較弱,因此不予呈現)。在穩定型節點中,夫子廟、玄武湖在全部時段內保持高值,是網絡中的集散中心,波動型節點存在淡季與旺季的差異。
接近中心性反映了節點在網絡中居于中心的程度。由圖5可知,各景區接近中心性的時序變化特征可分為波動型、穩定型、單峰型。在研究時段內,單峰型節點均在第二季度出現峰值;波動型節點的旺季普遍為第二、三季度;穩定型節點中,銀杏湖呈現持續低值,其他節點呈現持續高值,在網絡中的中心地位較穩定。

圖5 接近中心性時序變化特征
中介中心性反映了節點在網絡中對其他節點的控制作用。從圖6可見,各景區中介中心性的時序變化特征主要分為波動型和單峰型(由于多數節點為零值型,在網絡中未起到控制作用,因此不予呈現)。單峰型節點的峰值均出現在第一、二季度;波動型節點擁有網絡中最高的中介中心性,其中夫子廟在1月、6月最高,鐘山風景區在第三季度最高,玄武湖在其余時段為最高,說明起主導控制作用的波動型節點的出現具有時間差異。

圖6 中介中心性時序變化特征

圖7 集聚系數時序變化特征
集聚系數反映了節點對相鄰節點的帶動作用。從圖7可見,各景區集聚系數的時序變化特征可分為波動型、穩定型、單峰型。在研究時段內,單峰型節點的數值普遍在第二季度升高;波動型節點的峰值出現在不同時段;穩定型節點中夫子廟、玄武湖保持高值,對相鄰節點具有強帶動作用。
綜合以上4項結構參數的分析可知,各個景區在網絡中地位和作用具有較為鮮明的時序變化特征。夫子廟、玄武湖的各項參數均為網絡中的最高值,具有最強的集散、控制和帶動作用,是網絡的核心節點。多數景區節點在第二季度各項參數升高,反映出網絡結構于此時發生了顯著改變。鐘山風景區、南京大屠殺遇難同胞紀念館、求雨山文化園、南京市博物館、高淳老街在除中介中心性以外的其他三項參數中表現相似,說明這些節點在網絡中所處地位與集散、帶動作用呈現相似的時序變化特征,在各自的旺季更易發揮優勢。其中,鐘山風景區與南京大屠殺遇難同胞紀念館的旺季出現在第二、三季度,求雨山文化園與南京市博物館的旺季出現在第二季度,高淳老街的旺季為1月份。金牛湖、紫清湖、牛首山、游子山、天生橋等生態游景區的度數中心性與中介中心性呈現持續低值,第二季度的接近中心性和集聚系數顯著升高,表明其在網絡中地位上升,帶動作用增強,也反映出這些節點在第二季度更多地參與了游線的組合,且承接了較多來自其他節點的客流,是游客在該時段生態游傾向上升、游覽范圍擴大的體現。
本文基于加權方法對南京市旅游流網絡結構分析的結果顯示,網絡同配性為負,其中各個景區在網絡中地位和作用具有較為明顯的時序變化特征,特別是在第二季度,網絡結構的變化反映出游客的生態游傾向上升。為滿足游客在不同時段的出游傾向,充分發揮各景區在不同時段的優勢,需圍繞網絡中以夫子廟、玄武湖為主的核心景區制訂合適的營銷策略,增強景區間交通通達性,打造優化的旅游線路組合以利用其促進效應,并有效引導核心景區在游覽旺季所溢出的客流。在當前大數據應用范圍愈加廣泛的背景下,結合旅游大數據的加權旅游流網絡分析將有助于發掘蘊含在網絡演化特征中的游客傾向與需求,對城市旅游線路運營和營銷策劃具有現實意義與參考價值。
與非加權的社會網絡方法相比,加權方法結合具體數據為邊的權重賦值,有助于量化各個節點之間的聯系,在網絡結構參數計算方面從一定程度上彌補了非加權網絡中出現的集中化、二極化、無效化等不足,描述網絡結構更加具體、清晰,為旅游流網絡研究提供了方法改進。未來需結合空間距離、時間間隔等更多指標量化景區節點之間的聯系并對旅游流網絡中的交互影響因素、機制加以描述,考慮節點增減對網絡結構的動態影響,進行時間尺度更細的網絡結構長期演化分析,以期更深入地探索旅游流網絡的時空特征。