鄭 列, 宋 藝
(湖北工業大學理學院, 湖北 武漢 430068)
在“一帶一路”倡議的指引下,許多學者和業界人士對旅游經濟進行研究[1-4]。趙帥等[5]利用誤差修正模型對山西省旅游業發展與經濟增長之間的關系進行了實證研究。在前人研究的基礎上,本文利用偏最小二乘回歸模型對山西省旅游業的影響因素進行分析。
偏最小二乘回歸(PLSR)的思想:進行數學建模時,PLSR是n個因變量Y對應m個自變量X,它既能夠盡量提取Y和X中的重要成分(主成分分析的思想),又可以使X和Y中提取出的重要成分之間的相關性達到最大(最小二乘法的思想)[6]。利用偏最小二乘回歸模型還可以解決多重共線性問題,該方法比較適用于分析樣本量較小的數據[7]。
建立偏最小二乘回歸模型的步驟:數據說明與標準化→找出符合要求的主成分→建立主成分與原自變量、因變量之間的回歸→繼續求主成分直到滿足要求→推導因變量之于自變量的回歸表達式。
根據樣本數據計算各個因子的關聯度,然后將關聯度進行排序,根據排序結果進行數據分析,灰色關聯度分析[8]比較適合分析動態的過程。由于該方法主要是對變化趨勢進行研究,因此不需要大量的樣本。
1.1.1 社會經濟條件選取地區人均GDP、省內第三產業從業人數、山西省進出口貿易總額作為衡量山西省社會經濟條件的三個指標[9]。地區人均GDP是判斷該地區居民生活質量的一個重要指標,大多情況下,人均GDP越高,該地區人民生活質量也越好,對旅游的需求就越高。由于從事旅游業人數數據不詳,本文選取“第三產業從業人數”這個指標來衡量社會經濟條件。一般而言,若是第三產業從業人數越多,則說明服務業發展情況越好,旅游業的發展有很大可能也較好。而進出口貿易總額越高,表明該地區越開放,旅游業越發達。
1.1.2 相關產業狀況交通運輸業和餐飲住宿業與旅游業息息相關,本文選取酒店飯店資源和交通便利程度兩個指標來衡量相關產業狀況。酒店飯店資源用住宿餐飲法人企業數和住宿餐飲法人營業額來表示;交通便利程度用各個年份的客運量來表示。
1.1.3 旅游經濟產業規模由于山西省還未對旅游資本存量進行統計,而旅游業的大部分資本存量屬于固定資產領域,很多研究者選擇旅游業固定資產總額作為旅游業資本存量的近似替代。本文所需數據為山西省旅游業固定資產總額,但山西省還未編錄旅游統計年鑒,該數據無從查找,本文利用旅游總收入與國民總收入的比值來表示旅游經濟產業規模,該比值和旅游經濟產業規模成正比。另外,旅游者人數也是衡量一個地區旅游經濟產業規模的重要因子,旅游人數越多,意味著旅游經濟越發達。
1.1.4 政府因素選取政府對第三產業的投資額占比和市場化程度來衡量政府對旅游經濟的影響。政府對旅游產業的投資數據目前還無法查詢,但旅游經濟在第三產業經濟的占比很高,政府對旅游產業的投資都集中在對第三產業的投資,因此本文采用政府對第三產業的投資額與政府對固定資產投資額的比值,來表示政府對旅游業的支持度。本文用山西省政府財政支出值占省內生產總值(支出法)的比重來近似反映該省資源配置的市場化程度[10]。
各影響因素變量說明見表1。
筆者從2000-2017年《山西省統計年鑒》中整理了9項指標的樣本數據。為了使實證研究具有可比性和可信度,減少數據之間的異方差等問題,需要對查找到的數據查漏補缺,然后再進行實證研究。
某些年份的數據存在缺失,在進行缺失數據填充時,本文選用最大似然估計法。由于數據單位存在億元、千米(km)、百分比(%)、人次等,需要消除數據的量綱,把有量綱的數據變成標量。
本文采用R軟件“pls”包來實現偏最小二乘回歸分析,研究9個影響因素對旅游總收入的影響大小。導入樣本數據后,利用scale()函數對收集到的數據進行消除量綱處理,處理過的自變量記作x,因變量記作y,然后進行偏最小二乘回歸,選擇留一交叉驗證計算預測誤差平方和[11],R軟件運行結果見表2。表2中,CV代表預測誤差平方和,數據為主成分個數從1到9對應的CV值,adjCV代表經過調整的預測誤差平方和。在選擇主成分個數時,要保證主成分個數盡可能少,在這個前提下,選擇使預測誤差平方和最小或者變化很小時對應的主成分個數。

表2 初步預測結果
由結果可知,當主成分為4個時,預測的誤差平方和幾乎不存在變化,而且此時的累積貢獻率高達99.4%,所以將回歸成分的個數改為4個重新建模。
主成分個數為4個時,建立回歸模型,輸入命令coef(),即可得到回歸系數。但在進行建模之前原始數據已經標準化,回歸系數和原始數據是不對應的,因此需要進行一定的轉換才可得到最終的回歸模型,轉換后得到的回歸系數建立的模型如下:
y=1443.118+0.00001248386x1+ 0.001324288x2+0.0000002303111x3+ 0.00000003982244x4-0.00002848757x5+ 2.864308x6+0.00002032339x7+ 0.5941717x8+2.494388x9+ε
其中,ε為殘差,設殘差序列為εi(i=1,…,18)。
從回歸方程系數的符號著手分析,客運量(x5)的系數為負數,其余均為正數。根據原始數據,畫出客運量變化的折線圖(圖1),由圖1可知,客運量在2007年時突然下降,然后開始緩慢上升,2012年是一個轉折點,從這一年開始總客運量一年比一年低,呈下降趨勢。

圖 1 客運量變化
旅游總收入一直在增加,而客運量在近幾年卻呈下降態勢。這是因為山西省私人汽車擁有量在2012年以后一直呈現上漲趨勢,國民可支配收入也快速增長,人們在選擇短途出行時,更加偏向選擇快捷便利的交通方式,而私人汽車的方便快捷無疑是短途出行首選,這也直接導致公路、鐵路客運量的減少,同時說明人民的生活水平也在變好,人民生活美好了,對旅游的需求也愈發強烈了,所以客運量和旅游經濟是成反比的。
對回歸系數進行顯著性檢驗,利用jack.test()函數來進行檢驗,結果見表3。

表3 偏最小二乘回歸系數顯著性檢驗表
由表2可知,旅游人數(x7)和旅游總收入與國民總收入的比值(x6)兩個因素是極其顯著的,人均GDP(x1)和交通便利程度(x5)是顯著的,政府財政支出占比(x9)和第三產業從業人數(x2)是比較顯著的,其他三個因素(進出口貿易總額(x3)、住宿餐飲營業情況(x4)、第三產業投資占比(x8))不顯著。
采用Engle-Granger兩步檢驗法對誤差εi,(i=1,…,18)作協整檢驗[12],畫出εi的散點圖(圖2)。

圖 2 殘差散點圖
圖2中所有的點都分布在-0.4~0.3之間,大量散點在ε=0上下浮動,因此可以認為本文所建立的回歸模型不存在異方差問題,擬合效果比較好。
表4是對εi進行平穩性檢驗的結果,表中ADF檢驗的P值為0.028,0.028<0.05,所以εi是平穩的,本文構建的回歸模型為協整回歸。

表4 殘差序列平穩性檢驗結果
最后檢測回歸模型的擬合度。用真實值作橫軸,預測值作縱軸,畫出擬合效果圖(圖3)。在圖3中,所有的點都分布在對角線附近,說明模型的擬合效果很好。

圖 3 模型預測擬合散點圖
為了檢驗偏最小二乘回歸模型分析結果的有效性,本文采用灰色關聯度分析來探究旅游經濟的各個影響因素,并將其結果與前文得到的結果(偏最小二乘)進行比較。
在進行灰色關聯度分析時,首先對樣本進行去量綱處理,求出xi與Y的差,在所有差中找出最大值和最小值,利用公式
計算關聯系數,其中Δxik表示xik與Yk的差序列,Min(Δxik)表示最小差值,Max(Δxik)表示最大差值,ρ為分辨系數,ρ∈[0,1],若ρ越大,則表明各個關聯系數的差別越小,相應的分辨能力也就越弱[13],分辨系數大多數情況下取0.5。表5為計算得到的關聯系數。
得到各個關聯系數之后,通過公式
來計算各個影響因素和旅游總收入的關聯度[14]。各個因子的關聯度計算結果列于表6。
由表6可知,9個影響因素的關聯度均超過了68%,關聯度最高的是旅游人數(x7),最低的是交通運輸客運量(x5)。9個因素的關聯度排名為:旅游人數(γ7)>旅游總收入與國民總收入的比值(γ6)>人均GDP(γ1)>進出口貿易總額(γ3)>第三產業從業人數(γ2)>政府財政支出占比(γ9)>住宿餐飲業營業情況(γ4)>第三產業投資占比(γ8)>交通便利程度(γ5)。

表5 關聯系數表

表6 各個影響因素的關聯度
將偏最小二乘回歸模型得到的重要因素與灰色關聯度排序靠前的各因素進行比較,發現兩種方法的分析結果具有一致性,即:對旅游經濟影響最大的因素是旅游人數,其次是旅游總收入與國民總收入的比值,人均GDP也是比較顯著的因素之一。但偏最小二乘回歸選取的變量對旅游總收入的解釋度達到了99.4%,模型誤差也只有0.14,而且偏最小二乘回歸系數可以更直觀地看出各因素和旅游總收入的正反比關系。而灰色關聯度分析只能簡單地通過計算關聯度來分析因變量和自變量的相關關系。所以偏最小二乘回歸的結果更加有效具體。
通過本文的定量分析還可以發現:想要促進該地區旅游經濟的發展,景區應吸引大量游客,引導其進行消費,這樣才能增加旅游經濟產業規模。具體建議為:利用省內旅游資源的亮點,加大特色旅游的發展力度,如“喬家大院”“平遙古城”“五臺山”等極具人文特色和歷史文化底蘊的景點可以加大宣傳力度,增設更多有吸引力的活動,將歷史景區與現代科技相融合,讓游客身臨其境地體驗歷史文化的可貴之處。同時政府要加大對旅游業的各項投入,完善旅行社的管理制度,以及飯店酒店的衛生安全規章制度建設等,創造更加舒適便利的旅行條件,吸引更多國內外游客。
本文得到的結果還說明,山西省經濟發展水平與旅游經濟的發展呈現正相關關系。因此建議大力發展社會經濟,提高人們的消費水平,從而促使旅游經濟更快更好的發展。