彭 輝,趙亞軍,胡章浩
(長安大學 公路學院, 西安 710064)
鐵路客運量是衡量地區鐵路客運發展水平的重要指標,西寧作為青海省省會,在省內城市中人口數量居首,是西部地區重要的旅游城市。隨著西寧市的經濟發展、人民生活水平的提高及旅游人數的逐年增加,人們的出行需求日益增大,同時,鐵路客運與公路、航空、水運等客運方式的市場競爭日趨激烈,此外,在其他地區還有著鐵路客運基礎設施體量與鐵路客運量規模不符,從而造成鐵路設施功能發揮不足的現象[1-2]。因此,選取西寧市全市人口總數、歷年生產總值及接待游客總量作為研究因素,針對各因素對既有線鐵路客運量的不同影響程度做系統分析,預測結果對有關部門制定相關客運策略具有重要意義。本文通過建立西寧鐵路客運量多元線性回歸模型,利用Eviews軟件進行預測,并對模型預測精度進行檢驗。
在許多學術及現實問題研究中,某個因變量的變化一般受到多個因素的影響,這種情況下就需要將多個影響因素作為自變量來解釋因變量的變化情況,這種問題就稱為多元回歸問題,當多個自變量和需要研究的因變量之間存在某種線性關系時,此回歸分析問題就變成多元線性回歸。
多元線性回歸分析通用模型:設影響因變量Y的自變量個數為n個,記作X1,X2,…,Xn,多元線性回歸模型指所有自變量對Y的影響是線性的,則模型關系式為:
Y=β0+β1X1+β2X2+…+βnXn+ε
(1)
其中:Y為因變量;β0為常數項;β1,β2,…,βn為回歸系數;X1,X2,…,Xn為自變量,可得到精確值的解釋變量;ε為隨機擾動項;n為解釋變量個數。當n=1時,式(1)為一元線性回歸;當n≥2時,式(1)為多元線性回歸[3]。
多元線性回歸模型中,各個自變量對因變量的解釋顯著性不同,因此需要判斷所有自變量綜合起來對因變量聯合影響的總顯著性,即回歸方程的顯著性。在得到回歸模型后,要對模型進行各類檢驗以驗證模型是否可用,常用的檢驗方法有擬合度檢驗、回歸系數顯著性檢驗、回歸方程顯著性檢驗[4-5,6]。
根據所建立的基本多元線性回歸模型,在已經得到回歸系數的情況下,還需對整個回歸方程進行顯著性檢驗。通常對所建立的回歸方程進行顯著性檢驗時采用F檢驗,F檢驗一般過程見表1。

表1 F檢驗的步驟
為了更加全面系統地反映西寧鐵路客運量的情況,本文選取西寧市既有線鐵路客運量作為因變量,選擇國內生產總值、居民人均可支配收入、全市總人口數、接待游客總量、旅行社數量等作為自變量,分析西寧鐵路客運量的影響因素。
通過相關系數檢驗發現:國內生產總值與居民人均可支配收入、接待游客總量與旅行社數量存在很高的相關性,所以選取國內生產總值、接待游客總量、全市總人口數等作為自變量分析影響因變量的主要影響因素[7-8],所選取的原始數據滿足線性回歸條件,可作為建立模型的基本參數。
本文以2004—2016年西寧市鐵路客運量、全市總人口數、生產總值及接待游客總量為樣本基礎數據,依據3項指標歷年的統計數據,采用多元線性回歸模型,分析鐵路客運量變化規律,預測未來相關發展趨勢,表2為西寧市近年來各變量有關數據,數據來源于歷年《西寧統計年鑒》。

表2 2004—2016年西寧市各相關變量統計數據
鐵路客運量因其系統性而受到多種因素的影響和制約,本文選取較為重要的3項影響因素(人口總數、生產總值、游客總量)作為解釋變量進行回歸分析,對因變量和自變量進行統計描述分析得出西寧鐵路客運量與人口總數、生產總值、游客總量之間有著不同程度的相關關系。為進一步更加深入分析變量間的影響關系,將利用Eviews統計軟件對模型進行求解并檢驗。建立西寧鐵路客運量多元線性回歸預測模型[9]:
Y=β0+β1X1+β2X2+β3X3+ε
(2)
式(2)中各個符號含義見表3。
根據以上分析,依據樣本數據和基本模型,采用Eviews統計軟件求解多元線性回歸分析模型,并進行最小二乘法回歸分析,得到的分析結果見表4。
表4中:X1表示總人口數;X2代表生產總值;X3代表游客總量根據表4軟件分析結果。可以得出鐵路客運量、總人口數、生產總值以及游客數量的多元回歸模型:
Y=821.763 2-3.632 738X1-
0.271 564X2+0.569 589X3
t= (0.466 059) (-0.423 517)
(-0.940 071) (2.808 934)

表3 模型符號及其含義

表4 分析結果
1) 經濟意義檢驗
通過上述多元線性回歸模型的建立與求解可以得到:在其他情況不變的情況下,總人口數增加1個單位,西寧鐵路客運量將減少3.632 738個單位;在其他條件不變的情況下,生產總值每增加1個單位,鐵路客運量將減少0.271 564單位;在其他條件不變的情況下,接待游客總量每增加1個單位,鐵路客運量將增加0.569 589個單位。也即:鐵路客運量與接待游客總量成正相關關系,與總人口數、生產總值成負相關關系[6]。
2) 統計檢驗
從Eviews統計軟件得到的回歸估計結果可以看出:所建立的模型擬合度很高,可決系數為 0.924 981,表明西寧鐵路客運量的92.498 1%可以由總人口數、生產總值和接待游客總數量來解釋。
F統計量的值為36.989 97,Prob統計量的值為0.000 022,表明模型呈現顯著的線性回歸趨勢。
總人口數、生產總值和接待游客總數量的t統計量的值分別為-0.423 517、-0.940 071和2.808 934。查表可知,總人口數、生產總值和接待游客總數量對西寧鐵路客運量均有顯著的影響。
西寧鐵路線路分為既有線路和高鐵線路,由于高鐵線路客運量數據暫未獲取,因此本文只針對西寧市既有線鐵路客運量做短期預測。
根據2017年西寧國民經濟和社會發展統計公報顯示:2017年總人口為235.50萬人,全年生產總值為1 284.91億元,游客接待總量為 2 138.29萬人次,結合得到的鐵路客運量計算式,計算得到西寧既有線鐵路客運量為835.26萬人次,而2017年全年實際鐵路客運量為825.91萬人[10],統計所得鐵路客運量與模型計算出的客運量相差較小,所建立的模型預測效果良好,模型可用。
本文以西寧市各項統計數據為基礎,依據多元線性回歸分析方法建立模型,利用Eviews統計軟件平臺,預測西寧既有線鐵路客運量,并進行模型檢驗,發現在影響西寧鐵路客運量的幾項影響因素中,西寧市歷年游客總量對鐵路客運量有明顯的正相關關系,而人口總數及生產總值對鐵路客運量有明顯的負相關關系。經檢驗,模型精度符合要求,本文建立的模型可用以預測未來年西寧市鐵路客運量。
作為西部地區著名的旅游型城市,西寧地處高原地帶,氣候變化較大,因此西寧市的旅游業發展的季節性差異較大,適游期主要集中在5—8月,9—4月因受到自然資源類旅游活動的限制,旅游人數會大幅下降,因此西寧市游客數量高峰月出現在5—8月,約占全年游客總量的60%以上,總體上,在旺季旅游日均客流量大約是淡季時的3倍。因此,根據所建立的模型,在分時段預測西寧鐵路客運量時,應著重考慮旅游的季節性因素帶來的誤差。
影響鐵路客運量的因素較多,本文選取的影響因素是根據西寧市是旅游型城市這一特征,有針對性地選擇上述3個變量作為因變量,3項變量對西寧鐵路客運量均有著不同程度的影響,尤其是旅游客流量影響更為顯著。由于各變量間并不相互獨立,因此各因變量之間也存在著或強或弱的相關影響,這對模型的精確度有影響,在后續預測模型研究中,應多加考慮各因變量之間的相互影響關系。