任芳玲,左 童
(延安大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,陜西 延安 716000)
延安一直是紅色教育和革命情懷的培養(yǎng)地,所以每年都會(huì)有大量的游客來進(jìn)行觀光和革命熏陶,據(jù)統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,延安市近十年來旅游收入占延安市財(cái)政收入的比重明顯增高,為了進(jìn)一步使得旅游收入再創(chuàng)新高,分析其各方面的影響因素非常有必要[1]。本文選取居民消費(fèi)水平,旅游人口總數(shù),延安市年度旅客周轉(zhuǎn)量,私人汽車擁有量以及居民可支配收入作為參數(shù),通過多元線性回歸分析、逐步回歸法進(jìn)行優(yōu)化,最終得出結(jié)論。
多元線性回歸在分析多因素模型時(shí),具有簡(jiǎn)單和方便等優(yōu)點(diǎn),在各類分析問題中都得到應(yīng)用。如文獻(xiàn)[2-5]在對(duì)旅游收入影響因素分析過程中都用到了線性回歸法,本文會(huì)在此基礎(chǔ)上對(duì)基本的回歸方法進(jìn)行改進(jìn)。文獻(xiàn)[6-7]對(duì)旅游收入影響因素進(jìn)行了分析和評(píng)價(jià),文獻(xiàn)[8]在進(jìn)行回歸分析中對(duì)模型進(jìn)行了多重共線性的診斷并解決多重共線性問題,文獻(xiàn)[9]使用逐步回歸法對(duì)得到的結(jié)果進(jìn)行優(yōu)化,最后分析得到結(jié)論。本文在參考了以上相關(guān)論文的基礎(chǔ)之上,選用延安市旅游收入作為因變量來研究,使用改進(jìn)的多元線性回歸法和逐步回歸法對(duì)延安市旅游收入影響因素進(jìn)行分析,并得出相應(yīng)結(jié)論。
在現(xiàn)實(shí)問題中,因變量的變化往往受多個(gè)因素影響,就要用多個(gè)自變量來解釋因變量的改變,這就是多元回歸。當(dāng)多個(gè)自變量和因變量之間呈線性相關(guān),對(duì)其回歸就是多元線性回歸[2-3]。設(shè)x1,x2,…,xk為自變量,y為因變量,則回歸模型為:
y=b0+b1x1+…+bkxk+ε。
b0為常數(shù)項(xiàng),b1,b2,…,bk為系數(shù),b1為x1,x2,…,xk固定值時(shí),y隨x1的單位改變量,即x1對(duì)y的偏回歸系數(shù)。
為檢驗(yàn)方程的顯著性,需要進(jìn)行F檢驗(yàn),現(xiàn)提出如下假設(shè):
H0:b1=b2=…=bk=0,
H1:b1,b2,…,bk不全為0。
經(jīng)分析計(jì)算,由F分布定義,得檢驗(yàn)統(tǒng)計(jì)量:
SR為離差平方和;SE為殘差平方和。若F≥Fα(k,n-k-1),則拒絕H0,該回歸顯著。若F<
Fα(k,n-k-1),則接受H0,該回歸不顯著。
F檢驗(yàn)完成,進(jìn)行t檢驗(yàn)。在SPSS中,對(duì)t值的檢驗(yàn)只需看sig.的值就行,sig.意為顯著性(significance),sig.是一個(gè)最終值。sig.<0.05則表示t檢驗(yàn)通過。
逐步回歸是將變量依次引入模型,每引入一個(gè)就要對(duì)其進(jìn)行F檢驗(yàn),對(duì)所有入選的變量進(jìn)行t檢驗(yàn)。若原來的變量變得不再顯著,則將其刪除。以此類推,直到模型中沒有不再顯著的變量,也沒有變量從方程中剔除為止。逐步回歸法包含向前法和向后法。
向前法:對(duì)k個(gè)回歸自變量x1,x2,…,xk分別同因變量y建立一元回歸模型
y=b0+bixi+ε,i=1,…,k。


向后法的步驟與向前法相反,它先全部選入,隨后逐個(gè)剔除。
在對(duì)影響旅游收入因素的分析中,本文選取旅游人數(shù),居民消費(fèi)水平,旅客周轉(zhuǎn)量,私人汽車擁有量,以及可支配收入5個(gè)主要因素來進(jìn)行分析[4]。其中旅游收入為因變量,其他因素為自變量。通過延安統(tǒng)計(jì)局官網(wǎng)和國家統(tǒng)計(jì)年鑒,得到2005—2014年表1數(shù)據(jù):

表1 延安市旅游收入及影響因素表
其中:y為延安市旅游年收入總值(億);x1代表的是延安市每年旅游人數(shù)總量(萬);x2代表居民消費(fèi)水平(元);x3代表旅客周轉(zhuǎn)量(億人公里);x4私家汽車擁有量(萬);x5代表可支配收入(元)。建立回歸模型:
y=b0+b1x1+b2x2+b3x3+b4x4+b5x5+ε。
通過SPSS進(jìn)行回歸分析,統(tǒng)計(jì)結(jié)果顯示,所有的自變量都在考慮范圍之內(nèi),共同決定因變量,沒有進(jìn)行變量的剔除,繼續(xù)查看模型擬合度。
模型匯總結(jié)果顯示,變量間的線性相關(guān)系數(shù)R=1,R2=1,調(diào)整之后的R2=1,標(biāo)準(zhǔn)估計(jì)的誤差為0.87083,表示擬合度良好,變量相關(guān)程度高。然后進(jìn)行方差檢驗(yàn),結(jié)果如表2所示。

表2 方差分析表
a.預(yù)測(cè)變量:(常量),旅客周轉(zhuǎn)量,旅游人數(shù)數(shù)量,居民消費(fèi)水平,私人汽車擁有量,可支配收入。b.因變量:旅游收入
由表2,對(duì)給定的顯著水平α=0.05,F(xiàn)臨界值為Fα(k,n-k-1)=F0.05(5,4),F(xiàn)=6997.348>F0.05(5,4)=6.256,于是拒絕零假設(shè),變量之間線性關(guān)系顯著,于是建立線性模型[7],再查看正態(tài)分布。
如圖1,該直方圖基本符合正態(tài)分布。

圖1 標(biāo)準(zhǔn)化殘差直方圖
如圖2,通過分析標(biāo)準(zhǔn)化殘差圖是在一條直線上的散點(diǎn)圖,基本上都在一條直線上,因此符合正態(tài)分布,具有統(tǒng)計(jì)意義。于是得到如下結(jié)果:

圖2 標(biāo)準(zhǔn)化殘?jiān)鼒D

表3 回歸系數(shù)表
a.因變量:旅游收入
由表3可得到回歸方程為:
y=-37.332+0.044x1-0.013x2+1.029x3-
0.007x4+0.003x5
(1)
1)擬合度檢驗(yàn):R2=1.000代表該模型線性擬合度良好。
2)F檢驗(yàn):由表2可知,F(xiàn)值大于顯著水平H0,拒絕原假設(shè),總體回歸顯著。
3)t檢驗(yàn):由表3可知,t統(tǒng)計(jì)量所對(duì)應(yīng)的檢驗(yàn)值分別為:0.016,0.656,0.012,0.031,0.000,0.042與檢驗(yàn)α=0.05比較,其中居民消費(fèi)水平這一項(xiàng)所對(duì)應(yīng)的檢驗(yàn)值不符合,且符號(hào)的經(jīng)濟(jì)意義也不合理。說明各變量之間有可能存在多重共線性[8],于是對(duì)該模型進(jìn)行共線性診斷。

表4 共線性診斷
如表4所示,特征值約為0和部分條件指數(shù)大于10表明存在多重共線性。以及相關(guān)系數(shù)矩陣中,居民消費(fèi)水平系數(shù)為0.99接近于1,證明存在多重共線性[9]。
現(xiàn)使用逐步回歸法解決該問題,對(duì)自變量逐個(gè)進(jìn)行一元回歸:

表5 一元回歸結(jié)果表
如表5所示,一元回歸結(jié)果如下:
旅游人數(shù)數(shù)量:y=-3.248+0.055x1,
R2=0.998,F(xiàn)=3272.166;
居民消費(fèi)水平:y=-117.213+0.180x2,
R2=0.980,F(xiàn)=383.329;
旅客周轉(zhuǎn)量:y=-66.556+6.347x3,
R2=0.976,F(xiàn)=322.411;
私人汽車擁有量:y=-16.000+0.017x4,
R2=0.981,F(xiàn)=423.321;
可支配收入:y=-74.061+0.006x5,
R2=0.982,F(xiàn)=448.324。
結(jié)果表明,y與x1的回歸可決系數(shù)最大,選用y與x1為初始回歸模型[10]。然后建立自變量與因變量的二元回歸模型,通過SPSS軟件可得各個(gè)變量之間回歸的模型擬合度,即x1與x2,x3,x4,x5之間的模型擬合度分別為0.999,0.998,0.998,0.999。可見,x1和x2變量集與x1和x5變量集的可決系數(shù)大于其它變量集,通過觀察兩者的系數(shù)表,發(fā)現(xiàn)后者的模型比前者更優(yōu),于是選用x1和x5作為新的回歸模型,以此類推,重復(fù)以上步驟,繼續(xù)進(jìn)行逐步回歸的變量引入,得出如下最終結(jié)果。

表6 逐步回歸后的系數(shù)表
如表6所示,所有的值均小于0.05,檢驗(yàn)通過。

表7 模型匯總表
a.預(yù)測(cè)變量:可支配收入,旅游人數(shù)數(shù)量,旅客周轉(zhuǎn)量,私人汽車擁有量。
如表7所示,R2=1,表明模型擬合度良好。

表8 方差分析表
a.預(yù)測(cè)變量:(常量),旅客周轉(zhuǎn)量,旅游人數(shù)數(shù)量,居民消費(fèi)水平,私人汽車擁有量,可支配收入。b.因變量:旅游收入
如表8所示,F(xiàn)值大于顯著水平,拒絕零假設(shè)。
以上結(jié)果是在剔除不顯著變量后得出的結(jié)果,F(xiàn)和t檢驗(yàn)都通過,且R2=1,得到新的回歸方程為:
y′=-38.144+0.044x1+1.082x3-0.007x4+
0.003x5
(2)
對(duì)于x4系數(shù)為負(fù)的原因進(jìn)行考慮,原因可能如下:首先私人汽車擁有量確實(shí)一直都在提高,但是提高的車數(shù)量并不代表車主會(huì)去旅游。其次,旅游是較高消費(fèi)支出的活動(dòng),有的家庭由于買了車所以可支配收入減少旅游支出減少,于是旅游收入可能降低。因此,x4系數(shù)為負(fù)就很正常。
將表1中數(shù)據(jù)分別帶入(1)式和(2)式,利用歷史數(shù)據(jù)檢驗(yàn)兩種模型的優(yōu)勢(shì),得到如下結(jié)果:
由表9可見,(1)式平均相對(duì)誤差為2.76%,遠(yuǎn)遠(yuǎn)小于(2)式,說明后者比前者更優(yōu)。于是采用逐步回歸后的模型進(jìn)行研究,從回歸結(jié)果可得出以下結(jié)論:
從回歸結(jié)果來看,旅游收入與旅游人數(shù),旅客周轉(zhuǎn)量,私人汽車擁有量以及可支配收入相關(guān)。其中,旅游人數(shù)數(shù)量和旅客周轉(zhuǎn)量對(duì)延安市旅游收入的影響較大,意味著旅游人數(shù)數(shù)量的多少將直接影響到延安市旅游收入的多少。旅客周轉(zhuǎn)量的多少也決定了旅游收入,因此延安市既要加大旅游投資,也應(yīng)該加大延安交通建設(shè),交通方便,旅客周轉(zhuǎn)量會(huì)增大,旅客人流量也會(huì)變大,延安市旅游人數(shù)數(shù)量會(huì)相應(yīng)增加,收入也會(huì)提高。

表9 結(jié)論檢驗(yàn)表
其次,私人汽車擁有量和居民可支配收入也對(duì)旅游收入有一定的影響,但效果不太顯著。原因可能是汽車私有量人數(shù)的增多導(dǎo)致居民消費(fèi)水平結(jié)構(gòu)變化,具體原因上文已經(jīng)分析過。而居民可支配收入是由居民決定的,具有隨機(jī)性和不可控制性,因此影響較小。