摘要 本文基于四川省各地市州2010年第六次人口普查的相關數據,采用嶺回歸模型,對四川省各地市州產業結構變動對城鎮化的影響進行實證分析,結果表明:人均GDP對城鎮化的影響最大,其次是第二產業產值和第三產業產值,第一產業產值對城鎮化影響為負向。
關鍵詞 嶺回歸 產業結構 城鎮化 多重共線性
中圖分類號:F121 文獻標識碼:A
一、指標選取
本文主要探討的是四川省各地市州產業結構變動對城鎮化的影響,筆者選取第一產業產值(pri)、第二產業產值(sec)、第三產業產值(ter)和人均GDP(pgdp)作為產業結構的指標,數據來自2011年四川省統計年鑒;城鎮化的指標為城鎮化率(urba),數據來自2010年第六次人口普查。為了方便進行研究,對原始數據進行對數化處理。
二、模型選擇及多重共線性診斷
(一)模型選擇。
由于所研究的對象是多自變量單因變量,故采用多元的對數計量經濟模型,基本模型如下:
此類型模型由于自變量過多,自變量之間易產生相互作用,導致出現多重共線性,影響回歸結果的真實性。嶺回歸是解決多重共線性的一個方法,用損失精度的方法來解決多重共線性,對病態數據的耐受性遠遠強于最小二乘法。常用的是嶺跡圖,即嶺回歸系數關于嶺參數k的圖形)法,選用嶺跡趨于平穩、且回歸系數沒有不合理符號時的k值。
(二)多重共線性診斷。
變量之間多重共線性診斷需要用到方差膨脹因子、特征值、條件指數和方差比例等。當自變量的方差膨脹因子大于10時,表明自變量間存在嚴重的多重共線性。對最小二乘法建立的模型中的常數項及所有自變量計算主成分,若前面幾個主成分特征值數值較大,后面幾個較小甚至接近于 0,或其中幾個條件指數較大(大于 30),或某個主成分對2個或多個自變量的貢獻(即方差比例)均較大(大于0.5)時,則提示存在多重共線性。
1、多元線性回歸的參數估計與顯著性檢驗。
用最小二乘法建立三次產業產值、人均GDP對城鎮化率的多元線性回歸模型,同時進行顯著性檢驗,模型檢驗結果是: R2=0.814,即 81.4%的波動都可以用模型來解釋。方差分析結果:F=17.460,其相應顯著性水平P<0.0001。回歸模型具有顯著性意義,回歸系數及檢驗結果見表1。
表1 多元線性回歸的參數估計與顯著性檢驗
由上表可知,兩個自變量的回歸系數通不過t檢驗,所以自變量無統計學意義,且人均GDP回歸系數符號明顯與常規不符,自變量回歸系數的VIF有3個都大于10,說明自變量間存在嚴重的多重共線性。
2、多元線性回歸的共線性診斷。
進一步對多元線性模型進行共線性診斷,由表2得出,5個主成分特征值第1個最大,第2個較大,剩下的3個接近于0;第3、4、5個主成分的條件指數均大于30,第5個主成分的條件指數超過250,其相對應的自變量中一產產值、二產產值、人均GDP的方差比例均大于0.9,說明這些變量間存在多重共線性,可采用嶺回歸建立多元線性回歸模型。
三、建立嶺回歸模型
方程(2)中, Y為城鎮化率,X1為第一產業產值,X2為第二產業產值,X3為第三產業產值,X4為人均GDP。R2=0.77,調整后的R2=0.71,F=13.420,顯著性水平P<0.0001,括號內為t檢驗值。回歸模型中R2=0.77,表明方程擬合的優度高,其解釋力近80%。該回歸模型表明在2010年四川省各地市州第一產業產值每減少1個百分點,四川省各地市州城鎮化率就增加0.18個百分點;四川省各地市州第二產業產值每增加1個百分點,四川省各地市州城鎮化率就增加0.327個百分點;四川省各地市州第三產業產值每增加1個百分點,四川省各地市州城鎮化率就增加0.2144個百分點;四川省各地市州人均GDP每增加1個百分點,四川省各地市州城鎮化率就增加0.4182個百分點。
四、結果
由嶺回歸方程可以看出,人均GDP對四川省城鎮化的影響最大,為0.4182個百分點,其次是第二產業產值和第三產業產值,第一產業產值對城鎮化是負向的影響,也就是說,四川省各地市州第一產業的發展并不利于四川省各地市州城鎮化的發展,城鎮化的發展需要第二、三產業的發展作為重要支撐。□
(作者:四川大學法學院在讀研究生,法學碩士,研究方向:人力資源開發研究)
參考文獻:
[1]馬雄威.線性回歸方程中多重共線性診斷方法及其實證分析.華中農業大學學報:社會科學版,2008(2):78–81,85.
[2]張文彤.SPSS 統計分析高級教程.高等教育出版社,2004:92–93,114,128,130.