黃凱鑫+梁晨輝+黃新程



我們城市分為以下兩種類型:
a.發展中城市,擁有較大的人口增長率的內陸城市(Canberra);這種城市的特點是:社會公正體系不夠完善,經濟狀況不是特別理想。
b.發達城市,擁有較緩慢的人口增長率的沿海城市(Odense);通常情況下這種城市具有完善的社會體制、醫療保障體系、較為發達的經濟。
我們將建立多元線性回歸模型,以智能增長總分H(Task1)為因變量,政府的各項政策(Task2)為自變量建立回歸模型來研究最近幾年政府的各項政策對城市智能增長的影響。
一、模型建立
因變量:智能增長總分H;
自變量:城市人口(P)、人口增長率(PGR)、GDP、第三產業比重(T)、教育投入(EI)、文化產業投入(CI)、衛生機構個數(HI)、交通運輸投入(TI)、環境投入(ENI);
虛擬變量:地理位置(G) 1-沿海 、0-內陸。
根據所要研究的問題我們建立以下線性回歸方程:
H=?茁0+?茁1*P+?茁2*PGR+?茁3*GDP+?茁4*T+?茁5*EI+?茁6*CI+?茁7*HI+?茁8*TI
+?茁9*ENI+?茁10*G+∈
其中,∈滿足Gauss-Markov theory。
基于最小二乘原理建立線性回歸方程為:
從上表來看Adjusted R-squared達到0.87,說明方程擬合程度較好。對回歸方程進行顯著性檢驗,只有P(人口數量)、HI(衛生機構個數)顯著性不強,大部分回歸變量都是顯著的,說明我們建立的回歸方程是有意義的。計算各個變量的回歸擴大因子,以檢驗各個回歸系數之間是否存在復共線性:
由表1可以觀察到方差擴大因子都小于10,以此可以認為在這個模型中各個相關系數之間不存在復共線性。接下來采用逐步回歸的方法對回歸變量進行篩選,目的在于清除不顯著的變量,找出主要的影響因素。逐步回歸最終結果為:
對逐步回歸篩選后的線性回歸進行回歸診斷:
分析:
a.由圖Residuals vs Fitted可以看出,殘差值和擬合值是在0左右的隨機分布,因此,模型的因變量和自變量線性相關;
b.在圖Normal Q-Q中,點基本都分布在45度的直線上,滿足正態性假設;
c.Scale-Location圖中的點隨機分布在線的周圍,符合同方差假設;
d.在Residuals vs Leverage圖中對影響點進行分析,由結果可以看出,所用數據基本合理。
最后我們得到的回歸模型數學表達式為:
H=72.3652-1.6521*PGR+2.0365*GDP+1.2624*T+0.7581*EI+
0.8742*CI+1.9542*TI+1.7242*ENI+2.0352*G
二、制定計劃
從回歸模型的系數上我們可以看出城市智能發展指標受G(地理位置)、GDP(當地生產總值)、PGR(人口增長速率)、TI(交通運輸投入)、ENI(環境投入)的影響較大。因此根據這兩種不同類型的城市我們提出了不同的政策計劃使得該城市達到最大的智能發展指標:
(1)內陸發展中城市(Canberra)
政府應該盡可能增加當地的GDP,因為在回歸模型中,當G(地理位置)取0時(代表內陸城市),H受到GDP的影響最大,其次是TI(交通運輸投入)。也就是說政府在制定智能增長計劃時要將發展當地GDP和交通運輸放在重要的位置上。也可以這樣理解:對于那些內陸正處于發展中的城市,政府首要任務就是加大交通運輸投入這樣才能使該城市有更多的機會和外界進行商業貿易。
(2)沿海發達城市(Odense)
對于發達城市,其原本就擁有發達的交通運輸網,因此政府在制定智能增長計劃時應該更多地考慮教育投資(EI)、增加衛生機構個數(HI);文化產業投入(CI)在回歸模型中的系數比EI較大,說明對于沿海發達城市,政府在制定智能增長計劃時應該更多地考慮如何提高當地居民的生活質量,比如加大文化產業的投入(CI)就有利于豐富當地居民的精神文明,加大環境投入(ENI)可以使居民擁有更加舒適的生活環境,從而使城市發展更加智能。
三、增長計劃潛力排名
為了對之前提出的增長計劃中的各政策(initiatives)進行評估排序,找出最具有潛力的、潛力最小的措施(initiatives),我們的方法是基于Task3建立的線性回歸模型,利用主成分分析計算得出各個主成分的累計貢獻率,解釋各個主成分的含義。