◇王春
基于綜合主成分的部分省市城市設施水平研究
◇王春
城市居民對城市環境的要求日益劇增,所以就有必要研究一下我國部分省市的城市設施水平。本文以我國部分省市城市設施水平為研究對象,引據《中國統計年鑒—2014》中國部分省市的城市設施水平的數據,選取恰當的變量,據以統計分析做出綜合評價結果。
基礎設施;主成分方法
10.13999/j.cnki.scyj.2016.11.014
城市基礎設施是城市生存和發展所必須具備的工程性基礎設施和社會性基礎設施的總稱,是城市中為順利進行各種經濟活動和其他社會活動而建設的各類設備的總稱。它對生產單位尤為重要,是其達到經濟效益、環境效益和社會效益的必要條件之一。
城市經濟、市民生活的正常運行是以城市基礎設施為前提條件的。城市基礎設施中的供水、排水、網絡、燃氣、綠化、道路、交通、電力、通信等設施,都在城市的經濟生產中產生巨大影響。
1.主成分分析簡介
主成分分析也稱主變量分析,主要是運用降維的思想,在損失很少信息的前提下,用較少的指標來代替較多的指標,而這些較少的指標既綜合反映了原來較多的信息,相互之間又是無關聯的。
2.主成分分析法的計算步驟


(4)將標準化后的指標變量轉換為主成分

U1稱為第一主成分,U2稱為第二主成分,…,Up稱為第p主成分。
(5)對m個主成分進行綜合評價
對m個主成分進行加權求和,即得最終評價值,權數為每個主成分的方差貢獻率。
1.資料來源及評價指標選取
(1)數據來源
數據來自《中國統計年鑒—2014》(二十五、城市、農村和區域發展25-12分地區城市設施水平(2013年)),2013年分地區城市設施水平的數據來自國家統計局工作人員統計結果。
(2)評價指標選取
根據《中國統計年鑒—2014》選擇的樣本數據,選取如下六項指標作為分地區城市設施水平的評價指標體系。
城市用水普及率(%)用X1表示;
城市燃氣普及率(%)用X2表示;
每萬人擁有公共交通車輛(標臺)用X3表示;
人均城市道路面積(平方米)用X4表示;
人均公園綠地面積(平方米)用X5表示;
每萬人擁有公共廁所(座)用X6表示。
2.綜合主成分分析
(1)使用SAS軟件對相關數據進行分析
根據SAS程序得到的輸出結果,原始變量的簡單統計量的值和相關系數矩陣。主成分分析方法適用于變量之間存在較強相關性的數據,當原始變量之間存在較強的相關性的時候,運用主成分分析能起到很好的降維作用,即所得主成分濃縮原始變量信息能力差別不大。結果顯示X1,X2,X3,X4,X5之間均呈現正相關,且變量之間的相關程度均大于95%,運用主成分應該會有較好效果的。
由原始數據輸出結果給出了相關陣的特征值(Eigenvalue),特征值越多,它所對應的主成分變量包含的信息就越多。第 1個至第 6個變量主成分的貢獻率分別為 44.10%、22.92%、16.39%、10.56%、5.26%、和0.77%。
由輸出結果可知:前三個主成分的累計貢獻率達到83.41%。在通常情況下,選取主成分的個數以累計貢獻率達到85%以上為宜。83.41%累計貢獻率基本符合條件,即基本保留了原指標的信息。為使主成分的代表性更強,從而使綜合評價函數的結果更能接近實際,這里選擇前三個主成分代表整個指標體系,反映城市設施水平情況。
由輸出結果可以得到各個主成分的具體表達式如下:


第一、二和三主成分都是X1至X6標準化后變量(我們仍記為X1至X6)的線性組合,且組合系數就是特征向量的分量。下面考察一下每個主成分的具體含義:第一個主成分的系數全部為正,而且除了X4以外是所有系數均接近,因此可以作為城市設施水平的綜合指標。第二個主成分在X1、X6前的絕對值系數較大,分別為城市用水普及率和城市污水處理能力,因此可以看成是城市基礎設施中的用水系統能力。第三個主成分在X4前的系數較大,X4表示城市基礎設施水平中的人均城市道路面積,故此主成分可以用來描述城市道路人均占有情況。
(2)對相關數據進行分析
本文研究部分省市城市設施水平有6個指標,這6個指標有很強的相關性,通過主成分計算,我們可以選取三個主成分,這三個主成分具有明顯的實際意義,在第一主成分中變量的系數相當,所以第一主成分可以看成X1,X2,X3,X4,X5,X6的綜合變量,可以解釋為第一主成分反映部分省市城市設施水平。
根據以上對相關數據分析討論得知關于部分省市城市設施水平的主成分為F1、F2、F3,使用SAS程序可以得出F1、F2、F3三個主成分的主成分得分。
由SAS軟件輸出結果以及討論分析可知綜合主成分為:

綜合主成分得分見附表。
(3)結果討論
a.主成分分析結果分析討論
對于主成分分析的結果,根據輸出結果及相關分析可以知道第一個主成分可以作為解釋城市設施水平的綜合指標,第二個主成分可以看成是城市用水系統的綜合指標。第三個主成分可以用來表示城市道路人均占有率綜合指標。可以看出北京、天津、河北、上海、江蘇、浙江、福建等地區城市設施水平排在全國前列。分析內在原因,這些地區經濟發展均屬全國領先水平,經濟發展帶動了城市設施水平,最終相互影響、相互促進;用水系統綜合指標較高的是江蘇、安徽、山東、海南等地區。而上海、北京這兩個一線城市表現就比較糟糕,而內蒙古的地域寬廣,形成一個天然的緩沖帶,所以即使沒有優良的排水系統也可以有很好的表現。
b.綜合主成分結果分析討論
由以上討論結果可以看到按照綜合主成分得分排序后,北京、上海等一線城市城市設施水平綜合指標排名靠前,江蘇地區排名第一,另外一些沿海城市的排序也比較靠前,而西部(引自百度百科:中國西部地區包括重慶、四川、貴州、云南、廣西、陜西、甘肅、青海、寧夏、西藏、新疆、內蒙古等十二個省、市和自治區。土地面積681萬平方公里,占全國總面積的71%)欠發達地區的城市設施水平排名靠后,這與實際情況也比較接近。究其原因,首先,江蘇地區近年來在經濟發展和城市建設方面取得了較好的成績,所以城市設施綜合指標水平力壓北京、上海一線城市,成為第一。其次,北京、上海等一線城市,由于有大量的農民工涌入,造成城市較為擁擠,且城市基礎設施人均占有率低。最后,西部地區經濟較為落后,城市設施水平較低,不過西部地區具有廣泛發展產業的資源、地域寬廣等優勢,因此城市經濟有著較好的發展前景,城市基礎設施也有較大的發展機會。

附表 綜合主成分及排序
[1]潘勝強,馬超群.城市基礎設施發展水平評價指標體系[J].系統工程.2007(07).
[2]劉俊昌.我國城市設施水平的綜合評價 [J].統計與決策. 2008(01).
[3]童其慧.主成分分析方法在指標綜合評價中的應用[J].北京理工大學學報(社會科學版).2002(01).
[4]王鑫鰲.論城市基礎設施的特點和作用[J].城市開發.2003 (09).
(作者單位:上海海事大學2015級應用統計專業)