陳 侃 馬松林
(巢湖學院數學系,安徽 巢湖 238000)
基于主成分分析的安徽省各地區綜合評價探討
陳 侃 馬松林
(巢湖學院數學系,安徽 巢湖 238000)
全面科學的分析地區綜合經濟實力是合理制定地區發展政策和促進地區經濟協調發展的基礎.本文構建測度地區綜合經濟實力的指標體系,并運用主成分和系統聚類法分析了安徽省各地區綜合經濟實力,為科學制定地區發展政策提供了理論支撐.
綜合評價;主成分分析;系統聚類;累積貢獻率
安徽作為華東地區的重要組成部分,經濟一直保持著持續、快速的發展勢頭,經濟實力顯著增強,人民生活水平明顯提高,但各地區間經濟發展的不平衡性也進一步加大,如何準確地為安徽省各地市的經濟發展程度定位,也是一個關系到安徽省實施經濟發展戰略的重要問題.本文運用多元統計中的主成分分析法對全省各個地市的綜合經濟實力進行分析評價,系統、客觀地反映出安徽省地區間經濟實力的差距,希望能為促進地區間的優勢互補和良性競爭,為全面協調發展和提升安徽省綜合經濟實力,可以縮小地域差距,促進安徽經濟社會全面協調可持續發展.
地區綜合經濟實力是一個具有多角度、多層次、系統性的概念,隨著社會經濟的發展也在不斷發展和完善,評價一個地區綜合經濟實力的強弱需要通過多個指標的綜合分析和比較,因此,挑選的指標必須要全面反映所研究對象的主要特征,具有一定的評價和解釋功能,同時指標數據要從可信度大的機構或權威性刊物上獲得.基于以上分析,本文根據相關文獻選取了反映地區經濟發展水平、對外貿易水平、人民生活水平等情況共8個指標,構成評價綜合經濟實力的指標體系,見表1.

表1 綜合經濟實力指標體系
本文利用多元統計分析中主成分分析方法和聚類分析法把以上多個錯綜復雜的指標糅合成幾個正交的指標,再通過客觀賦權計算綜合得分,把各個地區分類加以分析.
2.1主成分分析的基本思想:是將彼此相關的一組指標變量轉化為彼此獨立的一組新指標變量,并且其中較少的幾個新指標變量就能綜合反映原來多個指標變量中所包含的主要信息,又各自帶有獨特的專業含義.它是一種數學變換方法,即把給定的一組變量通過線性變換,轉換一組不相關的變量(兩兩相關系數為0),在這種變換中,保持變量的總方差-方差之和不變,同時具有最大方差,稱為第一主成分;具有第二方差,稱為第二主成分,依次類推.
2.2 主成分分析基本步驟:
2.2.1 原始數據處理
根據指標屬性需要正向化處理,設原始變量指標 x1,x2,…,xi,…,xp的樣本觀察矩陣為 X,

2.2.2 建立變量的相關系數矩陣
假定標準化后的矩陣仍設X,求X的相關陣R=XTX, 求矩陣 R 的特征值 λ1≥λ2≥…≥λp≥0和單位正交化的特征向量 V=(V1,V2,…,Vp),令F=VTX=(F1,…,Fi,…,Fp),稱 F 為主因子矩陣,Fi=VTXa(1,…,p)為 i個樣本主因子觀測值.
2.2.3 確定主因子的個數m,建立因子模型,一般選取使得,這m個主因子將矩陣 V 分解為由 F=VTX 可得,X=VF=V(1)F(1)+V(2)F(2),其中V(1)F(1)為 m 個主因子所能解釋的部分,V(2)F(2)為含信息很少的殘余部分,設為ξ,這時有X=V(1)F(1)+ξ,上式稱為因子模型,V(1)稱為因子載荷陣,V(1)稱為主因子.
2.2.4 為了對主因子的實際意義有明確的分析和解釋,可對因子載荷陣V(1)進行最大方差正交旋轉或斜交旋轉.
系統聚類方法是實踐應用中最為廣泛的一種聚類方法,它的基本方法是首先按照被評價的評價指標體系特征,分別確定樣本(點)距離和類間距離,然后按照以下步驟進行分類.
(1)將被評價的n個個體看成n個類,這時類間距離與樣本間距離是相等的;
(2)按照預先確定的類間距離作為不相似性度量,并求出最小類間距離;
(3)將最小距離的兩類并為一類,并求出新類與其余類之間的距離,并選出最小類間距離;
(4)重復(3)步驟,直至所有類歸為一類;
(5)在所取類距離意義下,畫出按相似或相近程度的譜系圖;
(6)按綜合評價的精度要求,選出閾值,確定聚類結果并給出綜合評價的結果;
本文在聚類過程中,選用歐氏距離來度量類與類之間的相似程度,聚類方法采用最小距離法.
4.1本文選用2010年安徽省統計局公布的各指標的有關數據資料,對安徽省16個地市綜合經濟實力進行對比分析.首先對原始數據正向化處理,計算8個指標的無量綱數據相關系數矩陣(見表 2).

表2 指標間相關系數矩陣
從上表可以看出,指標間相關性較大,經KMO和Bartlett’s檢驗證明可以進行因子分析.
4.2 利用主成份分析綜合評價
對選取的8個指標,采用因子分析中的主成分分析法對相關系數矩陣進行初始因子求解,確定公因子數.得相關矩陣R的特征值、方差貢獻率和累計方差貢獻率(見表3).利用軟件對量化后的8個指標進行處理,得到8個主成分Zi(i=1,2,…,8).從表3可以看出,從第2個主成分起,已含原始數據的信息總量的94.44%,因此我們確定主成分個數為2個,且主成分具有典型經濟意義,Z1在各項指標上的載荷值均為正且相差不大,反映了地區經濟綜合實力,在此主成分上的得分越高,表明該地區的綜合經濟實力越強;主因子Z2在指標x4、x5和x6上的載荷值較大,這三個指標,反映了地區人民生活水平,這2個主成分較好的總括了原來的8項指標。用特征值歸一化后作為權值進行多指標綜合:綜合指標將主成份表達式代入,綜合指標的表達式:

表3 各指標的主成分、方差貢獻率以及累計方差貢獻率

利用綜合指標算出安徽省16個市的綜合得分,見表4。

表4 安徽省各地區綜合得分表

銅陵 0.15968蚌埠 0.12829黃山 -0.0876宣城 -0.0979滁州 -0.1404安慶 -0.1655六安 -0.291毫州 -0.3444宿州 -0.4036池州 -0.4279阜陽 -0.5369
從表4的綜合分析來看,明顯發現合肥作為安徽省省會城市,是全省政治、經濟、文化、信息、金融和商貿中心,全國重要的科研教育基地,擁有比相鄰城市更加優越獨到的區位資源優勢,因此在綜合得分方面遠遠超過了其它的城市.蕪湖、馬鞍山、淮南、淮北及銅陵名列安徽省前茅,它們由于自身發達的工業帶動著社會快速進步,正在加速前進著.安徽省的其它城市的綜合發展水平要遠遠低于前面這幾個城市,關鍵還是區位優勢不明顯,政策支持力度不夠.工業增長不夠強勁.經濟、政治、文化等方面要明顯落后于前面幾座城市.
筆者認為要想縮小安徽各個地區經濟發展差距,應著眼于加快在經濟欠發達地區推進重大基礎設施建設,打通制約其發展瓶頸硬件與軟件問題,并根據其區域特點切實加強產業布局的調整,走新型工業化道路;合馬蕪等經濟較發達地區在經濟儲備充裕的優勢條件下,加快從傳統工業產業向信息、服務外包、高科技科技產業轉型,注重生態建設與環境保護的同時能在政策上給經濟欠發達地區幫助.這樣有利于實施全省發展總體戰略,通過加快安徽省各地區的經濟發展,協調地區布局,提升了全省整體發展水平.
[1]林震巖.多變量分析——SPSS的操作與應用[M].北京:北京大學出版社,2007.
[2]余建英,何旭宏.數據統計分析與SPSS應用[M].北京:人民郵電出版社,2003.
[3]劉學家,陳世國.基于主成分分析的投資決策[J].運籌與管理.2006,(2).
[4]雷欽禮.經濟管理多元統計分析[M].北京:中國統計出版社,2002.
[5]韓娟.因子分析在評價綜合中心城市發展水平上的應用[J].北京統計,1998,(8).
[6]田曉文.中國地區經濟差距變化的三大趨勢及其成因初探[R].北京大學中國經濟研究中心討論稿系列.No.C1999017,1999-8.
0213
A
1672-2868(2011)06-0014-04
2011-09-26
巢湖學院院級自然科學研究資助項目(項目編號:XLZ-201005)
陳侃(1985-),男,安徽巢湖人。巢湖學院數學系教師,研究方向:多元統計
責任編輯:陳 鳳