王 越
(山西財經大學 山西 太原 030006)
使用SPSS的聚類分析功能對山西各地級市進行經濟區劃分
王 越
(山西財經大學 山西 太原 030006)
對山西省十一個地級市進行經濟地理分區,首先建立分類指標體系,然后查得五個指標的數據進行正規化轉化,最后利用SPSS進行聚類分析得出結論。
山西省;地級市;SPSS;經濟區劃分
經濟地理研究中,經常需要對所研究的區域進行經濟區劃分,以便進行分類指導。如何進行經濟區劃分呢?利用世界著名統計軟件SPSS的聚類分析功能,效果比較理想。聚類分析包括的內容很廣泛,可以有系統聚類法、動態聚類法、分裂法、最優分割法、模糊聚類法、圖論聚類法、聚類預報等多種方法,其中應用最為廣泛的是系統聚類法。它的基本原理是:首先將一定數量的樣品(或指標)各自看成一類,然后根據樣品(或指標)的親疏程度,將親密程度最高的兩類進行合并;然后考慮合并后的類與其他類之間的親疏程度,再進行合并;重復這一過程,直至將所有的樣品(或指標)合并為一類。
(一)確定分類指標
進行經濟區劃分,應考慮的指標因素是多種多樣的。既要以經濟因素為主,又要適當考慮自然因素和社會因素;既要有直接指標,又要有間接指標;既要有影響經濟發展的指標,又要有經濟現象引起的指標;既要考慮經濟發展的現狀,又要考慮經濟發展的過程和經濟發展的未來方向;既要有可以查閱到或計算出確切數據的指標,又要有無確切數據的指標。
參考有關資料,結合專家意見,確定了對山西省各地級市進行經濟區劃分的指標:地區生產總值、GDP增長率、水資源總量、城鎮居民人均可支配收入、農村居民人均純收入。
(二)轉換指標數據
由于五個變量量綱的數量水平不同,為使各個變量更具有可比性,有必要對數據進行轉換。目前進行數據處理的方法大致有三種,即標準化、極差標準化和規格化。為便于更直觀的比較各市之間同一指標的數值大小,采用規格化轉換方式。其計算公式為:
公式中x'i為正規化后的值,xi為原值,xmax為最大值,xmin為最小值。
進行正規化轉換后,0≤x'i≤1。

表1 山西省各地級市聚類分析數據
根據表1數據,利用統計分析軟件SPSS對山西省各地級市進行聚類分析,得出如下結論,包括表2和圖1。
(一)解析表

表2 聚為4類時的個案歸類表
從表4可以看出,聚為4類時,太原市為一類,運城市為一類,晉中市、晉城市、長治市、大同市、朔州市和陽泉市為一類。
(二)解析圖

圖1清晰地表示了聚類的全過程。它用逐級連線的方式連結性質相近的個案或新類,直至并為一類。在該圖上部的距離標尺上根據需要選定一個劃分類的距離值,然后垂直標尺劃線,該垂線將與水平線相交,則相交的交點數即為分類的類別數,相交水平連線所對應的個案聚成一類。
對山西省各地級市進行經濟區劃分,究竟劃為幾個區合適,既不是越多越好,也不是越少越好。劃分經濟區的目的,就是要根據各經濟區特點的不同,分類指導經濟活動,使人們的經濟活動更加符合當地的實際,使各經濟區能充分發揮各自自然、經濟、社會等方面的優勢,做到揚長避短,趨利避害,達到投入少、產出多,創造良好的經濟效益和社會效益之目的。分區太多,就失去了分區的意義;分區太少,則分類指導很難做到有的放矢。綜合各方意見,我認為分為四類比較合適。
從聚類分析可以看出,長治市和晉城市的相似系數最大,最早聚合,明顯為一類;呂梁市和臨汾市相似系數較大,劃為一類;然后忻州市也劃入了這一類;長治市和晉城市并且一類后又與朔州市聚為新的一類,這表明長治市和晉城市之間的相似性要大于與朔州市之間的相似性,事實也正是如此,畢竟朔州市在北邊,無論是經濟發展水平還是資源蘊藏、產業結構等,朔州市與長治市、晉城市都有些許差別;然后又與晉中市和陽泉市并為一類;最后大同市也并入這一類,說明這六個市的經濟發展水平比較接近;十一個市中,太原市最為特殊,作為山西省的省會城市,太原從經濟發展水平、發展速度、產業結構等各方面都領先于其他市,難以與其他市成為一類,故自成一類;運城市由于地處山西最南邊,發展情況較特殊,也自成一類。
[1]PASW使用手冊
[2]山西省統計局.山西統計年鑒
[3]山西省地圖.中國地圖出版社
王越(1993-),女,漢族,山西河曲人,碩士研究生,山西財經大學管理科學與工程學院,研究方向為網絡治理與組織創新。