[摘要] 本文根據系統聚類分析的最小離差平方和法,利用SPSS軟件,通過浙江省11個地市的國民經濟主要指標,對處在不同經濟發展水平的各個地市進行聚類分析,從而將浙江省劃分為三個經濟發展水平不同的經濟區域,結果供有關決策部門參考。
[關鍵詞] 最小離差平方和法 主要經濟指標 聚類分析
聚類分析又稱群分析,是多元統計分析中研究樣本或指標的一種主要的分類方法,起源于考古分類學。隨著經濟和社會的發展,結合了更為強大的數學工具的聚類分析方法已經越來越多應用到經濟分析和社會工作分析中。在經濟領域中,主要是根據影響國家、地區乃至單個企業的經濟效益、發展水平的各項指標進行聚類分析,然后根據分析結果進行綜合評價,以便得出科學的結論。聚類分析的方法主要有兩種,一種是“快速聚類分析方法”(K-Means Cluster Analysis),另一種是“系統聚類分析方法”(Hierarchical Cluster Analysis)。本文將根據2004年浙江省各市國民經濟主要指標,利用系統聚類的Ward’s Method,對浙江省11個市進行分類。
一、聚類方法簡介
系統聚類法(hierarchical clustering method)是使用最多的一種聚類方法。它的基本思想是:
1.將全部n個樣品各看成一類,即得到n類;
2.確定樣品與樣品和類與類之間的距離;
3.計算各類之間的距離,并將距離最近的兩類合并為一類,形成一個新的類;
4.重復步驟3。這樣從有n類開始,每次合并一類,經過n-1次合并后,所有的樣品成為一類;
5.將上述合并的全部聚類過程用一個直觀圖形畫出來,即畫出聚類圖;……