宮雷



摘要:本文運用系統聚類分析方法研究我國農村居民消費結構,為進一步研究我國農村居民消費問題,優化農村居民消費結構并積極尋求有效對策提供了依據。
關鍵詞:因子分析 聚類分析 消費結構
一、引言
隨著我國經濟的快速平穩發展,對于消費問題的關注成為轉型期經濟研究的重點之一,而對于消費結構的研究因其變量較多、機理復雜、數據量很大,所以各種較新的數理實證方法在此領域中應用逐漸受到廣大學者的重視。傳統的實證分析一般停留在簡單地對各類指標進行年均增減等比對分析,隨著統計方法日趨完善,各類年鑒中統計指標逐漸細化,且有充足統計數據的時間段逐漸延長,對于同一指標的描述也從原來的單變量變為了多維變量,數據量大大增加,而刻畫描述的細化程度也越來越有利于我們對實際情況進行分析。可以說,單從各類數據角度出發,對類似于農民消費結構這樣的重大經濟問題,我們已經有了擺脫簡單實證分析的數據基礎。
聚類分析是根據已知的觀察數據,計算所觀察的各個樣品或變量之間親疏關系,再依據某種準則,使同一類內的差別較小,而類與類之間的差別較大,最終將所觀察的樣品或變量分為若干類的分析方法。本文以日趨完善的統計數據為基礎,運用系統聚類分析的方法研究我國農村居民消費結構,對于我國制定完善經濟政策,改善農村居民消費結構,促進消費水平,進一步提高農民消費質量有重要的意義。
二、建模基本思想及流程
系統聚類分析的基本思想是:對于位置類別的樣本或變量,依據相應的定義把它們分為若干類,分類過程是一個逐步減少類別的過程,在每一個聚類層次,必須滿足“類內差異小,類間差異大”原則,直至歸為一類,其基本步驟如下:
(1)對原始變量標準化并選擇度量樣品間距離的定義及類間距離的定義。
(2)計算n個樣品兩兩間的距離,的樣品間的距離矩陣D(0)。
(6)畫譜系聚類圖。
(7)決定分類的個數及各類的成員。
三、實證分析
(一)數據來源
本文數據來源于《中國統計年鑒》(2016年)。考慮到數據的可取性,依據我國常用的消費資料支出分類方法,按農村居民家庭平均每人生活消費現金支出去向分為食品、衣著、家庭設備及服務、交通通訊、文教娛樂及服務、醫療保健、居住、雜項商品及服務八個指標來構建居民消費價格水平的指標體系,避免了單指標的片面性,它們在人均生活消費總支出中所占的百分比分別記為X1,X2,…,X8。
(二)聚類分析
聚類分析是將一批數據的個案或者變量的諸多特征,按照關系的遠近程度進行分類。用原始變量進行聚類,由于變量數太多,變量之間的相關性較強,同時存在特異值,使得聚類結果不是很好,而采用因子分析的結果因子得分來進行聚類分析的結果則相對較好。關系遠近程度的定量描述方式不同以及利用的聚類方法不同,可以產生有差別的聚類結果,本文度量樣品間距離采用的是應用最廣的歐式距離,度量類間距離采用的是分類效果較好,基于方差分析思想的離差平方和法(Ward法),采用本文第二節介紹的聚類思想及步驟,可將31個樣本聚為3類,聚類結果表1所示:
四、綜合評價
從聚類的結果來看,表1中各類別所包括的城市數不同,從形式上不如人為分組整齊,但這恰恰反映了聚類分組的科學性,它避免了人為分組的主觀隨意性。
第一類是北京,上海、廣東,浙江等經濟發展水平很高的地區,這些地區的農村居民的衣著、交通和通訊、文教娛樂用品及服務、醫療保健等這幾個項目的支出比例是這3類中最高的,這些消費項目是已經超越于日常生活,必需品消費,因此這一類的農村居民生活水平是最高的。
第二類中的這些地區的農村居民的衣著、交通和通訊、文教娛樂用品及服務、醫療保健等這幾個項目的支出比例在所有的消費中占的比例也非常高,僅次于第一類中的幾個地區,農村居民的生活水平大部分已經達到了小康水平。
第三類中的地區的農村居民的生存性消費還是占主導地位,即食品、居住占主導,而精神消費、娛樂文化等消費欠缺,這一類中的農村居民生活水平已經解決了溫飽,正在向小康邁進。從分類中可以看出,生活水平較高的農村居民都是東部沿海經濟較發達的省市,而西南部欠發達省市的農村居民生活水平相對較低,這很大原因是各地區經濟發展不平衡,造成居民收入差異較大,使得貧困地區的居民可用于消費的資金不多,不敢消費。