張婧婷+李亞鵬
摘 要:本文采用《2013年河南省統計年鑒》中各市生產總值和城鎮居民家庭消費支出的數據進行統計分析。首先運用統計軟件進行相關分析,找出數據變量之間的關系;接著運用聚類分析對各城鎮分類,利用因子分析提取公因子進行降維處理;最后對河南省城鎮居民家庭消費結構進行分析。
關鍵詞:城鎮居民家庭消費支出;聚類分析;因子分析
一、研究背景及目的
近年來全球經濟增長放緩,國內經濟發展面臨一些不平衡、不協調、不可持續的問題,多重因素導致中國經濟出現增速放緩跡象。拉動經濟增長的三駕馬車是“投資”“消費”“出口”。近年來,中國經濟從快速增長到現在的穩步增長,僅僅依靠政府、個人的投資及外貿出口是不夠的,“三駕馬車”均衡發展才能確保經濟的健康平穩發展。受西方經濟危機的影響及自身的影響,出口已經不能成為拉動中國經濟增長的主要動力,政府加大投資對經濟的發展只能起到暫時的作用,長遠來看是不夠的。隨著經濟的發展,我國居民消費水平逐漸上升,增加消費可以為經濟增長添加動力。消費是投資的前提,是需求的最終反映,是社會再生產的重要環節,是社會經濟活動的出發點和歸宿。河南是中華民族最為重要的發祥地和發源地,在此情況下,對河南各市城鎮居民家庭消費結構進行分析很有必要。
本文通過對河南各市生產總值及城鎮居民消費支出的指標進行分析,找出各個指標之間的內在聯系,為城市發展決策者提供政策建議。
二、研究方法
居民消費支出是指城鄉居民個人和家庭用于生活消費以及集體用于個人消費的全部支出,包括購買商品支出以及享受文化服務和生活服務等非商品支出。城鎮居民家庭消費種類可分為八大類消費,分別是服裝、醫療保健、商品服務、食品、家庭用品及服務、交通與通信、教育、文化娛樂服務。
采用數據分析方法主要有相關分析、聚類分析、因子分析等。
基本思路:首先使用相關分析、聚類分析等方法分析數據各個變量之間的關系,然后使用因子分析對影響城鎮居民消費支出的變量提取公因子,最后對各城市進行分類及排序。
三、實證分析
對國家統計局網站下載的數據,我們設置了共18個變量,分別是“省轄市”、“生產總值”、“第一產業”、“第二產業”、“第三產業”、“人均生產總值”、“工業”、“建筑業”、“消費性支出”、“服務性消費支出”、“食品”、“衣著”、“居住”、“家庭設備用品及服務”、“醫療保健”、“交通和通信”、“教育文化娛樂服務”、“雜項商品和服務”等。樣本是中國2013年河南省統計年鑒的相關數據。
A.相關分析。對幾個變量進行簡單相關分析,得出各個變量之間的相關性;控制其中一個變量,對其他幾個變量進行偏相關分析。相關分析結果顯示消費性支出與服務性消費支出、食品、衣著有很強的相關性;消費性支出與服務性消費支出、食品和消費性支出有明顯的相關性;家庭設備用品及服務與醫療保健有明顯的相關性;教育文化娛樂服務與醫療保健有明顯的相關性;食品與衣著、消費性支出有明顯的相關性;居住與服務性消費支出、食品、衣著沒有明顯的相關性;醫療保健與交通和通信沒有明顯的相關性。
B.聚類分析。聚類分析是研究(樣品或指標)分類問題的一種多元統計方法。類,通俗的說,就是指相似元素的集合。最終聚類結果,第一類中的城市有鄭州;第二類中的城市有洛陽、焦作、開封、許昌、三門峽;第三類中的城市有南陽、商丘、信陽、周口、駐馬店;第四類中的城市有平頂山、新鄉、安陽、漯河、鶴壁、濮陽。
C.因子分析。上一部分我們利用軟件來對各城鎮地區生產總值、消費性支出進行相關和聚類分析,把數據分了四類。但是由于各種變量不太利于具體經濟意義解釋,因此我們可以利用因子分析對構成城鎮居民消費性支出的各個變量提取公因子,對數據進行降維處理。通過降維處理,明確了每個因子。第一因子上包括醫療保健、教育文化娛樂服務、服務性消費支出、家庭設備用品及服務、居住,可命名為存量因子;第二因子包括衣著、消費性支出、交通和通訊,可命名為流量因子。因子分析后續分析:當我們對各城市在二個公因子的分析之后,就可以利用因子得分進行分類和排序。通過觀察可以看出,鄭州、洛陽、南陽、平頂山、新鄉、開封、焦作綜合消費能力較強。許昌、駐馬店、漯河、安陽、鶴壁、濮陽、周口、商丘、信陽、三門峽綜合消費能力較弱。
經過以上研究,我們可以從一種宏觀的視野下對河南省的城鎮居民消費支出情況有一個比較全面的了解,這對于河南省城市以后的發展有重要的借鑒和指導意義。同時,對于我們個人來說也是工作地選擇的重要參考。比如根據指標分析我們可以看出城市經濟發展靠前其消費支出也排在前幾名,消費支出比較靠前的城市在生活中面對的壓力可能比較大,對抗壓能力差的同學畢業以后可以選擇一些消費支出相對靠前的城市可能壓力會小點。另外,通過分析得到的結論對政府制定政策也有一定的參考意義。
四、結論
本文利用了多種統計學的方法對各地區進行了統計分析,加入了偏相關分析,這樣有利于控制其他變量的影響。利用因子分析對經濟綜合指標進行了降維處理,這樣就可以大大降低共線性的問題,并且利用各因子得分可以計算綜合成績,進而對各地區進行綜合排名,但是由于數據并不是太多,可能分析不是十分充分,這是本文的不足,有望在以后的數據分析中搜集更全面的數據,并且可以利用其他分析進行更多信息的提取。
作者簡介:張婧婷,河南大學數學與信息科學學院,數學與應用數學專業;李亞鵬,河南大學數學與信息科學學院,計算機科學與技術專業endprint