摘 要 近年來,我國第三產業產值不斷增加,其原因涉及多個方面。影響第三產業的因素包括批發零售業、餐飲業、金融業、房地產業、交通運輸業、社會服務業和教育文化業等多個領域。本實驗主要將各個領域的相關指標綜合在一起進行主成分分析,降維處理后提取主成分,然后利用提取的主成分對第三產業增加值進行多元統計分析,從而研究主要指標對第三產業增加值的影響。選用了近9年的數據(2005~2013),包括批發零售業商品銷售額等一系列的經濟指標。研究發現,宏觀調控和消費者行為影響著第三產業的發展。
關鍵詞 第三產業 降維 主成分分析 多元回歸分析 宏觀調控 消費者行為
一、問題及背景
第一,背景。雖然我國的第三產業起步較晚,但隨著改革開放以來,我國社會主義現代化建設事業的蓬勃發展,我國以服務業為主導的第三產業擁有非常大的發展空間以及廣闊的發展前景。我國第三產業的產值在這樣的背景下增長迅速,2011年已經突破20萬億。第三產業產值增加的原因是多方面的,因素不同,對第三產業的影響也不同。
第二,問題。為了分析影響我國第三產業產值增加的因素,本文選取批發零售業、餐飲業、金融業、房地產業、交通運輸業、社會服務業和教育文化業七個行業的包括餐飲營業額、商品房銷售額、批發零售業商品銷售額、旅游總花費、貨運量總計、股票籌資額、社會融資規模、全國教育經費總投入、直接醫療救助支出九個指標。由于指標較多,本文利用主成分分析的降維功能提取主要的成分,然后在此基礎上進行多元回歸分析,利用主成分之間不相關的特點消除多重共線性的影響,使模型更為準確。
第三,原始數據來源:中國統計年鑒。
二、數據處理
(一)方法簡述
本實驗主要的應用方法是主成分分析法以及多元線性回歸。
主成分分析的概述:主成分分析是將多個變量通過線性變換以選取出較少個數重要變量的一種多元統計分析方法。其思想是將眾多具有一定相關性的變量重新組合成一組新的互相無關的綜合指標來代替原來的指標。
設F1表示原變量的第一個線性組合形成的主成分指標,即F1=a11X1+a21X2+... ap1Xp,由數學知識可知,每一個主成分提取的信息量可用方差來度量,方差Var(F1)越大,表示F1包含的信息越多。常常希望第一主成分F1所含的信息量最大,因此在所有的線性組合中選取的F1應該是X1,X2……XP的所有線性組合中方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來p個指標的信息,再考慮選取第二個主成分指標F2,為有效地反映原信息,F1已有的信息就不需要再出現在F2中,即F2與F1要保持獨立、不相關,用數學語言表達就是其協方差Cov(F1,F2)=0,所以F2是與F1不相關的X1,X2……XP的所有線性組合中方差最大的,故稱F2為第二主成分,依此類推構造出的F1、F2……Fm為原變量指標X1、X2……XP第一、第二……第m個主成分。
多元線性回歸概述:多元線性回歸是研究多個自變量因素對因變量的影響,解釋變量可以有多個因素,被解釋變量是一個因素,運用最小二乘法表可以求解多元線性回歸方程。
(二)操作過程
第一,錄入數據,將得到的數據錄入統計軟件SPSS。
第二,進行主成分的分析。首先計算累計貢獻率,通過累計貢獻率的計算結果可以看出因子分析的結果產生兩個因子,考慮到因子分析與主成分分析的聯系,在因子分析的基礎上可以進行主成分的分析。前兩個因子的累計貢獻率達到了98%,因此提取了前兩個,也就注定了會有兩個主成分。
求特征向量并對原始數據標準化后定義了兩個變量Z1、Z2依次進行計算:
Z1=0.36*Z餐飲營業額+0.35*Z商品房銷售額+0.35*Z批發零售業商品銷售額+0.35*Z旅游總花費+0.36*Z貨運量總計+0.01*Z股票籌資額+0.34*Z社會融規模+0.36*Z全國教育經費總投入+0.36*Z直接醫療救助支。
Z2=-0.01*Z餐飲營業額+0.07*Z商品房銷售額-0.09*Z批發零售業商品銷售額-0.14*Z旅游總花費+0.01*Z貨運量總計+0.96*Z股票籌資額+0.18*Z社會融資規模-0.04*Z全國教育經費總投入+0.00*Z直接醫療救助支。
第三,進行多元線性回歸分析。將第三產業增加值這一列進行標準化處理,得到的數據命名為“Z第三產增加值”。以標準化后的第三產業增加值作為被解釋變量,以提取好的標準化主成分作為解釋變量進行多元線性回歸分析:回歸關系Z第三產增加值=0.357*Z1-0.031*Z2-7.196E-17。
三、結果分析
(一)主成分分析
從主成分分析的結果來看,成分Z1是主成分綜合了各個指標作為第三產業增加值的反映。由于此處考慮單位不同的問題進行了標準化的處理,處理后的Z1按照數值進行排序是逐漸增大的,說明了我國與第三產業相關的各個指標在逐年增加,從2005~2013年有了一個較大幅度的提升。
Z2標準化后的主成分有正也有負,通過觀察主成分特征向量F2,可以看出是餐飲營業額、批發零售業商品銷售額、旅游總花費、全國教育經費總投入與其他指標的對比。而在特征向量中,直接醫療救助支出前面的系數為0。因此,Z2是以上四個指標與社會融資規模、貨運量總計、股票籌資額、商品房銷售額的對比。后四個指標反映的主要是宏觀經濟中投資、政府購買與貨幣政策方面的指標,說明的主要是在宏觀的驅使下中國經濟的發展走向。前四個指標則主要是消費者行為的反映、消費者的餐飲支出、日常批發零售支出以及旅游的支出,其中有一個是全國教育經費總投入,可以理解為消費者在教育上支出的發展趨勢。
總之,Z2主成分主要反映了宏觀經濟大趨勢與消費傾向的增加值之差。反映在最終的標準化數據上可以看出,兩者之間的差值略有波動,基本上相差不大;近期宏觀經濟消費一直略低于消費者消費。同時,說明消費者的消費近期呈現出上升的趨勢。
(二)多元回歸分析
多元回歸的結果可以看出:回歸關系Z從第三產增加值=0.357*Z1-0.031*Z2 -7.196E-17,Z1作為貢獻率較大的主成分回歸系數也是比較大的,說明了第三產業各個領域的各個指標對產業增長都有一定程度的推動作用,對第三產業的發展有積極的影響。相對而言,Z2前的系數為負,而近期經濟的繁榮導致消費的大幅度增加,個人消費的增長超過政府購買的增加,Z2成負數的趨勢在增加,但是系數較小,說明了第三產業的增長與消費以及宏觀的經濟支持同步進行。根據回歸方程,在未來,我國的第三產業仍然會穩步上升。
總之,第三產業的增加與消費、投資、政府購買等一系列經濟活動密切相關,同時宏觀經濟政策的變化也會對第三產業有影響。
(作者單位為山東科技大學)
[作者簡介:李林(1993—),男,山東濟南人,碩士研究生,研究方向:金融數據挖掘。]
參考文獻
[1] 陳勝可. SPSS統計分析從入門到精通[M].清華大學出版社,2010.
[2] 黨耀國,米傳民,錢吳永.應用多元統計分析[M].清華大學出版社,2012.
[3] 統計分析與SPSS的應用[M].中國人民大學出版社,2011.
[4] 俞梅珍.服務貿易總協定框架下中國第三產業的發展及對策[J].經濟參考研究,2000.endprint