謝珍珠 楊潤高



本文首先利用ARIMA模型對1990-2015年中國老年人口數量的時間序列數據進行分析,預測中國老年人口數量的發展趨勢,然后建立我國老年人口數量與我國社會保障支出的模型,通過ARIMA模型預測的老年人口數量,預測我國財政在未來社會保障上面的支出。
中國老年人口 ARIMA
社會保障支出 協整 預測
聯合國在1956年確定的《人口老齡化及其社會經濟后果》
中的規定,當一個國家或地區65歲及以上老年人口占總人口比例超過7%,說明這個國家或者地區進入老齡化。根據國家統計局發布的數據,2016年我國60歲及以上人口為23086萬人,占總人口的16.7%,65歲及以是人口為15003萬人,占總人口的10.8%,遠超過7%,說明我國已經進入老齡化國家。通過對近30年中國老年人口數量的分析,并對未來幾年我國老年人口數量進行預測,老年人口數量影響到社會保障和就業支出,并提出相應的建議。
在人口方面預測的綜述
人口數量進行預測的方法有很多,有Leslie矩陣方程法(黃健元,2010),有年齡移算法(蔣遠營,2012),灰色預測模型(張榮艷等,2013),有Logistic模型法(閻慧臻,2008),有神經網絡預測(畢小龍等,2004),還有VAR模型(呂盛鴿等,2012),等等。而本文采用ARIMA模型,該模型同時考慮了時間序列的偏自會歸和自回歸特性,在預測時間序列方面,是一種很好的方法。
已有很多學者運用ARIMA模型進行人口序列的預測與研究,有的學者預測中國人口自然增長率(李頻等,2017),有的學者預測我國總人口(張諱等,2017),有的從人口出生率、死亡率和老年人所占比重方面進行分析(黃蘭,2015),有的學者對吉林失地人口進行分析(孫少巖等,2014)[],也有學者對我國某一個省份的老年人口進行預測(杜鑫,2016)。
但是運用ARIMA模型對我國老年人口總數進行分析與預測的文章并不多,并且只是對人口數量簡單的預測,而本文在對老年人口數量預測的基礎上,進一步研究老年人口數量和社會保障和就業支出的關系,進一步達到對社會保障和就業支出的預測,對我國財政支出具有重大的參考價值。
ARIMA(p,d,q)模型的建立與分析
(1) ARIMA (p,d,q)模型的基本原理
ARIMA(p,d,q)模型的形式是:▽dxt=Θ(B)/Φ(B)εt
其中▽d=(1-B)d,Θ(B)=1-θ1B-......-θqBq是平穩可逆ARMA(p,q)的移動平滑系數多項式,Φ(B)=1-ψ1B-......-ψpBp是平穩可逆ARMA(p,q)的自回歸系數多項式,{εt)是白噪聲序列。
當時間序列數據足平穩狀態時,ARIMA(p,d,q)模型變為回歸移動平均模型即ARMA(p,q)模型。當q=0,ARMA(p,q)模型變為平穩可逆p階自回歸模型AR(p),當p=0,ARMA(p,q)模型變為平穩可逆q階移動平均模型MA (q)。
實際問題中大多數的時間序列數據是不平穩的,所以需要對不平穩的時間序列數據進行差分處理,即確定ARIMA(p,d,q)模型中d的大小,然后確定p和q的大小。
(2)數據的來源和平穩性分析
本文選取1990-2015年中國老年人口數量的數據,如表一,數據來自國家統計局官網。首先利用eviews8.0做出人口數量的時序圖,得圖一。從圖一可以看出中國老年人口的序列X具有向上的趨勢,不平穩。對這26年的中國老年人口進行單位根檢驗,得到ADF統計值為1.61,均大于給定的顯著性水平為1%、5%和10%的臨界值,不能拒絕原假設,即原序列存在單位根,不平穩。
對數據進行一階差分處理,然后對一階差分后的數據做單位根檢驗,得到ADF的統計值為-6.07,均小于在顯著性水平為1%、5%和10%的臨界值,故拒絕原假設,中國老年人幾經一階差分后足平穩的。繪制一階差分序列的白相關和偏自相關圖,得到一階差分序列的自相關和偏自相關很快落人隨機區問內,序列趨勢已基本消除。所以ARIMA(p,d,q)模型中d為1,接下來就是確定p和q的值。
(3)模型的識別和估計
由上面的一階差分序列的自相關和偏自相關圖可知一階差分序列的自相關系數1階截尾,因此q=1,偏相關系數1階截尾,因此P=1,因此可選擇MA(1)、AR (1)、ARMA(1,1)模型擬合。又因為d=1,所以原始序列可選擇ARIMA(0,1,1)、ARIMA(1,1,0)和ARIMA(1,1,1)。分別對這三個模型進行估計,得到ARIMA(1,1,1)模型擬合最好,但因為常數項不顯著,故剔除,并且根據AIC和SC準則,剔除常數項之后的ARIMA(1,1,1)模型AIC和SC值最小,故最終模型為剔除常數項之后的ARIMA(1,1,1)模型。
(4)模型的檢驗
估計完模型之后,需要對模型的殘差序列進行白噪聲檢驗。得到剔除常數項之后的ARIMA(1,1,1)模型的殘差序列白相關和偏自相關的圖,經過檢驗殘差序列的自相關系數均落入隨機區問內,且自相關系數的絕對值都比較小,故殘差序列是純隨機的;另外Q統計量的P值大多數大于0.05,故可以近似的認為模型的殘差序列為白噪聲序列。
(5)模型的預測
利用剔除常數項之后的ARIMA(1,1,1)模型對2016-2020年中國老年人口數據進行預測,得到預測的65歲及以上人口在2016年為15190.02萬人,在2017年為15846.34,在2018年為16543.19萬人,在2019年為17283.07萬人,在2020年為18068.64萬人。
老年人口數與社會保障支出和就業模型估計
(1)數據的選取
根據表一,得到1990-2015我國社會保障支出的曲線圖,如圖二。從圖二可知,1990-2000年我國社會保障支出增幅較小,而從2000年之后社會保障支出大致呈線性增加的趨勢,故選取2000年之后的數據。
(2)數據的平穩性分析
對2000年之后的老年人口和社會保障支出的數據進行平穩性檢驗,為方便起見,把社會保障和就業支出變量命名為Y,把老年人口數量變量命名為X。經檢驗可知X序列和Y序列都是二階單整序列,因此X和Y序列可能存在協整關系,作兩變量之間的回歸,然后進行協整性檢驗。
(3)模型的建立與檢驗
以社會保障支出為被解釋變量,老年人幾數量為解釋變量,建立回歸模型。回歸方程如(1)所示:
Y=-27695.67+3.163674X
(1)
方程的調整之后的R2為0.981689,P值為0.0000,DW值為0.565737,在樣本容量n=16,k=1,顯著性水平為5%的條件下,DW值小于dl值1.106,故模型存在序列相關。對模型進行修正,修正之后模型為(2):
Y=-32411.40+3.545799X+0.669718AR (1)
(2)
模型的調整之后R2為0.992351,P值為較小,DW值為2.446720,調整之后n=15,在5%的顯著性水平下,du為1.361, 4-du為2.639,故調整之后的模型已不存在序列相關。
對模型進行殘差平穩性檢驗,模型殘差的ADF值為-5.658947,小于顯著性水平為1%臨界值-2.740613,故殘差序列是平穩的,則中國老年人口數量和社會保障支出之間協整關系成立。
(4)模型的預測
利用已經預測的2016-2010年的老年人口數據,帶人修正后的模型,對我國社會保障支出進行預測,得到預測的我國社會保障和就業支出在2016年為21453.71億元,在2017年為23779.45億元,在2018年為26249.38億元,在2019年為28872.21億元,在2020年為31657.25億元。
結論
本文通過建立ARIMA模型對我國老年人口數量進行預測,然后建立老年人口數量和社會保障支出的協整模型,達到對2016-2020年社會保障支出進行預測。由模型(2)知,從長期來看,我國老年人口數量每增加一個單位,社會保障支出增加3.545799個單位,預測的老年人口數量呈逐年增加的趨勢,故導致社會保障支出逐漸增加,到2020年,將達到31657.25億元,對我國政府決策提供參考。
[1]黃健元.基于Leslie方程預測的江蘇省人口老齡化特征分析[J].南京師大學報(社會科學版),2010( 03)
[2]蔣遠營.基于年齡移算法的人口預測[J].統計與決策,2012(13).
[3]張榮艷,馬艷琴,郝淑雙.殘差灰色預測模型在我國老齡人口預測中的應用[J].數學的實踐與認識,2013(08).
[4]閻慧臻.Logistic模型在人口預測中的應用[J].大連工業大學學報,2008(12).
[5]畢小龍,魏巍.基于神經網絡的我國人口老齡化趨勢預測[J].武漢理工大學學報·信息與管理工程版,2004(06).
[6]昌盛鴿,宣丹萍.北京市人口老齡化系數預測[J].統計研究,2012( 03).
[7]李頻胡明形.基于ARIMA模型的中國人口自然增長率預測[J].市場研究,2017(05).
[8]張祎朱家明.基于ARIMA和二次指數平滑模型的人口組合預測[J].牡丹江師范學院學報(自然科學版),2017(01)
[9]黃蘭.我國人口老齡化問題的分析與預測[J].成都紡織高等專科學校學報,2015 (4).
[10]孫少巖,逯家英,王化波.基于ARIMA模型對吉林省失地人口的研究[J].人口學刊,2014(04).
[11]杜鑫.基于ARIMA模型的陜西省老年人口數量的分析[J].社會視點,2016(24).
[12]王燕.應用時間序列分析[M].中國人民大學出版社,2012.
[13]國家統計局.[Z].(1990-2015).