王葉WANG Ye
(安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,蚌埠233000)
新中國(guó)成立以來(lái),我國(guó)人口總量持續(xù)增長(zhǎng),近年來(lái)雖然人口增速放緩,但人口問(wèn)題始終是中國(guó)的一個(gè)大問(wèn)題,人口基數(shù)多,人均耕地面積少,人均占有資源不足是我國(guó)的基本國(guó)情。從本質(zhì)上來(lái)說(shuō),人口問(wèn)題是發(fā)展問(wèn)題,會(huì)制約我國(guó)的發(fā)展。要有效控制人口增長(zhǎng),前提是要了解人口數(shù)量的變化規(guī)律,需要建立合適的人口預(yù)測(cè)模型,進(jìn)行較為準(zhǔn)確的預(yù)測(cè)。
國(guó)內(nèi)目前有很多學(xué)者采用不同的方法來(lái)預(yù)測(cè)中國(guó)的人口總量。涂雄苓(2009)分別利用指數(shù)平滑法和ARIMA 時(shí)間序列模型對(duì)中國(guó)人口數(shù)量進(jìn)行預(yù)測(cè), 并將二者的預(yù)測(cè)結(jié)果進(jìn)行比較,得出最優(yōu)預(yù)測(cè)模型是ARIMA(2,2,1)模型[1];韓紹庭(2014)運(yùn)用了多元線性回歸預(yù)測(cè)和ARIMA 預(yù)測(cè),發(fā)現(xiàn)多元線性回歸模型的預(yù)測(cè)精度更高[2];李利利(2014)在綜合考慮了自然資源、環(huán)境條件等因素的情況下,建立了Logistic 模型對(duì)中國(guó)人口進(jìn)行預(yù)測(cè)[3]。經(jīng)過(guò)學(xué)者不斷研究發(fā)現(xiàn),單一的預(yù)測(cè)方法存在著很多的缺陷和不足。Bates和Granger 在1969 年提出了組合預(yù)測(cè)方法,它是將各個(gè)單一預(yù)測(cè)方法看成一個(gè)個(gè)包含著不同信息的片段,通過(guò)將各項(xiàng)信息集成后分散單項(xiàng)預(yù)測(cè)的不確定性和減少總體不確定性,從而提高預(yù)測(cè)精度[4];陳華友和劉春林通過(guò)引進(jìn)誘導(dǎo)有序加權(quán)算術(shù)平均(IOWA)算子,這是一種以誤差平方和最小為準(zhǔn)則的組合預(yù)測(cè)模型,并給出了IOWA 權(quán)向量的確定的數(shù)學(xué)規(guī)劃方法[5]。該模型提出了一種新的賦權(quán)思想,根據(jù)各單項(xiàng)預(yù)測(cè)方法在各時(shí)點(diǎn)上的擬合精度的高低進(jìn)行有序賦權(quán),優(yōu)先給予預(yù)測(cè)精度最高的單項(xiàng)預(yù)測(cè)方法最高的賦權(quán)系數(shù)。
因此,為了更準(zhǔn)確的預(yù)測(cè)中國(guó)人口總量,本文采用基于IOWA 算子的組合預(yù)測(cè)模型對(duì)我國(guó)人口總量進(jìn)行預(yù)測(cè)。首先分別采用多元線性回歸模型、ARIMA 模型和二次指數(shù)平滑預(yù)測(cè)法這三種預(yù)測(cè)方法對(duì)中國(guó)的人口進(jìn)行單項(xiàng)預(yù)測(cè),然后建立基于IOWA 算子的組合預(yù)測(cè)模型來(lái)分析所建立的組合預(yù)測(cè)模型的優(yōu)越性。在此基礎(chǔ)上,使用IOWA 算子組合預(yù)測(cè)模型對(duì)我國(guó)未來(lái)五年的人口總量進(jìn)行預(yù)測(cè),以此來(lái)分析我國(guó)的人口總量及其增長(zhǎng)情況。

則稱函數(shù)fw是由v1,v2,…,vm所產(chǎn)生的m 維誘導(dǎo)有序加權(quán)平均算子,即IOWA 算子。其中v-index(i)是v1,v2,…,vm中按照從大到小的順序排序后第i 個(gè)大的數(shù)的下標(biāo),其中是加權(quán)向量,滿足。從上述概念中可以看出IOWA算子是對(duì)誘導(dǎo)值v1,v2,…,vm按從大到小的順序排序后所對(duì)應(yīng)的a1,a2,…,am中的數(shù)進(jìn)行有序加權(quán)平均,ωi與ai的大小和位置無(wú)關(guān),而是與其誘導(dǎo)值所在的位置有關(guān)。
選擇不同預(yù)測(cè)方法在各個(gè)時(shí)點(diǎn)上的預(yù)測(cè)精度作為該方法的誘導(dǎo)值,其中預(yù)測(cè)精度為:

其中,i=1,2,…,m;t=1,2,…,N,vit表示第i 種預(yù)測(cè)方法在第t 時(shí)刻的預(yù)測(cè)精度,xt為第t 時(shí)刻的實(shí)際值,xit表示第i 種預(yù)測(cè)方法在第t 時(shí)刻的預(yù)測(cè)值。此時(shí),m 種預(yù)測(cè)方法在t 時(shí)刻的預(yù)測(cè)精度與其預(yù)測(cè)值構(gòu)成了m 個(gè)二維數(shù)組:

于是,N 期總的組合預(yù)測(cè)誤差平方和S2為:


IOWA 算子組合預(yù)測(cè)法通過(guò)各單項(xiàng)預(yù)測(cè)法在各個(gè)時(shí)點(diǎn)上預(yù)測(cè)精度的高低按順序賦權(quán),并以誤差平方和最小為準(zhǔn)則建立組合預(yù)測(cè)模型,符合實(shí)際需要,所以本文采用IOWA 算子的組合預(yù)測(cè)模型。
筆者選取2000~2018 年之間24 年的全國(guó)總?cè)丝冢▂)作為被解釋變量,人均GDP(x1),城鎮(zhèn)化率(x2),初中畢業(yè)生人數(shù)(x3),城鄉(xiāng)收入差距(x4),人均受教育年限(x5)以及時(shí)間t 作為解釋變量。在導(dǎo)入數(shù)據(jù)后,利用R 軟件進(jìn)行多元線性回歸模型,逐步回歸后,剔除一些不顯著變量,最終得到如下回歸模型:

各個(gè)自變量的系數(shù)均通過(guò)顯著性檢驗(yàn),R2=0.9969,F(xiàn)統(tǒng)計(jì)量的值為32020,p 值為0,說(shuō)明在0.05 水平下回歸方程整體顯著。模型的預(yù)測(cè)值和預(yù)測(cè)精度見表1。(注:***表示在0.05 水平下顯著)
ARIMA 模型是以平穩(wěn)隨機(jī)序列為前提建模的,經(jīng)過(guò)對(duì)原序列以及各階差分?jǐn)?shù)據(jù)進(jìn)行ADF 檢驗(yàn)后,發(fā)現(xiàn)二階差分序列平穩(wěn),并通過(guò)觀察其自相關(guān)圖和偏自相關(guān)圖以及比較模型的R2,統(tǒng)計(jì)量t 和AIC 準(zhǔn)則,最后確定建立ARIMA(0,2,0)模型,模型的預(yù)測(cè)值及預(yù)測(cè)精度見表1。
指數(shù)平滑法是在時(shí)間序列統(tǒng)計(jì)模型的基礎(chǔ)上進(jìn)行預(yù)測(cè)的方法。指數(shù)平滑法分為一次指數(shù)平滑法和多次指數(shù)平滑法。一般情況下,運(yùn)用最多的是二次指數(shù)平滑法,其公式為:

對(duì)于以上三種模型的預(yù)測(cè)結(jié)果,選取2000~2018 年的預(yù)測(cè)數(shù)據(jù)建立組合預(yù)測(cè)模型。其中三種預(yù)測(cè)方法的各項(xiàng)預(yù)測(cè)結(jié)果如表1 所示。
由于要建立誘導(dǎo)(以預(yù)測(cè)精度作為誘導(dǎo)值)有序加權(quán)算術(shù)平均(IOWA)組合預(yù)測(cè)模型,將三種預(yù)測(cè)模型在樣本期(2000-2018 年)各時(shí)點(diǎn)按照預(yù)測(cè)精度由大到小的順序重新排列,得到預(yù)測(cè)精度最高、預(yù)測(cè)精度次高和預(yù)測(cè)精度最差的誘導(dǎo)預(yù)測(cè)模型對(duì)應(yīng)的預(yù)測(cè)值和預(yù)測(cè)精度,見表2。
根據(jù)各單項(xiàng)預(yù)測(cè)精度值和誤差,建立基于誤差平方和最小的組合預(yù)測(cè)模型,三種單項(xiàng)預(yù)測(cè)的誤差信息矩陣為:

使預(yù)測(cè)誤差平方和最小的誘導(dǎo)有序加權(quán)算術(shù)平均組合預(yù)測(cè)模型:


表2 按照精度從大到小排序的預(yù)測(cè)值與精度

表1 三種單項(xiàng)預(yù)測(cè)預(yù)測(cè)值與精度

利用LINGO11 解得最優(yōu)權(quán)重系數(shù)為:ω1=0.684,ω2=0.283,ω3=0.033。根據(jù)最優(yōu)權(quán)重系數(shù)及IOWA 算子組合預(yù)測(cè)模型,得出各年組合預(yù)測(cè)值見表1,以及各年組合預(yù)測(cè)值的預(yù)測(cè)精度見表2。
結(jié)合各單項(xiàng)外推預(yù)測(cè)計(jì)算出2019-2023 年的各單項(xiàng)預(yù)測(cè)值,再乘以各單項(xiàng)預(yù)測(cè)方法的最優(yōu)權(quán)重系數(shù)求和,即可計(jì)算出我國(guó)人口總量的后五年預(yù)測(cè)值,見表3。
由表3 可知,未來(lái)幾年我國(guó)人口仍在持續(xù)不斷地增長(zhǎng),到2023 年人口總數(shù)會(huì)達(dá)到142854 萬(wàn)人,從預(yù)測(cè)結(jié)果可以看出我國(guó)由于人口基數(shù)過(guò)大,短期一段時(shí)間內(nèi)人口仍呈增長(zhǎng)趨勢(shì),人口發(fā)展問(wèn)題仍是未來(lái)幾年的工作的重點(diǎn)。

表3 2019-2023 年全國(guó)人口預(yù)測(cè)值
本文在回顧誘導(dǎo)有序加權(quán)平均(IOWA)算子的組合預(yù)測(cè)模型的理論基礎(chǔ)上,首先分別采用了多選線性回歸模型、ARIMA 模型及二次指數(shù)平滑三種單項(xiàng)預(yù)測(cè)模型對(duì)我國(guó)2000-2018 年期間的人口總量,然后建立以單項(xiàng)預(yù)測(cè)法預(yù)測(cè)精度為誘導(dǎo)值,以誤差平方和最小為準(zhǔn)則的IOWA 算子的組合預(yù)測(cè)模型。預(yù)測(cè)結(jié)果顯示,由于我國(guó)人口基數(shù)較大,在未來(lái)的幾年中,人口依然處于持續(xù)增長(zhǎng)階段,中國(guó)在發(fā)展過(guò)程中的人口問(wèn)題依然是一個(gè)重點(diǎn)問(wèn)題。