摘要:基于1985~2010年中國普通高校與普通高中在校學生數據,建立了中國普通高校在校學生人數的發展趨勢的ARIMAX模型。利用該模型對未來中國高校在校學生人數進行了預測,結果顯示:2011年之后,中國高校在校學生人數呈下降態勢,于2017年達到最低點,之后緩慢回升;至2017年,與2010年相比,高校在校學生人數減少約19.6%.
關鍵詞:普通高校在校學生;時間序列;ARIMAX模型;ARIMA模型
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2013)26-0133-02
隨著中國人口自然增長率的下降,中國學齡人口已呈現下降趨勢,這一點在歷年中國普通高中在校學生人數上已有表現。高中在校學生人數的縮減必將導致高校學生人數的減少,高校的生存與發展將會因此受到影響。同時,隨之而來的高校畢業生人數的減少,也會使大學生就業狀況呈現新的格局。作為高校教育的改革與發展策略的參考,建立高校在校學生人數發展趨勢的數學模型,科學地探尋其發展規律、預測其發展趨勢是十分必要的。本文對1985~2010年我國高中在校學生與高校在校學生數據進行了研究,建立了兩者之間的ARIMAX模型。使用EG兩步法,以SAS軟件為輔助對模型進行了檢驗,并對高校在校學生人數的發展趨勢進行了擬合。結果表明,模型簡捷,擬合情況良好。之后,利用該模型對2012~2019年中國高校在校學生發展趨勢進行了預測。
一、ARIMAX模型簡介
1976年,Cox與Jenkins采用帶輸入變量的ARIMA模型為平穩多元序列建模。模型的結構為:
y1=μ+■■Blixit+εtεt=■at (1)
模型(1)被稱為動態回歸模型,簡記為ARIMAX模型[1]。式中,Φi(B),Θi(B)分別為殘差序列自回歸系數多項式和移動平均系數多項式;{at}為零均值白噪聲序列。為避免虛假回歸的問題,模型(1)中要求輸入變量{x1t},{x2t},…{xkt}與響應變量{yt}之間具有協整關系。使用Engle-Granger兩步法對序列進行協整檢驗[1](簡稱EG檢驗)的一般步驟為:步驟1,建立響應序列與輸入序列之間的回歸模型。步驟2,對回歸殘差序列進行{εt}平穩性檢驗。
二、ARIMAX模型的建立
選取了1985年~2010年的中國普通高校在校學生人數為響應序列{yt},對應年份的高中在校學生人數為輸入變量序列{xt},使用EG兩步法對序列進行協整檢驗。首先建立兩者的回歸模型。利用SAS軟件,采用極大似然估計得到回歸模型為:yt=-488.1299+0.9395xt+εt (2)
對模型的殘差序列進行平穩性的單位根(ADF)檢驗,檢驗結果如表1所示。
根據類型1延遲1階和2階的檢驗結果,類型2延遲1階的檢驗結果,可以以95%以上的把握斷定殘差序列平穩,即可以以95%以上的把握認為高中在校學生人數序列對高校在校學生人數序列有協整關系,可以建立兩者的ARIMAX模型。根據SAS軟件輸出的輸入序列{xt}與響應序列{yt}的協相關圖,考慮對這兩個序列進行同期建模。此時得到的回歸模型即模型(2)。進一步考慮模型(2)殘差序列的自相關性,經試驗,確定使用ARMA(2,1)模型對其進行擬合。結合模型(2),輸入序列與響應序列的ARIMAX模型可構建為:
y1=β0+β1x1+εtεt=■at (3)
使用SAS軟件對模型(3)的殘差序列{at}作白噪聲檢驗結果如表2所示。
各延遲階數下檢驗統計量的顯著性P值都大于0.05,所以該模型是顯著有效的。
進一步用極大似然法估計模型參數并對每個參數的顯著性進行檢驗,根據表3的結果可以看出,模型的每個參數在0.05的水平下都是顯著的,根據輸出的估計值可得模型為:
yt=-425.0046+0.9041xt+εtεt=■at (4)
此即最終模型。該模型表明,高校在校學生人數隨著高中在校學生人數的變化有一個長期固定的線性趨勢,高中在校學生人數每增加1萬人,高校在校學生人數平均增加0.9萬人。同時它還受到諸多隨機因素的影響,隨機波動序列具有短期的自相關性。
三、序列預測
為預測未來高校在校學生人數,需要獲得輸入序列{xt}的新值。為此,對{xt}擬合ARIMA(1,2,0)模型:(1-B)2xt=■εt(5),將{xt}的預測新值輸入模型(4),可以得到序列{yt}未來10期的預測值與模型的擬合效果圖。
由圖1可以看出,模型(4)對高校在校學生人數序列的擬合效果是比較理想的;而由預測結果顯示,高校在校學生人數在未來5~7年有下降趨勢,但在2018年后又將緩慢回升。
根據ARIMAX模型(4)的擬合圖(圖1)與預測結果(表4),對中國高校在校學生人數的發展趨勢可作出如下推斷:高校在校生人數在2011年已達到頂峰,之后開始下降,到2017年降至最低,之后有回升趨勢;2012~2017年,高校在校學生人數以平均每年76.2萬人的速度減少;2017年與2010年相比,學生人數約減少19.6%;2017~2020年,高校在校學生人數以平均每年84.4萬人的速度增加,但在短期內難以達到如同2011年的頂峰值。
參考文獻:
[1]王燕.應用時間序列分析[M].北京:中國人民大學出版社,2008:211-231.
[2]汪遠征,徐雅靜.多元平穩時間序列ARIMAX模型的應用[J].統計與決策,2007,(9):132-135.
[3]國家統計局.中國統計年鑒2011[M].北京:中國統計出版社,2011.
[4]汪嘉岡.SASV8基礎教程[M].北京:中國統計出版社,2001:396-423.
作者簡介:彭娟(1980-),女,湖北嘉魚人,碩士生,講師,研究方向為統計學。