摘要:人數預測的統計方法有多種,但利用ARIMA模型進行單指標短期預測工作,可以預測非平穩序列,對提高預測的準確性方面有比較明顯的效果。文章利用SAS軟件工具采用ARIMA模型對上海市第三產業從業人員進行預測,從預測結果來看,ARIMA模型用于上海市第三產業從業人數預測的理論和方法都是適用的。
關鍵詞:ARIMA模型;預測;第三產業從業人數
自從上世紀90年代以來,上海產業發展方針發生了重大變化,不斷進行從業結構調整,即從強化城市綜合功能、建設國際大都市一直到“三、二、一”產業發展方針,從而使產業結構實現了從適應性調整到戰略性調整的重大轉變。尤其是第三產業獲得了快速發展,其對上海經濟社會發展的深遠影響是巨大的。
具體表現在:從2010年開始,全市在業人口快速向第三產業轉移。按三次產業劃分,2010年第一產業在業人口占在業人口總數的比重為2.9%,第二產業占42.6%,第三產業占54.5%①。第三產業的長足快速發展,促進了上海市產業結構的進一步優化,且經濟運行質量也大大提高,使得上海的經濟穩定性大大增強,這在一定程度上減緩了經濟增長的波動幅度。這也使得上海經濟發展已進入相對穩定的增長周期;第三產業的快速崛起,使上海從原材料、產成品的集聚,發展到資金流、信息流的集聚擴散,城市功能定位發生重大變化,向著建設四個中心的目標前進;另外,第三產業成為了解決就業問題的主要渠道,為上海市的繁榮穩定奠定了堅實的基礎,同時,第三產業對于上海市的節能減排工作也大有幫助。因此預測未來上海市第三產業從業人數的變化,為上海市政府相關部門制定決策提供依據。
一般來說,大部分經濟變量在一定的時期內是相對穩定的,因此可以假設各經濟因素對預測指標的影響及這些經濟因素本身的變動趨勢是保持不變。因此,只要外推時間不長(具體多長,需要根據具體的預測項目而定),利用經濟變量的歷史數據進行預測是能夠能夠保證一定精度。本文將采用ARIMA模型對上海市第三產業從業人數進行短期預測,由于處理的數據較多,因此需要使用SAS軟件。
ARIMA與計量經濟其他預測模型相比,具有自身特點:ARIMA只考慮預測序列本身歷史數據,不需要直接考慮其他相互因素的變動,幾乎不直接考慮其他相關指標的信息;ARIMA預測方法簡單實用,適合用于指標數量不太大,但預測頻度較高的工作,而且其預測精度也能夠保證。
一、 ARIMA模型簡介
ARIMA模型全稱為差分自回歸移動平均模型。該模型是由博克思和詹金斯在70年代初所提出,這是在時間序列預測方法方面的重大創新,因此也稱為博克思-詹金斯法。其中ARIMA(p,d,q)稱為差分自回歸移動平均模型,AR是自回歸,p為自回歸項;MA為移動平均,q為移動平均項數,d為時間序列成為平穩時所做的差分次數。
ARIMA模型的基本思想是:將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現在值來預測未來值。具體思路是:
步驟一:識別。找出適當的p、d、和q值。通過相關圖和偏相關圖可以解決。
步驟二:估計。估計模型周所含自回歸和移動平均項的參數。有時可以用最小二乘法,有時候需要用非線性估計方法。(軟件可以自動完成)
步驟三:診斷(檢驗)??从嬎愠鰜淼臍埐钍遣皇前自胍?,是,則接受擬合;不是,則重新在做。
步驟四:預測。短期更為可靠。
其模型表達式如下:
設Xt是平穩隨機序列(EXt=0),且滿足下面的差分方程:
Xt+?漬1Xt-1+…+?漬pXt-p=?茲0?著t+?茲1?著t-1+…+?茲q?著t-q(1)
其中多項式
都是實系數多項式,Et是標準的白噪聲序列,Eεt =0, Eε2t =σ2,Eεtεs=σγ,其中γ=t-s,則稱{Xt,t =0,±1,…}為ARMA(p,q)序列,即自回歸滑動平均模型。
給定的時間序列,如隨機電報信號Xt,就可以利用編好的計算機軟件程序,對這些數據進行處理。首先要進行模型識別,即看序列Xt是否滿足自回歸滑動平均模型的要求。若Xt滿足要求,則可以確定模型的形式(即p,q的大 小)、估計參數?漬i,(i=1,...,p),?漬j,(j=1,...,q)等。然后就可以在一定的標準下(如估計形式線性與否、均方差最小等等)進行預測。
但ARMA(p,q)模型對時間序列的要求相對較高,它要求{Xt}是一個平穩的時間序列,即均值、均方差為常數,協方差只是時滯Γ的函數。而在現實生活中,尤其是對一些經濟變量,一般不滿足平穩性要求,而是呈現出明顯的趨勢性或季節性。對于這樣一些時間序列,我們無法直接利用ARMA(p,q)模型對其進行模擬,而需要進行簡單處理,即令:
Xt=μt+Yt
其中μt表示隨時間t變化的均值,而Yt表示零均值平穩過程,可以用ARIMA模型擬合。
所謂ARIMA方法就是通過某種處理,得到平穩序列Yt,然后對Yt計算出預測值,最后再反算推出Xt值的方法。
上式分別為一階差分,二階差分,……,D階差分,則我們可以做出下面的定義:若時間序列{Xt},經過D階差分后變為平穩時間序列,則稱{Xt}為ARIMA(p,d,q)序列。
對于ARIMA(p,d,q)序列{Xt},我們可以進行D階差分,Zt=?塄dXt然后利用ARIMA(p,q)模型對Zt進行擬合、預測,最后將擬合、預測結果經適當反算即可得到真正的預測值Xt。
二、 ARIMA模型預測的基本流程
ARIMA模型原理是:將預測對象隨時間變化而形成的數據序列視為一個隨機序列,用某個數學模型來表示這個序列。這個模型被識別后,從時間序列的過去值及現在值再來預測未來值。
ARIMA模型預測的基本流程:
(1)對序列進行平穩性識別。根據時間序列的自相關函數和偏自相關函數圖,利用ADF單位根檢驗其方差、趨勢及其季節性變化規律,實現對序列的平穩性檢驗。一般來講,經濟運行的時間序列基本都不是平穩序列。
(2)對非平穩序列進行平穩化處理。如果非平穩數據序列存在一定的增長或下降趨勢,則需要對數據進行差分處理,如果數據還存在異方差,還需要對異方差問題進行技術處理,直到處理后的數據的自相關函數值和偏相關函數值無顯著地異于零。
(3)建立相應的預測模型。如果平穩序列的偏相關函數是截尾的,而自相關函數是拖尾的,則可肯定序列適合AR模型;若平穩序列的偏相關函數是拖尾的,而自相關函數是截尾的,則可肯定序列適合MA模型;若平穩序列的偏相關函數和自相關函數均是拖尾的,則序列適合ARMA模型。
(4)進行參數估計,檢驗是否具有統計意義。
(5)進行假設檢驗,診斷殘差序列是否為白噪聲。
(6)利用已通過檢驗的模型進行預測分析。
三、 上海市第三產業從業人數預測實證分析
顯然,上海市第三產業從業人數不是個平穩序列,可以通過二次差分后得到平穩序列。所以可以選擇ARIMA模型進行預測。
本文使用SAS軟件,對1949年到2010年上海市第三產業從業人數進行時間序列分析,建立ARIMA模型,分析過程與結果如下:
令:
Renshu=上海市第三產業從業人數
Renshudif=上海市第三產業從業人數一次差分
Renshudif2=上海市第三產業從業人數二次差分
沒有差分前的自相關和圖自相關系數緩慢下降,可以看出該序列為非平穩序列,應當采用ARIMA模型進行預測。
從二次差分后自相關圖截尾可以看出二次差分后變為平穩序列。
從二次差分后,相關圖截尾偏相關圖拖尾以及上述各模型的檢驗結果中MA1,1的AIC值最小,T值的P-Value <0.001是顯著的,所有白噪聲檢驗數<0.05是通過檢驗的。可以采用ARIMA(0,2,1)模型。
所以該模型可以表示為:
Renshurif2(t)= 0.327504(1 - 0.86155 B**(1))B**(1):前一期白噪聲
根據軟件結果,上海第三產業從業人數的時間序列模型為:
Renshu(t)-2renshu(t-1)+renshu(t-2)=0.327504(1-0.861 55 B**(1)
2007年后 B**(1)=0
預測值為表1所示。
從表1可以看出ARIMA模型進行上海市第三產業往年從業人數預測值誤差比率都控制在7%以內,說明這種方法對于預測上海市第三產業從業人數是行之有效的。
下面對上海未來幾年的第三產業從業人數進行預測,預測結果如表2。
四、 結論
從模型預測的結果來看,ARIMA模型用于上海市第三產業從業人數預測的理論和方法是適用的。上海市第三產業從業人數是逐年上漲的,但漲幅并不是很急劇,這符合上海市的實際情況。2006年以來,上海市大量外資進入金融業、房地產業和其他服務業等第三產業,使本市的第三產業外資企業發展迅速,銷售收入和利潤也大幅增長。近10年來,上海市加快經濟結構調整轉型,實施三二一產業發展戰略,取得顯著成就,第三產業成為吸納就業最多的產業。2010年第三產業占54.5%,與上次經濟普查時相比第三產業則上升了11.9個百分點。上海服務業內部結構不斷優化,反映\"四個中心\"建設成效的城市綜合服務功能加快提升,第三產業已成為拉動上海經濟增長主動力。
注釋:
①根據第六次人口普查所獲得的數據進行的統計分析。
參考文獻:
1. (美)George E.P.Box,時間序列分析—預測與控制.北京:中國統計出版社,1999.
2. 王耀東等.經濟時間序列分析.上海:上海財經大學出版社,1996.
3. 高惠璇等.SAS/ETS軟件使用手冊.北京:中國統計出版社,1998.
4. 李勇等.基于乘積ARIMA模型的產品不確定性需求預測.系統工程與電子技術,2005,(1).
5. 黃宏等.溫州市三次產業從業人員需求量預測. 現代商業,2010(9).
6. 石美娟.ARIMA模型在上海市全社會固定資產投資預測中的應用.數理統計與管理,2005(1).
7. 上海市國民經濟和社會發展歷史統計資料(1949-2010).
8. 田金方,張小斐.干預ARIMA模型及其在我國人口總量預測中的實證研究.數理統計與管理,2007,(2).
9. 鄧偉,論ARIMA模型在廣東省第三產業預測中的應用,現代商貿工業,2010,(24).
10. 吳海軍.ARIMA模型在北京市全社會固定資產投資預測中的應用.經濟研究導刊,2007,(2).
11. 王春枝,吳靜.中國第三產業就業效應的實證分析.統計與信息論壇,2005,(3).
12. 萬平.Intervention-ARIMA模型在我國第三產業就業人數預測中的應用.統計教育,2009,(9).
基金項目:上海海事大學校級基金項目(項目號:2012 0122),上海海事大學重點學科項目(項目號:XR0101)。
作者簡介:李新偉,上海海事大學校長辦公室主任,上海海事大學經濟管理學院博士生;袁象,上海交通大學管理學博士,上海海事大學經濟管理學院副教授。
收稿日期:2012-07-17。