牛?!≈袊嗣翊髮W經濟學院
?
美國進出口貿易總額預測方法簡化研究
——基于包含突變點的單位根檢驗及ARIMA模型
牛睿中國人民大學經濟學院
摘要:ARIMA模型是經濟學研究中一個重要的預測模型,并有多年的使用歷史。而單位根是否存在是該模型一個重要前提基礎。同時多數經濟數據由于結構性的原因,無法通過單位根檢驗,常常需要差分處理,這無疑增加了ARIMA模型的復雜程度?;诮陙淼慕y計分析理論,特別是包含突變點的單位根檢驗理論,簡化ARIMA模型復雜度。最后以美國1992年-2015年進出口貿易總額數據做了實證分析,結果比較滿意。
關鍵詞:ARIMA 突變點 單位根 進出口總額 預測
ARIMA模型是經濟學研究中一個重要的預測模型,并有多年的使用歷史。而單位根是否存在是該模型一個重要前提基礎。同時多數經濟數據由于結構性的原因,無法通過單位根檢驗,常常需要差分處理,這無疑增加了ARIMA模型的復雜程度。然而是否能通過一定的統計原理降低ARIMA模型復雜程度,進而進一步推廣ARIMA模型的使用范圍,有著一定的研究意義。
(一)ARIMA模型
ARIMA(Autoregressive Integrated Moving Average Model),由Box和Jenkins(1970)提出,用于時間序列的分析及預測。ARIMA模型通常表示為ARIMA(P,D,Q),其中參數P,D及q要求為非負整數,p為自回歸模型階數,d為差分階數,q為模型移動項數。ARIMA模型是Box-Jenkins方法中時間序列模型的重要組成部分。三個參數中兩個參數為零時該模型可縮寫為“AR”,“I”或“MA”。例如:ARIMA (1,0,0)是AR(1),ARIMA(0,1,0)是I(1),ARIMA(0,0,1)是MA(1)。ARIMA模型的基本思想是:將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現在值來預測未來值。ARIMA模型在經濟預測過程中既考慮了經濟現象在時間序列上的依存性,又考慮了隨機波動的干擾性,對于經濟運行短期趨勢的預測準確率較高,是近年應用比較廣泛的方法之一。
(二)BP檢驗
突變點(Outlier 或 Breakpoint ),其檢驗早期研究見于Chow(1960)基于F-statistic檢驗已知突變點及Andrews(1993)和Andrews and Ploberger(1994)推導出的Quandt極限分布及相關統計量檢驗。BP檢驗是近年來發展起來的用于檢驗多結構突變點的完備估計方法,包括突變點估計值的連續性、突變點次數檢驗以及對突變點置信區間的估計。Bai 和 Perron (1998)研究了在最小二乘數回歸模型中突變點的估算模型,其模型很好的估計了未知突變點及突變點數量。隨后Bai 和 Perron(2003)進一步討論了突變估算模型的實際應用,并完善了模型,模型在全局及局部突變顯示了著良好的估算能力。并且根據多種理論研究了置信區間斷裂日期問題以及整體數據中誤差估算問題。
(三)包含突變點的單位根檢驗(Unit root test with breakpoint)
ARIMA模型所依賴的的一個重要的前提就是數據能通過單位根檢驗,即是平穩的(stationary)。如果存在單位根,則需要考慮差分穩定(difference stationary)。單位根的存在表明經濟環境中的沖擊將帶來永久性影響,如果這樣在引入模型后其解釋能力會變得不理想。同時以往學者研究中發現多數宏觀數據是無法通過單位根檢驗。
最早有學者Nelson 和 Plosser (1982)對美國 14 個主要經濟數據做了單位根檢驗,其中13個數據都是非平穩的。而后Perron 首先對這一結論提出質疑:由于單一時間序列單位根檢驗的檢驗勢(power)較低,若時間序列數據是由一次結構變動的趨勢平穩過程產生的,則單位根檢驗可能會錯誤地接受存在單位根的原假設。Perron (1989)提出未考慮結構變化的單位根檢驗功效較低, 通過先驗信息選擇外生結構變化的單位根檢驗給出了完全不同的結論:絕大多數 (11/14)總量是分段趨勢平穩 (segmented -trend-stationary) 的 。但 Perron 的檢驗的一個缺陷是假定發生結構突變的時間已知,即將結構突變的估計外生化,Christiano 指出這很可能會導致單位根檢驗對原假設的過度拒絕。Zivot 和 Andrew (1992) 將結構斷點選擇過程內生化, 對Nelson 和 Plosser (1982)所選取的樣本重新進行了無條件單位根檢驗, 在漸近分布和有限樣本情況下, 近半數總量無法拒絕非平穩原假設。鑒于我們無法確定所考慮的區間只有一個結構變化 , Lumsdaine 和 Papell (1997) 將Zivot 和Andrew (1992)的方法擴展到兩個結構斷點的情形, 結果得出更多的總量是分段趨勢平穩的結論。
王琨等(2007)對中國9項宏觀數據進行了分析,其中7項(含中國進出口總額)在數據考慮突變點結構后顯示了非線性平穩性。
這里選取了美國商務部經濟分析局1992年-2014年進出口貿易總額數據(IDS0182 Census-based NSA)。美國進出口貿易數據來源有很多,選取BEA數據來源主要原因有二:一是該數據是目前知道少有以月為單位的,這樣能增加樣本總量,提高ARIMA模型預測準確度;二是該數據直接從商務部的普查數據匯總而成,沒有多余的二次調整,降低不可知數據調整對模型分析帶來的影響。數據匯總見圖(1):

圖(1)美國進出口總額1992年-2014年數據
數據取對數,然后引入單位根檢驗。在這里選擇使用ADF和KPSS檢驗。檢驗結果見表(2):

表(1)ADF及KPSS檢驗結果
根據上表所示,原始數據明顯具有單位根,無法通過平穩性檢驗,而數據一階差分結果通過平穩性檢驗。按照原有理論需對數據進行一階差分處理,然后再引入ARIMA模型。這里我們采用與以往不同的數據處理方法?;趫D(1),發現數據具有明顯的上升趨勢,以及多處劇烈波動(例如2001年2月、2009年3月附近。)于是假設數據含有突變點,使用BP breakpoint model進行檢驗。通過BP breakpoint model對數據進行突變點檢驗,表明存在突變。有學者基于Perron (1989),總結出斷點數據四種基本模型:
1 無趨勢的偏移的突變結構:

2 有趨勢的偏移突變結構:

3 有趨勢的偏移及趨勢突變結構:

4 有趨勢的趨勢突變結構:

借用Eviews9,基于以上四個基本模型對數據進行包含突變的單位根檢驗,其結果如圖(2)。檢驗假設為數據存在單位根,而P值表明數據拒絕原假設,R表明解釋程度較好。

圖(2)
將數據導入ARIMA模型,由于數據通過單位根檢驗,可以將ARIMA模型退化成ARMA模型考慮。進行自相關檢驗(ACF)及偏自相關檢驗(PACF)。圖(3)為檢驗結果。

圖(3)
根據圖形所示,結合一般性經驗,估計ARMA模型的(p,q)值為(1,0),從而ARMA模型退化為AR(1)模型。將數據引入并計算。
最后進行傳統ARIMA模型預測,由于數據無法通過ADF檢驗,ARIMA最后取值為(3,1,3)。圖(4)為兩次檢驗結果。從結果可以看出整體預測差異不大。

圖(4)
在美國進出口總額實例分析中,由于考慮包含突變的單位根檢驗,簡化了原有ARIMA模型,將原有ARIMA(3,1,3)模型退化為AR(1)。同時將結果對比也較滿意。在此方法推廣時也應該注意到,目前研究對同時處理多個突變點結果不是非常理想,可以考慮分段式處理方法。但是分段式本身也加大了模型的處理復雜程度與本文初衷相反。所以本文涉及的處理方法尚有不足之處,有一定的局限性。
參考文獻:
[1 ]Box, George; Jenkins, Gwilym (1970). Time Series Analysis: Forecasting and Control.
[2] Pierre Perron(2006).Dealing with Structural Breaks.
[3] Jushan Bai and Pierre Perron(1998).Estimating and Testing Linear Models with Multiple Structural Changes.
[4] Jushan Bai and Pierre Perron(2003).COMPUTATION AND ANALYSIS OF MULTIPLE STRUCTURAL-CHANGE MODELS
[5] 王琨,滕建州,石凱,(2012) 中國宏觀經濟和金融總量的非線性研究
[6] 李子奈,周建,(2005) 宏觀經濟統計數據結構變化分析及其對中國的實證
作者簡介:牛睿,中國人大學經濟學院實驗室,實驗室(中級)。