摘 要 由于缺乏足夠的觀測數據等原因,常規的區域經濟預測模型在我國難以獲得預期的預測效果.而貝葉斯向量自回歸(BVAR)模型將變量的統計性質作為參數的先驗分布引入到傳統的VAR模型中,能夠克服自由度過少的問題.以青海為例,本文建立了一個BVAR模型,并引入了全國GDP和中央政府轉移支付作為外生變量以描述國民經濟與區域經濟的聯系.樣本內和樣本外的預測誤差比較以及青海經濟增長轉折點的準確預測都表明BVAR區域經濟預測模型優于其他預測模型.
關鍵詞 BVAR; 預測; 區域經濟增長; 青海
中圖分類號 F222.3 文獻標識碼 A
Regional Economic Forecasting Model Based on the Bayesian Vector Autoregrssion:Evidence from Qinghai Province
WANGFei
(School of Economics, Minzu University of China,Beijing 100081,China)
AbstractBecause of insufficient data observations and other reasons, in China, the traditional regional economic forecasting models can not achieve theexpected forecasting results. The Bayesian Vector Autoregrssion (BVAR) model introduces variables’ statistical properties as parameter’s prior distribution in the traditional VAR model, solving the problem of lacking degree of freedom. Based onQinghai province’s empirical data, this paper illustrated the application ofBVAR model, in which national GDP and transfer payment from central authority were introduced as exogenous variables to reflect the economic linkage between national economy and regional economy. In-sample and out-of-sample forecasting error comparison and accurate forecast of the turn point of Qinghai economic growth show that the BVAR forecasting model outperforms other alternative models.
KeywordsBVAR; forecast; regional economic growth; Qinghai
1 引 言
區域經濟預測具有悠久的歷史,只要地方政府試圖管理經濟運行,就必須進行某種形式的預測.準確的區域經濟預測是提高政府管理效率、企業經營效率和個人投資效率的重要手段.長期以來,區域經濟定量預測以經濟計量模型為主.經濟計量模型預測區域經濟更像是對國民經濟預測的翻版,是根據宏觀經濟理論建立聯立方程組以描述經濟變量之間的內在聯系,然后估計參數并進行預測.該方法的優點是,以經濟理論為建模基礎,較易解釋經濟變量的變化方向和大小.但經濟計量模型的缺點也很明顯:方程組數量多,即使是小型的計量模型也通常含有20-30個方程左右,建模過程復雜;方程組數量多使得變量的預測誤差相互累積影響最終的預測效果;對于區域經濟預測而言,難以像預測國民經濟一樣,獲得地區間貿易、投資等重要數據.
從國外的預測歷史來看,經濟計量模型在20世紀70年代的滯漲時期預測效果不佳,建立在Box和Jenkins的單變量自回歸求積移動平均模型(ARIMA)[1]基礎上的現代時間序列分析逐漸興起.與經濟計量模型不同的是,時間序列分析模型較少依賴經濟理論,更多的是依靠數據自身的變化規律來預測.考慮到經濟變量之間的復雜聯系,Sargent和Sim提出了向量自回歸(VAR)模型[2-3].但隨著變量個數的增加,VAR模型中的參數迅速增加以致自由度消耗過快.
由于我國區域經濟歷史數據較短,特別是考慮到改革開放前后經濟結構發生了巨大變化,可利用的數據只能從1978年開始.而無論是經濟計量模型還是ARIMA和VAR模型,都要求大量的觀測數據以保證參數估計精度和預測精度.所以,傳統的區域經濟預測模型在我國很難獲得預期的預測效果.而Litterman提出的貝葉斯向量自回歸模型(BAVR)[4]利用變量的統計性質作為VAR模型參數的貝葉斯先驗信息在一定程度上克服了VAR模型的過參數化缺陷.因此,從理論上看,BVAR模型在我國區域經濟預測中具有廣泛的應用前景.
BVAR模型在國外區域經濟預測中的初步應用取得了一些成效.Dua和Ray利用BVAR模型預測了美國康涅狄格州的區域經濟運行情況,發現BVAR模型不論是短期還是長期預測,都會產生精確的結果[5].Puri等用BAVR模型預測了南加州地區就業情況,結果表明BVAR方法的預測精度要優于ARIMA和無約束VAR模型[6].國內學者也逐步開始使用BVAR模型進行一些經濟預測工作,如陳東陵,張思奇等對我國宏觀經濟增長的預測,方勇,肖爭艷等對我國CPI的預測[7-10],但國內應用BVAR模型進行區域經濟預測的極少.
本文以青海為例,建立了一個BVAR模型來說明其在區域經濟預測中的應用,并與包括ARIMA在內的其他預測模型相比較來評價BVAR模型的預測效果.預測誤差比較證實了BVAR模型在區域經濟預測中的可行性.本文內容分為以下四部分:第一部分簡要介紹了BVAR模型;第二部分是對建模的數據來源,變量選取和預測效果評價方法進行了說明;第三部分是各種模型預測效果的比較及BVAR模型關于青海2010-2015年經濟增長預測值;最后給出本文的結論.
2 BVAR模型基本原理
BVAR模型是在普通VAR模型基礎上發展起來的.考慮無約束VAR模型:
Y(t)=X(t)α+∑pj=1β(j)Y(t-j)+ε(t),
t=1,2,…T,(1)
其中,t表示時刻,p表示滯后階數.
Y(t)是K維隨機向量Y在時刻t的取值,是模型中的內生變量.
X(t)是K×Km階分塊對角矩陣,X(t)=x′(t)IK.其中x(t)是m維向量,是每個方程都具有的確定性部分,比如常數項或外生變量等.
α是X(t)的Km維系數向量.
β(j)是K維向量Y(t-j)的系數,是K維參數方陣.
ε(t)是K維隨機誤差項.假定ε(t)是同期相關的,但無序列相關: 假定VAR模型的滯后階數p足夠長以保證εt是序列無關的.
E(ε(t)ε′(s))=Σ,t=s,
0,t≠s.
從VAR模型式(1)可以看出,總共有K2p+Km個待估參數.即使需要預測的變量較少,也需要可觀的觀測值.因此,除非數據足夠多,一般情況下,VAR模型都面臨自由度較少,因而預測精度不高的問題.通過對參數施加一定的約束,比如減少滯后階數,或在個別方程去掉一些變量,可以有效地緩解自由度過少的問題.但從貝葉斯的觀點而言,這意味著預測者認為去掉的這些滯后項其系數為0的概率是100%,遺憾的是根本無法得知這種約束是否成立.
而Litterman以及Doan,Litterman和Sims提出的貝葉斯VAR(BVAR)[4][11]模型創造性地將預測者對βj的先驗信息與上述無約束VAR模型相結合從而解決了上述問題.因該方法首先在明尼蘇達大學和美聯儲明尼蘇達分行提出,又被稱為明尼蘇達先驗.明尼蘇達先驗中每個參數β(i,k,j)(方程組(1)中第i個方程的第k個變量的滯后j階系數)的先驗分布都假定為正態分布,所以每個參數的先驗分布僅取決于兩個參數,先驗期望μβ(i,k,j)和先驗方差s2β(i,k,j).而對某一參數先驗期望μβ(i,k,j)而言,與其相對應的先驗方差s2β(i,k,j)就表示預測者對該先驗期望的把握程度:s2β(i,k,j)越小,表示預測者對該先驗期望的把握較大;而一個非常大的s2β(i,k,j)表明預測者對該先驗期望沒有什么信心.
并不是單獨地確定各個參數的先驗信息,明尼蘇達先驗發展了一種方法,可以系統地對參數施加先驗分布.明尼蘇達先驗從數據的統計性質來確定參數先驗期望的取值.由于經濟時間序列數據經常表現出隨機游走的特點,明尼蘇達先驗根據這一特點認為模型系統(1)中的每個內生變量服從隨機游走的先驗分布,這時變量最佳預測值就是其上一期的取值.因此,明尼蘇達先驗中參數β(i,k,j)的先驗期望是
μβ(i,k,j)=1, 如果i=k,j=1,
0, 其他.(2)
即方程組(1)中第i個等式右邊變量i自身的滯后一期系數的先驗期望都是1,而其他滯后期的系數以及其他變量交叉滯后項的系數,先驗期望都是0.
先驗標準誤s(i,k,j)是通過下式來確定的.
sβ(i,k,j)=γ#8226;g(j)#8226;f(i,k)#8226;sisk. (3)
其中,si是第i個方程的單變量自回歸的標準誤,而si/sk的目的是消除Y中各變量不同單位對先驗標準誤的影響.
式(3)中f(i,k)是相對權重,是參數β(i,k,j)的標準誤相對于β(i,i,j)的標準誤(即方程組(1)中第i個方程中第k個變量系數的標準誤相對第i個變量系數的標準誤)的取值.f(i,k)的具體數值就構成了一個K維方陣.根據定義可知f(i,k)=1,即該K維方陣主對角線上的元素都是1.而非對角線上元素通常小于1,因從預測角度而言,變量自身的滯后項通常比其他變量的交叉滯后項的影響更大.
g(j)是依賴于滯后階數j的函數,表示β(i,k,j-1)的標準誤相對于β(i,k,j)的標準誤(變量滯后j-1期系數的標準誤相對于滯后j期系數的標準誤)的取值.通常認為,隨著滯后階數的增加,無論是變量自身的滯后項還是其他變量的交叉滯后項的影響都越來越小.所以隨著滯后階數的增加,參數所對應的先驗方差越小.明尼蘇達先驗中g(j)通常采用諧函數g(j)=j-d的形式,d的數值越大,先驗方差隨著滯后階數的增加衰減的越快,d的數值越小,衰減的越慢.
γ是確定所有系數先驗標準誤大小的一個參數.根據f(i,k)和g(j)的定義,可知γ實際上就等于每個方程中,變量自身滯后一期系數的先驗標準誤.
通過式(3),所有參數先驗方差s2(i,k,j)的設定就轉化為所謂的超參數γ、d和f(i,k)的設定上.
BVAR模型的估計可以使用Theil所提出的混合估計方法(mixed estimation)[12].估計BVAR模型需要預測者確定上述超參數取值.因為BVAR模型的主要的目是預測,因此,與其他模型不同的是,超參數的取值標準就是獲得最優的預測效果,而不是依賴于各種模型設定檢驗.超參數的確定實際上是一個類似柵格搜索的過程,在超參數取值范圍內搜索能夠獲得最優預測效果的取值.為此,通常將獲得的總樣本T分成兩個時期T1和T-T1.時期T1的數據用于估計BVAR模型和預測,T-T1的數據用于計算比較預測誤差并確定最終的超參數數值.
3 BVAR模型在區域經濟預測中的應用
3.1 數據來源、變量選取
本文用BVAR模型來預測青海省地區生產總值并比較各種模型的預測誤差以評價BVAR模型區域經濟預測效果.想要預測的變量是青海地區生產總值.根據經濟理論知道,地區生產總值、固定資產投資額、通貨膨脹率和社會消費品零售總額,這幾個變量之間相互影響,相互作用,適合用VAR模型來描述這幾個變量之間的聯系.青海作為中國西部地區的一個省份,經濟發展必然會受到整個國民經濟增長周期的影響.而且,作為中國較為落后的西部地區,少數民族集中的地區,青海每年都可獲得較為可觀的中央政府轉移支付.因此,全國GDP和中央政府轉移支付是青海經濟增長的重要驅動力,在BVAR模型中,將這兩個變量引入到模型中作為外生變量,以反映國民經濟與青海經濟的聯系.
本文使用的是1978年到2009年的年度數據.2008年及以前的數據來自《青海統計年鑒》和《新中國五十五周年統計資料匯編》,2009年的數據來自青海2009年統計公報.考慮到統計年鑒會根據經濟普查信息對已公布數據進行修正,以各年鑒中最新公布的數據為準.
為了消除價格的影響,將上述變量統一轉變為2000不變價的實際值.青海地區生產總值實際值根據青海生產總值指數計算得到,同時計算得到青海生產總值平減指數;固定資產投資實際值根據固定資產資產價格指數計算得到,1991年以前固定資產價格指數無記錄,用青海生產總值平減指數來代替;通貨膨脹率用前述計算得到的青海生產總值平減指數來衡量;社會消費品零售總額則根據青海消費價格指數進行平減;全國GDP實際值用全國GDP指數計算得到;中央政府轉移支付公開出版資料中無記錄,本文用地方財政一般預算支出與收入差額來近似地衡量,并用青海生產總值平減指數進行平減.因各變量均存在明顯的指數上升趨勢,對變量全部進行了取對數轉化.
3.2 BVAR模型超參數確定
預測效果是選擇評價模型的關鍵.在本文中,是根據超前5步預測值的賽爾U(Theil U)統計量來確定BVAR模型各參數.Theil U統計量是預測值的均方根誤差與隨機游走預測值t+s=yt的均方根誤差之比
Theils=1T-T1-s+2∑Tt=T1(yt+s-t+s)21T-T1-s+2∑Tt=T1(yt+s-yt)2,
s=1,2,3,4,5,(4)
其中,s是預測步長,t+s是t+s期的預測值.顯然,Theil U統計量是無量綱的.對于BVAR模型中的不同參數,Theil U統計量越小,預測誤差越好,預測精度越高.
首先把樣本按照2000年為界分成兩個時期
因西部大開發戰略為青海經濟快速發展提供了契機,所以選擇2000年作為分界點.,先根據2000年以前(含2000年)的數據進行超前5步預測,然后使用卡爾曼濾波法(Kalman Filter)[13]更新BAVR模型系數,再進行超前5步預測,.……直到2009年.最終,獲得了9個超前1步預測值,8個超前2步預測值,……,5個超前5步預測值.根據式(4)計算得到青海生產總值預測值的超前1步到超前5步預測的Theil U統計量,選擇BVAR模型超參數需要綜合考慮這5個Theil U統計量.預測期越長,即預測步長越長,預測精度越低,所以,不能簡單地計算超前5步Theil U統計量的平均值以評價總體的預測效果.但遺憾的是,也沒有任何理論指出每步步長應給予的權重,本文選擇的權重是:預測步長每增加1步,權重下降10% 盡管10%的選擇是任意的,但BVAR模型最優超參數取值對此較為穩健..
本文的BVAR模型使用RATS軟件估計和預測.首先對地區生產總值、固定資產投資額、通貨膨脹率和社會消費品零售總額這四個內生變量進行ADF單位根檢驗,結果表明均為一階差分平穩過程,所以本文使用前述的明尼蘇達先驗.BVAR模型的估計和預測需要確定內生變量滯后階數、外生變量滯后階數以及模型中的超參數值.考慮到自由度的原因,內生變量最大滯后階數設為5,外生變量最大滯后階數設為1,根據青海生產總值預測值Theil U統計量同時確定內生變量和外生變量最優滯后階數和各超參數取值.為了降低相對權重f(i,k)的搜尋時間,首先將其非主對角線上的元素設為0.5,因經濟理論表明這些內生變量之間是相互聯系、相互影響的,然后逐漸調整非對角線上的元素以得到最優的預測效果.最終確定模型中內生變量滯后階數為3階,兩個外生變量均為當期和滯后1期;超參數γ=0.1、d=1.4;相對權重f(i,k)非主對角線元素中,青海生產總值方程中均為0.8,而其他方程中均為0.5 除了青海生產總值方程中相對權重的取值對BVAR模型預測結果有明顯影響外,其他方程中的相對權重影響很小..
3.3 各類區域經濟預測模型預測結果比較
為了說明BVAR模型的預測效果,在表1中比較了BAVR、VAR和ARIMA三種模型2005~2009年間的樣本內預測的Theil U統計量.其中VAR模型根據赤池信息準則(AIC)和施瓦茨信息準則(BIC)選擇內生變量滯后階數為2階
當樣本為2007年及以后時,AIC和BIC準則均選擇4階滯后,但實際預測效果更差.,外生變量滯后階數同BVAR模型一樣,為同期和滯后1期.而ARIMA模型則根據青海生產總值的自相關圖和偏相關圖,系數t值、殘差檢驗、AIC數值確定為ARIMA(3,1,0)過程
ARIMA模型參數的確定可參見漢密爾頓[14]..從表1的Theil U統計量可以看出,BVAR模型的預測效果最好,從超前1步到超前5步,預測誤差都是最小的.而且,與Litterman(1980)的預測結果相似,BVAR模型預測期(步長)越長,相對VAR和ARIMA模型的預測效果越好.VAR模型和ARIMA模型的預測效果均不太理想.與BVAR模型相似的是,VAR模型預測期越長,相對ARIMA模型的預測精度越高.BVAR和VAR模型的這個特點可能是因為考慮到了經濟變量之間的聯系,而ARIMA是單變量模型.但ARIMA模型超前1步預測效果要遠遠好于VAR模型,這可能是VAR模型自由度過少所致.
注:Theil U統計量加權均值各步長權重設定為:預測步長每增加1步,權重下降10%.
在表2中進一步比較了幾種模型樣本外的預測效果.與樣本內預測的區別在于,樣本外預測時同期外生變量的取值使用的是其預測值,以模擬真正的預測過程.兩個外生變量全國GDP和中央政府轉移支付(地方財政收支差額)用單變量ARIMA模型加以預測.根據它們的自相關圖和偏相關圖,系數t值、殘差檢驗以及AIC數值確定分別為ARIMA(2,1,0)和ARIMA(0,1,2)過程.青海省社科院和發改委信息處每年定期發布對下年度宏觀經濟指標的預測結果,他們的預測模型主要是依賴于投資數據的乘數模型.為了便于同他們的預測結果進行比較,在表2中僅比較了2005~2009年間的超前1步預測誤差,并將水平預測值轉化為增長率.
從表2可以看出,BVAR模型在所有模型中預測誤差最小,除了2005年預測誤差較大外
對外生變量預測值的進一步分析發現,2005年中央政府轉移支付預測誤差較大,導致BVAR模型在2005年預測表現不佳.,其他年份預測較為準確.ARIMA模型預測效果在所有模型中僅次于BAVR模型,好于青海社科院和發改委的預測.VAR模型預測誤差最大,可能是因為自由度過小所致.而且,BVAR模型對于2009年的青海經濟增長轉折點的預測也更為精確.與表1中的樣本內超前1步預測值Theil U統計量相比較可以發現,BVAR模型樣本外預測誤差要小于樣本內預測誤差,這可能意味著對全國經濟增長形勢和中央政府轉移支付的預期會影響到青海實際經濟增長過程.從各模型預測效果比較中可以看出,BVAR區域經濟預測模型優于其他預測模型.
注:1)青海社科院的預測數據來自歷年的《青海經濟社會形勢分析與預測》[15]
2)青海發改委預測數據來自青海經濟信息網http://www.qhei.gov.cn/yjyyc/xxyyc/default.shtml,其中2006和2007年預測數據未給出.
3)為便于與表1比較,青海社科院和發改委的預測值的Theil U統計量是對青海生產總值取對數后計算得到的.
3.4 BVAR模型2010~2015年預測結果
在表3中,根據BVAR模型給出了青海2010~2015年經濟增長率的預測值.根據兩個外生變量的取值考慮了以下三種情況:1)全國GDP的預測值根據單變量的ARIMA(2,1,0)過程預測得到(平均增長率為9.735%);中央政府轉移支付以近五年平均增長率23.28%增長;2)全國GDP以8%的較低速度增長,中央政府轉移支付以近五年平均增長率23.28%增長;3)全國GDP以11%的較高速度增長,中央政府轉移支付以30%的較高速度增長.這三種情況可以分別看成是適中、低迷和高漲的外部經濟環境.從表3可以看出中央轉移支付對于青海經濟增長的重要作用,即使全國經濟增長形勢不很樂觀,但只要中央轉移支付維持較高的增長率,青海經濟也能夠獲得較快的增長.
4 結 論
常規的區域經濟計量預測模型以及ARIMA、VAR等現代時間序列分析預測模型都要求較多的觀測值,在我國區域經濟預測中難以獲得預期的預測效果.而在VAR模型基礎上發展出的BVAR模型既具有VAR模型的優點,又克服了VAR模型自由度消耗過快的問題.本文以青海為例,建立了一個BVAR模型來說明該模型在區域經濟預測中的應用.
各種模型的預測誤差比較表明,BVAR模型無論是樣本內預測還是樣本外預測,預測誤差都顯著地小于VAR、ARIMA模型以及青海省社科院和發改委的實際預測模型.BVAR模型對2009年青海經濟增長的轉折點預測也更為精準.這表明BVAR模型應用于我國的區域經濟預測能夠得到更佳的預測效果.區域經濟計量模型建模過程復雜,工作量大.即使是青海省社科院和發改委的較簡單的定量預測模型也需要收集大量的投資數據,而且有些數據是不公開的,預測過程較多依賴專家的經驗判斷.而BVAR模型建模過程相對簡單,參數和超參數的確定有明確的標準,因此,在我國區域經濟預測中有廣泛的應用前景.
參考文獻
[1] G BOX ,G JENKINS. Time series analysis: forecasting and control[M]. San Francisco:Holden-Day, 1976.
[2] T SARGENT. Estimating vector autoregressions using methods not based on explicit economic theories[J]. Federal Reserve Bank of Minneapolis Quarterly Review ,1979, 3(3):8-15.
[3] C SIMS. Macroeconomics and reality[J]. Econometrica, 1980,48 (1):1-48.
[4] R LITTERMAN. A Bayesian procedure for forecasting with vector autoregression[R].Working paper,Department of Economics, Massachusetts Institute of Technology,1980.
[5] P DUA, D J SMYTH. Forecasting US homes Sales using BVAR models and survey data on households’ buying attitudes for homes[J]. Journal of Forecasting,1995,14(3):217-227.
[6] A PURI, G SOYDEMIR. Forecasting industrial employment figures in Southern California: A Bayesian vector autoregressive model[J]. The Annals of Regional Science, 2001, 34(4):503-514.
[7] 陳東陵.走向2000年——采用向量自回歸方法進行宏觀經濟預測[J].數量經濟技術經濟研究.1996,(7):57-61.
[8] 張思奇,P#8226;M#8226;薩默斯.貝葉斯向量自回歸(BVAR)季度預測模型[J].數量經濟技術經濟研究,1998,(9):29-33.
[9] 方勇,吳劍飛.中國的通貨膨脹:外部沖擊抑或貨幣超發——基于貝葉斯向量自回歸樣本外預測模型的實證[J].國際金融研究,2009,(4):72-28.
[10]肖爭艷,安德燕,易婭莉.國際大宗商品價格會影響我國CPI嗎——基于BVAR模型的分析[J]. 經濟理論與經濟管理,2009,(8):17-23.
[11]T DOAN, R LITERMAN,CSIMS. Forecasting and conditional projection using realistic prior distributions[J].Econometric Reviews,1984,3(1): l-100.
[12]H THEIL. Principles of econometrics[M]. New York: Wiley,1971.
[13]R KALMAN. A new approach to linear filtering and prediction problems[J].Journal of Basic Engineering, 1960,82(series D):35-45.
[14]漢密爾頓.時間序列分析[M].靳云匯,等譯.北京:中國社會科學出版社,1999.
[15]青海經濟社會形勢分析與預測(2004~2005——2008~2009)[M].西寧:青海人民出版社.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文