張敏新,喬吉良,何 朋
(1.南京林業大學 經濟管理學院,江蘇 南京 210037;2.深圳大學 管理學院,廣東 深圳 518060)
產出研究是經濟研究的一項重要內容。何新易[1]利用ARIMA模型對我國1952—2010年的總產出進行了建模與分析,預測結果認為未來5年我國的經濟增長仍將處于一個水平較高的上升通道;魏寧[2]以陜西省1952—2007年的國民生產總值為基礎,利用SPSS和Excel軟件對數據進行了時間序列分析,通過建立時間序列分析模型并對模型進行檢驗,綜合各種條件確定最終模型,最后利用建立的模型對陜西省未來6年的生產總值進行預測并取得了很好的預測效果;Andrew[3]、Michael等[4]研究了經濟時間序列中的趨勢和周期性因素、經濟和金融時間序列的非線性預測模型,認為利用時間序列模型構建經濟預測模型是可取的。
林業產出研究對判斷林業經濟形勢、衡量林業經濟運行趨勢,以及在林業經濟學科研究中都具有重要的作用。才琪等[5]研究了我國林業投資與林業經濟增長之間的互動關系,明確了我國林業投資在林業經濟增長中的地位與作用,為衡量我國林業投資利用效率提供了實證依據,在促進財政資源優化配置、提高資金使用績效的同時,推動了我國林業經濟增長,并且認為我國林業投資對林業經濟增長具有正向的推動作用。目前時間序列分析在林業學科中的應用已相當廣泛。彭勝志等[6]根據2004年7月到2009年9月我國林產品價格的歷史數據進行了統計分析,運用時間序列分析方法擬合隨機序列構建了ARIMA模型,同時對模型做了白噪聲檢驗,得到了很好的擬合效果,該模型可描述和預測林產品價格的動態變化狀況,為林產品價格分析提供了可供借鑒的方法;王曉婕[7]利用時間序列分析法的相關理論對1995—2009年我國家具制造全行業的總產值進行了建模分析,并建立了預測模型,使得到的實際數值與預測數值之間的誤差變得很小;林卓等[8]以閩西北杉木人工林為研究對象,利用ARIMA模型對杉木人工林蓄積量和碳儲量進行了擬合,取得了較高精度的擬合效果,同時獲取了有效的林分生長預測數據,得出了相關結論,認為基于現實林分調查數據的ARIMA模型對林分生長進行預測是值得嘗試和推廣的。
綜上所述,有關的林業經濟學者在時間序列模型的應用上主要是用于分析林產品價格和預測行業的產值變化,但并沒有將我國林業總產出的研究納入時間序列的研究框架內,也沒有對建立的模型做出更加科學合理的檢驗。本文嘗試將我國林業總產出的研究納入時間序列研究框架內,并對模型進行更加深入的檢驗,以期為我國未來林業總產出的預測提供了新的思路和方法。
時間序列模型源自于Box、Jenkins[9]提出的時間序列分析方法,主要利用隨機過程來研究經濟序列的內生性增長。本文嘗試將該方法引入到研究我國林業產出狀況,這種數學建模方法不考慮解釋變量的作用,也不以經濟理論為依據,而是依據變量本身的變化規律,利用外推機制描述林業產出的時間序列變化。
建立ARIMA(p,d,q)模型:本文擬建立ARIMA(p,d,q)模型。ARIMA(p,d,q)模型是由AR(P)過程、MA(q)過程經過d次差分之后得到的一個具有平穩性的自回歸移動平均過程[10]。所謂的平穩性是指一個隨機過程所產生的時間序列期望和方差在任何時間過程上都是常數,并且任何兩個時期的協方差僅僅依賴于這兩個時期的距離或滯后,而不依賴于計算這個協方差的實際時間[11],白噪聲過程就具有這種平穩性[12]。時間序列分析注重時間序列數據的平穩性。當時間序列非平穩時,一般通過差分或多次差分的方法使序列平穩后再建立時間序列模型[12]。
ARIMA(p,d,q)模型的推導與證明:首先,對一個p階自回歸過程AR(p)有:
=φ1Lyt+φ2L2yt+Λ+φpLpyt+ut
(1)
從而得到:
=Φ(L)yt
(2)
式中,φi(i=1,Λ,p)為回歸參數;ut為一個白噪聲過程[12](下同);定義L為滯后算子(下同);Φ(L)為自回歸特征多項式。
=(1-G1L)(1-G2L)Λ(1-GpL)…
(3)
根據式(2)、式(3)可得:
yt=Φ(L)-1ut
(4)


(5)


對一個q階移動平均過程MA(q)有:
=Θ(L)ut
(6)

類比式(4)有:
(7)
同理,根據式(5),可證明定理2成立。

從AR(p)模型和MA(q)模型到ARMA(p,q)模型,ARMA(p,q)模型的表達式為:
=Φ(L)-1Θ(L)ut
(8)
根據式(8)并且對yt進行d次差分,得到:
Φ(L)Ddyt=Θ(L)ut
(9)
式(9)即為ARIMA(p,d,q)模型的基本表達式,其中D為差分算子。
本文研究的數據來源于國家統計局網站,所研究的樣本區間設定為1952—2017年。利用EViews 8.0軟件繪制了中國林業產出yt的序列(圖1),顯然該序列不具有平穩性,故采用差分的方法對本文所研究的我國林業產出數據進行了兩次觀測,得到一階差分序列(Dyt=yt-yt-1)見圖2、二次一階差分序列(D(Dyt))見圖3。

圖1 林業產出yt序列

圖2 林業產出—階差分Dyt序列

圖3 林業產出二次—階差分D(Dyt)序列
根據式(9),ARIMA(p,d,q)模型中的d是我國林業產出序列yt經過一次或一次以上的差分變換后得到的平穩單積序列階數,因此采用單位根檢驗方法來檢驗序列的平穩性和求出模型中的d值。同時,本文對殘差序列進行了ADF單位根檢驗[13]。從圖1可知,1952—2016年我國的林業產出yt序列呈現出波動上升的趨勢。由于林業經濟產出作為國民經濟的一個重要組成部分,顯然隨著年份的增加,產出必然呈現出波動上升趨勢。因此,在做單位根檢驗時應把趨勢項考慮進去,檢驗結果見表1。

表1 檢驗我國林業產出序列的平穩性
林業產出yt序列以較大的P值(即100%的概率)接受存在單位根的檢驗結論,因此該序列不具有平穩性。對林業產出yt序列做一階差分,為消除趨勢性的影響,我們對差分采用公式Dyt=yt-yt-1進一步對林業產出Dyt序列進行ADF單位根檢驗,檢驗結果見表1。一階差分序列Dyt以P值為92%的概率接受了存在單位根的檢驗,該序列也不具有平穩性。再對yt做二次一階差分,即對D(Dyt)做進一步的ADF單位根檢驗,檢驗結果表明二次一階差分序列在1%的顯著性水平上拒絕了原假設,即接受了不存在單位根的檢驗結論。因此,林業產出yt序列是2階平穩的單積序列,即d的取值為2。
我們利用EViews 8.0軟件計算了林業產出D(Dyt)序列的自相關系數和偏相關系數,得到其相關關系和偏相關關系[10](表2)。根據表2,D(Dyt)序列的自相關系數有兩個峰值(k=2,3)和偏相關系數僅有一個峰值(k=2),并且兩者均呈現出快速衰減的特征,因此擬建立ARIMA(2,2,1)模型。

表2 Dyt序列的自相關系數(AC)和偏自相關系數(PAC)
我們對時間序列模型進行了檢驗[11,14],主要包括:①檢驗模型參數的估計值是否具有統計上的顯著性;②檢驗模型的殘差序列是否具有隨機性;③模型是否通過了AR函數的平穩性檢驗和MA函數的可逆性檢驗。根據EViews 8.0軟件對模型進行分析,得出相關結果見表3。

表3 時間序列分析相關結果
注:***表示P<0.01。

利用ARIMA(2,2,1)模型,對已觀測到的樣本數據進行數據擬合,擬合效果見表4。根據表4,擬合值和實際值之間具有趨于一致的變化趨勢。除個別的異常值以外,總體的殘差項圍繞零均值上下波動,且相對誤差較小,說明利用ARIMA(2,2,1)模型能很好地反應數據的真實情況,預測效果好。

表4 模型擬合效果
注:產出為名義產出,2017年林業產值官方數據尚未公布。
本文將時間序列分析引入林業產出的時間序列研究,通過對我國1952—2016年的林業總產出數據,利用ARIMA(2,2,1)模型進行了二次差分的擬合,擬合效果好,擬合的精確度較高,說明基于現實統計數據建立的ARIMA模型對林業產出預測是值得推廣的。今后在制定林業經濟政策需要參考前后年份的林業產出,采用時間序列模型來預測林業經濟產出具有可靠性。
與傳統的回歸模型相比,現實的經濟問題具有很大的隨機性,可運用隨機過程的原理,并利用差分變換使時間序列數據具有平穩性的效果,進而利用外推機制來建立ARIMA(2,2,1)模型,能很好地擬合和預測現實數據。利用時間序列分析建立的模型對未來3年的林業總產出進行預測,預測值分別為5093.26億元、5340.31億元和5728.14億元,說明未來幾年我國林業總產出會呈較好的發展趨勢。
由于通過ARIMA(2,2,1)模型所得出的預測結果只是一個預測值,而林業總產出的變化是一個復雜多變的動態系統,當國家的宏觀政策發生調整、環境發生改變時都會使林業經濟指標出現相應的變化,模型存在隨著預測時期延長預測誤差逐漸增大的缺陷,所以在實踐中應對模型進行調整,預測年份不宜過長[8],以確保得到最佳的預測效果。應隨時注意林業經濟乃至國民經濟運行中蘊藏的調整風險,政策制定者需要保持林業經濟政策調控的穩健性和連續性,并適時根據實際情況調整目標值。
本文僅對1952年以來我國的林業總產出數據進行了研究,未單獨考慮某個地區的產出情況,也沒有研究各個地區林業產出的共同性和差異性。在后續研究中,可通過對各地區的林業產出數據分別進行時間序列模型的擬合和對比,找出共同點和差異性。同時,本文并未考慮林業產出數據的季節性和周期性問題,如能解決這一問題,一定能對林業產出序列的發展變化規律做出更準確的結論。