李雄英, 陳小玲, 曾凱華
(1.廣東財經大學 統計與數學學院,廣東 廣州 510320;2.廣東省技術經濟研究發展中心,廣東 廣州 510070)
在股票市場,不少學者關心股價的變化和股價的預測,股價的不確定性變化往往又表現為市場的波動.由于股票收益率序列比股票價格序列能更好地體現股票市場的波動性,因此,在股票市場,對股票收益率進行建模預測相對于股票價格預測來說有著重要的研究價值.
預測的理論方法多種多樣.有的學者研究人工神經網絡預測模型、灰色預測模型、支持向量機預測模型等;有的學者研究時間序列方法,如ARIMA模型、ARCH模型;也有不少學者提出了一種組合預測模型,如ARIMA和SVM相結合的預測模型、ARIMA和BPNN組合的預測模型等[1].近年來,國內也有不少用ARMA模型、ARCH 模型和GARCH模型來研究時間序列數據變化和波動規律的成果.例如,吳玉霞和溫欣(2016)[2]運用ARIMA模型預測了股票價格變動的規律和趨勢,預測效果較理想.魯萬波(2006)[3]應用非參數 GARCH模型能較好地預測中國股市的波動性.王蔣鳳和吳群英(2011)[4]運用GARCH類模型對滬深300指數序列的波動性、收益率進行擬合與預測,獲得理想的效果.魏紅燕和孟純軍(2014)[5]運用GARCH模型研究人民幣對美元的匯率預測,預測結果比較理想.羅永恒(2013)[6]應用ARMA模型較好地反映了中國農產品價格指數的動態變化.付燕和栗鋒(2012)[7]運用ARMA模型對我國體育股票價格進行預測分析.賀本嵐(2008)[8]應用ARIMA與ARCH模型預測股票價格,結果表明ARCH 模型相比ARIMA模型的預測效果更滿意.閆冬(2012)[9]將GARCH模型與ARMA模型相結合,提出 ARMA-GARCH 組合預測模型,研究表明ARMA-GARCH 預測模型有效地刻畫了上證指數的短期變化.而在股票價格波動性的預測能力方面上,將ARMA模型、GARCH 模型以及ARMA-GARCH組合模型相比較的研究成果并不多.而大多數時間序列預測模型都是以ARMA或GARCH模型為基礎,因此比較ARMA模型、GARCH模型和ARMA-GARCH模型的預測效果具有重要的意義.
本文旨在研究ARMA模型、GARCH 模型對中國四大銀行股票價格波動的預測能力,通過以中國四大銀行股票每日的收盤價提取樣本研究對象,分別建立ARMA模型、GARCH 模型以及ARMA-GARCH模型對收益率序列進行預測與分析.首先,用ARMA模型來刻畫t時刻的收益率;再檢驗收益率序列是否存在條件異方差性,從而確定建立GARCH模型;接著由于ARMA模型殘差存在ARCH效應以及GARCH模型的均值方程系數不顯著,從而建立ARMA-GARCH組合預測模型;最后通過模型比較表明,對四大銀行股票收益率預測研究,擬合效果上,ARMA-GARCH模型的擬合優度最好;預測效果上,ARMA模型預測精度最好,其次是ARMA-GARCH模型.
ARMA模型是一類常用的隨機時間序列模型,由美國統計學家Box和Jenkins創立,亦稱Box-Jenkins方法.ARMA(p,q)模型的一般表達式為:
rt=φ1rt-1+φ2rt-2+…+φprt-p+ut-θ1ut-1-…-θq.
(1)
該模型中p為自回歸部分的階數,q為移動平均部分的階數,因此記為ARMA(p,q).
運用該ARMA模型的前提條件是,作為分析對象的時間序列是一組零均值的平穩序列.但現實中存在大量的非平穩的時間序列.因此,在建立ARMA模型之前,需要對序列進行平穩化處理.
在金融市場中,股價或市場具有波動率聚集的特點.1982年Engle最早提出了運用ARCH模型對金融市場波動的條件異方差性進行刻畫.ARCH模型,它的主要思想是擾動項是前后不相關的,它的條件方差依賴于它的前期值的大小.ARCH(q)模型的一般表達式為:
(2)
式中,假定εt是獨立同分布的標準正態分布,α0>0,αi≥0(i=1,2,…,q).
關于ARCH效應的檢驗,即對均值方程的殘差平方序列進行條件異方差性檢驗.若發現存在顯著的ARCH效應,則可以建立一個波動率模型.但ARCH模型有一個顯著的特點,就是通常擬合的模型階數q較大,為了解決這個問題,1986年Bollerslev在Engle的ARCH模型基礎上提出了廣義自回歸條件異方差模型-GARCH模型.
對于一個對數收益率序列rt,令at=rt-μt為t時刻的新息.稱at服從GARCH(m,s)模型,若at滿足:
(3)
式中,εt是均值為0,方差為1的獨立同分布序列,α0>0,αi≥0,βj≥0,α0>0,αi≥0,βj≥0,且

ARMA-GARCH 模型表示的是序列的均值應用 ARMA模型,條件方差應用GARCH模型.因此,ARMA-GARCH 模型的基本結構表示為:
(4)

本文選取2007年10月1日-2017年10月1日的中國銀行、中國工商銀行和中國建設銀行的股票每日收盤價以及中國農業銀行2010年7月15日-2017年10月1日的股票每日收盤價作為樣本數據,其中最后2天的數據作為測試數據,數據來源于雅虎財經網.本文研究股票市場的波動,以股票市場的日收益率作為考察變量,股票市場的日收益率以相鄰兩日收盤價的對數一階差分來表示,并以Rt作為第t日的股票日對數收益率.日對數收益率組成新的樣本時間序列,對該序列進行基本的統計分析,得到其基本描述統計分析結果及其時序圖,分別見表1和圖1.

表1 中國四大銀行日對數收益率的基本統計特征
由表1可知,中國銀行的偏度為0.095,接近于0,其他三大銀行的偏度均小于0,而四大銀行的峰度值均大于3,說明其日對數收益率具有尖峰厚尾特征,正態性檢驗所得的P值均接近于0,這說明至少可以在99%的置信水平下拒絕序列為正態分布的零假設,即可以認為中國四大銀行的日對數收益率序列均不服從正態分布,其所對應的股價序列并不是完全隨機的.

圖1 中國四大銀行日對數收益率時序圖
由圖1四大銀行的收益率時序圖上可以看出,各銀行的收益率在零均值附近上下波動,可以初步判斷四大銀行的日收益率是平穩的.
1) 平穩性檢驗
利用時間序列分析進行建模,首先需要對數據平穩化.而僅從時序圖中判斷序列的平穩性是不嚴格的,因此建模前必須先檢驗序列的平穩性.接著采用ADF單位根檢驗法進一步對該日對數收益率序列進行平穩性檢驗,檢驗結果見表2.

表2 各銀行日收益率序列的單位根檢驗
由表2可見,顯然各序列都可以在0.01的顯著性水平下拒絕原假設,接受備擇假設,即序列不存在單位根,則認為各序列{Rt}是平穩的.因此,各銀行的日對數收益率序列均可以考慮建立ARMA(p,q)模型.
2)ARMA模型識別與參數估計
對模型進行識別擬合與估計,可以利用序列的自相關系數(ACF)和偏自相關系數(PACF)識別ARMA模型的階數,并結合AIC信息準則擇優選擇模型,即AIC值越小其精度越高,擬合得較好.因此,結合各序列的ACF和PACF圖以及AIC信息準則,最終選擇最優的ARMA(p,q)模型分別為建設銀行ARMA(2,2),工商銀行ARMA(2,4),農業銀行ARMA(2,2),中國銀行ARMA(3,1).其中四大銀行模型估計結果見表3.

表3 ARMA模型參數估計結果
由表3可知,以中國銀行的日對數收益率為例,最終選擇ARMA(3,1)模型,即
rt=-0.577rt-1-0.062rt-2-0.051rt-3+
at+0.558at-1.
(5)
3)ARMA模型檢驗
對所建立的ARMA模型優劣的檢驗,是通過對原序列與所建立的ARMA模型的殘差序列{at}進行檢驗來實現的.若殘差序列具有隨機性,就意味著所建立的模型已包含原時間序列的所有趨勢,從而說明所建立的模型對原時間序列的描述是合適的充分的.本文中對殘差的這種隨機性檢驗采用的是Box-Ljung檢驗法.四大銀行的ARMA模型的殘差序列的隨機性檢驗結果見表4.

表4 模型殘差相關性與平穩性檢驗
由表4可知,各銀行的日收益率序列擬合的模型,其對應的殘差序列的Box-Ljung檢驗的P值均大于0.05,證實了各模型的殘差序列沒有顯著的相關性,從而模型建立是合理的.因此,可以應用上述ARMA模型預測各四大銀行的日收益率.
從基本統計分析中,得到中國四大銀行的日對數收益率具有尖峰厚尾特征,且各序列均不服從正態分布.從圖1時序圖中可以發現,除了觀察到各收益率序列在零均值附近上下波動之外,還有一個明顯的特點,就是波動的聚集性.因此,需要進一步判斷日收益率序列是否具有條件異方差性,以嘗試通過波動率進行建模,從而達到改進模型的作用.
1)ARCH效應檢驗


Lag

Lag

Lag

Lag
2)GARCH模型的建立
通過上述檢驗,發現各收益率序列均存在顯著的條件異方差性,進而為了消除序列的異方差性,選取構建GARCH模型.本文選擇建立GARCH(1,1)模型.借助R語言軟件,得到各銀行日收益率序列的GARCH(1,1)模型,其中殘差項的分布分別選擇了高斯分布、學生t分布、有偏學生t分布,3個模型都能較好地擬合了給定的數據,且3個擬合序列之間的相關系數都接近1,區別比較小.本文結合AIC最小原則選擇模型,綜合考慮,最后殘差項的分布選擇有偏學生t分布達到相對更優.各收益率序列的新息是服從有偏學生-t分布的GARCH(1,1)模型的參數估計結果見表5所示.
由表5可以看到,所有的參數估計,除了模型中的常數以外,其他參數都是高度顯著的,說明GARCH(1,1)能較好地擬合數據.其中,以中國銀行股票的日對數收益率序列為例,應用帶有偏學生t分布的新息,擬合的GARCH(1,1)模型為:
(6)


表5 GARCH模型估計結果
注:括號內為估計模型系數的概率
3)模型的檢驗
接下來,對GARCH(1,1)模型的殘差與殘差平方進行相關性檢驗.標準化殘差的Ljung-Box統計量和它們的平方序列都不能拒絕該模型,因為其對應的P值均大于0.05,從而認為各模型的殘差序列不存在ARCH效應,說明以上GARCH(1,1)模型消除了殘差序列的條件異方差性,模型的擬合是充分的.
1) ARMA-GARCH模型的建立
正如前文所述,在建立純時間序列ARMA模型時,顯然忽略了序列中存在ARCH效應,而僅僅的ARMA模型并不能處理序列的條件異方差性.對于存在ARCH效應的序列,若僅僅是通過波動率進行建模,如上文僅僅對股票的日對數收益率序列建立GARCH(1,1)模型,由表5可知,其常數項并不顯著,即僅構建波動率模型,其均值方程是不顯著的.因此,本文考慮在建立ARMA均值方程的基礎上,對均值方程的殘差項建立GARCH模型以消除條件異方差性,即通過建立ARMA-GARCH模型對樣本日對數收益率序列的ARMA模型進行改進.
對前文ARMA模型殘差進行ARCH效應檢驗,將Ljung-Box統計量應用于各ARMA模型的殘差平方序列,建行、工商銀行、農業銀行與中國銀行的4個ARMA模型的殘差平方序列的Ljung-Box統計量分別為Q=260,Q1=160,Q2=130,Q3=170,其對應的P值均接近于0,說明殘差序列存在顯著的序列相關性,顯然殘差序列存在ARCH效應.于是考慮建立ARMA-GARCH組合預測模型.殘差項的分布仍然選擇有偏學生t分布,各收益率序列的新息是服從有偏學生-t分布的ARMA-GARCH模型的參數估計結果見表6.

表6 各ARMA-GARCH模型的參數估計結果
同樣地,根據表6,以中國銀行股票的日對數收益率序列為例,應用帶有偏學生t分布的新息,改進后的ARMA(3,1)-GARCH(1,1)模型為:
(7)

2)模型檢驗
在得到改進的ARMA-GARCH模型后,對其對應模型的標準化殘差及其平方進行相關性檢驗.四大銀行的股票日對數收益率序列的ARMA-GARCH模型對應的標準化殘差的Ljung-Box統計量和它們的平方序列都不能拒絕原假設,說明ARMA-GARCH模型的擬合是充分的.其中,以中國銀行股票日對數收益率序列為例.從估計模型標準化殘差的時序圖、QQ圖及其相關圖中可以看出,標準化殘差序列是白噪聲序列,不存在序列相關性,而且其標準化殘差平方序列也不存在序列相關性,已經消除了條件異方差性,從而說明所擬合的ARMA(3,1)-GARCH(1,1)模型是充分的.
3.5.1 樣本內比較
如果數據分析的目的是為了研究一個時間序列的動態結構,那么可以用樣本內方法來比較不同的模型.樣本內比較法就是利用所有數據來進行模型估計和比較,比如信息準則(如AIC和BIC)和殘差方差的估計.如果選定其中一個準則,那么它的值越小,模型就越好.本文采用的AIC準則對以上3個模型進行樣本內比較,其值見表7.

表7 樣本內比較
從表7可知,根據AIC準則,對股票的日對數收益率序列建立波動率方程GARCH模型相比要優于建立ARMA模型.GARCH模型的AIC值比較于ARMA 模型的AIC值有了比較大的下降,說明四大銀行的股票日對數收益率序列存在波動率集聚現象且GARCH模型可以更好地解釋并消除條件異方差.根據表7,改進的ARMA-GARCH組合預測模型相比單純的ARMA模型與單純的GARCH模型也都更優.因此,根據AIC準則,即在樣本內比較時,ARMA-GARCH模型的擬合效果更理想.
3.5.2 樣本外比較
若建立時間序列模型是為了預測,則進行模型比較就要考慮模型的預測能力.本文采用均方誤差(MSFE)和平均絕對誤差(MAFE)2個指標來衡量模型預測效果的好壞,對于不同的模型,若預測的MSFE或MAFE越小,則說明預測精度越高[13]. 把最小MSFE或最小MAFE對應的模型作為這組數據的最好模型.其中,這2個指標反映預測值與實際值之間的誤差大小,其定義分別為:
(8)
(9)

根據各模型對股票日對數收益率的測試集的預測,計算了各模型預測的均方誤差、平均絕對誤差,下面給出3個模型超前兩步預測時,其在第一步預測中對應的預測誤差的均方(MSFE)與平均絕對預測誤差(MAFE),整理見表8.

表8 樣本外比較
根據表8可以得到,ARMA模型、GARCH模型與ARMA-GARCH模型這3個模型的預測效果差別不大.整體上,ARMA模型的預測效果更優,其中ARMA-GARCH模型是在ARMA模型的均值方程基礎上,對殘差項加入GARCH模型的波動率方程,但其預測效果也并沒有得到提升.因此,從預測精度上看,ARMA模型的預測效果最好,波動率建模的預測效果并沒有得到提高.
本文運用時間序列分析的預測方法,通過對中國四大銀行的股票日對數收益率序列進行實證分析可以發現,ARMA模型、GARCH模型以及改進的ARMA-GARCH模型均能對四大銀行的股票日對數收益率序列進行擬合與預測分析,具體可以得到以下結論:
1)在模型擬合效果方面,對四大銀行股票的日對數收益率序列建立GARCH模型相比要優于建立ARMA模型,而建立改進的ARMA-GARCH模型,與建立單一的ARMA模型、單一的GARCH模型相比,ARMA-GARCH模型的擬合優度都更優更理想.這是由于四大銀行的股票日對數收益率序列存在波動率集聚現象且GARCH模型可以更好的解釋并消除條件異方差,也說明ARMA-GARCH模型和GARCH模型能更好地反映這個時間段四大銀行日股價的實際波動情況.
2)在模型預測效果方面,ARMA模型、GARCH模型以及ARMA-GARCH模型各自的均方預測誤差與平均絕對預測誤差都比較小且各模型之間的預測誤差均相差在1%左右.整體上,在預測四大銀行的股價上,ARMA模型的預測效果最優,其次ARMA-GARCH模型.
綜上所述,ARMA模型對于四大銀行股票的波動性、股票收益率的預測效果比較好,但ARMA模型對股票收益率預測的擬合優度均遠遠高于GARCH和ARMA-GARCH模型.GARCH和ARMA-GARCH模型對于股票收益率序列可以很好地消除條件異方差,ARMA和GARCH模型結合的ARMA-GARCH模型在擬合效果和預測能力上都取得更理想的效果.