(西北師范大學經濟學院 甘肅 蘭州 730070)
黃永興[1]也做了股票的相關分析。他利用以往的上證指數和深證指數的數據,建立了我國滬深兩市的ARIMA模型和AR-EGARCH模型來研究兩市股指價格非線性規律的變動,通過對兩個模型的比較,發現 AR-EGARCH模型對滬深兩市的股價非線性規律的變化有更好的預測效果。趙志峰[6]主要考慮了政府這個因素。他利用98年到00年的深證指數數據分析了在政府干預的情況下比較ARIMA模型和干預模型哪個更適用,得出結果,在選取的數據較少時,傳統模型不如干預模型,并且干預模型能比其他模型更好的解決序列發生突變時的問題;鄭梅[3]等人也運用ARCH族模型對上海、深圳股市的波動性做了研究。他們在文中使用了三種不同的ARCH族模型并比較出了三種模型的優劣,結果發現EGARCH和TGARCH模型的預測效果比GARCH(1,1)模型的要好的多,他們還發現,在研究非對稱預測指標方面,每個模型的預測結果可能滿足不同投資者人群的需求,有的人傾向于考慮第一種模型預測的結果,有的投資者更愿意將第二種模型的結果作為參考,但大部分人還是對最優的模型的預測結果更為相信。從而可以看出,模型對未來股價的預測只能作為一種比較合理的參考,對不同的投資者人群而言,還要根據他們自身的需要進行選擇性的投資。楊帷[2]基于時間序列分析的理論對上證指數收益率進行了模型的建立,通過對自相關和偏自相關圖的觀察,建立了ARMA(6,0)模型,對殘差進行ARCH效應檢驗,最后通過建立GARCH模型,消除了異方差性,此外,他還建立了EGARCH(1,1)模型驗證了波動率序列具有“杠桿效應”。仲陽[5]利用1992年至2004年的上證綜指收盤價為樣本數據,并通過對其對數收益率建立ARCH族模型研究上證綜指收益率波動非對稱性和長短期效應特征。張楠[4]對上證股票時間序列建立了ARIMA模型,并進行了預測,結果發現模型較長期來說對短期的預測效果更好。
以上學者的研究在股票市場價格波動分析及其預測方面做出了很大的貢獻,這一方面表明了傳統的ARIMA等模型有一定的局限性,它們已經不能滿足我國股市發展現狀,需要更加適用的模型來對其進行研究,另一方面隨著數學模型種類增多、完善和發展,以及統計軟件的開發,使得我們的研究越來越有理論指導意義。
(一)ARIMA模型。當我們在對序列做模型的時候,大多數情況下序列并不都是平穩的,這時候ARMA(p,q)模型已不再適用,在這種情況下我們需要對所分析的序列做有限次的差分,此時本文采用ARIMA(p,d,q)模型,其中模型中的d表示差分次數。
因此我們構建模型如下:
(2-1)
為ARIMA(p,d,q)(求和自回歸移動平均模型)。
式中:
▽d=(1-B)d;Φ(B)=1-φ1B-...-φPBP
(2-2)
為ARMA(p,q)模型的自回歸系數多項式;
式:
Θ(B)=1-θ1B-...-θqBq
(2-3)
為ARMA(p,q)模型的移動平滑系數多項式。
d階差分后序列可以表示為:
(2-4)
(1)考察序列的平穩性;
(2)如果序列是平穩的,再來考察序列的自相關與偏自相關是否有顯著性,如果不平穩,需要對序列進行一階差分以及檢驗平穩性,當這個序列檢驗結果是平穩時,需要繼續下一個步驟,但如果結果仍然是不平穩的,那么我們選擇繼續進行差分運算;
(3)根據自相關和偏自相關圖對模型定階;
(4)估計并檢驗所選序列構造出的模型未知參數;
(5)最后對選取的最優模型做預測。
統計是數據科學,而分析數據必須要用到分析工具,俗話說:"工欲善其事,必先利其器",在學術界者這句話也是相當適用的,目前統計分析方面所用到的軟件有很多,由最初比較簡便的SPSS、EVIEWS等軟件到現今可以編程的MATLAB、R語言,這些工具給我們作分析提供了很大的方便,近幾年R軟件的興起,使得我們的分析越來越簡便、實用。
R軟件用是免費自由的軟件,它的代碼公開,可以修改,我們可以借鑒別人已做出的程序代碼結合自己的數據加以分析,運用起來十分的方便,除此之外它還有強大的幫助系統,當在運行程序的時候遇到不懂的函數或者出錯的地方,我們可以尋求幫助;R語言最實用的一點就是當我們運行代碼的時候可以將自己已經運行成功的代碼保存下來,等到下次做相同的分析的時候可以直接應用之前的代碼,只需要將做簡單的修改即可,非常的智能,并且R語言所需的各種安裝包都可以在網上下載在得到,是一款功能十分強大的統計分析軟件,由于它的便捷實用,受到越來越多學者的青睞。故本文我們也使用R語言作為分析軟件。
本文選取了深證指數日收盤價格(1991年4月3日起,截止至2018年12月13日,共計6749組數據),以R語言為主要分析工具,通過對股票的對數收益率序列進行建模,最后用模型來預測短時期內收益率的變動趨勢。
首先求得深證指數日收盤價的對數收益率序列,通過R語言軟件看其是否平穩。
輸入代碼得到運行結果:
data: r.x
Dickey-Fuller = -16.714, Lag order = 18, p-value = 0.01
從結果中可以看到,檢驗的P值為0.01<0.05,故拒絕原假設,接受備擇假設,表明深證指數對數收益率序列是平穩的。
1、建立ARIMA模型
通過觀察序列的自相關圖和偏自相關圖,自相關和偏自相關系數在前幾階的值均比較大,在七階以后的值逐漸變小,說明在前幾階序列相關是顯著的,所以我們在R語言軟件上建立了ARIMA(1,1,1)至ARIMA(6,1,6)之間的每一個模型來擬合收益率序列,通過比較AIC和BC的值,以及建立模型后的殘差序列的自相關圖,最終確定了最優的模型ARIMA(3,1,4)。得到的殘差的序列圖和自相關圖如圖1所示:

圖1 殘差的序列圖和ACF圖
從所做模型的殘差的自相關圖中可以看到,在第24階和第27階處殘差的自相關系數超過了2倍標準差[5],具有相關性,其余階數的自相關系數值均很小,由于自相關系數較大的部分滯后的階數都比較大,我們可以近似地認為殘差不具有相關性,模型的建立是成功的。由于我們人為地做出了近似的結論,我們需要再對所做模型的殘差做白噪聲檢驗,看其是否和我們預測的結論一致,通過在軟件中輸入代碼,輸出結果顯示p值為0.7037>0.05,通過白噪聲檢驗,說明所做模型的殘差不具有相關性,和我們所得出的結論一致。
從上圖中我們可以看到,殘差的序列圖有較強的波動性,可能存在異方差性。
2、建立GARCH模型
通過對擬合的模型ARIMA(3,1,4)進行殘差做Melcod.Li檢驗,發現具有異方差性,因此我們需要建立GARCH模型,來消除異方差性。
利用R軟件對序列進行整體ARIMA(3,1,4)-GARCH(1,1)建模,我們得到系數顯著性檢驗表:

表1 系數顯著性檢驗結果
從上表中的檢驗結果可以看出,我們建立的模型中除了MA(4)處的系數不顯著外,其余階數的系數均顯著,并且在模型的殘差檢驗中每個Q統計量所對應的P值都大于0.05,說明擬合后的模型的很好的描述了序列的自相關性和異方差性;ARCH效應檢驗中,對應的P為0.9888616,遠大于0.05,故拒絕原假設,我們所建立的模型殘差不再具有ARCH效應。
因此我們最終建立的模型方程為:
αt=σtεt
3、模型預測
通過軟件得到預測結果如圖2所示:

圖2 預測結果圖
本文以1991年4月3日至2018年12月13日的深證綜合指數日收盤價格作為原始數據,求取了其對數收益率序列最為研究數據,最終建立了ARIMA(3,1,4)-GARCH(1,1)模型,并對序列進行了短期預測,在進行建模的過程中,我們根據收益率序列的自相關和偏自相關圖對序列進行了模型的擬合,對序列進行了探究,我們得到了以下結論:通過對深證指數收益率序列的研究,起初我們用ARIMA模型進行建模,發現其殘差雖然是白噪聲序列,但是模型的殘差平方具有明顯的ARCH效應,因此我們又建立了GARCH模型,來消除序列的異方差性,最終建立了ARIMA(3,1,4)-GARCH(1,1)模型,并根據所做模型對深圳股市未來短時間內股票收益率做了預測,結果發現在未來的短期內股票收益率變動幅度不大,投資者和管理者可以做出合理的決策。