[摘 要] 本文利用連續(xù)的股指期貨指數(shù)5分鐘高頻數(shù)據(jù),基于“已實現(xiàn)” 波動率進(jìn)行實證研究,結(jié)果表明股指期貨“已實現(xiàn)” 波動率序列的分布是非正態(tài)分布且具有長記憶性,最后建立ARFIMA模型,并對波動率進(jìn)行預(yù)測,預(yù)測平均誤差7.20%。
[關(guān)鍵詞]ARFIMA模型 高頻數(shù)據(jù) 已實現(xiàn)波動率 預(yù)測
1 引言
隨著金融市場的不斷發(fā)展與擴(kuò)容,對金融數(shù)據(jù)、特別是高頻數(shù)據(jù)的研究已經(jīng)成為實業(yè)界和學(xué)術(shù)界的熱點問題和難點問題。本文在借助ARFIMA模型的基礎(chǔ)上,對連續(xù)的期指指數(shù)(IF8888)波動率進(jìn)行預(yù)測實證研究。在如今的經(jīng)濟(jì)領(lǐng)域中,時間序列的自相關(guān)函數(shù)緩慢衰減,而常用的模型AR 模型、MA模型及ARMA 模型,通常表現(xiàn)為短記憶性,屬于線性平穩(wěn)模型,難以刻畫日益復(fù)雜的金融市場。因此如何表現(xiàn)金融資產(chǎn)的長記憶性成為當(dāng)前學(xué)術(shù)界關(guān)注的焦點。
自從 Granger 和 Joyeux(1980)將長記憶性的概念引入經(jīng)濟(jì)學(xué)中,長記憶性的研究得到了飛速的發(fā)展。在當(dāng)前的學(xué)術(shù)文獻(xiàn)中,時間序列長記憶性的存在性得到了比較嚴(yán)謹(jǐn)?shù)尿炞C(Geweke Porter-Hudak,1984; SDerek Bond,2007;陳璞和鄭術(shù)專,2006;雷鳴,2007)。而在對時間序列長記性的模型研究上,學(xué)術(shù)界還未達(dá)成統(tǒng)一意見。目前存在接受度較高的模型有FDG模型(Granger,1980)、ARFIMA模型(Hosking,1981)、不對稱長記憶隨機(jī)波動模型(A-LMSV)(Ruiz Veiga,2007)和ARFIMA-FIGARCH 模型(Sang Hoon Kanga,Seong-Min Yoonb,2007)。其中ARFIMA模型不僅能刻畫時間序列的長記憶性和短記憶性,而且在高頻數(shù)據(jù)中擬合效果較好。
高頻數(shù)據(jù)由于其交易間隔不等、交易價格不連續(xù)以及呈現(xiàn)日內(nèi)“U”型模式等特點,導(dǎo)致對高頻數(shù)據(jù)的研究變得較為困難。Andersen和Bollerslev(1998)提出了一種基于高頻數(shù)據(jù)全新的非參數(shù)波動率度量方法——已實現(xiàn)波動率(Realized Volatility,RV),它的成功推出極大地推動了金融高頻數(shù)據(jù)波動率的研究進(jìn)展。Koop, Jungbacker 和 Hol(2005)構(gòu)建了拓展形式的SV模型(SV-RV模型)和ARFIMA模型(ARFIMA-RV 模型),并進(jìn)行實證檢驗分析發(fā)現(xiàn)已實現(xiàn)波動率的引入可以極大提高傳統(tǒng)波動率模型的預(yù)測能力。準(zhǔn)確度量高頻數(shù)據(jù)的波動率是為了預(yù)測,本文以中國連續(xù)的期貨指數(shù)高頻數(shù)據(jù)為樣本,基于已實現(xiàn)波動率,建立ARFIMA模型對高頻數(shù)據(jù)波動率進(jìn)行預(yù)測分析。
2 模型介紹
2.1 高頻已實現(xiàn)波動率模型
Anderson 和 Bollerslev(1998)首次提出已實現(xiàn)波動率(Realized Volatility,RV),是通過加總某一頻率下的日內(nèi)分時數(shù)據(jù)的收益平方來得到真實波動率的一個非參數(shù)估計,在日內(nèi)頻率選取適當(dāng)?shù)那樾蜗拢耙褜崿F(xiàn)”波動率是真實波動率的無偏、 有效且一致的估計量, 它沒有經(jīng)典算法所帶來的時間滯后。
2.2 ARFIMA模型
如果收益率時間序列具有長期記憶性, 則意味著收益是可預(yù)測的,長記憶性的存在使得資本市場的行為變得非常復(fù)雜, Granger Joyeus(1980), Hosking等(1981) 分別將分?jǐn)?shù)差分噪聲(FI)和ARMA模型相結(jié)合提出了ARFIMA模型來描述長記憶過程。
研究發(fā)現(xiàn),對數(shù)據(jù)進(jìn)行整數(shù)階差分往往會造成過度差分,將會濾掉序列在低頻處的成分,使模型的精度降低, 為解決這一問題, Granger和 Hosking推導(dǎo)出了可以描述序列長記憶性特征的分?jǐn)?shù)階差分方程ARFIMA。
3 實證分析
3.1 數(shù)據(jù)選取
本文選取連續(xù)的期貨指數(shù)IF8888在2011年1月4日至2016年8年26日之間的每隔5分鐘交易數(shù)據(jù)的收盤價為樣本,排除節(jié)假日等一些因素等的影響,共1375天的數(shù)據(jù),平均每天54條。選取5分鐘交易數(shù)據(jù)主要是因為吳有英等(2010)提出滬深300最優(yōu)時間間隔為5分鐘,能有效降低市場微觀摩擦引起的價格上下跳躍,降低RV的估計偏差。
3.2 已實現(xiàn)波動率統(tǒng)計特征
通過計算樣本已實現(xiàn)波動率和日內(nèi)收益率的均值、方差、偏度、峰度、以及JB統(tǒng)計量,可以發(fā)現(xiàn)已實現(xiàn)波動率是非正態(tài),具有嚴(yán)重的偏斜和尖峰厚尾現(xiàn)象,按每日收盤價計算的絕對收益率呈現(xiàn)均值回歸和聚集效應(yīng),即收益率在0附近波動,并且一個大的價格波動率后面緊跟著一個大的價格波動,一個小的價格波動率后面緊跟著一個小的價格波動,這也說明了股指期貨的收益率變化具有明顯的非線性特征。
3.3 長記憶性檢驗
從圖一中可以看出,股指期貨高頻數(shù)據(jù)存在明顯的日內(nèi)效應(yīng),即日內(nèi)呈現(xiàn)周期性波動,這與我國股指期貨市場非連續(xù)交易、詢報價等市場微觀結(jié)構(gòu)因素有關(guān)。從圖二可以發(fā)現(xiàn)已實現(xiàn)波動率存在長記憶性,在滯后80期后自相關(guān)函數(shù)才衰減為0。
3.4 ARFIMA計量模型
3.4.1 計算d值
因為已實現(xiàn)波動率取對數(shù)值后更接近于正態(tài)分布,所以看作是可觀測變量,有顯著的長期記憶性,用ARFIMA模型來刻畫。模型如下:
利用Matlab軟件,通過R/S分析法可以求出已實現(xiàn)波動率的Hurst指數(shù), 然后通過d=H-0.5的關(guān)系式求出分?jǐn)?shù)差分系數(shù)d,表1為計算結(jié)果。
從上表中可以計算出d值為0.03056,大于0,小于0.5,表明該5分鐘級別的已實現(xiàn)波動率呈現(xiàn)為長記憶性特點。
3.4.2 去除長記憶性——分?jǐn)?shù)差分推導(dǎo)及其運用
對于原始序列{Xt} ,可用下列公式表示對其進(jìn)行d階差分 ,其中 L為滯后算子 。差分后的序列記為{Wt}。為了方便計算,不失一般性 ,設(shè) X0=0
本文對對數(shù)已實現(xiàn)波動率進(jìn)行分?jǐn)?shù)差分,除去長記憶性,得到短記憶的時間序列:
從表三中可以看出去除長記憶性的時間序列仍然存在尖峰后尾右偏現(xiàn)象,并且Jarque-Bera統(tǒng)計量在1%的置信水平下顯著,拒絕原假設(shè),認(rèn)為樣本不存在概率服從正態(tài)分布。
3.4.3 確定滯后階數(shù)
對于時間間隔為 5分鐘的對數(shù) “已實現(xiàn)” 波動率序列,建立 AR(1),AR(2),AR(3), MA(1), MA(2),MA(3), ARMA(1,1), ARMA(1,2),ARMA(2,2) 等模型, 刪除參數(shù)不顯著的模型, 再選擇AIC值和SBC值最小者為最優(yōu)模型。實證研究表明對于分?jǐn)?shù)階差分后的對數(shù) “已實現(xiàn)”波動率序列最合適的預(yù)測模型是ARMA(1,1)。通過參數(shù)估計,最終得到最優(yōu)的ARFIMA(1,0.0356, 1)模型為:
3.4.4 模型預(yù)測
利用ARFIMA(1,0.0356, 1)模型對2016 年8 月15日到8 月26日的已實現(xiàn)波動率進(jìn)行驗證。其中最高誤差在9.45%,其平均誤差為7.20%,預(yù)測結(jié)果誤差在可接受的范圍內(nèi),對股指期貨投資者有一定的借鑒作用。
4 結(jié)束語
本文以連續(xù)的股指期貨高頻數(shù)據(jù)為樣本,在采用5分鐘最優(yōu)的時間間隔降低高頻數(shù)據(jù)的跳躍性,基于已實現(xiàn)波動率,驗證了股指期貨價格波動呈現(xiàn)長記憶性,因此針對已實現(xiàn)波動率建立ARFIMA模型,得到最優(yōu)模型ARFIMA(1,0.0356, 1),并利用該模型對已實現(xiàn)波動率進(jìn)行預(yù)測,最高誤差在9.45%,其平均誤差為7.20%。
參考文獻(xiàn):
[1]陳璞,鄭術(shù)專.長記憶時間序列的檢驗方法及對上證指數(shù)長記憶性的實證分析[J].科技應(yīng)用,2006.
[2]雷鳴,繆柏其.存款序列的長記憶實證研究[J].數(shù)理統(tǒng)計與管理. 2007(Vol.26.No.4).
作者簡介:
楊若一(1984- ),男,漢族,河北館陶,主任,學(xué)士,四川天麓量化技術(shù)與創(chuàng)業(yè)研究中心,量化投資與量化交易;
胡冰霜(1958- ),女,漢族,山東聊城,教授,博士,四川大學(xué)社會學(xué)與心理學(xué)系,人工智能與量化投資。