劉光強
(西南交通大學經濟管理學院,四川 成都 610031)
利用高頻數據度量金融資產的波動率在信息含量、模型構建及參數估計等方面均具有重要優勢,成為近年來的研究熱點。Andersen 和Bollerslev 、Barndorff-Nielsen 和Shephard 提出的已實現波動率方法(Realized Volatility,RV),通過利用積分波動率(Integrated Volatility)估計RV為高頻波動研究奠定了基礎。Corsi提出的具有長記憶的異質自回歸模型(Heterogeneous Autoregression,HAR)克服了前期分整模型(ARFIMA)在計算復雜性等方面的不足,成為研究RV模型的重要思路[1-2]。在此基礎上,將總波動分為連續性波動和非連續性波動(跳躍),Gallo和Otranto借助Barndorff-Nielsen和 Shephard所提出的二次變差理論,衍生出了跳躍型HAR模型(HAR-with-Jumps,HAR-J)和連續型HAR模型(Continuous-HAR,CHAR)。而Patton 和 Sheppard[3]通過對總波動進一步分析,考慮其正向波動和負向波動的不同影響,建立了Semivariance-HAR模型(SHAR)。
目前,應用相關高頻波動率建模主要集中在探討RV的預測,如陳浪南和楊科[4]利用上證綜指2000—2008年的高頻數據實證檢驗了中國股市高頻波動率的特征,并綜合分析了相關模型的樣本外預測能力。宋亞瓊和王新軍[5]則重點考慮了對跳躍強度的擬合,其結果表明跳躍強度對RV具有顯著影響。瞿慧和程思逸[6]考慮宏觀信息發布因素對滬深300指數的影響并對其RV進行建模。由此可見,從基礎的HAR類模型所衍生出來的考慮了跳躍成分的相關建模取得了理想的實證效果。
現有高頻波動建模的文獻大多局限于對波動率本身的探討,而缺少進一步對波動率建模在風險管理等方面的深入研究。本文擬結合HAR理論與Copula理論,并以滬港股市為研究對象,對滬港股市兩者間的相互關系展開分析。提出這一研究設想主要基于:(1)現有文獻在探討股市之間相互關系時往往應用日數據,而較少利用高頻交易信息,如龔樸和李夢玄[7]探討滬港股市的波動溢出和時變相關性時采用的是滬港股市間的日數據,劉鏡秀等[8]利用了1991—2011年的日數據對中外股市間的動態相關性進行了實證研究。(2)Copula理論對兩個時間序列間的相關性具有很好的擬合效果,但將HAR與之相互結合的相關研究還比較少見。如李強和周孝華[9]利用Copula函數對我國臺灣和韓國股票市場相關性展開了實證分析,黃在鑫和覃正[10]基于Copula理論對中美主要金融市場相關結構及風險傳導路徑進行了研究。(3)雖然目前已有學者以“滬港通”為背景展開了相關研究,如蔡彤彤和王世文[11]等,但公開的文獻中未有同時將HAR模型與Copula理論相結合展開的分析。
若假定資產的價格為p,那么,其價格的微分方程服從:
dlog(pt)=μt+δtdWt
(1)
也就是說,價格微分方程為連續波動μt和瞬時波動過程δt與布朗運動Wt之間的乘積,這里分析基于不考慮是否有跳躍情況,考慮跳躍的情形將在以下內容中進行闡述。在對RV研究過程中,現有文獻均是為了如何準確預測未來時間之內的積分波動率(Integrated Variance,IV),IV為:
(2)
但IV無法直接觀測,常用已實現波動率(Realized Variance,RV)代替,RV為:
(3)
也就是說,RV表示在時間t內所有收益率的平方和,而M=1/Δ表示在交易頻率Δ下時間t內的所有交易總次數,rt,i=log(Pt-1+iΔ)-log(Pt-1+(i-1)Δ)。當Δ→0時,RVt的估計誤差可以表示為:
RVt=IVt+ηt, ηt~MN(0,2ΔIQt)
(4)

(5)
HAR模型是當前對RV建模的重要基礎,HAR模型為:
RVt=β0+β1RVt-1+β2RVt-1|t-5+β3RVt-1|t-22+ut
(6)

在基礎的HAR模型上,通過對總的波動率進一步分解,若考慮了跳躍情形的HAR-J模型。也就是說,在HAR模型的基礎上,增加了跳躍因子,則有:
RVt=β0+β1RVt-1+β2RVt-1|t-5+β3RVt-1|t-22+βJJt-1+ut
(7)
其中,Jt=max[RVt-BPVt,0],BPV為:
(8)

除了考慮跳躍情形外,僅僅考慮非跳躍,也就是僅僅考慮連續模型CHAR被定義為:
RVt=β0+β1BRVt-1+β2BRVt-1|t-5+β3BRVt-1|t-22+ut
(9)
另外,Patton 和 Sheppard[3]在Barndorff-Nielsen等所提出的半方差測度基礎上,通過對總的波動進一步分解為正向波動和負向波動提出了半方差HAR模型(Semivariance-HAR,SHAR):
(10)

Sklar[12]提出的Copula函數是描述變量之間相關性的一個全新概念。其具體定義為,若F為具有邊緣分布Fi(i=1,2,…,n)的一個聯合分布函數,F與各個邊緣分布函數之間的關系可以通過一個稱之為Copula的函數C進行描述,即:
F(x1,x2,…,xn)=C[F1(x1),F2(x2),…,Fn(xn)]
(11)

(12)
其中,ui=Fi(i=1,2,…,n)。如果F是n階可微的,則其聯合密度函數為:

(13)

(14)
要對Copula函數的參數進行估計,可以對其進行取對數似然函數,然后進行最優化計算,即:
(15)
其中,ξ=(φ1,φ2,…,φn,θ)是包含了邊緣分布的參數φi和Copula的參數θ。
如果刻畫兩個變量之間的相關性,則可以運用二元Copula函數,而常用的二元Copula函數為正態Copula(Norm Copula,N-Copula)和二元t-Copula。Patton[13]依據ARMA(1,10)過程,提出了二元N-Copula和二元t-Copula的相關系數的方程形式:
(16)
(17)

考慮到“滬港通”于2014年11月17日實施這一背景,為了前后便于對比分析,本文將樣本的數據區間定為2013年1月1日至2016年12月31日,即前后大致為兩年,共計4年的樣本。同時,本文采用的是5分鐘高頻數據,然而滬港兩市交易機制的差別,每天的高頻數據量不同。滬市每天上午9:30—11:30,下午13:00—15:00共計4個小時,48個5分鐘高頻數據,港市每天上午9:30—12:00、下午13:00—16:00共計交易5.5小時,66個5分鐘高頻數據,為了進行對比分析和Copula建模研究,剔除了兩個市場之中獨有的交易日期之后共計939個交易日。滬港指數日收益率的描述性統計如表1所示。由表1可知,雖然港市相比滬市而言與正態分布更加接近,如峰度為5.1900,比滬市的峰度8.7135低,其偏度也較滬市更加接近于0,但從正態分布檢驗的統計值Jarque-Bera可知,兩個市場均拒絕服從正態分布的原假設。因而正態分布無法對兩市進行準確建模分析。

表1 HS300指數日收益率的描述性統計
注:***、**和*分別表示在1%、5%和10%的水平上顯著(下同),Jarque-Bera為正態分布檢驗的統計值。
首先,根據HAR等模型的建模需要,計算RV、RQ、RJ、BPV、R_S_n_d和R_S_p_d序列,具體的計算過程請參閱前文理論部分。滬港股市RV及RQ等序列的描述性統計如表2所示。由表2可知,滬市相較港市,以上各序列均較大,而這些序列具有對每日波動的刻畫能力,因此,滬市較港市具有較大的波動。另外,根據Dickey-Fuller單位根檢驗結果可知,各序列均顯示為平穩序列,因而可以對其進一步建模分析,為HAR等長記憶波動率建模奠定了良好的基礎。而在滯后24階的情況下,除了恒生指數RQ之外,滬港其余的RV等序列均顯著存在自相關性,因此,運用HAR、HAR-J等具有刻畫長記憶能力的相關模型對波動率進行建模具有合理之處。

表2 RV及RQ等序列的描述性統計
注: ADF為Dickey-Fuller單位根檢驗(下同)。
這里的估計是對整個樣本區間,即2013年1月—2016年12月的5分鐘高頻數據進行樣本內建模。表3展示了各模型對RV估計結果的統計分析,由表3可知,HAR、HAR-J、CHAR和SHAR四種模型的估計結果差異不大,滬市波動率的絕對值在24上下,而港市在4上下,由此可知,滬市日內波動大致為港市的6倍。為了便于進一步運用Copula理論分析,這里對各模型的結果進行ADF單位根檢驗,其結果均顯示各序列為平穩序列,因而可以對其進一步采用Copula函數進行建模分析。

表3 各模型對RV估計結果的統計分析
注:這里是各模型所預測的RV擴大了10 000倍后所得出的統計值,極差為最大值減去最小值。
本文同時采用了二元動態N-Copula和t-Copula兩種模型,在進行Copula建模時,筆者采用對應的序列進行擬合,如滬市的HAR序列和港市的HAR序列為一組、滬市的HAR-J和港市的HAR-J為對應的一組,依此類推,四種長記憶模型和日數據,一共考慮了五組數據,即同時對這五組數據運用動態N-Copula和t-Copula進行建模。2013年1月至2016年12月間滬港股市之間運用動態N-Copula和t-Copula具體的估計結果如表4和表5所示。同時,也對日收益率運用Copula進行建模對比分析。

表4 2013年1月至2016年12月動態N-Copula估計結果
注:括號內為參數估計的標準差,L-Likelihood為對數似然函數值,加粗為最小的AIC、BIC對應模型(下同)。

表5 2013年1月至2016年12月動態t-Copula估計結果
從表4和表5可知,在2013—2016年,無論是正態N-Copula還是t-Copula,HAR模型均具有最小的AIC和BIC,因此,可判斷基于HAR模型的Copula方法更能夠刻畫滬港兩市之間的相關性。在各種模型下,t-Copula較N-Copula均具有較低的AIC和BIC,由此可以判斷動態二元t-Copula較動態二元N-Copula能夠更加準確地刻畫滬港股市之間的相關性。這是由于刻畫t分布自由度的參數均在5%的水平上顯著(除SHAR模型在10%水平上顯著),因此,t-Copula充分刻畫了兩市極端波動之間的相關性。而直接采用日收益率建模的方式對兩市之間相關性的刻畫能力最弱。
“滬港通”開通前后兩市之間的相關性是否具有差別,具有什么樣的差別?這是本文擬研究解決的關鍵問題,下面將繼續應用前文的分析方法對此展開分析。由于“滬港通”是2014年11月17日開始實施,為了前后數據對稱,本文將從2015年1月1日為中點將樣本分為兩個子樣本區間,即前后各兩年時間進行對比分析,以期了解“滬港通”開通之后對兩市所帶來的影響。
先對各樣本區間的5分鐘高頻數據分布應用HAR、HAR-J、SHAR和CHAR四種模型對滬港兩市子樣本進行對應建模,并以此估計結果為基礎采用動態t-Copula對其相關性進行擬合,表6和表7分別為2013年1月至2014年12月和2015年1月至2016年12月兩子樣本間動態t-Copula估計結果,由此可以發現,在前半部分HAR模型具有最小的AIC和BIC,但在具有較大波動的后半部分,具有跳躍刻畫能力的HAR-J模型顯示為最佳模型。與總樣本一樣,兩個子區間中直接采用日收益率建模方式對兩市之間相關性的刻畫能力最弱。從表6中刻畫t-Copula自由度的參數可知,HAR-J和CHAR模型在5%的水平上顯著,HAR和SHAR模型在10%水平上顯著,而此區間滬港股市均有較大的波動,t-Copula的估計結果表明了兩市劇烈波動之間的相互影響。
本文對滬港兩市間各模型所估計的動態相關系數的均值進行了統計,具體結果如表7所示。總體而言,HAR、HAR-J、CHAR和SHAR四種模型所估計的動態相關系數差異不大,各個區間其均值差異在3%左右。從2013年1月至2016年12月總樣本以及2013年1月至2014年12月和2015年1月至2016年12月兩個子樣本區間來看,基于日收益率的相關系數則在整個樣本期間和兩個分樣本期間相差不大,但基于高頻數據的其他模型則在前后兩個不同樣本期間具有較大的差異。具體而言,在滬港通開通之后滬港兩市之間的相關性較之前有大幅提升,以后半段刻畫滬港股市動態相關性最佳的HAR-J模型為例,其前后相差達到了17.10%,表明“滬港通”實施之后兩市之間的相關性提升17.10%。其他幾個模型所估算的相關性提升幅度同樣在12%以上。

表6 動態t-Copula估計結果

表7 各模型動態t-Copula相關系數均值統計結果
注:子區間差異為2015年1月至2016年12月的相關系數均值減2013年1月至2014年12月的相關系數均值。
從上文的經驗分析可知,“滬港通”的實施使得兩市之間的關聯程度大幅提升,相關性提升是來源于滬市對港市的影響增強還是相反?這是本文進一步研究的問題。兩個序列之間的因果聯系可以通過格蘭杰因果檢驗進行判斷。格蘭杰因果關系檢驗要求估計以下回歸模型:
(18)
(19)
其中,Xt和Yt為X、Y原始序列當期值;Xt-i、Yt-i為X、Y原始序列滯后i期的值;αi、βi、λi、δi為回歸系數;μ1、μ2為誤差項。
格蘭杰檢驗是通過構造F值,利用F檢驗完成的。如針對X不是Y的格蘭杰原因這一假設,即針對式中X滯后項前的參數整體為零的假設,分別做包含與不包含X滯后項的回歸,記前者的殘差平方和為RSSU,后者的殘差平方和為RSSR,再計算F值:
F=(RSSR-RSSu)×(N-2n-1)/RSSu×n
(20)
其中,n為X的滯后項的個數,N為樣本容量。
如果計算的F值大于給定顯著水平α下F分布的響應的臨界值Fα(n,N-2n-1),則拒絕原假設,即認為X是Y的格蘭杰原因。
在經驗分析之前,本文對滬港股市的日收益率進行了ADF檢驗,顯示為平穩序列,因而在選取滯后2階情況下,本文對滬港股市各階段之間收益率的格蘭杰因果關系進行了分析。以5%為置信水平,在2015年1月至2016年12月間,格蘭杰檢驗拒絕了“港市不是滬市的格蘭杰原因”的原假設,即港市是滬市的格蘭杰原因,而其他區間則兩市之間顯示沒有因果關系。這結論進一步說明了,在2014年年末之后,港市與滬市之間的聯系進一步增強,且主要是港市對滬市的影響增強所致。
本文利用日內高頻交易數據詳細探討了滬港股市之間的相關關系和因果關系。首先,同時利用了能夠刻畫長記憶的HAR、HAR-J、CHAR及SHAR四種模型對滬港股市的高頻波動進行建模,然后在此基礎上利用了動態N-Copula和t-Copula模型對滬港股市2013年1月至2016年12月間的相關關系進行分析,同時以2014年11月17日實施的“滬港通”為標志,將樣本分為前后各兩年兩個子樣本進行了經驗分析。本文的實證結果表明:動態的t-Copula模型較N-Copula模型更能準確刻畫滬港股市之間的相關關系;基于HAR及HAR-J模型較CHAR及SHAR模型對滬港股市間的相關關系具有更佳的擬合效果;“滬港通”實施之后兩市之間的相關關系提升幅度達到12%以上,且格蘭杰因果關系表明港市對滬市的影響逐漸增強。
本文的經驗分析利用了日內高頻交易信息,較以往文獻利用日收益建模研究在利用信息方面更加符合實際,為研究滬港兩市間的相互關系提供了新的視角和經驗依據。本文研究結果與現實推理高度吻合,且從定量角度估算了滬港股市在“滬港通”實施之后兩者間的相關關系和因果關系。本文的研究結果表明,參與滬市的投資者、管理者應重視港市對滬市的重要影響,將港市的相關情況納入到滬市風險管理的范疇之中,做好應對港市變化所帶來的相關風險。