吳鑫育,李心丹,馬超群
1 安徽財經大學 金融學院,安徽 蚌埠 233030 2 南京大學 工程管理學院,南京 210093 3 湖南大學 工商管理學院,長沙 410082
波動率或資產收益率的條件方差,是期權定價和風險管理中的一個重要變量。在著名的Black-Scholes期權定價模型中,期權價格即是關于波動率的一個函數,波動率的建模也給計算金融頭寸的風險值(value at risk,VaR)提供了一個簡單方法。盡管資產收益率的波動率不能被直接觀測到,但它的一些特征卻能夠在資產收益率序列中直觀看到,如波動率聚集性和波動率非對稱性或杠桿效應。波動率聚集性指波動率在一些時間段上高、在一些時間段上低,波動率非對稱性或杠桿效應指波動率對資產價格正向沖擊(利好消息)和負向沖擊(利空消息)的反應不同。考慮波動率的這些豐富和復雜的特性,對其進行合理建模,對于期權定價、風險管理和資產組合配置等問題都具有十分重要的意義。
能夠很好地捕獲波動率上述特征的兩類模型是GARCH模型和SV模型,GARCH模型假設資產收益率的條件方差是關于歷史信息的一個確定性的函數,SV模型在條件方差過程中引入一個新的新息,使其在模型擬合上比GARCH模型更好。更為重要的是,SV模型在連續時間方面可直接與期權定價理論和利率期限結構模型等金融理論模型聯系起來。
傳統的SV模型通常采用日度收益率數據對波動率建模。但是,日度低頻數據包含的信息有限,不能完全反映資產價格日內實際變動情況,特別在金融市場高波動時期,采用日度收益率提取的波動率往往存在低估。近年來,隨著電子化交易和信息存儲技術的發展,已經可以較容易地獲得日內高頻數據,基于日內高頻數據構建的已實現波動率(RV)在金融計量學研究中得到越來越多的關注[1-2]。為了利用已實現波動率所包含的豐富日內信息,TAKAHASHI et al.[3]將已實現波動率引入傳統的SV模型,構建對日度收益率與已實現波動率聯合建模的已實現SV模型。基于該模型能夠同時給出已實現波動率的偏差和參數估計。進一步,KOOPMAN et al.[4]提出一個對日度收益率與已實現測度(包括已實現波動率)聯合建模的系統框架。隨后,眾多學者對已實現SV模型進行廣泛深入研究[5-7]。特別地,CHRISTOFFERSEN et al.[8]和TAKAHASHI et al.[9]研究發現,引入包含豐富日內高頻信息的已實現波動率能夠顯著改進SV模型參數估計和波動率估計精確性,提高期權定價和風險測量的準確性。
與國外研究相比,中國學者對已實現SV模型的研究還非常少,吳鑫育等[10]研究門限已實現SV模型,考察中國股市的波動率非對稱性。中國學者主要針對已實現GARCH模型進行研究,已實現GARCH模型是在借鑒已實現SV模型的建模思想的基礎上,對傳統GARCH模型進行擴展得到[11-12]。王天一等[13]考察已實現GARCH模型對于滬深300指數波動率的預測能力,黃友珀等[14-15]的研究考慮基于已實現GARCH模型的風險測量問題,HUANG et al.[16]考慮基于已實現GARCH模型的期權定價問題。然而,已實現GARCH模型比已實現SV模型在建模靈活性上仍顯不足。而且,上述研究大多沒有考慮到波動率的長記憶性。研究表明,波動率不僅具有短期的相關性,同時具有長期的相互影響,即波動率具有持續性和長記憶性[17-19]。ASAI et al.[20]構建能夠刻畫波動率長記憶性的已實現波動率模型,但該模型沒有考慮到已實現波動率存在的偏差問題。最近,ASAI et al.[21-22]考慮具有波動率長記憶性的已實現SV模型,將(對數)波動率建模為一個ARFIMA/Gegenbauer過程。但是該模型構造較為復雜,估計較為困難,且難以與連續時間模型直接聯系起來,給連續時間方面的應用(如期權定價和利率期限結構建模)帶來困難。
此外,關于資產收益率的經驗研究表明,資產收益率的分布往往呈現尖峰、厚尾等非正態性特征,其峰度比正態分布大。 而已有研究對于這種分布的擬合通常采用學生t分布和廣義誤差分布(GED)等復雜分布,而少有研究采用混合正態(MN)分布。混合正態分布是一類非常靈活的分布,能夠很好地刻畫資產收益率的尖峰、厚尾分布特征,許多常見的分布形式都可以由混合正態分布逼近得到,具有混合正態分布的SV模型在原理上與連續時間跳躍擴散模型類似。事實上,具有混合正態分布的SV模型中低概率、高方差的混合正態分量與跳躍擴散模型中的跳躍成分扮演相同的角色[23]。由于混合正態分布在保持正態分布易操作性和有限高階矩特征的同時,具有較高的靈活性,因而在金融學研究中得到越來越多的關注和應用[24-26]。
由上述分析可知,基于高頻數據對波動率建模的研究已經取得豐富的研究成果,但基于已實現SV模型、同時考慮波動率長記憶性和資產收益率非正態性對波動率建模的研究還很少見,且缺乏針對中國股市的實證研究成果。基于此,本研究構建對日度收益率和已實現波動率同時建模的混合正態雙因子已實現SV(2FRSV-MN)模型,該模型考慮已實現波動率的偏差修正,能夠綜合捕獲波動率聚集性、長記憶性和資產收益率的非正態性,充分利用日度低頻和日內高頻聯合數據信息集對波動率建模。2FRSV-MN模型中引入靈活的雙因子波動率描述波動率的長記憶特征,其中一個因子代表波動率長期成分,另一個因子代表波動率短期成分[27]。CORSI et al.[28]研究表明,波動率的長記憶性可以由波動率因子的疊加效應(多因子波動率模型)捕獲。相對于單因子波動率模型,多因子波動率模型具有更大的建模靈活性,能夠刻畫更現實的金融市場變量特征[29]。目前,中國關于雙因子SV模型的研究還非常少見。 為了估計2FRSV-MN模型的參數,本研究給出靈活、有效且易于實現的基于連續粒子濾波的極大似然估計方法。采用上證綜合指數和深證成分指數日內高頻數據,給出基于2FRSV-MN模型的樣本內擬合和VaR估計的實證研究。
本研究考慮的2FRSV-MN模型的形式為

(1)
xt=ξ+θt+σuutut~i.i.d.N(0,1)
t=1,2,…,T
(2)
ηi,t~i.i.d.N(0,1)i=1,2t=1,2,…,T-1
(3)
(4)
其中,t為交易日,T為觀測樣本最終交易日,rt為t交易日的資產收益率,μ為資產收益率的條件均值,θt為t交易日的對數波動率,t為收益率新息,c為對數波動率的長期均值,h1,t和h2,t為波動率因子,xt為t交易日的對數已實現波動率,ξ為偏差修正項,σu為測量誤差的標準差,ut為已實現波動率測量的擾動項,φ1為波動率長期成分的持續性,ρ1為波動率長期成分的杠桿效應,σ1,η為波動率長期成分的波動率,φ2為波動率短期成分的持續性,ρ2為波動率短期成分的杠桿效應,σ2,η為波動率短期成分的波動率,η1,t和η2,t為波動率新息,hi,1為初始的波動率因子。t、ut、η1,t和η2,t相互獨立;i.i.d.為獨立同分布,MN(·)為混合正態分布,N(·)為正態分布;μ、c、ξ、σu、φi、ρi和σi,η都是待估參數;i為波動率因子代碼,i=1時表示長期波動率因子,i=2時表示短期波動率因子。

2FRSV-MN模型通過(3)式引入雙因子波動率(兩個相互獨立的AR(1)過程)捕獲波動率過程的長記憶相關性。為了保證波動率因子過程(h1,t和h2,t)是平穩且可識別的,假設-1<φ2<φ1<1。雙因子波動率中,第1個因子代表波動率長期成分(持續性或長記憶波動率因子),第2個因子代表波動率短期成分(非持續性或短記憶波動率因子)。 兩個波動率因子過程中均引入杠桿效應參數ρi,用以捕獲波動率非對稱性,即波動率對于資產收益率正向沖擊和負向沖擊的非對稱反應,研究表明其對于市場風險測量具有重要影響[30-31]。

(5)
其中,0<λ<1,σ2=(1-p+λp)-1,p為概率,λ、σ和p都是待估參數。t的概率密度函數為
fMN(t|λ,p)=
(6)
本研究采用極大似然方法估計2FRSV-MN模型的參數。極大似然方法是一種常用的、有效的參數估計方法,其所獲得的極大似然估計量具有良好的統計性質,如一致性和漸近正態性等。由于2FRSV-MN模型包含不可觀測的隱因子,這使其似然函數很難獲得,因此很難實施基于極大似然原理的2FRSV-MN模型的直接參數推斷。為了克服這個問題,本研究采用粒子濾波方法解決2FRSV-MN模型的似然估計問題,進而通過極大似然原理對模型參數進行統計推斷。
粒子濾波是一種序貫蒙特卡羅方法,它通過模擬抽樣產生預測和濾波分布。該方法被廣泛應用于工程領域,近年來在金融應用中獲得越來越多的關注。 最簡單和常用的粒子濾波方法是由GORDON et al.[32]提出的抽樣重要性重抽樣(sampling/importance resampling,SIR)濾波方法。SIR濾波方法易于實現,且具有非常強的適用性,可以較容易地應用于各種包含不可觀測狀態變量的復雜非線性模型(如SV模型)[33-35]。
然而,基于標準SIR濾波算法得到的模型似然函數并非參數的連續函數,這給采用傳統的優化方法最大化相應的似然函數造成困難。為了克服這個問題,本研究運用MALIK et al.[36]提出的連續重抽樣方法,構建相應的連續SIR(CSIR)濾波算法獲得光滑連續似然函數,進而結合極大似然方法對2FRSV-MN模型的參數進行估計。

logL(Θ)=logp(y1,…,yt,…,yT|Θ)
(7)
其中,logL(Θ)為2FRSV-MN模型的對數似然函數;yt為t交易日的觀測樣本,包括資產收益率和對數已實現波動率,yt=(rt,xt)′;yT為T交易日的觀測樣本,包括資產收益率和對數已實現波動率,yT=(rT,xT)′;p(·)為概率密度函數;Ft為t交易日的信息集,Ft={y1,…,yt};且

(8)
其中,p(ht+1|Ft;Θ)為預測密度。
(8)式可以通過蒙特卡羅模擬近似得到,即

(9)

根據貝葉斯原理,濾波密度可以寫為
p(ht+1|Ft+1;Θ)∝p(yt+1|ht+1;Θ)p(ht+1|Ft;Θ)
(10)
其中,p(ht+1|Ft+1;Θ)為濾波密度。


(11)
下面給出2FRSV-MN模型的SIR濾波算法。







基于SIR濾波算法,根據(9)式得到似然估計為

(12)
從而,模型對數似然的估計為

(13)
上述對數似然估計不是無偏的,進行偏差修正得到無偏的對數似然的估計為

(14)

由于標準SIR濾波算法中的重抽樣(步驟3)是基于不連續的經驗分布函數,因此得到的似然函數并非參數的連續函數,這給借助優化方法最大化相應的模擬似然函數造成阻礙,同時無法采用常規方法計算參數估計的標準誤差。 為了克服這個問題,本研究對標準SIR濾波算法中的重抽樣步驟3進行修正,即
關于連續分布函數的具體構造形式及基于該分布的連續(分層)重抽樣方法參見MALIK et al.[36]的研究。
將SIR濾波算法中的步驟3替換為步驟3′,得到CSIR濾波算法。基于CSIR濾波算法得到連續的似然函數,進而結合極大似然原理可以得到2FRSV-MN模型參數的模擬極大似然估計為

(15)

根據“真實的”2FRSV-MN模型模擬生成樣本長度為2 500的觀測序列(資產收益率和對數已實現波動率),對該觀測序列運用基于CSIR濾波的極大似然方法進行估計,重復模擬和估計實驗100次,得到參數估計的均值、標準差和均方根誤差(RMSE)。基于CSIR濾波的極大似然估計方法采用MATLAB軟件編程,在Windows 7計算機上實現。


表1 數值模擬結果Table 1 Numerical Simulation Results
注:粒子數選取為500,下同。
準差都接近于RMSE,表明估計的有限樣本偏差很小。因此,運用基于CSIR濾波的極大似然方法估計2FRSV-MN模型可以獲得可靠的參數估計結果。
本研究采用2005年1月4日至2015年12月31日上證綜合(SSE)指數和深證成分(SZSE)指數共2 671個交易日的5分鐘高頻交易價格數據作為研究樣本,所有數據均來源于天軟數據庫。 第t交易日的指數對數收益率定義為rt=logPt-logPt-1,Pt為第t交易日的指數收盤價格。眾所周知,資產收益率的真實日度波動率不能直接觀測到,ANDERSEN et al.[1]采用日內高頻交易數據構建已實現波動率,給出它的估計量。第t交易日的已實現波動率定義為

(16)
其中,rt,j為第t交易日的第j個日內對數收益率,rt,j=logPt,j-logPt,j-1,Pt,j為第t交易日的第j個時間間隔上的收盤價;J為日內收益率數目。在理想的市場條件下,即不存在市場微觀結構噪聲以及資產可一直連續交易,RVt依概率收斂于積分波動率IV(即真實日度波動率)[2],即

(17)
其中,σ2(s)為資產在s時刻的瞬時波動率。但實際市場中往往存在非交易時間和市場微觀結構噪聲,此時RV不是積分波動率的一致估計量,而是存在源于非交易時間的下偏或源于市場微觀結構噪聲的上偏。
表2給出SSE指數和SZSE指數日度收益率、已實現波動率及其對數的描述性統計結果。 由表2可知,兩個指數的rt的均值都大于0,但在統計上不顯著;偏度小于0,峰度大于3,表明兩個指數的rt的分布呈現負偏和尖峰特征;Jarque-Bera統計量顯著,拒絕正態性假定。兩個指數的RVt的偏度、峰度和Jarque-Bera統計量都拒絕其為正態分布的假定。 但比較logRVt與RVt可以看到,logRVt的偏度、峰度和Jarque-Bera統計量都大大降低,雖然并不完全服從正態分布,但已經較為接近于正態分布。 圖1和圖2分別給出SSE指數和SZSE指數的rt和RVt時間序列圖以及rt的QQ圖和logRVt的自相關圖。由圖1和圖2可知,兩個指數的rt在抽樣階段內均展現明顯的波動率時變性和聚集性特征,rt的QQ圖表明其并不服從正態分布;兩個指數logRVt的自相關函數都是緩慢衰減的,表明波動率具有長記憶特征。

表2 rt、RVt和log RVt的描述性統計結果Table 2 Descriptive Statistics Results for rt, RVt and log RVt

(a)rt時間序列圖

(b)rt的QQ圖

(c)RVt時間序列圖

(d)log RVt自相關圖

(a)rt時間序列圖

(b)rt的QQ圖

(c)RVt時間序列圖

(d)log RVt自相關圖
基于SSE指數和SZSE指數數據,利用基于CSIR濾波的極大似然估計方法,得到2FRSV-MN模型的參數估計及其標準誤差、對數似然值和赤池信息準則(AIC),結果見表3和表4。為了比較起見,表中給出混合正態單因子已實現SV(1FRSV-MN)模型以及資產收益率新息t服從標準正態分布、標準學生t分布和標準GED分布等常見的一些分布的單因子和雙因子已實現SV模型的估計結果,具體模型包括1FRSV-N、1FRSV-t、1FRSV-GED、1FRSV-MN、2FRSV-N、2FRSV-t、2FRSV-GED和2FRSV-MN。 常見資產收益率新息分布函數的具體形式參見附錄。

表3 SSE指數參數估計結果Table 3 Parameter Estimation Results for SSE Index
注:v為標準學生t分布或標準GED分布的自由度。括號中數據為極大似然估計的漸近標準誤差,下同。
由表3和表4可知,SSE指數和SZSE指數已實現波動率的偏差修正參數ξ的估計值均小于0,表明兩指數已實現波動率均存在下偏,市場非交易時間效應強于微觀結構噪聲效應。所有模型中波動率持續性參數φ1的估計值均接近于1,表明滬深股市具有強的波動率持續性特征。在4個單因子模型中,兩個指數杠桿參數ρ1的估計值均為負值,表明中國滬深股市存在顯著的杠桿效應,但與歐美成熟股票市場相比并不強。 在4個雙因子模型中,兩個指數ρ1的估計值均為正值,ρ2的估計值均為負值,表明滬深股市杠桿效應只存在于短記憶波動率因子過程中,長記憶波動率因子過程中存在反向杠桿效應。
1FRSV-MN模型和2FRSV-MN模型均獲得比正態分布、學生t分布和GED分布模型更高的對數似然值和更低的AIC值,表明MN分布比其他分布能夠更好地刻畫資產收益率的非正態性。 事實上,根據AIC準則,在所有模型分布設定中,MN分布對于SSE指數和SZSE指數都獲得最好的收益率分布擬合效果。對于SSE指數,正態分布的擬合效果最差;對于SZSE指數,學生t分布的擬合效果最差。 比較單因子模型與雙因子模型的估計結果可知,雙因子模型比單因子模型具有更高的對數似然值和更低的AIC值,表明能夠描述波動率長記憶性的雙因子模型通過引入第2個波動率因子過程顯著改進了模型的擬合效果。特別地,2FRSV-N模型比1FRSV-MN模型具有更好的數據擬合表現,表明在波動率模型中考慮波動率長記憶性(雙因子波動率)比資產收益率的非正態性(尖峰、厚尾)更為重要。 比較各模型的對數似然值和AIC值,能夠綜合描述波動率長記憶性和資產收益率非正態性的2FRSV-MN模型在滬深股市獲得比其他模型更好的數據擬合效果。

表4 SZSE指數參數估計結果Table 4 Parameter Estimation Results for SZSE Index



圖3 SSE指數波動率濾波估計Figure 3 Filtered Volatility Estimates for SSE Index

圖4 SZSE指數波動率濾波估計Figure 4 Filtered Volatility Estimates for SZSE Index
準確測量金融市場風險對于金融機構的生存和發展乃至整個金融系統的穩定至關重要,VaR是市場風險管理中最廣泛使用的工具,它具有概念簡單、直觀和易于計算等優點,許多金融機構和風險管理者都通過計算VaR防范市場風險。本研究考慮基于1FRSV和2FRSV的4種分布模型的VaR估計。
概率為α的VaR定義為
Pr[rt (18) 其中,Pr為概率。 在1FRSV和2FRSV模型下,VaR的計算公式為 (19) 其中,zα為資產收益率新息分布的α左尾分位數。 根據5.2節給出的參數估計和波動率濾波估計,利用(19)式計算得到2FRSV-MN模型給定概率α∈{0.010,0.050}下SSE指數和SZSE指數的VaR結果,見圖5和圖6。為了檢驗VaR估計的準確性,進行后驗測試,包括失敗率檢驗和似然比檢驗。表5給出檢驗結果。由表5可知,對于概率為0.010和0.050,所有模型在5%顯著性水平下都通過了似然比檢驗,說明這些模型都能較好地測量金融市場風險。α=0.010時,1FRSV-N模型在滬深股市具有最好的風險測量效果,似然比值最低且失敗率最接近于相應的概率α=0.010。同理,α=0.050時,滬市1FRSV-MN模型和深市2FRSV-MN模型具有最好的風險測量效果。 (a)α=0.010時VaR的估計結果 (b)α=0.050時VaR的估計結果 (a)α=0.010時VaR的估計結果 (b)α=0.050時VaR的估計結果 表5 VaR估計失敗率檢驗和似然比檢驗結果Table 5 Results for Failure Rate and Likelihood Ratio Tests of VaR Estimates 本研究對傳統的低頻日度SV模型進行擴展,引入包含豐富日內高頻信息的已實現波動率,同時考慮已實現波動率的偏差修正、波動率長記憶性和資產收益率的非正態性(尖峰、厚尾)特征,構建2FRSV-MN模型。運用靈活且易于實現的基于連續粒子濾波的極大似然方法估計2FRSV-MN模型的參數,通過蒙特卡羅模擬實驗驗證估計方法的有效性。采用滬深股市SSE指數和SZSE指數5分鐘高頻交易數據進行實證檢驗,得到以下研究結論。 (1)滬深股市已實現波動率的偏差修正參數ξ的估計值均明顯小于0,表明已實現波動率是真實日度波動率的有偏估計,存在明顯下偏,滬深股市非交易時間效應強于微觀結構噪聲效應。 (2)所有模型中波動率持續性參數φ1估計值均接近于1,杠桿參數ρ1(單因子模型)或ρ2(雙因子模型)估計值均為負值,表明滬深股市具有強的波動率持續性和顯著的杠桿效應,且杠桿效應主要存在于短記憶波動率因子過程中,長記憶波動率因子過程中存在反向杠桿效應。 (3)根據模型估計的對數似然值和AIC值,2FRSV-MN模型比其他模型具有更好的數據擬合效果。 (4)基于VaR的估計結果表明,所有已實現SV模型都能較好地測量金融市場風險,但具有最好的風險測量效果的模型并非一定是具有最好的數據擬合效果的模型,這取決于選取的概率和數據。 概率為0.010時,1FRSV-N模型在滬深股市具有最好的風險測量效果;概率為0.050時,滬市1FRSV-MN模型和深市2FRSV-MN模型具有最好的風險測量效果。 本研究結果為波動率建模提供了更好的方法選擇,也豐富了市場風險測量的實證結果,進而為投資者和金融監管當局提供更準確的決策信息支持,實踐意義重大。 當然,本研究還存在一些不足,對于在模型中引入多重已實現測量、資產收益率的其他分布、馬爾科夫機制轉換、跳躍等,并考察其對市場風險測量和期權定價的影響需要進一步研究,這也是下一步研究的重點。 附錄:常見資產收益率新息分布 (1)標準正態分布 (20) (2)標準學生t分布 (21) (3)標準GED分布 (22) 需要指出的是,除了上述3種常見分布,近年來偏斜學生t(SKt)分布也被應用于對資產收益率分布建模,如吳鑫育等[39]和LIU et al.[40]的研究。 但是本研究通過實證研究發現,在已實現SV模型中引入SKt分布相比引入更簡單的t分布模型擬合并沒有明顯改進,估計結果非常類似。 因此,為了節省篇幅,本研究沒有給出基于SKt分布的實證結果。





6 結論




