摘要:利用參數方法計算VaR的關鍵在于對收益率分布形式的假定是否合理。為了充分反映金融收益的統計特性,并更好地刻畫厚尾特征,本文在利用ARMA-GARCH模型過濾了收益序列的自相關和波動聚類特性后,采用混合正態分布模型分析資產收益的VaR度量,并對上證綜指獲得的日收益率序列進行了實證研究。比較分析混合正態分布和正態分布兩種假定下的VaR。結果表明:混合正態分布假設能夠反映收益分布5%的厚尾特征并準確地刻畫1%的厚尾部分,避免了正態分布假設低估風險的缺陷,保證了VaR的準確性。
關鍵詞:風險價值;厚尾;ARMA-GARCH模型;混合正態分布
中圖分類號:F830 文獻標識碼:A
文章編號:1000-176X(2009)05-0068-06
一、引 言
金融資產價格的變化可能會使投資者面臨很大的潛在損失。為了衡量損失的程度,JP. MORGAN公司率先提出VaR(Value-at-Risk,風險價值或在險價值)方法,并在實踐中得到廣泛應用,成為金融市場風險測量的主流方法。VaR是在一定置信水平和一定持有期內,某一金融工具或其組合在未來資產價格波動下所面臨的最大可能損失。VaR方法的優點是用一個簡單易懂的數字即風險價值概括了投資者在金融市場的波動中面臨的風險。VaR的計算分為參數方法和非參數方法兩種。參數方法是假定投資收益服從某一分布,并采用特定的估計方法估計分布參數,然后,由該分布計算得出VaR。而非參數方法并不假定收益存在某種分布形式,VaR是從經驗分布中獲得的。非參數方法的缺點是完全依賴于特定的數據集,不能對過去觀察不到的數據進行外推,在運用中受到限制。實際中比較常用的是參數方法。
利用參數方法計算VaR的關鍵在于對收益率分布形式的假定是否合理。大量文獻資料和研究已經表明,金融收益數據的尾部集中了大量的概率分布,顯現出“厚尾”特性,而不能采用傳統的正態分布假定;另外,資產收益序列往往又具有波動聚類現象。如何處理收益的波動聚類并有效地刻畫金融資產收益序列的尾部特征,對于提高VaR度量模型的準確度至關重要。
對于波動聚類問題,廣義自回歸條件異方差模型(GARCH模型)通過假定數據方差項的某種自相關性,提供了收益波動性建模的系統框架,但在該模型中,通常假定收益率殘差服從為條件正態分布,而不能刻畫收益分布的厚尾特征。雖然對GARCH模型有很多發展和改進(如TARCH、EGARCH等),并可以假定殘差服從分布或廣義誤差分布(GED),但并不能充分而準確地描述實際收益數據的尾部特征,而且在分布的選擇上缺乏靈活性和適應性。在分析數據的尾部變化方面,國外很多文獻利用極值理論(EVT,Extreme Value Theory)對分布的尾部進行擬合和建模。McNeil[1-2-3]使用極值理論研究了嚴重損失分布的尾部估計和異方差序列的尾部風險度量;Hans N.E.Bystrom[4]比較分析了分塊樣本極大值和門限極值理論模型的性能;Danielsson and de Vries[5]比較各種模型的表現情況,認為EVT模型的表現優于參數方法和歷史模擬方法;Lee and Saltoglu[6]運用EVT模型對亞洲股票市場進行分析,認為歷史模擬法和參數方法比EVT模型表現更好。在國內,田宏偉等[7]研究了極值理論在市場風險度量和在匯率風險價值計算中的應用;朱國慶[8]、田新時[9]等也利用極值理論討論了上海股市收益的厚尾和風險度量問題。極值理論雖然提供了超越樣本的預測能力,但在實際運用中存在很大的缺陷。極值理論是完全基于收益序列尾部特征的,只考慮屬于極端值的樣本,一方面會使得樣本較少,另一方面也忽略了尾部以外的信息。另外,運用極值理論時,閥值的選取對模型也有很大的影響。
研究收益分布的厚尾特征對于衡量潛在損失具有非常重要的意義,而如何設定收益的分布形式,有效地描述和刻畫厚尾性對于VaR的計算又存在直接影響。為了充分反映金融收益的統計特性,并更好地捕捉尾部信息,本文結合ARMA-GARCH模型和混合正態分布的假定討論資產收益的VaR度量。采用混合正態分布刻畫厚尾特征,一方面在于盡量減少傳統的正態分布等假定帶來的模型誤設風險,另一方面又保持正態分布比較方便的特征。
二、VaR方法
VaR是在一定的置信水平下和一定的目標期間內,某金融工具或投資組合可能出現的最大損失(或最壞情況下的損失)。如果用r表示資產的日收益率,并假定其分布為f(r),則對于選定的置信水平α,VaR可以表示為:
∫-VaR-∞f(r)dr=1-α(1)
VaR實際上是在一定的目標期間內,收益分布對應于尾部水平(1-α)的分位數。例如,置信水平選取α=95%,則VaR就是收益分布的5%分位數,具體可以描述為:損失的水平在95%的置信水平下不會超過這個數值。
VaR方法準確地給出了風險的大小,是一個非常有用的概括風險的方法,但VaR只是預期損失將以概率(1-α)超過VaR值,而并沒有給出對損失的具體描述。為了分析損失的程度,引入條件VaR來度量在損失超過VaR值時損失的期望值,用公式表示為:
ES=-E(r|r≤-VaR) (2)
三、ARMA-GARCH模型
對收益率序列r,通常采用ARMA模型分析序列的自相關性。ARMA模型的形式為:
rt=μ+∑pi=1φirt-i+ut-∑qj=1θiut-i(3)
其中,{ut}是均值為0、方差為σ2的白噪聲序列。ARMA模型中關于ut是白噪聲序列的假定,使得模型無法有效解釋收益序列中經常觀察到的波動聚類現象,因此,在ARMA模型中進一步引入GARCH效應對波動性建模,本文采用通常使用的GARCH(1,1)模型,其形式為:
ut=σtεt, σ2t=ω+αu2t-1+βσ2t-1 (4)
其中,ω>0,α≥0,β≤1,α+β<1。{εt}是一個均值為0、方差為1的獨立同分布殘差序列,通常假定為標準正態分布或標準化的學生t分布。從GARCH(1,1)模型的表達式可以看出,如果u2t-1或σ2t-1較大,則σ2t較大,這意味著大的u2t-1會緊跟著另一個大的u2t,因此,模型有效地描述了序列中存在的波動聚類現象。為了提高GARCH模型在尾部的能力,可以將標準正態分布假定替換為t分布假定。不過,最近關于時間序列的經驗研究顯示GARCH模型的尾部太薄,即使是假設εt服從t分布的GARCH模型,可能也并不適合描述實際數據的尾部。
四、混合正態分布
ARMA-GARCH模型過濾之后得到殘差序列{εt:εt=ut/σt}是獨立同分布隨機變量,但傳統上對殘差服從標準正態分布或標準化t分布的假定并不能很好地描述分布的尾部特征。為了使分布假設更合理,同時又充分反映收益的統計特性,避免極值理論中只關注極端值的情況,采用混合正態分布方法有很好的實用價值,它在保持正態分布比較方便的基礎上能夠刻畫數據的厚尾特性。
混合正態分布的概率密度是幾個正態概率密度的線性組合。假定{εt}服從混合正態分布,則其概率密度為:
f(ε|θ)=∑kj=1pjfj(ε)(5)
其中,pj≥0且∑kj=1pj=1;fj(ε)為正態分布N(μj,σ2j)的密度函數,j=1,…,k,并假設k個正態分布之間是獨立的;θ=(μ1,…,μk,σ21,…,σ2k,p1,…,pk)為混合正態分布的參數。如果對樣本容量為t的數據序列引入缺失數據的隱變量z=(zij),i=1,…,t;j=1,…,k,其中zij的取值為:當第i個樣本來自于混合分布的第j個正態分量時,令zij=1,否則zij=0,則結合式(5)可知,f(εi|zij=1)=fj(ε),f(zij=1|p)=pj。因此,在混合正態分布中,各樣本值均由k個正態分布中某一個正態分布的統計特性所決定,或者說,各樣本值均來源于k個正態分布中的某一個分布。參數θ中的p1,…,pk反映了樣本來源于各個正態分布的概率;而μ1,…,μk,σ21,…,σ2k決定k個正態分布的統計特性。
金融資產收益率在過濾了自相關和波動聚類之后,在大部分“正常的”時間里可近似認為服從標準正態分布,而在“異常的”時間可能是來源于一個具有較大方差的正態分布。金融資產收益率具有厚尾特性而不能用正態分布來描述的原因可能也正是因為收益具有的“異常”特性,這種異常往往會給投資者帶來比預期更大的損失。基于上述思想,采用混合正態分布擬合ARMA-GARCH過濾之后的殘差,不僅可以充分描述收益的統計特性,而且可以反映收益的厚尾特征。為了直觀地說明混合正態分布對厚尾的描述,以下考慮兩個正態分布混合下的情況,表1給出了混合正態分布的參數設置以及分布的統計特性。從表1中可以看出,3個分布的均值和偏度均為0;εB和εC的標準差和峰度均大于εA,而且εB和εC的峰度遠遠大于3。εA實際上服從標準正態分布N(0,1),這說明εB和εC相對于正態分布εA顯示出尖峰的特征。通過混合正態分布εB、εC分別與均值、方差相同的正態分布的尾部放大對比,可以看出:相對于正態分布而言,εB、εC的左尾現象非常明顯。這在一定程度上表明,混合正態分布這一假設,在保持正態分布特征的基礎上,通過賦予各正態分量合適的參數以及適當的比例,可以用于描繪和刻畫序列的尾部特征。
圖1 混合正態分布與均值方差相同的正態分布尾部放大對比圖
假定獨立同分布的標準化殘差服從混合正態分布時,分布參數θ按照極大似然估計方法求參數是很困難的。極大似然估計在計算方面的復雜程度依賴于似然函數的形式,而混合正態分布的似然函數根據式(5)可得:
f(ε1……εt|θ)=∏ti=1f(ε|θ)=∏ti=112π∑kj=1pjσjexp-(εi-μj)22σ2j (6)
極大似然估計的計算很復雜,無法利用解析方法獲得參數的估計值。由于在引入隱變量z后,f(zij|p)事實上是一個多項分布Multinomial(1,p),因此,在實際中,參數估計常采用EM算法或貝葉斯方法。
五、實證分析
本文利用上證綜指獲得的收益率序列rt作為樣本計算收益率的VaR。由于中國股市從1996年12月16日起實行漲跌停板交易制度,為了提高模型的精度,減少極端異常值的干擾,樣本期間取為1996年12月16日至2008年11月11日,樣本數量為2 874個,數據來源于CCER經濟金融研究數據庫。實證分析的過程是先用ARMA-GARCH模型對收益率序列rt分離相關性和波動聚類特征,通過過濾得到近似獨立同分布的殘差序列εt;然后假設殘差εt服從混合正態分布,并計算該分布的VaR和ES值;最后計算收益率序列rt的VaR和ES值。
1. 收益率序列的統計特性及ARMA-GARCH模型
在考察的樣本期間內,收益率集中在(-0.1,0.1)之間,具體的描述統計以及正態性檢驗結果如表2所示。
表2 收益率數據的描述統計和正態性檢驗結果
平均值
標準差
中位數
最大值
最小值
0.000371
0.017454
0.000498
0.098570
-0.094441
偏 度
峰 度
Jarque-Bera檢驗
-0.050992
7.788802
統計量=2 747.427,P = 0.000000
Jarque-Bera正態性檢驗(又稱為峰度-偏度檢驗)結果表明,收益率序列rt顯著異于正態分布。圖1繪制了收益率的核密度圖以及假定收益率服從正態分布時的概率密度圖,從圖1中可以看出,收益率序列存在明顯的尖峰厚尾現象,特別是左尾是很明顯的,這表明,收益率在負值時異常值出現的概率更大。
圖1 收益率的核密度圖和正態分布假設下的概率密度圖
進一步采用Augmented Dikey-Fuller方法對收益率進行單位根檢驗,t統計量為-54.79,小于顯著性水平1%的Mackinnon臨界值-3.43,因而拒絕單位根假設,即收益率序列rt是平穩的,可以用ARMA模型分析序列可能存在的自相關問題。相關計算表明,直至滯后36期,rt序列的自相關系數最大僅為0.079,基本上不存在明顯的自相關現象,ARMA模型簡化為rt=0.000371+μt;而考察r2t序列的自相關結構時,表明r2t序列存在相關性,說明序列rt可能存在ARCH效應。對是否真實存在ARCH效應, LM檢驗的結果表明,當選擇滯后階數為3時,相伴概率P=0,即rt序列存在ARCH效應。由于日收益率序列rt只是存在ARCH效應,因此,ARMA-GARCH模型簡化為:
rt=μ+ut, ut=σtεt, εt~iid(0,1)
σ2t=ω+αu2t-1+βσ2t-1(7)
在上述模型中,如果假定殘差εt為標準正態分布,利用準極大似然估計(QML)方法并結合模型參數的顯著性檢驗,模型的估計結果為:
σ2t=4.637995×10-6+0.110810u2t-1+0.880523σ2t-1(8)
為了檢驗模型的效果,對標準化的殘差序列εt進行LM檢驗。結果表明,在滯后3階的情況下,相伴概率為0.73,表明序列εt已不存在ARCH效應。進一步計算εt序列和ε2t序列的自相關和偏相關系數,計算結果均接近于0,表明殘差序列εt不存在ARCH效應,也不存在自相關現象。因此,可以認為標準化殘差序列εt是獨立同分布序列。
2.殘差序列εt的混合正態分布假設
如果模型(7)、(8)的設定是正確的,那么在正態分布假設下,ARMA-GARCH模型過濾后得到的標準化殘差εt序列應服從標準正態分布。然而通過表3中關于εt序列的描述統計和正態性檢驗數據可以看出,雖然序列的平均值和標準差均接近標準正態分布,但是峰度值卻顯著大于3,表明序列存在尖峰現象。
進一步從圖2中殘差數據的核密度圖和標準正態分布的概率密度圖中可以看出,殘差序列存在明顯的尖峰厚尾現象。這表明經過ARMA-GARCH模型過濾后,殘差序列εt依然存在厚尾現象,殘差服從標準正態分布的假設并不合理。
圖2 殘差數據的核密度圖和標準正態分布的概率密度圖
本文假定標準化殘差服從混合正態分布,分布參數的估計值及標準誤差如表4所示。對分布的估計結果進行秩和檢驗,統計量為83.123,P值為 0.015,表明在0.01的水平下不能拒絕分布假設。擬合的混合正態分布其均值為0.0111,均方差為1.0017,峰度為5.1600,都接近于殘差序列相應的統計值。
圖3給出了殘差數據在混合正態分布和正態分布兩種擬合下的對比圖,從圖3中可以看出,相對于正態分布,混合正態分布不僅能充分反映出序列的統計特性,而且能夠刻畫序列的尾部特征。從混合正態分布的參數值可以看出,數據來源于正態分布N(0.049137,0.706401)的概率約為73%;而來源于正態分布N(-0.093617,1.542316)的概率約為26%。
圖3 殘差數據在兩種分布假設下擬合的對比圖
3.VaR的計算結果及檢驗
以下計算并比較在混合正態分布和正態分布兩種假設下的VaR,其中,置信水平取α=99%和α=95%兩種情況。
由式(1)計算混合正態分布和正態分布的VaR和ES,結果如表5所示。從表5中可以看出,混合正態分布在99%置信水平下的VaR和ES均明顯大于正態分布的相應值,這正是由于混合正態分布考慮了數據的尾部特征。在95%的置信水平下,兩種分布的VaR和ES相對來說比較接近,表明對于該例數據,混合正態分布更關注1%的厚尾。
由以上計算得到的殘差VaR和ES,結合GARCH模型(7)、(8)式得到的條件標準差σt,將εt的VaR和ES分別代入表達式rt=σtεt,則可以獲得收益率序列rt的動態VaR和ES估計序列。表6給出了對應于兩種分布假設、收益率rt在99%和95%置信水平下VaR和ES的統計結果。從表6中也可以看出,混合正態分布假設下收益率在99%置信水平的VaR和ES均明顯大于正態分布假設的相應值,而兩種分布假設下95%置信水平的VaR和ES比較接近,這也正是由于針對給定的收益率樣本,混合正態分布更關注收益率1%的厚尾。
VaR的準確性可以采用基于失效率的檢驗方法進行評估。對于給定時間窗口T下的T個樣本,如果定義失效率N為樣本值超過VaR的個數,即異常樣本的個數,那么在T較大時,N應趨近于T(1-α),其中α為置信水平。對于T天的動態VaR,通過比較異常個數N的理論值和實際值,可以初步判斷VaR的準確性。進一步采用Kupiec[10]提供的方法,構建對數似然比統計量:
LR=-2ln[(1-α)T-NαΝ]+2ln[(1-N/T)T-N(N/T)N](9)
如果LR>3.84,則認為(1-α)并不是樣本值超過VaR的真實概率,即VaR與設定的置信水平α并不對應。表7給出了不同時間窗口T的各種VaR類型中異常個數的理論值、實際值和統計量。從表7中可以看出,當置信水平為95%時,實際觀察到的值在兩種分布假設下均非常接近或等于理論值,而且統計量均小于3.84。這說明兩種分布假設都能描述5%的厚尾部分。然而,當置信水平為99%時,正態分布假設下的實際值明顯大于混合正態分布假設,統計量也出現大于3.84的情況,而混合正態分布假設下的值接近于理論值,統計量也都小于3.84。這說明混合正態分布假設更適合描述分布的厚尾特征,能夠準確刻畫1%的厚尾部分,而正態分布假設在1%的尾部上大大低估了風險。
表7各種VaR類型中異常個數的理論值、實際值和統計量
VaR類型
時間窗口T下,異常個數的實際值(理論值)
六、結 論
利用參數方法計算VaR的關鍵在于對收益率分布形式的假定是否合理。為了充分反映金融收益的統計特性,并更好地刻畫厚尾特征,本文在利用ARMA-GARCH模型過濾了收益序列的自相關和波動聚類特性后,采用混合正態分布模型分析資產收益的VaR度量,并對上證綜指獲得的日收益率序列進行了實證研究。研究表明,即使是過濾了自相關和異方差效應,日收益率序列仍然存在厚尾現象,并不服從傳統的正態分布,而混合正態分布假設能夠反映收益分布5%的厚尾特征并準確地刻畫1%的厚尾部分,避免了正態分布假設低估風險的缺陷,保證了VaR的準確性。應當指出的是,本文假定混合分布的參數在樣本期間為常數,如果能夠判斷出收益序列或金融數據在不同時期存在顯著的變化,則應當考慮分布參數的可變性。
參考文獻:
[1] McNeil, A.J. Estimating the Tails of Loss Severity Distributions Using Extreme Value Theory[J]. ASTIN Bulletin,1997,(27):117-137.
[2] McNeil, A.J. Extreme Value Theory for Risk Managers[M].Internal Modeling and CAD. Risk Book,1999.
[3] McNeil, A.J. Estimation of Tail-related Risk Measures for Heteroscedastic Financial Time Series:An Extreme Value Approach[J]. Journal of Empirical Finance,2000,(7):271-300.
[4] Hans N.E.Bystrom. Managing Extreme Risk in Tranquil and Volatile Markets Using Conditional Extreme Value Theory[J]. International Review of Financial Analysis,2004,(13):133-152.
[5] Danielsson J.,C.G.de Vries. Value at Risk and Extreme Returns, London School of Economics[J].Financial Markets Group Discussion Paper,1997,(273).
[6] Lee, Saltoglu. Assessing the Risk Forecasts for Japan[J]. Japan and the World Economy, 2002,14(1):63-87.
[7] 田宏偉,詹原瑞,邱軍. 極值理論(EVT)方法用于受險價值(VaR)計算的實證比較與分析[J]. 系統工程理論與實踐,2000,(10).
[8] 朱國慶,張維. 關于上海股市收益厚尾性的實證研究[J].系統工程理論與實踐,2001,(4).
[9] 田新時,郭海燕. 極值理論在風險度量中的應用——基于上證180指數[J].運籌與管理,2004,(1).
[10] Kupiec, Paul. H.Techniques for Verifying the Accuracy of Measurement Models[J].Journal of Derivatives,1995,(3):73-80.
[11] 菲利普#8226;喬瑞(Philippe Jorion).風險價值VaR[M].陳躍,等譯,北京:中信出版社,2004.10.
[12] Ruey S.Tsay. 金融時間序列分析[M]. 潘家柱譯,北京:機械工業出版社,2006.4.
[13] 詹姆斯 D.漢密爾頓. 時間序列分析[M]. 劉志明譯,北京:中國社會科學出版社,1999.12.
[14] Clark. A Subordinated Stochastic Process Model with Finite Variance for Speculative Prices[J].Econometrica,1973,(1):135-155.
[15] Zangari, P.An Improved Methodology for Measuring VAR, RiskMetrics Monitor[M].Reuters/JP Morgan, Second quarter,1996.
[16] Venkataraman, S.Value at Risk for a Mixture of Normal Distributions: The Use of Quasi-Bayesian Estimation Technique[J].Economic Perspectives, Federal Reserve Bank of Chicago, March/April,1997,21(2):2-13.(責任編輯:于振榮)
VaR Measures Based on Mixture of Normal Distributions
Abstract: In order to describe the statistic character and account for the characteristic of fat tails of return series, this paper focuses on the VaR analysis for fat-tailed financial returns based on mixture of normal distributions combined with ARMA—GARCH Model. We firstly build an ARMA-GARCH Model to fit the correlationship and volatility clustering of return series, then we propose the statistical models of mixture of normal distributions to estimate VaR and ES instead of normal distribution. The empirical study of the return series of Shanghai stock index shows that mixtures of normal distributions can well fit the return series and performs well on one percent of the distribution’s tail. Comparing with normal distribution, mixtures of normal distributions can model fat tails while preserving some convenient characteristics of normal distribution and enhance the accuracy of VaR.
Key words: Value-at-Risk (VaR); fat tails; ARMA-GARCH model; mixture of normal distributions