摘要本文介紹了一種偏斜-t分布的隨機數生成方法及其Matlab實現。然后,以GARCH模型為例,探討了該隨機數生成器的在參數估計中的表現。極大似然估計的結果表明,各個系數的估計量均具有無偏性。這也就是說,該隨機數生成器可以有效地應用于時間序模型,如GARCH模型的模擬。本研究的隨機數生成器為基于蒙特卡羅技術,進一步討論時間序列的偏斜特征如何影響模型參數估計的無偏性、效率性和漸近正態性等統計特性提供了基礎。
關鍵詞偏斜 GARCHMatlab 極大似然
中圖分類號:G633.6文獻標識碼:A
蒙特卡羅模擬是統計研究中的重要技術,而生成隨機數是該項技術的重要步驟之一。對于服從均值為0、方差為1的分布來講,傳統的隨機數生成器大多應用于對稱分布的隨機數序列的生成過程,如正態分布和學生-t分布等。但是,近年來,在時間序列建模領域,特別是金融時間序列的建模中,偏斜證據越來越多。
Peir€?(1999)發現美國、英國、日本和加拿大等世界幾個主要發達國家的股指和匯率的收益率均表現出顯著的偏斜特征。Campbell Hentschel (1992)以及Glosten et al. (1993)等也發現,金融時間序列經非對稱GARCH模型擬合后的標準化殘差仍然存在顯著的偏斜。國內的研究如蔣春福等(2007)等。可見,已有不少證據顯示時間序列數據,特別是金融資產的收益率數據常常表現出偏斜特征。
本文介紹了一種可用以生成偏斜-t分布的隨機數生成方法,并基于Matlab 6給出了具體的程序。最后,以GARCH建模為例展示了利用該隨機數生成器模擬GARCH序列并進行極大似然估計的結果。
1 偏斜-t分布的隨機數生成方法
自由度較小時的學生-t分布和峰度系數小于2時的GED分布都比正態分布具有更高的峰度(超額峰度)。但這三種分布都是對稱的。Hansen(1994)推廣了傳統的學生-t分布,并進一步引入了偏斜參數。設隨機變量S服從偏斜參數為、自由度為的偏斜-t分布(Skew-t),其概率密度函數如下:
其中,和分別是偏斜系數和自由度,-1<<1;sgn(·)是符號函數;a、b和c都是與和有關的常數。當>0(<0)表示分布右(左)偏斜,||越大,偏斜程度越嚴重。Skew-t分布均值為0方差為1,因此可以作為GARCH模型的條件分布。①
服從Skew-t分布的隨機數生成算法由Jondeau Rockinger(2003)給出。設隨機變量X服從自由度為v的學生-t分布,其概率密度函數為,
其中v為自由度。X的累積分布函數(CDF)為。
首先生成服從(0, 1)均勻分布的隨機數X,t=1,2,…,T,其中T是模擬的樣本量;然后,按照如下公式計算每個X所對應的S,
其中,Fv-1(·)表示以v為自由度的傳統學生-t分布CDF的逆函數。這樣就可以得到服從偏斜參數為、自由度為v的Skew-t分布的隨機數序列{S|t=1,2,…,T}。
2 基于Matlab6的服從偏斜-t分布的隨機數生成器
根據公式和,我們可以編制如下的隨機數生成器。該隨機數生成器在WindowsXP環境下,利用Matlab6編制。
function robs = rskewt(u, v, n)
rand('state',sum(100*clock)); %設置隨機數種子
x=rand(n,1); %生成均勻分布的隨機數
robs =zeros(n,1); % 0向量,用于存儲生成的隨機數
c=gamma(v/2+0.5)/(sqrt(pi*(v-2))*gamma(v/2)); a=4*u*c*(v-2)/(v-1); b=sqrt(1+3*u^2-a^2);
for i = 1:n,
if x(i)<(1-u)/2,robs(i)=1/b*((1-u)*sqrt((v-2)/v)*tinv(x(i)/(1-u),v)-a);
else, robs(i)=1/b*((1+u)*sqrt((v-2)/v)*tinv((x(i)+u)/(1+u),v)-a);end;
end;
以上程序中,輸入參數u是自由度,v是偏斜系數,n是需要生成的隨機數個數利用該隨機數生成器,本研究考慮自由度v取值為6(尖峰、厚尾),偏斜系數u的取值考慮-0.3、0和0.3等三種情況。
3 應用舉例:模擬GARCH序列
在所有的GARCH族模型中,GARCH (1, 1)模型形式最為簡潔。考慮如下模型,
其中,為均值方程中的截矩項;為了確保方差過程的非負性和平穩性,>0,≥0,≥0以及+<1。記參數向量=(,,,),本研究使用的真實參數向量將被設置為(0.1,0.05,0.05,0.8)。模擬的樣本量T取為2500。為了估計參數向量,考慮極大化如下似然函數,
于是,即可得到參數向量的極大似然估計量。重復以上過程N=500次即可得到各個系數的極大似然估計量的描述性統計結果(表1)。
表1 系數的極大似然估計量的描述性統計
從表1可以看出,各個系數的估計結果的均值都是非常接近真實值的。統計上來講,各個系數經500次重復后極大似然估計值的均值與真實值之間的差異均小于1倍標準差,因此,不能拒絕各個系數的抽樣分布的均值等于真實值。可以認為,本文的隨機數生成器可以很好地應用于時間序列,如GARCH序列的模擬過程。
4 結論
鑒于蒙特卡羅模擬技術是統計研究的重要手段之一,而應用該技術的重要步驟之一便是生成服從某種分布的隨機數。特別的,在模擬時間序列模型,如GARCH模型的模擬過程中,往往需要生成均值為0、方差為1隨機數序列。傳統的隨機數生成器大多是應用于對稱分布的隨機數生成過程,如正態分布和學生-t分布等。
本文介紹了一種偏斜-t分布的隨機數生成技術,并采用Matlab6給出了具體實現的代碼。最后,應用該隨機數生成器模擬GARCH序列并進行參數估計。極大似然估計的結果表明,利用該隨機數生成過程,所得到的服從偏斜-t分布的隨機數序列可以產生無偏的估計量。這些結果說明,本文的隨機數生成器可以很好地應用于時間序列,如GARCH序列的模擬,從而為進一步使用蒙特卡羅技術,討論條件分布的偏斜特征如何影響極大似然估計量無偏性、效率性和漸近正態性等統計特性提供了基礎。
注釋
①關于Skew-t分布的其它細節請參見Hansen (1994)。
參考文獻
[1]Peir€?A. Skewness in financial returns[J]. Journal of Banking Finance, 1999. 23(6): 847~862.
[2]Campbell J Y, Hentschel L. No news is good news : An asymmetric model of changing volatility in stock returns[J]. Journal of Financial Economics, 1992.31(3): 281~318.
[3]Glosten L R, Jagannathan R, Runkle D E. On the relation between the expected value and the volatility of the nominal excess return on stocks [J]. Journal of Finance, 1993.48(5): 1779~1801.
[4]蔣春福,李善民,梁四安.中國股市收益率分布特征的實證研究[J].數理統計與管理, 2007.26(4):710~717.
[5]Hansen B E. Autoregressive conditional density estimation[J]. International Economic Review, 1994.35(3): 705~730.
[6]Jondeau E, Rockinger M. Conditional volatility, skewness, and kurtosis: existence, persistence, and comovements[J]. Journal of Economic Dynamics Control, 2003.27(10): 1699~1737.