劉虹曼,李樹有
(1.遼寧理工學院基礎教學部,遼寧 錦州 121000;2.遼寧工業大學理學院,遼寧 錦州 121001)
強正態分布是偏態分布[1-2]的一種.1985年,Azzalini首次提出偏態分布理論.2007年,Gupta[3]在利用偏態分布分析偏態單峰密度的數據時通過大量的模擬研究,提出了一種可行性較強的傾斜模型,將正態分布作為其中的一個特例,命名為強正態分布,并做出如下定義:
如果隨機變量X具有累積分布函數[4]
FX(x;α)=P(X≤x)=(Φ(x))α,-∞
則稱其服從強正態分布,其中Φ(·)表示標準正態分布的分布函數[5].
1998年,Nelsen提出了Copula函數[6],并給出了定義及基本性質.Copula函數描述的是變量間的相關性,實際上是一類將聯合分布函數與它們各自的邊緣分布函數連接在一起的函數,因此也被叫作連接函數.
令u=(u1,u2,…,un),?u1,u2,…,un∈[0,1],Copula函數表示為C:[0,1]n→[0,1],對于(x1,x2,…,xn)∈(-∞,∞)×(-∞,∞)×…×(-∞,∞),稱
FX1,X2,…,Xn(x1,x2,…,xn)=C{FX1(x1),FX2(x2),…,FXn(xn)}
為連接函數.
由Clayton連接函數的定義,有n元Clayton連接函數
即對α>0,(U1,…,Un)有聯合分布函數[7]
Gupta于2013年得到如下結論[8]:
(1)對0 (2)對m (3)對0 (4)已知U1=u1,…,Um=um,(Um+1,…,Un)的條件概率密度函數為 分布函數為 FX1,X2,…,Xn(x1,x2,…,xn)= P{X1≤Φβ1(x1),X2≤Φβ2(x2),…,Xn≤Φβn(xn)}= Cα,n(Φβ1(x1),Φβ2(x2),…,Φβn(xn))= (Φ(x1)-β2/α+Φ(x2)-β2/α+…+Φ(xn)-βn/α-(n-1))-α, 隨機變量(X1,…,Xn)的聯合概率密度函數為 如果對于參數β1>0,β2>0,…,βn>0,隨機變量(X1,…,Xn)有上述聯合分布函數FX1,…,Xn(x1,…,xn),則隨機變量(X1,…,Xn)服從n元強正態分布,并有以上概率密度函數fX1,…,Xn,記作(X1,…,Xn)~MPN(α,β1,β2,…,βn). 根據以上定義,得到如下性質: 性質如果隨機變量(X1,…,Xn)服從n元強正態分布,那么: (1)X1~PN(β1),X2~PN(β2),…,Xn~PN(βn); (2)隨機變量(X1,…,Xn)的聯合概率密度函數為 (3)隨機變量(X1,…,Xn)的聯合分布函數為 FX1,X2,…,Xn(x1,x2,…,xn)= (Φ(x1)-β1/α+Φ(x2)-β2/α+…+Φ(xn)-βn/α-(n-1))-α; (4)隨機變量(X1,…,Xn)的聯合生存函數為 (5)已知X1=x1,X2=x2,…,Xm=xm,則(Xm+1,…,Xn)的條件概率密度函數為 條件分布函數為 證明對于上述性質(1),當n元隨機變量(X1,…,Xn)服從n元強正態分布時,根據Clayton連接函數的性質可知結論顯然成立.性質(2)可以通過對n元聯合分布函數進行求導計算得到.對于性質(3)和性質(4),可以分別根據n元聯合分布函數和n元聯合生存函數定義求得,即: FX1,…,Xn(x1,…,xn)=P{X1≤Φβ1(x1),X2≤Φβ2(x2),…,Xn≤Φβn(xn)}= Cα,n(Φβ1(x1),Φβ2(x2),…,Φβn(xn))= (Φ(x1)-β1/α+Φ(x2)-β2/α+…+Φ(xn)-βn/α-(n-1))-α; 對于性質(5),根據條件概率分布函數的定義,當X1=x1,X2=x2,…,Xm=xm時,有 即可求得條件分布函數 對其求導,即可得條件概率密度函數 為了估計n元強正態分布的未知參數α,α1,…,αn,設β1=αα1,β2=αα2,…,βn=ααn. 根據其已知概率密度函數推導出似然函數為 對其求對數得到對數似然函數為 分別對α,α1,α2,…,αn進行極大似然估計,即分別對α,α1,α2,…,αn求偏導,并使其等于零聯立得到: 因為以上聯立方程不能直接求出未知參數α,α1,…,αn的極大似然估計值,所以接下來利用牛頓迭代法對參數α,α1,…,αn的極大似然估計值進行進一步計算.令: 將函數f1,f2,f3,…,fn+1分別對參數α,α1,α2,…,αn-1,αn求偏導,則有: ? ? 依此進行下去,可得 由牛頓迭代法得到以下公式: 即 將中國各個主要城市的月降水量分為12組數據進行去差異化整理,整理結果如表1所示.將其作為樣本數據[10](表1中對數據保留三位小數),對未知參數進行參數估計. 表1 中國各主要城市月降水量 對于以上12組數據,即n=12,利用Matlab對α1,α2,…,α12這12個未知參數進行估計,得到參數估計值(精度為第n次估計值與第n+1次估計值差的絕對值小于10-3): α=4.223,α1=0.704,α2=0.632,α3=0.656,α4=0.611,α5=0.706,α6=0.697, α7=0.802,α8=0.755,α9=0.674,α10=0.771,α11=0.734,α12=0.645. 根據所設參數β1=αα1,β2=αα2,…,βn=ααn,可計算出: β1=2.973,β2=2.669,β3=2.770,β4=2.580,β5=2.981,β6=2.943, β7=3.387,β8=3.188,β9=2.846,β10=3.256,β11=3.099,β12=2.724. 本文主要研究了n元強正態分布的各項性質,以及對未知參數的極大似然估計.主要得出以下結論: (1)推導得到了n元強正態分布具有聯合概率密度函數、聯合分布函數、聯合生存函數、條件概率密度函數、條件分布函數的性質. (2)根據所取的樣本數據,即180個中國部分主要城市的月降水量數據,對α1,α2,…,α12這12個未知參數進行估計,得到參數估計值(精度為第n次估計值與第n+1次估計值差的絕對值小于10-3)α1,α2,…,α12.根據所設參數β1=αα1,β2=αα2,…,βn=ααn,可計算出β1,β2,…,β12.
2.2 n元強正態分布的極大似然估計
2.3 應用實例

3 總結