【摘要】本文綜述了正態分布的最新發展狀況,給出了正態分布的概念和公式,主要論述了正態分布的各種擴展,包括漸近正態分布、二元正態分布、離散正態分布、廣義正態分布、對數正態分布、多元正態分布、廣義逆正態分布、偏正態分布和截尾正態分布等,并論述了其最新進展和應用動態.
【關鍵詞】正態分布;廣義正態分布;多維正態分布;偏正態分布
一、正態分布及其應用
1.正態分布定義和性質
生產與科學實驗中很多隨機變量的概率分布都可以近似地用正態分布來描述,正態分布是當今應用最為廣泛的連續概率分布.17世紀,棣莫弗和拉普拉斯最早使用了正態分布,18世紀早期德國數學家高斯研究了正態分布的性質并應用正態分布分析了天文數據,所以在科學界正態分布也叫作高斯分布.正態分布的概率密度函數為:f(x)=
2.正態分布的應用
由于正態分布具有很多優良性質,根據中心極限定理,諸多數據集合可以用它來近似擬合,所以生產與科學實驗中很多隨機變量的概率分布都可以近似地用正態分布來描述.例如,在生產條件不變的情況下,產品的口徑、長度等指標,同一種生物體的身長、體重等指標.一般來說,如果一個量是由許多微小的獨立隨機因素影響的結果,那么就可以認為這個量具有正態分布,還有一些常用的概率分布也是由它衍生而來的,例如對數正態分布、t分布、F分布等.
二、正態分布的新發展
實際應用中由于正態分布的不易滿足性,故針對不同問題對正態分布進行了擴展,在一般正態分布的基礎上,導出了漸近正態分布、二元正態分布、離散正態分布、廣義正態分布、廣義逆正態分布、對數正態分布、多元正態分布、偏正態分布和截尾正態分布等,各擴展有不同的特點和應用.
1.漸近正態分布
漸近正態分布在因子分析中應用很廣泛,因子分析主要用在行為和社會科學,如隨著年齡的增長,兒童的身高、體重會隨著變化,因為影響身高與體重的生長因子相同故有一定的相關性.漸近正態分布主要用于弱假設情況下的最大似然因子分析,通過漸近正態性可以使因子分析適用于更廣泛數據分布的分析.因子分析模型對于p可觀測隨機向量xα可以表示為:xα=μ+Λfa+ua (α=1,…,N) (7),其中μ是p維向量參數,Λ是p×k階因子載荷矩陣,fα是非觀測可能包含隨機誤差的k階向量,uα是一個非觀測隨機誤差向量,而且fα和uα互相獨立.
Anderson和Amemiya分別在1956年和1987年討論了最大似然估計在弱假設情況下的性質,后者指出對于探索性因子分析,如果uα服從正態分布,因子載荷和誤差的漸近分布將對fα有更好的適應性.對于因子分析模型,Aerson和Rubin在1956年通過最大似然估計得出漸近正態分布統計量上提出一般性結論,指出用漸近分布來做一般分布的因子和誤差分析的可靠性.隨后在1988年Anderson 和Amemiya對該結論做了證明,并把模型拓展到Λ是λ的非線性函數上這種更一般的情況.
2.二元正態分布
二元正態分布是多元正態分布的一個特例,它的很多性質可從多元正態分布中推出.定義:兩個連續的隨機變量x和y,x~N(μx,σ2x),y~N(μy,σ2y),它們的聯合概率密度可用下式表示:
它是左截尾的離散正態分布,同時像半邊連續正態分布一樣也是有確定期望和方差的最大熵分布.Kemp同時推出半邊正態分布是qhyperPoissonI分布,說明它和M/M/1 隊列的關系,推導了它的期望和圖形的單峰性質.
4.廣義正態分布
廣義正態分布在1972年最早由Miller et.al提出,它是作為一個非隨機誤差的模型用于粗差探測模型.它具有對稱的單峰概率密度曲線,很多其他的分布通過它概率密度式參數的指數衰減推導而出.由于廣義正態分布的強適應性、穩定性,只需一個參數就可確定和可逼近大批量數據,所以它在各個領域獲得了廣泛應用.
【參考文獻】
[1] Wassily Hoeffding.A Class of Statistics with AsyMptotically Normal Distribution.Institute of Statistics.
[2] T.W.Anderson,Yasuo AmeMiya.The AsyMptotic Normal Distribution of Estimators In Factor Analysis Under General Conditions.The Annals of Statistics,1988,Vol.16,No.2,159-771.
[3] P.Blaesild.Conditioning With Conic Sections In The TwoDimensional Normal distribution.The Annals of Statistics[J].1979,vol 7,No 3,169-670.
[4] ManLai Tang,WaiYin Poon.Statistical inference for equivalence trials with ordinal responses: Alatent normal distribution approach.Computational Statistics Data Analysis[J].2007,vol 51,5918-5926.
[5] D.Marcottea,E.Henry.Automatic joint set clustering using a mixture of bivariate normal distributions.International.Rock Mechanics Mining Sciences[J].2002,vol 39,323–334.
[6] S.J.van Albada,P.A.Robinson.Transformation of arbitrary distributions to the normal distribution with application to EEG testretest reliability Neuroscience Methods[J].2007,vol 161,205-211.
[7] N.E.Savin,Henry B.,Iowa City.Semiparametric Estimation of the BoxCox Model.Preliminary and Incomplete.Tippie College of Business[J].2001,vol 30.