顧蓓青,王蓉華,徐曉嶺
(1.上海對外經貿大學 統計與信息學院,上海 201620;2.上海師范大學 數理學院,上海 200234)
Cauchy分布的統計分析方法研究
顧蓓青1,王蓉華2,徐曉嶺1
(1.上海對外經貿大學 統計與信息學院,上海 201620;2.上海師范大學 數理學院,上海 200234)
文章在刻度參數λ已知的情形下,給出了位置參數μ的分位數估計與逆矩估計,通過模擬比較發現分位數估計更加精確。同時還給出了參數μ的區間估計,考察了區間估計的精度;在位置參數μ已知的情形下,給出了刻度參數λ的極大似然估計,考察了點估計的精度;在參數μ,λ都未知的情形下,給出了參數μ,λ的點估計,通過模擬認為位置參數μ的點估計取樣本中位數,而刻度參數λ的點估計取極大似然估計(依賴于μ的估計)較為精確。
Cauchy分布;位置參數;刻度參數;逆矩估計;極大似然估計;分位數估計
設隨機變量X服從位置參數μ、刻度參數λ的兩參數Cauchy分布(記為C(μ,λ)),其密度函數f(x)和分布函數F(x)分別為:

特別地,(1)取μ=0 ,此時,
(2)取λ=1,此時,
(3)若取μ=0,λ=1,此時X~C(0,1),即稱X服從標準Cauchy分布或t(1),其密度函數f(x)和分布函數為:
由于Cauchy分布的數學期望不存在,使得它在分布理論中占有特殊的地位,在幾乎所有的教科書中,Cauchy分布均作為不存在矩的反例而出現,從而使人們誤認為它是人為杜撰出來的,并沒有其他的實際意義。實際上,文獻[1]中曾指出,Cauchy分布在力學、電學、心理生物學、人類學和計量學中都有許多應用。
關于Cauchy分布的參數估計,有一些學者做了研究,取得了一些成果。郭彥在文獻[2]中利用特征函數討論了Cauchy分布的結構、可加性、無窮可分性等概率性質,針對C(μ,1)的參數估計問題,說明了矩法、均方誤差最小、極大似然估計法等常用的估計方法均不合適,并利用Cauchy分布的中位數給出了參數μ的點估計。王志祥在文獻[3]中針對C(0,λ)通過引入新的隨機變量,利用局部矩估計方法給出了參數λ的點估計與區間估計,但局部矩估計依賴于C的取值,影響了該方法的應用。吳慶波等在文獻[4]中針對兩參數Cauchy分布C(μ,λ),給出了位置參數μ和刻度參數λ的分位數估計。
本文在刻度參數λ已知的情形下,給出了位置參數μ的分位數估計、逆矩估計及區間估計,通過模擬考察了點估計和區間估計的精度,并發現分位數估計更加精確。其次,在位置參數μ已知的情形下,給出了刻度參數λ的極大似然估計,通過模擬考察了點估計的精度。最后,在參數μ,λ都未知的情形下,給出了參數μ,λ的點估計,通過模擬認為位置參數μ的點估計取樣本中位數較為精確,而刻度參數λ的點估計取極大似然估計(依賴于μ的估計)較為精確。
設X1,X2,…,Xn為來自總體X~C(μ,λ0)的一個容量為n的簡單隨機樣本,其中刻度參數λ0已知,而位置參數μ未知時,下面求參數μ的點估計與區間估計。
如果次序統計量記為X(1)≤X(2)≤…≤X(n),給定0<p<1,樣本的p分位數X*(p)可定義為:
其中上式中的<pn>為pn的整數部分。
由于F(μ)=0.5,則位置參數μ的分位數估計為:1=X*(0.5)

化簡得:

引理1:(1)μ的方程有唯一實根。(2)對正常數a,μ的方程有唯一實根。


易見,方程(1)的根即為參數μ的逆矩估計2。
再者易知:

于是,給定置信水平1-α下,參數μ的區間估計為:
其中,21,22分別為如下方程的根:

給定樣本容量n,參數真值取μ=1,λ0=1,通過1000次Monte-Carlo模擬得到參數μ的點估計的均值與均方差,結果列于表1,從中可以看到不論是小樣本還是大樣本,方法一都優于方法二。

表1 參數μ的點估計模擬比較
給定樣本容量n,參數真值取μ=1,λ0=1,置信水平1-α=0.95,通過1000次Monte-Carlo模擬得到參數μ的區間估計的平均下限、平均上限、平均區間長度,以及區間估計包含參數真值的次數,結果列于表2,從中可以看到0.95的置信水平基本達到,同時隨著樣本容量n的增加,區間估計的平均長度呈減小趨勢,也就是區間估計越精確。

表2 參數μ的區間估計
設X1,X2,…,Xn為來自總體X~C(μ0,λ)的一個容量為n的簡單隨機樣本,其中位置參數μ0已知,而刻度參數λ未知時,下面求參數λ的點估計。



表3 參數λ的0.25分位數估計和0.75分位數估計大于0的次數
記樣本觀察值為x1,x2,…,xn,則似然函數為:


注:文獻[4]中所給出的關于刻度參數λ的似然方程是錯誤的。
引理 2:λ的方程有唯一正實根。

易見,方程(4)的根即為參數λ的極大似然估計2。
給定樣本容量n,參數真值取μ0=1,λ=1,通過1000次Monte-Carlo模擬得到參數λ的點估計的均值與均方差,結果列于表4,從中看到其精度還是令人滿意的。

表4 參數λ的點估計
設X1,X2,…,Xn為來自總體X~C(μ,λ)的一個容量為n的簡單隨機樣本,次序統計量記為X(1)≤X(2)≤…≤X(n),其次序觀察值記為x(1)≤x(2)≤…≤x(n)。
則參數μ,λ的點估計為:=X*(0.5),1=X*(0.5)-X*(0.25)
則參數μ,λ的點估計為:=X*(0.5),2=X*(0.75)-X*(0.5)
位置參數的點估計取為=X*(0.5),而刻度參數的點估計3可取為如下方程的根:

給定樣本容量n,參數真值取μ=1,λ=1,通過1000次模擬得到參數λ的點估計的均值與均方差,結果列于表5,從中可以看到方法三更優。
例1:文獻[3]提供了如下算例,取樣本容量n=10,刻度參數λ的真值取為5,通過Monte-Carlo模擬產生10個服從C(0,λ)分布的隨機數如下:
2.3008,3.9756,-6.4165,11.9341,16.4812,-0.2428,-7.9044,-6.3136,14.5784,-1.9155
文獻[3]得到了參數λ的局部矩估計為:=5.0953
(1)當參數λ=5已知時,參數μ的點估計為1=X*(0.5)=1.029,=1.6879,給定置信水平0.95下,參數μ的區間估計為:
(2)當參數μ=0已知時,參數λ的0.25分位數估計為1(0.25)=μ0-X*(0.25)=6.3136 ,0.75 分位數估計為1(0.75)=X*(0.75)-μ0=11.9341,極大似然估計2=5.5386 ;
(3)當參數μ,λ都未知時,μ的點估計為=X*(0.5)=1.029 ,λ的 點 估 計 為1=X*(0.5)-X*(0.25)=7.3426 ,2=X*(0.75)-X*(0.5)=10.9051 ,3=5.6939
例2:取樣本容量n=30,通過Monte-Carlo模擬產生一組服從C(2,3)分布的隨機數如下:
5.11597, -0.232211, 6.7509, 5.26303, 2.80716,1.96063,-0.943453,-0.754331,3.11886,5.40918,-6.09775,2.3691,0.499949,1.11528,2.4189,0.284043,-2.20647,11.5716,284.604,22.5808,5.52263,7.28462,-4.86067,4.58242,-21.4326,4.87815,3.84585,2.19667,-0.332737,-42.9647
(1)當參數λ=3已知時,參數μ的點估計為1=X*(0.5)=2.394 ,2=2.4367 ,給定置信水平0.95下,參數μ的區間估計為:
(2)當參數μ=2已知時,參數λ的0.25分位數估計為1(0.25)=μ0-X*(0.25)=2.3327 ,0.75 分位數估計為1(0.75)=X*(0.75)-μ0=3.2630,極大似然估計2=2.8423;
(3)當參數μ,λ都未知時,μ的點估計為=X*(0.5)=2.394 ,λ的點估計為1=X*(0.5)-X*(0.25)=2.7267 ,2=X*(0.75)-X*(0.5)=2.8690 ,3=2.8081
考慮到Cauchy分布C(μ,λ)其數學期望不存在的特殊性及其在眾多領域的重要應用,本文在已有研究成果的基礎上,進一步討論了它的參數估計問題。在參數λ已知的情形下,給出了參數μ的分位數估計、逆矩估計及區間估計;另外,在參數μ已知的情形下,給出了參數λ的分位數估計和極大似然估計;并且分別通過Monte-Carlo模擬考察了點估計和區間估計的精度,發現參數μ的分位數估計較優,參數λ的極大似然估計較優。最后,在兩個參數μ,λ都未知的情形下,給出了參數μ,λ的幾種點估計方法,通過大量Monte-Carlo模擬發現參數μ的點估計取樣本中位數較為精確,而刻度參數λ的點估計取極大似然估計(依賴于μ的估計)較為精確。
[1]方開泰,許建倫.統計分布[M].北京:科學出版社,1987.
[2]郭彥.對柯西分布性質的進一步討論[J].淮陰工學院學報,2005,(5).
[3]王志祥.Cauchy分布刻度參數的矩估計與區間估計[J].統計與決策,2008,(23).
[4]吳慶波,李再興,景平.一元Cauchy分布族中兩參數的分位數估計及其性質[J].廊坊師范學院,2010,(1).
[5]徐曉嶺,王蓉華.概率論與數理統計[M].北京:人民郵電出版社,2014.
Study on Statistical Analysis Method of Cauchy Distribution
Gu Beiqing1,Wang Ronghua2,Xu Xiaoling1
(1.School of Statistics and Information,Shanghai University of International Business and Economics,Shanghai 201620,China;2.College of Mathematics and Science,Shanghai Normal University,Shanghai 200234,China)
This paper gives the quantile estimate and inverse moment estimate of location parameterμin the case of known scale parameterλ,and finds that quantile estimate is more accurate through simulation comparison.At the same time,the interval estimate of parameterμis given and the precision of interval estimate investigated;the maximum likelihood estimate of scale parameterλalso given in the case of known location parameterμ,and the precision of point estimate investigated;the point estimates of parametersμ,λis provided in the case of unknown parametersμ,λ;the paper finds that sample median is more accurate for point estimate of location parameterμ,while maximum likelihood estimate depending on estimate ofμis more accurate for point estimate of scale parameterλ.
Cauchy distribution;location parameter;scale parameter;inverse moment estimate;maximum likelihood estimate;quantile estimate
O212
A
1002-6487(2017)20-0019-04
國家自然科學基金資助項目(11671264)
顧蓓青(1984—),女,上海人,博士,講師,研究方向:應用統計。
(責任編輯/亦 民)