999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

泊松分布參數的穩健估計

2014-07-05 16:25:01李洪明
關鍵詞:性質定義污染

李洪明

泊松分布參數的穩健估計

李洪明

呼倫貝爾學院數學科學學院,內蒙古呼倫貝爾021008

本文主要以非對稱分布中泊松分布為研究對象,探討了其參數的穩健估計方法.作者以截斷似然估計為基礎,結合Cizek的工作,提出了適用于泊松分布參數的一種穩健估計方法.該方法避免了事先選取截斷比例的麻煩,通過數據自身的信息給出在平均似然最大準則下的最優截斷比例.在文中的模擬部分,分別就未受污染和受污染的泊松分布數據進行了模擬,得到了不錯的效果.

自適應極大截斷似然估計;泊松分布;崩潰點;穩健估計

對于非對稱分布中的泊松分布而言,其在實際生活中有著十分重要的地位.很多的實際模型都是基于泊松過程提出的,然而在某個確定時刻,泊松過程就相當于是一個泊松分布。因此,如何估計泊松分布的參數在理論和實際中都有著重要意義.理論上,我們可以在估計泊松分布參數的方法基礎上,考慮其是否適合于其它非對稱分布的位置參數估計;實際中,較為準確地估計出泊松分布的參數對未來情況的預測有著重要作用。

Cizek在解決廣義線性模型——Binary-Choice回歸模型時,提出了一種通過數據自身情況決定截斷比例的方法。本文就是在這個想法的基礎上,通過一定的改進,提出了一種估計泊松分布參數的方法,并說明了該方法在估計泊松分布參數時的可行性。

1 泊松分布的參數估計

1.1極大似然估計

對于泊松分布而言,其分布律記為 p( x;λ),其中λ為待估的參數。假設X1,L,Xn是服從分布p( x;λ)的獨立樣本。稱由(1)式確定的MLE為參的極大似然估計。

因此,在泊松分布中,其參數的極大似然估計就是統計量x,從該表達式,我們可以發現當數據中有一個壞數據(即離群值)的時候,該表達式會與真實結果之間產生較大的偏差。對于泊松分布參數的極大似然估MLE而言,其方差n。另一方面,由Rao-Cramer不等式可知:對于任何無偏估計而言,其方差的下界為n。因此,在對泊松分布參數進行估計時,MLE是最有效的估計(即最小方差無偏估計)。進一步,由極大似然估計的近似分布性質可知:MLE具有近似分布N,n這也就是為什么在估計泊松分布的參數時常用極大似然估計的原因。

1.2M估計

對于分布p( x;λ)而言,其中λ為待估的參數。假設X1,L,Xn是服從分布p( x;λ)的獨立樣本,在正則條件下,λ的極大似然估計()MLEλ等價于方程(3)的解。

對于泊松分布而言,(3)式即為

令 ¬0 (u) =u,則泊松分布參數λ的極大似然估計λ(MLE)就是(5)的解。

對于(4)式而言,我們可以發現大數據xi對其影響很大。換而言之,如果數據被污染,有離群值在里面的話,那么用(4)式得到的估計會與真實值有較大偏差.我們稱(6)式的解λ(MLE)為M估計。

進一步,考慮到數據的尺度問題,將(6)改進為

由M估計的近似分布性質可知:ME具有近似分布

Huber建議在(7)中取u和d如下:

1.3極大截斷似然估計

Neykov和Neytchev基于極大似然估計的優良性質,提出通過似然函數截斷一些可能的壞數據后再進行估計的方法,這種方法既保留了似然函數的部分性質,又提高了估計量的穩健性。

對于分布p( x;λ)而言,其中λ為待估的參數,我們稱(9)所對應的估計λ(MLE,h)為參數λ的極大截斷似然估計。

1.4自適應極大截斷似然估計

基于1.3小節中提到的極大截斷似然估計而言,它有一些不錯的性質,但是截斷比例h的選取并沒有一致的方法。通常情況下,截斷比例的選取依賴于一些先驗知識。當h取得越大,則λ(MLE,h)受壞數據的影響越小,但有效性會降低。因此,我們考慮用平均似然達到最大的方法來確定截斷比例h,稱(10)所對應的截斷比例h*為最優截斷比例[1]。

其中λ(MTLE,h)的定義如(9)所示δλ為對截斷比例上限的限制令λ(AMTLE,h)=λ(MTLE,h*)稱估計量λ(AMTLE)為自適應極大截斷似然估計。在實際操作中,我們可以用下面的方法來給出我們首先用樣本的中位數median{ xi}作為位置參數λ的估計,記u=median{ xi}然后令我們來解釋為什么這樣選取λδ根據定理1,我們可以看出受數據影響較小的中位數在樣本量趨于無窮的時候,雖然不是無偏估計,但其和真實值之間的差異并不太大。在樣本量充分大時候,用上面所給的λδ作為截斷上限可以保證得到的估計與λ相差不大[2]。

2 自適應極大截斷似然估計的性質

2.1自適應極大截斷似然估計的極限性質

根據(10)關于自適應極大截斷似然估計中最優截斷比例的定義,我們可以知道,當樣本量n→∞的時候h*會以概率1趨于h0,h0有(11)式確定[3]。

根據引理1,我們可以得到λ(AMTLE)依概率收斂的極限,即下面的定理。

2.2自適應極大截斷似然估計崩潰點

對于一個估計而言,我們常常考慮它受壞數據影響的情況。我們稱一個估計是穩健的,是指它受壞數據影響較小[6],即數據集中有壞數據和沒有壞數據時的估計結果相差不大。但這種定義只是一個描述性的定義,對問題的分析沒有太大的作用。Müller和Neykov[7]給出了一種描述一個估計穩健性的指標。在本文中,我們也用這個定義來描述估計的穩健性。

3 有限樣本的性質

在這兩個小節中,我們考慮的樣本量n分別為100,200和400。對于相同樣本量的數據,我們分別用極大似然估計,M估計,極大截斷似然估計,自適應極大截斷似然估計和中位數對泊松分布的參數進行估計。對于某一種估計結果,我們考慮它的均方誤差MSE和平均偏差EB。這二者的定義如(13)所示。

在實際計算這兩個指標時,我們采用Monte Carlo方法,用多次模擬的平均值近似真值。這由大數定律是可以保證的。為了提高估計的精度,在Monte Carlo方法的基礎上,我們用Hammersley等減少方差的方法對模擬方法進行改進。

3.1未受污染數據的模擬

表1 未受污染數據的模擬情況Table 1 Unpolluted data simulation

=3.5 =4n=100n=200n=400n=100n=200n=400 MSEEBMSEEBMSEEBMSEEBMSEEBMSEEB MLE0.03530.00260.01770.00250.00870.00010.03980.00200.0202-0.00250.0100-0.0001 ME0.0982-0.0435 0.0683-0.0693 0.0441-0.10170.0485-0.07600.0282-0.08090.0170-0.0794 MTLE(0.1)0.1267-0.1080 0.0976-0.1403 0.0708-0.17160.0455-0.03160.0121-0.01090.0013-0.0015 MTLE(0.2)0.2136-0.2370 0.2192-0.3197 0.2236-0.39680.0738-0.05790.0218-0.02060.0026-0.0026 AMTLE0.0404-0.0707 0.0225-0.0710 0.0138-0.07260.04120.00890.01160.01260.00210.0096 MEDIAN0.2344-0.2668 0.2418-0.3464 0.2466-0.42240.0866-0.08540.0266-0.02890.0034-0.0038估計方法估計方法=21n=100n=200n=400n=100n=200n=400 MSEEBMSEEBMSEEBMSEEBMSEEBMSEEB MLE0.2054-0.00860.10330.00330.05070.00270.20990.00410.1058-0.00140.05250.0040 ME0.26260.05770.14950.05590.10150.05500.26940.07430.12670.04440.06120.0400 MTLE(0.1)0.3396-0.04090.2035-0.05720.1624-0.09280.3463-0.0218 0.1794-0.04940.0758-0.0372 MTLE(0.2)0.3983-0.08580.2412-0.09970.1926-0.13260.4021-0.0629 0.2204-0.08260.1008-0.0510 AMTLE0.2192-0.08290.1110-0.07010.0571-0.07120.2221-0.0683 0.1157-0.07570.0599-0.0709 MEDIAN0.4158-0.17960.2720-0.17800.2452-0.21540.4174-0.1623 0.2474-0.15780.1211-0.1075 =11n=100n=200n=400n=100n=200n=400 MSEEBMSEEBMSEEBMSEEBMSEEBMSEEB MLE0.10530.00330.0514-0.0063 0.02520.00250.11120.00190.0548-0.00310.02680.0006 ME0.16010.04660.10710.02340.09450.02210.13490.04100.05260.02190.02600.0230 MTLE(0.1)0.2092-0.0551 0.1598-0.1044 0.1339-0.14440.1829-0.04090.0842-0.04740.0259-0.0213 MTLE(0.2)0.2488-0.1088 0.2042-0.1650 0.1953-0.22150.2214-0.09160.1134-0.09020.0380-0.0420 AMTLE0.1149-0.0699 0.0594-0.0808 0.0307-0.07120.1213-0.07220.0635-0.07890.0339-0.0752 MEDIAN0.2769-0.1738 0.2424-0.2282 0.2431-0.29740.2434-0.14740.1357-0.11760.0498-0.0515估計方法=10.5 =20.5

從表1中,我們可以發現:當數據未受污染時,自適應極大截斷似然估計的MSE是較其他穩健方法而言是最小的,并且EB也不是太大,也就是說在未受污染的情況下,自適應極大截斷似然估計有良好的表現。對于中位數估計而言,當位置參數很小或者非整數時,其估計效果不佳,比如在0.5λ=的時候,中位數估計的結果和零非常的接近,在很多樣本中中位數就是0,這與實際是不相符合的。從這一點也能看出,自適應極大截斷似然估計就中位數估計而言,有一定的改進作用。

4 結論

通過上面的分析,我們可以發現,自適應極大截斷似然估計在估計泊松分布參數的時候,具有較好的穩健性質,并且該估計不用事先給定截斷數據的比例,在實際運用中較為方便。

[1]涂冬生,成平.非截尾型L統計量的Bootstrap逼近[J].系統科學與數學,1989,9(01):14-23

[2]鄭忠國.隨機加權法[J].應用數學學報,1987,10(02):247-253

[3]涂冬生.L統計量的Bootstrap逼近[J].科學通報,1986(13):965-969

[4]周勇.L統計量的隨機加權分布逼近及重對數律[J].湘潭師范學院學報,1991,12(6):7-18

[5]劉銀萍,宋立新.Ⅱ型截尾情形下泊松分布參數的估計[J].吉林大學學報,2007,45(6):941-944

[6]宋立新,薛宏旗.一種Sieve極大似然估計的漸近性質[J].湘潭大學學報,2000,20(03):370-377

[7]Klugman S A,Panjer H H.損失模型從數據到決策[M].吳嵐譯.北京:人民郵電出版社,2009:350-370

[8]Biihlmann H.Mathematical Methods in Risk Theor y[M].Berlin:Spring er Verlag,1996:100-120

Robust Estimation of Parameter in Poisson Distribution

LI Hong-ming
Mathematics Institute,Hulunbeier College,Hulunbeier021008,China

This paper,the asymmetrical distribution of the Poisson distribution as an objective,discussed the estimation method of robust parameter.Author truncated likelihood estimation,combining Cizek's work,proposed a robust estimation method applying to Poisson distribution parameters.It avoided the hassle of pre-selected cutoff ratio,and gave their information through the data at an average maximum likelihood ratio criterion optimal truncation.In the analog part of the text,uncontaminated and contaminated Poisson distribution data were respectively simulated to get good results.

Adaptive maximum truncated likelihood estimation;Poisson distribution;collapse;robust estimation

O211.3

A

1000-2324(2014)04-0615-05

2013-01-24

2013-03-02

內蒙古自治區高等學校科學研究基金項目(NJZY13319)

李洪明(1962-),男,副教授,河北保定人,研究方向:概率統計、數學模型.E-mail:li-h-m@163.com

猜你喜歡
性質定義污染
隨機變量的分布列性質的應用
完全平方數的性質及其應用
中等數學(2020年6期)2020-09-21 09:32:38
九點圓的性質和應用
中等數學(2019年6期)2019-08-30 03:41:46
堅決打好污染防治攻堅戰
當代陜西(2019年7期)2019-04-25 00:22:18
堅決打好污染防治攻堅戰
厲害了,我的性質
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
對抗塵污染,遠離“霾”伏
都市麗人(2015年5期)2015-03-20 13:33:49
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
公務員文萃(2013年5期)2013-03-11 16:08:37
主站蜘蛛池模板: 国产女人在线观看| 国产91精品最新在线播放| 亚洲中字无码AV电影在线观看| 在线亚洲天堂| 91成人免费观看| 中文字幕日韩丝袜一区| 在线观看亚洲人成网站| 欧美一级99在线观看国产| 在线观看国产小视频| 亚洲aaa视频| 欧美成a人片在线观看| 香蕉在线视频网站| 91精品啪在线观看国产91九色| 久热精品免费| 国产美女免费网站| 狼友av永久网站免费观看| 亚洲中文字幕在线精品一区| 久久6免费视频| 五月婷婷导航| aaa国产一级毛片| 玖玖精品在线| 日本一区二区不卡视频| 免费一级无码在线网站| 亚洲av无码成人专区| 中文国产成人精品久久一| 免费A级毛片无码免费视频| 8090午夜无码专区| 美女高潮全身流白浆福利区| 日韩精品少妇无码受不了| 18禁色诱爆乳网站| 熟妇人妻无乱码中文字幕真矢织江| 免费国产高清视频| 精品欧美日韩国产日漫一区不卡| 成人日韩欧美| 爆乳熟妇一区二区三区| 狠狠躁天天躁夜夜躁婷婷| 国产一区二区福利| 国产毛片不卡| 激情综合网址| 久操中文在线| 精品久久久久久久久久久| 亚洲视频免| 99re热精品视频中文字幕不卡| 老司机精品一区在线视频| 日韩精品一区二区三区免费| 香蕉99国内自产自拍视频| 久青草免费视频| 99久久国产精品无码| 国产超薄肉色丝袜网站| 国产菊爆视频在线观看| 久久a级片| 免费可以看的无遮挡av无码| 91色国产在线| 国产不卡国语在线| 精品国产99久久| 亚洲国产成人无码AV在线影院L| 欧美精品啪啪一区二区三区| 欧美人人干| 波多野结衣第一页| 亚洲日韩精品综合在线一区二区| 日韩毛片视频| 国产免费久久精品99re丫丫一| 操国产美女| 在线观看的黄网| 亚洲日韩精品无码专区| 性喷潮久久久久久久久| 99久久精品无码专区免费| 亚洲av成人无码网站在线观看| 精品91在线| 99精品视频九九精品| 四虎成人在线视频| 2020最新国产精品视频| 日韩小视频在线观看| 国产精品亚洲αv天堂无码| 天天综合网色| 国产丝袜一区二区三区视频免下载| 国产成人毛片| 亚洲成网777777国产精品| 日本不卡在线| 国产精欧美一区二区三区| 亚洲资源站av无码网址| 欧美成人一级|