丁先文,鄒 舒,林金官
(1.江蘇技術師范學院 數理學院,常州 213001;2.東南大學 數學系,南京 211189)
參數方法計算置信區間的理論和應用已得到大量的研究成果,非參數方法計算置信區間近來得到許多統計工作者的研究和推廣,本文通過隨機模擬對這兩種方法進行比較研究。

由引理2即可計算參數λ的置信度為1-α的置信區間。
非參數統計又稱任意分布檢驗。它是統計學的一個分支。如果在一個統計問題中,其總體分布不能用有限個實參數來刻畫,只能對它作一些諸如分布連續、有密度、具有某階矩等一般性的假定,則稱之為非參數統計問題。這類檢驗不對總體參數進行比較,而是用于分布之間的比較,檢驗資料的總體分布型是任意的。非參數統計與參數統計相比,有如下幾點優點:(1)使用于任何分布的資料;(2)不受總體方差一致的限制;(3)可用于等級資料的統計分析;(4)有些問題本身沒有適當的參數檢驗方法,而非參數檢驗則恰能處理。
在構造參數的置信區間時,目前常用的非參數方法有經驗似然方法、Bootstrap方法、Jackknife方法等。由于非參數推斷不需知道總體的分布,因而在實際問題中得到廣泛的應用。統計學中Bootstrap方法是指用原樣本自身的數據抽樣得出新樣本及統計量,它是根據給定的原始樣本復制觀測信息,不需要進行分布假設或增加新的樣本信息,可對總體的分布特征進行統計推斷,屬于非參數統計方法。Bootstrap方法的核心是利用自助樣本來估計未知概率測度的某種統計量的統計性質,基本思想是:在有n個原始樣本范圍內作有放回抽樣,樣本容量仍然為n,原始數據中每個觀測對象被抽到的概率相等,為1/n,所得到的樣本稱之為Bootstrap樣本,于是每次觀測都可得到參數θ的估計值,重復B次,就可得到該參數的B個估計值,然后根據實際問題的需要,再作進一步計算。
Bootstrap方法計算參數的置信區間可以采用標準Bootstrap、百分位數Bootstrap、t百分位數Bootstrap和修正偏差后的百分位數Bootstrap等四種方法來估計,本文以正態分布和Possion分布為例,采用百分位數Bootstrap方法計算參數的置信區間[2]。

利用隨機數發生器隨機產生一組均值為10,方差為4的樣本容量為30正態分布的隨機數,分別用Bootstrap方法和經典方法計算均值的置信區間,比較置信區間的長度差異。進行一次抽樣,得到正態隨機數組如下:
11.1776 4.6553 12.8573 16.4942 7.2329 13.4320 15.0160 3.6251 4.2361 12.2846 8.4005 12.7600 13.2625 12.8476 15.1610 12.6744 14.7634 5.1902 9.9208 9.3731 3.5837 11.0292 5.7741 15.6606 6.7796 12.1150 10.8773 6.3124 1.3173 9.7632
計算結果如表1所示。

表1 經典方法與Bootstrap方法的比較
由表1可知:
(1)無論是經典方法還是Bootstrap方法,隨著置信區間的置信度減小,區間的長度也減小,這與理論結果是一致的;
(2)對Bootstrap方法,計算的精度重復與重復抽樣的次數B有一定關系,但差別不大,選取適當的B可以提高置信區間的精度;
(3)對正態分布而言,Bootstrap方法得到的置信區間的長度比經典方法的大一些。
經典方法的置信區間用于估計均值的波動情況,與樣本容量有關,樣本容量越大,則區間長度越??;Bootstrap方法得到的區間長度稍大,用作對下一個數據的預測比較合理。
分別用Bootstrap方法和經典方法計算Poisson分布中參數λ的置信區間,比較置信區間的長度差異[4]。
解:利用隨機數發生器隨機產生一組Poisson分布P(4)的隨機數,如下所示:
4 4 8 1 9 2 2 3 9 4 3 2 4 2 3 4 6 6 4 3 3 2 3 0 23 2 4 3 3
計算結果如表2所示。

表2 經典方法與Bootstrap方法的比較
由表2可知:
(1)無論是經典方法還是Bootstrap方法,隨著置信區間的置信度減小,區間的長度也減小,這與理論結果是一致的;
(2)對Bootstrap方法,計算的精度重復與重復抽樣的次數B有一定關系,但差別不大,選取適當的B可以提高計算精度;
(3)對Bootstrap而言,Bootstrap方法得到的置信區間的長度與經典方法沒有明顯的差異,選取合適的抽樣次數B,結果甚至優于經典的參數方法。
上例說明在Poisson分布場合,Bootstrap方法得到的置信區間的長度與經典方法沒有明顯的差異。由于Bootstrap方法在計算置信區間時,不需要假設總體的分布已知,也不需要構造樞軸量,有著廣泛的實際應用價值。
本文通過對正態分布和Poisson分布分別用經典方法和Bootstrap方法計算參數的置信區間,并對結果進行了比較分析。由于Bootstrap方法在計算置信區間時,不必假定總體分布,不需構造樞軸量及精度較好等優點,在實際中有廣泛的應用價值,Bootstrap方法的出現為解決實際問題提供了一種新的途徑,這在一定程度上為統計工作者提供了很大的方便。
[1]韋博成.參數統計教程[M].北京:高等教育出版社,2006.
[2]Bradley Efron,Robert J.Tibshirani.An Introduction to the Bootstrap[M].New York:Chapman&Hall,1993.
[3]趙慧琴.Bootstrap方法在區間估計中的應用[J].江西科學,2010,(4).
[4]姚源果,夏開萍,羅朝暉.Bootstrap方法下的Poisson分布置信區間的估計[J].廣西民族大學學報,2008,(2).