劉蓮花 (海南醫學院公共衛生學院,海南 海口 571199)
羅文強 (中國地質大學(武漢)數理學院,湖北 武漢 430074)
擬合優度檢驗功效比較
劉蓮花 (海南醫學院公共衛生學院,海南 海口 571199)
羅文強 (中國地質大學(武漢)數理學院,湖北 武漢 430074)
采用統計模擬的方法對6種正態性擬合優度檢驗方法的功效進行了模擬比較,模擬中分別采用Beta分布、Gamma分布、T分布和Lognormal分布4種不同的偏正態分布函數進行抽樣,最終得出6種檢驗方法功效上的總體排序。
擬合優度檢驗;檢驗功效;統計模擬
擬合優度檢驗是統計理論的重要內容,其與實際應用有密切的聯系。現實生活中常常需要根據給定的樣本數據來檢驗樣本是否來自某個特定的分布,以便進一步的獲取樣本的某些信息,如疲勞壽命、可靠度等。但是實際應用中常常出現這種問題:同一樣本數據在相同的原假設分布下,有的擬合優度檢驗方法得出的結論是拒絕原假設,而有的擬合優度檢驗方法得到的結論是接受原假設。出現這種問題的原因是進行擬合優度檢驗時很容易犯“拒真”和“納偽”2類錯誤。任何一種檢驗方法,犯2類錯誤都是不可避免的,然而對于同一樣本,不同的擬合優度檢驗方法犯錯誤的概率卻是不同的。一個好的檢驗,要求在控制第1類錯誤的前提下,第2類錯誤盡可能的小,也就是檢驗的功效盡可能的高,因此出現上述問題時,應以功效較高的檢驗方法得出的結論為主,且在進行擬合優度檢驗時,應盡量選擇功效高的擬合優度檢驗方法。為此,筆者對不同的擬合優度檢驗方法的功效進行了模擬比較。
目前擬合優度檢驗的方法很多,因為正態分布是最重要的分布,也是實際應用最為廣泛的分布,所以筆者主要針對正態性檢驗方法進行討論。討論的統計量有D、W2、A2、Zc、Za和Zk,其數值計算公式[1-3]如下:

按照Neyman-Pearson原則[4],在所有水平為α的擬合優度檢驗中,功效函數[4]在備擇假設H1為真時越大,表明該檢驗越好,也即檢驗的功效越高,然而想求擬合優度檢驗的功效,其檢驗問題的備擇假設,必須是具體的分布,所以筆者針對如下的具體問題進行討論:
H0:F(x)=F1(x)H1:F(x)=F2(x)
擬合優度檢驗的功效一般不易直接求出,為此筆者采用統計模擬[5]的方法,模擬的具體步驟如下:

步2 計算用某種檢驗方法進行擬合優度檢驗時統計量的值,并記m次重復模擬中統計量的值落于拒絕域的次數為t;

因為對于不同的偏正態分布以及不同的樣本容量擬合優度檢驗的功效會有很大的差別,所以筆者主要選擇Beta分布、Gamma分布、T分布、Lognormal分布作為備擇分布進行抽樣模擬[6-7],所抽取的樣本容量分別為10、30、50、60、70、80、100、150、200、250,模擬中的檢驗水平α=0.05,并在模擬中不斷改變各分布的參數,以便得到在不同的偏度和峰度時的功效模擬值,表1~4分別列出了4種備擇分布的參數取不同值時所對應的偏度及峰度值,圖1~圖4是分別從4種不同的備擇分布中進行抽樣模擬時的功效比較圖形,最后通過分析圖形對6種正態性檢驗方法的功效進行了總體的評價和排序。
3.1備擇假設為Beta分布
從功效模擬圖形1可得如下結論:①當備擇分布Beta的偏度為零時,D統計量的功效是最高的,但是若偏度非零則D統計量的功效最低,這說明D統計量在檢驗時對峰度比較靈敏而對偏度不靈敏。②當備擇分布偏度非零時,D統計量的功效隨樣本變化很小。③除D以外的其他5種統計量的功效隨著備擇分布偏度偏離于零的程度的增大而增加。④當偏度非零時,W2統計量的功效僅高于D統計量。⑤當偏度非零時,幾種統計量的功效排序大致為:Za>Zc>Zk>A2>W2>D。

表1 Beta分布中參數取不同值時的偏度及峰度

圖1 Normal VS Beta(原假設是Normal分布,備擇假設為Beta分布) 功效模擬比較圖

圖2 Normal VS T功效模擬比較圖

圖3 Gamma 功效模擬比較圖
3.2備擇假設為T分布
從功效模擬圖形2可得如下結論:①因為T分布是對稱分布,即偏度為0,從圖中可發現D統計量的檢驗功效是最高的,進一步說明了D統計量對峰度靈敏。②T分布中參數為3時偏離正態的程度大于參數為9時偏離正態的程度,相應的各統計量的功效也較高,這說明當備擇分布偏離正態越嚴重,各檢驗統計量的功效越高。
3.3備擇假設為Gamma分布
從功效模擬圖形3可得如下結論:①2個圖形中的備擇分布的偏度都是非零的,所對應的D統計量的功效最低,進一步說明D統計量對偏度不靈敏。②當備擇分布偏度非零時,W2統計量僅優于D統計量,而Za,Zc功效是最高的。

表2 T分布中參數取不同值時的偏度及峰度

表3 Gamma分布中參數取不同值時的偏度及峰度
3.4備擇假設為Lognormal分布

表4 Lognormal分布中參數取不同值時的偏度及峰度
圖4(b)的備擇分布偏離正態分布的程度較圖4(a)備擇分布嚴重,所對應的各統計量的功效也較高,進一步說明備擇分布偏離正態分布越嚴重,各統計量的檢驗功效就越高。

圖4 Lognormal 功效模擬比較圖
整體上觀察上述4種備擇假設下的功效模擬圖形,可得到如下的總體結論:①D不是很好的檢驗正態性的方法,因為它只對峰度的偏差靈敏,而對偏度的偏差不靈敏。②當備擇分布偏離正態的程度越嚴重,各檢驗統計量的功效就越高。③統計量Za、Zc、Zk對各種偏正態的分布都很有效且是穩健的。④在備擇分布偏度非零的情況下,W2的功效僅高于D的功效。⑤從功效的角度看,6種統計量的總體排序為:Za>Zc>Zk>A2>W2>D。
采用統計模擬的方法比較了D、W2、A2、Zc、Za、Zk這6種統計量在檢驗正態性時的功效差異,通過對Beta分布、Gamma分布、T分布、Lognormal分布這4種分布進行抽樣模擬,得出了6種統計量各自的優缺點,并對6種統計量在功效上進行了總體的排序。在進行擬合優度檢驗時,應該結合具體的原假設和備擇假設,盡量選擇合適的功效較高的檢驗方法,從而提高檢驗的可靠度。
[1]楊振海.擬合優度檢驗[M].合肥:安徽教育出版社,1994.
[2]Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio[J]. J Roy Statist Soc,2002,64:281-294.
[3]Zhang J, Wu Y h. Likelihood-ration tests for normality[J]. Computational Statistics & Data Analysis, 2005,49: 709-721.
[4]茆詩松,王靜龍,濮曉龍.高等數理統計[M].北京:高等教育出版社,1998.
[5]楊振海,程維虎.統計模擬[J].數理統計與管理,2006,25(1):117-126.
[6]Surucu B.A power comparison and simulation study of goodness-of-fit tests[J].Computers and Mathematics with Applications, 2008, 56:1617-1625.
[7]Zhang Z Z. Some comments on the EDF Statistics of Goodness-of-Fit Tests[J]. Chinese Journal of Applied Probability and Statistics, 1996, 12(4):361-368.
2012-11-24
海南省自然科學基金項目(112006)。
劉蓮花(1983-),女,碩士,講師,現主要從事擬合優度檢驗方面的教學與研究工作。
O212
A
1673-1409(2013)04-0014-03
[編輯] 洪云飛