文小波


[摘? ? ? ? ? ?要]? 以單因子變量法為手段,兩兩對照研究影響假設檢驗結論的一些因素.原假設與備擇假設的互換,不同顯著性水平,參數與非參數假設檢驗的對照,不同統計量的選擇等,都可能造成假設檢驗得出矛盾的結論,在實際應用中這些問題應得到重視,合理做出選擇.
[關? ? 鍵? ?詞]? 假設檢驗;統計量;顯著性水平
[中圖分類號]? O211.1? ? ? ? ? ? ? ? [文獻標志碼]? A? ? ? ? ? ? ? ?[文章編號]? 2096-0603(2020)01-0010-02
假設檢驗是最常用的統計推斷方法之一,在統計學中有廣泛的應用.假設檢驗分為參數與非參數假設檢驗.根據中心極限定理,在樣本量足夠大時,其他的分布也可以做正態近似,因此在做假設檢驗時,常對總體做正態假設.
假設檢驗的步驟為建立假設、構造檢驗統計量、選定顯著性水平、給出拒絕域的形式、做出判斷.
一、原假設與備擇假設的互換
原假設與備擇假設的互換,可能會得出相反的結論.
(一)參數假設檢驗下原假設與備擇假設的互換
本文首先通過一個方差已知的單個正態總體均值假設檢驗的例子來加以分析說明原假設與備擇假設互換之后,檢驗結論的問題.
為何會出現兩種截然相反的結果呢,這其實是接受域的構成較為復雜的原因引起的.相同的原假設和備擇假設互換以后,就可能將模糊域推向另一面,從而得出兩個矛盾的結果.由此有結論1.
結論1 參數假設檢驗下原假設與備擇假設的互換可能會引起對立結果.
(二)非參數假設檢驗下原假設與備擇假設的互換
非參數假設檢驗之中,原假設和備擇假設的互換亦可能得出矛盾的結論.常用非參數檢驗的方法有游程檢驗、符號檢驗、符號秩和檢驗等,本文以符號檢驗為例,加以闡述說明上述問題.
例2 煙廠稱每只香煙的尼古丁含量在12mg以下,抽取12只香煙,測得其尼古丁含量為16.7 17.7 14.1 11.4 13.4 10.5 13.6 11.6 12.0 12.6 11.7 13.7,是否該煙廠所說的尼古丁比實際含量少?
由此可見,在非參數假設檢驗中,原假設和備擇假設的對換亦可能得出相反的結論.故在假設檢驗之中,應以期待接受的假設作為原假設,這樣容易使原假設獲得成立,由此有結論2.
結論2 非參數假設檢驗下原假設與備擇假設的互換可能會引起對立結果的出現.
二、不同的顯著性水平
在相同的原假設和備擇假設及統計量選取之下,不同的顯著性水平亦可能有相反的結果.
例3 某纖維長度符合正態分布,其均值為240,先抽取5件產品,得其長度為239.7 239.6 239 240 239.2,判斷該纖維長度是否滿足要求.
在相同的假設檢驗之中,不同的顯著性水平得出相反的結論是常見的事情.一般默認的顯著性水平是α=0.05,在具體應用中可根據要求具體選擇.由此有結論3.
結論3 同一假設檢驗之下,不同的顯著性水平可能會引起對立結果的出現.
三、參數和非參數假設檢驗
接下來,本文進一步研究參數和非參數假設檢驗方法對相同問題結果的影響.
例4 某保險公司,從索賠數額中抽取15個數據為4632?4728 5052 5064 5484 6972 7596 9480 14760 15012 18720 21240 22836 52788 67200,已知上年索賠中位數和均值皆為5063,問今年與上年的索賠金額是否有變化.
參數假設檢驗與非參數假設檢驗沒有哪一個方法明確更加優良,各有各的優勢之所在,使用的前提條件與假設并不一致.當然在一般情況下,如果能使用參數假設檢驗的地方,盡量使用參數的假設檢驗.由此有結論4.
結論4? 同一問題,參數與非參數假設檢驗可能會引起對立結果的出現.
四、不同的統計量
最后本文探討相同的原假設和備擇假設及顯著性水平,不同的統計量也可能會有相反的結果.
例5 從甲地到乙地傳輸信號,現在乙地接收到5個信號值,分別為8.05 8.15 8.2 8.1 8.25,已知信號值服從正態分布N(μ,0.22),是否有理由猜測信號值為8.
由上例可以看出檢驗統計量的選擇可能會造成得出相反的結論.題干之中正態總體的方差是已知的,一般采用μ檢驗,但spss軟件計算之中,t檢驗是非常方便操作的.最終統計量的選擇需根據實際情況來加以選擇.由此有結論5.
結論5 同一問題,檢驗統計量的不同可能會引起對立結果的出現.
假設的建立,參數與非參數假設檢驗的選擇,不同的顯著性水平,不同的檢驗統計量等都可能得到矛盾的結論.這也是假設檢驗被很多人排斥的地方,認為其不科學.但這是不對的,概率與統計是一門研究隨機變量規律性的一個學科,本就具有一定的隨機性,很多問題不能像純數學一樣表示為確切的函數關系,這也正是統計學的特別之處.當然引起假設檢驗出現對立結果的因素不僅僅只有文中所提到的因素,如單側還是雙側假設檢驗的選擇,犯第一類錯誤和犯第二類錯誤等因素也都有可能得出自相矛盾的結論,在運用中也是需要注意,本文不再贅述.在應用之中,只要合理地選擇假設檢驗方法、統計量和顯著性水平,對最終的結果做出合理的解釋,就可以很好地利用假設檢驗來做統計推斷分析.當然在假設檢驗之中,雖然假設檢驗有著看起來的很多問題,但是只要合理選擇,其仍然是最重要的統計推斷方法之一.
參考文獻:
[1]茆詩松,程依明,濮曉龍.高等數理統計[M].北京:高等教育出版社,2006.
[2]杜強,賈麗艷,嚴先鋒.spss統計分析從入門到精通[M].北京:人民郵電出版社,2014.
[3]胡曉華.解析顯著性水平及應用[J].統計與決策,2017(13):88-91.
編輯 馮永霞