賀樂平 莫宏敏
摘 要: 本文對統計推斷理論中區間估計和參數假設檢驗的相關性問題進行了分析,并對區間估計和假設檢驗的內在聯系和區別進行了探討.
關鍵詞: 統計推斷 置信區間 假設檢驗 拒絕域 區間估計
1.引言
數理統計是數學中的一個重要分支,具有廣泛的應用.假設檢驗和區間估計作為兩種重要統計推斷方法,在金融保險、經濟管理、科學研究、工程技術、質量控制乃至國防安全、災害防治等各方面等領域的應用日趨廣泛.其在科學決策中的作用也被越來越多的人所認知.表面上看,假設檢驗和區間估計從是兩個不同的概念,但實際上它們之間的聯系是很密切的,掌握它們之間的關系、各自的適用范圍和應用條件,以及應注意的問題對作出正確的統計推斷至關重要.本文初步探討了區間估計與假設檢驗問題的內在聯系和區別,討論了如何利用置信區間解釋假設檢驗的有關問題的新思路、新方法.
2.參數的區間估計與假設檢驗的內在聯系
統計推斷的基本問題分為兩類:一類是參數估計,另一類是假設檢驗.它們是兩個不同的統計概念,但又有著密切的聯系,從某種意義上來講,是同一問題的不同表達方式,參數區間估計與假設檢驗雖然提法不同,但解決問題的方法、途徑是相通的,統計推斷的基本思想是一樣的,都是利用樣本信息推斷總體的性質,即用部分推斷總體.它們選取的都是同一個統計量,然后計算出這個統計量落在某個區間上的概率,而據由此作出判斷.利用區間估計可以建立假設檢驗,反之亦然.
例:設總體X~N(μ,σ■),σ■未知,試求未知參數u的區間估計.
解:選取統計量
t=■~t(n-1),按置信度1-α確定一個大概率事件
p|■|≤t■=1-α,由此得到u的置信度為1-α的置信區間為[■-■t■,■+■t■].該區間估計恰好是原假設H■μ=μ■的一個接受域,其中顯著性水平為α.
對假設檢驗問題,則提出假設:H■∶μ=μ■;H■∶μ≠μ■,選擇統計量t=■
對給定的顯著性水平為α,得到一個小概率事件p|■|>t■=α,由實測值,
|■|>t■是否成立,決定是否拒絕原假設,拒絕域為|■|>t■,接受域為|■|≤t■,則結果正是u的置信度為區間估計.
3.參數的區間估計與假設檢驗之間的區別
參數的區間估計與假設檢驗的統計處理確有相通之處.某種意義上是從不同的角度回答同一問題,但兩者之間又有區別,主要體現以下幾點.
第一,參數估計解決的是定量問題,是多少(或范圍)問題,假設檢驗解決的是定性問題,則判斷結論是否成立的問題.各自的要求不盡相同.區間估計是確定置信度1-α(一定的概率)下給出未知參數的接受范圍.而假設檢驗是在給定的置信水平α下,確定未知參數能否接受已給定的值.
第二,區間估計與假設檢驗對問題的了解程度不盡相同.假設檢驗原假設H■的設定對結果影響很大,其中考慮了某些非樣本信息,原假設必須選有足夠理由認為其成立概率很大的假設,因為沒有非常充足的證據是不能輕易推翻原假設的,而區間估計則只依據樣本作出推斷.因而在實際應用中,究竟選擇哪種方法進行統計推斷,需要根據實際問題的情況確定相應的處理方法.否則將會產生不同的結論,得出錯誤的統計推斷.
例:已知某廠生產的維尼綸纖度服從正態分布,規定標準為纖度不低于100,某日抽取6根纖維,測得纖度為分別85,90,95,97,100,103.問能否認為這天的維尼綸是合格的?(a=0.05)
解法一:①提出待檢假設:H■∶u≥100,H■∶u<100
②選取統計量:t=■
③對于給定的檢驗水平α=0.05,查表確定臨界值t■(5)=2.015,從而給出拒絕域:P{t<-t■=-2.015}=α=0.05,拒絕域為(-∞,-2.015)
④計算判斷:易得■=95,s=6.6030
t=■=-1.8558
因統計量觀察值沒有落入拒絕域中,應當接受原假設H■,可以認為這天的維尼綸是合格的.
解法二:提出待檢假設:H■∶u≤100,H■∶u>100
其拒絕域為(2.015,+∞),統計量的觀察值也沒有落入拒絕域中,理應接受H■,結論是這天的維尼綸是不合格的,為何當交換原假設和備擇假設作檢驗時,卻得出截然相反的結論呢?這主要是由樣本的隨機性所引起的.事實上,第一種解法的拒絕域為(t■,+∞),第二種解法的拒絕域為(-∞,-t■),兩種方法的接受域有一個公共的交集(-t■,t■).由于樣本的隨機性,當樣本觀測值落入兩者的交集時,兩種解法都是接受原假設,從而得出截然相反的檢驗結果.
假若從區間估計的角度分析,由已知條件,利用樣本數據,可以算出,置信度為0.95的置信區間大約是(90,100),而所給樣本數據中超過100的概率只有約5%.因而從數據來看,很難認為這天的維尼綸是合格的.區間估計與第二種推斷方法結果相同,卻與解法一大相徑庭,其中的原因值得研究.
如果我們知道該廠的生產過程一直很穩定,裝配工人技術嫻熟,以往的檢驗很少有生產不正常的情況出現,被判定為不合格,犯錯誤的概率較大,則我們選擇假設檢驗的解法一.盡管這次檢驗所給樣本數據似乎不太理想,但經檢驗,我們還是有理由相信,這天的維尼綸是合格的.這時,若用區間估計的方法進行檢驗,則結論為這天的維尼綸是不合格的,檢驗并沒有考慮到我們已有的非樣本信息,因此該結論是不全面的.如果樣本僅如例2所列,除此之外并無其他值得重點考慮的信息,則用區間估計檢驗,并據之判斷,按區間估計的結果認為該認為這天的維尼綸是不合格的并無不當.因此,從例2的情況可知,區間估計與假設檢驗適用的情況應有所不同,而且假設檢驗中,在某些情況下,所得結論與原假設及備擇假設的設定有關,這關乎單側假設檢驗中原假設的設定原則問題,這里不再贅述.
綜上所述,在常規情況下如果我們對問題的總體的某些非樣本信息,如歷史經驗等有很多實際的了解,則應選取假設檢驗方法,如果我們對待檢驗問題除樣本信息外的其他信息一無所知,則用區間估計方法檢驗較妥當,據此作出判斷較客觀,失誤相對較少.總之,在學習和應用中,準確把握住數理統計中區間估計與假設檢驗這兩種統計推斷方法內在聯系和區別是得出正確結論的關鍵,我們必須注意它們各自適用的范圍和條件,這對作出正確的統計推斷至關重要.
參考文獻:
[1]鄧集賢等.概率論與數理統計(下)[M].北京高等教育出版社,2009.
[2]茆詩松,王靜龍.數理統計[M].上海華東師范大學出版社,1986.
[3]茆詩松等.高等數理統計[M].北京高等教育出版社,2000.
[4]杜世平.對區間估計與假設檢驗的關系的思考[J].西南民族大學學報,2005,31(3):339-341.
項目:吉首大學新開課程建設立項項目:2012KCB04,吉首大學教改課題:民族地區統計學專業應用型人才培養模式改革的理論與實踐(2013JSUJGA13)