復旦大學公共衛生學院生物統計學教研室(200032)
秦國友 趙耐青
?
·學術討論·
應用t分布統計量和t檢驗統計量介紹假設檢驗原理
復旦大學公共衛生學院生物統計學教研室(200032)
秦國友趙耐青
假設檢驗是統計推斷的一個重要內容,也是醫學統計課堂教學的重點和難點之一。在講授這部分內容時,很多學生即使記住了相關的知識要點,在理解和實際使用中可能會出現較多問題和偏差。
目前的醫學統計教材[1-4]對于假設檢驗問題論述均是以單樣本t檢驗為例,闡述假設檢驗步驟和計算公式,最后得到t檢驗統計量取值或借助統計軟件得到P值。在原假設H0成立情況下,如果t檢驗統計量取值的絕對值大于t分布界值(也可以等價地敘述為P值小于檢驗水準α),則這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發生的,由此拒絕原假設H0而推斷備擇假設H1成立。

綜上所述,我們在介紹假設檢驗原理時,僅僅以小概率事件作為拒絕H0的依據是有瑕疵的。為了敘述方便,本文將仍以單樣本單側t檢驗為例,利用t分布統計量和t檢驗統計量之間的關系,可以清晰地論述假設檢驗原理。
假定X1,…,Xn是從正態分布總體N(μ,σ2)的一個隨機樣本,需要檢驗的問題是:
H0∶μ=μ0H1∶μ>μ0
α=0.05
先舉例描述下列簡單的統計性質:
1.t分布統計量:
(1)
2.構造二個與t分布相似的統計量:
顯然統計量T1,統計量T2和t分布統計量的分布圖形狀是相同的,只是T1統計量和T2統計量的分布圖分別右平移2個單位和左平移1個單位。即:t分布統計量的分布圖的峰位置在t=0位置,統計量T1的分布圖的峰在T1=2位置和統計量T2的分布圖的峰在T2=-1位置,上述三個統計量的分布圖見圖1。

圖1 統計量的分布圖
t檢驗統計量表達式如下
(2)
為了借助t檢驗統計量與t分布統計量的關系詮釋假設檢驗原理,可以把式(2)改寫為下式(3)
(3)
由式(3)可知,如果為真H0∶μ=μ0為真,t檢驗=t分布統計量,若隨機抽樣得到的樣本,計算t檢驗統計量出現t檢驗>t0.05n-1的概率P(t檢驗>t0.05,n-1|H0∶μ=μ0)=0.05,這是一個小概率事件。

由圖2所示,可知:當H1∶μ>μ0為真時,t檢驗統計量>t分布界值tα,n-1的分布曲線下的面積為1-β較大甚至很大,即:t檢驗統計量>t分布界值tα,n-1的概率較大或很大并且這個概率P(t檢驗>t0.05,n-1|H1∶μ>μ0)就是檢驗效能(Power)。

圖2 t檢驗統計量分布示意圖
綜上所述,在H0∶μ=μ0為真情況下,如果隨機抽樣所得到的t檢驗統計量的觀察值大于t分布界值tα,n-1是一個小概率事件,但在H1∶μ>μ0為真情況下,如果隨機抽樣所得到的t檢驗統計量大于t分布界值tα,n-1不是一個小概率事件,并且其概率較大或很大,因此可以拒絕H0∶μ=μ0,推斷H1∶μ>μ0成立。
在許多醫學統計教材中常常強調了原假設的作用而相對忽略了對備擇假設的作用的論述。而備擇假設恰恰告訴我們在什么情況下拒絕原假設。只有將原假設和備擇假設結合起來,我們才可以作出正確的統計推斷。我們在實際中常用的P值的計算也是不僅僅基于H0∶μ=μ0而且還要考慮H1,才能基于是否為小概率事件進行統計推斷的。通常P值的含義為在原假設成立的總體中抽樣出現比當前樣本還要極端情況的概率。而這個定義中的極端情況就是指備擇假設成立的情況。
本文以單樣本單側t檢驗為例,借助t分布與t檢驗統計量之間的關系,較好地詮釋假設檢驗的基本原理和思想,對于單樣本雙側t檢驗和兩樣本成組t檢驗同樣可以借助t分布與t檢驗統計量之間的關系詮釋這些假設檢驗的基本思想。在醫學統計的教學實踐中,我們通過這種方式對假設檢驗進行講授,并取得了良好的教學效果,學生對相關的知識點也有更好地理解和掌握。
[1]顏虹.醫學統計學(第二版).北京:人民衛生出版社,2010.
[2]趙耐青,陳峰.衛生統計學.北京:高等教育出版社,2008.
[3]李康,賀佳,楊土保.醫學統計學(第6版).北京:人民衛生出版社,2013.
[4]方積乾,徐勇勇,陳峰.衛生統計學(第7版).北京:人民衛生出版社,2013.
(責任編輯:郭海強)
中央補助地方貴州省慢性病及其危險因素監測項目
劉濤,E-mail:liutao9099@163.com