摘要:兩樣本均值的假設(shè)檢驗是《概率論與數(shù)理統(tǒng)計》中很關(guān)鍵的一部分內(nèi)容,在生物醫(yī)學(xué)、質(zhì)量檢測等領(lǐng)域中常遇到比較兩樣本是否存在顯著差異。利用傳統(tǒng)的手工方法分析數(shù)據(jù)存在一些困難,因此,將統(tǒng)計軟件引入《概率論與數(shù)理統(tǒng)計》教學(xué)中適合了時代的發(fā)展。本文結(jié)合實例介紹R統(tǒng)計軟件在兩樣本均值假設(shè)檢驗中的應(yīng)用。
關(guān)鍵詞:R統(tǒng)計軟件;假設(shè)檢驗;U檢驗;t檢驗
中圖分類號:G642 文獻標志碼:A 文章編號:1674-9324(2013)20-0213-02
兩樣本假設(shè)檢驗問題在生物醫(yī)學(xué)、質(zhì)量檢測等領(lǐng)域常常遇到。如研究兩種不同飼料對雌鼠體重增加是否有差異,兩種不同藥品對病人療效是否相同。在講授兩樣本假設(shè)檢驗理論知識的同時應(yīng)將統(tǒng)計軟件的應(yīng)用作為一個重點,讓學(xué)生至少熟練掌握一門統(tǒng)計軟件。目前,可用于統(tǒng)計分析的軟件有很多,如Excel、SPSS、SAS、Eviews、Minitab,S-plus以及R等。由于R軟件具有強大的計算與圖形展示功能、更新迅速以及自由免費等諸多優(yōu)點[1-5],目前國內(nèi)越來越多的高等院校在統(tǒng)計教學(xué)中將R軟件作為教學(xué)軟件。本文將結(jié)合實例介紹R統(tǒng)計軟件在兩樣本均值假設(shè)檢驗中的應(yīng)用。
一、兩樣本均值假設(shè)檢驗及R語言實現(xiàn)
設(shè)X1,X2,…,Xn■~N(μ1,σ■■),Y1,Y2,…,Yn■~N(μ2,σ■■)且兩樣本獨立。在《概率論與數(shù)理統(tǒng)計》課程中,對兩正態(tài)總體的假設(shè)檢驗問題常介紹兩種情況:(1)σ■■和σ■■已知;(2)σ■■=σ■■=σ■未知。本文僅以雙側(cè)假設(shè)檢驗為例,考慮假設(shè)檢驗問題:H0∶μ1=μ2,H1∶μ1≠μ2.下面分別介紹兩種情況下的檢驗方法及R語言實現(xiàn)。
1.檢驗方法。①σ■■和σ■■已知,當(dāng)H0為真時,可以構(gòu)造U檢驗統(tǒng)計量:U=■~N(0,1)對給定的顯著性水平α,H0的拒絕域為:U≥Zα/2.②σ■■=σ■■=σ■未知,當(dāng)H0為真時,可以構(gòu)造t檢驗統(tǒng)計量:T=■~t(n1+n2-2),其中Sw=■,S■■和S■■分別是X和Y的樣本標準差。對給定的顯著性水平α,得H0的拒絕域為:T≥tα/2(n1+n2-2).
2.案例分析。本節(jié)采用文獻[6]中的案例來說明R統(tǒng)計軟件在兩樣本假設(shè)檢驗中的應(yīng)用。某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L),結(jié)果如下:克山病患者(X):0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11。健康人(Y):0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
該地克山病患者與健康人的血磷值是否相同?
①假定σ■■和σ■■已知,σ■■=0.17,σ■■=0.18。兩樣本均值假設(shè)檢驗程序代碼如下:##兩樣本方差已知的均值檢驗###
mean_test<-function(x, y,sigma1,sigma2){
n1<-length(x) #X樣本數(shù)
n2<-length(y) #Y樣本數(shù)
xb<-mean(x) #X樣本均值
yb<-mean(y) #Y樣本均值
u<-(xb-yb)/sqrt(sigma1^2/n1+sigma2^2/n2) #計算U檢驗統(tǒng)計量
pp<-pnorm(u,0,1) #計算標準正態(tài)分布在u點的概率分布函數(shù)值
if(pp<1/2) P=2*pp #計算假設(shè)檢驗P值
else P=2*(1-pp)
data.frame(mean=xb-yb, U=u, p_vale=P)
}
X=c(0.84,1.05,1.20,1.20,1.39,1.53,1.67,1.80,1.87,
2.07,2.11) #輸入樣本值
Y=c(0.54,0.64,0.64,0.75,0.76,0.81,1.16,1.20,1.34,
1.35,1.48,1.56,1.87)
mean_test(X,Y,sqrt(0.17),sqrt(0.18)) #通過編寫的mean_test函數(shù)計算檢驗p值
運行結(jié)果
mean U p_vale
0.4362937 2.548825 0.01080866
從運行結(jié)果可以看出p-value<0.05,拒絕原假設(shè),即該地區(qū)克山病患者與健康人的血磷值不同。
②假定σ■■=σ■■=σ■■未知,R軟件中提供了t.test()進行兩樣本的假設(shè)檢驗和區(qū)間估計,關(guān)于t.test()的用法以及功能可參見文獻[1]或者輸入help(t.test)。程序代碼為:t.test(X,Y,var.equal=TRUE)
運行結(jié)果
data: X and Y
t = 2.5237, df = 22, p-value = 0.01934
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.07776886 0.79481855
sample estimates:
mean of x mean of y
1.520909 1.084615
從運行結(jié)果可以看出p-value<0.05,仍拒絕原假設(shè)。
二、 探索與思考
在傳授專業(yè)知識的同時,不僅要使學(xué)生能夠?qū)⑺鶎W(xué)的統(tǒng)計方法用統(tǒng)計軟件加以實現(xiàn),增強學(xué)生的動手能力,而且應(yīng)該啟發(fā)同學(xué)去探索和思考,增強學(xué)生分析問題和解決問題的能力。通過對《概率論與數(shù)理統(tǒng)計》中兩正態(tài)總體均值的假設(shè)檢驗問題的學(xué)習(xí),可提出以下幾個問題讓學(xué)生去探索和思考:
1.當(dāng)σ■■≠σ■■且都未知時,是否可以構(gòu)造類似的t檢驗統(tǒng)計量:T=■.如果可以,在原假設(shè)成立時,檢驗統(tǒng)計量的分布是否仍然可以用t分布逼近,t分布的自由度是多少?該問題是著名的“Behrens-Fisher”問題(參見文獻[7])。
2.當(dāng)σ■■已知,σ■■未知的情況在分析實際問題的時候會遇到,如舊藥與新藥療效的比較,通過先前的認知我們知道舊藥的方差信息,但是新藥的方差信息是完全不知道的,一個自然的想法就是用樣本方差代替,構(gòu)造如下檢驗統(tǒng)計量:T=■該檢驗統(tǒng)計量在原假設(shè)成立時的分布如何?
3.在解決實際問題時,常會遇到兩非正態(tài)總體均值的比較,對該類假設(shè)檢驗問題如何構(gòu)造檢驗統(tǒng)計量以及在原假設(shè)成立的時候,構(gòu)造的檢驗統(tǒng)計量的分布如何?通過以上的問題,可以激發(fā)學(xué)生去探索解決問題的方法。在思考和探索的過程中,提高學(xué)生的創(chuàng)新能力。
參考文獻:
[1]薛毅,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學(xué)出版社,2006.
[2]王星.非參數(shù)統(tǒng)計[M].北京:清華大學(xué)出版社,2010.
[3]程新,魏賽金,江莉.統(tǒng)計軟件R及其在《生物統(tǒng)計學(xué)》實驗教學(xué)中的應(yīng)用[J].統(tǒng)計教育,2008,4(103):29-31.
[4]王斌會.多元統(tǒng)計分析及R語言建模[M].廣州:暨南大學(xué)出版社,2010.
[5]湯銀才.R語言與統(tǒng)計分析[M].北京:高等教育出版社,2005.
[6]黃志碧,梁秋萍.兩樣本均數(shù)比較的假設(shè)檢驗方法[J].廣西醫(yī)學(xué),1998,20(5):831-837.
[7]Scheffe,H.Practical solution of the Behrens-Fisher Problem[J].Journal of the American Statistical Association,1970,65:1501-1508.