郭 文
樣本容量是指按照某種規(guī)則從總體中抽取出來(lái)的樣本觀察單位的數(shù)目。在抽樣調(diào)查中,樣本容量的研究是一個(gè)非常重要的問(wèn)題,樣本容量直接影響著犯兩類(lèi)錯(cuò)誤的概率。在假設(shè)檢驗(yàn)中,一般討論的是犯第一類(lèi)錯(cuò)誤的情況,通常只給出犯第一類(lèi)錯(cuò)誤的概率,那么在樣本容量自由選擇的情況下,犯第二類(lèi)錯(cuò)誤的概率是無(wú)法控制的。而犯第二類(lèi)錯(cuò)誤的情形一般在醫(yī)學(xué)、風(fēng)險(xiǎn)控制、質(zhì)量控制等領(lǐng)域應(yīng)用較多。在研究這些領(lǐng)域時(shí),我們希望能同時(shí)控制兩類(lèi)錯(cuò)誤的概率,那么樣本容量就需要通過(guò)計(jì)算來(lái)確定。目前國(guó)內(nèi)外對(duì)樣本容量的研究大多是建立在調(diào)查精度和費(fèi)用控制的基礎(chǔ)上。本文研究樣本容量的角度與之不同,是在控制兩類(lèi)錯(cuò)誤的前提下,對(duì)方差檢驗(yàn)中樣本容量進(jìn)行探討。
如果把假設(shè)檢驗(yàn)中構(gòu)造的統(tǒng)計(jì)量記為T(mén),把顯著性水平α下確定的拒絕域記為,把接收域記為W,則當(dāng)T服從正態(tài)分布時(shí),雙側(cè)檢驗(yàn)的與W如圖1所示。圖中陰影部分為拒絕域,非陰影部分為接受域W。
當(dāng)原假設(shè)H0為真時(shí),由于樣本的隨機(jī)性,仍然有可能以α的概率拒絕原假設(shè)H0,這就是第一類(lèi)錯(cuò)誤,簡(jiǎn)稱(chēng)棄真,α為棄真的概率。如圖1,棄真顯然就是H0為真時(shí)T落入拒絕域Wˉ的事件,所以

圖1 雙側(cè)檢驗(yàn)的拒絕域與接收域
當(dāng)原假設(shè)非真時(shí),我們也仍然有可能接受它,這就是第二類(lèi)錯(cuò)誤,簡(jiǎn)稱(chēng)取偽,取偽的概率以β表示。取偽顯然是當(dāng)H0為非真時(shí),T落入接受域W的事件,所以
P{T ∈ W| H0非真} =β
設(shè)隨機(jī)樣本(X1,X2,…,Xn)來(lái)自正態(tài)總體X~N(μ,σ2),μ=μ0已知。
對(duì)于右側(cè)檢驗(yàn),首先建立假設(shè)檢驗(yàn):

其次構(gòu)造χ2統(tǒng)計(jì)量:
當(dāng)H0為真時(shí):
當(dāng) H1為真時(shí):
根據(jù)定義,有

因此


uα、uβ為標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn)、β分位點(diǎn)。
將式(2)、(3)代入式(1)得:

解得:

同理,可計(jì)算出左側(cè)檢驗(yàn)樣本容量為:

雙側(cè)檢驗(yàn)時(shí)樣本容量為:

設(shè)隨機(jī)樣本(X1,X2,…,Xn)來(lái)自正態(tài)總體 X~N(μ,σ2),μ未知。
對(duì)于右側(cè)檢驗(yàn),首先建立假設(shè)檢驗(yàn):

構(gòu)造χ2統(tǒng)計(jì)量:
當(dāng)H0為真時(shí)

當(dāng)H1為真時(shí)


因此

同樣,當(dāng)n充分大時(shí)(通常n>45),有

這里uα、uβ為標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn)、β分位點(diǎn)。
將式(5)、(6)代入式(4)得:

解得

同理,可計(jì)算出左側(cè)檢驗(yàn)樣本容量為:

雙側(cè)檢驗(yàn)時(shí)樣本容量為:

設(shè) X1,X2,…,Xm和Y1,Y2,…,Yn是分別從服從和分布的兩個(gè)母體中抽出的獨(dú)立子樣,μ1、μ2已知。
首先建立假設(shè)檢驗(yàn):

其次構(gòu)造F統(tǒng)計(jì)量:

對(duì)于右側(cè)檢驗(yàn),建立假設(shè)檢驗(yàn):

則

則

當(dāng)n→∞時(shí),有 Fα(m,∞)=
又因?yàn)?/p>

因此

同理

所以,當(dāng)n→∞時(shí),有

解得:

同理,可計(jì)算出左側(cè)檢驗(yàn)時(shí)樣本容量為:

雙側(cè)檢驗(yàn)時(shí)樣本容量為:

設(shè) X1,X2,…,Xm和Y1,Y2,…,Yn是分別從服從和分布的兩個(gè)母體中抽出的獨(dú)立子樣,μ1、μ2未知。
首先建立假設(shè)檢驗(yàn):

其次構(gòu)造F統(tǒng)計(jì)量:

當(dāng)H0成立時(shí),F(xiàn)~F(m-1,n-1)。
對(duì)于右側(cè)檢驗(yàn),建立假設(shè)檢驗(yàn):

則

則

當(dāng)n→∞時(shí),有 Fα(m-1,∞)=
又因?yàn)?/p>

因此

同理

所以,當(dāng)n→∞時(shí),有

解得:

同理,可計(jì)算出左側(cè)檢驗(yàn)樣本容量為:

雙側(cè)檢驗(yàn)時(shí)樣本容量為:

以上我們對(duì)方差檢驗(yàn)中單母體及雙母體方差已知、方差未知情形下兩類(lèi)錯(cuò)誤與樣本容量的關(guān)系進(jìn)行了探討,并在控制兩類(lèi)錯(cuò)誤的條件下,給出了確定樣本容量的公式。從上面的討論可以看出,方差檢驗(yàn)中樣本容量的確定是件比較復(fù)雜的事情,必須給予足夠的重視。在實(shí)際操作中,樣本容量的確定既要考慮精度要求,又要考慮經(jīng)費(fèi)預(yù)算、可操作性等,必須通過(guò)綜合考慮,以達(dá)到一個(gè)最優(yōu)樣本容量的選擇。
[1] 陳國(guó)銘,李世英.統(tǒng)計(jì)質(zhì)量控制:估計(jì)和檢驗(yàn)[M].北京:中國(guó)石化出版社,北京,1995.
[2] 陳希孺.概率論與數(shù)理統(tǒng)計(jì)[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2009.
[3] 魏宗舒.概率論與數(shù)理統(tǒng)計(jì)教程(第二版)[M].北京:高等教育出版社,2008.
[4] 馮士雍,施錫銓.抽樣調(diào)查——理論、方法與實(shí)踐[M].上海:上海科學(xué)技術(shù)出版社,1994.
[5] W.G.Cochran.Sampling Techniques[M].Chichester:John Wiley&Sons,1997.