職桂珍, 徐雅靜, 曲雙紅, 盧金梅, 汪遠征
(鄭州輕工業學院數學與信息科學系,河南鄭州 450002)
假設檢驗中p值的靈活運用
職桂珍, 徐雅靜, 曲雙紅, 盧金梅, 汪遠征
(鄭州輕工業學院數學與信息科學系,河南鄭州 450002)
給出假設檢驗中p值的定義以及雙邊檢驗p值與單邊檢驗p值的關系,介紹了利用p值將三種檢驗同時進行的方法及意義,最后給出應用實例.
假設檢驗;p值;拒絕域
假設檢驗是統計推斷的重要內容,在很多經典的統計學教科書中,甚至是現在流行的概率統計教材中,大多采用計算檢驗統計量的觀測值,并根據檢驗統計量的觀測值是否落入拒絕域的方法做出能否拒絕原假設的推斷.而現代統計軟件中,假設檢驗多是采用計算p值的方法進行推斷的.檢驗時需要由樣本觀測值計算出檢驗統計量的觀測值和衡量觀測結果極端性的p值,然后通過比較p值和顯著水平的大小作判斷:當p<,拒絕原假設H0;當p>,不能拒絕原假設H0.借助于統計軟件,采用p值法進行假設檢驗方便、明了且便于了解檢驗結果顯著性的程度.
然而,由于傳統統計教學方法和現代軟件使用的脫節,使很多人對p值的概念不清楚,不能靈活使用,或根本看不懂軟件結果而無法解決應用問題.另一方面,有些統計軟件可以方便地利用p值進行雙邊檢驗,卻沒有直接給出單邊檢驗的過程和結果.如果對p值的計算沒有深入探究,遇到單邊檢驗問題,就會覺得軟件不好使用.事實上,可以通過雙邊檢驗的p值計算出單邊檢驗的p值,單雙邊檢驗可以同時進行,事半而功倍.本文深入介紹p值的計算公式并推出單雙邊檢驗中p值的關系,最后給出應用實例.
p值就是當原假設成立時得到樣本觀測值和更極端結果的概率.若W為檢驗統計量,W0為W的觀察值,通常p值由下面公式計算而得到.
1.雙邊檢驗的p值.
假設H0:θ=θ0;H1:θ≠θ0.
(i)檢驗統計量為對稱分布的雙邊檢驗

(ii)檢驗統計量為非對稱分布的雙邊檢驗

2.單邊檢驗的p值
(i)拒絕域為右邊區域的右邊檢驗
假設H0:θ≤θ0;H1:θ>θ0.

(ii)拒絕域為左邊區域的左邊檢驗
假設H0:θ≥θ0;H1:θ<θ0.

根據上面p值的計算公式不難推出如下命題:
命題 設W為檢驗統計量,W0為W的觀察值,W中為W的中位數,p雙,p右和p左分別為雙邊檢驗H0:θ=θ0;H1:θ≠θ0,右邊檢驗H0:θ≤θ0;H1:θ>θ0和左邊檢驗H0:θ≥θ0;H1:θ<θ0的p值,則它們有下面關系:
1.檢驗統計量為對稱連續分布時,

2.檢驗統計量為非對稱分布時,

證1.檢驗統計量為對稱連續分布時,由于

所以
(i)拒絕域為右邊區域的右邊檢驗,
若W0≥0,則p右=P{W≥W0}=p雙/2;
若W0<0,則p右=P{W≥W0}=1-P{W<W0}=1-p雙/2.
(ii)拒絕域為左邊區域的左邊檢驗,
若W0≥0,則p左=P{W≤W0}=1-P{W>W0}=1-p雙/2;
若W0<0,則p左=P{W≤W0}=p雙/2.
2.檢驗統計量為非對稱分布時,由于

所以
(i)拒絕域為右邊區域的右邊檢驗,
若W0≥W中,則p右=P{W≥W0}=p雙/2;
若W0<W中,則p右=P{W≥W0}=1-p雙/2.
(ii)拒絕域為左邊區域的左邊檢驗
若W0≥W中,則p左=P{W≤W0}=1-p雙/2;
若W0<W中,則p左=P{W≤W0}=p雙/2.
知道雙邊檢驗的p值和單邊檢驗的p值關系后,三種檢驗就可以一次完成.事實上,實際應用中只作一次雙邊檢驗或單邊檢驗有時是不夠的.比如在均值檢驗時,得到拒絕原假設μ=μ0的結論下,有時我們還需要進一步檢驗是否可以認為μ>μ0或μ<μ0才能得到較為準確的結論.即使是在得到不能拒絕原假設μ=μ0的結論下,如果雙邊檢驗的p值不夠大(0.05<p<0.1),即拒絕備擇假設μ≠μ0的證據較弱,往往也應該進一步作單邊檢驗,以得到較為合理的μ≥μ0或μ≤μ0的結論.針對這兩種情況,利用上述雙邊檢驗的p值和單邊檢驗的p值關系,將三種檢驗同時進行就很有必要.
在考慮雙邊檢驗的p值和單邊檢驗的p值關系時,當檢驗統計量為非對稱分布時要用到檢驗統計量分布的中位數,可查閱有關分位數表,或用統計軟件調用相應分位數函數進行計算.
1.檢驗統計量為對稱分布時.
例1 一家食品廠以生產袋裝食品為主,每天的產量大約為8000袋,每袋重量規定為100克.為了分析每袋重量是否符合要求,質檢部門經常進行抽檢.現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如表1所示.試從抽檢的樣本數據出發,檢驗袋裝食品的平均重量與100克是否有顯著差異.

表1 25袋食品的重量(單位:克)
分析與解答 設重量變量名為weight,本題是要求做原假設為μ=100的雙邊檢驗.但是根據檢驗p值與單邊檢驗p值的關系,我們可以將三種檢驗同時進行.
(i)雙邊檢驗(H0:μ=μ0=100; H1:μ≠μ0,α=0.05).
在SAS中作t檢驗結果如圖1.

圖1 t檢驗結果
從圖中看到原假設μ=100的p雙值為0.0355,在0.05的顯著水平下,應該拒絕原假設.
(ii)右邊檢驗(H0:μ≤100; H1:μ>100,α=0.05).
由于

拒絕右邊檢驗的原假設μ≤100.
(3)左邊檢驗(H0:μ≥100; H1:μ<100,α=0.05).
由于

不能拒絕左邊檢驗的原假設μ≥100.
綜上,我們可以認為袋裝食品的平均重量與100有顯著差異,袋裝食品的平均重量大于100克.
2.檢驗統計量為非對稱分布時.
例2 某藥材生產商要檢查包裝機械的狀態.根據規定,包裝機正常工作時,每袋重量為50克,方差為4.隨機抽取當天生產的16袋樣本稱重后結果如表2所示,試考查藥材包裝機的狀態是否正常.

表2 16袋藥材重量(單位:克)
分析與解答 設重量變量名為weight,本題首先做原假設為σ2=4的雙邊檢驗,再根據雙邊檢驗p值與單邊檢驗p值的關系,將三種檢驗同時進行,并綜合分析三種情況作出判斷.
(i)雙邊檢驗(H0:σ2=σ20=4; H1:σ2≠σ20,α=0.05).
在SAS中做方差的卡方檢驗結果如圖2.

圖2 χ2檢驗結果
從圖中看到原假設σ2=4的p雙值為0.0662,在0.05的顯著水平下,不能拒絕原假設.
(ii)右邊檢驗(H0:σ2≤4; H1:σ2>4,α=0.05).
由于自由度為15的χ2分布中位數為14.339,χ2=26.500>χ,p右=p雙/2=0.0331<0.05,應拒絕右邊檢驗的原假設σ2≤4.
(iii)左邊檢驗(H0:σ2≥4; H1:σ2<4,α=0.05).
由于χ2=26.500>χ,p左=P{W≤W0}=1-p雙/2=0.9669,不能拒絕左邊檢驗的原假設σ2≥4.
綜上,我們可以認為包裝重量的方差不小于4,即認為現在包裝機情況不夠穩定,需維修.
例3 從機械廠的兩臺機器所加工的同一種零件中,分別抽出8個和9個樣品,測量其尺寸如表3,試檢驗兩臺機器所加工零件的穩定性哪個較好?(α=0.05)

表3 兩臺機器所加工同一種零件的尺寸(單位:厘米)
分析與解答 設尺寸變量名為y,A機床加工該零件尺寸的方差為σ12,B機床加工該零件尺寸的方差為σ22.本題首先做原假設為σ12=σ22的雙邊檢驗,再根據檢驗p值與單邊檢驗p值的關系,將三種檢驗同時進行,并進行綜合分析作出判斷.
(i)雙邊檢驗(H0:σ=σ; H1:σ≠σ,α=0.05).
在SAS中做兩總體方差比的F檢驗結果如圖3.
(ii)右邊檢驗(H0:σ≤σ; H1:σ>σ,α=0.05).
由于自由度為(7,8)的F分布中位數為0.988,F=3.53>F中,p右=p雙/2=0.0491<0.05,拒絕右邊檢驗的原假設σ≤σ.
(iii)左邊檢驗(H0:σ≥σ; H1:σ<σ,α=0.05).
由于F=3.53>F中,p左=P{W≤W0}=1-p雙/2=0.9509,不能拒絕左邊檢驗的原假設σ≥σ.
綜上,我們可以認為A機床加工的零件尺寸的方差不比B機床加工的零件尺寸的方差小,即B機床加工的零件比A機床加工的零件尺寸更加穩定.

圖3 F檢驗結果
在統計推斷中掌握雙邊檢驗p值與單邊檢驗p值的關系,不僅可以更加靈活地使用統計軟件解決實際問題,而且可以三種檢驗同時進行使推斷結果更加客觀、符合實際.
[1] 峁詩松,程依明,濮曉龍,等.概率論與數理統計教程[M].北京:高等教育出版社,2004.
[2] 汪遠征,徐雅靜.SAS軟件與統計應用教程[M].北京:機械工業出版社,2007.
[3] 薛薇,SPSS統計分析方法及應用[M].北京:電子工業出版社,2004.
[4] Gerald Keller,Brian Warrack.Statistics for managenment and economics[M].王琪延,郝志敏,廉曉紅,等譯.北京:中國人民大學出版社,2006.
[5] 謝明文.關于單側檢驗拒絕的證明及假設檢驗的概率實質[J].北京:數學實踐與認識,2004(10):99-103.
The Flexible Application of Valuepin Hypothesis Tests
Z HI Gui-zhen, XU Ya-jing, QU S huang-hong, L U J in-mei, WA N G Yuan-zheng
(Dept.ofMath.and Infor.Sci.,Zhengzhou Inst.of Light Ind.,Zhengzhou 450002,China)
Supplying with the definition of Valuepin the hypothesis tests and the relationship of Valuepin unilateral test and bilateral test,this paper introduced the method and significance of using Valuepto carry on the three kinds of tests synchronously,some applied exaples will be given in the end.
hypothesis tests;valuep;rejection region
O212.1
C
1672-1454(2011)05-0152-05
2009-01-11
鄭州輕工業學院第八批教學改革與研究資助項目;鄭州輕工業學院研究生教育教學第一批教改項目;鄭州輕工業學院青年教師教學改革與研究項目