高文龍 劉小寧 顏 虹△
對(duì)于來(lái)自正態(tài)總體完全隨機(jī)設(shè)計(jì)多組樣本數(shù)據(jù)資料的多重比較可以通過(guò)方差分析方法來(lái)實(shí)現(xiàn)。然而,對(duì)總體分布未知的數(shù)據(jù)資料利用方差分析方法來(lái)直接進(jìn)行檢驗(yàn),可能增加統(tǒng)計(jì)推斷的誤差〔1〕。秩和檢驗(yàn)是這類(lèi)數(shù)據(jù)資料分析的重要工具,因?yàn)橹群蜋z驗(yàn)方法并不要求數(shù)據(jù)資料滿足正態(tài)性假定。Nemenyi法檢驗(yàn)是一種能夠?qū)崿F(xiàn)多樣本間兩兩比較的一種常用的秩和檢驗(yàn)方法。但在常用的統(tǒng)計(jì)軟件包(SPSS或SAS)中沒(méi)有提供這種方法完整的分析模塊,筆者利用SAS軟件,通過(guò)編程實(shí)現(xiàn)了Nemenyi法檢驗(yàn),為更多研究者利用此方法解決問(wèn)題提供了新思路。
Kruskal-Wallis H檢驗(yàn),是完全隨機(jī)設(shè)計(jì)多個(gè)獨(dú)立樣本比較的秩和檢驗(yàn)方法,它用于推斷計(jì)量資料或等級(jí)資料的多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布是否有差別。統(tǒng)計(jì)量H如下所示:

N為樣本總數(shù),Ri為第i組的秩和,ni為第i組的樣本例數(shù)。
當(dāng)樣本數(shù)據(jù)存在相同秩,H值偏小,需要校正。

ti為第i個(gè)同秩個(gè)數(shù)。
如果,Kruskal-Wallis H檢驗(yàn)結(jié)果為拒絕H0,接受H1,可以認(rèn)為多個(gè)總體分布位置不全相同,要進(jìn)一步分析哪兩組總體分布位置不同,可以利用Nemenyi法檢驗(yàn)得到所需要的結(jié)果。此時(shí),H0:為任意兩個(gè)總體分布位置相同;H1:為任意兩個(gè)總體分布位置不同。規(guī)定檢驗(yàn)水準(zhǔn)為0.05。統(tǒng)計(jì)量值為:

其中Ri為第i組的均秩,Rj為第j組的均秩,N為樣本總數(shù),ni為第i組的樣本例數(shù),nj為第j組的樣本例數(shù),C為式(3)所計(jì)算的統(tǒng)計(jì)量。v為自由度,g為樣本組數(shù)。
本文選取文獻(xiàn)〔1〕中介紹的例8-6。比較小白鼠接種三種不同菌型傷寒桿菌9D、11C和DSC1后存活日數(shù),結(jié)果見(jiàn)表1。問(wèn)小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)有無(wú)差別?

表1 小白鼠接種三種不同菌型傷寒桿菌存活日數(shù)比較〔1〕
Nemenyi法檢驗(yàn)的步驟及SAS程序如下所示:〔2〕
第一步:根據(jù)表1,建立數(shù)據(jù)集:

第二步:調(diào)用proc npar1way wilcoxon過(guò)程,實(shí)現(xiàn)Kruskal-Wallis H檢驗(yàn),并將 wilcoxon scores輸出到WS數(shù)據(jù)集(圖1),將Kruskal-Wallis檢驗(yàn)結(jié)果輸出到數(shù)據(jù)集KWT(圖2)。


圖1 SAS數(shù)據(jù)集WS
Kruskal-Wallis檢驗(yàn)結(jié)果顯示χ2=9.940492,P<0.01,可以認(rèn)為多個(gè)總體分布位置不全相同。

圖2 SAS數(shù)據(jù)集KWT
第三步:整理 Nemenyi法檢驗(yàn)所用的數(shù)據(jù)集WSKWT(圖3)。

第四步:實(shí)現(xiàn)Neymenyi法檢驗(yàn),輸出結(jié)果(表2)。



圖3 SAS數(shù)據(jù)集WSKWT

表2 SAS Nemenyi法檢驗(yàn)結(jié)果
如表2所示,p12和p13均小于0.05,p23>0.05。因此,可認(rèn)為小白鼠接種11C的存活日數(shù)高于接種9D的存活日數(shù);接種DSC1的存活日數(shù)高于接種9D的存活日數(shù);尚不能認(rèn)為小白鼠接種11C與接種DSC1的存活日數(shù)有差別。
與文獻(xiàn)〔1〕和文獻(xiàn)〔3〕相比,本文所得結(jié)論與之相同。本文將SAS結(jié)果輸出結(jié)果調(diào)入數(shù)據(jù)集,整理后進(jìn)行Nemenyi法檢驗(yàn),一方面,減少了編秩程序〔4〕,保持了SAS計(jì)算數(shù)值的精度,另一方面,減少了因手工抄算而導(dǎo)致的錯(cuò)誤和精度損失。因此,文獻(xiàn)〔3〕檢驗(yàn)的精度要低于本研究的結(jié)果。本文所采用的實(shí)例滿足χ2分布檢驗(yàn)要求,因此把SAS proc npar1way wilcoxon輸出的χ2值作為Hc直接進(jìn)行校正值C值計(jì)算,減少了C值編程計(jì)算上的冗余,簡(jiǎn)化了程序。對(duì)于概率值的計(jì)算,本文利用了χ2分布的概率密度函數(shù)雙側(cè)求解,進(jìn)行雙尾檢驗(yàn)。此外,本文以三組樣本為例進(jìn)行了Nemenyi法的演示分析,如果對(duì)三組以上的數(shù)據(jù)利用此方法檢驗(yàn),需要對(duì)本文SAS Nemenyi法檢驗(yàn)步驟中第四步程序作相應(yīng)的改動(dòng)。
1.孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第2版.北京:人民衛(wèi)生出版社,2006:130-133.
2.朱世武.SAS編程技術(shù).北京:清華大學(xué)出版社,2007.
3.劉偉,林漢生.SPSS在完全隨機(jī)設(shè)計(jì)多個(gè)樣本間多重比較Nemenyi秩和檢驗(yàn)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,4(26):214-216.
4.劉尚輝,王亞奇.運(yùn)用SAS做秩和檢驗(yàn).中國(guó)衛(wèi)生統(tǒng)計(jì),2008,1(25):25.