濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)研究所(261053)
李志華△ 劉洪慶
·方法介紹·
1:M配比病例對(duì)照研究資料分析方法的探討*
濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)研究所(261053)
李志華△劉洪慶
目的 通過(guò)對(duì)幾種分析方法的比較,探討1:M配比病例對(duì)照研究資料分析便捷實(shí)現(xiàn)形式。方法 以《流行病學(xué)》教材給出的病例對(duì)照研究實(shí)例和相關(guān)文獻(xiàn)報(bào)道為資料,采用《醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)》、《流行病學(xué)研究方法與應(yīng)用》、Pike與Morrow介紹的方法進(jìn)行驗(yàn)證比較,對(duì)χ2檢驗(yàn)公式整合與分解,采用Excel軟件編制χ2檢驗(yàn)和OR估計(jì)值的計(jì)算表。結(jié)果 《流行病學(xué)研究方法與應(yīng)用》介紹的方法與Pike與Morrow(1970)報(bào)道的方法驗(yàn)證結(jié)果相同,分析原理相同。《醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)》介紹的方法是建立在病例對(duì)照研究分層分析法總χ2值的計(jì)算,且沒(méi)有進(jìn)行連續(xù)的校正,χ2值偏高。結(jié)論 通過(guò)對(duì)χ2檢驗(yàn)公式的整合與分解,采用Excel軟件編制χ2檢驗(yàn)和OR值計(jì)算表,可以便捷分析1:M配比病例對(duì)照研究的資料。
1:M配比的病例對(duì)照研究χ2檢驗(yàn) 分析方法
病例對(duì)照研究是流行病學(xué)常用的研究方法之一,是臨床流行病學(xué)研究罕見(jiàn)病病因的最佳方法?!读餍胁W(xué)》第5版[1]、第6版[2]和第7版[3]在研究實(shí)例部分均介紹了美國(guó)Vincent紀(jì)念醫(yī)院的Herbst醫(yī)生對(duì)陰道腺癌病因研究的例子。該報(bào)道是采用1:4配比的病例對(duì)照研究方法,并指出資料分析采用Pike和Morrow(1970)非參數(shù)檢驗(yàn)[4]。我們先后采用《醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)》(第二版)[5]、《流行病學(xué)研究方法與應(yīng)用》(第二版)[6]、Pike與Morrow[7]介紹的方法進(jìn)行了驗(yàn)證,發(fā)現(xiàn)按照分層分析的原理分析1:M配比的病例對(duì)照研究資料,不同程度地高估了暴露效應(yīng)。本文就1:M配比資料的χ2檢驗(yàn)和OR值的估計(jì)方法進(jìn)行了探討。
1.《流行病學(xué)》教材給出的實(shí)例[1-3]和Herbst文獻(xiàn)報(bào)道[4]
美國(guó)Vincent紀(jì)念醫(yī)院的Herbst醫(yī)生對(duì)陰道腺癌病因研究,病例組和對(duì)照組的母親部分主要暴露因素的分析結(jié)果,見(jiàn)表1。
2.分析方法
分別采用方積乾主編《醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)》、趙仲堂主編《流行病學(xué)研究方法與應(yīng)用》和Pike 和Morrow關(guān)于1:M配比設(shè)計(jì)的資料分析方法[5-7]。
1.分析結(jié)果
以表1為例,除母親年齡外,其他因素分別采用上述3種分析方法,結(jié)果見(jiàn)表2。
注①Herbst報(bào)道中未見(jiàn)OR值。②P值按分布臨界值表估計(jì)。③Pike與Morrow在該文獻(xiàn)中沒(méi)有給OR計(jì)算方法。
從表2結(jié)果可以看出,4種分析方法對(duì)各個(gè)因素的統(tǒng)計(jì)學(xué)意義影響不大,但是《醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)》介紹的方法所計(jì)算的值明顯高于其他方法,也就是說(shuō)實(shí)際對(duì)應(yīng)的P值減小。
2.原理分析
(1)《醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)》1:M配比設(shè)計(jì)的資料分析原理
當(dāng)危險(xiǎn)因素按二項(xiàng)分類(lèi)時(shí),1:M配比的可能結(jié)果有2(M+1)種。設(shè)全部資料共有k個(gè)配比組。對(duì)第i個(gè)配比組的結(jié)果表達(dá),見(jiàn)表3。
分析原理:Yi為指示變量,當(dāng)病例接觸危險(xiǎn)因子時(shí),令Yi=1,否則令Yi=0;Xi表示在M個(gè)對(duì)照中接觸危險(xiǎn)因子的例數(shù)。
(1)
(2)
式中符號(hào)對(duì)應(yīng)表3所示之含義。
(3)
式中ai、bi、ci、di分別代表第i層四個(gè)格子的數(shù),n1i、n0i、m1i、m0i分別代表四格表的行與列合計(jì),ni代表第i層樣本總例數(shù)。
2.《流行病學(xué)研究方法與應(yīng)用》關(guān)于1:M配比資料的分析[6]
資料整理成表4。
(1)估計(jì)優(yōu)勢(shì)比(OR):
(4)
(5)
其中:
(3)Pike與Morrow介紹的方法[7]
根據(jù)Pike與Morrow的文獻(xiàn)報(bào)道,資料整理成表5。
表和公式中的m表示配比數(shù),在無(wú)效假設(shè)前提下,自由度v=1時(shí),總的χ2檢驗(yàn)近似公式是:
(6)
其中:
E(mm,i)=nm,i×i/(m+1)
V(mm,i)=nm,i×i×(m+1-i)/(m+1)2
3.χ2檢驗(yàn)公式的整合與分解
根據(jù)Pike與Morrow以及近些年來(lái)國(guó)內(nèi)學(xué)者的意見(jiàn),依據(jù)表5資料整理格式,將檢驗(yàn)公式(6)整合成公式(7),然后分解成公式(8)。按照公式(8)和公式(4),采用Excel軟件編制了χ2檢驗(yàn)和OR估計(jì)值的計(jì)算表,以“以往流產(chǎn)史與她們的女兒發(fā)生陰道腺癌的關(guān)系”為例,見(jiàn)表7。
(7)
∑[nc,i×i×(c+1)-nc,i×i2]
(8)
*:χ2=7.16,OR=10.50,95%CI(1.88,58.74)
結(jié)論:χ2所得值與《流行病學(xué)研究方法與應(yīng)用》1:M配比資料的分析結(jié)果完全一致,統(tǒng)計(jì)學(xué)意義無(wú)需贅述。
在罕見(jiàn)病病因的研究中,由于病例數(shù)極少,采用配比的方法能夠提高檢驗(yàn)效率,王天根認(rèn)為1:1配比是最浪費(fèi)信息的設(shè)計(jì),當(dāng)病例是罕見(jiàn)的疾病而對(duì)照相對(duì)較易獲得的時(shí)候,常采用1:M配比,其設(shè)計(jì)一般最多配比數(shù)為4,配比數(shù)量繼續(xù)增加,檢驗(yàn)效能增加幅度將越來(lái)越低[8]。
通過(guò)查閱1980年以來(lái)國(guó)內(nèi)相關(guān)文獻(xiàn),發(fā)現(xiàn)按照分層分析的方法,不但每層的例數(shù)僅有1+4個(gè),而且四格表中每個(gè)格子的理論值將均小于5,有的甚至小于1,按照卡方檢驗(yàn)的基本原理,應(yīng)該采用確切概率法直接求P值。Mantel-Haenszel(1959)提出了直接進(jìn)行卡方檢驗(yàn)的方法。Pike與Morrow在1970基于卡方檢驗(yàn)的基本原理提出了本文前述的分析方法。
按照分層分析法計(jì)算的χ2值均大于其他方法,Pike與Morrow分析方法是基于χ2檢驗(yàn)的基本原理,即(實(shí)際頻數(shù)-理論頻數(shù))/方差,符合1:M配比資料中每個(gè)對(duì)子實(shí)際暴露數(shù)多小于5的資料。前者在計(jì)算公式中沒(méi)有使用連續(xù)校正,是不符合于檢驗(yàn)的基本原理的。
OR95%置信區(qū)間的估計(jì),一般采用Woolf自然對(duì)數(shù)轉(zhuǎn)換法和Miettnen氏卡方值法,與王書(shū)平[11]采用SAS自編程序比較,Miettnen氏卡方值法估計(jì)的置信區(qū)間的范圍比較窄,因此其計(jì)算置信區(qū)間的精確度比較高。Woolf自然對(duì)數(shù)轉(zhuǎn)換法是建立在OR方差的基礎(chǔ)上,主要使用表格中的原始數(shù)據(jù),而Miettnen氏卡方值法與卡方值的聯(lián)系比較大。因此本文例題中OR95%置信區(qū)間的估計(jì)均采用Miettnen氏卡方值法。
[1]李立明,主編.流行病學(xué).第5版.北京:人民衛(wèi)生出版社,2003,81-82.
[2]李立明,主編.流行病學(xué).第6版.北京:人民衛(wèi)生出版社,2007,86-87.
[3]詹思延,主編.流行病學(xué).第7版.北京:人民衛(wèi)生出版社,2012,101-102.
[4]Herbst AL,Ulfelder H,Poskanze DC.Adenocarcinoma of the Vagina -Association of Maternal Stilbestrol Therapy with Tumor Appearance in Young Women.N Engl J Med,1971,284(15):878-881.
[5]方積乾,主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn).第2版.北京:人民衛(wèi)生出版社,2001:319-323.
[6]趙仲堂,主編.流行病學(xué)研究方法與應(yīng)用.第2版.北京:人民衛(wèi)生出版社,2005:89-90.
[7]Pike MC,Morrow RH.Statistical analysis of patient-control studies factor under investigation an all-or-none variable.Brit J Prev Soc Med,1970,24(1):42-44.
[8]王天根,主編.流行病學(xué)研究方法.北京:人民衛(wèi)生出版社,1991,83-119.
[9]魏承毓,張漢民,李遂初,等,主編.實(shí)用流行病學(xué).蘭州:甘肅科學(xué)技術(shù)出版社,1989:81-114.
[10]沈福民,主編.流行病學(xué)原理與方法.上海:復(fù)旦大學(xué)出版社,2001:37-53.
[11]王書(shū)平.1:M配對(duì)病例-對(duì)照研究中兩種可信區(qū)間的SAS 分析方法.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(5):606-607.
(責(zé)任編輯:郭海強(qiáng))
2013年濰坊醫(yī)學(xué)院科技創(chuàng)新研究基金資助(K1301008)
△通信作者:李志華