王瑞平
(上海市皮膚病醫(yī)院臨床研究與創(chuàng)新轉(zhuǎn)化中心 上海 200443)
臨床研究中,研究者在開展“暴露與結(jié)局”“干預(yù)與療效”評估時(shí),其理想狀態(tài)是研究對象除暴露因素和非暴露因素、干預(yù)因素和非干預(yù)因素有區(qū)別外,其他因素在不同組研究對象間均衡可比。為此,研究者通常采用隨機(jī)化、限制、傾向性評分匹配等方法實(shí)現(xiàn)上述目標(biāo)。但在研究的實(shí)施階段,由于各種原因,往往仍會(huì)存在研究結(jié)果與真實(shí)情況之間的系統(tǒng)偏差,導(dǎo)致偏倚發(fā)生,引起“暴露與結(jié)局”“干預(yù)與療效”評估的偏差,而混雜偏倚就是一種重要類型的偏倚。認(rèn)識(shí)、識(shí)別和控制混雜偏倚是臨床研究者須掌握的一項(xiàng)基本技能,準(zhǔn)確評估和控制混雜因素對研究結(jié)果的影響,可以提高研究結(jié)論的可靠性和應(yīng)用價(jià)值。本文將介紹混雜偏倚的概念,產(chǎn)生原因和特點(diǎn),以及控制混雜因素的措施等內(nèi)容,以期為研究者掌握識(shí)別、評估和控制臨床研究中的混雜因素提供參考。
臨床研究中,測量值與真實(shí)值之間的差異稱為誤差(error),包括隨機(jī)誤差(random error)和系統(tǒng)誤差(systematic error)。如圖1所示,隨機(jī)誤差也稱為偶然誤差和不定誤差,是由于在測定過程中一系列有關(guān)因素微小的隨機(jī)波動(dòng)而形成的具有相互抵償性的誤差。例如測量血壓,每次測量值之間的差異就是隨機(jī)誤差。隨機(jī)誤差無法完全消除,但可通過增加樣本量或測量次數(shù)減小隨機(jī)誤差。系統(tǒng)誤差則是指一種非隨機(jī)性誤差,如違反隨機(jī)原則的偏向性誤差,在抽樣中由登記記錄造成的誤差等。它使總體特征值在樣本中變得過高或過低。例如測量血壓,如果血壓計(jì)未進(jìn)行校正,導(dǎo)致測量值整體上系統(tǒng)性的高于或低于真實(shí)值的現(xiàn)象即為系統(tǒng)誤差,系統(tǒng)誤差可以通過一定的技術(shù)和方法進(jìn)行消除。偏倚(bias)是一種系統(tǒng)誤差,包括選擇性偏倚、信息偏倚和混雜偏倚。

圖1 臨床研究中的隨機(jī)誤差和系統(tǒng)誤差產(chǎn)生示意圖
混雜偏倚(confounding bias)是偏倚的一種重要類型,是指暴露因素與疾病發(fā)生的相關(guān)程度受到其他因素的歪曲或干擾,由于暴露因素對某疾病的作用與其他病因?qū)ν环N疾病的作用在同一個(gè)研究里交織在一起而引起的暴露效應(yīng)估計(jì)上的系統(tǒng)誤差。導(dǎo)致混雜產(chǎn)生的因素稱為混雜因素(confounding factor),它可以是疾病的危險(xiǎn)因素,也可以是保護(hù)因素,并且與研究的暴露因素存在關(guān)聯(lián)。
臨床研究中,除應(yīng)關(guān)注的研究變量(干預(yù)或暴露)和結(jié)局變量之間的關(guān)聯(lián)外,還可能存在第3個(gè)因素與這2個(gè)變量有關(guān),且可能部分或全部地影響兩者之間的真實(shí)聯(lián)系,掩蓋或夸大研究因素與結(jié)局之間的關(guān)聯(lián)強(qiáng)度,而這些因素就便被稱為混雜因素,其所導(dǎo)致的偏倚則稱為混雜偏倚(圖2)。判定一個(gè)因素是否為混雜因素,須要同時(shí)滿足以下3個(gè)條件:①混雜因素必須與所研究疾病的發(fā)生有關(guān),是該疾病的危險(xiǎn)因素之一;②混雜因素必須與所研究因素有關(guān);③混雜因素必須不是研究因素與疾病病因鏈上的中間環(huán)節(jié)或中間步驟[1]。例如,研究飲酒與肝癌之間的關(guān)聯(lián),吸煙就是一個(gè)潛在的混雜因素,因?yàn)椋孩傥鼰熓歉伟┑奈kU(xiǎn)因素;②吸煙與飲酒存在關(guān)聯(lián);③吸煙不是飲酒與肝癌發(fā)生病因鏈上的中間環(huán)節(jié)。

圖2 混雜因素判定條件的示意圖
混雜偏倚的特點(diǎn)是具有方向性,其可以表達(dá)為“正混雜和負(fù)混雜”,也可以表達(dá)為“趨向無效值、遠(yuǎn)離無效值或顛倒”。負(fù)混雜為縮小暴露與疾病之間的關(guān)聯(lián);正混雜為夸大暴露與疾病之間的關(guān)聯(lián)。如圖3所示,當(dāng)以Δ表示研究效應(yīng)的真實(shí)值,以Δ'表示研究效應(yīng)的估計(jì)值,如果①Δ>1,暴露為危險(xiǎn)因素,Δ>Δ'>1為負(fù)混雜(圖3a),Δ'>Δ>1為正混雜(圖3b);②Δ<1,暴露為保護(hù)性因素,Δ<Δ'<1,為負(fù)混雜(圖3a),Δ'<Δ<1,為正混雜(圖3b)。當(dāng)比值比(odd ratio, OR)或相對危險(xiǎn)度(relative risk,RR)=1時(shí),即為無效值。由此,①Δ'相比于Δ更趨向1,即混雜趨向于無效值,混雜因素“縮小”真實(shí)效應(yīng)(圖3c);②Δ'相比于Δ更遠(yuǎn)離1,即混雜遠(yuǎn)離無效值,混雜因素“夸大”真實(shí)效應(yīng)(圖3d);③Δ'和Δ位于1的兩側(cè),混雜因素顛倒真實(shí)效應(yīng)(圖3e)。臨床研究中,如果混雜偏倚為負(fù)混雜,調(diào)整后真實(shí)的關(guān)聯(lián)強(qiáng)度更大,混雜因素對研究結(jié)論無明顯影響。但如果混雜因素為正混雜,研究者須評估混雜因素的大小并進(jìn)行合理調(diào)整,最后根據(jù)調(diào)整后的結(jié)果進(jìn)行綜合分析,在給出研究結(jié)論時(shí)須謹(jǐn)慎。

圖3 混雜偏倚的方向示意圖
混雜偏倚同時(shí)還具有一定的大小。假設(shè)以Δ表示研究效應(yīng)的真實(shí)值,以Δ'表示研究效應(yīng)的估計(jì)值,用公式value=|Δ'-Δ|/Δ可表示正負(fù)混雜因素的相對大小。但是,研究者須注意評估混雜因素的大小不適用于混雜因素存在顛倒的情況。例如,一項(xiàng)吸煙與肺癌的隊(duì)列研究結(jié)果顯示[2],吸煙與肺癌的估計(jì)效應(yīng)值RRc=2.6,調(diào)整年齡混雜因素后,吸煙與肺癌的效應(yīng)值RRa=3.4,根據(jù)如下公式計(jì)算,混雜偏倚的大小為0.24,方向?yàn)樨?fù)混雜。

在臨床研究過程中,研究者須要識(shí)別并控制潛在的混雜偏倚,而識(shí)別混雜偏倚常用的方法就是分層分析。為方便理解,本文引用“一項(xiàng)口服避孕藥(oral contraceptive, OC)與心肌梗死(myocardial infarction,MI)病例對照研究”舉例說明[3]。
在該項(xiàng)研究中,考慮到年齡與OC、MI均有關(guān),即考慮年齡是潛在的混雜因素,因此將年齡(<40和≥40歲)分為兩層,來判定年齡是否為OC與MI關(guān)聯(lián)的潛在混雜因素,并進(jìn)行混雜偏倚大小和方向的評價(jià)。如圖4所示,首先,根據(jù)原始數(shù)據(jù)計(jì)算出表示OC與MI發(fā)病之間關(guān)聯(lián)強(qiáng)度的OR=2.20,95%置信區(qū)間(confidence interval, CI):1.26~3.84。然后,根據(jù)混雜因素判定的3個(gè)條件:①判定年齡是否與OC有關(guān),摘取兩層對照組患者數(shù)據(jù)(圖4中實(shí)線框內(nèi)數(shù)據(jù)),計(jì)算出年齡與OC之間的OR值為3.91;②判定年齡與MI是否有關(guān),摘取兩層未服用口服避孕藥患者數(shù)據(jù)(圖4中虛線框數(shù)據(jù)),計(jì)算出年齡與MI之間的關(guān)聯(lián)強(qiáng)度OR值為0.48;③年齡不是“OC與MI”發(fā)病的中間環(huán)節(jié)。由此可以判定,年齡是潛在的混雜因素。

圖4 混雜偏倚識(shí)別方案之分層分析
進(jìn)一步分別計(jì)算兩層中OC與MI之間的關(guān)聯(lián)強(qiáng)度。在<40歲年齡層,OR=(ad)/(bc)=(21×59)/(17×26)=2.80;在≥ 40歲年齡層,OR=(ad)/(bc)=(18×95)/(88×7)=2.78。可知兩層之間的關(guān)聯(lián)強(qiáng)度同質(zhì),由此確認(rèn)了年齡在OC與MI關(guān)聯(lián)之間起到混雜作用。為扣除年齡這個(gè)混雜因素的影響,應(yīng)按照如下公式開展Mantel-Haenszel合并計(jì)算,得到ORMH=2.79,與未調(diào)整的OR=2.20相比,年齡為負(fù)混雜,縮小了OC與MI的關(guān)聯(lián)強(qiáng)度,混雜偏倚大小為value=(2.20-2.79)/2.79= 0.21。

臨床研究中,在識(shí)別和確認(rèn)混雜偏倚后,一項(xiàng)重要的工作就是去扣除(校正)混雜偏倚的影響,還原“暴露與結(jié)局”“干預(yù)與療效”之間的真實(shí)關(guān)聯(lián)強(qiáng)度。而在實(shí)際操作中,可以運(yùn)用研究設(shè)計(jì)和統(tǒng)計(jì)分析中的方法對混雜偏倚進(jìn)行控制或校正。
①隨機(jī)化(randomization):在研究設(shè)計(jì)階段,臨床試驗(yàn)中以隨機(jī)化原則將研究對象以同等的幾率被分配在各處理組中,將某一個(gè)或某些可能的混雜因素在組間達(dá)到均衡,控制已知和未知混雜因素。但隨機(jī)化不適用于觀察性研究,同時(shí)研究者還須關(guān)注某些研究中存在的倫理學(xué)問題。
②限制(restriction):針對某一個(gè)或某些可能的混雜因素,在研究對象入選條件予以限制,僅在具有一定特征的對象中進(jìn)行觀察,提高受試人群的同質(zhì)性,以排除混雜因素的干擾。例如,考慮“性別”對分析年齡因素對急性心肌梗死預(yù)后的影響,可以僅選擇40~69歲的男性前壁心肌梗死患者中開展。但是由于進(jìn)行了限制,研究結(jié)果的代表性差,外推性也會(huì)受到影響。
③匹配(matching):在研究設(shè)計(jì)階段,將某一個(gè)或某些可能的混雜因素,在研究對象入選時(shí)予以匹配,控制已知的混雜因素,該方法在觀察性研究和臨床試驗(yàn)都可以采用。例如,開展一項(xiàng)吸煙與肺癌的病例對照研究,文獻(xiàn)顯示年齡和性別是潛在混雜因素,在對象入選是進(jìn)行個(gè)體匹配,消除年齡(±1歲)和性別(同性別)影響。該方法的局限性為匹配因素多時(shí)難操作,同時(shí)對于匹配的因素在統(tǒng)計(jì)分析時(shí)無法評估其對暴露或結(jié)局的影響。
1)分層或亞組分析:通過分層(stratification)分析或亞組(subgroup)分析,將研究結(jié)局按照混雜因素分成幾個(gè)層或亞組,在組內(nèi)對終點(diǎn)指標(biāo)進(jìn)行分析,隨后應(yīng)用Mantel-Haenszel合并計(jì)算即可控制混雜偏倚的影響。
2)標(biāo)準(zhǔn)化(standardization):當(dāng)兩組對象內(nèi)部構(gòu)成存在差別時(shí)可能會(huì)導(dǎo)致結(jié)論的偏差,為校正這種影響可用率的標(biāo)準(zhǔn)化法,通過“迫使”暴露組和非暴露組擁有相同的混雜因素水平,形成人為的組間可比性,然后在混雜因素分布相同的情況下比較兩組的發(fā)病情況。例如,AB兩家醫(yī)院用同一種療法治療某病,治療對象有普通型和重癥型兩類患者,其中A醫(yī)院為三甲醫(yī)院,收治重癥病例較多;B醫(yī)院為二乙醫(yī)院,收治普通病例較多。如圖5所示,整體上看A醫(yī)院的治愈率(47.50%)低于B醫(yī)院(53.75%),但如果按照患者的嚴(yán)重程度分層看,A醫(yī)院收治的普通型病例和重型病例的治愈率均高于B醫(yī)院,導(dǎo)致合計(jì)結(jié)果與分層結(jié)果不一致的主要原因就是因?yàn)锳醫(yī)院和B醫(yī)院收治的患者重癥和普通型的比例不一樣。為消除患者疾病嚴(yán)重程度這個(gè)混雜因素的影響,采用標(biāo)準(zhǔn)化的方法。如圖6所示,首先,選擇A醫(yī)院和B醫(yī)院就診病例的合計(jì)數(shù)作為“標(biāo)準(zhǔn)人口”共800例,其中普通型400例,重型400例。其次,分別依據(jù)A醫(yī)院和B醫(yī)院普通型和重型病例的治愈率,計(jì)算標(biāo)化治愈人數(shù),然后用標(biāo)化治愈人數(shù)除以標(biāo)準(zhǔn)人口數(shù)(800人),即得到A醫(yī)院和B醫(yī)院的標(biāo)化治愈率,分別為50.88%和47.50%,兩者進(jìn)行比較即可。

圖5 率的標(biāo)準(zhǔn)化應(yīng)用示例(一)

圖6 率的標(biāo)準(zhǔn)化應(yīng)用示例(二)
3)多因素分析(multivariate analysis):在研究分析階段,將已知的潛在混雜因素放入模型,利用多元回歸模型進(jìn)行流行病學(xué)數(shù)據(jù)分析,進(jìn)而達(dá)到控制混雜因素的目的。常用的模型包括:Logistic回歸、多元線性回歸回歸、廣義線性模型、最優(yōu)尺度回歸、比例風(fēng)險(xiǎn)回歸等。具體操作方法可參考本刊2022年第43卷“臨床研究規(guī)范”專欄其他文獻(xiàn)或工具書。