南京醫(yī)科大學公共衛(wèi)生學院生物統(tǒng)計學系(211166)
李清雅 魏永越 施倩雯 段巍巍 陳 峰△
【提 要】 目的 本研究以生存結局為切入點,探討含兩個中介變量時的中介生存分析模型(Aalen相加風險模型、Cox比例風險模型、加速失效時間AFT模型),為預后的多中介變量分析方法的選擇提供應用建議。方法 通過統(tǒng)計模擬試驗,設定不同的相關系數(shù)、效應比、刪失率等,從第一類錯誤及檢驗效能等方面對上述三種方法進行統(tǒng)計學性質(zhì)評價。結果 中介變量與暴露的相關系數(shù)越大,越容易發(fā)現(xiàn)中介變量的中介效應;刪失率與效應比對Aalen模型的影響較大,對其他兩種模型的影響較小;隨著刪失率的降低,Aalen模型的第一類錯誤反而膨脹,故Aalen模型不適用于多中介變量的分析;樣本量越大,三種模型的檢驗效能差別減小且趨于穩(wěn)定。不同參數(shù)設定下,AFT模型的檢驗效能最大,其次為Cox模型,最后為Aalen模型。結論 AFT模型優(yōu)于其他兩種方法,推薦用于生存結局的多中介變量的中介分析;進行中介分析時需要足夠的樣本量。
中介分析(mediation analysis)是研究暴露通過中介變量對結局效應的一種方法,是研究疾病發(fā)生機制的工具之一[1-4]。在醫(yī)學研究中,大量確證性研究采用中介分析,建立中介模型來進行因果關系的分析。由于研究情境復雜,常用的考慮單個中介變量的中介模型往往不能滿足實際問題的分析需求,需要考慮多個中介變量才能更清晰地解釋暴露對結局的效應,這方面的研究越來越受到理論界的關注[5-7]。特別在生存分析中,多中介模型的研究和應用剛剛起步[8,9]。
目前,針對生存結局,常用的三種針對多個中介變量的生存模型分析方法有:Aalen相加風險模型,Cox比例風險模型和加速失效時間(AFT)模型。三種模型分別描述了特定尺度下的中介效應,Aalen相加風險模型是基于風險之差,Cox模型基于對數(shù)風險之比,AFT模型基于平均生存時間之比。然而,至今尚無報道對以上三種方法進行比較評價。
本研究以生存結局為切入點,探討兩個中介變量的中介生存分析模型,通過統(tǒng)計模擬試驗,設定不同的相關系數(shù)、效應比、刪失率等,從第一類錯誤及檢驗效能等方面對上述三種方法進行統(tǒng)計學性質(zhì)評價,為預后的多中介變量的中介分析方法的選擇提供應用建議。
用S表示個體的暴露,M1和M2表示兩個中介變量,Y表示結局變量,S、M1、M2和Y的因果關系見圖1。

圖1 兩中介變量的因果關系圖
首先,定義結局變量Y是關于疾病發(fā)展時間T的函數(shù),Y=H(T)。Y(s,m1,m2)是將暴露S、中介變量M1和中介變量M2的值分別設為s、m1、m2時反事實(指在不同條件下有可能發(fā)生但違反現(xiàn)存事實)的結局變量的值;M2(s,m1)是將暴露S、中介變量M1的值分別設為s、m1時反事實的中介變量M2的值;M1(s)是將暴露S的值設為s時反事實的中介變量M1的值。將自然直接效應和間接效應擴展到兩中介變量模型,定義如下三個特定路徑效應[10-11]:
ΔS→Y=Y(s1,M1(s0),M2(s0,M1(s0)))-Y(s0,M1(s0),M2(s0,M1(s0)))
ΔS→M2→Y=Y(s1,M1(s0),M2(s1,M1(s0)))-Y(s1,M1(s0),M2(s0,M1(s0)))
ΔS→M1Y=Y(s1,M1(s1),M2(s1,M1(s1)))-Y(s1,M1(s0),M2(s1,M1(s0)))
(1)
分別構建M1和M2的線性回歸模型:
(2)
(3)

(4)
其中λi表示個體i發(fā)展成某種疾病的風險;λ0(t)是基線風險。
在風險差異的尺度下重新表達特定路徑效應(PSEs):
(5)

相加風險模型假設風險是被線性預測的,與相加風險模型不同,Cox模型假設風險是呈指數(shù)(對數(shù)風險尺度上呈線性)被預測的:
(6)
在對數(shù)風險比的尺度下重新表達特定路徑效應(PSEs):
(7)
與Cox比例風險模型類似,以加速失效時間(AFT)模型建立生存結局的模型:
(8)
其中ε是服從極值分布的隨機變量,是尺度參數(shù)。在平均生存時間比的尺度下重新表達特定路徑效應(PSEs):
(9)
可通過重抽樣的方法計算ΔAalen、ΔCox和ΔAFT的方差和可信區(qū)間[12]。
(1)指定ΔS→Y,即對應λS(或γS,θs)值;
(2)指定樣本量(N)、S與M1、S與M2、和M1與M2的相關系數(shù)r1、r2和r3,可產(chǎn)生多元標準正態(tài)分布隨機數(shù)S、M1和M2;此時r1、r2和r3即為δS,αS和αM值;
(3)指定效應比R,即間接效應/直接效應,可知ΔS→M1Y,根據(jù)公式可計算求得λM1值;
(4)把變量S、M1、M2和設定的系數(shù)代入指數(shù)回歸模型的風險函數(shù)λi=exp(λSSi+λM1M1i+λM2M2i),基于指數(shù)分布隨機產(chǎn)生生存時間;
(5)根據(jù)樣本量(N)和刪失率(cen%)隨機產(chǎn)生截尾,1代表死亡,0代表刪失。
(6)設λM2=0,比較方法的第一類錯誤;設λM2= 1,比較方法的檢驗效能。
模擬試驗中考慮的影響因素包括S與M1、S與M2、M1與M2的相關系數(shù),效應比、刪失率、樣本量等。中介變量與中介變量以及中介變量與暴露之間的關系越復雜,越難將中介變量的效應從暴露對結局的效應中分解出來,會影響中介分析的檢驗效能。由于生存資料的刪失率越高,模型預測越不準確,模擬試驗時刪失率取值70%以下。參數(shù)設置見表1。

表1 模擬試驗參數(shù)設置情況
(1)根據(jù)不同的參數(shù)設置產(chǎn)生模擬數(shù)據(jù);
(2)對產(chǎn)生的同一模擬數(shù)據(jù)分別用三種方法進行分析,提取相關結果,包括三個特定路徑效應(PSEs)的點估計、區(qū)間估計(95%CI)及假設檢驗P值;
(3)重復(1)~(2)步驟1000次,對1000次的結果進行匯總,得到三種方法的第一類錯誤和檢驗效能。
(1)刪失率對第一類錯誤的影響
在Aalen模型中,當相關系數(shù)r1固定時,隨著相關系數(shù)r2的增大,第一類錯誤逐漸膨脹,并超過0.05;當相關系數(shù)r1、r2均固定時,隨著刪失率(cen%)的增加,第一類錯誤逐漸減小。
在Cox模型中,當相關系數(shù)r1固定時,隨著相關系數(shù)r2的增大,第一類錯誤逐漸增大且趨于0.05;當相關系數(shù)r1、r2均固定時,隨著刪失率(cen%)的增加,第一類錯誤逐漸減小。
在AFT模型中,結果與Cox模型類似。當樣本量較大(N=500)時,三種模型的第一類錯誤受刪失率的影響很小。
圖2顯示了當M1與M2的相關系數(shù)r3=0,效應比R=0.1,刪失率(cen%)為70%時,三種模型的第一類錯誤的比較。橫坐標為兩個中介變量(M1、M2)與暴露(S)的相關系數(shù)(r1、r2)的組合,縱坐標為第一類錯誤。

圖2 三種模型的第一類錯誤的比較
(2)M1與M2的相關性對第一類錯誤的影響
當刪失率(cen%)為70%,效應比R為0.1時,隨著M1與M2的相關系數(shù)r3逐漸增大,三種模型的第一類錯誤的差別逐漸減小且趨于穩(wěn)定。
(3)樣本量的影響
總體來講,隨著樣本量N的增加,不同情景下,三種模型的第一類錯誤逐漸趨于穩(wěn)定。Aalen模型的第一類錯誤略有膨脹,其他兩種模型的第一類錯誤趨于設定的0.05。
表2顯示了當M1與M2的相關系數(shù)r3=0,效應比R=0.1,刪失率(cen%)為70%時,樣本量N對三種模型的第一類錯誤的影響。
(1)刪失率對檢驗效能的影響
在Aalen模型中,當M1與S的相關系數(shù)r1固定時,隨著相關系數(shù)r2的增大,檢驗效能出現(xiàn)先增大后減小的趨勢;當相關系數(shù)r1、r2均固定時,隨著刪失率(cen%)的增加,檢驗效能逐漸減小,當刪失率(cen%)為70%時,檢驗效能最小。
在Cox模型中,當M1與S的相關系數(shù)r1固定時,隨著相關系數(shù)r2的增大,檢驗效能出現(xiàn)先增大后減小的趨勢;當相關系數(shù)r1、r2均固定時,隨著刪失率(cen%)的增加,檢驗效能逐漸減小,刪失率在30%以下時,檢驗效能的差別很小。
在AFT模型中,當M1與S的相關系數(shù)r1固定時,隨著相關系數(shù)r2的增大,檢驗效能出現(xiàn)先增大后減小的趨勢;當相關系數(shù)r1、r2均固定時,隨著刪失率(cen%)的增大,檢驗效能略減小,同時檢驗效能普遍較高(大于0.8),當相關系數(shù)r1、r2均等于0.7時,檢驗效能出現(xiàn)低值,對這種情況需要做進一步研究。
當樣本量較大(N=500)時,三種模型的檢驗效能受刪失率的影響很小。
圖3顯示了當M1與M2的相關系數(shù)r3=0,效應比R=0.1,刪失率(cen%)為70%時,三種模型的檢驗效能的比較。橫坐標為兩個中介變量(M1、M2)與暴露(S)的相關系數(shù)(r1、r2)的組合,縱坐標為檢驗效能。

表2 樣本量對三種模型的第一類錯誤的影響

圖3 三種模型的檢驗效能的比較
(2)M1與M2的相關性對檢驗效能的影響
隨著中介變量M1與M2的相關系數(shù)r3的增大,三種模型的檢驗效能呈減小的趨勢。三種模型的檢驗
效能的大小排序均為:AFT模型>Cox模型>Aalen模型,Aalen模型的檢驗效能偏低。
(3)樣本量對檢驗效能的影響
總體來講,隨著樣本量N的增加,不同情景下,三種模型的檢驗效能逐漸增大,且差距逐漸減小,趨于穩(wěn)定。當樣本量較小(N=100)時無法檢驗出來的效應;樣本量增大時,各模型的檢驗效能也隨之增大。當樣本量較大(N=500)且M1與S的相關系數(shù)r1較大時,三種模型的檢驗效能基本一致。
表3顯示了當M1與M2的相關系數(shù)r3=0,效應比R=0.1,刪失率(cen%)為70%時,樣本量N對三種模型的檢驗效能的影響。

表3 樣本量對三種模型的檢驗效能的影響
本研究主要討論了兩個中介變量的特定路徑效應(PSEs),以及兩中介變量之間不存在交互作用的情況。隨著中介變量的增多,中介變量與中介變量以及中介變量與暴露之間的影響必定更加復雜,此時對模型的構建和方法的選擇需要做進一步深入的研究。
當M1與S的相關系數(shù)r1固定時,隨著M2與S的相關系數(shù)r2的增大,三種模型的檢驗效能均出現(xiàn)先增大后減小的趨勢,原因是在小樣本量(N=100)的條件下,M2與暴露S相關性過高,難以從暴露對結局的效應中分解出M2對結局的效應。當樣本量擴大至500時,這種趨勢不再存在,三種方法的檢驗效能均增大并趨于穩(wěn)定,提示中介變量與暴露的相關性越高,需要更大的樣本量才能檢驗出中介效應。
當暴露與中介變量間的相關系數(shù)固定時,隨著中介變量間的相關系數(shù)r3的增大,三種模型的檢驗效能呈減小的趨勢。中介變量間的相關性越高,兩個中介變量對結局的效應發(fā)生重疊,越難將兩個中介變量的中介效應區(qū)分開來,也就越難發(fā)現(xiàn)中介變量M2對結局Y的效應,此時可通過增大樣本量,以提高檢驗效能。
模擬試驗結果顯示,無論在何種情況下,隨著樣本量的增加,檢驗效能趨于穩(wěn)定。即使在暴露與中介變量相關性較高的情況下,也能保持足夠的檢驗效能。這說明,進行中介分析,必須要有足夠的樣本量。
隨著刪失率的增加,檢驗效能逐漸減小,實際數(shù)據(jù)的分析過程中會遇到很多刪失率較大的數(shù)據(jù),對于高刪失率的數(shù)據(jù),在方法的選擇上要更加慎重。有研究顯示,對于大樣本(≥500)或刪失率較小(≤30%)的數(shù)據(jù),Cox模型和AFT 模型的有效性及偏倚性相近,分析結果均較為可靠。對于樣本較小(300~400)或刪失率較高(40%~60%)的數(shù)據(jù),AFT模型的分析結果似乎更為可靠,此時應首先考慮采用該模型進行分析。但當樣本量不足200或刪失率超過70%時,兩類模型的適用性都不佳。當出現(xiàn)樣本量不足或刪失率過高的情況下,可考慮選擇其他模型對生存結局進行分析。
在Aalen相加風險模型、Cox比例風險模型和加速失效時間(AFT)模型下的多中介變量的中介分析描述了特定尺度下的中介效應,Aalen相加風險模型是基于風險差異,Cox模型基于對數(shù)風險比,加速失效時間(AFT)模型基于平均生存時間比,模型解釋時需要注意。三種模型下的解析表達式都可以通過因果關系圖上各個箭頭對應的效應參數(shù)被直觀地解釋。
通過模擬試驗發(fā)現(xiàn),隨著刪失率的降低,Aalen模型的第一類錯誤膨脹。Cox模型的解析表達式只有在結局不常見的假設下才能得到,是其應用的局限性。不同參數(shù)設定下,AFT模型的檢驗效能最大,其次為Cox模型,最后為Aalen模型。AFT模型優(yōu)于其他兩種方法,推薦用于生存結局的多中介變量的中介分析。同時,進行中介分析時需要足夠的樣本量,才能發(fā)現(xiàn)多個中介變量的中介效應。