呂晶晶 巫宏基 侯雅文 陳 征△
【提 要】 目的 競(jìng)爭(zhēng)風(fēng)險(xiǎn)數(shù)據(jù)下,統(tǒng)計(jì)分析方法常基于部分分布風(fēng)險(xiǎn)率(sub-distribution hazard,SDH)建立,但一般有前提條件SDH成比例,且有時(shí)無(wú)法對(duì)患者的生存情況或組間效應(yīng)量部分分布風(fēng)險(xiǎn)率比(sub-distribution hazard ratio,SHR)做出直觀(guān)的解釋。因此,為了避免上述基于風(fēng)險(xiǎn)率模型的一些限制,本文介紹并研究一種新指標(biāo),限制平均損失時(shí)間(restricted mean time lost,RMTL)。方法 首先介紹RMTL的定義和估計(jì)方法;其次針對(duì)組間RMTL差值構(gòu)造了差值法和權(quán)重法;最后,通過(guò)Monte Carlo模擬評(píng)價(jià)權(quán)重法的性能,并與現(xiàn)有方法進(jìn)行比較。結(jié)果 綜合Monte Carlo模擬得到的Ⅰ類(lèi)錯(cuò)誤及檢驗(yàn)效能結(jié)果,本文提出的權(quán)重法綜合性能相對(duì)較好,且在多種模擬情形下均具有較高的檢驗(yàn)效能。結(jié)論 在分析競(jìng)爭(zhēng)風(fēng)險(xiǎn)型數(shù)據(jù)時(shí),RMTL的相關(guān)結(jié)果可與SHR一同給出。
競(jìng)爭(zhēng)風(fēng)險(xiǎn)型數(shù)據(jù)是臨床隨訪(fǎng)研究中常見(jiàn)的數(shù)據(jù)類(lèi)型。在隨訪(fǎng)過(guò)程中,患者可能經(jīng)歷多種結(jié)局終點(diǎn)事件,其中主要觀(guān)察或研究的事件記為興趣事件,其他可能會(huì)阻礙興趣事件發(fā)生的事件即為競(jìng)爭(zhēng)事件[1]。當(dāng)競(jìng)爭(zhēng)風(fēng)險(xiǎn)存在時(shí),直接將數(shù)據(jù)簡(jiǎn)化為單終點(diǎn)的數(shù)據(jù)類(lèi)型(即競(jìng)爭(zhēng)事件均作為右刪失處理)進(jìn)行分析將會(huì)高估事件的累積發(fā)生率,甚至得出錯(cuò)誤的結(jié)論[2-3]。類(lèi)似單終點(diǎn)下Kaplan-Meier生存曲線(xiàn),競(jìng)爭(zhēng)風(fēng)險(xiǎn)下常用累積發(fā)生函數(shù)(cumulative incidence function,CIF)曲線(xiàn)描述患者的生存狀態(tài)或趨勢(shì);在對(duì)組間CIF的比較中,部分分布風(fēng)險(xiǎn)率比(sub-distribution hazard ratio,SHR)常常作為效應(yīng)指標(biāo)隨檢驗(yàn)結(jié)果一并給出。但在實(shí)際應(yīng)用中,SHR有一些局限:(1)最常用的Gray檢驗(yàn)[4]具有穩(wěn)健效能的前提是滿(mǎn)足組間SDH成比例假定;(2)Gray檢驗(yàn)是基于部分分布風(fēng)險(xiǎn)率(sub-distribution hazard,SDH)構(gòu)造得到,與描述性指標(biāo)CIF所反映的結(jié)果并不直接對(duì)應(yīng)[5];(3)SHR是SDH的比值,但在描述時(shí)僅包含組1(或組2)相較于組2(或組1)的SHR,而沒(méi)有每組的描述信息,即不包含基線(xiàn)組的信息,因而對(duì)臨床醫(yī)生或患者而言是一個(gè)較為抽象的概念;(4)從指標(biāo)定義角度來(lái)看,SDH是基于條件概率估計(jì)得到的,因此,對(duì)應(yīng)的比值SHR所反映的“風(fēng)險(xiǎn)”并不是實(shí)際意義上的死亡風(fēng)險(xiǎn)(risk ratio),因而無(wú)法直觀(guān)解釋患者的生存情況[6-8]。
由于SHR的上述問(wèn)題,一方面,Calkins等[9]借鑒單終點(diǎn)下限制平均生存時(shí)間的概念,將兩個(gè)終點(diǎn)事件合并為一個(gè)復(fù)合事件,提出競(jìng)爭(zhēng)風(fēng)險(xiǎn)限制平均生存時(shí)間(restricted mean survival time under competing risks,RMSTc)。然而,采用簡(jiǎn)單的復(fù)合終點(diǎn)作為結(jié)局不一定存在臨床意義[10],且從實(shí)際意義上來(lái)說(shuō),RMSTc損失了興趣事件單獨(dú)的信息。另一方面,Zhao等[11]提出限制平均損失時(shí)間(restricted mean time lost,RMTL)這一指標(biāo)概念,其大小對(duì)應(yīng)興趣事件CIF曲線(xiàn)下方的面積,表示患者在限制時(shí)間點(diǎn)內(nèi)因興趣事件而損失的平均壽命,但是并未給出相應(yīng)的假設(shè)檢驗(yàn)方法。因此,本文針對(duì)競(jìng)爭(zhēng)風(fēng)險(xiǎn)型數(shù)據(jù),介紹了RMTL的估計(jì)方法,并基于RMTL差值提出新的假設(shè)檢驗(yàn)方法。

1.RMTL的估計(jì)
在興趣事件(j=1)下,第k組的RMTL為[11]
表示患者在限制時(shí)間點(diǎn)內(nèi)因興趣事件而損失的平均壽命,對(duì)應(yīng)第k組CIF曲線(xiàn)下的面積。


2.假設(shè)檢驗(yàn)
本文首先基于兩組間RMTL差值,構(gòu)造統(tǒng)計(jì)量

其中,ρ為不同時(shí)刻點(diǎn)間的相關(guān)系數(shù)。Lyu等[12]指出,相關(guān)系數(shù)ρ的估計(jì)涉及實(shí)際數(shù)據(jù)中潛在累積發(fā)生率分布的假定,顯得復(fù)雜且難以求解得到,且進(jìn)行敏感性的模擬研究得到ρ=0.5時(shí)方法具有穩(wěn)健的I類(lèi)錯(cuò)誤。因此,取ρ=0.5作為每個(gè)時(shí)間點(diǎn)間的相關(guān)系數(shù)估計(jì)值。最終得到統(tǒng)計(jì)量
本文考慮兩組權(quán)重的選擇方法:
(1)取ω(ti)=1,則統(tǒng)計(jì)量中不包含任何權(quán)重,本文記為差值法;

探究上述假設(shè)檢驗(yàn)法的性能,采用Monte Carlo方法比較Gray檢驗(yàn)和RMTL差值法、權(quán)重法的Ⅰ類(lèi)錯(cuò)誤和檢驗(yàn)效能,共基于6種模擬情形(圖1):(1)基于原假設(shè);(2)兩CIF曲線(xiàn)滿(mǎn)足組間SDH成比例假定;(3)兩條CIF曲線(xiàn)中期發(fā)散末端收斂;(4)兩條CIF曲線(xiàn)前期發(fā)散后期收斂;(5)兩條CIF曲線(xiàn)前期收斂后期發(fā)散;(6)兩條CIF曲線(xiàn)交叉。考慮樣本均衡(n1,n2均為50、100或150)和不均衡(n1=50,n2=100;n1=50,n2=150)的情形,刪失率設(shè)置為兩組相同,且均約為0、15%、30%、45%。每一種參數(shù)組合下模擬5000次,顯著水平設(shè)為α=0.05。

圖1 假設(shè)檢驗(yàn)?zāi)M下的興趣事件累積發(fā)生率圖
為了評(píng)價(jià)上述檢驗(yàn)法在不同情形下的綜合性能,本文采用方差分析的方法構(gòu)造Ⅰ類(lèi)錯(cuò)誤和綜合檢驗(yàn)效能結(jié)果的評(píng)價(jià)指標(biāo)[15]。方差分析方法是通過(guò)控制單個(gè)或者幾個(gè)研究因素來(lái)評(píng)價(jià)感興趣因素的變化趨勢(shì),從而匯總分析不同參數(shù)組合下的復(fù)雜結(jié)果,將復(fù)雜結(jié)果變得更簡(jiǎn)單直觀(guān)。在本文中,共考慮4個(gè)影響因素,分別為檢驗(yàn)法(test)、樣本量(n1_n2)、刪失率(cen)和模擬情形(sit),進(jìn)而擬合如下4個(gè)模型:
模型1:E(Y)=test×n1_n2+cen+sit
模型2:E(Y)=test×cen+n1_n2+sit
模型3:E(Y)=test×sit+n1_n2+cen
模型4:E(Y)=test+n1_n2+cen+sit
模型1~3分別代表考慮不同樣本量,不同刪失率,不同模擬情形下的各種檢驗(yàn)方法的評(píng)價(jià),而模型4則是綜合所有影響因素,對(duì)各種檢驗(yàn)方法的評(píng)價(jià)。其中,用Ⅰ類(lèi)錯(cuò)誤的模擬結(jié)果減去所定義的顯著水平0.05,得到平均偏差值,其值越接近0則表示Ⅰ類(lèi)錯(cuò)誤越穩(wěn)定;檢驗(yàn)效能的模擬結(jié)果用平均拒絕率評(píng)價(jià),檢驗(yàn)效能越高則平均拒絕率越大。
由表1可見(jiàn),差值法的Ⅰ類(lèi)錯(cuò)誤最激進(jìn),Gray檢驗(yàn)的Ⅰ類(lèi)錯(cuò)誤最穩(wěn)定,而權(quán)重法的Ⅰ類(lèi)錯(cuò)誤相對(duì)保守。由于差值法的Ⅰ類(lèi)錯(cuò)誤過(guò)于激進(jìn),因此不再納入檢驗(yàn)效能的比較中。

表1 各種檢驗(yàn)法的平均偏差值(%)(Ⅰ類(lèi)錯(cuò)誤)
檢驗(yàn)效能結(jié)果由平均拒絕率反映(表2)。在模擬情形C、D、F中,即當(dāng)兩條CIF曲線(xiàn)中期發(fā)散或存在前期差異或交叉時(shí),權(quán)重法的檢驗(yàn)效能均顯著高于Gray法的檢驗(yàn)效能。而在模擬情形B和E中,即兩CIF曲線(xiàn)滿(mǎn)足SDH成比例假定或存在后期差異時(shí),權(quán)重法的檢驗(yàn)效能略低于Gray。

表2 各種檢驗(yàn)法的平均拒絕率(檢驗(yàn)效能)
本文選取某一關(guān)于淋巴細(xì)胞白血病患者預(yù)后影響因素的研究作為實(shí)例分析,所有檢驗(yàn)均為雙側(cè)檢驗(yàn),檢驗(yàn)水準(zhǔn)α=0.05。該研究共包含1400例患者,其中,未進(jìn)行放療組的患者1320例,放療組的患者80例,兩組刪失率分別約為27%、36%。興趣事件為死于淋巴細(xì)胞白血病,競(jìng)爭(zhēng)事件為死于其他原因。至隨訪(fǎng)結(jié)束,共389名患者發(fā)生興趣事件,425名患者發(fā)生競(jìng)爭(zhēng)事件。經(jīng)檢驗(yàn),該研究數(shù)據(jù)不滿(mǎn)足SDH成比例風(fēng)險(xiǎn)假定[16](P=0.009)。


圖2 興趣事件的累積發(fā)生函數(shù)圖(τ=14.9年)
在假設(shè)檢驗(yàn)中(表3),Gray法(P=0.144)和差值法(P=0.052)均未發(fā)現(xiàn)兩組間差異具有統(tǒng)計(jì)學(xué)意義,而權(quán)重法得到兩組間差異具有統(tǒng)計(jì)學(xué)意義(P=0.026)。

表3 實(shí)例分析結(jié)果
在競(jìng)爭(zhēng)風(fēng)險(xiǎn)型數(shù)據(jù)中,對(duì)療效的評(píng)價(jià)往往更為復(fù)雜[11]。常用的Gray檢驗(yàn)往往受限于組間SDH成比例假定,此外,在實(shí)際應(yīng)用中,CIF曲線(xiàn)圖常常會(huì)作為描述指標(biāo)隨檢驗(yàn)結(jié)果一并給出,但Gray檢驗(yàn)是基于SDH構(gòu)造得到,其假設(shè)檢驗(yàn)結(jié)果與描述指標(biāo)CIF并不相互對(duì)應(yīng)。因此,本文針對(duì)競(jìng)爭(zhēng)風(fēng)險(xiǎn)型數(shù)據(jù),介紹了一個(gè)非風(fēng)險(xiǎn)率指標(biāo)RMTL,并基于RMTL差值,即兩組CIF曲線(xiàn)下面積的差值,建立了差值法和權(quán)重法。由實(shí)例可見(jiàn),RMTL可以分別給出兩組間患者的生存情況及其差異,相較于SHR,可以反映更多的患者信息。由模擬結(jié)果可見(jiàn),權(quán)重法相較于差值法已經(jīng)極大地校正了刪失時(shí)Ⅰ類(lèi)錯(cuò)誤較大的問(wèn)題,且在中期發(fā)散、前期發(fā)散和曲線(xiàn)交叉的模擬情形下均具有較高的檢驗(yàn)效能。在截?cái)帱c(diǎn)的選擇中,為避免截?cái)鄷r(shí)間點(diǎn)太大或太小所造成方法的偏差[17],本文基于目前常用的截?cái)帱c(diǎn)選擇方法,即兩組間最后事件發(fā)生時(shí)間的較小值作為截?cái)鄷r(shí)間點(diǎn)。但當(dāng)試驗(yàn)組的事件率較低時(shí),選取該方法作為截?cái)帱c(diǎn)會(huì)對(duì)結(jié)果造成不同程度的影響[18]。在實(shí)際應(yīng)用時(shí),研究者往往事先確定隨訪(fǎng)期長(zhǎng)度,若在隨訪(fǎng)期內(nèi)觀(guān)察到其中一組的全部終點(diǎn),則研究停止,即得到最終的截?cái)鄷r(shí)間點(diǎn);若直至隨訪(fǎng)期結(jié)束,仍未觀(guān)察到全部終點(diǎn),則將隨訪(fǎng)期限作為最終的截?cái)鄷r(shí)間點(diǎn)。
本文所介紹的RMTL可以直觀(guān)地展現(xiàn)組間生存情況的差異,相較于SHR可以反映更多的患者信息。因此,在競(jìng)爭(zhēng)風(fēng)險(xiǎn)型數(shù)據(jù)下,為了直觀(guān)地反映組間的生存差異情況,建議RMTL的相關(guān)估計(jì)結(jié)果應(yīng)隨SHR一并給出。在假設(shè)檢驗(yàn)方面,可考慮使用本文提出的權(quán)重法。