王 慧,宋雪霏,楊辰玲,王 一,李凌子,周慧芳,李寅煒,孫 靜
上海交通大學(xué)醫(yī)學(xué)院附屬第九人民醫(yī)院眼科/上海市眼眶病眼腫瘤重點(diǎn)實(shí)驗(yàn)室(上海 200011)
脫落是指經(jīng)篩選后隨機(jī)入組成功的受試者不能完成試驗(yàn)的現(xiàn)象,一般包括退出和失訪兩種情況[1-2]。甲狀腺相關(guān)性眼病(thyroid-associated ophthalmopathy,TAO)是致盲和致殘的最常見眼眶病,在彌漫性甲狀腺腫伴甲狀腺功能亢進(jìn)癥(graves disease,GD)患者中的發(fā)生率達(dá)50%,是一種器官特異性自身免疫病[3-4]。在TAO 臨床研究中,脫落的發(fā)生使得某些受試者結(jié)局?jǐn)?shù)據(jù)無(wú)法獲取而造成數(shù)據(jù)缺失,這是導(dǎo)致統(tǒng)計(jì)分析結(jié)果出現(xiàn)偏倚的重要因素,會(huì)對(duì)臨床試驗(yàn)結(jié)果的解釋及結(jié)論的可信度造成明顯影響[5-7]。因此,如何控制受試者脫落的發(fā)生,是臨床研究者應(yīng)該考慮的重要問(wèn)題。本文通過(guò)回顧性分析TAO 臨床研究中受試者脫落發(fā)生的原因,收集受試者基線特征數(shù)據(jù),建立受試者脫落預(yù)測(cè)模型,為做好TAO 臨床試驗(yàn)受試者管理、提高臨床研究質(zhì)量提供依據(jù)。
以2017 年11 月至2021 年4 月在上海交通大學(xué)醫(yī)學(xué)院附屬第九人民醫(yī)院眼科參與TAO 臨床試驗(yàn)的384 例受試者作為研究對(duì)象。共4 項(xiàng)TAO臨床試驗(yàn),其中包括2 項(xiàng)國(guó)內(nèi)多中心研究。
回顧性收集納入受試者資料,包括性別、年齡、常住地、治療方式、來(lái)源、吸煙情況、突眼度、眼球運(yùn)動(dòng)情況、復(fù)視情況、CAS 評(píng)分、矯正視力及脫落情況。經(jīng)篩選后隨機(jī)入組成功的受試者,若出現(xiàn)退出或失訪的情況,即記錄為脫落。將本研究中384 例TAO 受試者以7 ∶ 3 的比例隨機(jī)分為訓(xùn)練集(268 例)和驗(yàn)證集(116 例)。
應(yīng)用R 軟件(version 4.2.2)進(jìn)行數(shù)據(jù)處理與統(tǒng)計(jì)分析。計(jì)量資料若符合正態(tài)分布用均數(shù)與標(biāo)準(zhǔn)差(±s)表示,采用獨(dú)立樣本t檢驗(yàn)進(jìn)行兩組間比較,非正態(tài)分布則用四分位數(shù)M(P25,P75)表示,兩組間比較采用Mann-Whitney U 檢驗(yàn);分類資料用頻數(shù)和百分比(n,%)表示,組間比較采用χ2檢驗(yàn)。對(duì)納入訓(xùn)練集的受試者資料,采用R 軟件的glmnet 程序包進(jìn)行LASSO 分析,篩選TAO 受試者脫落的影響因素,運(yùn)用多因素Logistic回歸建模,繪制列線圖。在驗(yàn)證集中,通過(guò)區(qū)分度和校準(zhǔn)度對(duì)訓(xùn)練集所建模型的性能進(jìn)行評(píng)估。區(qū)分度用ROC 曲線下面積(area under curve,AUC)評(píng)價(jià),校準(zhǔn)度用校準(zhǔn)曲線評(píng)價(jià)。以P<0.05 表示差異有統(tǒng)計(jì)學(xué)意義。
研究共納入384 例受試者,年齡19~78 歲、平均(44.55±13.25)歲,其中男性173 例(45.1%)、女性211 例(54.9%),常住地為上海本地的42例(10.9%)、外地342 例(89.1%),吸煙者87例(22.7%)、非吸煙者297 例(77.3%)。共53例受試者脫落,脫落率為13.8%。脫落原因主要有入組后未治療(18,33.96%)、未追蹤到原因(18,33.96%)、拒絕隨訪(9,16.98%)、新冠疫情影響(5,9.43%)及電話無(wú)人接聽(3,5.66%),見表1。訓(xùn)練集與驗(yàn)證集TAO 受試者在各基線特征變量上的差異無(wú)統(tǒng)計(jì)學(xué)意義,見表2。

表1 受試者脫落原因Table 1.Reasons for subjects dropping out

表2 訓(xùn)練集與驗(yàn)證集的特征差異Table 2.Differences of characteristics between the training set and the validation set
對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行LASSO 分析,得到11個(gè)潛在預(yù)測(cè)因子。這些預(yù)測(cè)因子是LASSO 回歸模型中的非零系數(shù),包括性別、年齡、常住地、治療方式、來(lái)源、吸煙情況、突眼度、眼球運(yùn)動(dòng)情況、復(fù)視情況、TAO 分期和矯正視力,見圖1、圖2。

圖1 調(diào)和參數(shù)Lambda(λ)與變量篩選路徑圖Figure 1.Solution path diagram of the harmonic parameter Lambda(λ) and the variable

圖2 調(diào)和參數(shù)Lambda(λ)與模型誤差圖Figure 2.Harmonization parameter Lambda(λ)and model error diagram
對(duì)Lasso 回歸篩選出的預(yù)測(cè)因素,經(jīng)逐步回歸建立多因素Logistic 回歸模型,預(yù)測(cè)受試者脫落情況。其中,治療方式、吸煙情況、復(fù)視評(píng)分、來(lái)源為受試者脫落的獨(dú)立預(yù)測(cè)因子。手術(shù)治療相較于非手術(shù)治療受試者發(fā)生脫落的風(fēng)險(xiǎn)降低[OR=0.16,95%CI(0.06,0.40),P<0.001];吸煙者相對(duì)于不吸煙者發(fā)生脫落的風(fēng)險(xiǎn)降低[OR=0.19,95%CI(0.03,0.78),P=0.04];復(fù)視評(píng)分越高,發(fā)生脫落的風(fēng)險(xiǎn)越低[OR=0.36,95%CI(0.19,0.61),P<0.001];分中心受試者相較于主中心發(fā)生脫落的風(fēng)險(xiǎn)增加[OR=12.09,95%CI(3.41,48.76),P<0.001],見表3。從列線圖上可知,各項(xiàng)預(yù)測(cè)因素均有對(duì)應(yīng)的分?jǐn)?shù),將各項(xiàng)預(yù)測(cè)因素所對(duì)應(yīng)的分?jǐn)?shù)累加得到總分,然后根據(jù)總分所對(duì)應(yīng)的預(yù)測(cè)值即可得到預(yù)測(cè)TAO 受試者脫落的概率(圖3)。

圖3 預(yù)測(cè)TAO受試者發(fā)生脫落的風(fēng)險(xiǎn)列線圖模型Figure 3.Nomogram model for predicting the risk of TAO subjects dropping out

表3 受試者脫落影響因素的Logistic回歸分析Table 3.Logistic regression analysis of factors affecting subjects dropping out
在驗(yàn)證集中對(duì)訓(xùn)練集模型的區(qū)分度與校準(zhǔn)度進(jìn)行驗(yàn)證。對(duì)于TAO 受試者脫落預(yù)測(cè)模型,在驗(yàn)證集中AUC 為0.786,表明模型性能較好,預(yù)測(cè)驗(yàn)證集人群TAO 受試者發(fā)生脫落的準(zhǔn)確率為78.6%(圖4)。預(yù)測(cè)模型的校準(zhǔn)曲線在驗(yàn)證集中表現(xiàn)出良好的一致性,平均絕對(duì)誤差(mean absolute error,MAE)為0.034(圖5)。

圖4 驗(yàn)證集的ROC曲線Figure 4.The ROC curve for the validation set

圖5 驗(yàn)證集的校準(zhǔn)曲線Figure 5.Calibration curve for the validation set
臨床試驗(yàn)的價(jià)值在于有效合格病例所提供的實(shí)質(zhì)性證據(jù),受試者招募進(jìn)度和數(shù)據(jù)完整性是限制試驗(yàn)整體實(shí)施的兩項(xiàng)重要因素,提高篩選成功率、盡量減少脫落率,以及盡量低的方案入排違背是項(xiàng)目管理和實(shí)施的關(guān)鍵[8-9]。通過(guò)此次回顧性分析發(fā)現(xiàn),入組后未治療、拒絕隨訪、新冠疫情影響及電話無(wú)人接聽是導(dǎo)致受試者脫落的主要原因。因此,在知情同意過(guò)程中,研究者應(yīng)向受試者詳細(xì)介紹項(xiàng)目研究方案,提升受試者認(rèn)知度,以減少入組后不按要求治療的情況發(fā)生,并記錄受試者多個(gè)聯(lián)系方式以備用。
多因素分析的目的是通過(guò)控制其它多個(gè)混雜因素的影響,找出具有獨(dú)立作用的影響因素,并估計(jì)其效應(yīng)大小。本次研究結(jié)果顯示,訓(xùn)練集中非手術(shù)治療受試者為139 人,占比為51.9%,發(fā)生脫落的風(fēng)險(xiǎn)高于手術(shù)治療受試者。甲狀腺相關(guān)性眼病非手術(shù)治療的方式主要有激素類藥物治療、放射治療及免疫抑制劑治療等,這些治療方式治療周期較長(zhǎng),并給受試者帶來(lái)不良反應(yīng),可能是非手術(shù)治療受試者依從性較差的主要原因。例如使用糖皮質(zhì)激素可能引起糖尿病、高血壓、青光眼、消化性潰瘍、骨質(zhì)疏松和情緒波動(dòng)[10]。復(fù)視評(píng)分越高者越不易發(fā)生脫落,甲狀腺相關(guān)性眼病累及眼外肌時(shí)會(huì)出現(xiàn)復(fù)視,使患者無(wú)法雙眼同視,嚴(yán)重影響患者生活質(zhì)量,因而對(duì)疾病的重視程度增加,這部分受試者在臨床研究中一般依從性較好[11]。來(lái)源于分中心的受試者,發(fā)生脫落的風(fēng)險(xiǎn)較高,可能因?yàn)榉种行呐R床研究團(tuán)隊(duì)對(duì)項(xiàng)目的重視及積極性不夠,未能及時(shí)聯(lián)系患者隨訪,造成患者失訪。吸煙者相對(duì)于不吸煙者發(fā)生脫落的風(fēng)險(xiǎn)降低,以往的研究表明,吸煙者由于視覺功能較低,更有可能尋求醫(yī)療幫助,依從性更好[12]。
AUC 是 ROC 曲線下區(qū)域的面積,在分類模型中用于判斷一個(gè)模型分類預(yù)測(cè)性能,理論上,0.5 ≤AUC ≤1,其值越大說(shuō)明試驗(yàn)的診斷價(jià)值越大[13-14]。校準(zhǔn)曲線根據(jù)預(yù)測(cè)的受試者脫落和實(shí)際的受試者脫落之間的一致性來(lái)描述模型的校準(zhǔn)度,45°虛線代表一個(gè)完美的預(yù)測(cè)[15]。本研究利用訓(xùn)練集受試者基線數(shù)據(jù),建立受試者脫落的預(yù)測(cè)模型,并在驗(yàn)證集中繪制ROC 和校準(zhǔn)曲線驗(yàn)證模型的區(qū)分度和校準(zhǔn)度。AUC 在驗(yàn)證集中為0.786,表明模型診斷準(zhǔn)確度較好;預(yù)測(cè)模型的校準(zhǔn)曲線在驗(yàn)證集中表現(xiàn)出良好的一致性。
綜上所述,可運(yùn)用本文所建模型對(duì)今后開展的TAO 臨床試驗(yàn)受試者脫落情況進(jìn)行預(yù)測(cè),但此模型存在影響因素納入不足及樣本量較少的局限性,應(yīng)探索更多與脫落相關(guān)的影響因素,擴(kuò)大樣本量,在實(shí)踐中不斷改進(jìn)預(yù)測(cè)模型,協(xié)助研究者規(guī)范管理臨床試驗(yàn)。受試者脫落是由多方面因素導(dǎo)致的問(wèn)題,很多情況下,研究無(wú)法讓受試者遵循研究方案治療,或令其再次返院復(fù)查,因此應(yīng)在出現(xiàn)可能會(huì)影響依從性的事件后,及時(shí)做好處理及預(yù)警方案,并且在得知脫落后盡快收集有用的療效和安全性信息,并做好相關(guān)記錄。