馮骎 王仙友 李伊婷 徐榮 陶逸然
集合管癌(collecting duct carcinoma,CDC)是一種起源于腎髓質(zhì)Bellini集合管遠(yuǎn)端的惡性上皮性腫瘤(又稱Bellini管癌),是腎細(xì)胞癌的一種極為罕見的病理亞型,僅占腎臟腫瘤的1%~2%[1]。臨床上,CDC侵襲程度較高,多數(shù)患者首診時(shí)已處于進(jìn)展期或發(fā)生轉(zhuǎn)移,因此預(yù)后極差[2]。據(jù)報(bào)道,50%~60%的CDC患者在最初診斷后2年內(nèi)死亡,且2年癌癥特異性生存率為47.3%[3-4]。亦有研究表明,60%~70%的患者在診斷后3年內(nèi)死亡[5]。由于CDC極其罕見,幾乎不可能開展大規(guī)模的前瞻性研究。迄今為止,較大的系列研究包括歐洲、日本以及來自美國國家癌癥數(shù)據(jù)庫的系列研究[4-7]。由于臨床上可供研究的CDC病例較少,加上國內(nèi)的大樣本研究較為欠缺,因此臨床上如何便捷、準(zhǔn)確地評(píng)估CDC患者預(yù)后的難度較大。目前,國內(nèi)外多應(yīng)用列線圖模型來分析各類腫瘤患者的預(yù)后情況。因此,本研究利用美國國立癌癥研究所的監(jiān)測、流行病學(xué)和結(jié)局(surveillance epidemiology and end results,SEER)數(shù)據(jù)庫中CDC患者生存數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,篩選出對(duì)CDC患者生存具有重要影響的預(yù)后因子,并建立列線圖模型,現(xiàn)將結(jié)果報(bào)道如下。
1.1 對(duì)象 從SEER數(shù)據(jù)庫中(http://seer.cancer.gov/seerstat)篩選1975至2016年確診為腎CDC(ICD-O-3編碼為8319/3,Bellini管癌)的患者467例,剔除非組織學(xué)確診、側(cè)別不清或雙側(cè)、TNM分期不清及數(shù)據(jù)缺失、死于其他情況的患者,最終有282例患者納入本研究。采用隨機(jī)數(shù)字表法,按7:3的比例分為訓(xùn)練隊(duì)列186例和驗(yàn)證隊(duì)列96例。
1.2 觀察指標(biāo) 主要包括診斷時(shí)年齡、種族、性別、腫瘤側(cè)別、臨床分期、腫瘤直徑、原發(fā)部位手術(shù)情況、放化療情況、總生存期等。
1.3 統(tǒng)計(jì)學(xué)處理 采用R 4.0.2和RStudio 1.2.5033統(tǒng)計(jì)軟件。呈非正態(tài)分布的計(jì)量資料以M(P25,P75)表示,組間比較采用Mann-Whitney U檢驗(yàn);計(jì)數(shù)資料組間比較采用χ2檢驗(yàn)。使用survival軟件進(jìn)行單因素生存分析,篩選出對(duì)患者總體生存率有統(tǒng)計(jì)學(xué)意義的因素,再將這些因素分別納入兩個(gè)Cox多因素生存回歸模型分析,根據(jù)AIC信息準(zhǔn)則選擇擬合優(yōu)良性較好的模型變量并分別確定兩個(gè)模型的最優(yōu)解[8],比較兩個(gè)模型的C指數(shù)并確定最優(yōu)預(yù)測模型,使用rms軟件建立預(yù)后列線圖。通過ROC曲線及校準(zhǔn)曲線分析評(píng)價(jià)并驗(yàn)證所建立的列線圖預(yù)測效能。應(yīng)用ggDCA的決策曲線分析計(jì)算一系列閾值概率的凈收益來評(píng)估列線圖的臨床實(shí)用性[9]。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 兩組患者臨床資料比較 訓(xùn)練隊(duì)列與驗(yàn)證隊(duì)列患者在性別、年齡、種族、腫瘤側(cè)別、臨床分期、腫瘤直徑、原發(fā)病灶手術(shù)情況、放化療情況、總生存期等臨床資料比較,差異均無統(tǒng)計(jì)學(xué)意義(均P>0.05),見表1。

表1 訓(xùn)練隊(duì)列與驗(yàn)證隊(duì)列臨床資料比較
2.2 列線圖的構(gòu)建 單因素分析顯示,訓(xùn)練隊(duì)列患者的年齡、腫瘤直徑、T分期、N分期、M分期、TNM分期、原發(fā)病灶是否手術(shù)、是否行放化療是預(yù)后影響因素。其中單獨(dú)的T分期、N分期、M分期和TNM總分期之間存在關(guān)聯(lián)性,因此將其分別置于兩個(gè)不同的模型中。模型1的變量包括年齡、T分期、N分期、M分期、腫瘤直徑、原發(fā)病灶是否手術(shù)、是否行放療、是否行化療,模型2的變量包括年齡、TNM分期、腫瘤直徑、原發(fā)病灶是否手術(shù)、是否行放療、是否行化療。根據(jù)AIC信息準(zhǔn)則得到兩個(gè)模型的最優(yōu)擬合變量,模型1包含年齡、T分期、M分期、原發(fā)病灶是否手術(shù)、是否行化療,模型2包含年齡、TNM分期、腫瘤直徑、原發(fā)病灶是否手術(shù)、是否行化療,見表2。模型1、2的C指數(shù)及95%CI分別為0.772(0.735~0.809)和 0.778(0.741~0.815),差異有統(tǒng)計(jì)學(xué)意義(P<0.05),即模型2為更優(yōu)模型。根據(jù)模型2得到的預(yù)后列線圖,見圖1。

圖1 集合管癌(CDC)患者的預(yù)后列線圖

表2 影響訓(xùn)練隊(duì)列CDC患者生存的單因素及多因素分析
2.3 列線圖的預(yù)測效能 ROC曲線分析顯示,根據(jù)所建立的預(yù)后列線圖計(jì)算得到3個(gè)月、6個(gè)月、1年、3年生存率的AUC均>0.8,提示該列線圖具有較好的預(yù)測準(zhǔn)確度,見圖2。校準(zhǔn)曲線分析顯示列線圖預(yù)測的生存率與實(shí)際生存率具有較好的一致性,提示該列線圖預(yù)測效能較好,見圖3。

圖2 根據(jù)所建立的預(yù)后列線圖預(yù)測訓(xùn)練隊(duì)列集合管癌(CDC)患者3個(gè)月、6個(gè)月、1年、3年生存率的ROC曲線

圖3 根據(jù)所建立的預(yù)后列線圖預(yù)測訓(xùn)練隊(duì)列集合管癌(CDC)患者3個(gè)月、6個(gè)月、1年、3年生存率的校準(zhǔn)曲線
2.4 列線圖的驗(yàn)證 在驗(yàn)證隊(duì)列中,根據(jù)所建立的預(yù)后列線圖計(jì)算得到3個(gè)月、6個(gè)月、1年、3年生存率的AUC均>0.7,提示該列線圖具有較好的預(yù)測準(zhǔn)確度,見圖4。校準(zhǔn)曲線分析顯示列線圖預(yù)測的生存率與實(shí)際生存率具有較好的一致性,提示該列線圖在驗(yàn)證隊(duì)列中表現(xiàn)良好,見圖5。

圖4 根據(jù)所建立的預(yù)后列線圖預(yù)測驗(yàn)證隊(duì)列集合管癌(CDC)患者3個(gè)月、6個(gè)月、1年、3年生存率的ROC曲線

圖5 根據(jù)所建立的預(yù)后列線圖預(yù)測驗(yàn)證隊(duì)列集合管癌(CDC)患者3個(gè)月、6個(gè)月、1年、3年生存率的校準(zhǔn)曲線
2.5 列線圖的臨床適用性 決策曲線分析顯示,當(dāng)訓(xùn)練隊(duì)列的閾值概率(總體生存率)超過10%、驗(yàn)證隊(duì)列的閾值概率(總體生存率)超過15%時(shí),使用所建立的列線圖預(yù)測CDC患者的預(yù)后比“所有患者全部治療或全不治療”的策略提供更大的凈收益,這表明該列線圖具有潛在的臨床適用性,見圖6。

圖6 訓(xùn)練隊(duì)列和驗(yàn)證隊(duì)列驗(yàn)證列線圖臨床實(shí)用性的決策曲線分析(a:訓(xùn)練隊(duì)列;b:驗(yàn)證隊(duì)列)
2.6 列線圖的網(wǎng)絡(luò)訪問 本研究所建立的CDC預(yù)后列線圖可通過https://chingfeng.shinyapps.io/DynNomapp CDC/在線訪問并使用。
CDC是腎細(xì)胞癌的一種罕見病理亞型,多數(shù)患者在初診時(shí)就已表現(xiàn)出轉(zhuǎn)移性特征,且TNM分期較晚,60%~70%的患者在診斷后3年內(nèi)死亡[5-6]。目前對(duì)于常見腎臟腫瘤(如透明細(xì)胞癌、乳頭狀細(xì)胞癌等)已建立標(biāo)準(zhǔn)治療方案,但對(duì)于CDC的最佳治療策略尚缺乏共識(shí)[10]。目前,手術(shù)仍是CDC的主要治療選擇。有報(bào)道稱,細(xì)胞減滅性腎切除術(shù)可以改善患者的癌癥特異性生存率[11]。此外,亦有術(shù)后長期生存的報(bào)道[12]。但是考慮到多數(shù)患者確診時(shí)已經(jīng)存在淋巴結(jié)轉(zhuǎn)移或遠(yuǎn)處轉(zhuǎn)移,細(xì)胞減滅性手術(shù)能否使患者獲益尚無定論。有文獻(xiàn)報(bào)道,化療可在一定程度上提高患者的客觀緩解率[13]。先前的貝伐單抗、吉西他濱和鉑類三聯(lián)治療轉(zhuǎn)移性CDC的Ⅱ期臨床試驗(yàn)結(jié)果顯示,患者的無進(jìn)展生存期和總生存期得到延長[14]。這些研究納入的樣本量均十分有限,其必要性仍有待進(jìn)一步驗(yàn)證。因此,準(zhǔn)確地判斷CDC患者的預(yù)后對(duì)輔助治療的選擇具有重要意義。然而,目前文獻(xiàn)中尚未指明預(yù)測CDC患者預(yù)后的最佳方法。因此,本研究建立了包含診斷時(shí)年齡、TNM分期、腫瘤直徑、原發(fā)病灶是否手術(shù)、是否行化療等因素的CDC預(yù)后列線圖,并使用內(nèi)部數(shù)據(jù)集進(jìn)行驗(yàn)證,提示該列線圖在訓(xùn)練隊(duì)列和驗(yàn)證隊(duì)列中均有良好的區(qū)分度和校準(zhǔn)度。另外,決策曲線分析結(jié)果也提示其具有廣闊的臨床應(yīng)用前景。
有學(xué)者建立疾病特異性風(fēng)險(xiǎn)模型來預(yù)測CDC患者的癌癥特異性死亡率,其參數(shù)包括腫瘤直徑、轉(zhuǎn)移、Fuhrman核分級(jí)、淋巴管浸潤以及美國麻醉醫(yī)師協(xié)會(huì)評(píng)分[4]。同樣,本研究所構(gòu)建的列線圖也包含腫瘤直徑,但遺憾的是由于后幾項(xiàng)因素SEER數(shù)據(jù)庫中并未提供,故未納入研究。不同于上述疾病特異性風(fēng)險(xiǎn)模型的是,筆者發(fā)現(xiàn)69歲以上患者的總體生存率較69歲以下患者明顯下降,故有理由認(rèn)為高齡是CDC患者預(yù)后不良的因素。TNM分期是本研究所建立的列線圖最終風(fēng)險(xiǎn)評(píng)分的主要部分,結(jié)合年齡、腫瘤直徑以及治療相關(guān)因素后對(duì)CDC患者預(yù)后的預(yù)測效能更佳。考慮到社會(huì)環(huán)境和醫(yī)療環(huán)境的不同,希望未來可以進(jìn)一步得到外部臨床數(shù)據(jù),對(duì)列線圖進(jìn)行個(gè)性化調(diào)整,以便更好地應(yīng)用于臨床。
綜上所述,本研究所建立的CDC預(yù)后列線圖(包括年齡、TNM分期、腫瘤直徑、原發(fā)病灶是否手術(shù)、是否行化療等因素)具有較高的預(yù)測效能及臨床適用性,臨床醫(yī)生可通過https://chingfeng.shinyapps.io/DynNomappCDC/在線訪問并使用。但本研究也存在一定的局限性:(1)剔除了缺少臨床數(shù)據(jù)的患者;(2)由于某些信息在SEER數(shù)據(jù)庫中無法獲取,本研究未納入某些潛在的預(yù)后預(yù)測因子,如 Fuhrman核分級(jí)、Ki-67指數(shù)等;(3)治療相關(guān)因素未細(xì)化到具體方案;(4)臨床數(shù)據(jù)均來源于回顧性分析,所構(gòu)建的列線圖仍需要在前瞻性臨床試驗(yàn)中作進(jìn)一步驗(yàn)證。