張娟,劉娟,于紅
(連云港市贛榆區人民醫院,江蘇 連云港 222000)
肺癌是最常見的呼吸系統腫瘤,可以分為非小細胞肺癌(Non-Small Cell Lung Cancer,NSCLC)和小細胞肺癌(Small Cell Lung Cancer,SCLC)[1]。SCLC 在肺癌病理分型中占比較少,約15%[2]。目前,SCLC 患者預后不太理想,5 年生存率不足7%[3]。SCLC 的疾病特征是癌細胞增殖快,侵襲能力強,大部分癌細胞分化程度低,轉移范圍廣[4]。肝臟是SCLC 最常見的轉移部位,肝轉移是SCLC 患者的主要致死原因[5]。因此,醫生早期評估SCLC患者發生肝轉移的風險概率,以選擇最佳的治療方案是很有必要的。以往研究顯示,SCLC 患者發生肝轉移與臨床特征相關[6],但缺乏依據治療信息預測肝轉移發生傾向的模型。因此,本研究利用SEER 數據庫中患者臨床基本特征和治療信息,探究影響SCLC 肝轉移的獨立風險特征,并開發一個簡便、直觀及精準的可視化諾模圖預測模型,方便臨床醫生早期識別高危肝轉移患者,進一步完善治療決策。
通過使用SEER*Stat 8.3.9.1 軟件,從SEER 數據庫中提取2010—2015 年間SCLC 患者的臨床特征。選取標準:(1)2010—2015 年病理診斷為SCLC 的患者;(2)TN 分期采用第七版肺癌分期手冊劃分;(3)隨訪信息齊全。排除標準:(1)初診時為多原發腫瘤;(2)患者生存時間及生存情況不詳;(3)數據由醫院住院部及門診部提供;(4)臨床信息不詳。
利用SEER 數據庫收集SCLC 病例,根據選取和排除標準獲取信息,最終獲取了11 837 例病例。提取的臨床信息包括:年齡、種族、性別、腫瘤大小、T 分期、N 分期、清除淋巴結數目、腫瘤部位、化療、手術、放療、腦轉移、骨轉移、生存時間。
根據R 4.1.1 軟件進行統計學分析及繪圖。運用R 語言包“survminer”“survival”對SCLC 患者肝轉移、非肝轉移組的總生存期(Overall Surviva,OS)進行生存分析;運用R 語言包“caret”按6∶4 將數據隨機分為訓練組和驗證組,應用訓練組數據建立模型、應用驗證組數據驗證模型的可靠性;運用R 語言包“tableone” 對訓練組與驗證組的定性資料分布差異進行χ2檢驗;運用R 語言包“glmnet”進行Lasso 回歸分析;運用R 語言包“rms”進行多因素Logistic 回歸分析,并繪制預測SCLC 患者肝轉移風險的可視化諾模圖模型;運用R 語言包“pROC”計算曲線下面積(Area Under Curve,AUC),評價預測模型辨別高危肝轉移患者的能力;運用R 語言包“rms”繪制校正圖,評價實際發生概率與模型預測概率的一致性。P<0.05 為差異有統計學意義。
SCLC 患者中,肝轉移組3 211 例,非肝轉移組8 626 例。Log Rank 檢驗結果顯示,兩組患者預后差異有統計學意義(χ2=1 337.185,P<0.001),非肝轉移組患者比肝轉移組患者生存時間顯著延長,見圖1。

圖1 SCLC 肝轉移組與非肝轉移組的生存曲線Figure 1 Survival curves of SCLC's liver metastasis group and non liver metastasis group
本研究共提取11 837 例患者,將其隨機劃分訓練組(n=7 103)和驗證組(n=4 734)。兩組患者的年齡、種族、性別、腫瘤大小、T分期、N 分期、清除淋巴結數目、腫瘤部位、化療、手術、放療、腦轉移及骨轉移的差異均無統計學意義(P>0.05),見表1,兩組數據具有可比性。

表1 SCLC 患者一般臨床資料[n(%)]Table 1 General clinical data of patients with SCLC[n(%)]
將人口學特征與臨床特征納入Lasso 回歸分析,最佳值λ為0.012 397 62 時,得到8 個回歸系數非零的重要特征(見圖2),即種族、N 分期、清除淋巴結數目、化療、手術、放療、腦轉移以及骨轉移,此時預測模型最簡便且性能最好。

圖2 應用Lasso 回歸篩選SCLC 發生肝轉移的相關重要特征Figure 2 Application of Lasso regression to screen important features related to liver metastasis in SCLC
考慮到臨床醫生認為年齡可能也是肝轉移發生的危險特征,因此在多因素Logistic 回歸分析中,納入的自變量為年齡、種族、N 分期、清除淋巴結數目、化療、手術、放療、腦轉移與骨轉移。結果顯示,種族、清除淋巴結數目、N 分期、手術、放療、化療、骨轉移、腦轉移均是影響SCLC 患者發生肝轉移的獨立風險特征(見圖3)。其中種族、清除淋巴結數目、手術、放療是SCLC患者發生肝轉移的保護特征,N 分期、化療、骨轉移、腦轉移是SCLC 患者發生肝轉移的危險特征。

圖3 多因素Logistic 回歸分析SCLC 肝轉移獨立風險特征Figure 3 Independent risk characteristics of SCLC's liver metastasis using multivariate logistic regression analysis
通過多因素Logistic 回歸分析,我們將化療、種族、腦轉移、手術、N 分期、放療、骨轉移、清除淋巴結數目納入諾模圖模型,諾模圖可應用于臨床預測個體發生肝轉移風險率中(見圖4)。結果表明,清除淋巴結數目是最強的預后特征,其次是骨轉移、放療。

圖4 預測SCLC 患者肝轉移發生風險的諾模圖Figure 4 Nomogram for predicting the risk of liver metastasis in patients with SCLC
應用AUC 評估預測模型辨別高危患者的能力,結果顯示,訓練組和驗證組的AUC 以及對應的95%CI 分別為0.779(0.768~0.791)和0.776(0.762~0.792),表明預測模型識別高危肝轉移的能力較強(見圖5A、圖5B);繪制校正圖評估實際發生概率與預測概率的一致性,結果顯示,訓練組和驗證組預測曲線均貼近45℃斜線(見圖6A、圖6B),表明模型校準度較好。

圖5 諾模圖預測模型的ROC 曲線Figure 5 ROC curve of Nomograph prediction model

圖6 諾模圖預測模型的校正曲線Figure 6 Correction curve of Nomogram prediction model
本研究從SEER 數據庫中共獲取了11 837 例SCLC 患者,超過27%的患者發生肝轉移。通過Lasso 回歸分析以及多因素Logistic 回歸分析,將化療、種族、腦轉移、手術、N 分期、放療、骨轉移、清除淋巴結數目作為SCLC 患者肝轉移的獨立預測特征并用于建立諾模圖。本研究利用ROC、校正圖等方法對模型進行了驗證,證明該模型具有良好的預測能力,易于辨別SCLC 肝轉移高危患者。
本研究通過多因素Logistic 回歸分析發現,白人患者發生肝轉移的風險概率比黑人和美國印第安/阿拉斯加患者發生肝轉移的風險概率高,與Reddy S P 等[7]的研究結果一致。在我們的回顧性研究中,N 分期在N2(P<0.001)、N3(P<0.001)期時,諾模圖上量化的分數較高,對應的預測肝轉移風險較高。以往研究顯示,癌細胞轉移順序由淋巴結向遠處轉移[8-9]。因此,早期擴大肺部淋巴結清掃區域,能夠抑制癌細胞向遠處轉移。本研究對治療情況的分析顯示,手術(P=0.022)、放療(P<0.001)是SCLC 患者的保護因素,接受手術和放療的患者肝轉移發生率低。孫基峰等[10]的研究發現,接受治療的SCLC 肝轉移患者生存期明顯比未接受治療的患者延長。以往研究[11]表明,化療抑制癌細胞向身體其他部位轉移,這一結果與本研結果不一致。原因可能是化療會刺激機體產生更多的外泌體,外泌體使腫瘤微環境更利于癌細胞活躍,促進癌細胞通過血液循環抵達肝臟[12]。研究報道,SCLC 患者遠處轉移率極高,癌細胞往往向多個部位同步轉移[13]。這些表明,當檢查到遠處轉移時,SCLC 細胞可能已轉移到多個器官,并且發生骨、腦轉移的患者更可能發生肝轉移。
本研究尚存在局限性。(1)作為一項具有潛在選擇偏倚風險的回顧性研究,本研究結果需要從前瞻性多中心臨床試驗中得到證實。(2)由于SEER 數據庫的限制,無法獲得吸煙史、飲酒史、靶向治療和免疫治療的數據。(3)盡管在本研究中討論了化療、手術以及放療情況,但SEER 數據庫中沒有具體的治療方案,如化療周期、化療劑量、手術方法以及放療區域等詳細信息。(4)本研究中病例來自國外,建立的模型是否可應用于中國病例還需要更多的研究。
綜上所述,本研究基于化療、種族、腦轉移、手術、N 分期、放療、骨轉移、清除淋巴結數目開發了諾模圖模型來預測SCLC患者發生肝轉移的風險概率。通過對模型的評估,證明該模型具有良好的辨別能力。該模型可以幫助臨床醫生對高危肝轉移SCLC 患者選擇最佳治療策略。當然,該模型在SCLC 肝轉移患者中的應用還需要進一步的研究來證實。