衡 晨,李 嬈,易 靜
重慶醫科大學公共衛生學院醫學與社會發展研究中心/健康領域社會風險預測治理協同創新中心,重慶 400016
肺癌是最常見的惡性腫瘤,占所有惡性腫瘤的11.6%,2018年全球因肺癌死亡的人數超過170萬[1]。肺癌主要包括非小細胞肺癌和小細胞肺癌,其中非小細胞肺癌占肺癌總數的85%[2]。鱗狀細胞癌占非小細胞肺癌總數的30%,通常由吸煙引起,在男性群體中更常見,生長緩慢[3]。有研究表明,30%~40%的肺癌患者年齡在70歲及以上[4]。隨著人口老齡化問題越來越突出,開展針對老年群體的肺癌相關研究的需求越發迫切。既往研究表明,肺鱗癌患者的總生存率與年齡呈負相關[5]。因此,有必要分析老年肺鱗癌患者預后的影響因素,以建立良好的預后預測模型,以期為評估老年肺鱗癌患者的預后提供參考。
SEER數據庫是美國癌癥患者數據的權威來源,該數據庫的樣本量大、數據類型多。深入挖掘其中的信息有助于更好地了解、掌握癌癥預后的影響因素。精確的預后分析在改善患者生活質量方面發揮著至關重要的作用。目前有關老年肺鱗癌患者預后分析的研究一般采用Cox比例風險回歸模型或競爭風險模型[6-9],很少有將Cox、LASSO回歸分析相結合的研究。傳統的TNM分期系統存在局限性,如未納入其他影響預后的變量,而列線圖模型直觀、應用方便,能根據患者的疾病特征評估個體化風險,能納入疾病的相關影響因素[10],可以為臨床醫師評估患者預后、制訂治療方案提供科學參考。本研究旨在分析65歲及以上的老年肺鱗癌患者預后的影響因素,以期為有效改善老年肺鱗癌患者預后提供科學參考。現報道如下。
1.1數據來源與研究對象 從SEER數據庫中提取2004-2015年被診斷為肺鱗癌25 602例患者的人口學及臨床特征資料,按照7∶3隨機分為訓練集(17 921例)與驗證集(7 681例)。納入標準:(1)診斷時間為2004-2015年;(2)腫瘤原發部位為肺和支氣管;(3)病理診斷結果為鱗癌;(4)生存資料完整,且生存時間≥1個月;(5)只有1個原發腫瘤;(6)年齡≥65歲。排除標準:(1)缺乏婚姻狀態、種族、患側部位、臨床分期、組織學分級、手術情況等信息;(2)死亡原因未知。兩個數據集患者的年齡、性別、婚姻狀態、種族、原發部位、患側部位、T分期、N分期、M分期、組織學分級、手術情況比較,差異均無統計學意義(P>0.05),具有可比性。見表1。

表1 訓練集和驗證集患者的基本資料比較[n(%)]
1.2方法 使用SEER*Stat 8.4.2軟件,選取Incidence-SEER Research Data、17 Registries、Nov 2022 Sub(2000-2020)數據集,提取患者基本資料。納入信息包括年齡、性別、婚姻狀態、種族、原發部位、患側部位、T分期、N分期、M分期、組織學分級、手術情況、生存時間及生存狀態。生存時間指患者從確診肺鱗癌之日至該癌癥導致死亡的時間。

2.1訓練集和驗證集患者的生存結局 25 602例患者中死亡17 717例(69.2%)。中位生存時間為17.00(5.00,79.00)個月;中位隨訪時間為76.00(45.00,109.00)個月。訓練集中有5 482例患者存活,12 439例患者死亡。驗證集有2 403例患者存活,5 278例患者死亡。
2.2訓練集和驗證集患者的基本資料比較 訓練集和驗證集的基本資料比較,差異均無統計學意義(P>0.05)。見表1。
2.3肺鱗癌患者基本資料與預后的相關性及對預后不良的單因素與多因素Cox回歸分析 將訓練集的資料進行單因素Cox回歸分析,結果顯示,年齡、性別、婚姻狀態、種族、原發部位、患側部位、T分期、N分期、M分期、組織學分級、手術情況是肺鱗癌患者預后不良的影響因素(P<0.05)。Kaplan-Meier生存曲線分析結果顯示,以上11項變量是肺鱗癌患者預后不良的影響因素(P<0.05),見圖1。為了避免過度擬合,將這11項變量進行LASSO回歸和交叉驗證,見圖2、3。基于調優系數等于lambda.1se篩選出了年齡、T分期、N分期、M分期、手術情況5項變量,剔除了性別、婚姻狀態、種族、原發部位、患側部位、組織學分級6項變量。以患者的預后情況作為因變量(存活=0,死亡=1),將篩選出的年齡(65~<70歲=0,70~<75歲=1,75~<80歲=2,≥80歲=3)、T分期(T1=0,T2=1,T3=2,T4=3)、N分期(N0=0,N1=1,N2=2,N3=3)、M分期(M0=0,M1=1)、手術情況(接受手術=0,未接受手術=1)作為自變量進行多因素Cox回歸分析,結果顯示,年齡越大、高T分期、高N分期、高M分期、未接受手術是老年肺鱗癌患者預后不良的危險因素(P<0.05)。見表2。

注:A為不同年齡肺鱗癌患者的生存曲線;B為不同性別肺鱗癌患者的生存曲線;C為不同婚姻狀態肺鱗癌患者的生存曲線;D為不同種族肺鱗癌患者的生存曲線;E為不同原發部位肺鱗癌患者的生存曲線;F為不同患側部位肺鱗癌患者的生存曲線;G為不同T分期肺鱗癌患者的生存曲線;H為不同N分期肺鱗癌患者的生存曲線;I為不同M分期肺鱗癌患者的生存曲線;J為不同組織學分級肺鱗癌患者的生存曲線; K為不同手術情況肺鱗癌患者的生存曲線。

圖2 預后影響因素的LASSO回歸分析

圖3 LASSO回歸交叉驗證圖

表2 訓練集單因素和多因素Cox回歸分析
2.4列線圖模型的建立與驗證 基于多因素Cox回歸分析結果,納入年齡、T分期、N分期、M分期、手術情況作為獨立預測因子建立列線圖模型。“變量評分”代表一個評分尺度,從每個變量的某個取值處對應到“變量評分”即為該變量取值的評分,將患者各個指標的評分相加得到總分,對應到“變量總得分”上尋找對應的分數,作垂線至生存概率軸得到最終結果。見圖4。訓練集和驗證集中用于評估列線圖模型的 C-index分別為0.732(95%CI:0.727~0.736)和0.733(95%CI:0.725~0.739)。

圖4 預測老年肺鱗癌患者半年、1年、3年肺癌特異性生存的列線圖模型
訓練集列線圖模型預測半年、1年、3年肺鱗癌患者預后的曲線下面積(AUC)分別為0.772(95%CI:0.764~0.779)、0.795(95%CI:0.789~0.802)、0.846(95%CI:0.839~0.852)。驗證集列線圖模型預測半年、1年、3年肺鱗癌患者預后的AUC分別為0.774(95%CI:0.763~0.785)、0.805(95%CI:0.795~0.815)、0.839(95%CI:0.829~0.850)。決策曲線結果見圖5。

注:A為列線圖模型的半年決策曲線;B為列線圖模型的1年決策曲線;C為列線圖模型的3年決策曲線。
本研究納入了不同基本資料的老年肺鱗癌患者作為研究對象,其中男性患者占比高于女性患者,這可能是因為男性患者的一些不良習慣更易導致患病。由于SEER數據庫記錄的是美國癌癥患者數據,故納入患者中白種人較多。在腫瘤特征方面,腫瘤原發部位為肺上葉的患者占比最高,患側部位位于左側和右側的比例則較為均衡。納入病例的T分期最多為T2期,N分期最多為N0期,M1期的患者占比不高,組織學分級為Ⅲ級的患者占比最高。此外,較少患者接受過手術,這可能是因為手術對于部分老年患者來講風險較大,故未接受手術。
根據LASSO回歸結合Cox回歸分析結果最終確定了5個影響老年肺鱗癌患者預后的因素,其中,年齡更大是影響老年肺鱗癌患者預后不良的危險因素(P<0.05),與既往的研究結果一致[11-12]。老年群體身體機能弱、細胞衰老、合并多種系統慢性疾病都有可能不利于癌癥患者的預后[13]。本研究結果顯示,高T分期是影響老年肺鱗癌患者預后不良的危險因素(P<0.05),提示更高的T分期代表更深的侵犯程度,與相關研究結果均一致[11,14]。張嬌等[15]研究表明,非小細胞肺癌患者N分期越高,其生存率越低,本研究中N分期為N1及以上(發生淋巴結轉移)時HR>1。本研究認為發生遠處轉移是影響老年肺鱗癌患者預后不良的危險因素,與既往的研究結果一致[9]。腫瘤向遠處器官的轉移擴散是大多數癌癥患者死亡的原因[16]。王根旺等[17]研究表明,發生骨、腦、肝轉移的原發性肺癌患者具有較高的死亡風險。目前手術干預是肺鱗癌的主要治療方式[18]。本研究結果顯示,未接受手術治療是影響老年肺鱗癌患者預后不良的危險因素(P<0.05),與吳敏[19]研究結果一致。但本研究并未提及具體的手術治療方式,常用的手術治療方式包括肺葉切除術、支氣管切除術、全肺切除術、肺血管成形肺葉切除術及縱隔淋巴結切除術等[20],但何種手術方式更有利于患者預后尚有待進一步研究。
目前,列線圖模型在腫瘤學中應用廣泛,這種圖標式模型能直觀、形象地預測患者生存率。本研究構建的列線圖模型納入了5個影響老年肺鱗癌患者預后不良的危險因素,C-index和ROC曲線分析結果提示列線圖模型具有較好的預測能力,決策曲線表明列線圖模型的臨床實用性良好,有助于臨床醫師對預后較差的老年肺鱗癌患者進行針對性治療。
本研究也存在一定局限性。首先,本研究使用的數據是回顧性研究數據,可能導致不可避免的偏倚,且納入病例中大部分為白種人,提示如果想獲得更準確、更適合中國人的預測模型,有必要進一步收集前瞻性中國肺鱗癌患者的臨床資料。其次,SEER數據庫提供的協變量有限,缺少一些可能影響預后的特征,例如吸煙和被動吸煙情況、職業暴露、基因突變和靶向治療等。另外,SEER數據庫中患者的放療、化療情況未知,本研究為了研究的準確性并未納入以上變量,但其值得關注。此外,本研究缺少外部驗證,進一步研究可納入醫院提供的臨床數據進行驗證。
綜上所述,老年肺鱗癌患者年齡、T分期、N分期、M分期、手術情況對其生存預后有顯著影響,構建的列線圖模型能較為直觀、準確地預測患者生存概率,可為臨床老年肺鱗癌預后評估提供科學參考依據。