李 宏, 唐 樂, 李慧敏, 羅 琴
(新疆醫科大學1附屬腫瘤醫院呼吸神經內科, 2第三臨床醫學院, 烏魯木齊 830011)
靜脈血栓栓塞 (Venous thrombo embolism, VTE)是癌癥患者死亡的第二大原因[1-2],肺癌是VTE發生的最常見腫瘤亞型,約66. 6%的患者在確診癌癥前6個月內發生VTE[3]。近年肺癌患者的治療效果雖然得到明顯改善,但是伴隨治療的規范化和患者生存期的延長,肺癌患者VTE的發生率也增加了[4-5]。目前應用于臨床實踐的VTE風險評估量表較多[6],但缺乏針對肺癌人群VTE的優勢風險模型[7-10]。列線圖因其簡便易用、可視化、量化等特點近年得到廣泛應用[6, 11]。本研究基于回顧性隊列資料,構建肺惡性腫瘤患者的VTE列線圖模型,并對其進行驗證,以準確預測肺癌人群VTE風險概率。
1.1 研究對象臨床數據來自新疆醫科大學附屬腫瘤醫院2020年1月至2023年1月住院的3 479例肺癌患者。納入標準:(1)年齡>18歲;(2)經組織學確診肺惡性腫瘤;(3)經影像學證實發生VTE,包括深靜脈血栓或肺動脈栓塞。排除標準:(1)肺癌診斷前發生VTE;(2)確診肺癌前抗凝治療;(3)存在血液系統疾病;(4)無完整臨床及病理資料。多次住院的患者分析中僅計入1次。根據以上標準納入發生VTE的122例肺癌患者,按1∶4比例隨機匹配同期住院的488例未發生VTE的肺癌患者。最終將610例肺癌患者按7∶3隨機分為428例的建模集(VTE:85例,無VTE:343例),以及182例的驗證集(VTE:37例,無VTE:145例)。
1.2 方法回顧性收集患者一般信息,包括年齡、性別、身高、體重、體質指數(Body mass index,BMI)、吸煙史等;高血壓、糖尿病、冠心病、高血脂等基礎疾病史;惡性腫瘤臨床病理分型、分期、遠處轉移、肺部感染、胸水等惡性腫瘤及肺部因素;外科手術、化療、放療、靶向治療、免疫治療、中心靜脈置管(Central venous catheterization, CVC)等詳細治療方案;以及入院確診時的基線實驗室指標,包括白細胞計數(WBC)、血紅蛋白(HB)、血小板計數(PLT)、D-二聚體(D-D)、凝血酶原時間(PT)、纖維蛋白原(Fbg)、N端B型鈉尿肽前體(NT-proBNP)、白蛋白(Alb)、乳酸脫氫酶(LDH)、堿性磷酸酶(ALP)、谷丙轉氨酶(ALT)、谷草轉氨酶(AST)、總膽紅素(TB)、甘油三酯(TG)、總膽固醇(TC)、肌酐(Cr)、尿酸(Ua)、血尿素氮(BUN)、細胞角質素19(CYFRA21-1)、癌胚抗原(CEA)、糖類抗原125(CA125)、鱗狀細胞癌抗原(SCC)、胃泌素釋放肽前體(ProGRP)、神經元特異性烯醇化酶(NSE)等。
1.3 列線圖構建及統計學分析應用SPSS 27.0及R 4.3.0統計軟件包進行數據分析。(1)數據整理:將所有待估測變量進行統計學描述,分析有無異常值及缺失值,缺失值進行多重插補,數據缺失>20%舍棄相應變量;并根據需要將連續型變量進行二分類及多分類變量轉換。(2)初篩變量:連續型變量進行單因素方差分析,分類變量進行單因素卡方檢驗。(3)構建多因素模型:將建模集P<0.1的變量納入多因素Logistic回歸,并利用向后似然比法確定最終模型變量。(4)構建列線圖:基于多因素分析結果,使用rms包構建列線圖。(5)列線圖的驗證:在建模集中進行內部驗證,在驗證集中進行外部驗證。通過模型區分度、校準度及臨床適用性檢測模型效能。區分度:使用pROC包繪制受試者工作特征(Receiver operating characteristic,ROC)曲線,根據曲線下的面積(Area under the cure,AUC)評估該模型正確區分VTE發生的能力。校準度:使用calibrate包進行Hosmer-Lemeshow擬合優度檢驗,并利用1 000次Bootstrapping方法生成校準曲線,用于評估真實概率與預測概率是否吻合。臨床適用性:使用rmda包繪制臨床決策曲線(Clinical decision curve,DCA),根據模型凈獲益評估臨床適用性。
2.1 建模集及驗證集人口統計學和臨床病理學特征單因素分析結果顯示,年齡、性別、吸煙史在肺癌發生VTE與未發生VTE患者比較差異無統計學意義;BMI≥24(P=0.015)、患有糖尿病基礎病史(P=0.031)是肺癌患者發生VTE的不良危險因素。見表1。

表1 建模集和驗證集的人口統計學和臨床病理學特征表
2.2 建模集和驗證集的實驗室指標單因素分析單因素分析結果顯示,D-D、LDH、CA125、PT、ALP是VTE發生的危險指標。見表2。

表2 建模集和驗證集的實驗室指標單因素分析
2.3 建模集和驗證集的臨床病理學特征及治療因素分析單因素分結果顯示,腺癌、Ⅲ-Ⅳ期/廣泛期是肺癌患者VTE發生的不良腫瘤因素;化療及中心靜脈導管留置與較高的VTE發生率顯著相關。見表3。

表3 建模集和驗證集的臨床病理學特征及治療因素表
2.4 建模集的多因素Logistic回歸分析多因素Logistic回歸分析結果顯示:BMI、合并糖尿病、D-二聚體、LDH、病理類型為腺癌、Ⅲ-Ⅳ期/廣泛期、留置CVC是肺癌VTE的獨立危險因素。據此構建8個因素預測模型:Logit(P)=-5.938+0.689×BMI[24~28 kg/m2]+1.046×BMI[>28 kg/m2]+0.890×糖尿病+1.804×D-D[2~10 mg/L]+ 2.367×D-D[>10 mg/L]+0.428×LDH[250~500 U/L]+1.839×LDH[>500 U/L]+1.312×病理類型[腺癌]+1.028×臨床分期[Ⅲ-Ⅳ期/廣泛期] +0.875×化療+1.580×CVC。見表4。
2.5 基于建模集多變量Logistic回歸分析確定的獨立危險因素構建的列線圖模型分析D-D及LDH顯示評分占比較大,后續依次是CVC、病理類型、BMI、臨床分期、糖尿病和化療,見圖1。
2.6ROC曲線分析建模集的AUC是0.887,95%CI為0.850~0.924,而驗證集的AUC是0.887,95%CI為0.7940~0.912,證明有良好區分度,見圖2。

注:De,建模集;Vad,驗證集。
2.7 校準曲線分析建模集與驗證集的校準曲線顯示預測概率和實際概率非常吻合,見圖3。建模集與驗證集Hosmer-Lemeshow擬合優度檢驗的結果分別為χ2=5.224,P=0.814,χ2=12.512 ,P=0.186。

圖3 基于VTE風險預測列線圖的建模集(A圖)和驗證集(B圖)校準曲線圖
2.8DCA曲線分析預測列線圖的DCA曲線顯示,相對于不治療所有患者及積極干預所有患者兩種策略,列線圖為肺癌患者提供了更好的血栓預防凈獲益,見圖4。

圖4 基于VTE風險預測列線圖的建模集(A圖)和驗證集(B圖)校準曲線圖
肺癌患者每年的VTE總發病率為3.92%,患病率為2%至15%[12-13]。VTE的風險評估、血栓預防和治療是肺癌患者VTE管理的核心問題[13]。盡管Caprini、Padua、Khorana等血栓風險評分表已用于臨床實踐,但在肺癌患者VTE風險評估中的價值仍存在爭議[10]。已有研究報道,BMI、腰臀比、腰圍增加可使VTE風險增加1.40、1.58和1.67倍[14]。本研究顯示BMI值超過24 kg/m2,甚至達到28 kg/m2,會使肺癌人群VTE風險增加1.991和2.847倍。另外,一項大數據VTE薈萃分析表明,糖尿病使VTE風險增加1.35倍[15]。發生VTE的糖尿病患者更有可能經歷復雜臨床病程及復發性DVT和長期大出血并發癥[16]。本研究顯示糖尿病使肺癌人群VTE風險增加。LDH是參與糖酵解和糖異生工程中的重要酶類,在心、肝疾病及惡性腫瘤中可明顯升高。既往研究發現LDH水平較高與VTE發生率相關[17]。VTE在體能狀態差和高LDH的淋巴瘤患者中更多[18]。本研究提示LDH>500 mg/L時,肺癌人群VTE風險增加6.293倍。本研究確定了肥胖、糖尿病、LDH為肺癌人群的高危VTE因素,其機制可能涉及血液停滯、慢性血管功能損傷及異常凝血級聯反應[16]。
VTE預防的臨床實踐模式因癌癥類型及診療方式而異。本研究發現肺癌病理類型為腺癌、臨床分期為Ⅲ-Ⅳ期/廣泛期、化療、留置CVC使VTE風險增加了3.715、2.796、2.399和4.857倍。這與既往肺癌危險因素分析研究結果一致[19]。D-D是纖維蛋白的降解產物,是VTE顯著的獨立風險預測因子,亦是肺動脈栓塞排除標準[20]。本研究結果提示D-D為2~10 mg/L及>10 mg/L時,VTE風險為6.076和10.662倍。D-D水平與VTE風險正相關[20]。癌癥相關血栓評分表與D-二聚體檢測相結合,已被證明可用于癌癥患者VTE的風險預測。然而,在感染、心力衰竭、不同腫瘤、心肌梗塞、中風和慢性腎病等情況下,D-二聚體水平也會升高。因此,綜合D-二聚體檢測的多因素臨床預測模型更能提高肺癌患者的VTE預測準確率[19]。本研究基于建模集多變量Logistic回歸分析確定的獨立危險因素構建列線圖模型顯示,D-D及LDH顯示評分占比較大,后續依次是CVC、病理類型、BMI、臨床分期、糖尿病和化療。建模集與驗證集的校準曲線顯示,預測概率和實際概率非常吻合。預測列線圖的DCA曲線顯示,相對于不治療所有患者及積極干預所有患者兩種策略,列線圖為肺癌患者提供了更好的血栓預防凈獲益。
綜上,肺惡性腫瘤靜脈血栓栓塞癥列線圖模型對預測肺癌患者VTE 風險有一定價值,可根據其制定預防性抗凝策略。但本研究尚存在以下局限性:首先,本研究為回顧性研究,可能存在選擇偏倚;其次,缺乏來自不同中心的外部數據進行驗證。因此,后期仍需進一步深入研究。