殷菲,劉云,沈勰
《中國統計年鑒2020》報告,2019年我國部分地區城鄉居民主要疾病死亡率及死因構成中損傷和中毒居第5位,城市居民損傷和中毒的死亡率為36.06/10萬,而在農村居民中高達51.08/10萬[1]。在發達國家,創傷已成為中青年人群第1位致死原因,因車禍、生產安全事故等造成的人體損害事件逐年攀升,其造成的社會危害和勞動力損失遠大于任何一類疾病[2]。對于創傷患者,尤其是嚴重多發傷患者病情變化迅速、病死率高,如何早期判斷傷情嚴重程度將直接影響臨床醫師的診療和患者的預后。近年來越來越多的評分系統被證實可以用來評估多發傷患者的病情嚴重程度及預后,包括基于生理學因素的改良創傷評分(RTS)、急性生理與慢性健康評分(APACHE),基于解剖因素的簡明損傷定級標準(AIS)、損傷嚴重程度評分(ISS)和兩者兼有的創傷嚴重程度評分(TRISS)、創傷嚴重程度特征評分(ASCOT)等[3-5]。DE MUNTER等[6]在分析了1990—2015年發表的90篇文獻后發現,基于雙重因素的TRISS、ASCOT較僅有生理或解剖單一因素的評分系統在評估預后方面具有更高的準確性,但其仍需較多的變量,一定程度上增加了數據遺漏或不可靠的可能,并且計算復雜、缺少計算機參與無法完成評分,導致其在緊急情況下作用有限。因此本研究回顧性分析了近5年蘇州市第九人民醫院收治的多發傷患者的臨床資料,旨在尋找一個結合解剖學與生理學因素,在預測患者預后方面具有較高準確性且可以被快速解讀、無需計算機參與、直觀的評分系統。
本研究價值:
(1)根據既往文獻的參考指標及臨床工作中的經驗,盡可能將與疾病相關的因素選入,創建列線圖(Nomogram圖)時應用了較新穎的限制性立方樣條(RCS)分析方法探索數據,最終篩選出5種因素(年齡、損傷嚴重程度評分、格拉斯哥昏迷評分、血小板計數、動脈血乳酸)參與建模。這5種因素涵蓋了解剖學特征和生理學特征,且是臨床上容易獲得的,使建立的模型在參數選擇上具有一定的優勢。
(2)既往文獻多將連續性變量轉化成二分類或有序多分類等級變量后再進行研究,但是數據分類后會丟失統計功效,相當于直接剔除1/3的數據;很少有研究直接描述連續性變量的非線性特征,且極少應用在Nomogram圖中,但這種非線性的表現常更符合臨床數據的真實變化。經驗證,通過RCS擬合非線性優化后的模型2具有更高的區分度、校準度和臨床凈收益率。
(3)本研究創建了網頁動態列線圖,可支持他人訪問,便于今后的臨床應用、科研學習和模型優化。網址:https://yinfxyz.shinyapps.io/dynnomapp2/。
1.1 一般資料 選取2015年12月至2020年12月蘇州市第九人民醫院綜合ICU、急診ICU收治的嚴重多發傷患者作為建模組人群。納入標準:單一致傷因素造成2個或2個以上解剖部位損傷,且至少有1個部位的損傷危及生命,即ISS≥16分[4]。排除標準:年齡<16周歲;相關檢查未完成即已出院或死亡;合并其他可能影響研究結果的疾病,如嚴重心血管疾病、肝腎衰竭;合并凝血功能障礙性疾病,如白血病、血友病;影像學資料缺失;院前時間>24 h。初步篩選出331例患者,其中4例ISS評分<16分,1例合并嚴重肝硬化、肝衰竭,1例合并嚴重冠心病、心力衰竭,3例缺失影像學資料,1例院前時間>24 h。建模組最終納入321例患者,其中交通傷217例,墜落傷64例,打砸壓傷27例,刀刺傷3例,爆炸傷2例,其他原因損傷8例;男227例,女94例;平均年齡(50.8±15.2)歲;住ICU天數(10.8±10.3)d;總住院天數(25.7±24.2)d。
收集2021年1—8月本院收治的嚴重多發傷患者作為預測模型的驗證組人群,納入與排除標準參照建模組人群,共納入136例。本研究經蘇州市第九人民醫院倫理委員會審核批準(批件號:KY2021-043-01),納入對象個人標識符完全刪除,數據分析匿名化。
1.2 研究方法 回顧性收集患者入院時的一般資料,包括患者的住院號、性別、年齡、基礎疾病(包括糖尿病、高血壓)、院前時間、損傷類型,入院24 h內的臨床資料,包括格拉斯哥昏迷評分(GCS)、休克情況、平均動脈壓(MAP)、體溫(T)、呼吸(R)、脈搏(P)、動脈血酸堿度(pH值)、動脈血氧分壓(PaO2)、動脈血二氧化碳分壓(PaCO2)、動脈血乳酸(LAC)、白細胞計數(WBC)、紅細胞計數(RBC)、血紅蛋白(Hb)、血細胞比容(HCT)、血小板計數(PLT)、總膽紅素(TBiL)、白蛋白(ALB)、丙氨酸氨基轉移酶(ALT)、天冬氨酸氨基轉移酶(AST)、乳酸脫氫酶(LDH)、血尿素氮(BUN)、血肌酐(Scr)、血清鈉離子(Na+)、血清鉀離子(K+)、肌酸激酶(CK)、肌酸激酶同工酶(CK-MB)、肌鈣蛋白I(cTnI)、肌紅蛋白(MYO)、凝血酶時間(TT)、凝血酶原時間(PT)、活化部分凝血活酶時間(APTT)、纖維蛋白原(Fib)、D-二聚體(D-D)、ISS。
根據患者出院時病情分為救治成功和救治失敗。救治成功指臨床治愈(癥狀和體征完全消失)、臨床好轉(癥狀和體征明顯改善)、合并顱腦創傷時格拉斯哥預后評分(GOS)≥4分;救治失敗指死亡、未愈(臨床癥狀、體征較入院時好轉不明顯或加重;病情極其危重,家屬放棄搶救,簽字出院)、合并顱腦創傷時GOS≤3分。驗證組患者信息采集及分組情況參照建模組。
1.3 統計學方法 采用IBM SPSS(Version 25.0)、MedCalc(Version 19.0.7)、R語言(Version 3.6.1)軟件進行統計學分析。以P<0.05為差異有統計學意義。符合正態分布的計量資料以(±s)表示,兩組間比較采用獨立樣本t檢驗;非正態分布的計量資料以M(P25,P75)表示,兩組間比較采用非參數Mann-Whitney U檢驗。計數資料以相對數表示,兩組間比較采用χ2檢驗。采用單因素分析、LASSO(Least Absolute Shrinkage and Selection Operator)回歸分析篩選影響患者預后的相關變量,運用多因素Logistic回歸分析建模,限制性立方樣條(restricted cubic spline,RCS)優化,并通過Hosmer-Lemeshow擬合優度檢驗判斷模型的擬合優度。繪制列線圖(Nomogram圖),采用Bootstrap方法和臨床決策曲線分析(decision curve analysis,DCA)驗證模型的校準度。繪制模型的受試者工作特征(ROC)曲線,利用ROC曲線下面積(AUC)、Brier Score、赤池信息準則(AIC)指標評價新模型。AUC之間的比較采用Delong檢驗。在驗證組人群中進行新模型的外部驗證,評估其實際臨床應用價值。
2.1 建模組
2.1.1 影響嚴重多發傷患者預后的單因素分析 建模組321例嚴重多發傷患者中救治成功244例,救治失敗77例。單因素分析結果顯示:救治成功與救治失敗患者院前時間、損傷類型、GCS、休克情況、R、P、pH值、LAC、RBC、Hb、HCT、PLT、ALB、K+、CK、CKMB、cTnI、MYO、TT、PT、APTT、Fib、D-D、ISS比較,差異有統計學意義(P<0.05);救治成功與救治失敗患者性別、年齡、基礎疾病、MAP、T、PaO2、PaCO2、WBC、TBiL、ALT、AST、LDH、BUN、Scr、Na+比較,差異無統計學意義(P>0.05),見表1。

表1 影響嚴重多發傷患者預后的單因素分析Table 1 Univariate analysis of possible prognostic factors of successfully and unsuccessfully treated patients with severe multiple trauma
2.1.2 LASSO回歸分析篩選影響嚴重多發傷患者預后的相關因素 運用R語言glmnet程序包,以嚴重多發傷患者預后情況(賦值:救治成功=0,救治失敗=1)為因變量,以單因素分析中P<0.05的24個變量為自變量(賦值:休克:否=0,是=1;損傷類型:交通傷=1,墜落傷=2,打砸壓傷=3,刀刺傷=4,爆炸傷=5,其他原因=6;其余變量均為實測值)進行LASSO回歸分析,隨著懲罰系數λ的變化,模型初始納入的影響因素的系數被壓縮,最后部分影響因素系數被壓縮為0,從而避免了模型過度擬合,達到最佳影響因素選擇的效果(圖1)。為尋找最佳懲罰系數λ,使模型性能優良且影響因素最少,經過交叉驗證,繪制均方誤差隨參數Logλ的變化圖(圖2),最優解為距離最小均方誤差一個標準差(右側縱向虛線)時對應的λ,經計算λ=0.059。根據此λ值篩選出4個預測變量為GCS、LAC、PLT、ISS,回歸系數分別為:-0.262、0.036、-0.003、0.042。

圖1 LASSO回歸篩選變量動態過程圖Figure 1 Selection process of prognostic variables of severe multiple trauma by LASSO regression

圖2 交叉驗證最佳參數λ的選擇過程圖Figure 2 Selection process of the value of lambda by cross validation
2.1.3 建模與RCS擬合優化 運用R語言rms程序包,首先將PLT轉化為二分類變量,以嚴重多發傷患者是否救治成功(賦值:成功=0,失敗=1)為因變量,以年齡(賦值:實測值)、GCS(賦值:實測值)、LAC(賦值:實測值)、PLT(賦值:≥100×109/L=0,<100×109/L=1)、ISS(賦值:實測值)為自變量進行多因素Logistic回歸分析,結果顯示,年齡、GCS、LAC、PLT、ISS是嚴重多發傷患者預后的影響因素(P<0.05,表2),經Hosmer-Lemeshow擬合優度檢驗顯示擬合良好(χ2=2.717,df=8,P=0.951),作為模型1;Nagelkerke R2=0.741,上述5個因素解釋了74.1%的數據變化,C-index為0.963。

表2 嚴重多發傷患者預后影響因素的多因素Logistic回歸分析Table 2 Multivariate Logistic regression analysis of prognostic factors of severe multiple traumain patients in the model group
運用RCS分析上述因素,其中年齡與GCS的P值(for all)分別為0.009、<0.001,P值(for nonlinear)分別為0.027、0.001,表示年齡與GCS與預后呈非線性相關;應用RCS擬合優化多因素Logistic回歸構建的模型,作為模型2,Hosmer-Lemeshow擬合優度檢驗顯示模型2擬合良好(χ2=2.468,df=8,P=0.932);Nagelkerke R2=0.790,解釋了79.0%的數據變化;C-index為0.974。
2.1.4 預測模型的列線圖繪制及Bootstrap內部驗證 將多因素Logistic回歸分析結果篩選出的變量納入列線圖預測模型,以嚴重多發傷患者是否救治成功為結局變量,繪制模型1與模型2(圖3~4)。采用Bootstrap方法(重復抽樣)在建模樣本中進行內部驗證,樣本量為321,再次抽樣次數400次,結果顯示模型1和模型2校準圖中標準曲線與預測曲線貼合良好(圖5~6),絕對誤差分別為0.010、0.019,說明模型的校準度良好。通過R語言DynNom程序包建立網頁版動態列線圖,模型1列線圖網址:https://yinfxyz.shinyapps.io/dynnomapp/,模型2列線圖網址:https://yinfxyz.shinyapps.io/dynnomapp2/。

圖3 嚴重多發傷患者預后預測模型1列線圖Figure 3 Nomogram 1 predicting prognosis in severe multiple trauma

圖4 嚴重多發傷患者預后預測模型2列線圖Figure 4 Nomogram 2 predicting prognosis in severe multiple trauma

圖5 模型1列線圖預測嚴重多發傷患者預后的校準曲線Figure 5 Calibration curve of nomogram 1 predicting prognosis in severe multiple trauma

圖6 模型2列線圖預測嚴重多發傷患者預后的校準曲線Figure 6 Calibration curve of nomogram 2 predicting prognosis in severe multiple trauma
2.1.5 模型1、模型2列線圖預測嚴重多發傷患者預后的ROC曲線及比較 繪制模型1、模型2列線圖預測嚴重多發傷患者預后的ROC曲線(圖7),結果顯示,模型1、模型2列線圖預測嚴重多發傷患者預后的AUC、最佳截斷值、靈敏度、特異度、Brier Score、AIC見表3。Delong檢驗結果顯示,模型2列線圖預測嚴重多發傷患者預后的AUC大于模型1列線圖,差異有統計學意義(Z=-2.400,P=0.016)。

圖7 模型1、模型2列線圖預測嚴重多發傷患者預后的ROC曲線Figure 7 The ROC curves of nomograms 1 and 2 for predicting the prognosis in severe multiple trauma

表3 模型1、模型2列線圖預測嚴重多發傷患者預后的AUC、最佳截斷值、靈敏度、特異度、Brier Score、AICTable 3 The AUC,optimal cut-off value,sensitivity,specificity,Brier Score and Akaike information criterion of nomograms 1 and 2 for predicting the prognosis of severe multiple trauma
2.1.6 模型1、模型2列線圖預測嚴重多發傷患者預后的DCA 模型1、模型2列線圖預測嚴重多發傷患者預后的DCA顯示,在任何閾值概率下(0~100%),使用列線圖(模型1、模型2)預測嚴重多發傷患者預后的凈收益率均較高,且模型2的凈收益率高于模型1(圖8)。

圖8 模型1、模型2列線圖預測嚴重多發傷患者預后的DCAFigure 8 Decision curve analysis of nomograms 1 and 2 for predicting the prognosis of severe multiple trauma
2.2 驗證組
2.2.1 驗證組救治成功和救治失敗患者年齡、GCS、LAC、PLT、ISS比較 驗證組136例嚴重多發傷患者中救治成功104例,救治失敗32例。救治成功和救治失敗患者GCS、LAC、PLT、ISS比較,差異有統計學意義(P<0.05);救治成功和救治失敗患者年齡比較,差異無統計學意義(P>0.05),見表4。

表4 驗證組救治成功和救治失敗患者年齡、GCS、LAC、PLT、ISS比較Table 4 Comparison of age,Glasgow Coma Score,arterial lactate,platelet count and Injury Severity Score of successfully and unsuccessfully treated patients with severe multiple trauma in validation group
2.2.2 模型2列線圖的外部應用 在驗證組人群中,模型2列線圖預測嚴重多發傷患者預后的AUC為0.949〔95%CI(0.898,0.979),P<0.001〕,見圖9,Hosmer-Lemeshow擬合優度檢驗表明該模型擬合良好(χ2=5.813,df=8,P=0.668)。模型2列線圖在建模組及驗證組人群中的AUC比較,差異無統計學意義(Z=1.124,P=0.263)。

圖9 模型2列線圖預測驗證組嚴重多發傷患者預后的ROC曲線Figure 9 The ROC curve of nomogram 2 for predicting the prognosis of patients with severe multiple trauma in the validation group
一般認為,當評估多發傷的嚴重程度時,可依據解剖學標準和生理學標準來確定,其中以解剖學最可靠,因為創傷發生后身體形態方面相對穩定,通過肉眼觀察、影像學檢查獲取更為直觀,但多發傷患者病情復雜,最大的缺陷是容易出現信息缺失和遺漏,因此臨床醫生常需要結合其他生理學指標完成評估。生理學指標能反映身體功能(包括年齡、性別、合并癥)和器官系統對損傷產生的一系列變化(包括生命體征、生化指標、血常規、凝血功能等)[7],這類臨床參數并不穩定,在治療過程中和不同的疾病時期可能發生變化,患者從受傷至送達醫院的時間不同,且在采集血液、體液標本時是否接受治療、接受何種治療也無法統一。因此本研究同時收集生理學數據與解剖學數據,其中解剖學數據的采集參照AIS-ISS(2005)評分標準[8]。
本研究單因素分析結果顯示,共24個變量可能影響嚴重多發傷患者的預后,從統計學角度分析,Logistic回歸分析模型中每個變量至少應該有10個陽性病例[9],本研究數據中陽性病例數(即建模組救治失敗患者)為77例,未達到Logistic回歸分析所需的條件,故先選用LASSO回歸對變量行初步篩選[10],結果顯示最佳λ為0.059,在此懲罰系數下,GCS、LAC、PLT、ISS這4個變量的系數未歸零,分別為-0.262、0.036、-0.003、0.042。GCS是目前全球公認的用于意識狀態評估的有效評分方法[11],GALKOVA等[12]表示該量表具有較高的靈敏度和特異度,可用于預測多發傷患者的死亡率。多發傷患者因快速失血導致組織灌注不足易發生酸中毒,生物標志物如pH值、乳酸和堿剩余常被用于判定組織灌注不足,進而確定患者是否需要干預以幫助改善預后;多項研究表明,對于多發傷患者,入院時血清乳酸水平升高與較高的死亡率和輸血需求相關[13]。多發傷患者血小板減少的原因在于大量丟失與高消耗,而血小板急劇減少可導致彌散性血管內凝血(DIC)、創傷性凝血病的發生[14]。LIU等[15]在一項多發傷合并顱腦損傷的研究中證實,PLT為患者預后不良的獨立危險因素,其OR值為0.982,PLT每減少1個單位,患者預后不良的概率增加1.8%。回歸模型中變量的臨床意義表現在每增加或減少1個單位時發生陽性結果風險的變化程度,在本研究LASSO回歸結果中PLT系數僅為-0.003,遠小于其他3個變量,以連續性變量的形式構建模型的臨床意義不顯著,故根據臨床經驗將PLT以100×109/L為截點轉化為二分類變量再進入下一步分析。雖然本研究單因素分析中年齡無統計學意義,但根據既往研究結果顯示,多發傷患者的年齡與醫院死亡率指數呈正相關,年齡是不良結果的獨立預測因子[16-17]。因此筆者在構建新的嚴重多發傷患者預后預測模型時,將年齡一并納入分析中。根據多因素Logistic回歸分析建立的模型1列線圖具有較好的區分度及校準度,采用Bootstrap方法進行的內部驗證結果顯示該模型絕對誤差為0.010(<0.05)。
經多因素Logistic回歸分析擬合的模型1中,年齡與其他4項獨立因素校準后,其統計學意義仍處于臨界狀態,強制納入后對模型的改善度較小。因此,筆者再次深入分析數據時發現,在年齡、GCS與預后的平滑曲線中大致可知兩者并非呈簡單的線性相關,僅使用線性模型不能準確地反映年齡對預后情況的影響,這也可能是導致在單因素分析中年齡無統計學意義的重要原因。連續性變量的轉換及評價其與結果的關聯是多變量建模的必要步驟,特別是列線圖,因此本研究通過使用RCS,設置3個節點,尋求評估連續預測的最佳效果。FATOVICH等[18]在研究中表示,當嚴重創傷患者年齡>47歲時,其死亡風險呈指數級增長。本研究中,從模型2列線圖中可知該閾值年齡約為50歲,年齡越大救治失敗的概率也越大;老年患者組織器官功能衰退,免疫力與抵抗力低下,常合并其他慢性病,機體一旦受到創傷,組織器官功能恢復時間長,容易受到致病菌的侵襲,出現并發癥的概率也越大,對預后產生不利影響[19]。同樣,本研究RCS分析發現GCS與預后亦呈非線性相關,且具有統計學意義,P值(for nonlinear)<0.05,GCS的閾值約為8分,當GCS<8分時,救治失敗的概率隨分值的減少呈指數級增長。因此筆者在創建列線圖時考慮到非線性持續性變量的存在,運用RCS擬合多因素Logistic回歸構建非線性優化后的模型2列線圖,并繪制模型2列線圖預測嚴重多發傷患者預后的ROC曲線,其AUC為0.974,提示該模型區分度表現良好;經Hosmer-Lemeshow擬合優度檢驗顯示該模型擬合良好,再采用Bootstrap方法進行模型的內部驗證,均提示該模型的校準度良好。根據回歸方程計算患者預后概率比較繁瑣,同時還需借助專業計算設備,不易于臨床推廣,且含有非線性因素的模型不適宜用方程推導,因此本研究運用列線圖的可視化方式,以便簡單、快捷地獲得一個較為精確的概率值[20],同時本研究還提供了列線圖的網頁動態版本,具有一定的推廣意義和臨床應用價值。
本研究結果顯示,模型2列線圖預測嚴重多發傷患者預后的AUC大于模型1列線圖,說明模型2列線圖的區分度更優。由于Hosmer-Lemeshow擬合優度檢驗得到的P值并不能用來量化模型校準度[21],本研究再引入 Brier Score[22]、AIC[23]進一步評估模型 1、2 列線圖的校準能力,結果顯示模型2列線圖的Brier Score、AIC小于模型1,且在最佳截斷值下具有較高的靈敏度和特異度。DCA結果顯示在各個閾概率下,兩模型均具有較好的臨床凈收益率,且模型2列線圖的臨床凈收益率高于模型1列線圖。以上結果均說明應用RCS擬合非線性優化后的模型2列線圖較模型1列線圖有一定的改善效果。將模型2列線圖在驗證組人群中進行同中心時段驗證[24],結果顯示,模型2列線圖預測嚴重多發傷患者預后的AUC為0.949,Hosmer-Lemeshow擬合優度檢驗表明該模型擬合良好;且模型2列線圖在建模組及驗證組人群中的AUC比較差異無統計學意義,提示模型2列線圖在預測外部人群救治成功與否中的表現良好,預測能力無下降。
綜上所述,年齡及入院24 h內GCS、LAC、PLT、ISS是影響嚴重多發傷患者預后的重要因素,上述因素涵蓋了患者的解剖和生理特征,且年齡、GCS與患者預后呈非線性相關。經RCS擬合非線性優化后的模型2列線圖較模型1列線圖有更高的區分度和校準度,且在驗證組人群的預后評估中準確性未下降,因此模型2列線圖有助于分析患者病情、指導臨床治療(網址:https://yinfxyz.shinyapps.io/dynnomapp2/),值得推廣。由于本研究人群來自單中心,樣本量較少,且多數為鈍性損傷,結果可能存在一定的局限性,因此在后續的研究工作中還需要開展與其他中心的合作研究,完善模型的多中心驗證與優化。
作者貢獻:殷菲提出研究思路和研究目標,設計研究方案,包括LASSO回歸、RCS擬合Logistic回歸探索各參數、繪制非線性效應列線圖等,并負責論文起草、最終版本修訂,對論文整體負責。殷菲、劉云負責研究過程的實施,各項數據的采集,包括患者入院時的一般資料,入院24 h內的臨床資料,并負責數據的校對、清洗。殷菲、沈勰負責數據的統計學分析、圖表繪制,包括運用SPSS軟件行單因素、多因素分析,ROC曲線分析,R語言繪制列線圖、校準圖、ROC曲線圖、DCA圖等。
本文無利益沖突。