官艷 張國嬌 羅茵
重癥急性胰腺炎(severe acute pancreatitis,SAP)是臨床上常見的危急重癥之一,死亡率達20%~30%[1-3]。早期腸內營養(≤48小時)可以降低病人死亡率[4-6]。誤吸是早期腸內營養常見的嚴重并發癥,其發生率達30%[7]。早期預測腸內營養誤吸風險,對降低誤吸發生率具有重要臨床意義。機器學習算法是通過監督、無監督或半監督方法,對存在大量復雜關系的變量進行反復迭代分析,具有直觀、預測效能高等優點[8-9]。本研究分析296例SAP病人實施早期腸內營養誤吸發生的情況,使用新型機器學習算法構建重癥急性胰腺炎病人早期腸內營養誤吸風險的預測模型。
2012年1月~2019年12月就診的重癥急性胰腺炎病人296例。納入標準:(1)年齡≥18歲;(2)依據中華醫學會急性胰腺炎診療指南(2014)明確診斷為SAP;(3)進入ICU后24小時至48小時以內接受腸內營養治療,且腸內營養時間1周以上;(4)病人及家屬對治療方法知情并簽署知情同意書。納入變量包括年齡、性別、身高、體重、體位、急性生理與慢性健康評分(APACHE-II評分)、意識狀態、營養風險、鼻飼管置入長度、白細胞計數、淋巴細胞計數、血小板計數、中性粒細胞計數等。
1.觀察指標:SAP病人給予腸內營養期間是否發生誤吸作為主要觀察指標。誤吸的診斷標準:(1)在實施腸內營養過程中,病人具有嗆咳、呼吸急速、心率加快等典型臨床表現;(2)病人的口鼻腔有殘留的腸內營養液,或吸痰之后可見痰液中有腸內營養液;(3)對病人進行呼吸道分泌物PH值監測,以PH<7作為誤吸診斷標準;(4)對于懷疑誤吸的病人,留取呼吸道分泌物并監測胃蛋白酶,陽性提示有誤吸現象;(5)采取肺纖維支氣管鏡檢查,發現呼吸道有胃內容物存在。以上任何1項均可作為SAP病人實施腸內營養之后發生誤吸的診斷標準。
2.機器學習模型構建的評價:將數據按照隨機分組的原則,分為訓練集隊列(70%)和驗證集隊列(30%)。按照機器學習的算法,納入隨機森林、神經網絡、決策樹、支持向量機和廣義線性回歸算法,觀察不同算法的表現[10-12]。根據算法中的β指數迭代權重,評估變量對結局指標的影響。變量的β指數越高,則說明該變量在預測結局指標中發揮的作用越大。隨后根據變量的權重值,對可能引起變量預測變化的相關因素進行排名,用于模型構建。構建機器學習模型后,采取重抽樣和十倍交叉驗證模型的穩健性。評估每個模型的預測效能,采用受試者工作曲線和決策曲線分析。曲線下面積(area under the curve,AUC)用于反映模型的預測效能,決策曲線分析(decision curve analysis,DCA)通過重分類改善指標,評估閾值概率(切點值分類后的構成比)評估預測模型的效能[13]。在不同的閾值概率上,對應曲線的凈獲益越大,則說明模型的預測效能越高。

1.SAP病人誤吸情況 :296例病人中未發生誤吸268例,發生誤吸28例。兩組病人年齡、性別、體位、體重指數(BMI)、中性粒細胞-淋巴細胞比值(NLR)、淋巴細胞-單核細胞比值(LMR)比較,差異無統計學意義(P>0.05)。APACHE-II評分、意識狀態、營養風險、鼻飼管置入長度、中性粒細胞計數、淋巴細胞計數、血小板計數、血小板-淋巴細胞比值(PLR)等比較,差異有統計學意義意義(P<0.05)。兩組病人一般資料比較,見表1。

表1 兩組病人一般資料比較
2.SAP病人誤吸影響因素分析:為了消除候選變量間數值差異過大,或因過擬合造成的影響,本研究采用Sigmoid函數處理非線性數據,以及根據最大化數據分離的標準反復分割數據集。利用遞歸特征消除算法,從15個臨床資料特征中提取8個特征,其中包含了5個關鍵特征因子,分別是APACHE-II評分、意識狀況、營養風險、鼻飼管置入長度、PLR。無論是采用機器學習反復迭代分析,還是采用廣義線性模型進行二分類學習,其關鍵特征因子均保持高度匹配。具體提取特征因子見表2。

表2 機器學習遞歸特征消除算法篩選的關鍵變量
3.機器學習模型的性能比較:將篩選得到的最優候選變量納入到各類分類器中,并采用十折交叉驗證對模型進行訓練和評估。見圖1A。圖1A可以看出,隨機森林模型有著最高的預測效能,其AUC值為0.976,其次為神經網絡(AUC=0.973)、決策樹(AUC=0.961)、支持向量機(AUC=0.932)和廣義線性回歸算法(AUC=0.921)。與ROC曲線的結果一致,利用DCA評估機器學習模型的臨床受益,當隨機森林模型預測SAP病人發生誤吸概率閾值為0.01時,模型提供了最優的預測效能(圖1B)。利用驗證集隊列對預測模型進行驗證,見圖2。
SAP是臨床上常見的急危重癥,主要是由多種因素導致胰酶在胰腺內被異常激活,而胰酶可以對胰腺細胞造成損傷。SAP約占胰腺炎發病的20%~30%,未能得到及時治療可導致死亡風險增加[3]。SAP病人存在腸道屏障損害,腸黏膜通透性增加,腸道菌群移位,炎癥因子擴散,腸源性感染的風險增加[14]。對SAP病人實施早期腸內營養可以促使腸黏膜生長,維持腸道表皮細胞的完整性,減少并發癥的發生率。腸內營養的途徑包括經口、經鼻胃管、經鼻空腸管等途徑,誤吸是腸內營養最常見的并發癥。評估SAP病人誤吸風險因素具有重要臨床意義。本研究基于機器學習算法,將候選變量納入機器學習模型中,利用反復迭代無監督學習,篩選有意義的預測變量,構建可視化預測評估模型,借助我們構建的機器學習預測模型,可以使SAP病人誤吸風險計算實現便捷化、可視化。

A.受試者工作曲線評估每個模型的預測效能;B.決策曲線分析評估每個模型的預測效能圖1 機器學習模型在訓練隊列中的預測效能比較

A.受試者工作曲線評估每個模型的預測效能;B.決策曲線分析評估每個模型的預測效能圖2 機器學習模型在驗證隊列中的預測效能比較
本研究結果表明,無論是采用傳統的廣義線性模型,還是通過使用不同機器學習算法,結果均顯示APACHE-II評分、意識障礙、營養風險、管飼置入長度以及炎性因子比值在候選變量中占有很大的權重。Cardoso 等[15]研究表明,APACHE-II評分越高,病人發生誤吸的風險越大,該評分系統能夠反映病情的嚴重程度,臨床上可用于動態評估病情變化。本研究納入APACHE-II評分作為候選變量,可以提升預測模型的準確度,用于臨床預見性治療評估,預防誤吸發生。與單獨使用APACHE-II評分預測誤吸風險比較,聯合炎性因子比值和臨床相關指標,可以更好地預測誤吸風險。有研究表明,炎性因子在SAP的病情發展中發揮著關鍵作用,白細胞介素-6、腫瘤壞死因子-α可以激活中性粒細胞和氧自由基,造成臟器損傷[16]。此外,大量炎性因子活化導致腸道屏障受損,使SAP病人腸蠕動減少,增加了誤吸發生幾率。本研究通過機器學習算法,發現NLR、PLR可用于評估誤吸風險,這提示在行腸內營養之前,應該重視控制和減少炎性因子的產生,以減少誤吸風險發生。另外,中性粒細胞計數、淋巴細胞計數、血小板計數等是血常規中的常見指標,其獲取較為便捷,易于評估。
多因素Logistic回歸分析以及反復迭代分析,結果均顯示置入管飼的深度是影響SAP病人發生誤吸的獨立危險因素。針對SAP病人實施腸內營養治療,要兼顧喂養方式與鼻飼管置入長度。本研究還發現,營養風險與意識障礙是預測SAP病人發生誤吸的獨立危險因素。Marchetti 等[17]研究表明,高營養風險與病人發生院內死亡的風險呈顯著正相關。這是因為高營養風險病人需要接受更多的治療措施,如氣管插管、氣管切開以及置入鼻飼管等,這些均可以增加病人誤吸風險。戴卉等[18]研究表明,意識障礙病人咳嗽反射能力下降,氣道防御性保護能力降低,從而導致吞咽障礙,誘發誤吸。因此,對SAP病人實施臨床干預時,應該預防口咽分泌物進入下呼吸道,預防誤吸發生。
本研究基于機器學習算法建立了SAP病人早期腸內營養誤吸風險預測模型,其中隨機森林模型表現最優,可用于精確預測SAP病人早期腸內營養誤吸風險,可以為臨床決策提供參考,幫助醫患共同實現最優個體化治療方案。
致謝
本文承華中科技大學同濟醫學院附屬同濟醫院肝臟外科黃志勇教授親自指導,特此感謝。