劉永飛,張佳婧,汪建勝
準確的術前評估是麻醉醫師和手術醫師為手術病人制定合理的圍手術期管理策略的必要前提。充分、精準的術前評估能夠為病人術后可能出現的并發癥和不良事件提前做好預案,從而減少術后并發癥,降低病人術后死亡率[1-3]。術前訪視是術前評估的重要環節,然而術前訪視主要依賴于麻醉醫師的個人經驗和判斷,主觀性較強。因此,一系列評分或分級系統被開發并用于術前評估,如美國麻醉師協會(ASA)分級系統[4]、序貫器官衰竭評分(SOFA)系統[5]、急性生理與慢性健康評分(APACHE Ⅱ)系統[6]等。但這些系統在開發時并未考慮不同手術部位對術后并發癥及死亡風險的影響,因此缺乏特異性。隨著我國醫療水平的提高,各大三級醫院每年手術量呈上升趨勢。然而,目前對于普外科最常見的腹部手術仍缺乏客觀、準確、特異性強的術前評估系統[7]。近年來,隨著人工智能科技和機器學習技術的在醫學領域的發展,利用人工智能技術對既往數據進行挖掘、學習,并形成預測模型進行預警評估的策略成為可能[8-10]。本研究擬通過機器學習分類算法的佼佼者支持向量機模型,預測腹部手術病人術后28 d的死亡風險,為腹部手術病人術前風險評估提供新的方法。
1.1 納入及排除標準 納入標準:2015年7月至2017年6月期間收治于寶山區中西醫結合醫院并行腹部手術的病人。排除標準:產科手術;年齡<6歲的兒科手術;合并其他部位手術(如胸腹聯合手術等);建模指標或預后結局缺失者。
1.2 統計學方法
1.2.1 建模變量 經過專家查閱文獻和專家討論,最終確定了三個模塊共29變量進行建模,(1)病人的一般情況:性別、年齡、體質量指數(BMI)、術前合并癥等;(2)麻醉術前訪視情況:手術類型(擇期或急診)、美國麻醉師協會(ASA)分級、心率(HR)、平均動脈壓(MAP);(3)實驗室檢查:白細胞計數(WBC)、血紅蛋白濃度(Hb)、血小板計數(PLT)、丙氨酸氨基轉移酶(ALT)、天門冬氨酸氨基轉移酶(AST)、膽紅素(BIL)、白蛋白(ALB)、尿素氮(BUN)、血肌酐(SCr)、D二聚體(DDimer)、國際標準化比值(INR)、降鈣素原(PCT)、C反應蛋白(CRP)。所有臨床數據集實驗室指標通過訪問我院電子病例系統獲得,對于住院期間手術次數>1次者,僅納入第一次手術時的指標。
1.2.2 預測變量 腹部術后病人28 d內出現死亡事件。
1.2.3 數據處理 將所有病人通過隨機抽樣將所有病人以7∶3比例分配訓練集和驗證集。對于計量資料首先進行正態分布檢驗,符合正態分布的計量資料以均數(標準差)表示,組間比較使用獨立樣本t檢驗;非正態分布的計量資料以中位數(四分位間距)表示,組間比較采用Wilcoxon秩和檢驗。計數資料使用個數(百分比)表示,組間比較采用χ2檢驗或Fisher精確概率法。不同模型的受試者工作曲線(ROC)下面積比較采用Delong檢驗。所有數據分析使用R軟件平臺(版本3.6.2)完成。
1.2.4 模型的構建、驗證和評價 基于訓練集數據,使用e1071包構建支持向量機模型,使用tune.svm()函數進行交叉驗證并調整參數達到最優,核函數kernel設置為線性,最優成本函數cost設置選項為(0.001,0.01,0.1,1,5,10)[11-12]。完成最優支持向量機模型構建后,分別在訓練集和測試集上進行預測和驗證,評價模型的敏感性、特異性、陽性預測值、陰性預測值、準確率等指標,并構建支持向量機模型預測術后死亡事件的ROC曲線,并計算ROC曲線下面積[13-14]。為了進一步評價支持向量機模型的工作性能,我們使用廣義線性模型函數glm()構建了多因素logistic回歸模型對術后死亡事件進行預測,并在訓練集和測試集中比較支持向量機模型和傳統logistic回歸模型的工作性能[15]。
2.1 病人基本信息 腹部手術病人的基本信息及預后如表1所示,研究共納入手術病人1 512例,其中男911例(60.25%),女601例(39.75%),年齡(62.83±12.33)歲。其中115 例(7.61%)病人在術后28 d死亡。急診手術病人209例,占總手術人數的13.82%,按照美國麻醉師協會(ASA)分級,Ⅰ級、Ⅱ級、Ⅲ級、Ⅳ級、Ⅴ級的人數分別占總手術人數的6.55%、69.64%、16.53%、6.08%、1.19%。術前發病率最高的前三位合并病分別為高血壓(219例,14.48%)、慢性心功能不全(176例,11.64%)、糖尿病(138例,9.13%)。通過隨機抽樣分配后(7∶3),得到訓練集病人1 048例,驗證集病人464例。所有建模指標中,除性別和免疫抑制情況在訓練集和驗證集的比例存在差異(P<0.05),余指標在訓練集和驗證集中均無顯著性差異(P>0.05)(見表1)。

表1 腹部手術病人基本信息及預后

續表1
2.2 支持向量機模型預測的死亡概率在存活組和死亡組間的分布 使用支持向量機預測每個腹部術后病人死亡概率在存活組和死亡組間的分布見圖1。訓練集中,死亡組的死亡預測概率顯著高于存活組的死亡預測概率(P<0.01)(見圖1A)。驗證集中死亡組的死亡預測概率顯著高于存活組的死亡預測概率(P<0.01)(見圖1B)。

2.3 支持向量機模型與傳統logistic回歸模型的準確性比較 在訓練集中,支持向量機模型的ROC曲線下面積高于logistic回歸模型,但差異無統計學意義(0.97 vs 0.95,P>0.05)。類似的,在驗證集中,支持向量機的ROC曲線下面積顯著高于logistic回歸模型(0.98 vs 0.91,P<0.05)。2種模型的預測準確性均在95%~97%之間,但支持向量機模型的敏感性(訓練集68.57% vs 62.86%,驗證集79.78% vs 77.78%)和陽性預測值(訓練集80.00% vs 65.75%,驗證集83.33% vs 77.13%%)優于傳統logistic回歸模型,提示支持向量機模型能夠更準確的識別出死亡高風險人群(見表2、圖2)。

表2 支持向量機模型與logisitc回歸模型的ROC曲線的參數
利用人工智能技術和機器學習算法對既往醫療數據進行挖掘、學習,并建立預測模型是近年來智慧醫療領域的研究熱點。本研究基于既往腹部手術病人的臨床數據,通過機器學習算法中的支持向量機模型,建立了腹部病人術后28 d死亡風險的預測分類器。這一模型無論是在訓練集和驗證集均取得了良好的工作性能,ROC曲線下面積分別達到0.97和0.98,優于傳統logistic模型的預測效果。
支持向量機的雛形是Vapnik和他的AT&T Bell實驗小組在20世紀90年代中期提出。該算法以得到現有信息下的最優解為目標,采用結構風險最小化準則設計學習機器,并在建模過程中通過調節向量機模型的核函數及誤差懲罰參數尋求最優的向量機性能[16]。由于支持向量機可將非線性問題變換轉換到高維的特征空間的線性約束條件下的凸二次規劃問題,因此理論上可以得到全局最優解,這一特性解決了神經網絡方法中的“局部極值問題”,且巧妙的避免了“維數災難”問題。不僅如此,支持向量機折衷考慮了經驗風險和置信范圍,具有較強的推廣性。
支持向量機模型較好地解決了人工智能算法中的非線性、高維數、局部極小點等問題[17-18]。正因如此,支持向量機越來越多的被運用于醫學領域。一項發表于國外的研究[19]顯示,基于免疫組織化學的特征的支持向量機模型能夠準確預測胃癌術后病人的總生存時間和無病生存時間。不僅如此,另一項基于生信分析的支持向量機模型[20]顯示,富集于內質網(如SSR3)、AMPK信號通路(如CREB1)和泛素介導的蛋白質水解(如FBXO2、CUL7和UBE2D3)等信號通路的分子,能夠準確地區分轉移性和非轉移性結直腸癌,并作為轉移性大腸癌預后的生物標志物。我們的研究使用腹部術前病人一般情況、術前訪視、實驗室檢查等指標作為建模變量,準確的預測了病人術后28 d死亡風險的預后,拓展了支持向量機的應用領域。機器學習中的支持向量機模型能夠準確預測腹部手術病人28 d死亡風險,其工作性能強于傳統的logistic回歸模型。
本研究有一定的局限性。首先,本研究為單中心研究,研究的結論是否適用于其他中心仍需在其他中心的數據中進行驗證。其次,本研究為回顧性研究,部位病人因臨床數據缺失未被納入建模,因此有選擇性偏倚的風險。再次,本研究中納入的建模變量是查閱文獻和專家討論后確定,但仍有可能存在對死亡時間有預測作用,卻沒有參與建模的臨床變量存在。因此,模型的預測準確性可能因一些測量變量未被納入而降低。