童 睿 闞麗虹 朱中生
(上海市浦東醫院-復旦大學附屬浦東醫院心內科 上海 201399)
心力衰竭是導致老年人住院的常見原因,具有極高的病死率和致殘率。由于患者臨床狀況千差萬別,不同研究報道的急性心力衰竭住院患者1年內病死率從20%到60%不等[1-3],及時根據患者臨床狀況對患者預后進行判斷有助于對高?;颊邔嵤┎煌瑥姸鹊膫€體化干預,改善臨床結局。針對心力衰竭預后的預測模型,目前比較著名的有西雅圖心 力 衰 竭 模 型(Seattle heart failure model,SHFM)[4]、心 衰 生 存 評 分(heart failure survival score,HFSS)[5]等。但是,盡管這些模型的表現在人群層面上尚可接受,其對個體的預測并不可靠[6-7];此外,這些模型建模數據均來自西方發達國家,其在亞洲人群、發展中國家的適用性仍待驗證。
目前國內對于心力衰竭預后模型的構建主要基于前瞻性的隊列研究[8-9],通過多因素回歸分析繪制列線圖進行危險分層,這種方式對隨訪數據要求較高,且由于納入標準的限制,研究樣本量有限,樣本分布與真實臨床場景下數據特征的分布存在偏倚,外部數據驗證效果往往欠佳。隨著電子病歷系統的推廣,各醫療機構積累了大量真實世界臨床數據,但傳統統計學方法難以對這種結構混雜、特征高維、缺失值多的數據集進行有效處理。近年來,由于能從海量的非線性的、存在干擾的真實世界醫學數據中提取隱匿而有價值的信息,機器學習算法越來越受到關注。利用國外的公共數據庫和多中心電子病歷系統回顧性資料,一些研究者嘗試將LASSO回歸、隨機森林、XGBoost等機器學習方法引入心衰預后建模和能有效預測心衰預后的臨床特征探索挖掘中,提供了寶貴的真實世界臨床證據[10-11]?!?br>