徐寒瑩,徐鵬,張影,張冬梅,崔雅斌,王健**
(1. 長春中醫藥大學中醫學院 長春 130117;2. 長春中醫藥大學附屬醫院腦病中心 長春 130021)
卒中作為一種急性腦血管病,具有高發病率、高復發率、高致殘率、高死亡率的特點。在中國,卒中是造成我國成年人致死、致殘的主要原因。據統計我國卒中的死亡率是歐美國家的4-5倍,甚至遠高于日本、印度等鄰近的亞洲國家[1]。2017年我國有約196 萬人死于腦卒中,首次卒中后1年內復發率高達17.1%[2]。卒中反復發作可加劇神經功能缺損癥狀及并發癥,使治療更具難度。復發卒中是卒中患者死亡風險加倍的獨立因素,同樣也是我國殘疾調整生命年(Disability-adjusted life years,DALY)水平居高不下的重要原因[3,4]。一項薈萃分析表明,卒中復發的累計風險在首次卒中后30天、1年、5年、10年時分別為3.1%、11.1%、26.4%、39.2%[5]。因此,建立科學精準的風險評估工具,盡早識別卒中復發風險因素對于快速調整可控因素,在卒中復發的防控過程中具有重要意義。早在20 世紀90年代,國外學者已著手建立簡易評估工具用于卒中的二級預防風險評估,并在推廣應用過程中不斷改良,現已形成較為成熟的卒中復發風險評估體系。近年來,我國諸多研究團隊也聚焦于卒中復發風險評估工具的研究,致力于創建適合國人的復發風險預測工具為卒中二級預防提供保障。本文即對我國現階段卒中復發風險預測工具的開發與應用進行概述。
目前對于復發風險預測工具的構建手段主要劃分為2 類,即傳統建模方法和機器學習算法。傳統建模方式是根據單因素、多因素回歸分析疾病的復發概率,建立數學公式以實現預測,此類方法應用廣泛,操作簡便。機器學習算法得益于計算機技術的快速發展,是人工智能的重要分支,是近年來國內外研究者勇于嘗試的新興技術。下文即圍繞2類建模手段展開詳細論述。
風險預測模型的實質是探求研究因素與疾病產生的因果關系及關系的強弱程度。疾病的產生可為單因素獨立作用或多因素聯合作用的結果。回歸分析以數據為基礎,通過數學模型形式表現因果關系,也是風險預測的常用統計方法。目前,較為經典的風險預測建模方法主要為Cox 比例風險回歸和Logistic回歸分析。Logictic 回歸模型主要探討事件概率與自變量的關系。Cox 回歸模型以生存結局和生存時間為因變量,可同時分析多因素對生存時間的影響。安雅臣等[6]構建了可預測3年內復發風險的Cox 回歸模型及個體預后指數方程,結果顯示AUC 值為0.817,并計算約登指數最大值為0.483,確定其對應的預后指數(1.248)作為截斷點(即最佳陽性判別點),即預后指數≥1.248時3年內復發的可能性大。于瑩等[7]建立了缺血性卒中患者阿司匹林治療后復發風險的Logistic回歸模型,AUC值為0.7529,預測準確率為71.36%,提示模型具有較好的預測性能。
伴隨科技的迅猛發展,人工智能(Artificial Intelligence,AI)得以快速崛起。機器學習(Machine Learning,ML)作為AI 的前沿研究領域和重要分支同樣取得了突破性的進展。ML 是計算機通過反復的“訓練”(模型學習)數據內規律性的信息,從而獲得新的經驗和知識,不斷優化自身性能的新方法。ML 的基礎在于數據樣本,關鍵環節在于模型訓練,數據體量的擴充和較好的數據質量可以提升模型的品質,這樣的特質也使得ML 在大數據的分析與處理等方面具有顯著優勢。近年來,ML 與醫療、公共衛生事業的聯系日趨密切,由ML 衍生出的各類新型算法在臨床數據的挖掘、疾病預測、診斷和治療等方面發揮著不容忽視的作用,是實現未來智慧醫療的核心技術,為形成科學化醫療決策提供有力支持。研究者們也將ML應用于卒中的風險預測,常見類型包括決策樹模型、人工神經網絡模型、支持向量機模型(Support vector machines,SVM)等。劉澤文等[8]對657 名卒中患者(按9:1比例劃分訓練集與測試集)建立支持向量機模型以預測5年卒中復發風險,結果顯示模型AUC 值為0.836。潘思行等[9]基于神經網絡與支持向量機建立了客觀化舌象和形體特征的輔助中醫體質識別模型,結果顯示融合了舌象和形體特征的2種機器學習模型一定程度上可提高中醫體質辨識的準確性。由此可見,機器學習算法在中醫藥領域有較好的應用價值,為日后建立具有中醫特色的卒中風險預測工具提供技術保障。
傳統的復發預測工具通過納入患者入院時的信息與指標進行模擬整合與風險分層,進而評估復發風險,未能考慮基線及隨訪期間風險因素的變化,在預測精確度上略顯不足。ML 可通過數據集快速、準確的識別風險因素,并可應對數量大、高維度、非結構性的復雜數據。相較于傳統預測模型,ML 可靈活處理數據缺失值,挖掘潛在風險因素,有較強的的抗干擾能力,可進一步提高了預測模型的準確率。陳思玎等[10]對10645 名缺血性卒中患者分別構建了機器學習模型XGBoost和Logistic回歸模型對患者卒中后3個月死亡結局展開預測,兩者AUC 分別為0.8539、0.8278,前者顯示出較好的預測效能,與此同時,在運算時間成本和預測精準度等方面也更具優勢。譚英等[11]對589 名缺血性卒中患者分別構建了BP 神經網絡模型和Logistic 回歸模型進行復發風險預測,兩者AUC 值分別為0.787、0.729,提示前者的預測效能更佳。ML在近年來獲得了巨大發展,并逐漸參與卒中決策制定過程。卒中病因的復雜性及ML 對大數據的良好處理能力使得研究者們對運用ML 進行卒中的風險預測產生興趣,但結合目前國內外的研究現狀、相關文獻發表數量、文獻質量評價結果可知,現階段國內外研究者構建的卒中預測模型仍多應用傳統建模方法,ML在疾病預測領域的發展仍處于初級階段,尚未實現廣泛推廣,目前多數研究僅采用內部驗證方法,鮮少經過外部驗證,而針對于ML 的超參數情況的調整流程也尚未形成標準化的指南或程序報告[12,13]。由此可見,在AL 背景下衍生的新型建模方式仍需要研究者們進一步探索與挖掘,在未來可更好的應用于卒中風險預測的實踐中。
卒中復發風險預測工具是早期識別卒中復發高危人群、明確預防重點的有效措施。我國目前應用的復發預測工具均為國外研究團隊所建立,但此類工具并不完全適用于在中國人群。近年來,國內研究者也致力于對傳統預測工具的改良與創新,使其更好的適用于國內人群,下文即簡要介紹我國對國內外卒中復發預測工具的應用現狀。
國外學者對于復發預測工具的研究與開發早于國內。《中國缺血性腦卒中風險評估量表使用專家共識2016》中推薦使用ABCD2 評分或ABCD3-I 評分對短暫性腦缺血發作(TIA)患者進行卒中風險評估,應用Essen 量表(ESRS)或卒中預測工具-Ⅱ(SPI-Ⅱ)評估缺血性卒中患者長期復發風險[14],而以上工具均為西方國家以歐美人群為研究目標所構建。ABCD 評分系統主要用于TIA 后的卒中風險評估,通過不斷完善風險參數實現階段性衍化。ABCD2 因操作便捷且對接診醫師無神經專科知識要求等特點,在臨床上使用更為廣泛。美國心臟協會(AHA)指南建議使用ABCD2 對TIA 后短期復發的高危人群進行風險識別。ABCD3-I 在ABCD2 的基礎上增加了DWI 和頸動脈成像2 個指標,因此預測效果更佳[15]。ESRS 的建立基于阿司匹林與氯吡格雷比較用于缺血事件高危患者試驗(CAPRIE)[16],可以合理預測卒中及心血管事件復發的長期風險,并在歐美人群中進行了效度驗證[15,17]。ERSR 中缺少反映顱內血管狹窄程度的預測指標,而國內缺血性卒中患者的顱內血管狹窄和大動脈粥樣硬化更為多見,因此ERSR 在我國的預測效能低于歐美國家。孟霞等[18]研究表明,ESRS 對大卒中復發/聯合血管事件的預測效能最高,其次是小卒中,對TIA的預測效能最低。SPI-Ⅱ與ESRS 在中國人群中對卒中復發的風險預測能力基本一致[19]。近年來,國內學者將以上工具在中國人群中進行驗證及橫向比較,結果顯示在中國人群中的預測效能尚有不足。
我國對于卒中風險預測工具的建設與開發起步較晚。且相較于初發預測工具,對復發預測工具的研究尤為薄弱,然而因卒中復發引起高致殘率、死亡率不容忽視。近年來隨著對于卒中復發危險因素的不斷深入探索,國內研究者逐步開展了一系列科學研究,構建風險預測模型,應用于卒中復發高危人群的早期識別與防控。
2.2.1 基于經典預測模型優化的卒中復發風險預測工具
卒中二級預防對于降低卒中復發風險、致殘率、致死率有重要意義。復發風險預測工具可盡早識別風險因素,提高醫生與患者的防范意識,強化二級預防效果。目前國內的復發預測工具多基于小樣本量、隨訪時間較短、地域局限的研究,建模方法相對傳統,未能在大范圍內得以推廣。許多學者以國外經典復發模型為基礎,結合國內卒中流行病特征進行改良,并在小范圍內得以驗證。Ling 等[20]選取高血壓病史>15年、糖尿病史>10年、缺血性卒中或TIA 既往史、大動脈粥樣硬化亞型作為危險因素,構建了改良ESRS評分,并應用改良ESRS 與原始ESRS 分別對773 名缺血性卒中患者進行評估,結果顯示兩者AUC 值分別為0.70、0.58,改良ESRS 顯示出較好的預測效能且在靈敏度與特異性等方面也優于原始ESRS。此外,將現有復發預測工具聯合新的亞臨床指標在一定程度上也可提高預測效能,研究者們也積極尋找更有利的獨立復發預測因子。魏衡等[21]研究表明超敏-C 反應蛋白與ABCD2 評分聯合能提高對腦梗死的預測價值。Liu等[22]研究發現,miR-122rs17669基因型是卒中復發風險的重要預測因子,攜帶rs17669 多態性CC 基因型的患者與TT/CT 基因型相比,缺血性卒中復發風險增加88%。李菁晶等[23]研究發現DWI 所示多發皮層、皮層下和(或)深部白質病變、多發顱內外動脈狹窄可能是小卒中1年后卒中復發的獨立預測因子。
2.2.2 基于中醫理論開發的卒中復發風險預測工具
中醫“治未病”理論中未病先防、既病防變、病后防復的內容與現代醫學倡導的三級預防理念聯系密切。目前國內所建立的中醫相關卒中復發預測工具主要圍繞中醫證候要素和中醫體質辨識兩個角度展開。證候是中醫學理論研究的核心內容,是對患者生理、病理狀態的概括,其外在表現為具象的癥狀、體征。體質是在先天與后天共同作用下形成的形態結構、生理功能與心理狀態方面長期的、相對穩定的固有特質[24]。體質影響著疾病的易感程度與轉歸。《中醫體質分類與判定》行業標準的頒布及《中醫體質量表》的制定,為中醫體質辨識及基于體質的疾病預防和管理提供了有效依據,數據挖掘技術的快速發展也為研究者建立中醫特色相關的風險預測模型提供了重要技術支撐。張靜等[25]對1780 例復發缺血性中風患者進行Logistic 回歸分析后發現風痰阻絡、氣虛血瘀、痰熱腑實、痰蒙清竅、痰熱內閉證候類型表現可能是缺血性中風復發的危險因素,缺血性中風復發人群顯示出特定的中醫證候特征。王桂倩等[26]融合常規復發風險因素與體質信息建立了基于體質的缺血性中風復發風險模型,并與西醫危險因素的復發風險模型進行對比,兩者AUC 值分別為0.766、0.718,前者顯示出較好的預測效能。我國現階段對于中醫特色相關的復發預測工具研究較為匱乏,應充分發揮中醫藥優勢與專長,將現代風險因素與中醫證候要素、患者體質狀態相結合,構建具有中醫特色的復發風險預測工具,同時開展中醫健康教育,推廣中醫特色康復診療技術,使中醫藥在卒中疾病全周期發揮作用。
本文應用對比的方式針對我國現階段卒中復發預測工具的開發技術與國內外預測工具的應用現狀分別展開分析,對于現下應用的主要建模方式進行分類概述,并從建模原理、數據處理、模型效能、精準度、發展現狀等角度將傳統建模方法與機器學習模型進行對比,展開詳細論述。通過本研究可知,我國目前對于卒中復發預測工具的研究仍處于初級階段,所應用的卒中復發預測工具多為發達國家建立,而此類模型在國內人群中預測效果存在局限,因此構建適合國人的復發預測工具是未來卒中預警與防控領域研究的重難點。
本文通過分析我國現階段的風險預測現狀,總結得出3個目前我國卒中風險預測研究領域面臨的瓶頸問題并提出建議:
3.2.1 加強國外模型在國內人群的適應性與預測能力
國內研究者根據我國卒中流行病學特征,在經典模型基礎上加入新型預測參數以增強模型的預測效能,但此類工具的開發多基于小樣本量、小范圍、隨訪時間短的隊列研究,且以回顧性的病歷資料研究居多,前瞻性研究較少,多數研究無法代表大范圍內卒中患者復發的整體特征,因此亟需構建基于大型臨床研究,符合中國人群卒中流行特征的復發預測工具,更好的指導臨床實踐。
3.2.2 溯源與挖掘傳統中醫理論中蘊含的“治未病”思想構建中醫特色風險預測工具
中醫“治未病”思想在慢性病防控管理方面具有豐富的理論與實踐經驗,《中國防治慢性病中長期規劃(2017-2025)》中明確提出要發揮中醫藥在慢性病防治中的優勢與作用。但目前以“證候特征”“體質辨識”為核心的中醫健康狀態辨識體系在卒中、冠心病等慢性病的風險評估能力與預測精確程度仍有待提高,缺少高級別循證證據,尚未形成完備的卒中防控與評價體系,這也使得具有中醫特色的卒中發病、復發防控服務模式的推廣進程緩慢,難以落地。對于中醫特色風險評估工具未來的建設與發展,需依托大規模人群流調、回顧性研究、隊列研究、隨機對照研究,建立在以“證候”為核心的卒中風險識別技術的基礎上,并可逐步開展中醫相關的卒中防控干預技術與推廣模式評價研究,形成標準化指南,建設中醫防控示范基地,構建中醫卒中發病與復發預警防治體系。
3.2.3 推動新型建模技術及數據處理手段與卒中復發風險預測相融合
準確性與科學性是評價預測工具優劣程度的重要指標。充足樣本數量、風險因素細化程度、科學的建模方法是提高預測工具準確性與科學性的重要手段。近年來,國內研究團隊對于機器學習算法的大膽的應用與嘗試也使得新型建模技術在我國卒中風險預測領域獲得了巨大發展。目前,各級醫院的醫療數據存儲水平參差不齊,多樣的數據形式使得增加了數據共享的難度。在未來的研究過程中,可引入混雜處理、因果推斷、縱向數據處理及分析(重復測量方差分析、分層模型、廣義線性模型、混合效應模型、生存分析等)、高維數據分析(稀疏約束、分組最小角回歸算法等)及合成分析等方法以適應大數據時代大體量、復雜醫療數據資料的特點,為建立個體精準化卒中風險預測模型提供技術保障,形成科學、實用的卒中二級預防決策提供可靠依據。
我國人口占世界人口總量的1/5,是世界范圍內卒中負擔最重的國家。近年來我國社會經濟快速發展,我國卒中危險因素流行特征上雖與發達國家有相似之處,但仍具相對獨立性。與西方發達國家相比,中國人群的顱內動脈硬化疾病更多,不同程度的顱內動脈硬化及狹窄也會增加卒中的復發率[27]。此外,我國作為一個人口龐大、幅員遼闊的多民族國家,卒中風險因民族、南北地域、城鄉、收入水平不同而具有顯著差異。研究表明,我國卒中患病率最高與最低省區之間差異可超過8 倍[28]。與發達國家不同,我國的國民收入水平多以中等收入為主,而收入水平很可能是影響卒中復發的一個更重要指標[29]。我國目前應用的預測工具均建立在發達國家開展的長期、大規模研究為基礎,并不完全適用于中國人群。在日后的發展中,研究者們應著手運用科學合理的建模技術,融合更高級的循證證據以建立適合國人的卒中復發風險預測工具,同時充分發揮中醫藥在人體狀態中的評估預警作用,進一步完善卒中防控體系,保障卒中風險篩查工作有序高效運行,以便于實行精準、有效的卒中二級預防,從而進一步遏制卒中的流行上升趨勢。