宋文華 謝家偉 劉彤
遺傳性心律失常主要包括先天性長QT 綜合征(long QT syndrome,LQTS)、Brugada 綜合征(Brugada syndrome,BrS)、兒茶酚胺敏感性多形性室速(catecholaminergic polymorphic ventricular tachycardia,CPVT)等。年輕患者的心臟性猝死往往是相關疾病家系中唯一的臨床現象,而采用當前基因分析方法進行的基因檢測只能提示潛在的致病性變異或意義不明的變異。遺傳性心律失常猝死風險極高,因此早期診斷和實施干預對改善患者臨床預后至關重要。機器學習是人工智能最重要的研究領域之一,其重要性主要體現在能夠從數據中學習,進而建立計算模型,特別是實現樣本分類[1]。近年來隨著大量數據源的出現、全球數字化和數據測量及收集技術的發展,人工智能的應用范圍越來越廣泛[2]。隨著運算速度的提升和醫療數據量的增長,人工智能技術正逐漸運用于醫療行業,其中人工智能心電圖對遺傳性心律失常的診治助益尤多[3-4]。計算機可以應用程序算法模仿心臟科醫生解讀心電圖[5-7],例如:確定心率、每一次QRS 前識別P波,以及識別病理性心電圖波形變化[8]。總之,人工智能心電圖不同于傳統的醫療檢查手段,該技術自動化讀取心電圖相關變量及波形,通過機器學習編程,計算結果能精準、客觀地預測患者的不良臨床預后。
心電圖的QT 間期代表心肌細胞動作電位的持續時間。LQTS 是一種原發性心電紊亂,患者易因惡性室性心律失常而發生心臟性猝死[9]。LQTS 病因與先天性離子通道突變和后天因素(如藥物應用等)相關。LQTS 的心電圖特征是QT 間期≥450 ms。GIUDICESSI 等[10]開發和驗證了一種確定QTc 的人工智能12 導聯心電算法。他們首先利用538 200例患者的160 萬份12 導聯心電圖建立了一個深度神經網絡(deep neural networks,DNN),并以心臟科醫生反復測量的QTc 值作為金標準;隨后對686 例遺傳性心律失?;颊哌M行了前瞻性驗證,結果發現DNN 可以準確預測患者標準12 導聯心電圖的QTc。因此,應用人工智能設備預測QTc 或成為LQTS 經濟有效的篩查手段[11]。另一項研究通過開發自然語言處理器測量QT 間期,與傳統的心電圖機相比,該處理器能更高效地識別QT 間期延長[12]。
LQTS 由復極電流減少或去極電流增加所致,目前已知有13 個遺傳亞型。不同類型的K+通道功能缺失突變可導致1 型(KCNQ1)、2 型(KCNH2)、5型(KCNE1)、6 型(KCNE2)、7 型(KCNJ2)和13 型(KCNJ5)LQTS。Na+通道功能的增益突變導致LQTS 3 型(SCN5A)和10 型(SCN4B),L 型Ca2+通道突變導致LQT 8 型(CACNA1C,Timothy 綜合征)。蛋白突變導致LQT 4 型(ANKB)、9 型(CAV3)、11 型(AKAP9)和12 型(SNTA1)。此外,長QT 間期與癲癇猝死有關,這種猝死由神經元型Na+通道亞型介導的晚期Na+電流增加引起[13-14]。
TSE 等[15]在一項關于先天性LQTS 的研究中,應用了隨機生存森林(random survival forest,RSF)算法。研究者引入用于生長樹的新生存分裂規則,以及用于估算缺失數據的新算法。該研究納入了1997—2019 年先天性LQTS 確診患者的臨床資料,探究該隊列中室性心律失常的重要危險因素,同時比較了傳統Cox 回歸與RSF 算法的效能。該研究中,利用RSF 算法構建了數百棵樹,以兩種形式建立隨機化:一是引導數據集,二是預測器上的節點分裂。
與Cox 比例風險模型相比,RSF 算法顯示出明顯優勢[15]。該算法不僅對個體風險函數進行假設,而且對自發性室速、心室顫動(室顫)預測因子的重要性進行排序,顯著提高了運算精確度。傳統的Cox 或Kaplan Meier 方法基于屬性的線性組合進行分析,而RSF 算法的優勢在于可以處理干預措施和預測變量的影響。研究發現,除了預測接受心臟再同步化治療的心力衰竭患者的死亡率外,RSF 算法還可改善對心力衰竭的全因死亡率、心力衰竭相關住院事件及費用的預測。此外,該模型成功預測了重癥監護室內心臟驟?;颊叩淖≡核劳雎?以及獲得性LQTS 患者的全因死亡率。該研究首次證明RSF 算法模型對先天性LQT 的室速或室顫的預測價值更大。
21 世紀初,CHEN 等[16]發現BrS 患者有一條等位基因上攜帶SCN5A突變基因;隨后從分子水平證明BrS 為離子通道結構缺陷病,屬于常染色體顯性遺傳病。各國學者隨后又發現了數十種不同位點及類型的相關基因突變,包括GPD1-L、SCN3b、CACNA1C、CACNBβ2b、KCNE3 和KCNH2 等。
BrS 是一種室速、室顫和心臟性猝死風險較高的心臟疾病。心電圖和電生理檢查等侵入性檢查結合臨床癥狀評估,可用于該病的風險分層,但難以發揮預測作用,特別是對無癥狀患者。既往研究中,心電圖相關數據大部分由人工測量,存在不可避免的主觀偏差。盡管自動化測量尚未用于BrS 的風險預測,但可能會提供人工測量難以獲取的信息。
TSE 等[17]在探究BrS 相關預測因素的研究中,回顧性分析了2000—2018 年在同一家三級醫院就診的BrS 患者資料,通過機器自動提取與P、Q、R、S、T 波相關的參數,包括12 導聯的心電向量值、電軸、波幅和持續時間等;主要終點是隨訪期間出現的自發性室速和(或)室顫事件。研究者們首先通過Cox 回歸確定對主要終點有顯著預測作用的心電圖變量,然后生成了一個基于決策樹學習方法的簡單算法,即風險分層評分系統[17]。結果顯示,與去極化和復極相關的自動心電圖測量有助于BrS 患者的危險分層[17]。
另一項中國香港學者開展的隊列研究同樣應用Cox 回歸確定BrS 的顯著風險預測因素[18],通過非負矩陣分解分析變量之間的非線性關系,并將其納入RSF 模型。RSF 的優點是能夠捕捉變量之間的非線性效應和復雜交互作用,從而減小預測方差和偏差,提高心電圖指標對心臟驟停事件和BrS 室性心律失常事件的預測效能。綜上所述,機器學習技術降低了人為因素和主觀偏差的干擾,顯著提高了BrS 的總體風險分層效能。
根據致病基因的不同,目前臨床上將CPVT 分為CPVT1 和CPVT2 兩類。CPVT1 是常染色體顯性遺傳,由心肌細胞蘭尼堿受體(RyR2)基因突變引起,存在于約一半的先證者中。CPVT2 是常染色體隱性遺傳,較CPVT1 少見,與心肌細胞儲鈣蛋白(CASQ2)基因突變有關,占1%~2%。60%左右的CPVT 患者中可檢出RyR2 或CASQ2 基因突變。
JUHOLA 等[19]提出將誘導多能干細胞來源的心肌細胞(induced pluripotent stem cell-derived cardiomyocytes,iPSC-CMs)作為遺傳性心臟病的診斷工具之一,可用于有心臟性猝死家族史或具有非特異性臨床特征患者的診斷。誘導多能干細胞構造的人類心臟疾病模型既能用于研究疾病的病理生理學和治療方法,也可以用于診斷。該模型能夠檢測細胞的鈣信號,并利用機器學習方法通過鈣瞬變圖譜來檢測潛在的遺傳性心臟病。鈣瞬變的異常在許多心臟疾病模型中都很明顯。既往研究表明,健康心肌細胞對應的正常鈣瞬變與病態心肌細胞對應的異常瞬變之間存在差異。該研究旨在利用機器學習方法并依據鈣瞬變來區分不同的遺傳性心臟病(CPVT、LQTS、肥厚型心肌病)。經驗證,這3種疾病的分類準確率高達87%,表明異常鈣瞬變在心臟疾病鑒別診斷中具有較高特異性;再將健康對照納入分類,獲得的最佳分類準確率仍然很高(約79%)。因此,機器學習方法是一種對iPSC-CMs 進行準確分類的有力手段,并且有望成為遺傳性心臟病的有效診斷方法。研究者們也提到,隨著未來更便捷、更先進方法的涌現,如將血細胞直接分化為心肌細胞,遺傳性心臟病的診斷工具將更加豐富[20-22]。
機器學習是一種可以從數據中學習復雜模式的計算機算法,具有極大的醫學應用潛力。隨著臨床記錄、可穿戴設備和傳感器數據、藥物清單、影像資料的累積,醫學的復雜性現在已經超出了人類思維水平所能處理的范疇。在臨床工作中,對各類數據的認識和理解、技能和實踐操作均可能因人而異;而機器學習算法經過科學的設計、驗證和實施,將有助于從不同角度整合與分析醫療數據,并將其完整呈現在臨床醫生面前,為制定個性化的臨床診療方案提供幫助。目前,已經開發了數種可用于預測常見基因變異并分析其致病性的工具,但相關機器學習工具還不夠精確,有時甚至忽略了目標基因與疾病關系的某些重要參數。因此,還需要更多的高質量研究,進一步探索人工智能心電圖在遺傳性心律失常診斷中的應用。