沈文茜 杜國慶
(哈爾濱醫科大學附屬第二醫院超聲醫學科,黑龍江 哈爾濱 150086)
由于超聲心動圖是唯一允許對心臟實時和動態觀察,即刻檢測出心臟各種異常的成像方式,所以在心血管疾病的診斷和治療中起著至關重要的作用[1]。心臟結構和功能的準確定量評估是臨床診斷和制定合理治療方案的基礎,但基于主觀評價的二維超聲心動圖的定量和診斷容易出錯,主要問題是操作者的手法以及對超聲心動圖的解讀,操作者之間存在相當大的差異,尤其對于質量較差的圖像[2]。盡管人工智能20世紀50年代就已出現,但直到最近,人們才對人工智能在醫學成像中的應用產生濃厚的興趣和研究,機器學習(machine learning,ML)是人工智能的一個子領域,ML模型可通過對海量超聲心動圖圖像的回顧來“學習”圖像中不同的特征代表什么,然后來識別新的圖像,量化感興趣區域或識別特定疾病模式等[3]。在ML模型的輔助診斷下,可減少操作者之間和操作者內部的差異,從而提高診斷的準確性,并提供額外的人眼無法察覺的信息[4]。因此,ML模型有望成為快速和準確地評估心血管結構和功能的工具。現對ML在超聲心動圖中的應用進展做一綜述。
ML是一門以數學和計算機科學為基礎的廣泛學科,它可通過復雜的計算和統計算法“教會”計算機快速、準確和高效地分析大量數據,這些算法從現有的數據集中推斷關系,并了解其中哪些關系具有最高的預測能力。利用這些知識ML模型就能對新的數據進行預測。ML可分為監督學習、非監督學習、半監督學習、增強學習及深度學習[5]。(1)監督學習:在監督學習中,輸入數據被稱為“訓練數據”,每組訓練數據有一個明確的標識或結果,在建立預測模型時,監督式學習建立一個學習過程,將預測結果與“訓練數據”的實際結果進行比較,不斷地調整預測模型,直到模型的預測結果達到一個預期的準確率。分類和回歸是監督學習的兩種類型。(2)非監督學習:在非監督學習中,數據并不被特別標識,學習模型試圖找出輸入數據之間的相似性,并根據這些相似性對數據進行分類,也被稱為密度估計。非監督學習包含有聚類。(3)半監督學習:半監督學習介于非監督學習(未標記數據)和監督學習(標記數據)之間。在此學習方式下,輸入數據部分被標識,部分未被標識,這種學習模型可用來進行預測,但模型首先需學習數據的內在結構以便合理地組織數據來進行預測。(4)強化學習:在這種學習模式中,當答案錯誤時,算法會被告知,但不會告知如何糾正它,它必須探索和測試各種可能性,直到找到正確的答案。強化學習不同于監督學習,因為它不提供精確的輸入和輸出集,也不提供精確的次優操作。(5)深度學習:深度學習是一種人工神經網絡,能使用卷積神經網絡等技術處理更大和更復雜的數據集。深度學習可以是有監督、無監督或半監督[6]。
雖然ML模型具有快速地分析大量數據的潛力,但它們本身需大量數據來確保它們得到充分的訓練。在醫療領域,需付出巨大的努力以確保數據的充足、質量以及準確性,然后才能用來訓練模型。此外,更重要的是要確保這些用于模型訓練的數據集能代表總體,因為抽樣偏差和數據的缺失會對模型的預測能力產生負面影響[7]。目前ML已被應用到醫學成像領域的各種技術中,例如CT冠狀動脈造影中的鈣化評分[8]、輔助放射科醫生對乳腺病變的檢測[9]以及皮膚病學中的皮膚癌分類[10]。
指南建議超聲心動圖通過對心臟腔室和瓣膜的定量測量來指導臨床決策[11],然而,定量分析操作復雜,有時還需大量的時間來進行手動描記,在繁忙的臨床環境中這是不可能實現的[12]。所以視覺定性評估仍在臨床實踐中占主要地位,這就需操作者具備大量的圖像采集和超聲心動圖解讀經驗,而低年資超聲專業醫師往往不具備這樣的能力。在急診科,超聲檢查變得越來越普遍,而對于未經正式訓練的內科醫生,操作規范和圖像解讀都非常難[13]。應用ML來完成對量化的需求,為臨床醫生提供快速的全自動測量,可提高診斷的準確性[14]。
隨著三維超聲心動圖等多維成像方法的出現,超聲心動圖中獲得的數據量逐漸增加[15],獲得的大部分數據未得到充分利用。ML技術就具有同時從超聲心動圖中提取多個數據集的潛力,通過ML模型這些數據集可以高效和自動化的方式進行解讀[6]。此外,ML模型能將現有的電子健康記錄中的臨床數據與超聲心動圖數據聯系起來,為臨床醫生提供更多的信息,以便更好地服務于患者[16]。
雖然ML在超聲心動圖中的應用還處于相對早期的階段,但已應用在超聲心動圖的很多方面,包括圖像識別、心功能的自動量化、瓣膜疾病的自動評估以及鑒別超聲征象相似的疾病。
超聲心動圖實現全自動心功能評估的最重要步驟之一就是圖像識別,標準圖像的自動分類是預處理階段的關鍵,也為后續全自動分析提供基礎?;跁r空特征提取的多節段分類算法和監督學習法,實現了自動識別并分類超聲心動圖中的心尖兩腔心、心尖四腔心和胸骨旁長軸切面,正確率分別為97%、91%和97%,平均識別率為95%[17]。研究表明深度卷積神經網絡模型對超聲心動圖心尖四腔心切面進行自動質量評估,通過圖像是否清晰顯示四個腔室,專家人為地將圖像質量定義為0~5分(0分:僅顯示明顯的主動脈瓣和/或僅顯示房間隔或室間隔;1分:顯示一個或兩個腔室的邊界;2分:顯示三個腔室的邊界;3分:顯示三腔或四腔的邊界,但不夠清晰,無法量化所有腔;4分:清晰地顯示三腔或四腔的邊界,可用于量化分析;5分:清晰地顯示四個腔室的邊界,所有心腔均可量化)。最終訓練模型與專家評分的平均絕對誤差為0.71±0.58,并且可推廣到超聲心動圖其他標準切面[18]。另有研究表明:由卷積神經網絡組成的深度學習模型能自動地檢測和識別15個標準視圖(左室長軸切面、右室流出道切面、大動脈短軸切面、二尖瓣口短軸切面、心尖四腔心切面、心尖五腔心切面、心尖兩腔心切面、心尖三腔心切面、劍突下四腔心切面、下腔靜脈長軸切面、劍突下腹主動脈切面、胸骨上窩主動脈弓長軸切面、脈沖波多普勒、連續波多普勒和M型超聲心動圖)的特定特征,而不用考慮圖像分辨率,其準確率為97.8%[19]。圖1是一個卷積神經網絡模型用于超聲心動圖圖像分類的例子。
定量評估左心室的大小和功能是目前超聲心動圖最主要的目的之一。在傳統ML和深度學習之前,形變模型在邊緣檢測、分割、形狀表征和運動跟蹤方面顯示出巨大潛力[20]。研究證明:ML模型可實現測量自動化,增加測量重復性,在專家和初學者之間搭建橋梁,提高檢查效率和簡化工作流程。自動測量心功能是最早實現的應用技術之一,可明顯減少操作者的主觀性,增加測量重復性[21]。隨著技術的進步,基于ML圖像分析的新型全自動軟件實現了快速和可重復地測量左心室容積、射血分數以及雙平面縱向應變[22]。在三維超聲心動圖方面,ML模型可自動測量左心房和左心室體積以及射血分數,自動化測量結果不僅可與人工測量相比擬,還與心臟磁共振具有良好的一致性[15,23-25]。最新研究表明:ML模型可準確地測量三維超聲心動圖中右心室容積和射血分數,重復性較好,如32%的患者實現準確的全自動化分析僅需(15±1) s,且重復性為100%;而其余68%患者還需在自動分析后手動進行調整,平均時間為(114 ± 71) s[26]。

圖1 卷積神經網絡模型示意圖
超聲心動圖是評價瓣膜反流的最常用影像方法。最新指南建議使用半定量和定量超聲心動圖技術來評估瓣膜反流的嚴重程度[27],后者臨床多采用反流緊縮口寬度及近端等速表面積法(proximal isovelocity surface area,PISA)?;诙S超聲心動圖的PISA和半球對稱性幾何假設的內在局限性,三維超聲心動圖的PISA技術已被證明與心臟磁共振有更好的相關性[28]。de Agustín等[29]研究中使用自動化軟件對三維超聲心動圖中二尖瓣PISA進行自動量化。Choi等[30]采用三維全容積彩色多普勒超聲心動圖對主動脈瓣反流容積進行定量分析,結果與心臟磁共振具有很好的正相關,比二維超聲心動圖PISA更能準確地反映主動脈瓣反流的嚴重程度。此外,經食管三維超聲心動圖二尖瓣自動評估軟件實現了比人工判讀更可靠和一致的二尖瓣環大小及其形態的定量評估[31]。
不同的病理狀態可有相似的超聲心動圖表現,如果操作者缺乏臨床經驗將很難進行鑒別診斷。如運動員常出現左心室肥大,但這種超聲征象也會在肥厚型心肌病中出現[32]。一項研究開發了一種集成模型,包括支持向量機、隨機森林和人工神經網絡,可精確地區分這兩種情況,該模型可自動地區別運動員生理性左心室肥大和肥厚型心肌病,校正年齡后,靈敏度為96%[33]。此外,縮窄性心包炎(constrictive pericarditis,CP)與限制型心肌病(restrictive cardiomyopathy,RCM)患者的血流動力學特征相似,使得區分這兩種疾病比較困難。由于CP和RCM的治療方案和臨床結果存在顯著差異,區別二者就具有至關重要的意義。超聲心動圖是診斷CP和RCM的首選影像學方法,一項研究證明ML模型具有準確地區分CP和RCM的患者群體中相似征象的能力,利用多種超聲心動圖特征,ML分類算法能準確地區分二者,準確率為90%[34]。
雖然超聲心動圖是診斷心血管疾病常用且較易操作的成像方式,但在很大程度上依賴于操作者的經驗。ML已被證明可提高超聲心動圖的優勢:不僅使解讀過程重復性更好,準確性更高,并且可大大縮短分析時間。盡管有人擔心,將ML模型整合到醫療環境中可能會取代臨床醫生,但它更有可能成為臨床醫生(尤其是經驗較少的醫生)的輔助工具,使他們能更準確和更快速地進行分析和診斷。雖然ML的使用近幾年來有了很大的進步,但仍處于起步階段,還需進一步的研究來完善。