王妍潔,宋 青,韓 鵬,羅渝昆
1 解放軍醫學院,北京 100853;2 解放軍總醫院第一醫學中心 超聲診斷科,北京 100853
人工智能(artificial intelligence,AI)這一術語最早于1956年提出,旨在利用計算機模擬人腦信息處理過程從而進行科學問題的解決[1]。隨著關鍵數據處理方式的變革、核心建模方式的提出及計算機技術的迅速發展,人工智能技術與醫療(尤其是醫學影像領域)的融合不斷加深,為臨床疾病診治提供了幫助[2-3]。腹部超聲可獲得肝實質及包膜、肝內外血管及膽管情況、實時血流灌注特點等信息,具有便攜、低成本、實時及非電離成像等優勢。作為疾病“前哨兵”,超聲對于肝彌漫性病變程度的評估及異常占位性病變的定位、定性具有很好的診斷效能。人工智能技術,特別是深度學習(deep learning,DL)技術在輔助超聲診斷肝病方面的研究日新月異,本文就人工智能技術輔助超聲診斷肝病變的研究進展進行綜述。
非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)發病率近年來逐漸增高。據統計,非酒精性脂肪肝在我國成年人中的發病率為15%~30%,成為威脅國人健康的第一大慢性肝病[4]。傳統二維超聲對于脂肪肝程度的判定主要依靠觀察者的肉眼判別,征象包括實質回聲細密、遠場回聲衰減、肝腎對比度增加及肝內血管模糊表現等[5]。觀察者間一致性較差。因此,迫切需要一種能夠定量而又無創的方法對脂肪肝的嚴重程度進行分級。Han 等[6]以磁共振質子脂肪密度分數(MRIderived proton density fat fraction,MRI-PDFF)為對照標準,對204 名受試者的射頻數據進行訓練,建立了用于診斷NAFLD 有無的分類器和用于預測MRI-PDFF 的脂肪分數估算器,結果顯示診斷分類器的效能評估均超過90%,預測脂肪分數在整個MRI-PDFF 范圍內的平均偏差為0.8%,證實基于超聲射頻數據進行非酒精性脂肪肝診斷及脂肪分數量化是準確可行的。Byra 等[7]通過對肝圖像進行高層特征提取,建立了基于遷移學習的網絡模型,使用特征和套索回歸方法對照肝活檢以評估脂肪變性程度,其曲線下面積(area under the curve,AUC)達0.977,優于傳統灰度共生矩陣法和肝腎指數法。Cao 等[8]采用包絡信號法、灰度法和深度學習索引法對四分類肝圖像進行后處理和ROI 分析,三種方法區分有無NAFLD 二分類的診斷AUC 值均在0.85 以上,其中深度學習指數AUC 值可達0.933。但該研究缺乏病理或其他影像學標準對照,僅依據3 名醫師主觀判別NAFLD 程度,這或許解釋了其對于鑒別輕、中度NAFLD 效能較差的原因。Chen 等[9]使用基于VGG-16 模型的深度學習算法和基于超聲熵成像的反向散射統計分析,對肝脂肪變性進行分級預測,結果顯示兩者在識別中、重度脂肪肝的AUC差異有統計學意義,后者效能略優于前者,且后者還可提供與微結構有關的物理信息,這為臨床輔助診療提供了一種不同的思路。
近期,有研究提出了一種基于四種不同遷移學習預訓練的組合式深度學習算法,其對肝是否存在NAFLD 的二分類準確性非常高(AUC 達0.999 9)[10]。但目前只做到二分類,且數據樣本僅包含55 名需減重手術的嚴重肥胖患者,輕、中度NAFLD 患者的納入量少,選擇偏倚對模型效能或有影響。
肝纖維化是機體應對多種長期慢性損傷(如慢性乙型肝炎)后產生的累及全肝的免疫性損傷修復反應,其病理改變示纖維組織異常增生,至終末形成假小葉(即肝硬化階段)。“肝炎-肝纖維化-肝硬化-肝癌”四部曲中肝纖維化與肝硬化的治療方案不盡相同,正確區分疾病進展情況有利于指導臨床治療方案的選擇。早期研究使用基于模糊邏輯算法的紋理分析測算超聲圖像中的數字定量特征,從而實現分類輸出[11]。Gao 等[12]使用灰度梯度共生矩陣和灰度共生矩陣對肝二維超聲圖像進行紋理分析,采用多層前饋神經網絡作為分類器,對肝纖維化進行五分類預測,對不同分類的預測正確率均>70%,其中S0 和S4 分類準確率更高達100%,但灰度檢測法受到不同儀器及時間增益補償的影響較大。高永振等[13]利用背向散射回波射頻時間序列分析原理,提取7個特征參數建立分類模型,對正常肝和肝硬化的二分類準確率為87.5%。Acharya 等[14]基于曲波變換方法提取熵特征,利用局部性敏感判別分析,對正常、肝纖維化和肝硬化三分類的預測準確率為97.33%。Cheng 等[15]分析了160 組大鼠肝纖維化超聲射頻數據,采用基于雙向長短期記憶網絡模型定量預測不同分期肝纖維化程度,線性回歸顯示其與病理金標準具有良好的相關性(R2>0.93)。
付甜甜等[16]結合灰階超聲和二維剪切波彈性新技術作為輸入端對圖像數據進行訓練,使用Let-Net-5 深度學習網絡模型對肝纖維化進行二分類和三分類的不同分級預測,其中二分類最好結果可達91.8%。Xue 等[17]基于超聲圖像灰度和彈性模量相結合的遷移學習模型對肝纖維化進行分期預測,二者相結合對肝纖維化各分期(S4、≥ S3 和 ≥S2)的AUC 分別為0.950、0.932 和0.930,性能優于傳統血清學檢測。
趙萬明[18]對321 名慢性乙型肝炎患者的超聲圖像進行分析,篩選了121個影像組學特征對肝纖維化分期進行預測,結果示模型對于早期纖維化的AUC 值可達0.88,證實基于遷移學習和影像組學的網絡模型對肝纖維化具有較好的表征能力。除了對肝整體實質變化情況進行特征提取學習之外,有研究基于手動勾畫高頻超聲圖像肝包膜輪廓模型,對肝硬化進行早期預測[19]。Liu 等[20]進一步提出了區域肝包膜自動檢測及特征分析的網絡模型,最大AUC 值可達0.97。
肝局灶性病變在臨床常見,不同病理類型的病變對應的超聲圖像具有不同的影像學特征。臨床處理良性病變傾向于定期復查,而惡性病變需要盡早進行干預處理[21]。早期區分超聲圖像中肝局灶性病變性質的計算機輔助診斷主要基于灰度紋理,即對病灶內部和周邊對比提取有意義的紋理特征進行分析。Virmani 等[22]提出基于支持向量機的小波紋理描述符用以區分正常肝、肝硬化及HCC 圖像,其檢測正常肝和肝硬化的總分類準確度為88.8%,檢測HCC 病變的敏感度為86.6%。此外,原發性肝細胞肝癌和肝轉移癌的二分類輸出模型,囊腫、血管瘤和惡性腫瘤的三分類輸出模型,以及囊腫、血管瘤、肝細胞肝癌、轉移性癌和正常肝組織的五分類輸出模型,均有嘗試[23-26]。
深度學習基于大量人工神經元網絡分層,對圖像數據進行自動學習和特征提取,因其卓越的性能,近年來被廣泛應用。Schmauch 等[27]使用了50 層殘差神經網絡的深度學習算法,對367 張肝局灶性病變的圖像進行良惡性分類,平均AUC 值約0.935,區分病變的AUC 值約0.916。Xi 等[28]基于596例超聲數據建立的殘差網絡模型,在病變模型的綜合測試精度為0.84,與兩名超聲醫生判定結果相當。一項多中心研究基于2 143例患者的24 343 張二維超聲圖像數據,建立了用于肝局灶性病變良惡性預測的深度卷積網絡模型,其AUC 值可達0.924,模型診斷準確性與超聲造影和增強CT 相當,稍遜于增強MRI[29]。目前多種深度學習模型對肝占位性病變良惡性二分類預測的效能不錯,但尚無與病理學相關的更為詳細的分類預測,而病變的不同病理類型往往對應著不同的治療方案和策略選擇。因此,期待在未來出現更為精細的預測模型。
有研究針對超聲引導下微波消融肝損傷范圍界定問題,利用豬肝消融區域的1 640個反向散射射頻信號建立卷積神經網絡,提出的兩種模型在監測熱損傷方面的AUC 均高于0.85,優于單純二維超聲圖像,且模型評估的消融區域與大體病理圖像有很好的相關性[30]。
大部分肝病已經納入人工智能輔助診斷領域,為臨床診斷工作提供了便利。但超聲與人工智能融合發展仍存在一些問題:1)超聲是應用高頻率聲波作為信息載體,提供圖像灰度信息供操作者進行疾病診斷參考的影像學手段。因其物理學特點,超聲圖像時有各種偽像存在,包括高斑點噪聲、低對比度、模糊邊界、低信噪比和強度不均勻性等,限制了圖像質量[31]。2)與具有標準化切面及掃面間隔的CT/MRI 等成像方式相比,超聲圖像獲取高度依賴于操作者,不同操作者間一致性稍差,不同機器、不同調節模式(如2D 增益、機械指數、時間補償增益等) 的成像結果差異,對于高度依賴輸入圖像質量的人工智能模型來說具有較高挑戰性。3)目前大多研究均基于單中心數據樣本進行建模分析,其模型應用的普適性有待進一步提高。
目前,人工智能輔助超聲病變圖像識別及分類尚處于起步階段,其效能還有待驗證。臨床信息、病史數據的輸入有望與單純圖像信息相互補充,提高模型預測診斷準確率。總之,人工智能與超聲診斷相互融合,對于減輕臨床醫生煩雜的工作量、促進規范化的臨床診療、提高觀察者一致性具有十分重要的意義。