張舒 張蒙 劉雨萌 黃小平 甘建和
肝細胞受到損傷后,損傷區域被細胞外基質或纖維瘢痕組織包裹。如這一損傷修復過程持續反復發生,則纖維瘢痕組織越來越多,逐漸形成肝纖維化和肝硬化[1]。肝組織活檢是診斷肝纖維化和肝硬化的“金標準”,組織學分期劃分為S0~S4(S0為無纖維化;S1為輕度纖維化;S2為中度纖維化;S3為進展期肝纖維化;S4為肝硬化)。根據各評分系統,以S0-1表示無顯著纖維化, Scheuer和METAVIR≥S2或 Ishak≥S3定義為顯著纖維化;Scheuer和 METAVIR≥S3或Ishak≥S4定義為進展期肝纖維化[2]。肝纖維化和早期肝硬化是可逆的,準確地評估和早期干預是延緩甚至逆轉疾病進展的關鍵[3]。然而,肝組織活檢因具有侵襲性、手術并發癥、取樣誤差、觀察者內部和觀察者間的偏倚等原因,在臨床應用中受到限制[4]。常規影像學檢查對于肝纖維化的早期診斷意義不大,現有的無創血清診斷模型在各研究結果中精度不一,磁共振彈性成像和瞬時彈性成像等新技術尚未在各醫院廣泛開展,臨床上亟需更精準、便捷的無創診斷工具。針對肝硬化而言,肝硬化分為代償期肝硬化和失代償期肝硬化,代償期肝硬化患者往往無明顯癥狀,而失代償期肝硬化患者常因并發肝性腦病、食管胃底靜脈曲張、腹水等并發癥而死亡,中位生存期約為2年[5]。全球每年有近200萬人死于肝硬化并發癥,是全球第11大最常見的死亡原因[6],準確、及時評估患者病情有助于臨床管理和降低病死率。近年,人工智能和影像組學技術正成為醫學領域的一股研究熱潮,為疾病的診斷、風險分層、預后預測提供輔助幫助。本文旨在對AI與影像組學在肝纖維化及肝硬化中的應用研究做一綜述。
AI是計算機學科的一個分支,是研究、開發用于模擬、延伸和擴展人類智能的理論、方法、技術及應用系統的新學科[7]。機器學習(machine learning,ML)是AI的一個子集,通過它可以建立算法和預測模型,以有效地識別大數據集中的模式;通過運用統計學方法,使機器能夠通過經驗進行改進。ML可以進一步分為監督學習(基于輸入和輸出數據創建的預測模型)、無監督學習(僅基于輸入數據的組合模式識別)和深度學習(基于神經網絡的學習,可以應用于大數據集)[8]。
(一)機器學習在評估肝纖維化和早期肝硬化的研究進展 病毒性肝炎是當前導致肝纖維化/肝硬化的首要因素,Wei等人[9]利用490例慢性乙型肝炎患者血清學指標構建了多種機器學習模型,同時在兩個獨立的外部隊列——慢性丙型肝炎患者(n=254和n=230)上使用這些模型來進行驗證。研究得出GB模型明顯優于其他ML模型和基于4因子的纖維化指數(FIB-4)。在診斷顯著性肝纖維化,GB模型受試者操作特征曲線下面積(receiver operating characteristic area under the curve,AUROC)為0.918,FIB-4的AUROC為0.841;在區分有無肝硬化中,GB模型AUROC為0.871,而FIB-4為0.830;外部隊列中GB模型預診斷性能亦優于FIB-4。
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)的全球患病率正在逐年增加,已成為一個嚴重的公共衛生問題。NAFLD發展過程中,在肝臟脂肪變性基礎上出現肝細胞損傷,發生變性壞死,進而導致肝纖維化和肝硬化[10]。Okanoue等人[11]基于人工智能/神經網絡算法,建立了Fibro-Scope模型,包含年齡、性別、身高、體重、腰圍、天冬氨酸氨基轉移酶(AST)、丙氨酸氨基轉移酶(ALT)、γ-谷氨酰轉移酶、膽固醇、甘油三酯、血小板計數和 IV型膠原蛋白7S(T4C7S)12個血清學指標。結果表明,在訓練集中和驗證集中Fibro-Scope模型在診斷有無肝纖維化的AUROC分別為0.960(95%CI:0.937~0.983)和0.888(95%CI:0.784~0.991)。Okanoue等[12]對模型再次優化,納入424例NAFLD患者再次進行研究,在訓練集中預測肝纖維化各階段的模型AUROC值均極高(>0.97)。Fibro-Scope模型在訓練集中診斷肝纖維化敏感性為99.5%,特異性為90.9%,陽性預測值為97.4%,陰性預測值為98.0%;在驗證集中的敏感性為100%,特異性為88.2%,陽性預測值為96.9%,陰性預測值為100%。總之,模型診斷性能超越了病理學家的獨立診斷和其他現有的血清學模型。病理學家獨立診斷的敏感性為98.4%,特異性為87.5%,陽性預測值為96.9%,陰性預測值為93.3%。研究表明,基于人工智能/神經網絡算法的Fibro-Scope模型具有極高的診斷精度,且成本低、易于使用,可以準確地區分出各個階段的肝纖維化。此模型已被納入日本醫療健康檢查計劃,根據臨床實踐將進一步微調,并可能最終替代肝組織活檢。
影像組學指的是結合AI技術,高通量地從影像中提取大量的特征,從而將影像數據轉化為具有高分辨率、可挖掘的影像特征空間[13]。具體包括以下步驟[14]:①圖像采集:對圖像進行標準化處理,消除不必要的混雜變異因素; ②圖像分割:對感興趣區域進行二維或三維勾畫,分割方法包括手動、半自動、自動三種分割方式; ③特征提取:包括形態學特征、一階特征、二階特征、紋理特征、基于濾波和變化的其他特征; ④特征選擇:常用的特征選擇方法包括方差選擇法、相關系數法、卡方檢驗、LASSO回歸、主成分分析法、線性判別分析法等;⑤模型建立;包含多種機器學習方法,如邏輯回歸、決策樹、隨機森林、支持向量機、神經網絡、深度學習等。
(一)在肝纖維化及早期肝硬化中的研究進展 Li等人[15]對100例患者的常規超聲影像上肝臟回聲紋理的異質性進行影像組學分析,根據肝纖維化面積來量化肝纖維化程度,能夠準確地鑒別出輕度和顯著性肝纖維化,模型AUROC高達98.5%,特異度為93.3%,敏感度為93.7%。Wang等人[16]納入144例慢性乙型病毒性肝炎患者,采用LASSO回歸進行特征選擇、支持向量機建模以評估患者是否出現肝硬化,新模型包含了25個影像組學特征,以及ALT、AST、球蛋白、國際標準化比值(INR)4個臨床指標。結果顯示,在訓練隊列和驗證隊列中,此新模型的AUROC分別為0.915和0.872,顯示出良好的診斷價值。此外,Park等人[17]納入436例肝纖維化患者的肝臟增強MRI,在開發集中,通過使用邏輯回歸和彈性網絡正則化構建影像組學纖維化指數模型(RFI),確定診斷顯著肝纖維化、進展期肝纖維化和肝硬化的最佳RFI閾值,RFI診斷中度肝纖維化的敏感性和特異性分別為81%和78%;診斷進展期肝纖維化的敏感度和特異度為79%和95%;診斷肝硬化的敏感度和特異度為95%和75%。在測試集中,該模型在區分肝纖維化3個階段的AUROC值分別為0.91、0.87和0.88。我們發現基于影像組學的方法,可改善常規的影像學檢查對于輕度肝纖維化的診斷性能以及提升在肝纖維化各分期的診斷性能。但上述研究均為單中心的研究,模型是否具有普適性仍需要更多的研究來驗證。
(二)在失代償期肝硬化及其并發癥的研究進展 Nitsch等人[18]將肝硬化患者的影像組學特征應用于肝硬化患者的預后分析,為應對肝病患者的臨床治療和移植器官分配等方面的挑戰開辟了新的研究途徑。他們對肝脾影像分割后進行特征提取、采用隨機森林建模評估疾病的嚴重程度,并將其與現有的MELD評分和臨床失代償的指標進行比較。結果表明,基于肝脾的MRI影像學特征的模型預測在預測失代償的效能最高(AUROC為0.84)。但本研究為小樣本單中心的研究,僅采集了90例患者的肝臟MRI資料,仍需進一步研究。
肝性腦病是肝硬化患者常見的并發癥之一,發病率為30%~45%,III~IV級肝性腦病患者90天內病死率可高達66%[19]。為提高預測患者繼發HE的準確性,曹金明等[20]通過肝臟增強CT影像組學共收集304例乙型肝炎肝硬化患者的臨床資料及肝臟增強CT影像。從門靜脈期影像中提取到356個肝臟影像組學特征,LASSO回歸篩選出其中19個特征,結合3個獨立危險因素(血清白蛋白、腹水和側支循環開放情況),建立了單獨的影像組學模型、單獨的臨床模型以及由影像組學和臨床特征共同構成的綜合模型3個模型,預測繼發肝性腦病的風險。結果表明綜合模型預測AUROC值高達0.94,準確性高達0.93。
約50%的肝硬化患者會發生食管胃底靜脈曲張(gastroesophageal varices,GEV)[21]。GEV引起的首次出血的病死率為20%,無干預的首次出血存活的患者1年內再出血的風險高于60%,病死率約為33%[22]。鑒于與GEV相關的高發病率和病死率,指南建議所有肝硬化患者都應定期行胃鏡篩查有無發生GEV[23],然而部分患者暴露于有創手術和麻醉并發癥等風險,并沒有出現需要治療的靜脈曲張(varices needing treatment,VNT)。2015年BavenoVI共識提出肝硬度<20kPa、血小板計數>150×109/L的患者可免行內鏡篩查[24],但仍有不少爭議。Lin等[25]收集245例肝硬化患者臨床和門脈期CT影像資料,隨機分為訓練集(n=111)、內部驗證集(n=71)和外部驗證集(n=63)。在訓練集中,利用LASSO回歸和交叉驗證法算法,共提取了14個食管胃底區的特征和5個脾門區的特征,構成影像組學標簽(rad score),多因素邏輯回歸顯示血小板、rad score是發生VNT的獨立危險因素,進而建立了預測發生VNT的預測模型和列線圖。在訓練集、內部驗證集和外部驗證集中,AUROC分別為0.987(95%CI0.969~1.00)、0.973(95%CI0.939~1.00)和0.947(95%CI0.876~1.00);在有效性和安全性評估中,列線圖顯示可免除40%以上的內鏡檢查,且VNT漏診率低于5%。此無創和可重復的模型不僅能提高患者的依從性,還能顯著減少不必要的內鏡檢查和醫療負擔,具有極高的應用價值。
基于人工智能與影像組學的研究方興未艾,在肝纖維化和肝硬化的無創診斷方面,常規的檢查可以達到甚至超越金標準的診斷性能;在失代償期肝硬化的應用方面,各種預測模型的預測效能可得到進一步優化,提高評估患者預后的準確性。這些均有助于慢性肝病患者實現無創、縱向、精準的隨訪和治療。當前的大多數研究多為單中心研究,尚未在臨床投入使用,還需接受臨床實踐的檢驗。人工智能與影像組學的應用亦存在許多壁壘,例如高質量數據的采集、部分算法難以理解、模型準確度不足等,但隨著大數據的發展、多學科的融合,未來或許我們可以建立大型、多中心、跨學科、高質量的肝病數據中心,為實現肝病的精準治療和個體化治療提供橋梁。
利益沖突聲明:所有作者均聲明不存在利益沖突。