梁智星, 葉林森, 楊 揚
中山大學附屬第三醫院 肝臟外科暨肝移植中心, 中山大學器官移植研究所,廣東省器官移植研究中心, 廣州 510630
醫院信息系統的進步極大地增加了醫療機構收集的患者數據量,據估計,2020年全球將產生2314兆字節的醫療數據[1],這為使用數據分析技術實現個性化醫療及改善患者預后提供了可能。然而,如何把龐大的數據轉化為可實踐的知識仍然是一個重大的挑戰,這一點在肝移植領域尤為明顯。自 1963年Starzl教授首次將肝移植應用于臨床以來,經過半個多世紀的發展和完善,肝移植已成為治療各種終末期肝病最有效的方法。與其他領域的“單患者”數據分析不同,肝移植通常需要考慮供體和受體“雙患者”的特征以及移植過程中的變量,所涉及的大量因素使用傳統生物統計學分析顯得非常困難。人工智能(artificial intelligence,AI)的核心是通過機器學習算法挖掘大型數據中的隱藏聯系,其優勢在于能從現有的數據中學習,找到變量之間的新聯系并產生預測,相比傳統方法更有效地生產預測模型?;谶@一優勢,越來越多學者將AI方法應用于肝移植領域,尤其是在預后預測和器官分配方面。
從概念上而言,AI并不新鮮,最早由阿蘭·圖靈在1937年提出,受限于當時的計算機技術,AI技術的發展曾一度停滯。直到20世紀后期,數據量的爆發性增長和計算能力的提升使得這一領域重新得到關注,自1998年以來,醫學AI領域的研究數量成倍增長[2]。在實踐中,AI算法通常區分為機器學習(machine learning, ML)和深度學習(deep learning, DL)。
ML可分為監督學習方法(如支持向量機、決策樹、隨機森林、樸素貝葉斯等算法)和非監督學習方法(如主成分分析)。監督學習即用一部分已知結果的樣本訓練機器,讓其學習輸入數據(如患者特征、圖像等)與結果(如發生并發癥、死亡等)之間的聯系,從而預測患者是否發生某一終點事件。非監督學習即是讓機器學習數據中的潛在分布或聯系,根據樣本的相似性進行聚類。ML在醫學領域中通常使用的都是監督學習算法[3](表1)。
DL是ML的一個子集,包含人工神經網絡(artificial neural networks, ANN)、卷層神經網絡(convolutional neural networks, CNN)、 循環神經網絡(recurrent neural networks, RNN)等算法模型。神經網絡是模擬大腦神經元組成的仿生模型,能夠挖掘數據中復雜的非線性關系,允許更復雜的監督和無監督學習任務(表1)。與其他ML算法相比,DL特別適用于大規模復雜或高維度的數據,能夠處理一些環境信息十分復雜、知識背景不清楚和推理規則不明確的問題[4],通常用于影像識別、病理診斷、預后預測等。
縱觀當前AI算法在肝移植領域的應用主要有以下2個方面:(1)緩和日趨嚴重的器官供需矛盾問題——使用分類技術評估供肝,減少經驗性誤判導致的供肝廢棄,擴大供體池;(2)制訂最佳的器官分配方案,避免因分配不佳導致的不良預后,提升供體池的整體獲益,提高捐獻器官的有效利用率及移植患者生存獲益——使用回歸模型預測移植肝存活及受體預后。利用AI算法在復雜和高維度數據中的優勢,擴大供體池,提高供受體匹配成功率,為肝移植患者長期生存提供有力支持。
移植肝脂肪變性(hepatic steatosis,HS)被認為是影響移植物功能的最重要因素之一[5],移植肝組織的病理學活檢是評估HS的金標準。然而病理檢查通常在器官獲取后進行,其結果一般在移植手術前難以獲得,因此供肝的HS評估常依賴于獲取人員視覺和觸覺上的經驗性判斷。然而有研究[6]表明超過90%的器官獲取人員對供肝移植物衰竭發生風險的預測存在很大差異,特別是低估了高風險供肝的移植物衰竭發生風險,說明依賴經驗性的判斷是不夠準確的。

表1 常用的AI算法
Kuppili等[7]利用極限學習機算法構建的脂肪肝診斷模型,能夠根據肝臟超聲圖像快速診斷HS,準確率高達96.75%。而Byra等[8]提出的CNN模型能更進一步地從超聲圖像中自動評估HS的程度。此外,支持向量機算法[9]還能夠根據數字化的病理圖像對HS進行自動分類,并能以高準確率(≥95%)區分大泡性和小泡性HS。Moccia等[10]和Cesaretti等[11]更是創造性地使用手機拍攝的供肝圖像進行半監督訓練,取得了88%的準確度、95%的靈敏度和81%的特異度,實現了在手術室快速評估供肝HS,為評估HS提供了一個全新的視野。這些研究表明,AI算法在供肝HS評估中表現出良好的性能,使獲取術中的供肝客觀評估成為可能。
臨床供肝評估是一個動態的過程,涉及供體情況、獲取及轉運過程等多個變量,這是一個隨時間變化、非常復雜的多維度非線性關系。傳統的生物統計方法需要假設解釋變量和結果變量之間是獨立的和線性的關系,并且無法納入大量的臨床變量進行分析,而這正是AI算法的優勢。筆者團隊利用ML算法構建供肝評估模型,納入供體基本特征、獲取前各項實驗室檢查結果、獲取/移植手術特征以及受體基本特征共67項變量數據,較傳統生物統計學方法具有更優的預測評估效能(AUC:0.85 vs 0.73; NRI=0.368 5, 95%CI: 0.321 0~0.415 9,P<0.001),相關經驗正在進一步總結當中。除了對供肝客觀、全面、精準的評估,AI技術還有望應用于供肝能否劈離的精準識別、活體肝移植供肝分割容量的判斷等方面,為外科醫生的臨床決策提供支持。
目前在世界大部分地區,對等待移植名單患者進行優先排序的金標準仍然是終末期肝病模型,但這種基于“病重患者優先”原則的分配政策存在一定缺陷[12]。肝移植中最佳器官分配的關鍵是準確預測特定供受體組合的移植結果,因此一個能最大限度考慮到所有供體和受體因素的可重復預測模型,無疑能最大限度地提高現有供體池的整體效益。目前已有許多學者嘗試利用AI技術建立器官分配模型[13-20]。
一項西班牙多中心的回顧性研究[13]使用ANN算法提出了一個創新的供體-受體匹配模型,其納入了1003對肝移植供體-受體,以及供體、受體和移植過程中的64個變量信息,準確預測移植后3個月的移植物存活率(AUC=0.81)和移植物丟失率(AUC=0.82),為臨床決策提供參考,以使肝臟分配更加公平、高效。此外,Bertsimas等[18]使用貝葉斯最優分類器預測候選者在移植等待名單上的3個月病死率或除名風險,開發了病死率優化預測模型(optimized prediction of mortality, OPOM)。OPOM可以根據疾病的嚴重程度,更準確和客觀地確定等待移植名單患者的優先次序,使器官的分配更加公平。在肝臟模擬分配中,與MELD相比,OPOM分配可使等待移植名單上的死亡人數大幅減少418例。
器官分配的目的是最大程度地降低移植物丟失的風險以及提高移植物存活的可能性,需要對特定的供-受體分配進行精準的預測。要清楚的意識到,在未來利用AI技術根據供體來源(腦死亡、循環死亡、活體供肝)和受體原發病(良性終末期肝病、肝惡性腫瘤)建立分組預測模型,指導肝移植臨床決策,有望實現腦死亡器官捐獻/心臟死亡器官捐獻整肝供肝的精準分配。另一方面,筆者單位是全國最大的劈離式肝移植中心,利用AI技術在劈離方式、劈離后供體分配等方面實現精準分配,建立本中心的數據庫,為國家的器官分配政策提供參考。
AI技術在評估移植肝存活及患者預后方面同樣發揮著巨大作用,使用ML和神經網絡算法構建的預測模型可以更準確地預測移植預后[21-34]。Liu等[22]根據患者的術前生理測量值,設計一個預測模型來預測術后30 d內的患者生存率,該研究利用隨機森林算法評估特征的重要性,結果顯示,年齡、BMI、白細胞及淋巴細胞數量、血小板、國際標準化比值以及鈉鎂離子濃度是移植術后早期生存的重要影響因素。Hoot等[24]利用器官共享聯系網絡的數據庫建立貝葉斯模型預測早期移植物存活率,通過對29個移植前變量進行學習分析,該模型90 d移植物存活的預測準確度可達91%。另一項大型研究[25]回顧性分析了62 294例肝移植患者術后10年內的生存情況,從超過600個變量信息中篩選出97個預測因子構建模型,結果顯示,使用ANN算法構建的預測模型對移植術后遠期生存的預測性能明顯優于傳統的Cox回歸模型。
急性腎損傷、移植后糖尿病(post-transplant diabetes mellitus, PTDM)、皮膚癌等是移植術后的重要并發癥,與移植物丟失及患者生存相關。梯度提升機[27]對各階段的急性腎損傷預測效能明顯優于其他常用的機器學習方法(AUC=0.90),相比之下,傳統的生物統計學方法logistic回歸的AUC為0.61。Bhat等[29]使用多種機器學習方法發現高齡、男性和肥胖的受者是PTDM的高危因素,以西羅莫司為主要免疫抑制劑的患者術后1年內發生PTDM的風險較他克莫司高33%,提示了對這部分受者應該采取更積極的預防策略和更密切的隨訪。Jain等[33]建立的機器學習模型能夠準確預測肝移植術后心血管事件的發生率和病死率,幫助臨床醫生篩選出可能發生心血管不良事件的移植受者。
筆者團隊率先在基于放射學特征、放射組學特征、臨床變量機器組合構建XGBoost算法模型,以及基于醫學圖像識別構建CNN模型,能夠在術前準確識別肝細胞癌患者腫瘤微血管侵犯(AUC分別為0.952、0.980),為預測肝癌患者術后復發提供參考[35]。隨著肝移植病例數據量的不斷增長、影像學和病理學等多學科評估的加入,以及前瞻性研究的驗證,AI預測模型將更能發揮出其在處理高維度、多種類數據方面的優勢,最終真正應用到臨床診療實踐當中,為肝移植患者提供更好的生存獲益。
盡管許多研究已經證明AI算法模型具有更佳的預測作用,但正如其發展歷史那樣,AI的應用極依賴于高質量的數據庫。事實上,AI算法并非總能得出比傳統生物統計學方法(如線性回歸、logistic回歸等)更好的結果[36],只有當數據集龐大且各變量間隱含非線性關系時,AI算法的表現才能達到預期,這一限制在肝移植領域更為明顯。盡管獨特的“雙患者”模式能夠提供更多的臨床資料信息,但單中心的移植病例數量仍遠少于其他疾病,這在一定程度上局限了AI模型的準確性與可信度。多中心的合作有望彌補這一缺陷,但各中心在數據產生、收集以及分析過程中采取策略的不同,導致了部分特征的數據缺失,這對于某些AI算法來說可能是致命的。
此外,嚴謹的研究設計、數據預處理策略、模型的選擇及該模型與臨床研究的適配性都是影響AI模型的關鍵因素,某些類型的AI模型可能更適合于特定類型的數據,比如CNN適用于圖像識別、RNN適用于有時序先后順序的數據。模型構建的過程中還應該注意不要讓模型與訓練數據過度擬合,這是AI算法特別是神經網絡最容易發生的錯誤,模型能否泛化應用要比數據擬合更為重要。AI技術的另一大挑戰源于其本身的不透明性,AI算法的高精確度可能是以失去對工作原理的可解釋性為代價,盡管已有研究[37]嘗試使模型更具解釋性,但算法在輸入數據-輸出結果的學習過程仍難以被完全理解,因此AI經常被認為是“黑箱”模型。這也許是AI技術真正應用到臨床決策的最后障礙——當部分的決定權從人類手中移交給機器算法時,患者及其臨床醫生對算法的可接受性和信任程度。
肝移植的過程通常產生大量的供-受體數據信息,這與AI技術依賴于龐大數據的特性尤為匹配。比傳統方法更為精準的AI預測模型,能夠幫助臨床醫生采取干預來改善患者的預后,比如對脂肪變性供肝縮短特定的缺血時間、對移植術后肝癌復發高風險的患者采取預防性綜合治療等。5G網絡與AI技術的結合還有望實現供肝運輸過程中的在線實時評估、實時分配,更加公平、高效地選擇最優受體,提高現有供體池的整體效益。隨著AI技術在肝移植領域的廣泛應用,基于AI算法構建臨床模型,實現對器官的公平分配、對移植術后生存和預后的預測,成為幫助臨床醫生及患者作出關鍵決策的寶貴工具,使外科醫生做出更多基于證據的決策,并幫助患者了解接受特定肝移植的風險/效益比,更好地為肝移植患者服務。
利益沖突聲明:所有作者均聲明不存在利益沖突。
作者貢獻聲明:梁智星負責撰寫論文;葉林森負責修改論文;楊揚負責擬定寫作思路,指導撰寫文章并最后定稿。