黎 健 馮 莉
復旦大學附屬中山醫院閔行分院內鏡中心(201100)
人工智能(artificial intelligence, AI)在醫學中的應用已引起廣泛關注,AI輔助消化內鏡診斷是目前的研究熱點。臨床上內鏡操作由內鏡醫師完成,診斷則依靠醫師肉眼結合病理活檢完成,其本質是一個不斷積累經驗、逐漸完善的過程。AI輔助內鏡診斷有望提高內鏡醫師對消化道病灶的檢出率,有效減少誤診和漏診。本文就AI在消化系統疾病內鏡診斷中的作用和研究進展作一綜述。
AI可定義為由機器模仿人類認知功能所展示的智能[1-2]。機器學習(machine learning)是一種實現AI的方法,機器可在沒有明確指令的情況下利用數據來提升自身性能。深度學習(deep learning)是一種實現機器學習的技術,其通過模仿動物神經系統來創建自身神經網絡[3]。由于醫學數據通常由非結構化文本、圖像和視頻組成,不易加工成有明確特征的數據,因此在臨床醫學中深度學習尤為有價值[4]。AI、機器學習、深度學習的關系見圖1。特征學習屬于深度學習,指機器內部的某些設定要求機器主動識別并學習原始數據中的特征,而非被動識別學習已標記的數據特征[5]。這種技術可使機器學習特征并能在沒有預先提供特征的情況下,自動推斷輸入值和輸出值。
采用機器學習方法的AI大致分為兩類:手工算法和深度學習算法。在手工算法中,研究人員基于臨床知識,手動輸入數據特征,如病灶邊緣、大小、顏色和圖像表面特征;深度學習算法則主動提取并學習鑒別圖像特征。從技術層面上而言,深度學習算法能使用卷積神經網絡(convolutional neural networks, CNN)來分析復雜信息,通常較手工算法更具優勢,但需要更多學習材料用于準確識別和分析[6]。
1. Barrett食管(Barrett’s esophagus, BE)異型增生的識別:BE是食管腺癌發生的危險因素之一,但在內鏡檢查中常被誤診,原因可能為:①內鏡醫師無法區分胃(近賁門處)柱狀黏膜和遠端食管的化生上皮;②獲取的食管活檢組織中缺少杯狀細胞[7]。自動識別BE異型增生是計算機輔助診斷(computer-aided diagnosis, CAD)領域的研究熱點之一。CAD能幫助內鏡醫師進行精準定位活檢,減少不必要的隨機活檢。隨機活檢對異型增生的敏感性較低,約64%[8]。有研究發現,精準定位活檢診斷高級別上皮內瘤變和食管腺癌的敏感性為90%,特異性為80%,陰性預測值為98%[9]。Veronese等[10]提出的一種CAD方法分析共聚焦圖像區分胃上皮化生、腸化生和上皮內瘤變的敏感性分別為96%、95%、100%。因此,在臨床實踐中采用AI輔助內鏡診斷,有望提升內鏡醫師識別和診斷病變的水平。

圖1 AI與機器學習、深度學習的關系
基于病變部位特定紋理和對常規內鏡圖像進行機器學習,van der Sommen等[11]研發了一套能自動識別早期腫瘤的系統,識別過程分3個步驟:①預處理;②對獲取的圖像進行降維度特征提取;③識別分類。結果顯示對44例BE患者100張圖像的早期腫瘤病變的診斷敏感性和特異性均為83%。Swager等[12]發現,容積激光顯微內鏡(volumetric laser endomicroscopy, VLE)能對食管壁層深達3 mm處的病變進行識別,其結果接近顯微鏡分辨率掃描,使用AI模型對60張VLE圖像進行體外交叉驗證,敏感性為90%,特異性為93%。
2. 食管癌的識別:食管癌為全球第六大癌癥死亡原因,其發病率位居第七位,多數病例預后較差且幾乎所有病例均為鱗狀細胞癌[13]。內鏡下盧戈碘色素染色為目前診斷食管鱗狀細胞癌的主要方法,敏感性>90%,特異性約70%[14],可能與炎性病變可引起假陽性表現有關。此外,作為篩查手段,碘染色引起的胃灼熱不適和過敏反應風險在一定程度上限制了該方法的臨床應用[15]。隨著內鏡技術的發展,窄帶成像(narrow-band imaging, NBI)技術是一種非侵入性、安全性更高且可獲取高清圖像的診斷方法。在一項納入123例患者的交叉試驗中,NBI對異型增生的檢出率明顯高于普通白光內鏡(30%對21%,P=0.01),且NBI所需的活檢次數更少[8]。有研究[16]發現NBI診斷食管高級別上皮內瘤變的敏感性和特異性分別為91%和95%。目前,包括共聚焦激光顯微內鏡(confocal laser endomicroscopy, CLE)和細胞內鏡(endocytoscopy)在內的更先進的內鏡成像技術正處于臨床前應用階段[17]。值得注意的是,內鏡醫師對這些新技術的顯微圖像進行診斷時,不僅需要專業知識,還需大量強化訓練,可能阻礙了這些新技術的臨床推廣。因此,CAD系統用于自動分析診斷所獲取的內鏡圖像時,能減少內鏡醫師的學習成本,提升臨床工作效率,凸顯AI的診斷價值。
Shin等[18]采用一種定量圖像分析由高分辨率顯微內鏡(high-resolution microendoscopy, HRME)獲取的細胞核與細胞質區域圖像,HRME能產生與CLE類似圖像,但成本明顯降低。結果顯示該法對食管鱗狀細胞癌的診斷敏感性和特異性分別為87%和97%,在算法中加入實時圖像分析功能后,敏感性和特異性分別為95%和91%。Horie等[19]的大樣本量研究基于CNN構建了AI模型,對384例食管癌患者的8 428張內鏡圖像進行機器學習,結果顯示癌灶檢測的敏感性為98%,陽性預測值為40%。基于機器學習的特性,隨著學習材料的增加,陽性預測值會逐漸增高,可作為一種較好的輔助診斷工具。
1. 早期胃癌的識別:胃癌是一種嚴重危害人類健康的消化道惡性腫瘤,占全球癌癥死亡率的8.2%[13]。早期內鏡診斷并治療是降低胃癌死亡率、提高患者生存率的主要方法。目前臨床上早期診斷胃癌存在兩個問題:①內鏡下識別早期胃癌存在一定困難,內鏡下早癌通常表現為黏膜輕度隆起或凹陷伴輕度發紅,極易遺漏;②內鏡下如何預測病灶浸潤深度。分化型黏膜內癌(M期)或侵入黏膜下層≤0.5 mm(SM1期)的病灶可行內鏡下切除;而侵入黏膜下層>0.5 mm(SM2期)的病灶,通常采取手術切除。AI的應用可在一定程度上解決上述兩個問題。
Sakai等[20]使用CNN學習內鏡圖像來自動識別早癌,在926張內鏡圖像中,228張為早癌,其余為正常圖像。經數據訓練后再行驗證,結果顯示228張癌癥圖像中,共205張(89.9%)診斷準確,除去用于學習的圖像,診斷準確率為82.8%;698張正常圖像中,491張(70.3%)被系統識別成正常。表明通過少量數據學習,CNN就能在早期胃癌檢測中實現較高的準確性。Miyaki等[21]采用CAD系統自動識別癌與非癌區域,對胃癌的診斷準確性達85.9%,敏感性為84.8%,特異性為87.0%。該團隊隨后將類似技術用于放大BLI圖像來識別早期胃癌,結果顯示癌變平均輸出值為0.846±0.220,紅色病變為0.381±0.349,周圍組織為0.219±0.277,癌變輸出值明顯高于其他類型[22]。上述研究結果說明AI在自動分析診斷早期胃癌方面具有一定的潛力。Hirasawa等[23]使用深度學習技術自動檢測早期胃癌。將13 584張傳統內鏡圖像(而非NBI、FICE、BLI圖像)用于訓練CNN,并從連續77處胃癌病變中收集2 296張圖像,結果顯示該模型準確診斷71處胃癌病變僅需77 s,總體敏感性為92%。但仍有161處非癌性病變被誤診為胃癌,陽性預測值較低(31%)。該研究構建的CNN可用于短時間內處理大量內鏡圖像來診斷胃癌,且具有實時臨床診斷能力,如何提高陽性預測值將是后續研究重點。Zhu等[24]設計了能從M/SM1型胃癌中識別SM2型胃癌的AI模型,結果顯示診斷SM2型胃癌的敏感性和特異性分別為76%和96%,高于內鏡醫師視覺檢查的敏感性和特異性。
2. 幽門螺桿菌(Helicobacterpylori, Hp)感染的識別:Hp已被列為Ⅰ類致癌原,能定植于胃部并引起慢性萎縮性胃炎、腸化生,從而增加胃癌的發生風險[25]。胃鏡檢查是診斷Hp感染的重要方法,但準確性并不高,敏感性和特異性分別為62%和89%[26]。目前AI診斷Hp感染已成為消化內鏡領域的研究熱點之一。一項單中心回顧性研究[27]基于WLI、BLI、LCI圖像利用AI來診斷Hp感染,共納入222名受試者,其中105名胃鏡和血清學確診Hp感染陽性。結果顯示WLI的ROC曲線下面積顯著低于BLI和LCI(0.66對0.96、0.95,P<0.01)。說明基于BLI和LCI圖像,AI已具備較好的診斷Hp感染的能力,有望成為一種有用的輔助診斷工具。但該研究的缺陷在于AI系統為回顧性診斷而非內鏡下實時診斷。由此可見,在胃鏡檢查過程中,AI是一種有效的輔助支持診斷工具,可避免內鏡醫師漏診Hp感染患者,具有較強的臨床應用潛力。
結直腸癌(CRC)是全球第三大常見癌癥,癌癥相關性死因中位居第二位[13]。結腸鏡結合病理活檢是診斷CRC的首選方法。研究表明,多數CRC由腸息肉演變而來[28]。結直腸息肉(特別是腺瘤性和鋸齒狀息肉)參與CRC的發生和發展,屬癌前病變,因此,通過早期診斷和干預結直腸息肉,有助于預防CRC[29]。結腸鏡檢查預防CRC的效果取決于腺瘤檢出率,識別并切除這些癌前病變,同時行切除后監測,是預防CRC、降低發病率、死亡率的重要方法。
AI在腸息肉、腸癌識別領域的應用已有較多研究,除傳統CAD外,基于CAD應用AI的CNN系統亦取得迅速發展。Komeda等[30]設計了CNN-CAD系統學習從常規結腸鏡檢查視頻中截取的1 200張圖像,并對腸息肉進行診斷和分類。經10次交叉驗證后,準確性為0.751。說明該CNN-CAD系統可用于快速診斷腸息肉并進行分類,但需在體內環境中行進一步的前瞻性研究,以明確CNN-CAD系統在常規結腸鏡檢查中的有效性。Urban等[31]的CNN系統對8 641張內鏡圖像(包括4 088張各種類型息肉)進行深度學習,評估診斷息肉的能力,結果顯示交叉驗證準確率為96.4%,ROC曲線下面積為0.991。且該CNN系統具備實時識別和定位息肉的功能,可增加腺瘤檢出率并減少CRC的發生,但仍需在大型多中心試驗中行進一步驗證。Chen等[32]創新性地利用NBI圖像結合DNN-CAD系統診斷增生性和腫瘤性息肉。該研究收集了1 476張腫瘤性息肉和681張增生性息肉圖像,以病理結果作為參照。結果顯示DNN-CAD系統鑒別腫瘤性息肉和增生性息肉的敏感性為96.3%,特異性為78.1%,陽性預測值為89.6%,陰性預測值為91.5%。DNN-CAD系統鑒別腫瘤性息肉和增生性息肉的用時為(0.45±0.07) s,顯著短于專家和年輕內鏡醫師所需的時間[(1.54±1.30) s、(1.77±1.37) s,P<0.001]。
目前AI在醫療領域的應用已取得較多進步,尤其在消化內鏡診斷方面。但AI在消化內鏡中的應用面臨一些問題:AI如何在消化內鏡中做到實時診斷?如何更好地將AI融合于新的內鏡技術?此外,消化內鏡醫師和患者的接受程度亦是面臨的另一問題。自2017年以來,AI作為一項國家戰略,已在皮膚癌、糖尿病視網膜病變中發揮重要作用,未來基于AI的內鏡圖像診斷識別有望在消化內鏡篩選消化道早癌方面發揮重要作用。