褚慶玉,賈山移,冉玲華
1 重慶市人民醫(yī)院,重慶400014;2 重慶慎安醫(yī)院
人工智能(AI)是借助計(jì)算機(jī)模擬某些思維過(guò)程和智能行為的過(guò)程,“數(shù)據(jù)驅(qū)動(dòng)”深度學(xué)習(xí)(DL)的問(wèn)世為AI研發(fā)帶來(lái)了革命性的動(dòng)力。AI能從海量的大數(shù)據(jù)中提取特征病變,通過(guò)計(jì)算機(jī)迅速地做出醫(yī)學(xué)判定[1]。計(jì)算機(jī)運(yùn)算能力受計(jì)算機(jī)硬件、運(yùn)算方法制約,目前DL算法包括深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、深度置信網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)等[2],其中CNN被最廣泛地用于醫(yī)學(xué)圖像識(shí)別。而DL算法在圖像識(shí)別準(zhǔn)確性上,已經(jīng)可以有超越人類的表現(xiàn)[3]。在消化內(nèi)鏡領(lǐng)域,醫(yī)師需要處理大量的內(nèi)鏡圖像,導(dǎo)致工作量大,同時(shí)漏診率高。AI給膠囊內(nèi)鏡(CE)帶來(lái)一種全新的診療體系,全面提升了內(nèi)鏡檢查效率及診療水平。近年來(lái),大多數(shù)CE對(duì)AI的研究主要分為計(jì)算機(jī)輔助檢查系統(tǒng)(CADE)和計(jì)算機(jī)輔助診斷系統(tǒng)(CADX)兩類[2]。CADE旨在檢查、定位胃腸道(GI)病變,而CADX則專注于GI病變的識(shí)別;此外,計(jì)算機(jī)輔助跟蹤系統(tǒng)(CADM)的研發(fā),用于評(píng)估CE檢查過(guò)程的完整性,提高病灶的識(shí)別,提高內(nèi)窺鏡檢查質(zhì)量。雖然,AI在臨床中的應(yīng)用中發(fā)揮了前所未有的優(yōu)勢(shì),但仍存在不足。本文就AI在CE中的應(yīng)用及存在的不足綜述如下。
1.1 CADE 在內(nèi)鏡檢查中,檢查結(jié)果受閱片醫(yī)師的水平、追蹤模式等多因素制約,往往導(dǎo)致診斷結(jié)果的偏差。而CADE檢查系統(tǒng)不受上述因素的限制,對(duì)可疑病變提高檢出率,是目前CE檢查的主要方法。目前,CADE已廣泛應(yīng)用于胃癌、小腸疾病、大腸息肉的檢查。有學(xué)者基于CNN模型來(lái)檢測(cè)胃癌,總體準(zhǔn)確性為92.2%;但是受胃解剖結(jié)構(gòu)影響,可導(dǎo)致其陽(yáng)性預(yù)測(cè)值不理想[4]。多項(xiàng)研究顯示,AI為小腸膠囊內(nèi)窺鏡(SBCE)檢查小腸病變帶來(lái)了突破;AI在自動(dòng)檢測(cè)SBCE圖像方面的潛力,主要應(yīng)用于腸出血、缺鐵性貧血、克羅恩病的診治、腫瘤的檢測(cè)、腹痛的診斷,并有助于急性消化道出血的治療[5]。最近,一項(xiàng)研究對(duì)6 970例患者的113 426 569張圖像進(jìn)行病灶分析,AI顯示出比胃腸病學(xué)專家更高的敏感性,并顯著縮短了對(duì)每例患者的圖像分析時(shí)間[6]。一項(xiàng)針對(duì)1 058例患者的前瞻性隨機(jī)對(duì)照試驗(yàn)(RCT)結(jié)果顯示,CADE能提高息肉和腺瘤的檢出率(29.1%,20.3%),患者平均息肉、腺瘤數(shù)目分別為0.53、0.31個(gè)[7]。這表明高性能實(shí)時(shí)息肉自動(dòng)檢測(cè)可以在實(shí)際臨床環(huán)境中改善檢出率,AI在SBCE檢測(cè)息肉方面表現(xiàn)出良好的性能。
目前,在大多數(shù)CADE研究中,敏感性被視為降低病變遺漏率的主要因素之一[8]。但假陽(yáng)性率隨CADE高敏感性而增加,這可能影響內(nèi)鏡檢查結(jié)果的判斷,特別是在篩查人群中[9]。因此,高靈敏度和低假陽(yáng)性率之間的平衡將是未來(lái)研究的重點(diǎn)。
1.2 CADX CADX可以通過(guò)應(yīng)用自動(dòng)圖像分析來(lái)提高病變光學(xué)診斷和靶向活檢的準(zhǔn)確性,已被用于食管癌、幽門螺桿菌(HP)感染和早期胃癌的檢查。有學(xué)者報(bào)道了一種基于CNN的食管癌識(shí)別模型,該模型可以將淺表食管癌與晚期癌區(qū)分開,準(zhǔn)確性達(dá)98%[10]。針對(duì)HP感染的研究也表明,與內(nèi)鏡醫(yī)師相比,CADX的準(zhǔn)確性更高[11,12]。有學(xué)者將一種CADX系統(tǒng)應(yīng)用于識(shí)別實(shí)時(shí)放大的NBI中,其對(duì)胃癌診斷的準(zhǔn)確度≥96.3%[13]。最近,一種CNN-CAD預(yù)測(cè)胃癌的浸潤(rùn)深度系統(tǒng)成功研發(fā),臨床結(jié)果顯示其準(zhǔn)確性(89.16%)、特異性(95.56%)明顯優(yōu)于經(jīng)驗(yàn)豐富的內(nèi)鏡醫(yī)師[14]。
已發(fā)表的研究表明,CADX在GI檢查時(shí)可自動(dòng)識(shí)別腺瘤性息肉和非腺瘤性息肉,此結(jié)論引起了內(nèi)鏡醫(yī)師的廣泛關(guān)注[15,16]。最近,一種使用窄帶成像(NBI)內(nèi)窺鏡視頻鑒別腺瘤性和增生性小腸息肉的CADX系統(tǒng)研發(fā)成功,對(duì)106例包含小息肉的患者進(jìn)行測(cè)試,該模型在區(qū)別腺瘤和增生性息肉的總體準(zhǔn)確性、敏感性、特異性分別為94%、98%、83%[14]。最近,一項(xiàng)實(shí)時(shí)CADX和帶有染色或NBI圖像的前瞻性研究表明,CADX達(dá)到“診斷分離”策略,是目前最有價(jià)值的內(nèi)窺鏡創(chuàng)新合并,對(duì)小型腺瘤的發(fā)現(xiàn)率﹥90%[17]。另外,CADX具有實(shí)時(shí)發(fā)現(xiàn)息肉的良好臨床表現(xiàn)[18]。隨著研究的深入,有一些研究試圖將AI應(yīng)用于炎癥性腸病。最近研發(fā)的一種CADX系統(tǒng),可以識(shí)別正常黏膜、病變黏膜,診斷潰瘍性結(jié)腸炎患者的準(zhǔn)確性、特異性分別為91%、97%[19]。
1.3 CADM 隨著研究的深入,自動(dòng)結(jié)腸鏡檢查系統(tǒng)問(wèn)世,該系統(tǒng)可以檢測(cè)腸管表面微小息肉,并且可以描述病變的大小、形態(tài)[20]。近年來(lái),在CE中應(yīng)用CNN的研究激增。但是,多數(shù)已發(fā)表的研究集中在GI病變的診斷或檢査的質(zhì)量控制以及監(jiān)督檢查的完整性,而忽略檢查時(shí)間及圖像的質(zhì)量。CE的檢查時(shí)間以及收集圖片的清晰度,是改善內(nèi)窺鏡檢查的基礎(chǔ)。Wu等[21]研發(fā)了一個(gè)實(shí)時(shí)質(zhì)量改進(jìn)系統(tǒng)WISENSE以監(jiān)控CE盲區(qū),對(duì)檢查過(guò)程進(jìn)行計(jì)時(shí)并在CE檢查期間自動(dòng)生成照片;將WISENSE用于324例患者的RCT研究顯示,WISENSE組的盲點(diǎn)率(5.86%)低于對(duì)照組(22.46%)。在結(jié)腸鏡檢查領(lǐng)域,AI充分發(fā)揮智能的潛力。最近一種自動(dòng)質(zhì)量控制系統(tǒng)(AQCS)問(wèn)世,該系統(tǒng)不但可以定時(shí)停藥,還能監(jiān)督藥物穩(wěn)定性以及評(píng)估腸道準(zhǔn)備和檢測(cè)結(jié)直腸息肉。臨床試驗(yàn)表明,AQCS可以使息肉和腺瘤的漏診率降到16.5%,且能延長(zhǎng)給藥撤藥時(shí)間[22]。
2.1 數(shù)據(jù)因素 每個(gè)系統(tǒng)收集的圖像均是高質(zhì)量的內(nèi)窺鏡圖像構(gòu)建數(shù)據(jù)庫(kù),對(duì)于低質(zhì)量或無(wú)法識(shí)別的圖像未納入數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)圖片的過(guò)度模擬化導(dǎo)致檢查結(jié)果存在一定的誤差。在這種情況下,系統(tǒng)診斷的準(zhǔn)確性可能被夸大。同時(shí),靜態(tài)高質(zhì)量圖像的良好性能并不能確保在動(dòng)態(tài)視頻中獲得成功。因此,可以考慮運(yùn)用加強(qiáng)數(shù)據(jù)集的方法,增加數(shù)據(jù)集的大小,在一定程度上避免過(guò)擬合現(xiàn)象的發(fā)生,從而使系統(tǒng)更加穩(wěn)定。同時(shí),為便于在CE檢查過(guò)程中進(jìn)行實(shí)時(shí)評(píng)估,采用未經(jīng)處理的圖像對(duì)CNN進(jìn)行訓(xùn)練和(或)測(cè)試是更理想的方法。此外,數(shù)據(jù)庫(kù)收集的回顧性研究不能涵蓋所有病變的形態(tài)特征,而捕獲圖像的病變往往沒有最典型的病變特征,導(dǎo)致一些具有臨床價(jià)值的非典型病灶被忽略,導(dǎo)致較高的選擇偏倚[23]。因此,系統(tǒng)數(shù)據(jù)集的構(gòu)建應(yīng)包括具有各種形態(tài)學(xué)特征的GI病變。
2.2 實(shí)驗(yàn)樣本因素 當(dāng)前大多數(shù)研究通過(guò)診斷測(cè)試評(píng)估AI輔助系統(tǒng),結(jié)果在很大程度上受到樣本數(shù)量、質(zhì)量的影響。測(cè)試集和數(shù)據(jù)集在患者或病變級(jí)別應(yīng)完全獨(dú)立。考慮到數(shù)據(jù)偏斜度對(duì)AI的影響,應(yīng)根據(jù)疾病分類、人群等因素來(lái)確定測(cè)試數(shù)據(jù)集的分布,以確保結(jié)果的合理性和充分性[24]。
2.3 研究方法因素 首先,應(yīng)將患者的風(fēng)險(xiǎn)分級(jí)納入當(dāng)前CNN的模型中,以提高在高風(fēng)險(xiǎn)人群中的診斷,同時(shí)減少普通人群的誤診率。上述問(wèn)題都是可能導(dǎo)致AI在CE應(yīng)用中存在的不確定因素。此外,一些前瞻性研究采用單一方法進(jìn)行,所以無(wú)法對(duì)AI系統(tǒng)進(jìn)行確切評(píng)估[25]。其次,先前研究的結(jié)果指標(biāo)主要集中在技術(shù)指標(biāo)上,如敏感性、特異性、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值,而這些指標(biāo)很容易受到測(cè)試人員分布的影響。最后,評(píng)判DL各種算法的性能沒有“黃金”法則,而是依據(jù)實(shí)驗(yàn)者對(duì)系統(tǒng)的熟練程度,算法的不同也是導(dǎo)致實(shí)驗(yàn)誤差的原因。
2.4 技術(shù)因素 目前,大多數(shù)研究仍集中在早期系統(tǒng)開發(fā)和可行性研究上,而后期產(chǎn)品開發(fā)未能跟進(jìn)[26]。因此,醫(yī)學(xué)界、計(jì)算機(jī)科學(xué)家行業(yè)之間更緊密的協(xié)作對(duì)促進(jìn)AI在醫(yī)療產(chǎn)品中的臨床應(yīng)用至關(guān)重要。考慮到當(dāng)前醫(yī)療資源和醫(yī)師能力的不平衡,將AI技術(shù)集成到當(dāng)前醫(yī)療系統(tǒng)中是改善工作流程的理想方法。
隨著CE新技術(shù)的發(fā)展,智能融合是CE發(fā)展的趨勢(shì),而最具潛能的是與光活檢和刷檢的結(jié)合,解決CE病理檢查的局限。光活檢具有高分辨率、高靈敏度、高精確度且無(wú)損傷、安全等優(yōu)點(diǎn),而細(xì)胞學(xué)刷檢方法簡(jiǎn)便、診斷快捷、報(bào)告迅速。在AI技術(shù)的發(fā)展,光活檢、刷檢與CE結(jié)合,使內(nèi)鏡病理檢查快捷、精準(zhǔn)。隨著技術(shù)的進(jìn)步,具有先進(jìn)治療功能的智能CE(組織病檢、攜帶藥物、控制釋放)應(yīng)用于臨床并造福患者。5G時(shí)代來(lái)臨,互聯(lián)網(wǎng)新技術(shù)與醫(yī)療領(lǐng)域融合的逐漸深入,CE將在醫(yī)療影像大數(shù)據(jù)分析、遠(yuǎn)程診療等方面持續(xù)發(fā)力,利用大帶寬、低時(shí)延、高速率的天然優(yōu)勢(shì)將促進(jìn)跨屏、跨空間的遠(yuǎn)程醫(yī)療快速普及,讓優(yōu)質(zhì)的醫(yī)療資源得以在更大范圍共享,助力消化道疾病的診治。隨著科技的進(jìn)步,AI將為CE提供更為廣闊的發(fā)展空間。在不久的將來(lái),CE與智能手機(jī)融合,CE檢查不需要在醫(yī)院進(jìn)行,患者購(gòu)買內(nèi)鏡設(shè)備后與智能手機(jī)結(jié)合,將檢查圖像上傳,遠(yuǎn)程進(jìn)行圖像識(shí)別及診斷,提高CE檢查的靈活性、智能性。隨著科技的進(jìn)步,AI輔助系統(tǒng)將提高內(nèi)鏡的診斷率、診療效率,降低醫(yī)療費(fèi)用,新的智能技術(shù)對(duì)內(nèi)鏡提出了挑戰(zhàn)。AI、機(jī)器學(xué)習(xí)、CE技術(shù)的融合迫在眉睫,可能對(duì)當(dāng)前技術(shù)的未來(lái)產(chǎn)生深遠(yuǎn)影響,對(duì)提高患者的診治水平具有重要意義。