狄 宇,李 瑩
中國醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 北京協(xié)和醫(yī)院眼科,北京 100730
人工智能(artificial intelligence,AI)是計算機(jī)領(lǐng)域的前沿科學(xué),其目的是賦予計算機(jī)像人類一樣的智力以解決實際問題[1]。1956年,“人工智能”這一概念由McCarthy等[2]在美國達(dá)特默斯的一次學(xué)術(shù)會議上首次被提出,會議探討了機(jī)器模擬智能的相關(guān)理論和原理,但進(jìn)一步研究發(fā)現(xiàn)實際操作中遇到的困難遠(yuǎn)超出預(yù)想,此后因受限于技術(shù)條件和水平,AI一直在跌宕起伏中發(fā)展。近年來,隨著大數(shù)據(jù)科學(xué)的發(fā)展、計算機(jī)性能的顯著提升及相關(guān)研究工具的成功開發(fā),AI的研究走上了前所未有的快車道,在醫(yī)學(xué)領(lǐng)域的應(yīng)用也日益廣泛,并引起普遍關(guān)注[3]。AI與眼科的深度融合基于眼科一些疾病的診斷主要依賴于各種影像學(xué)檢查,目前AI不僅在糖尿病視網(wǎng)膜病變、老年性黃斑變性、白內(nèi)障及青光眼等眼科常見致盲性眼病的研究中較為廣泛[4- 7],且在角膜相關(guān)疾病領(lǐng)域也展現(xiàn)出巨大潛力,已有多項研究將AI應(yīng)用于圓錐角膜、角膜屈光手術(shù)、感染性角膜炎、角膜移植及翼狀胬肉等方面,本文將對AI在角膜相關(guān)疾病領(lǐng)域的應(yīng)用研究進(jìn)行綜述,以期為臨床工作提供指導(dǎo)。
AI模型的構(gòu)建主要包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)分組、模型優(yōu)化及評價[8]。良好的數(shù)據(jù)準(zhǔn)備對于提高模型性能和滿足算法條件至關(guān)重要,傳統(tǒng)的機(jī)器學(xué)習(xí)(machine learning,ML)需將圖像轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),通過統(tǒng)計分析選擇相關(guān)特征,以避免模型過擬合,提高準(zhǔn)確度。深度學(xué)習(xí)(deep learning,DL)主要選擇預(yù)處理圖像中感興趣的區(qū)域進(jìn)行分割或定位,其中圖像預(yù)處理內(nèi)容包括去除鏡面反射、消除不均勻照明及將不同來源的照片轉(zhuǎn)化為相同大小及格式[9]。
對于所有數(shù)據(jù)類型和算法而言,數(shù)據(jù)分組是相同的,通常將其隨機(jī)分為2個獨立的數(shù)據(jù)集:一組為測試數(shù)據(jù)集,另一組為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用于構(gòu)建模型,驗證數(shù)據(jù)集用于調(diào)整超參數(shù)進(jìn)行模型優(yōu)化,而測試數(shù)據(jù)集用于評估模型性能。常用的數(shù)據(jù)劃分方法包括留出法、交叉驗證法及自舉法,其中十折交叉驗證法被廣泛應(yīng)用,可避免因樣本量過小出現(xiàn)過擬合或欠擬合現(xiàn)象[10- 12]。
模型評價指標(biāo)包括靈敏度、特異度、準(zhǔn)確度、精準(zhǔn)率、召回率、受試者操作特征(receiver operating characteristic,ROC)曲線及曲線下面積(area under the curve,AUC)。ROC曲線根據(jù)不同的二分類方式(分界值或決定閾),以真陽性率(靈敏度)為縱坐標(biāo)、假陽性率(1-特異度)為橫坐標(biāo)繪制的曲線,不僅可判斷任意分界值對性能的識別能力,同時可對兩種及以上不同模型的性能進(jìn)行比較,由于AUC不受分類閾值及正例比例的影響,因此是衡量ML模型分類性能最常用的指標(biāo),其取值范圍在0.5~1之間,AUC越接近1表示模型的預(yù)測性能越好[6]。
ML的算法包括傳統(tǒng)的ML算法和DL算法。傳統(tǒng)的ML算法將臨床專家選擇的變量作為輸入,主要包括線性回歸、邏輯回歸、支持向量機(jī)(support vector machine,SVM)、決策樹及隨機(jī)森林等算法,通常不涉及大型神經(jīng)網(wǎng)絡(luò)。DL算法主要采用多媒體數(shù)據(jù)集(如圖像、視頻和聲音),通常涉及大規(guī)模神經(jīng)網(wǎng)絡(luò)的應(yīng)用,主要包括人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)。雖然傳統(tǒng)的ML算法仍在使用,但深度神經(jīng)網(wǎng)絡(luò)是目前AI研究的焦點[6]。
圓錐角膜是以角膜中央或旁中央擴(kuò)張變薄并向前呈錐形突出為特征的一種眼病,可造成高度不規(guī)則散光和高度近視,最終導(dǎo)致視力嚴(yán)重下降,其患病率約為1/2000~1/500,多于青春期發(fā)病[13]。早期發(fā)現(xiàn)圓錐角膜并及時進(jìn)行干預(yù),可避免病情進(jìn)展,維持較好的視力。然而圓錐角膜的早期診斷較為困難,評估過程中需全面分析角膜地形圖和角膜生物力學(xué)特征,基于角膜地形圖儀(EyeSys System 2000、Tomey、Orbscan、Pentacam)和眼前節(jié)光學(xué)相干斷層成像的AI模型可為圓錐角膜的早期診斷助力[14- 15]。目前,已有文獻(xiàn)報道應(yīng)用SVM、決策樹、CNN、多層感知器神經(jīng)網(wǎng)絡(luò)(multi-layer perception neutral network,MLPNN)及前饋神經(jīng)網(wǎng)絡(luò)(feed forward neural network,F(xiàn)NN)等算法建立AI模型,可對圓錐角膜進(jìn)行早期診斷(表1)[16- 29]。

表1 圓錐角膜相關(guān)AI研究
早期圓錐角膜的AI研究主要應(yīng)用角膜地形圖數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,旨在鑒別圓錐角膜與其他角膜的異常,如角膜散光、屈光術(shù)后和角膜移植等。1997年,Smolek等[29]應(yīng)用神經(jīng)網(wǎng)絡(luò)法建立模型對圓錐角膜進(jìn)行篩查和分類,該研究將300例受試者的TMS-1角膜地形圖儀檢查數(shù)據(jù)平均分為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集,將角膜地形圖儀的10個參數(shù)輸入模型,應(yīng)用神經(jīng)網(wǎng)絡(luò)訓(xùn)練的AI模型進(jìn)行圓錐角膜診斷,輸出為圓錐角膜、可疑圓錐角膜及其他,結(jié)果顯示AI模型的準(zhǔn)確度、靈敏度和特異度均達(dá)100%,該研究證實了神經(jīng)網(wǎng)絡(luò)通過角膜地形圖識別圓錐角膜的價值。近年來,隨著診斷工具及新算法的不斷開發(fā)與改進(jìn),多種機(jī)器學(xué)習(xí)分類器(machine learning classification,MLC)紛紛涌現(xiàn)。Hidalgo等[22]基于Pentacam角膜地形圖儀的22個參數(shù),使用SVM建立模型以識別圓錐角膜、頓挫型圓錐角膜、角膜散光、角膜屈光術(shù)后及正常角膜,通過十折交叉驗證法得出模型的準(zhǔn)確度為88.8%,加權(quán)平均靈敏度為89.0%,特異度為95.2%,然而對于頓挫型圓錐角膜的識別率較低,靈敏度僅為37.3%,分析主要原因為頓挫型圓錐角膜與正常角膜間的角膜地形圖參數(shù)相似性較高有關(guān)。Kovcs等[23]應(yīng)用神經(jīng)網(wǎng)絡(luò)法構(gòu)建MLC,通過分析30例雙側(cè)圓錐角膜、15例單側(cè)圓錐角膜與30例正常對照組數(shù)據(jù),基于雙側(cè)數(shù)據(jù)間的差異參數(shù),以區(qū)分存在細(xì)微角膜變化的頓挫型圓錐角膜與正常角膜,其靈敏度和特異度均為90%,AUC為0.96。Souza等[26]應(yīng)用Obscan Ⅱ前節(jié)分析系統(tǒng)數(shù)據(jù)對不同類型的MLC,包括SVM、MLPNN及徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function neutral network,RBFNN)進(jìn)行測試,其AUC分別為0.99、0.99、0.98,提示3種類型的MLC均具有較好的分類性能。
然而在上述機(jī)器學(xué)習(xí)研究中,輸入模型的數(shù)據(jù)均需臨床醫(yī)生進(jìn)行選擇并完成標(biāo)注,不僅工作量繁重且存在主觀診斷偏移。Kuo等[16]基于角膜地形圖圖像,利用VGG 16、InceptionV3及ResNet 152算法構(gòu)建模型,以區(qū)分圓錐角膜與其他角膜狀態(tài),結(jié)果發(fā)現(xiàn)3種算法構(gòu)建的模型準(zhǔn)確度、靈敏度及特異度均在90%以上,其中ResNet 152構(gòu)建的模型性能最佳,AUC為0.955,準(zhǔn)確度為95.8%,靈敏度為94.4%,特異度為97.2%,說明DL通過角膜地形圖儀進(jìn)行圓錐角膜的篩查具有較好的準(zhǔn)確度。Kamiya等[17]利用DL算法自動識別和評估CASIA系列掃頻眼前段光學(xué)相干斷層掃描儀(anterior segment-optical coherence tomography,AS-OCT)獲得的前后表面曲率圖、前后表面高度圖、角膜厚度圖及總屈光度彩色圖像,根據(jù)Ameler-Krumeich系統(tǒng)對圓錐角膜進(jìn)行分級,研究共納入304只圓錐角膜患眼(Ⅰ級108只眼、Ⅱ級75只眼、Ⅲ級42只眼、Ⅳ級79只眼),該模型區(qū)分圓錐角膜與正常角膜的準(zhǔn)確度為99.1%,對圓錐角膜分級的準(zhǔn)確度為87.4%,但該模型區(qū)分晚期圓錐角膜(Ⅱ、Ⅲ、Ⅳ級)的靈敏度較低,分析可能與AS-OCT彩色圖像在Ⅱ、Ⅲ、Ⅳ級圓錐角膜間缺乏典型表現(xiàn)有關(guān)。
角膜屈光手術(shù)作為視覺矯正的方法之一,已被越來越多的屈光不正患者所接受。我國近視眼的發(fā)病率較高,角膜屈光手術(shù)患者數(shù)量龐大,為篩選適合角膜屈光手術(shù)的患者,避免術(shù)后并發(fā)癥的發(fā)生,術(shù)前眼部科學(xué)評估尤為重要[30]。完整的角膜屈光手術(shù)術(shù)前檢查較多,需結(jié)合患者的個體化特征進(jìn)行綜合分析(如年齡與術(shù)前及術(shù)后屈光狀態(tài)的關(guān)系),然而眼科醫(yī)生難以同時考慮所有變量間的非線性關(guān)系,因此建立快速、客觀、可靠的術(shù)前篩查及術(shù)后效果評估方法是重要的研究方向[31]。
目前已有術(shù)前篩查角膜屈光狀態(tài)、術(shù)后評估繼發(fā)角膜擴(kuò)張高風(fēng)險人群的AI研究。Saad等[32]基于術(shù)前Obscan角膜地形圖儀的參數(shù),應(yīng)用線性判別模型篩查角膜屈光術(shù)后繼發(fā)角膜擴(kuò)張的患者,其靈敏度為92%,特異度為93%,但將該模型應(yīng)用于不同種族人群時其特異度為98.1%,靈敏度降低為70.8%,分析其靈敏度下降的原因,主要與研究人群的過度擬合相關(guān)。Lopes等[33]基于術(shù)前患者的Pentacam角膜地形圖儀參數(shù),應(yīng)用隨機(jī)森林算法構(gòu)建模型,納入屈光術(shù)后角膜穩(wěn)定組2980只眼、角膜擴(kuò)張組71只眼及圓錐角膜組182只眼,該研究將檢測角膜擴(kuò)張組和圓錐角膜組靈敏度均為100%的模型定義為Pentacam隨機(jī)森林指數(shù)模型,模型的AUC、靈敏度、特異度分別為0.992、94.2%、98.8%,優(yōu)于Pentacam系統(tǒng)中的Belin/Ambrosio角膜擴(kuò)張篩查模塊。然而,前2種機(jī)器學(xué)習(xí)模型的構(gòu)建均基于角膜地形圖儀的參數(shù),忽略了個體化特征。Yoo等[34]采用5種機(jī)器學(xué)習(xí)算法組合為一種集成分類器,對擬行角膜屈光手術(shù)的患者進(jìn)行術(shù)前評估,輸入的數(shù)據(jù)集指標(biāo)包括年齡、性別、等效球鏡、矯正遠(yuǎn)視力、眼壓、中央角膜厚度和非侵入性淚膜破裂時間,以達(dá)到模擬臨床醫(yī)生術(shù)前評估的情境,結(jié)果顯示集成分類器較單一算法性能更佳,其AUC、準(zhǔn)確度、靈敏度、特異度分別為0.983、94.3%、94.5%、92.5%。
此外,角膜屈光術(shù)后欠矯及回退是影響手術(shù)效果和穩(wěn)定性的重要原因,角膜屈光術(shù)前治療參數(shù)(Nomogram)的設(shè)定具有重要意義。天津市眼科醫(yī)院王雁教授團(tuán)隊[35]利用MLPNN算法,輸入數(shù)據(jù)指標(biāo)包括年齡、眼別、裸眼視力、等效球鏡、球鏡、柱鏡、散光軸位等相關(guān)參數(shù),訓(xùn)練Nomogram預(yù)測模型,將ML模型與臨床專家進(jìn)行比較,結(jié)果顯示臨床專家組與ML組在安全性方面無顯著差異,但在有效性和預(yù)測性方面ML組優(yōu)于臨床專家組,ML組與臨床專家組術(shù)后的等效球鏡度數(shù)分別為-0.09±0.024和-0.23±0.021,可見Nomogram預(yù)測模型具有較好的性能,然而對于高度近視及散光患者的預(yù)測仍有待進(jìn)一步驗證。
感染性角膜炎引起的角膜混濁是我國致盲的主要原因,其主要病原體包括細(xì)菌、真菌和病毒。病原學(xué)涂片和培養(yǎng)為診斷的金標(biāo)準(zhǔn),然而病原學(xué)培養(yǎng)的陽性率卻不盡相同,約為33%~80%[36]。Saini等[37]利用ANN算法,輸入眼部誘發(fā)因素、全身誘發(fā)因素及潰瘍特點等參數(shù)指標(biāo)以訓(xùn)練模型,結(jié)果發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)分類的準(zhǔn)確度為90.7%,明顯優(yōu)于臨床醫(yī)生預(yù)測的準(zhǔn)確度62.8%,但該研究的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集中數(shù)據(jù)量較少,仍需擴(kuò)大數(shù)據(jù)量進(jìn)行模型的訓(xùn)練和驗證以提高其性能。此外,AI可結(jié)合SVM與直線段檢測算法(line segment detector,LSD)或AlexNet與VGGNet構(gòu)建模型,識別共聚焦顯微鏡圖像中的菌絲及其密度,以輔助診斷真菌性角膜炎及其病變程度。2018年,Wu等[38]提出將自適應(yīng)魯棒二進(jìn)制模式(adaptive robust binary pattern,ARBP)與SVM結(jié)合以區(qū)分正常角膜的神經(jīng)纖維與真菌感染角膜的菌絲,ARBP用于提取圖片中的重要特征,SVM用于分類篩選異常圖片,研究采用LSD檢測異常菌絲、測量相應(yīng)密度、評估真菌性角膜炎的嚴(yán)重程度,其準(zhǔn)確度為99.7%。該研究的訓(xùn)練數(shù)據(jù)集納入圖片僅400張,2019年擴(kuò)大樣本量至1213張,并利用AlexNet和VGGNet構(gòu)建模型,其靈敏度和特異度分別為100%和99.8%[39]。
角膜后彈力層內(nèi)皮移植術(shù)(Descemet’s membrane endothelial keratoplasty,DMEK)是目前治療角膜內(nèi)皮病變的理想術(shù)式,其植片包括后彈力層和內(nèi)皮細(xì)胞層,術(shù)后眼球解剖結(jié)構(gòu)可達(dá)到正常生理狀態(tài),視力恢復(fù)較快,手術(shù)效果良好,術(shù)后排斥反應(yīng)發(fā)生率較低,但植片脫位為術(shù)后常見并發(fā)癥,因此術(shù)后早期是否行前房空氣再注射以保證手術(shù)成功率是臨床醫(yī)生面臨的一項挑戰(zhàn)[40]。Treder等[41]基于觀察DMEK術(shù)后AS-OCT的表現(xiàn),利用DL算法訓(xùn)練模型自動檢測植片脫離患眼,經(jīng)測試模型的準(zhǔn)確度、靈敏度、特異度分別為96%、98%、94%。同年,Hayashi等[42]基于前房空氣再注射指征(即植片脫離范圍距瞳孔中心4 mm 范圍內(nèi)),利用VGG19進(jìn)行模型訓(xùn)練,經(jīng)測試其AUC、靈敏度、特異度分別為0.964、96.7%、91.5%,該模型對于輔助臨床決策具有一定意義。
此外,基于共聚焦顯微鏡檢查,利用AI自動識別角膜神經(jīng)纖維,可用于糖尿病周圍神經(jīng)病變的早期診斷[43- 44]。Li等[45]指出,AI在識別角膜神經(jīng)纖維長度、密度及其分支密度方面與人工識別結(jié)果具有較好的一致性。同時,基于前節(jié)照片,有研究指出利用SVM、ANN及CNN算法建立模型,可自動識別翼狀胬肉與正常人群,為社區(qū)人群疾病篩查提供有利的工具[46- 48]。
AI與臨床的日益融合將為疾病普查帶來便捷,有助于疾病的一級預(yù)防。一方面可緩解醫(yī)療機(jī)構(gòu)壓力,解決臨床資源分配不足的問題;另一方面可降低醫(yī)療成本,為更多患者帶來希望;此外,還可提高疾病檢測的靈敏度和特異度,增加臨床決策的科學(xué)性。AI在角膜相關(guān)疾病的多個方面均有涉及,其通過影像數(shù)據(jù)的綜合分析,協(xié)助角膜疾病的診斷和治療,有助于診療程序的簡潔化、精準(zhǔn)化和個性化,為精準(zhǔn)化角膜疾病的診療奠定數(shù)據(jù)基礎(chǔ)。
然而,目前AI在角膜相關(guān)疾病領(lǐng)域的應(yīng)用仍面臨諸多挑戰(zhàn)。首先,由于缺乏公共數(shù)據(jù)集合衡量算法的優(yōu)劣,很難將目前的研究結(jié)果進(jìn)行橫向比較;其次,由于技術(shù)原因,臨床醫(yī)生難以理解從獲取臨床數(shù)據(jù)至得出預(yù)測結(jié)果的過程,僅從模型的統(tǒng)計結(jié)果而非認(rèn)知過程判斷其可靠性,因此目前結(jié)果僅可用于疾病的輔助診斷,最終還需臨床醫(yī)生結(jié)合實際情況進(jìn)一步確認(rèn);最后,AI模型的訓(xùn)練過程依賴高質(zhì)量和大量的訓(xùn)練數(shù)據(jù),由于角膜相關(guān)檢查較多,檢測結(jié)果及參數(shù)缺乏統(tǒng)一性,可能影響AI模型的性能。
綜上,AI作為一種尋求模擬人類智能處理問題方法的計算機(jī)科學(xué),現(xiàn)階段在眾多領(lǐng)域發(fā)展迅猛,其在眼科的研究日益增多。AI在角膜相關(guān)疾病領(lǐng)域的研究主要包括圓錐角膜的早期診斷及分級、角膜屈光手術(shù)術(shù)前篩查及術(shù)后效果評估、感染性角膜炎的分類及程度判斷、角膜移植術(shù)后再干預(yù)的評估,以及輔助糖尿病周圍神經(jīng)病變角膜神經(jīng)末梢的檢測和翼狀胬肉的篩查,主要采用的算法包括SVM、決策樹法、CNN等,模型的靈敏度和特異度均達(dá)90%以上。雖然AI在模型構(gòu)建方面仍面臨一定挑戰(zhàn),但其可為醫(yī)生提供客觀的臨床決策、為患者提供精準(zhǔn)的治療奠定基礎(chǔ)。因此,AI在眼科領(lǐng)域具有廣闊的發(fā)展前景,在角膜相關(guān)疾病領(lǐng)域具有較大的發(fā)展?jié)摿Α?/p>
作者貢獻(xiàn):狄宇負(fù)責(zé)查閱文獻(xiàn)、撰寫論文;李瑩負(fù)責(zé)指導(dǎo)論文寫作方向、審閱及修訂論文。
利益沖突:無