陳婷麗,王 靜,袁 非
糖尿病性視網膜病變、視網膜大動脈瘤和黃斑變性等眼底疾病常常嚴重危害患者視力,而患者在疾病早期常無明顯自覺癥狀。因此,此類疾病的篩查和早期診治對于患者的預后具有非常重要的意義。隨著分級診療的普及,眼底病變的篩查工作一直成為基層眼科、社區醫院的重心,而探索一種經濟快捷、高效的眼底病變篩查方式,一直以來是廣大眼科醫師和人工智能工程人員追求的目標。隨著人工智能的快速興起,實現眼底病變的智能化篩查成為目前研究的熱點[1-2]。人工智能在糖尿病性視網膜病變[3-4]、青光眼[5-6]、黃斑變性[7-8]等眼科疾病的應用具有很高的敏感性和特異性。本研究擬通過人工智能診斷系統對真實世界中的患者進行診斷,以評估其在眼底疾病篩查診斷中的應用價值。
1.1對象收集2018-07/12在我院眼科體檢的療養員1345例2690眼,其中男830例1660眼,女515例1030眼,年齡16~77(平均45.06±10.70)歲,最佳矯正視力為0.04~1.5。納入標準:患者眼底照相成像清晰且患者同意本研究對其眼底照相進行相關數據分析。排除標準:(1)因眼外傷、角膜混濁、白內障、玻璃體混濁(積血)等導致屈光間質透明度下降,影響眼底清晰成像者;(2)因全身疾病無法配合眼底照相檢查者。本研究經醫院倫理委員會批準,經患者同意并簽署知情同意書。
1.2方法所有體檢者均由同一檢查者采用免散瞳眼底彩色照相機進行眼底拍照,分別拍攝以黃斑為中心和以視盤為中心的眼底照片。采用以多層深度卷積神經網絡算法為基礎的人工智能診斷系統對所上傳的眼底圖像進行分析,獲取人工智能診斷報告,作為人工智能診斷組。同時,該患者由兩位眼底專科醫師會診,彼此分別獨立對患眼進行裂隙燈下90D前置鏡檢查,分別得出診斷報告。將完全相同的診斷結果作為最終人工診斷結果,若出現診斷差異性,交由眼底專科主任醫師進行最終診斷的確定,以上結果作為專家診斷組。本研究中主要診斷包含有21個臨床常見眼底病所需診斷:(0)未見明顯異常;(1)玻璃膜疣(黃斑區外);(2)眼底動脈硬化;(3)年齡相關性黃斑變性(ARMD)玻璃膜疣;(4)豹紋樣眼底;(5)疑似白內障眼底/圖片質量不佳;(6)杯盤比偏大;(7)其他黃斑變性;(8)黃斑前膜;(9)其他視神經病變;(10)不明異常-就診/觀察;(11)大玻璃膜疣/色素沉著;(12)視網膜零星出血;(13)視網膜有髓神經纖維;(14)非增殖性糖尿病性視網膜病變輕度;(15)非增殖性糖尿病性視網膜病變中度;(16)非增殖性糖尿病性視網膜病變重度;(17)增殖性糖尿病性視網膜病變;(18)視網膜分支靜脈阻塞;(19)視網膜大動脈瘤;(20)視網膜激光斑。以專家診斷組為金標準,計算人工智能診斷組的準確率、一致性、敏感性和特異性。
統計學分析:采用統計學軟件SPSS 21.0進行統計分析。計量資料以均數±標準差表示,計數資料以眼數表示。通過Kappa檢驗比較人工智能診斷組與專家組結果的一致性。其中Kappa值>0且≤0.20為極低的一致性,>0.20且≤0.40為一般的一致性,>0.40且≤0.60為中等的一致性,>0.60且≤0.80為高度一致性,>0.80為幾乎完全一致。Kappa檢驗中P<0.05表示兩者之間的一致性具有統計學意義。以專家組結果為金標準,計算人工智能診斷組的準確性、敏感度和特異性,其中涉及四個統計參數:真陽性(true positive, TP)、假陽性(false positive,FP)、真陰性(true negative,TN)、假陰性(false negative,FN),計算公式如下:準確率=(TP+TN)/(TP+FP+FN+TN),敏感性=TP/(TP+FN),特異性=TN/(FP+TN)。
2.1人工智能系統診斷準確率在本研究中,所納入患者的診斷結果有1~5(1.38±0.67)個診斷,人工智能診斷組所有診斷完全一致的準確率為62.82%,其中僅1個診斷的準確率為56.09%,2個診斷的準確率為77.96%,3個診斷的準確率為84.61%,4個診斷的準確率為86.95%,5個診斷的準確率為60.00%。在僅1個診斷的結果中,由于豹紋狀眼底診斷產生差異的為606眼(71.63%),去除豹紋狀眼底診斷差異后,該組診斷準確率為87.54%。
2.2人工智能系統診斷的一致性在本研究中,由于患者的診斷結果大于等于1個診斷,因此,我們根據不同診斷對結果分別進行一致性分析。人工智能診斷組和臨床專家組一致性分析結果見表1,在玻璃膜疣(黃斑區外)、ARMD玻璃膜疣、黃斑前膜、不明異常-就診/觀察、近視萎縮弧、視網膜有髓神經纖維、分支靜脈阻塞、非增殖性糖尿病性視網膜病變(輕度、中度、重度)、視網膜大動脈瘤、視網膜激光斑診斷中,Kappa值>0.80,具有幾乎一致性。在疑似白內障眼底/圖片質量不佳、動脈硬化、杯盤比增大、其他黃斑變性、大玻璃膜疣/色素沉著、視網膜零星出血、增殖性糖尿病性視網膜病變診斷中,Kappa值>0.60且≤0.80,具有高度一致性。在其他視神經病變中,Kappa值>0.40且≤0.60,具有中等一致性,在無明顯異常和豹紋狀眼底中,Kappa值>0且≤0.20,具有極低一致性。
2.3人工智能系統診斷的敏感性和特異性在本研究中,人工智能系統診斷的敏感性結果見表1,在玻璃膜疣(黃斑區外)、ARMD玻璃膜疣、豹紋狀眼底、黃斑前膜、不明異常-就診/觀察、近視萎縮弧、視網膜零星出血、視網膜有髓神經纖維、分支靜脈阻塞、視網膜大動脈瘤、視網膜激光斑、非增殖性糖尿病性視網膜病變(輕度、中度、重度)診斷中,敏感性>0.80;在動脈硬化、疑似白內障眼底/圖片質量不佳、杯盤比增大、其他黃斑變性、增殖性糖尿病性視網膜病變、大玻璃膜疣/色素沉著、其他視神經病變診斷中,敏感性>0.60且≤0.80;在無明顯異常診斷中,敏感性>0且≤0.20,其中在專家組認為無明顯異常而人工智能組認為有異常的501例中,人工智能組診斷為豹紋狀眼底改變的占98.6%,為494例。人工智能系統診斷的特異性結果見表1,豹紋狀眼底特異性為0.142,其余診斷特異性均大于0.90,具有較高的特異性。

表1 人工智能診斷系統的一致性、敏感性和特異性
近年來,隨著人工智能的快速發展,人工智能在臨床中的應用日益廣泛[2, 9-10]。深度學習算法是對人工神經網絡的發展,其中包括多種算法,諸如:受限波爾茲曼機、卷積網絡、堆棧式自動編碼器等[11]。本研究中,人工智能主要以深度學習為基礎,通過多層深度卷積神經網絡的訓練,自動獲取眼底圖片中的異常病灶信息,進而得出相應的診斷。
卷積神經網絡[12](convolutional neural networks,CNN)是近幾年以來發展迅速并且受到各學科領域廣泛關注的一種深度學習的模型。早期的卷積神經網絡主要用于手寫識別,隨著其不斷發展并且廣泛應用在圖像處理、物體分類及語音處理等領域。卷積神經與傳統的神經網絡相比,具有以下優點:(1)卷積神經網中的神經元采用局部感知連接,相比較傳統神經網絡全連接的方式很大程度上降低了網絡計算的復雜度[13];(2)卷積神經網絡權值共享的特殊方式使其布局更加接近生物網絡,在圖像處理上極具優勢;(3)卷積神經網絡利用多卷積核操作,實現能夠對于復雜圖像信息進行多特征抽取,進一步提高了網絡的抽象能力;(4)卷積神經網絡中含有下采樣層,能夠有效地減少每層樣本的數量,進一步提升模型的能效。
以往研究主要集中在人工智能診斷系統對于單病種的診斷一致性、準確性、敏感性和特異性的研究[14]。在真實世界中,患者的診斷往往并非單一,因此,我們通過人工智能診斷系統分析門診患者的眼底照相,進而評估其一致性、準確性、敏感性和特異性。
其中,為所選路徑中前往充電的充電站集合;為電動汽車在完全充電狀態的容量;為電動汽車在充電站充電電量與總容量的比值;為該充電站的充電功率為充電效率。
人工智能診斷組對于患者的完整診斷的診斷準確性為62.82%,其中4個診斷的診斷準確率最高為86.95%,其次為3個診斷的準確率為84.61%,2個診斷的準確率為77.96%,單個診斷準確率僅為71.63%,5個診斷的準確率最低為60%。診斷個數是指同一患者同一眼別的診斷名稱個數,由于單一患眼具有5個診斷的數量很少,在納入患者中僅具有5眼別,其中3眼別的診斷完全一致,診斷準確率為60%。在臨床中僅靠眼底照相對單眼做出5個診斷的患者數量很少,這也是本研究存在的不足之處,我們也將在后期擴大樣本量,從而完善人工智能系統對于多診斷的眼底照相的準確率研究,但是在本研究中,對于具有5個診斷的眼底照相,人工智能診斷系統具有60%的準確率,也說明了人工智能眼底病變診斷系統在未來的臨床工作中具有很好的應用前景。
在21個眼底病常用診斷中,我們發現除無明顯異常及豹紋狀眼底外,其余診斷的一致性Kappa值高達0.57~1,敏感性高達0.651~1,特異性高達0.93~1。雖然在無明顯異常及豹紋狀眼底診斷中Kappa值較低,分別為0.044、0.169,然而其P值小于0.05,提示人工智能診斷組與專家組之間具有診斷一致性。但是其一致性非常低。同時,我們發現豹紋狀眼底的診斷一致性、特異性分別為Kappa值0.169,特異性0.142,說明這可能和我們在人工智能系統中關于豹紋狀眼底的深度學習算法有關,單純通過眼底照相可能存在一定的局限性,尚需通過深度學習結合患者的驗光結果等進一步加強和完善豹紋狀眼底的診斷一致性和特異性。通過數據分析發現,在單個診斷中,共501眼由臨床專家組診斷為無明顯異常,而人工智能診斷組認為其中有494眼為豹紋狀眼底。當去除豹紋狀眼底診斷時,單個診斷的準確率提升至87.54%。因此,我們推測,該診斷系統可以隨著深度學習增加從而得到進一步優化,具有很大的提升空間。
目前大多數人工智能在眼底病的研究主要集中在人工智能診斷系統對于糖尿病性視網膜病變的應用價值。He等[3]和Gargeya等利用深度學習算法對糖尿病患者的眼底照相進行識別以診斷DR,都獲得了大于90%的敏感性和特異性[12]。翁銘等[15]通過人工智能診斷系統對糖尿病患者進行診斷,并將DR分為輕度NPDR、中度NPDR、重度NPDR及PDR進行分析,得出人工智能診斷系統的敏感性為0.82,特異性為0.91。本研究結果顯示,在患者診斷中糖尿病性視網膜病變(輕度NPDR、中度NPDR、重度NPDR、PDR)的敏感性和特異性分別為0.920、0.911、0.886、0.780和0.998、0.997、0.996、0.992,其中敏感性較以往研究類似,而特異性大于99%。這可能由于篩查人群的不同,既往研究主要針對糖尿病患者的DR篩查,而本研究所納入門診患者中非糖尿病性視網膜病變患者占大多數,提示人工智能對于DR患者的診斷具有高度特異性,在篩查診斷中具有極低的假陰性,對于DR篩查工作具有重要的臨床意義。
本研究結果顯示,人工智能診斷系統對于本試驗中大多數診斷均具有較高的敏感性和特異性,然而不同的眼底疾病都有其臨床診斷金標準,單依賴于眼底照相可能無法做出精確的診斷。青光眼是第二大致盲疾病,人工智能診斷系統在青光眼方面的應用主要在檢測視網膜神經纖維層厚度、視野和杯盤比等方面[16-17]。Diaz-Pinto等[18]研究認為基于卷積神經網絡的人工智能診斷系統通過眼底照相診斷青光眼的敏感性為0.934,特異性為0.858。本研究從眼底照相中通過識別杯盤比的大小確認其是否異常,具有高度一致性,且有較好的敏感性0.651和高度特異性0.997。本研究敏感性下降的主要原因可能為Diaz-Pinto的研究對象為具有56%青光眼患者的眼底圖庫,而本研究對象為門診隨機患者,青光眼確診患者常伴有明顯的杯盤比增大,從而有利于人工智能診斷系統進行確診,提高診斷敏感性。臨床上對于青光眼的診斷仍需視野、OCT等檢查支持,因此本研究中以杯盤比增大作為診斷,我們認為,隨著人工智能診斷系統的深度學習的加強和優化,其對于人群篩查具有重大的臨床意義。本研究結果顯示,人工智能診斷系統在黃斑前膜、黃斑變性、ARMD玻璃膜疣等黃斑疾病診斷抑或是視網膜大動脈瘤、分支靜脈阻塞、視網膜零星出血中,都具有高度一致性、敏感性和特異性。本研究中的人工智能診斷系統目前主要通過眼底照相的細節識別處理,而對于該類眼底疾病,臨床上常需要進一步行OCT、眼底血管造影等檢查以進一步明確診斷。因此,在后續人工智能診斷系統研究中,將會納入更多眼科檢查結果,通過多維度的深度卷積神經網絡學習不斷更新人工智能診斷系統,使之能夠更為智能化的服務眼科醫療。
綜上所述,基于多層深度卷積神經網絡學習的人工智能診斷系統對于絕大多數眼底疾病可以達到較高的敏感性和特異性,適用于眼底疾病的篩查工作,特別有利于基層醫院或社區醫院對于眼底疾病的初步診斷。本研究中也存在一定的不足之處,比如眼底疾病的病種仍有一定的局限性,部分病種的樣本量較小,部分眼底病變未采用其他檢查做為診斷參考標準等。因此,我們將進一步擴大眼底病種,增大樣本量,完善人工智能診斷模型,以期對于常見眼底疾病能夠做出更為準確的診斷,推動人工智能眼底病變診斷系統的發展。