徐婷宜,朱家明,宋 梟
(揚州大學信息工程學院,江蘇 揚州 225127)
眼底視網膜是唯一可以通過無創眼底檢查觀察到微循環的人體部位,視網膜血管的直徑、粗細等很多特征變化直接反映出了一些病癥,如糖尿病、高血壓等[1]。視網膜血管分割是眼科疾病準確可視化、診斷、早期治療和手術計劃的關鍵步驟。作為第一步,準確的血管分割為后續操作奠定了關鍵基礎。由于血管在嘈雜背景下會發生極端變化,如小導管,光盤區的判別能力低等,手動分割需要手工標記特征,既繁瑣又耗時。因此,尋求一種解決眼底圖像自動分割的方法引起了研究者極大的興趣。
2014年,Eid Emary等[2]提出了一種利用可能性模糊c均值(PFCM)聚類來克服傳統模糊c均值目標函數的視網膜圖像自動血管分割方法。該方法用于驅動模糊聚類的優化,但在計算過程中容易受到噪聲等外部信息的干擾,無法達到精確的分割效果。2016年,Pawel Liskowski等[3]提出一種使用在大型樣本訓練的深度神經網絡監督分割技術。該方法提高了檢測精度,但實驗樣本較多,計算量較大。Debamita Kumar等[4]提出一種將二維匹配濾波器應用于眼底視網膜圖像,通過對比受限的自適應直方圖均衡化檢測增強的血管的方法。該方法在網絡中引入拉普拉斯高斯 (LOG)濾波器,但實驗網絡深,實驗結果容易發生過擬合,影響分割效果。2018年,Khan等[5]提出一種改進多尺度線檢測器分割方法。該方法提升了傳統尺線檢測器的去噪能力,但對于細微血管的特征采集能力比較薄弱。
為了減少視網膜血管分割的細節丟失,提升血管分割敏感度,使自動分割技術更好地應用于臨床診斷,本文提出了一種添加了注意力機制(AG)的改進Unet模型。首先,在上采樣和下采樣部分,將原始卷積模塊改為殘差卷積模塊,不僅緩解了由于網絡層數過深存在的梯度爆炸或梯度消失的問題[6],還能捕獲不同層次的的視網膜信息,更好地表示圖像特征;其次,在網絡下采樣部分中引入自適應的注意力機制,使注意力模塊在學習過程中更專注于視網膜中不同形狀和大小的血管,把血管和背景的權重區別開,提高了分割精度,達到分割細小血管的目的,實現更好的分割性能。
Unet專為生物醫學圖像分割而設計。隨著數據擴充數量的增加,該體系結構可能適用于較少數量的訓練數據集。它由編碼器和解碼器兩部分組成[7,8]。編碼路徑類似于用于分類的任何CNN類型架構。它有助于從輸入圖像中提取更多上下文信息。有3×3卷積運算(未填充),具有批處理歸一化和ReLU功能,然后是2×2最大池化運算(跨度為2)用于下采樣。對于每次下采樣,要素圖的數量都會增加一倍。解碼路徑包括特征圖的上采樣,上卷積層(3×3卷積)將特征圖的數量減半。解碼部分中的大量特征圖有助于在沒有不必要信息的情況下將從編碼部分提取的上下文信息傳播到輸出。編碼路徑的相應裁剪特征圖與解碼路徑的3×3卷積和Relu串聯在一起。這樣做是為了提高輸出圖像的分辨率。最后,使用1×1的卷積層,將64個特征向量映射到所需的類。Unet結構如圖1所示。

圖1 Unet結構圖
深度學習中更深的網絡可以提高給定任務的性能,但同時會影響訓練,從而導致梯度消失。解決方案考慮殘差神經網絡給出。普通單元和殘差單元之間的差異如圖2所示。圖2(a)所示的普通網絡用于Unet,而殘差層具有備用連接(圖2(b))。該殘差層有助于避免消失的梯度問題。殘差單元可以由式(1)定義:
H(x)=F(x)+x
(1)

圖2 網絡單元圖
Attention Gate為注意力機制[9],在醫療圖像中,需要檢測識別器官組織,忽略圖像中的無關區域,把注意力集中到對特定任務有用的顯著特征。最近的研究證明,用AG訓練的深度學習模型隱式地提高了網絡的性能。AG的非典型結構如圖3所示。

圖3 AG模型


(2)

在分割任務中,語義類型有多個,因此AGs是多維的,并且每個AG應更加專注其分割目標的情況。在該模型引入選通向量q(i,j),用于確定每個通道像素的專注位置和上下文信息,以不斷改進下層特征映射。對比乘法注意與加法注意的方式與性能,最后選擇乘法注意來獲得選通向量,并獲得了較好的分割效果。AGs的具體定義如下

(6)
σ2=F(y(i,j))=1/(1+exp-y(i,j))
(7)

本文提出了基于改進Unet的Res-Unet框架。它保留了Unet端對端的原始結構,將粗糙的高層信息與精細的低層的信息結合在一起[10]。Unet網絡在編碼部分充分利用上下文的特征信息,在解碼部分改善背景噪聲的不良影響,以更好地回復出血管形態結果。但是Unet這種深層網絡模型在分割上也存在一些問題,網絡層數越深,越容易引起網絡性能退化。這種由大量網絡層間本身的級聯造成,并且由于眼底圖像間存在病灶區域或者拍攝角度變化等噪聲,Unet無法更好的抑制這類干擾信息,從而在血管分割上存在一定的細節丟失。
為了解決網絡性能退化的問題,本文在編碼器和解碼器部分都使用Resnet的模塊,它通過對堆積層的恒等映射,使堆積層在輸入特征的基礎上學習到新的特征,提高網絡性能[11]。
該編碼模塊由4組下采樣層與卷積層組成每一下采樣層包含2個并行通道,其卷積層尺寸均為3×3,初始卷積模塊的特征通道數為64,其中卷積模塊為Resnet,用以解決梯度問題,使網絡性能提升。解碼模塊由4組上采樣層與卷積層組成,其結構和卷積層參數與編碼模塊相同。最高解碼層為1×1卷積層,用以輸出分割結果。在每層編碼模塊與解碼模塊之間都設置為帶有AG的跳躍連接,共4層,該模塊用以融合成像背景與血管比例,有效降低背景混沌對血管形態的影響。圖像信息經過采集不同級別的分類過濾器并結合Resnet模塊跳躍連接的輸入圖像信息進行解碼,注意力模塊通過增加血管權重抑制背景噪聲達到精確分割的目的。粗粒度層的過濾器用來判斷血管的大概位置和具體走勢,細粒度層獲取分叉末端等細微的特征信息進行分類,使解碼端注意血管信息的權重比較高,而忽視噪聲背景等信息。網絡結構如圖4所示。

圖4 網絡結構圖
DRIVE數據庫包含了40張照片,其中7張顯示了輕度早期糖尿病性視網膜病變的跡象。
STARE(視網膜的結構化分析)由TopCon TRV-50眼底攝像頭捕獲的20個視網膜眼底玻片組成。數據集的一半包含健康受試者的圖像,其余包含病理病例,這使得分割更具挑戰性。圖5為數據庫圖像。

圖5 數據庫圖像
在預處理的完整圖像的子圖像(補丁)上執行神經網絡的訓練。尺寸為48*48的每個色塊是通過在整個圖像中隨機選擇其中心來獲得的。通過在20個DRIVE訓練圖像的每一個中隨機提取5000個補丁,可獲得100000個補丁。數據集的前90%用于訓練(90000個補丁),而后10%用于驗證(10000個補丁)。本文實驗平臺為Linux平臺下的Keras框架。訓練進行了80個時期,最小批次為32個補丁。學習率為0.001,采用自適應矩陣估計算法(Adam)優化模型,在解碼階段使用批量隨機梯度下降法(SGD)優化。使用Intel?CoreTMi7-9750CPU,訓練持續約22個小時。


表1 實驗數據
根據表1中的內容,DRIVE和STARE兩個數據庫在本文所提算法下的所有評價指標均優于原始Unet算法,基本可以實現分割任務,其中敏感度最低,需要進一步提升。

圖6 DRIVE數據集分割結果
圖6為DRIVE數據庫中的test3和test15的分割結果,圖7為STARE數據庫中的img1181和img1184的分割結果。其中DRIVE數據庫中的分割優勢更為明顯,可見本算法在背景較為純凈的圖像中效果更好。與原始Unet網絡的對比,本算法在血管形態復雜的情況下的分割水平適用性較好。

圖7 STARE數據集分割結果
為了進一步說明本文算法將帶有殘差卷積模塊的編碼器和解碼器層和帶有注意力模塊的跳躍連接與Unet模型結合具有優勢,本文將基于原始的Unet模型進行部分調整,并在DRIVE數據集上進行了實驗對比,測試其準確性、敏感性、特異性、AUC值與F1值。其中包含了Unet模型、只有殘差卷積的Unet網絡Res-Unet、只有注意力模塊的Att-Unet和本文分割算法。實驗結果如表2所示。

表2 實驗對比數據
由表2可知,原始的Unet網絡分割效果已經較為精準,準確性、敏感性和AUC值均達到90%以上,但敏感性較低,需要進一步提升;Res-Unet利用殘差網絡進行上下采樣,各項指標都有了進一步的提升,F1值與AUC值較低,說明網絡對血管細節分割的能力不強;Att-Unet利用注意力模型,降低噪聲的干擾,加強了對血管細節的分辨能力,表中可見F1值較Res-Unet有明顯提升,但準確性基本沒有變化,說明該方法在提取信息的過程中存在信息丟失現象;本方法在準確性、特異性、敏感性、AUC值與F1值都有顯著提升,說明本文的方法既能通過殘差模塊提取充分的特征信息,也可以通過注意力模塊忽略背景噪聲,將注意力集中在血管分割上,以達到相對較強的分割水平。分割細節如圖8所示。

表3 DRIVE數據庫算法指標對比

圖8 分割結果圖

表4 STARE數據庫算法指標對比
如表3、表4所示,本文根據上述所提評價指標將本文與文獻[2]-[5]的分割方法在DRIVE和STARE數據集上進行對比,從而進一步證明本文所提算法的優越性。
本文提出了一種具有注意力機制的類Unet模型和一種具有權重的Res-Unet跳躍連接方案:在上下采樣的過程中將原始的卷積層改為殘差卷積進行特征采樣,針對不同步長的粒度特征進行累加,使細小血管的分叉處和末端的細微像素點抓取更準確。在網絡解碼部分使用注意力模塊,使學習過程中更專注于視網膜血管的形狀和大小,忽略背景噪聲,以提高細小血管的分割精度,實現高精度視網膜血管分割。在DRIVE和STARE兩個數據集上評估了文中的方法,并將分割結果與傳統Unet網絡分割結果對比,實驗證明本網絡的準確性和靈敏度可以實現高性能的分割。