史春暉,朱習軍
(青島科技大學 信息科學技術學院,山東 青島 266061)
阿爾茲海默癥(Alzheimer disease,AD)[1]的發病機制目前尚不明確,在AD的早期階段(輕度認知障礙),雖然患者還未表現出AD的特征,但其腦部內側顳葉已經發生萎縮,而且極有可能向AD轉化。其中,海馬體萎縮的最為嚴重[2],同時海馬體存在形狀不規則、體積較小、不易分割等特點,因此,對海馬體的分割仍然存在很大的挑戰。核磁共振成像(magnetic resonance imaging,MRI)設備具有成像分辨率高,不會產生電離輻射,對比度成像等其它設備所不具備的優勢,故當前海馬體的分割多依賴于MRI圖像數據。
目前,海馬體的分割主要是醫生通過手動實現,且分割過程耗時大,主要原因是醫生要對病人海馬體區域花費大量的時間進行勾畫,而且勾畫結果易受醫生主觀因素的影響。針對手動分割存在的問題,相關工作者提出半自動化或自動化的海馬體圖像分割算法,而且隨著深度學習的發展,深度卷積神經網絡及其各種模型在醫學圖像處理領域中被廣泛應用并且取得了較好的效果[3-5]。但是這些算法都存在著相同的問題,神經網絡訓練時間相對較長,需要的樣本數據量大,圖像在輸入過程中通過滑動窗口的方式對像素點進行檢測,使得訓練速度很慢,而且容易出現冗余的現象,其次窗口的大小會對池化操作及其結果造成影響。針對這些問題,本文基于深度學習理論,運用改進的U-net模型,實現對海馬體的分割,從而達到輔助醫生對阿爾茲海默癥的診斷和診療。
本文采用MRI圖像作為海馬體分割的數據源,算法的整體流程主要包括圖像預處理,數據擴充以及基于U-net模型的圖像分割3個主要步驟,算法的基本流程如圖1所示。

圖1 算法流程
圖像預處理可以盡量減少抽取圖像特征時因圖像的亮度、對比度等無關因素的干擾,對算法的精度也有一定程度的提高。
1.1.1 限制性對比度自適應直方圖均衡算法
傳統的直方圖算法在對圖像的灰度進行分布的過程中,對有用信息以及噪聲進行了同樣的操作,這使得圖像中的噪聲得到放大。針對噪聲被同步放大的問題,通過限制性對比度自適應直方圖均衡算法(contrast limited adaptive histogram equalization,CLAHE)可以很好地解決,CLAHE最顯著的特點便是對圖像對比度增強的幅度予以限制,
使得圖像對比度更加自然。CLAHE算法通過設定的閾值對直方圖進行裁剪,去掉了過高的部分,然后將其均勻分布到直方圖中,從而生成新的直方圖。算法原理如圖2所示,同時在各個圖像塊間運用雙線性插值方式,去除分塊處理導致的塊邊緣過渡不平衡的問題,使得運算效率得到改善。

圖2 CLAHE直方圖裁剪
1.1.2 曲率驅動的圖像去噪
常用的圖像去噪方法在去噪過程中高頻成分被沒有區分的減弱,所以圖像噪聲在被去除的同時邊緣也變得模糊。實際圖像中物體包括邊緣在內的等照度線是光滑的曲線,曲率絕對值小,當有噪聲存在時,局部灰度值發生改變,等照度線隨即產生不規則的震蕩,形成局部曲率很大的等照度線。根據這一原理,對相應位置的像素點進行調整,把不規則的等照度線變成平滑的曲線,實現圖像去噪。
1.1.3 預處理實現
本文通過使用CLAHE算法對圖像進行預處理,以達到增強圖像對比度的目的,同時運用曲率驅動算法去除圖像噪聲,從而得到預處理后的圖像數據。由于實驗采用的腦部MRI圖像樣本,海馬體位置比較固定,因此基于 U-net 模型輸入數據的特點,從每個MRI圖像中提取一個128×128的圖像塊,對其進行預處理。在后面的過程中,該128×128大小的圖片將作為數據樣本被送到網絡模型中進行訓練和測試。預處理后的圖像,如圖3所示。

圖3 預處理后的圖像
原始數據的數量遠不足以訓練一個深層次網絡,因此在本文中用到了Keras自帶的圖像數據增強技術,對原始數據做平移、旋轉、扭曲等操作進行數據擴充以增加數據樣本量。但是通過這些變換得到的圖像相對于原始圖像在形狀上并沒有太大的差異。而考慮到真實的腦部MRI圖像中,根據海馬體的患病程度而導致的圖像形狀大小差異較大,本文處理方法是在原有點陣上,疊加正負向隨機距離形成“插值位置”矩陣,然后計算每個插值位置上的灰度,形成新的點陣,實現圖像內部的扭曲變形。從而實現原始MRI圖像數據樣本數據量的增加。擴充后的數據樣本如圖4所示。

圖4 數據增強
全卷積神經網絡(FCN)是一種端到端的語義分割方法,實現了逐像素點預測。其將傳統CNN中的全連接層轉化成卷積層,可以接受任意尺寸的輸入圖像。對池化后縮小的圖片,通過上采樣可得到和原圖等大的分割圖。全卷積之后的結果直接上采樣會很粗糙,深層語義信息豐富但圖像失真,淺層圖像特征明顯但語義不顯著,U-net模型通過采用跳躍連接可以改善上采樣粗糙的情況。
深度神經網絡包含很多層,訓練過程中會出現學習速度慢、學習效果過分依賴于初始數據分布以及梯度消失問題。基于這些問題,Ioffe等提出了批規范化方法,訓練時采用初始很大的學習率加快網絡的衰減速度,少用或不用Dropout和正則化操作,同時實現對過擬合的控制,其公式如下
(1)
(2)
(3)

如圖5所示。每一個殘差塊中包含著兩個卷積層及一條繞過它們的殘差連接,同時殘差塊的輸入被直接添加到輸出,使得每一層學到的不僅是參數本身,還包括殘差,后面的層學到的是對前面層的補充。這種方法極大地增加了網絡性能,從而解決網絡深度變深以后性能退化的問題。

圖5 殘差模塊
參數的學習率由Adam(adaptive moment estimation)利用梯度的一階矩估計和二階矩估計動態調整。Adam的每一次迭代,學習率都被限制在一個大致的范圍,具有參數比較平穩的優點,同時計算高效,可以解決學習率消失、收斂過慢、損失函數波動較大等其它優化算法中存在的問題。公式如下
mt=μ×mt-1+(1-μ)×gt
(4)
(5)
(6)
(7)
(8)

圖6為本文中使用的U-net網絡結構。該網絡包含一個收縮路徑(contracting path)和一個對稱的擴張路徑(expanding path)[7]形成一個U型。其中,收縮路徑用于獲取上下文信息,擴張路徑用以精確定位。收縮路徑是典型的卷積網絡結構,結構含有重復的步驟,每次重復中都有兩個3×3卷積層(無padding),且每個卷積層后有一個ReLu非線性激活函數及批規范化(BN)層來提高網絡性能,以及一個步長為2的2×2最大池化層進行下采樣,經下采樣特征通道數量加倍。擴張路徑也使用了一種相同的排列模式,對數據進行上采樣處理,通過反卷積,特征通道數量被減半,特征圖大小加倍,然后拼接反卷積的結果與收縮路徑中對應步驟的特征圖,拼接后的特征圖再進行兩次3×3的卷積。最后一層的卷積核大小為1×1,并利用sigmoid函數對輸出進行處理,將64通道的特征圖最終轉化為特定類別數量的結果。

圖6 U-net網絡結構
傳統的卷積層或全連接層在信息傳遞過程中,往往存在信息丟失、損耗等問題,而且隨著網絡不斷加深,梯度消失和梯度爆炸的問題也會隨之出現。因此為使模型更有效的訓練,區別于原始U-net,改進的U-net在卷積塊中加入殘差,在該模塊中輸入信息被直接傳到輸出,保證了信息的完整性,整個網絡僅需要學習輸入、輸出差別的部分,這在一定程度上簡化了學習目標和難度。網絡模型中的損失函數使用Adam算法進行優化,實現梯度參數的更新,該優化算法較傳統的SGD、動量等具有計算高效,方便實現的優點,最終使得結果較快的趨向于收斂。
本實驗所用的數據樣本來源于阿爾茲海默癥神經影像學計劃 (Alzheimer’s disease neuroim aging initiative,ADNI)數據庫[9]。ADNI于2003年創建,目前已有59個數據采集點。ADNI的主要目的是,盡可能早地檢測出患AD的人群,在早期階段研究發現最有效的診斷方法,輔助醫生確定新的治療方案并觀察成效,從而減輕臨床試驗的時間和成本。
本文采用Keras框架搭建基于U-net的海馬體分割模型。為了驗證算法的分割精度,將數據集分為訓練集和測試集兩部分,訓練集用于對U-net模型進行訓練,測試集用來驗證算法模型的精確度。原始訓練樣本為ADNI數據庫中的129組人腦核磁共振影像數據。經過彈性形變、翻轉、旋轉等圖像擴充操作后,新的數據集包含5萬張圖像數據,其中2/3被用以網絡模型的訓練,剩余的1/3圖像用于對算法分割精度的驗證。
為定量評估算法的分割性能,本文采用Dice系數、精確率(precision)和召回率(recall)分別對分割結果進行評估。
(1)Dice系數是一種集合相似度函數,可用來評判實際分割樣本與理論分割結果的相似度,兩個樣本相似度越好,相應的損失就越小,精度越高
(9)
其中,X表示手動分割結果,Y表示本文算法分割結果,Dice系數的取值范圍為0-1,Dice系數越大表示分割結果越準確。
(2)精確率,召回率,在圖像分割領域是兩個比較基本的指標,因此將其引入本文中
(10)
(11)
其中,TP表示正確分割的部分,FP表示誤分割部分,FN表示將正確區域誤分為錯誤的部分。上述兩個指標取值越高表示分割結果越好。
圖7給出了本文算法在訓練樣本集和測試樣本集上海馬體分割的對比結果。由圖7中可以看出訓練樣本集和測試樣本集隨著數據樣本的增大分割結果趨向于穩定,均維持在80%以上。

圖7 樣本分割結果
圖8為本文算法在MRI腦圖像上的分割結果,第一列為原始的輸入圖像,第二列為醫生手動分割的海馬體圖像,第三列為本文算法得到的分割結果。從圖中可以看出,采用本文算法對海馬體分割得到的結果與手工標注的結果基本接近。

圖8 分割結果示例
為驗證由數據增強后樣本擴充對實驗結果的影響,本文分別用兩組數據對算法進行實驗,其中一組圖像僅包含變形后的數據及其擴充樣本集,另一組圖像包含原始數據及其變形后的總的數據樣本集。實驗結果數據見表1。

表1 不同樣本集下分割結果對比
從表1可以看出,僅采用變形后的樣本集與全部數據集的實驗結果基本接近,這表明了采用數據增強的合理性,同時也驗證在本文中原始數據集在較小的樣本的情況下,采用包括圖像變形在內的方法進行數據擴充增大訓練樣本數量,可以使網絡性能在一定程度上得到提高。
為驗證算法的有效性及優越性,本文分別對全卷積神經網絡(FCN)和原始U-net網絡模型及本文算法在訓練集和測試集上進行對比驗證,實驗結果數據見表2。

表2 本文算法與其它算法的分割結果對比
從表中可以看出,本文改進的U-net算法較其它兩種方法分割性能有所提升,而且相比原模型提高了3.2%。FCN和原U-net模型性能相對較差的原因在于這兩個模型對特征的提取不夠好,不能有效地將海馬體從MRI圖像中分割出來。同時由于Adam算法的使用,網絡收斂速度較其它方法更快,因此本文算法與FCN及原始U-net算法相比較,取得的分割效果最好。
本文針對海馬體分割問題,提出了一種改進的U-net全卷積神經網絡。在神經網絡進行卷積的過程中輸入直接被連接到后面的層,從而殘差將直接被后面的層學習,對前面的學習過程進行補充,增加網絡了性能。實驗結果表明,本文改進的算法較全卷積神經網絡模型與傳統U-net模型具有更好的分割效果,并且收斂時間最短。但實驗本身仍然存在一些分割準確率低的問題,雖然我們對U-net做了一定的優化,但是分割效果也并不是十分理想。針對這一問題,擬在后續實驗中加入SE模塊,通過對通道進行加權,強調有效信息,抑制無效信息,實現更高精確度的海馬體分割算法。