馬澤源 王 瑜
(北京工商大學計算機與信息工程學院 北京 100048)
近年來腦部疾病,尤其是腦腫瘤的發病率迅速攀升,死亡率又居高不下,給居民健康帶來了很大的威脅[1]。為了能盡早對腦腫瘤進行診斷與治療,醫務人員提出了各種新型醫學成像技術,以便輔助診斷,將腦腫瘤病變部位與正常腦組織分割開來,從而根據病情準確地為患者制訂治療方案,例如X射線、計算機斷層掃描(Computed Tomography,CT)以及MRI等。在這些成像技術中,MRI技術以無傷害性、軟組織對比度強等優勢成為臨床治療上的首選。腦腫瘤中最常見的種類是神經膠質瘤,占腦腫瘤病例中的30%,其中80%的惡性腫瘤為神經膠質瘤[2]。神經膠質瘤具有很強的侵染性,通常與病變部位附近的正常腦組織互相滲透,再加上腦瘤經常伴生著腦水腫以及腦部壞死,導致診斷困難,且MRI影像存在特征少,對比度不明顯,紋理變化小等特性,更加增加了診斷的難度,時常會有誤診或漏診,對患者的健康產生了很大的威脅。
從20世紀60年代開始,隨著醫學應用以及科學發展的需要,針對腦腫瘤圖像分割的新理論、新算法相繼被提出來,并取得了越來越好的效果。深度學習方法優勢明顯、效果顯著,其中卷積神經網絡(Convolutional Neural Networks,CNN)經常被使用。Wang等[3]提出一種基于全卷積神經網絡(Fully Convolutional Networks,FCN)的方法,使用3組FCN,根據腦腫瘤等級分步對腦腫瘤進行分割。Sajjad等[4]提出一種CNN,首先分割出腦腫瘤的大致輪廓,再進行數據擴大,然后使用FCN提取出邊緣,將兩者進行融合,最后使用全卷積層將腫瘤按照等級分類,實現腦腫瘤的分割。Chen等[5]將四種模態的腦腫瘤MRI圖像分為兩部分,分別輸入兩個結構相同的分割網絡,一個負責分割出腦腫瘤的邊緣,另一個負責分割出腦腫瘤的整體,將兩個網絡的結果融合起來,從而實現分割。CNN對于腦腫瘤MRI影像這種紋理信息少的醫學圖像,常常無法準確區分腦腫瘤與正常組織的交界邊緣。為了解決以上問題,有的學者提出分割前增加各種預處理方法,如各向異性擴散(Anisotropic Diffusion)濾波算法、降噪算法和顯著度增強算法等,為后續分割任務提供高質量數據源。
顯著度增強是一種根據人眼機理而提出的輔助圖像處理方法,可以分成三類。第一類是基于全局特征的算法,王剛等[6]提出先對圖像進行非局部均值(Non Local Means, NLM)濾波,再計算每個像素點與全局像素點平均值之間的歐氏距離,將顯著度區域區分出來。第二類是基于局部特征的算法,Jiang等[7]通過比較某像素點與其鄰近的像素點,再將其結果用馬爾科夫鏈進行計算,檢測顯著度區域。第三類是局部與整體特征結合的方法,侯慶岑等[8]提出利用圖論的方法,將圖像劃分為若干區域,再根據各區域像素平均值的大小檢測顯著度區域。
本文在上述預處理方法的啟發下,將自然圖像處理中應用很廣泛的顯著度增強技術與深度學習結合,提出一種結合頻率調諧全局顯著度增強與深度學習的MRI腦腫瘤影像全自動分割方法。主要思想包括:使用高斯濾波對圖像進行降噪,根據像素點像素值與全局像素平均值的差值對圖像進行分段式增強,然后用預處理后的MRI訓練深度學習架構,如寬殘差金字塔池化網絡(WRN-PPNet)[9]和UNet[10],對腦腫瘤進行分割,在Brats2015數據庫的實驗中顯示,該方法在MRI影像上獲得了很好的分割準確度和敏感度。
本文提出的顯著度增強方法,基于頻率調諧進行處理,根據像素點在圖像全局中的顯著程度,對像素點進行不同程度的增強,從而檢測出顯著度增強。其具體步驟如下:
(1)輸入圖像,對其進行高斯濾波,消除圖像中的噪音。
(2)計算各像素點的全局顯著度,并根據全局顯著度進行顯著度增強,全局顯著度的計算公式如下:
(1)
式中:O為全局顯著度;I為全圖像素點平均值;T為某一點像素值。由于MRI影像中有很多的黑色背景,像素值為0,因此在計算全圖像素點平均值時不考慮這些點,以提高增強效果。然后根據各像素點的全局顯著度對像素點進行分段式增強:
(2)
式中:T′表示增強后的像素值。
本文使用WRN-PPNet和UNet深度學習網絡框架分割增強后的腦瘤圖像。UNet是FCN的改進網絡,很好地克服了FCN需要大量訓練數據、不擅長分割醫療圖像以及無法保留空間位置信息等缺點,其結構如圖1所示。整個網絡包含4次上采樣,4次下采樣,卷積核大小為3×3,卷積時對邊緣進行填充處理。上采樣由兩個卷積層與一個最大池化層組成,下采樣由兩個卷積層與一個反卷積層組成,每次反卷積后都將特征圖與對應上采樣所得的特征圖的核心疊加起來。分類層由兩個3×3卷積層與一個1×1卷積層組成,最后由Sigmoid分類器進行分割。UNet通過跳層連接保留了更多的底層信息,適合于分割特征稀少,邊緣不清晰的醫療圖像。

圖1 UNet結構圖
WRN-PPNet由寬殘差模塊、金字塔池化模塊,以及尺寸恢復模塊組成,其結構如圖2所示。寬殘差模塊由3層組成,每一層由4塊寬殘差塊組成,加寬系數為3,每一層都由2層批標準化層與2層3×3卷積層交叉而成,批標準化有利于加快訓練速度,并遏制梯度爆炸。金字塔池化網絡模塊由三條通路組成,池化核半徑分別為4×4、2×2和1×1,三條池化路徑皆為平均池化,第一條池化通路在池化過后,將縮小到原尺寸四分之一的特征圖輸入到連續兩個雙3×3卷積-上采樣的尺寸恢復結構,雙卷積是為了對特征圖進行優化,上采樣的結構會將特征圖的尺寸恢復到輸入特征圖的大小,最后將三通路的結果與輸入特征圖融合到一起。尺寸恢復模塊的結構中含有兩個雙3×3卷積-上采樣尺寸恢復結構,將神經網絡處理過后的特征圖恢復到原始數據的大小,以方便醫務人員的診斷。

圖2 WRN-PPNet網絡結構圖
本文采用的定量評價指標包括Dice系數、靈敏度(Sensitivity)系數、PPV,其中:Dice系數表示全自動分割得到的結果與醫務人員分割的正確結果之間的重合程度;靈敏度表示得到正確分割的腫瘤區域占真實腫瘤區域的比例;PPV表示正確分割的腦腫瘤區域占模型分割出的腦腫瘤區域的比例。
Dice系數公式為:
(3)
Sensitivity系數公式為:
(4)
PPV系數公式為:
(5)
式中:P為網絡分割出的腦腫瘤區域;T為真實腦腫瘤區域;∩表示交集;∪表示并集。
為了驗證提出算法的有效性,本文設計了一系列實驗,實驗所用的操作系統為Ubuntu 16.04 LTS,使用的語言為Python 3,UNet和WRN-PPNet 網絡模型由深度學習框架Tensorlayer搭建,模型在一塊顯存為12 GB的GPU(NVIDIA Titan X(Pascal))上訓練。
在本文中,UNet的節點數隨著層數從64上升至128乃至1 024,然后再降低到64,激活函數為線性整流函數。在 WRN-PPNet模型中,WRN 模塊中殘差塊的大小為3×3,特征圖逐次縮小二分之一,在PPNet模塊中,所有層的節點數均為128,在尺度恢復模塊中,除最后一層外,所有層的節點數均為64,最后一層節點數為1,除最后一個卷積層外,所有卷積層的卷積核均為3×3,最后一個卷積層的卷積核大小為1×1,模型中所有的激活函數均為線性整流函數,最后一層的激活函數為Sigmoid。
為了使神經網絡加快收斂,減少訓練時間,本文采用了批標準化方法(Batch Normalization,BN),可以克服神經網絡層數加深導致難以訓練的難題。在神經網絡中,每一層的輸入在經過層內操作之后,必然會導致與原來對應的輸入信號分布不同,并且前層神經網絡的增加會被后面的神經網絡不斷地累積放大。解決這一問題的思路就是根據訓練樣本與目標樣本的比例,對訓練樣本進行矯正,通過一定的規范化手段,把每層神經網絡任意神經元的輸入值分布強行拉回到均值為0、方差為1的高斯分布。這樣使得激活輸入值落在非線性函數對輸入比較敏感的區域,導致輸入的較小變化會引起損失函數較大的變化,讓梯度變大,避免產生梯度消失問題,而且梯度變大意味著學習收斂速度快,能大大加快訓練速度。
本文使用2015年四種模態(Flair、T1、T1c和T2)腦腫瘤分割挑戰賽的數據進行實驗驗證,數據來源于Virtual Skeleton 數據庫(Virtual Skeleton Dataset,VSD)[11],具體任務是分割出MRI圖像中腦腫瘤區域,并得到腦瘤區域、腦瘤核心區域、腦瘤增強區域的分割準確率。抽取186名患者四種模態MRI影像作為實驗數據,其中選取136名患者的影像作為訓練樣本,50名患者的影像作為測試樣本,每名患者的MRI影像的大小為240×240×155 dpi,格式為.nii,對其進行切片后可以得到21 080×4片訓練切片與7 750×4片測試切片,其中“4”代表四種模態,各模態切片如圖3所示。UNet的學習率為萬分之一,WRN-PPNet的學習率為千分之一,最大訓練次數為100輪,并采用EarlyStoping監督神經網絡進行訓練,當驗證集的分割準確度不再提升時便停止訓練,這種方法可以有效地節約訓練時間。

圖3 四種模態的MRI影像
顯著度增強前后的對比如圖4所示,其中第一行為原圖,第二行為顯著度增強后的結果。經過顯著度增強的腦腫瘤MRI影像對比度得到提高,從而為后續深度學習網絡分割腦腫瘤任務提供高質量數據源,有利于特征提取,提高了分割準確度。

圖4 顯著度增強效果對比圖
為了驗證本文提出的顯著性增強方法對腦腫瘤分割具有明顯的提升作用,本文在UNet與WRN-PPNet兩種神經網絡結構上測試分割結果,兩種網絡對腦腫瘤分割得到的結果如圖5所示,其中MRI為腦腫瘤圖像,GT為專家手動標識結果,Predict為全自動分割結果。具體實驗結果如表1所示,其中whole表示腦腫瘤區域,core表示腦腫瘤核心區域即非增強及增強腫瘤區域,enhance表示增強腫瘤區域。

圖5 網絡分割結果

表1 分割結果 %
從圖5可以看出,本文所使用的算法實現了端對端的全自動分割,并且無須技術人員的干預,分割腦腫瘤圖像準確,邊緣清晰,能較好地解決腦腫瘤、水腫和正常腦組織邊際不清的問題,為輔助醫務人員進行診斷提供客觀參考。
從表1的實驗結果可知,本文提出的顯著度增強方法在腦腫瘤分割任務中起到很明顯的輔助作用。在三種指標的定量分析中,分割準確率都有較明顯的提高,如WRN-PPNet網絡的分割結果:Dice指標提高了4%,靈敏度提高了3%,PPV提高了4%;UNet網絡的分割結果:Dice指標提高了4%,靈敏度提高了4%,PPV提高了3%。總體來說,顯著度增強在WRN-PPNet與UNet上都得到了很好的結果,驗證了其有效性。
MRI以其無損傷性和軟組織成像度高等優點,成為目前腦腫瘤診斷的主要輔助設備。本文提出一種基于顯著度增強和深度學習的腦瘤全自動分割方法。實驗結果表明,分割準確率可以達到86.5%,能夠較好地實現腦腫瘤全自動分割。未來的工作是設計更好的顯著度增強預處理方法及新的深度學習網絡架構。