周瑞文
(中南民族大學 生物醫學工程學院,湖北 武漢 430074)
脊柱在所有年齡段中被認為是身體重要的成像部位之一,脊柱在保護人們身體中樞神經系統的脊髓方面起到了重要作用,如果脊柱存在任何損傷,整個身體將會受到影響,并且由于神經的高度集中,將會引起巨大的疼痛,隨著社會的飛速發展,人們生活節奏的不斷加快,脊柱疾病逐漸流行開來,背痛是普遍存在于人類的世界性健康問題。引起疼痛問題的原因可能有很多種,可以通過不同的治療方法進行治療,如物理療法,生化療法等。磁共振成像技術是診斷患者脊柱是否有問題的常用檢查技術。脊柱的MRI圖像具有脊柱邊界形態不規則,組織對比度較低,結構復雜等特征給脊柱圖像分割帶來了挑戰。因此,尋找一種有效的脊柱分割算法對實現脊柱的準確分割至關重要。
近年來,深度學習[1]被廣泛應用于MRI圖像分割領域。研究者們針對上述問題,提出了許多實現脊柱圖像分割的算法。如David R等[2]人通過CCSweep的方法把生成的脊柱形狀的均值信息用來實現半自動分割,這是一種將多可掃卷自動分解為多可掃卷的新方法。這種方法解決了不確定邊緣大小或區間匹配約束,過于依賴輸入網格離散化和不穩定環路等問題。Tobias Klinder等[3]提出在解剖模型中加入先驗形狀來提高醫學圖像分割結果的方法。脊柱的整體形狀是局部椎體坐標系統的集合,而獨立椎體則是三角曲面網格,通過適應模型吸引到的圖像特征,利用單個形狀的先驗邊和關于目標對象之間空間關系的附加信息對數據集進行并行分割。李帥等利用核磁共振圖像中椎間盤與椎骨灰度的鮮明對比,將距離規則化的無須初始化水平集模型應用于脊柱MRI圖像,提出一種改進的標記符分水嶺算法對椎間盤進行分割。葉偉等[4]采用各向異性擴散濾波器對脊柱的MRI圖像進行預處理,然后用核密度估計方法來確定模糊C均值聚類的初始聚類中心值,采用模糊C均值算法進行分割圖像。
為進一步提高脊柱圖像的分割質量和準確度,本文研究提出了一種基于Unet的新的圖像分割方法Unet++,通過此方法可提高脊柱MRI圖像的分割敏感度和精度。
深度學習模仿了人類大腦的神經連接并建立了類似的結構模型。現代深度學習中包含數十個到上百個連續的表示層,這些表示層都是從訓練數據中自動學習的。數據模型中包含多少層,稱為模型的深度。神經網絡的結構逐層堆疊,通過學習深層次圖像的特征,得到更加準確的圖像信息。
全卷積神經網絡[5]如Unet網絡被證明非常適用于幾乎所有醫學圖像的語義分割,并證明取得了比傳統方法更好的效果。目前主要是通過對Unet網絡進行添加多尺度塊、殘差等方式來修改網絡結構,或者通過添加批歸一化層[6]來提高分割精度。
針對脊柱分割,本文通過加深Unet網絡結構層,重新設計連接方式,聚合不同譯碼子網絡尺度特征,并通過剪枝,形成靈活的特征聚合方法,提高學習推理速度,極大程度地提高了分割精確度。本方案網絡結構如圖1所示。

圖1 unet++網絡結構
此網絡通過編碼器-解碼器這種對稱網絡進行數據的學習,重新設計了一系列包括嵌套,密集和跳躍路徑。由不同深度的U型網絡組成,這些U型網同時進行訓練,這樣不但提高了網絡的整體分割性能,而且可以實現網絡模型的剪枝,允許攜帶不同尺度特征的圖片沿著跳躍連接在聚合層與解碼器的特征圖進行融合,突破了不必要跳躍連接的限制,可以捕捉更多語義特征圖的細節,有助于還原降低采樣帶來的信息損失。此網絡重新設計跳躍路徑如下:xi,j表示結點Xi,j的輸出,i代表編碼方向的下采樣層索引,j代表沿著跳躍路徑的密集塊卷積層的索引。由xi,j表示的特征圖計算如下:
(1)
函數H(.)是一個卷積操作,且緊跟一個激活函數。μ(.)是一個上采樣操作,[]表示疊層。j=0的節點從編碼路徑的先前層接收一個輸入,j=1的節點接收兩個輸入,它們都來自編碼子網絡且是兩個連續的層,j>1的節點接收j+1個節點,其中j個輸入是在相同的跳躍路徑的先前j個節點輸出,而最后一個輸入是從更低一層的跳躍路徑的上采樣的輸出。先前的特征圖都會累積到當前節點的原因是因為沿每個跳過路徑使用了密集的卷積塊。
實驗數據為2019年全國醫學創新設計大賽210個成人脊柱MRI圖像,將195個作為訓練集,15個作為測試集。將三維MRI圖像轉化為512×512的二維MRI圖像(其中含有金標準圖像)。轉化后的二維MRI圖像見圖2。

圖2 二維MRI脊柱圖像
實驗采用改進的unet網絡,使用Dice相似性系數,Sensitivity靈敏度和PPV來評價分割結果。Dice相似性系數是分割后圖像與金標準圖像的重合度,靈敏度Sensitivity是用來計算TP和FN的量,PPV是衡量TP與FP之間的數量關系。
(2)
(3)
(4)
其中TP、FP和FN分別表示真陽性、假陽性和假陰性的數量。
本文討論了圖像像素的二分類問題,即分別對圖像中的前景像素和背景像素進行分類。實驗過程中網絡的卷積層采用3×3大小的卷積核,學習率設置為0.0001,批次設置為4,迭代次數為100。本研究提出的網絡分割方法可以較清楚的呈現分割后的脊柱MRI圖像。輸入圖像、標簽圖像及網絡分割后的結果如圖3所示。

圖3 網絡輸出圖像與原始標簽圖
由網絡輸出圖像3(c)與標簽圖像3(b)對比圖可知,本文網絡分割結果與原始圖像具有較高的相似度。表1呈現的為unet和unet++分割脊柱MRI圖像在Dice相似性系數,Sensitivity靈敏度和PPV三種評價指標下的對比。

表1 不同網絡分割結果對比
此前趙燕燕[6]改進的控制標記符分水嶺分割算法,葉偉[4]等利用基于模糊C均值聚類分割算法,以及Claudia Iriondo[7]等通過定量MRI圖像的不同方法得到的分割結果如表2所示。
本文為了更精確地分割脊柱MRI圖像,提出了unet++。本網絡的結構重新設計了網絡層的跳躍連接路徑和深度監督,重新設計的跳躍路徑減少了編碼器和解碼器子網絡特征映射之間的語義隔閡,從而使優化器解決的優化問題更加簡單。深度監督還可以使分割更加準確,尤其是脊柱出現側彎等問題時,可以被快速清楚地發現。本實驗無需引進形狀先驗信息或人工提取特征,是一種自動分割網絡,可以描述數據的深層信息變化,且分割結果明顯高于其他一些傳統方法,本實驗雖然在分割圖像的精度上有所提升,但是對硬件條件有較高要求,有待優化及進一步深入研究。

表2 不同分割方法結果對比