李 響, 卜 巍, 鄔向前
(1 哈爾濱工業(yè)大學 計算機科學與技術(shù)學院, 哈爾濱150001; 2 哈爾濱工業(yè)大學 媒體技術(shù)與藝術(shù)學院, 哈爾濱150001)
醫(yī)學病變分割是計算機視覺領(lǐng)域一個具有挑戰(zhàn)的方向。 腫塊分割對于腫塊的形狀和病理分類都具有重要意義。 鉬靶圖像的成像原理是光線通過越密集的組織剩余量越少,成像越亮。 由于腫塊病變是一個類球的結(jié)構(gòu),成像時從病變中心到邊緣病變越來越薄,因此病變邊緣非常不明顯。 語義分割中有很多方法加入邊緣檢測,有助于場景的分割,而病變由于邊緣漸變的特性,標注的邊緣不足夠準確,訓練過程中邊緣周圍錯誤標注的像素反而影響網(wǎng)絡(luò)的訓練。 因此,本文利用形態(tài)學腐蝕操作生成計算損失的掩碼,使錯誤可能性高的邊緣周圍部分不參與損失的計算。
乳腺腫塊任務(wù)可以看作是像素級分類任務(wù),也可看作是腫塊的邊緣檢測任務(wù)。 目前有許多傳統(tǒng)方法被提出,來解決乳腺腫塊分割的問題,包括基于閾值的方法,迭代像素分類,區(qū)域增長,區(qū)域聚類,邊緣檢測,模板匹配和隨機松弛的技術(shù)[1-2]。 經(jīng)典的統(tǒng)計模型也用于分割問題,例如,Dhungel 等人運用多個深度置信網(wǎng)絡(luò)(DBN),高斯混合模型分類器和先驗作為潛在能量函數(shù),以及結(jié)構(gòu)化支持向量機(SVM)進行分割[3],也提出了使用深度置信網(wǎng)絡(luò)或卷及神經(jīng)網(wǎng)絡(luò)特征作為其潛在能量函數(shù)的結(jié)構(gòu)化支持向量機[4]。 僅基于全卷積網(wǎng)絡(luò)(FCN)方法也可進行圖像分割[5]。 但是,典型的全卷積網(wǎng)絡(luò)結(jié)構(gòu)不能準確地保留腫塊邊界。 為了克服這個缺點,Wentao Zhu 等人將全卷積網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)實現(xiàn)的條件隨機場連接在一起,可增強分割結(jié)果的結(jié)構(gòu)性[6]。 Vivek Kumar Singh 等人應(yīng)用條件生成對抗網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)腫塊分割,并以分割結(jié)果為輸入對腫塊形狀進行分類。
腫塊分割網(wǎng)絡(luò)的基線網(wǎng)絡(luò)總體結(jié)構(gòu)借鑒目前分割結(jié)果較好的Wentao Zhu 等人提出的網(wǎng)絡(luò)結(jié)構(gòu)。 本文在基線網(wǎng)絡(luò)上利用形態(tài)學腐蝕操作,生成計算損失的掩碼,掩碼將損失計算分為三部分:病變區(qū)、背景區(qū)和模糊區(qū),改變分割結(jié)果的對數(shù)損失計算,去除模糊區(qū)部分損失。 整個腫塊分割網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
輸入為40×40 的圖像塊,圖像輸入4 個不同感受野的全卷積網(wǎng)絡(luò),每個全卷積網(wǎng)絡(luò)包含3 個卷積層、兩個池化層,實現(xiàn)特征編碼,編碼結(jié)果為一個特征向量,通過一個反卷積層解碼特征向量,獲得初步分割結(jié)果。 4 個全卷積網(wǎng)絡(luò)的前兩層感受野分別為2、3、4 和5,這樣遞增的設(shè)置可以使網(wǎng)絡(luò)學習不同尺度上下文的細節(jié)特征。 以可學習的權(quán)重加權(quán)融合4個分割結(jié)果,融合結(jié)果輸入條件隨機場。 自適應(yīng)的權(quán)重使網(wǎng)絡(luò)可以根據(jù)數(shù)據(jù)集的特性選擇不同分割結(jié)果的比例,加權(quán)求和實現(xiàn)了多分類器投票的效果,提高分割準確性。 條件隨機場是給定一組輸入隨機變量X 的條件下,另一組輸出隨機變量Y 的條件概率分布模型。 實驗中應(yīng)用全連接的成對條件隨機場,以全卷積網(wǎng)絡(luò)的分割結(jié)果為條件,將像素標簽建模為馬爾可夫隨機場中的隨機變量。 Zheng 等人將條件隨機場實現(xiàn)為循環(huán)神經(jīng)網(wǎng)絡(luò),每次循環(huán)經(jīng)過四步優(yōu)化。 應(yīng)用對抗性訓練增強深層網(wǎng)絡(luò)的魯棒性,對抗性訓練的思想是,如果模型足夠強大,它應(yīng)該對訓練示例的小擾動保持不變。 網(wǎng)絡(luò)訓練過程中損失函數(shù)對輸入圖像求導,梯度矩陣方向的小向量作為對抗擾動,疊加到圖像上,再一次計算損失函數(shù)。
根據(jù)像素級分割標簽的結(jié)構(gòu),生成損失選擇掩碼。 將分割標簽分為腫塊標簽和背景標簽兩部分,應(yīng)用直徑為3 的濾波核對兩部分分別進行形態(tài)學腐蝕,腐蝕操作消除了腫塊標注邊緣的標簽,結(jié)合腐蝕后的兩部分生成掩碼。 掩碼白色區(qū)域是腫塊中心部分,為正樣本,損失函數(shù)為- log(p),掩碼黑色區(qū)域是遠離腫塊的背景部分,為負樣本,損失函數(shù)為- log(1 - p)。 灰色部分損失為0。 因為分割任務(wù)即為像素級分類,部分區(qū)域不計算損失不會影響網(wǎng)絡(luò)的反向傳播參數(shù)更新。

圖1 網(wǎng)絡(luò)結(jié)構(gòu)Fig. 1 Network structure
實驗應(yīng)用DDSM-BCRP 數(shù)據(jù)集,該數(shù)據(jù)集為劃分好訓練測試集的DDSM 子集。 在鉬靶圖像上采集腫塊所在圖像塊,縮放到40×40 大小。 網(wǎng)絡(luò)為端到端訓練,訓練學習率為0.003,以28 的批量大小訓練5 000 epoch。 訓練采用Adam 優(yōu)化方法。
醫(yī)學病變分割算法的評估,主要應(yīng)用DICE 系數(shù)。 為了證明本文方法的有效性,對基線方法和目前較好的腫塊分割方法進行了實驗對比,對比結(jié)果見表1。 本文的基線網(wǎng)絡(luò)精度達到了91.04%,加入腐蝕損失后方法提高了0.02%。 較目前比較好的方法都有超過1%的顯著提高。 分割可視化結(jié)果如圖2 所示。 病變邊緣漸變的現(xiàn)象并不只存在于鉬靶圖像中,大部分醫(yī)學圖像都有該現(xiàn)象,因此掩碼選擇計算損失方法可擴展到多種病變分割模型中。

表1 分割結(jié)果對比Tab. 1 Comparison of segmentation results

圖2 分割實例Fig. 2 Segmentation instance
腫塊分割與判斷腫塊形狀、腫塊分類和確定治療方案都有相關(guān)性。 腫塊分割可獲得腫塊的形狀和邊緣。 邊緣信息反映了其生長方式和生物學特性。邊緣不規(guī)則的、有毛刺狀的腫塊通常是惡性的,邊緣光滑、形狀規(guī)則的腫塊一般是良性的。 本文提出了基于腐蝕損失的腫塊分割算法,利用形態(tài)學腐蝕操作生成計算損失的掩碼,使錯誤可能性高的邊緣周圍部分不參與損失的計算,進一步提高目前較好的應(yīng)用全卷積網(wǎng)絡(luò)和條件隨機場進行腫塊分割的方法的分割性能。 實驗證明了本文的方法要比目前較好的幾個分割方法都更加有效。 同時,邊緣模糊的特性存在于多種醫(yī)學圖像中,本文的方法具有普適性,后續(xù)可應(yīng)用于其他醫(yī)學病變的分割算法。