李玉慧,梁創學,李軍
華南師范大學物理與電信工程學院,廣東廣州510006
神經元結構分割是目前生物醫學圖像分析的重要課題之一[1]。然而,通過重建神經元結構來獲得對人類或動物神經系統功能連接性的深入了解是神經解剖學者們面臨的重大挑戰[2]。電子顯微成像(Electron Microscope,EM)是神經元結構成像的重要設備,但其成像數量巨大,采用人工分割的方式雖然能獲得很好的分割效果,但這卻是一項枯燥、繁瑣且耗時耗力的任務[3]。Helmstaedter 等[4]使用20 000 h的人工僅從小鼠視網膜重建了大約1 000 個神經元。自U-Net 在神經元結構分割中取得當時最好的效果后,基于深度學習的分割算法成為醫學圖像分割算法的主流方法[5-6]。因此,設計一種基于深度學習的精確、快速、有效的神經元結構分割算法對于研究神經系統功能有著重大意義。
自AlexNet 在2012年的ImageNet 競賽 中取得冠軍后,卷積神經網絡(Convolutional Neural Network,CNN)逐漸成為圖像特征提取的主流工具[7-8]。CNN的典型使用是在圖像分類任務上,一些優秀的模型如AlexNet[7]、VGG[9]、GoogleNet[10]、ResNet[11]等都會在網絡的最后加入一層全連接層,然后經過softmax后獲得圖像的類別信息。在生物醫學圖像分割任務中,期望的輸出應當是每個像素對應的類別。Long等[12]提出了全卷積網 絡(Fully Convolutional Network,FCN),主要思想是用卷積層代替全連接層,使得任意圖像大小的輸入成為可能,開啟了一種端到端的訓練模式。但是這種模型進行語義分割時有一個主要的問題:下采樣操作(比如pooling 層)會降低空間分辨率,削弱了空間“位置”信息。這個問題在編碼器-解碼器的結構(Encoder-Decoder)中得到有效解決。……