李紫薇, 英昌盛, 于曉鵬, 丁婷婷
(吉林師范大學 計算機學院, 吉林 四平 136000)
遙感圖像中的建筑物分割能記錄區域地表的綜合特征和地物個體特征, 提供細致、 真實、 可靠的基礎數據, 廣泛應用于城市規劃、 變化檢測、 地理信息系統構建等領域[1]. 受高分辨率遙感圖像的成像因素以及建筑物自身的尺寸和形狀特征多樣性的影響, 遙感圖像建筑物分割一直是該領域的研究重點和難點. 傳統的建筑物分割方法多基于人工構造特征結合傳統圖像分割方式, 針對特定的場景實現建筑物分割[2-3], 但這種方法無法達到自動分割建筑物的目標, 且分割結果精確度較低、 魯棒性較差.
隨著神經網絡的發展, 卷積神經網絡(convolutional neural networks, CNN)以其強大的特征提取能力在圖像處理領域廣泛應用. Simonyan等[4]基于CNNs提出了一種用于圖像分類的網絡VGGNet, 但該網絡無法直接應用于遙感圖像建筑物分割任務; Long等[5]提出了全卷積神經網絡(fully convolution network, FCN), 將VGGNet的全連接層全部替換為卷積層, 在圖像的像素級進行分類進而實現分割, 這種方法克服了傳統分割算法的缺點, 使語義分割成為圖像分割的主流模式; Ronneberger等[6]在FCN的基礎上提出了一種編碼解碼結構的全卷積神經網絡U-Net, 利用跳躍連接將上采樣和下采樣的特征圖進行融合, 使分割結果更精細, 但FCN和U-Net均采用反卷積操作進行上采樣, 參數量大且運算復雜; Badrinarayanan等[7]提出了一種對稱編碼解碼結構的全卷積神經網絡SegNet, 利用下采樣時保存的索引信息進行上采樣, 減少……