陳國軍 尹 沖 滕一諾 王雯璇
(中國石油大學(華東)計算機科學與技術學院 青島 266580)
無人機圖像是遙感圖像的一種,近年來無人機因便攜性強、成本較低、成像效果好等優點,成為高分辨率遙感數據采集的重要手段,在資源調查、監測與分類等方面得到廣泛研究和應用[1]。傳統算法會受到淺層特征學習的泛化和復雜函數的表示等方面的制約。深度學習從大量的數據中抽取層次特征,能夠反映底層到高層的特征映射關系。
卷積神經網絡的發展,為圖像分割和分類提供新的思路。Long[2]等提出的FCN 將卷積神經網絡應用到分割任務上。Ronneberger[3]等提出的U-Net用于醫學圖像分割,結構簡單,樣本較少,訓練速度快。Chen 等提出多個版本的DeepLab。DeepLabv1[4]使用不同采樣率的空洞卷積獲取更多的上下文信息,DeepLabv2 提出空洞空間金字塔池化方法(ASPP),DeepLabv3[5]在ASPP中增加1*1卷積和全局平均池化。
隨著大規模、真實世界數據集的迅速增加,長尾問題越來越普遍(少數類占了大部分數據,而大多數類的代表性不足)[6]。類別重平衡大致劃分為兩大類,重采樣和重賦值[7~9]。這些方法通過樣本重采樣(數據增強,擴充少樣本),對損失重新賦權重調整網絡的訓練,使得樣本分布與測試中的樣本分布接近。重平衡策略能促進分類學習,在存在長尾問題的數據集中獲得識別準確率的提升[10~11]。
本文針對分割精度較低和數據長尾問題,并結合地物圖像特點在語義分割模型DeepLabv3 采取以下改進,將主干網絡ResNet101替換為ResNet152并添加預訓練模型,調整ASPP的擴張率,采用類別平衡損失函數來解決數據集的長尾數據分布問題。……