






摘 要:為了解決高分辨率遙感影像中道路提取的質量和效率問題,本文提出了一種融合CBAM的改進UNet++的道路提取方法。在原始UNet++網絡中引用CBAM,對損失函數進行改進,并使用一種新的聯合損失函數。試驗結果表明,與U-Net、SegNet和UNet++網絡相比,本文方法在IoU、Recall、OA和Kappa方面均是最優秀的。其中,OA和Kappa分別為94.92%和0.9202。綜上所述,本文方法能夠有效進行高分辨率遙感影像道路提取,具有一定的泛化能力,能夠為道路的防護和規劃提供支持。
關鍵詞:道路提取;遙感影像;U-Net++;CBAM:損失函數
中圖分類號:P 23" " " 文獻標志碼:A
高分辨率遙感影像被廣泛應用于生活發展的各個方面,例如災害監測、導航定位、道路矢量化和城市規劃等[1]。其中,道路是重要的地理信息,在生活發展中具有著不可替代的作用。
基于高分辨率遙感影像的道路提取方法有多種,其中四種方法最為普遍,分別為基于道路形狀、基于道路紋理、基于圖像灰度閾值和利用深度學習進行提取。目前,UNet++神經網絡被提出,后被廣大學者所應用[2-3]。BOUSIAS等利用UNet++網絡對高分辨率遙感影像進行變化檢測任務,訓練和評價了UNet和UNet++神經網絡。雖然UNet++網絡在高分辨率遙感影像的變化檢測任務中具有較好的性能,但是面對高分辨率遙感影像復雜的特征信息時,仍然存在邊緣細節提取不完全、提取結果不連續等問題。
針對提取不完整和提取不連續等問題,本文在UNet++的基礎上進行改進,提出一種能夠有效提取高分辨率遙感影像道路的方法,即利用多層次融合結構提取深層和淺層特征并結合CBAM模塊,增強對道路特征信息的辨識能力,并改進損失函數,以提高遙感影像的道路提取精度。
1 道路提取網絡結構設計
1.1 改進的UNet++
本文方法以UNet++網絡為基礎,進行了3個方面的改進。1) 通過多層卷積提取道路特征,深層和淺層特征融合后再利用上采樣進行恢復,得到多層級別的道路語義信息。2) 在UNet++中融合CBAM模塊,利用CBAM提高對道路特征信息的辨別能力,減少對非道路特征的學習能力。3) 融合2種新型損失函數,得到更有效的損失函數。該函數具有更好的穩定性,與交叉熵相比更能解決類不平衡問題。由于本文算法是在UNet++的結構上進行改進,因此與原結構相似,包括編碼器-解碼器組成。影像在編碼中得到道路特征信息,在解碼器中恢復邊界特征,以此進行道路特征提取,如圖1所示。
在編碼器中,卷積提取道路特征并通過激活函數進行非線性表達,再通過池化作用逐層減少特征圖尺寸和參數。在本文結構中,多層次卷積特征通過每一層次的卷積操作增加通道,進而對道路信息進行逐層特征提取。在解碼器中,通過上采樣將特征圖恢復為輸入大小,并通過卷積操作和激活函數逐漸恢復道路的邊界細節信息。在解碼器中,嵌套的多個解碼器可使不同特征圖共同作用,以便適應不同的特征信息提取,提高網絡模型的適用性。然后在不同深度的特征圖后使用CBAM模塊,進一步篩選識別道路特征,以此提高對道路特征信息的識別能力,減少參數并防止出現過擬合現象。CBAM模塊學習不同層次的特征并得到權重值,權重值與上采樣得到的特征信息圖融合為最終的權重分割圖WSM(Weighted Segmentation Map,WSM),可進一步提高道路提取的分割精度。在最終層,對每一個像素進行分類,在softmax激活函數的作用下完成類別預測。此外,在改進的聯合損失函數的作用下,難以分割的特征得到了有效關注,提高了分割精度。
1.2 多層級特征融合結構
多層次特征融合結構是利用多層次特征卷積提取道路的深層和淺層信息并進行道路分割的結構。具體結構如圖2所示。與UNet直接進行4次下采樣不同,該結構通過1次下采樣D1、2次下采樣D2、3次下采樣D3和4次下采樣D4來提取不同層深度特征的語義信息。
1.3 CBAM模塊
在高分辨率遙感影像道路分割任務中,道路目標具有形狀多樣、大小不一等特點,這就導致使用單一的上采樣操縱無法準確識別道路的邊界特征,進而影響道路提取的整體精度。為了能夠準確解決邊緣細節提取不準確的問題,本文在每個多層次特征融合結構后均添加了CBAM結構。進行上采樣提取時,不同的提取結果通常具有多樣性,單一的上采樣無法準確識別每層特征圖的道路邊界,因此需要在每層后均增加CBAM結構。在多層特征結構后添加CBAM能夠將加權信息作用到各個特征圖中,進而提升分割精度,如圖3所示。
1.4 聯合損失函數
目前的遙感影像分割任務中損失函數較多,其中常見的損失函數包括交叉熵損失函數和骰子系數損失函數。在交叉熵損失函數中,通常正樣本與負樣本的數量比例會使模型預測結果有偏差,進而導致分割精度下降。DICE損失函數的本質是DICE系數的相反數。DICE系數是一種集合相似度度量函數,通常用于計算2個樣本的相似度(值范圍為[0,1]),如公式(1)所示。
(1)
式中:Yb、分別為第b張圖片的向量化后的真實標簽和對應的預測概率;N為批量大小。
該混合損失函數可使網絡訓練過程較穩定,并能提高模型預測的分割精度。
2 試驗結果和分析
2.1 數據集構建
將改進的UNet++網絡在Massachusetts道路數據集進行對比試驗。Massachusetts道路數據集空間分辨率為1m,切片大小為(512×512)dpi,最終選取640張照片作為試驗對象。將其按照7∶2∶1的比例劃分為訓練集、測試集和驗證集。2個數據集上的部分影像和對應的標簽如圖4所示。
2.2 試驗結果于分析
為驗證上述方法的有效性和優越性,本文在Massachusetts道路數據集上以SegNet、UNet、UNet++和本文提出的改進UNet++道路提取方法進行試驗,并比較試驗結果。部分試驗提取結果如圖5所示。
從圖5可以看出,在4組試驗中,當道路結構較簡單時,4種方法均具有不錯的提取效果。但是當道路情況較復雜時,SegNet和UNet的提取效果較差,提取結果存在嚴重的道路不連續現象,完整度較差。圖5(p)和圖5(u)中還存在提取不準確的現象。SegNet的提取結果比UNet提取結果更好一些,但是提取結果的連續性仍然較差。UNet++的提取結果比UNet和SegNet更好,不連續現象明顯改進,提取結果更優。但是UNet++的提取結果在邊緣細節處理和道路連續性方面仍然不盡如人意,提取結果存在道路不連通、邊緣細節丟失等情況。本文方法的提取結果在提取不連續現象方面得到了明顯的改進,提取結果邊緣細節更詳細。這得益于本文引用的CBAM模塊,對道路的特征信息篩選進行了改進,能夠準確識別道路特征。并且本文應用了新的聯合損失函數,使網絡訓練更穩定,提取結果邊緣細節更詳細,整體提取結果更完整。以上均說明本文方法的更具有效性和優越性,適用于高分辨率遙感影像道路的提取任務。
Massachusetts 道路數據集對比方法在道路提取中的定量評價結果見表1。從中可以看出,UNet網絡和SegNet網絡的MIoU分別為61.67%和70.82%,均低于UNet++網絡。而本文方法的MIoU比UNet++高7.01%。從Recall來看,UNet為75.76%,SegNet為64.57%,UNet++為80.23%,
本文方法高于其他3種方法,比UNet高13.31%。從OA來看,本文方法為94.92%,其他方法均低于90%。從Kappa系數來看,UNet網絡為0.7045,SegNet網絡為0.7594,UNet++網絡為0.8176,本文方法為0.9202,遠高于其他3種方法。以上定量指標均說明本文方法在引用CBAM模塊和改進的損失函數后,道路特征識別有所提升,能夠有效地進行高分辨率遙感影像道路提取,驗證了本文算法的可行性。
3 結論
本文提出了一種適用于高分辨率遙感影像道路提取的改進UNet++網絡,在UNet++網絡的基礎上融合CBAM模塊,使提出網絡更高效且更有針對性。利用新的融合損失函數,本文方法對道路特征信息的識別能力得到進一步增強,提高了提取精度。道路提取結果的定量分析表明,本文算法在各項評價指標上均優于其他3種方法,說明本文算法更具高效性、準確性以及針對性。
參考文獻
[1]王偉.基于深度學習的高分辨率遙感圖像分割方法[J].智能計算機與應用,2023(10):156-158.
[2]趙久玉,蔡建超.基于Unet++網絡的數字巖心圖像分割泛化能力[J].中國石油大學學報(自然科學版),2024(2):118-125.
[3]王書韜,史明昌,陳春陽,等.UNet++結合BP神經網絡提取地表覆蓋類型[J].武漢大學學報(工學版),2024(1):121-128.