



摘要:針對遙感圖像山體滑坡分割提取難度大、精度低等問題,提出了一種基于改進U-Net網絡的遙感圖像山體滑坡分割提取方法。首先將原始網絡中的特征提取模塊用殘差網絡ResNet進行替換,加深網絡防止梯度消失,可以學習到更深層的特征;其次,融入(multi-scale features fusion module)多尺度特征融合注意力模塊增強發現山體滑坡區域的能力;最后,采用廣義的損失函數FTL(Focal Tversky Loss)替換帶權重的交叉熵損失函數以平衡準確率和召回率之間的關系。實驗結果表明,改進后算法mIoU為65.92%,比改進前提升了2.5個百分點,mPA為73.93%,比改進前提升了3.56個百分點,F1-score綜合得分指標為60.08%,比改進前提升5.09個百分點。改進后模型算法能有效提高山體滑坡分割性能。
關鍵詞:遙感圖像;山體滑坡分割;U-Net網絡;ResNet;損失函數
中圖分類號:TP277;TP311.1文獻標識碼:A文章編號:1009-3583(2024)-0090-04
Landslide Segmentation Extraction from Remote Sensing Images Based on Improved U-Net Network
SUN Xie-yao1,LI Xiu-ru2,HOU Xiu-li1,YIN Xi-xiang1
(1.Anhui Business College,Wuhu 241000,China;2.Ma’anshan University,Ma’anshan 243000,China)
Abstract:A remote sensing image landslide segmentation and extraction method based on an improved U-Net network is proposed to address the difficulties and low accuracy of remote sensing image landslide segmentation and extraction.Firstly,replacing the feature extraction module in the original network with the residual network ResNet and deepening the network to prevent gradient vanishing,we can learn deeper features.Secondly,incorporating the MSF(multi-scale features fusion module)can enhance the ability to discover landslide areas in mountains.Finally,a generalized loss function FTL(Focal Tversky Loss)is used to replace the weighted cross entropy loss function to balance the relationship between accuracy and recall.The experimental results show that the improved algorithm has an mIoU of 65.92%,which is 2.5 percentage points higher than before,anmPA of 73.93%,which is 3.56 percentage points higher than be-fore,and an F1 score index of 60.08%,which is 5.09 percentage points higher than before.The improved model algorithm can effectively improve the segmentation performance of mountain landslides.
keywords:remote sensing image;mountain landslide segmentation;U-Netnetwork;ResNet;loss function
圖像分割是圖像處理的重要組成部分,也是圖像分析的關鍵步驟,目的是提取圖像中的一些有意義的區域[1]。由于圖像分割目標與特征的不同,分割方式也不盡相同,針對不同的應用場景有不同的分割方式。從遙感圖像中提取有價值信息一直以來都是人工智能領域和遙感領域中的研究熱點,因為有著很高的應用價值[2]。基于遙感圖像信息的提取與分析也是監測地球的重要方式[3],在自動駕駛、災害評估、地理信息更新等方面有著廣泛應用。例如胡宏宇等人[4]基于VGGU-Net框架構建編碼器-解碼器網絡,并設計了一個卷積塊,提出了一種面向自動駕駛的基于VGGU-Net++的遙感影像路網檢測方法;車子杰等人[3]將遙感影像進行融合,并將標準卷積用深度可分離卷積與空洞卷積替換,構建新的網絡模型,提出了一種基于改進U-Net網絡的多源遙感影像洪澇災害信息提取;高亦遠等人[5]將U-Net分割模型和Vision Transformer(ViT)集成,將自注意力機制引入CNN中,提出了一種基于自注意力機制的遙感影像建筑物提取方法,該方法有了提取多層次細節信息和全局信息的能力。
雖然目前很多學者對災害的研究已經相當深入與成熟[6],但借助于人工智能技術對遙感圖像地質災害山體滑坡的圖像分割研究卻不多。根據現有資料,地質災害類型主要包括滑坡、崩塌、不穩定斜坡及地面塌陷[7]。但由于遙感圖像的山體滑坡背景復雜,存在其他尤其是樹林的干擾,因而從遙感圖像中盡可能地準確無誤地提取出山體滑坡信息仍然是有挑戰性的。文中提出的基于改進U-Net網絡能有效將遙感圖像山體滑坡進行分割提取。
1 U-Net網絡概述
U-Net網絡是由Ronneberger O等人[8]提出的一種二分類分割網絡,U-Net網絡是在增強型全卷積神經網絡(FCN)的基礎上改進而來,能有效提高圖像特征重構能力。由于整個網絡呈現典型的U型結構,所以叫U-Net網絡,左邊來源于增強型全卷積神經網絡FCN的結構,主要是從原始圖像中經過卷積、下采樣后得到高語義的特征圖。U-Net網絡結構如圖1所示。
針對遙感圖像山體滑坡的語義特征,原始U-Net網絡存在一定的提取缺陷,比如遙感圖像山體滑坡不同層次特征不能更好提取、卷積的感受野區域對發現山體滑坡的能力有限等等。由于訓練樣本的原因,不能更好地權衡準確率和召回率之間的關系。
2 U-Net算法改進
2.1引入殘差網絡ResNet
網絡性能的提高可以將遙感圖像中不同層次的特征進行更好地提取,所以隨著網絡的加深,遙感圖像中的目標分割效果會有所提升,但是簡單地對網絡加深會帶來一些問題,比如梯度爆炸或消失。殘差網絡思想油然而生,殘差由He K等人[9]提出,對卷積神經網絡做了改進,避免了梯度爆炸或消失的問題。殘差網絡由殘差塊組成,殘差塊結構如圖2所示。輸入為x,殘差指的是F(x),最后輸出是F(x)+x。
2.2多尺度特征融合注意力模塊
在遙感圖像中,山體滑坡區域不僅是在某一個區域,在一張遙感影像圖中也可能存在多個山體滑坡區域。由于卷積的感受野區域決定了特征區域范圍,因而感受野較大或者較小都會使模型對遙感圖像中的山體滑坡區域分割造成影響。為了提高模型的性能,增強其發現山體滑坡區域的能力,引入多尺度特征融合注意力模塊[10](multi-scale features fusion module)。MSF在2022年由謝娟英等人[10]提出,其實驗表明,該模塊能有效提高對目標區域的分割效果。MSF模塊示意圖如圖3所示。
由圖3可知,該模塊使用了三種不同的卷積核進行特征的提取,提取后特征通過歸一化N和ReLU激活函數激活后再進行特征融合,以此來減少卷積時的特征丟失,保留更多信息。融合后特征再經過GAM模塊(GlobalAttention Module)與SAM模塊(Spa-tial Attention Module)組成的分支,以及LAM模塊(Lo-cal Attention Module)和SAM模塊構成的另一個分支,組合后形成新的特征圖。新特征圖具有更多的特征信息。假設輸入通道數、高、寬分別為c、h和w,M'則特征圖表達式如式(1)所示,特征M'經過GAM和LAM得到特征MG和ML,分量加和后得新特征圖NM。MG、ML和NM表達式如式(2)(3)(4)所示。
2.3損失函數改進
損失函數簡單來說是用來估量一個模型的預測與真實的不一致程度,該值越小,說明模型效果越好。原算法中采用的損失函數為帶權重的交叉嫡損失函數,表達式如式(5)所示。表達式中含有w(x)進行加權,這和分割任務有關,該損失函數由Ronne-berger O等人[8]為了加強粘連的同類細胞之間的分割線改進而來。
E=Σx∈w(x)log(pk(x)(x))(5)
其中:
pk(x)=exp(ak(x))/(Σk'(K)=1 exp(ak(x)))K(6)
w(x)=wc(x)+w0·exp(-((d1(x)+d2(x))2/2 2))(7)
該損失函數可以用于大多數的分割任務場景,但是其也有缺點,在山體滑坡遙感圖像中,由于存在前景區域像素數量遠小于背景區域像素數量的情況,山體滑坡在整個遙感圖像中可能只占據一小部分,所以占據主導的主要為背景區域損失,進而使得算法模型偏向背景,對山體滑坡的分割產生影響,分割效果不佳。并且,在遙感圖像上體滑坡中存在數據不平衡,訓練時可能會導致精度高但召回率低的情況。在訓練樣本時為了更好地權衡準確率和召回率之間的關系,2020年JADON S等人[11]提出了一種廣義的損失函數FTL(Focal Tversky Loss),FTL損失函數表達如式(8)所示。
FTL損失函數通過對a和的參數調整來控制假陽性和假陰性之間的平衡,通過FTL損失函數代替交叉嫡損失函數。
3實驗結果
3.1實驗數據
由于遙感圖像山體滑坡數據集較少,采用自構建的小樣本量遙感圖像山體滑坡數據集。為了獲取遙感圖像山體滑坡的多樣性,山體滑坡遙感圖像通過各大網站收集,采用LabelMe進行標注,統一標準處理后共計1400張遙感圖片。
3.2實驗結果分析
實驗采用Pytorch深度學習框架,訓練輪數epochs設置為100。表1給出了不同方法與本文算法的數據對比。由表1可知,在U-Net算法模型基礎上改進后,指標mIoU和mPA均有所提升,均交并比mIou從63.42%提升為65.92%,上漲2.5個百分點;平均檢測精度mPA由70.37%提升到73.93%,上漲3.56個百分點。F1-score綜合得分指標由54.99%提升為60.08%,上漲5.09個百分點。對比實驗結果表明,改進后算法模型能在一定程度上提升圖像分割效果。
為了更直觀地展示遙感圖像山體滑坡分割提取效果,隨機選取兩張圖片進行兩種算法的分割提取對比,效果如圖4所示。
4結論
本文對遙感圖像山體滑坡分割提取進行了研究,旨在提高山體滑坡分割提取模型性能。在U-Net網絡基礎上,首先將原始網絡中的特征提取模塊用殘差網絡ResNet進行替換,其次,融入多尺度特征融合注意力模塊增強發現山體滑坡區域的能力,最后采用廣義的損失函數FTL替換帶權重的交叉嫡損失函數以平衡準確率和召回率之間的關系。實驗結果表明,改進后算法模型能有效提高遙感圖像山體滑坡分割提取性能。
參考文獻:
[1]吳祥.一種基于K-平均簇劃分算法的圖像分割方法[J].遵義師范學院學報,2006(03):51-52.
[2]何哲,陶于祥,羅小波,徐浩.基于改進U-Net網絡的遙感圖像道路提取[J/OL].激光與光電子學進展:1-14
[3]車子杰,高飛,吳兆福,李振軒.基于改進U-Net網絡的多源遙感影像洪澇災害信息提取與變化分析[J].測繪通報,2022(01):26-32.
[4]胡宏宇,左記祥,呂穎,趙睿.面向自動駕駛的遙感影像路網檢測方法[J].中國公路學報,2022,35(11):310-317.
[5]高亦遠,佘江峰,趙強,汪李娜.基于自注意力機制的遙感影像建筑物提取方法研究[J].信息技術與信息化,2022,No.272(11):5-8.
[6]譚陽陽,李淥.明代貴州地區自然災害與官方對策研究[J].遵義師范學院學報,2020,22(05):33-37.
[7]李華章,賈亮亮,何文剛,張相春.中緬天然氣管道貴州段地質災害分布特征與風險評價[J].遵義師范學院學報,2022,24(04):98-101.
[8]RonnebergerO,FischerP,BroxT.U-Net:Convolutionalnetworks for biomedical image segmentation.In:Proc.of the 18th Int’l Conf.on Medical Image Computing and Computer assisted Intervention.Munich:Springer,2015.234-241.
[9]He K,Zhang X,Ren S,etal.Deep Residual Learning for Im-age Recognition[C]//2016 IEEE Conference on Computer Vi-sion and Pattern Recognition(CVPR).Piscataway,NJ,USA:IEEE,2016:770-778.
[10]謝娟英,張凱云.XR-MSF-Unet:新冠肺炎肺部CT圖像自動分割模型[J].計算機科學與探索,2022,16(08):1850-1864.
[11]JADON S.A survey of loss functions for semantic segmentation[C].2020 IEEE Conference on Com-putational Intelli-gence in Bioinformatics and Com putationalBiology.Oc-tober 27-29,2020,Via del Mar,Chile.IEEE,2020:1-7.
(責任編輯:羅東升)