戴牧宸 冷祥光 熊博蒞 計(jì)科峰
(國防科技大學(xué)電子科學(xué)學(xué)院電子信息系統(tǒng)復(fù)雜電磁環(huán)境效應(yīng)國家重點(diǎn)實(shí)驗(yàn)室 長沙 410073)
隨著合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)成像技術(shù)的發(fā)展,利用SAR圖像進(jìn)行海洋監(jiān)測、海洋目標(biāo)檢測已成為當(dāng)前的研究熱點(diǎn),而實(shí)現(xiàn)精準(zhǔn)快速的海陸分割對海岸線提取與監(jiān)測、近岸目標(biāo)檢測等任務(wù)具有非常重要的意義。以艦船目標(biāo)檢測任務(wù)為例,海陸分割可排除SAR圖像中陸地背景干擾引起的虛警,降低不必要的計(jì)算量,有效提高檢測效率[1–3]。
傳統(tǒng)的海陸分割算法可分為兩大類。第1類方法是利用算法檢測出陸地區(qū)域,代表算法有閾值分割方法[4,5]、聚類方法[6]、邊緣檢測方法[7]和基于馬爾科夫隨機(jī)場方法[8]等。此類方法依靠圖像中陸地區(qū)域和海域在灰度、相似度等特性上的差異分割出陸地區(qū)域,在簡單場景下可獲得較高的分類準(zhǔn)確度。但此類方法易受噪聲干擾,且需要人為設(shè)置參數(shù)來調(diào)控結(jié)果,魯棒性較差,難以滿足實(shí)際應(yīng)用中高準(zhǔn)確率和魯棒性的要求。第2類方法是基于現(xiàn)有的地理數(shù)據(jù)庫模型獲取陸地掩模并進(jìn)行調(diào)整,文獻(xiàn)[9]通過訪問海岸線數(shù)據(jù)庫(Global Self-consistent,Hierarchical,High-resolution Geography database,GSHHG)來獲取初始的海岸線,而后使用CV(Chan-Vese)模型獲取更加精細(xì)的分割結(jié)果。該類方法在初始地理信息正確的情形下,分割結(jié)果優(yōu)異。但在海島信息缺失,海岸線偏移,傳感器參數(shù)偏差等初始地理信息誤差較大的情形下會(huì)出現(xiàn)分割結(jié)果異常的現(xiàn)象。
深度學(xué)習(xí)由于其強(qiáng)大的圖像特征提取能力,被廣泛應(yīng)用于圖像分割領(lǐng)域。Berkeley團(tuán)隊(duì)提出FCN(Fully Convolutional Networks)方法用于圖像語義分割,將圖像級(jí)別的分類擴(kuò)展到像素級(jí)別的分類,奠定了語義分割的基礎(chǔ)[10]。當(dāng)前語義分割方法主要分為兩大類,一類是通過編碼器-解碼器結(jié)構(gòu)融合高層語義和低層空間信息進(jìn)而實(shí)現(xiàn)精細(xì)的圖像像素級(jí)分類,代表方法有U-Net[11],SegNet[12]等。另一類是使用空洞卷積結(jié)構(gòu),省去池化層,減少圖像特征提取過程中輸入圖像部分位置信息的丟失,代表方法有DeepLabv3+[13],PSPNet[14]等。近年來,已有學(xué)者將深度學(xué)習(xí)方法應(yīng)用于海陸分割任務(wù)[15–18]。文獻(xiàn)[17]在U-Net網(wǎng)絡(luò)的基礎(chǔ)上提出DeepUNet,設(shè)計(jì)了DownBlock模塊和UpBlock模塊替代編碼-解碼結(jié)構(gòu)中的卷積層,在光學(xué)遙感圖像海陸分割任務(wù)中獲得了更精確的分割結(jié)果。文獻(xiàn)[18]提出基于密集深度分離卷積的分割網(wǎng)絡(luò)架構(gòu),通過密集分離卷積和擴(kuò)張卷積提取圖像高維特征,并構(gòu)造基于雙線性插值的上采樣解碼模塊用以實(shí)現(xiàn)SAR圖像海陸分割。
現(xiàn)有的基于深度學(xué)習(xí)的海陸分割算法多采用U型網(wǎng)絡(luò)結(jié)構(gòu),其通過逐層融合骨干網(wǎng)絡(luò)不同層級(jí)的特征,逐步將特征圖分辨率恢復(fù)至原圖大小。但此類方法會(huì)在高維特征圖提取過程中引入過多的計(jì)算量,因而分割速度較慢。文獻(xiàn)[19]提出的雙邊網(wǎng)絡(luò)(Bilateral Segmentation Network,BiSeNet)可有效平衡分割速度和精度,在自然場景圖像語義分割任務(wù)上取得了較好的表現(xiàn)。但對于SAR圖像海陸分割任務(wù),雙邊網(wǎng)絡(luò)的特征提取路徑難以有效提取SAR圖像的上下文語義信息和空間信息,因而分割效果較差。本文根據(jù)SAR圖像特點(diǎn)減少雙邊網(wǎng)絡(luò)中空間路徑的卷積層數(shù),從而降低空間信息的損失,并選用ResNet18輕量化模型作為上下文路徑骨干網(wǎng)絡(luò),減少過擬合現(xiàn)象并提供較廣闊的特征感受野,同時(shí)提出邊緣增強(qiáng)損失函數(shù)策略,提升模型分割性能。基于高分三號(hào)SAR圖像數(shù)據(jù)的實(shí)驗(yàn)表明,所做改進(jìn)可有效提升網(wǎng)絡(luò)的預(yù)測精度和分割速率,并降低網(wǎng)絡(luò)規(guī)模,同時(shí)網(wǎng)絡(luò)泛化性能較強(qiáng),具有較高的實(shí)際應(yīng)用價(jià)值。
當(dāng)前實(shí)時(shí)語義分割算法大多通過犧牲精度來獲取更快的速度,實(shí)際應(yīng)用效果不佳。文獻(xiàn)[19]提出的雙邊分割網(wǎng)絡(luò)BiSeNet,可有效平衡語義分割的精度和速度。其通過構(gòu)建兩條特征提取路徑分別提取高維非線性特征和低維空間特征,使得網(wǎng)絡(luò)兼?zhèn)鋸V闊的感受野和豐富的空間特征信息。該架構(gòu)主要由空間路徑(spatial path)和上下文路徑(context path)兩條路徑構(gòu)成。
空間路徑的作用是保持輸入圖像的尺寸,獲取空間信息。上下文路徑的作用則是獲取足夠大的感受野,從而判斷目標(biāo)類別,其使用一系列注意力優(yōu)化模塊(Attention Refinement Module,ARM)優(yōu)化輸出的上下文語義特征信息。兩條路徑的輸出特征通過特征融合模塊(Feature Fusion Module,FFM)實(shí)現(xiàn)特征融合并進(jìn)行像素級(jí)分類,最后通過雙線性插值上采樣獲取分割結(jié)果。在分割速度方面,雖然空間路徑輸入的圖像尺寸較大,但其只有3層卷積塊,因此計(jì)算量較小,而上下文路徑則采用輕量級(jí)的網(wǎng)絡(luò),可快速實(shí)現(xiàn)下采樣。此外,兩個(gè)模塊可并行計(jì)算從而進(jìn)一步提升分割速度。在分割精度方面,空間路徑輸出特征具有豐富的空間細(xì)節(jié)信息,而上下文路徑具有較廣闊的感受野,可充分提取圖像上下文信息,因此網(wǎng)絡(luò)分割精度較高。
與自然場景圖像不同,SAR遙感圖像的圖片尺寸一般較大。直接對原始圖像進(jìn)行海陸分割會(huì)消耗大量計(jì)算資源,分割速度較慢,現(xiàn)有研究通常對原始圖像和對應(yīng)標(biāo)簽進(jìn)行線性降采樣處理,在降采樣后的圖像上進(jìn)行訓(xùn)練和預(yù)測,以提升分割速率。該做法使得圖像中目標(biāo)特征尺寸進(jìn)一步縮小,直接利用當(dāng)下主流的語義分割框架難以有效提取圖像分割所需高維非線性特征和低維空間特征,使得分割精度下降,因而需要對網(wǎng)絡(luò)的特征提取結(jié)構(gòu)進(jìn)行改進(jìn)。
圖1展示了本文網(wǎng)絡(luò)的整體結(jié)構(gòu)。該網(wǎng)絡(luò)主要由空間路徑和上下文路徑兩部分組成。空間路徑的作用是保持輸入圖像的尺寸,獲取空間信息。上下文路徑的作用則是獲取足夠大的感受野,提取高維非線性特征。網(wǎng)絡(luò)的輸出由上采樣模塊融合兩路特征,并對卷積獲得的特征圖4倍雙線性插值上采樣獲得。
3.1.1 空間路徑
海陸分割網(wǎng)絡(luò)的訓(xùn)練和預(yù)測通常是在線性降采樣后的圖像和海陸標(biāo)簽上進(jìn)行的,因此需要使用層數(shù)更少的特征提取模塊以保留充足的圖像空間信息。如圖1所示,所提方法減少了雙邊網(wǎng)絡(luò)空間路徑的卷積塊數(shù)目,該路徑使用兩個(gè)卷積塊提取圖像空間特征。卷積塊的組成如圖1(a)所示,每個(gè)卷積塊由卷積層、批標(biāo)準(zhǔn)化層和激活層(ReLu)組成。卷積層通過卷積核卷積運(yùn)算,提取圖像低層特征。批標(biāo)準(zhǔn)化層對卷積層輸出特征進(jìn)行標(biāo)準(zhǔn)化處理,調(diào)整數(shù)據(jù)分布回到正態(tài)分布,使得網(wǎng)絡(luò)在訓(xùn)練時(shí)獲得更穩(wěn)定的參數(shù)。ReLu激活層可賦予網(wǎng)絡(luò)對特征進(jìn)行非線性表達(dá)的能力。空間路徑使用步長為2的卷積層用以替代常規(guī)的卷積池化層,減少輸入圖像空間位置信息的丟失。該路徑輸出特征圖的空間尺寸較大,其大小是輸入圖像的1/4,因而輸出特征含有豐富的空間信息。

圖1 基于改進(jìn)BiSeNet的SAR圖像海陸分割網(wǎng)絡(luò)架構(gòu)Fig.1 The structure of network based on improved BiSeNet for sea-land segmentation
3.1.2 上下文路徑
SAR是一種相干成像系統(tǒng),其后向散射成像機(jī)制會(huì)不可避免地導(dǎo)致相干斑噪聲的產(chǎn)生。此外,因風(fēng)力、浪涌等自然因素的影響,SAR圖像中海域存在復(fù)雜的海雜波干擾,同時(shí)由于SAR系統(tǒng)側(cè)視成像的特點(diǎn),圖像中陸地區(qū)域如建筑和山體等高大目標(biāo)會(huì)帶來較為明顯的陰影,上述成像特性均會(huì)給SAR圖像海陸分割帶來不利影響。為準(zhǔn)確判定圖像中像素的類別標(biāo)簽,網(wǎng)絡(luò)需要使用較深的網(wǎng)絡(luò)層數(shù)和較大的特征感受野感知像素所在場景的上下文信息。但隨著卷積神經(jīng)網(wǎng)絡(luò)模型層數(shù)的加深,網(wǎng)絡(luò)參數(shù)就越多,模型復(fù)雜度就越高,訓(xùn)練所需的數(shù)據(jù)量就越大,而SAR圖像海陸分割的訓(xùn)練數(shù)據(jù)集相對較小,該情形下網(wǎng)絡(luò)在訓(xùn)練時(shí)容易出現(xiàn)過擬合現(xiàn)象。綜合考慮上述SAR圖像海陸分割任務(wù)的特點(diǎn),可通過適當(dāng)縮減高維非線性特征提取模塊的通道數(shù)來降低網(wǎng)絡(luò)復(fù)雜度。如圖1所示,上下文路徑使用ResNet18輕量化模型作為骨干網(wǎng)絡(luò),其可在大幅減少計(jì)算量的情形下保留較豐富的高維特征信息,并提供較大的感受野。考慮到網(wǎng)絡(luò)輸入為SAR原始圖像線性降采樣處理后的圖像,因此上下文路徑骨干網(wǎng)絡(luò)的16倍下采樣特征圖可充分感知圖像上下文信息,故采用該尺度特征進(jìn)行調(diào)優(yōu)輸出。
上下文路徑輸出特征圖的尺寸為輸入圖像的1/16,特征通道數(shù)僅為256。最終輸出特征圖由兩部分特征相加獲得:(1)通過全局平均池化后上采樣的全局上下文信息特征;(2)通過注意力優(yōu)化模塊得到的優(yōu)化特征。注意力優(yōu)化模塊詳細(xì)構(gòu)成由圖1(b)所示,其通過平均池化獲取全局上下文信息,并計(jì)算一個(gè)注意力向量來指導(dǎo)特征學(xué)習(xí)。該模塊能方便地集成全局上下文信息,不需要任何上采樣操作,可降低計(jì)算成本。
3.1.3 上采樣模塊
上采樣模塊的作用是融合高維非線性特征和低維空間特征,預(yù)測海陸分割結(jié)果,其結(jié)構(gòu)如圖1所示。模塊的輸入為空間路徑和上下文路徑輸出的低維空間特征和高維非線性語義特征。具體結(jié)構(gòu)為:通過雙線性插值對高維非線性特征進(jìn)行4倍上采樣,使其尺度與低維空間特征保持一致。而后經(jīng)通道并聯(lián)結(jié)合兩路特征,并使用1×1卷積對融合特征進(jìn)行通道降維,后經(jīng)sigmoid激活函數(shù)映射到區(qū)間[0,1],最后通過雙線性插值將其尺寸調(diào)整到原圖大小,得到最終分割結(jié)果。
海陸交界區(qū)域內(nèi)像素點(diǎn)附近的場景信息較為復(fù)雜,分類難度要遠(yuǎn)大于其他區(qū)域,同時(shí)海陸交界區(qū)域在SAR圖像中所占百分比較低,模型在訓(xùn)練過程中對該區(qū)域的學(xué)習(xí)程度較少,因而網(wǎng)絡(luò)對海陸交界區(qū)域的分割準(zhǔn)確度較低。針對網(wǎng)絡(luò)在訓(xùn)練時(shí)對SAR圖像海陸交界區(qū)域?qū)W習(xí)比重較低的問題,提出邊緣區(qū)域增強(qiáng)的損失函數(shù),該方法通過對SAR圖像海陸交界區(qū)域附加額外損失進(jìn)而增強(qiáng)網(wǎng)絡(luò)對海陸交界區(qū)域的學(xué)習(xí)程度。所提損失函數(shù)主要由兩部分組成:(1)對于訓(xùn)練圖像中全部區(qū)域的交叉熵?fù)p失函數(shù);(2)對于訓(xùn)練圖像中海陸交界區(qū)域的絕對值損失函數(shù)。網(wǎng)絡(luò)使用sigmoid激活函數(shù)將網(wǎng)絡(luò)輸出映射到區(qū)間[0,1]以表示像素為陸地區(qū)域的置信度,激活函數(shù)如式(1)所示

式中,outputm,n是圖像(m,n)處的輸出值,pm,n為該處像素預(yù)測成為陸地的概率。設(shè)單批訓(xùn)練中使用的圖像數(shù)量為K,輸入圖像大小為M和N,損失函數(shù)定義如式(2)所示

本部分基于高分三號(hào)SAR圖像數(shù)據(jù),就網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)有效性、邊緣增強(qiáng)損失函數(shù)有效性、與現(xiàn)有典型網(wǎng)絡(luò)分割性能對比以及網(wǎng)絡(luò)泛化性能4個(gè)方面進(jìn)行實(shí)驗(yàn)。下面給出實(shí)驗(yàn)設(shè)置及結(jié)果分析。
采用高分三號(hào)SAR圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。高分三號(hào)是我國首顆自主研制的C頻段多極化SAR衛(wèi)星,具有高分辨率、大成像幅寬、高輻射精度、多成像模式和長時(shí)工作等特點(diǎn)[20]。實(shí)驗(yàn)所選用圖像數(shù)據(jù)的工作模式及對應(yīng)的主要指標(biāo)如表1所示。

表1 選用數(shù)據(jù)的工作模式Tab.1 The imaging modes of data
收集了13幅超精細(xì)條帶模式圖像用于模型訓(xùn)練和測試,圖像內(nèi)容涵蓋港口、島嶼和開闊海域多種類型數(shù)據(jù)。由于SAR圖像尺寸較大,直接在該尺度下進(jìn)行預(yù)測會(huì)導(dǎo)致圖像分割速度大幅降低,因此對原始圖像和對應(yīng)的標(biāo)簽進(jìn)行3倍線性下采樣處理。此外,卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像尺寸有限,不能直接將大尺寸SAR圖像送入網(wǎng)絡(luò)進(jìn)行訓(xùn)練,因此將其裁剪為尺寸為1024×1024像素的切片圖像作為網(wǎng)絡(luò)輸入。實(shí)驗(yàn)選取9幅超精細(xì)條帶模式SAR圖像用于訓(xùn)練數(shù)據(jù)集制作,其中5000張切片圖像作為訓(xùn)練數(shù)據(jù)集,1000張切片圖片作為驗(yàn)證數(shù)據(jù)集,其余4幅超精細(xì)條帶模式SAR圖像用于實(shí)驗(yàn)測試。根據(jù)前期海陸分割實(shí)驗(yàn)結(jié)果,海陸交界邊緣的誤分類像素集中于距離海陸交界曲線小于6個(gè)像素的區(qū)域內(nèi),故設(shè)定上述范圍作為海陸交界區(qū)域用以網(wǎng)絡(luò)訓(xùn)練和實(shí)驗(yàn)結(jié)果分析。此外,為進(jìn)一步驗(yàn)證模型的泛化性能,選取高分三號(hào)聚束模式、精細(xì)條帶模式1、精細(xì)條帶模式2、標(biāo)準(zhǔn)條帶模式各1幅圖像用以實(shí)驗(yàn)測試。
下面給出實(shí)驗(yàn)平臺(tái)配置及網(wǎng)絡(luò)訓(xùn)練相關(guān)參數(shù)設(shè)置。
4.2.1 實(shí)驗(yàn)平臺(tái)配置
CPU為Intel i7-8700K,內(nèi)存大小為32 GB,GPU為NVIDIA GTX Geforce 1080 Ti,操作系統(tǒng)為windows 7,代碼運(yùn)行環(huán)境為python3.7,深度學(xué)習(xí)環(huán)境配置為CUDA9.2,cudnn7,torch 1.3.1。
4.2.2 網(wǎng)絡(luò)參數(shù)設(shè)置
所有實(shí)驗(yàn)都在相同的實(shí)驗(yàn)環(huán)境中進(jìn)行。綜合考慮現(xiàn)有實(shí)驗(yàn)平臺(tái)配置以及網(wǎng)絡(luò)能穩(wěn)定收斂的要求,實(shí)驗(yàn)設(shè)置batch_size=5控制單次網(wǎng)絡(luò)訓(xùn)練選取的樣本數(shù),learning_rate=0.001控制網(wǎng)絡(luò)學(xué)習(xí)速率。epoch=50控制網(wǎng)絡(luò)的迭代次數(shù)。超參數(shù)λ=7控制絕對值損失函數(shù)的權(quán)重。采用隨機(jī)梯度下降法作為優(yōu)化器對網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化調(diào)整。
為定量分析算法的分割效果,采用陸地預(yù)測精度(Land Precision,LP)、陸地預(yù)測召回率(Land Recall,LR)、海域預(yù)測精度(Sea Precision,SP)、海域預(yù)測召回率(Sea Recall,SR)、海陸交界區(qū)域預(yù)測精度(Edge Precision,EP),整體預(yù)測精度(Overall Precision,OP)、F1分?jǐn)?shù)(F1Score)來評價(jià)算法的分割性能。上述評價(jià)標(biāo)準(zhǔn)的計(jì)算方法所示為

其中TPland,FPland,FNland分別為預(yù)測結(jié)果中陸地區(qū)域的真正例、假正例、假負(fù)例。TPsea,FPsea,FNsea分別為預(yù)測結(jié)果中海域的真正例、假正例、假負(fù)例。TPedge,FPedge分別為預(yù)測結(jié)果中海陸交界區(qū)域的真正例、假正例。F1分?jǐn)?shù)定義為

對比實(shí)驗(yàn)部分首先驗(yàn)證網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)及邊緣增強(qiáng)損失函數(shù)的有效性,其次對比分析所提方法與現(xiàn)有典型分割網(wǎng)絡(luò)的分割性能,最后測試分析基于高分三號(hào)超精細(xì)條帶模式數(shù)據(jù)進(jìn)行訓(xùn)練的網(wǎng)絡(luò)模型對高分三號(hào)其他工作模式圖像數(shù)據(jù)的泛化性能。
4.4.1 網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)的性能驗(yàn)證
為驗(yàn)證所做結(jié)構(gòu)改進(jìn)對網(wǎng)絡(luò)分割性能的影響,進(jìn)行對照實(shí)驗(yàn)。實(shí)驗(yàn)選取測試數(shù)據(jù)集大圖1中的區(qū)域1用以展示,輸入圖像如圖2(a)所示。對應(yīng)的海陸標(biāo)簽和海陸交界區(qū)域如圖2(b)、圖2(e)所示,其中黑色區(qū)域代表海域,白色區(qū)域表示陸地區(qū)域。圖2(c)和圖2(d)展示了BiSeNet和所提方法在同一實(shí)驗(yàn)條件訓(xùn)練后對輸入測試圖像的分割結(jié)果。
由分割結(jié)果可見,BiSeNet和所提方法在陸地和海域的內(nèi)部均有著較好的分割效果。但在海陸交界區(qū)域,由于BiSeNet是在原圖尺寸1/8大小的特征圖上進(jìn)行預(yù)測,特征圖中海域和陸地邊界信息較少,因此分割結(jié)果中海域和陸地交界輪廓模糊,錯(cuò)分類像素點(diǎn)個(gè)數(shù)較多。而所提方法改進(jìn)了兩路特征提取模塊,使網(wǎng)絡(luò)能有效提取高維非線性語義特征和低維空間特征,保留豐富的海域和陸地邊界信息,并在原圖尺寸1/4大小的特征圖上進(jìn)行預(yù)測,因而在海陸交界區(qū)域有著更優(yōu)的表現(xiàn)。
表2統(tǒng)計(jì)了兩類方法對測試數(shù)據(jù)集(4幅超精細(xì)條帶模式大圖)分割結(jié)果的各項(xiàng)評價(jià)指標(biāo)。由表2可見,BiSeNet的海陸交界區(qū)域預(yù)測精度為0.6612,整體預(yù)測精度為0.9827,F1分?jǐn)?shù)為0.9868,對測試數(shù)據(jù)集的總分割時(shí)間為54.32 s。而所做改進(jìn)使海陸交界區(qū)域預(yù)測精度、整體預(yù)測精度和F1分?jǐn)?shù)分別提高了0.0919,0.0056和0.0043,總分割時(shí)間縮減到26.73 s,分割速率提升1倍左右。上述結(jié)果證明所提方法能有效且快速地提取SAR圖像海陸特征,具有更優(yōu)的分割準(zhǔn)確度和分割速率。
4.4.2 邊緣增強(qiáng)損失函數(shù)的性能驗(yàn)證
為驗(yàn)證所提損失函數(shù)的有效性,選用常用于圖像分割的交叉熵?fù)p失函數(shù)和所提損失函數(shù)進(jìn)行對比實(shí)驗(yàn)。實(shí)驗(yàn)選取測試數(shù)據(jù)集大圖2中的碼頭區(qū)域用以展示,輸入圖像和海陸標(biāo)簽由圖3(a)和圖3(b)所示。使用交叉熵?fù)p失函數(shù)進(jìn)行訓(xùn)練的BiSeNet和所提網(wǎng)絡(luò)的分割結(jié)果如圖3(c)和圖3(d)所示,使用邊緣增強(qiáng)損失函數(shù)進(jìn)行訓(xùn)練的BiSeNet和所提網(wǎng)絡(luò)的分割結(jié)果如圖3(e)和圖3(f)所示。為更清晰地觀察分割結(jié)果,選取輸入圖像兩個(gè)子區(qū)域進(jìn)行放大展示,結(jié)果如圖4所示。
由分割結(jié)果可見,使用交叉熵?fù)p失的網(wǎng)絡(luò)在海陸交界區(qū)域的分割結(jié)果并不理想,且BiSeNet的分割結(jié)果的陸地區(qū)域出現(xiàn)部分孔洞。而使用邊緣增強(qiáng)損失函數(shù)后,網(wǎng)絡(luò)對海陸交界區(qū)域這類復(fù)雜場景的學(xué)習(xí)程度增加,兩類方法對海域和陸地的分割結(jié)果更為精確,且能更好地提取圖中陸地和海域邊界的輪廓。表3統(tǒng)計(jì)了上述實(shí)驗(yàn)在測試數(shù)據(jù)集(4幅超精細(xì)條帶模式大圖)上的分割結(jié)果的各項(xiàng)評價(jià)指標(biāo)。由表3可見,邊緣增強(qiáng)損失函數(shù)提升了兩類方法的分割性能,并使改進(jìn)后網(wǎng)絡(luò)的海陸交界區(qū)域預(yù)測精度、整體預(yù)測精度和F1分?jǐn)?shù)分別提升到0.7657,0.9889和0.9915。上述結(jié)果證明所提邊緣增強(qiáng)損失函數(shù)可增大網(wǎng)絡(luò)在訓(xùn)練過程中對于海陸交界區(qū)域的學(xué)習(xí)比重,有效增強(qiáng)網(wǎng)絡(luò)對海陸交界區(qū)域的分割能力,提升網(wǎng)絡(luò)分割性能。
4.4.3 與現(xiàn)有典型網(wǎng)絡(luò)的對比分析
為更加充分驗(yàn)證所提方法的分割性能,選取UNet[11],BiSeNet[13],DeepLabv3+[19]和DFANet[21]輕量化模型架構(gòu)同所提方法進(jìn)行對比。實(shí)驗(yàn)選取測試數(shù)據(jù)集大圖3中群島區(qū)域用以展示,輸入圖像、海陸標(biāo)簽和交界區(qū)域如圖5(a)、圖5(g)和圖5(h)所示。各方法的分割結(jié)果如圖5(b)到圖5(f)所示。為了更清晰地觀察分割結(jié)果,選取輸入圖像兩個(gè)子區(qū)域進(jìn)行放大展示,結(jié)果如圖6所示。
(1) 網(wǎng)絡(luò)分割準(zhǔn)確度及分割速率對比分析。由分割結(jié)果可見,U-Net方法和DeepLabv3+方法分割結(jié)果中陸地區(qū)域均出現(xiàn)孔洞現(xiàn)象,而DFANet方法的模型過于輕量化,網(wǎng)絡(luò)未能有效提取SAR圖像特征,因而分割結(jié)果中陸地區(qū)域和海域均出現(xiàn)大量的誤分類像素。此外,BiSeNet方法和DeepLabv3+方法對海陸邊界的分割并不精確,與真實(shí)的海陸邊界存在較大誤差,而U-Net方法的分割結(jié)果通過逐像素預(yù)測得到,因此對海陸邊界的分割效果最優(yōu)。與之相比,所提方法通過兩條路徑分別提取SAR圖像空間特征和上下文特征,網(wǎng)絡(luò)兼?zhèn)湄S富空間特征提取能力和較廣闊的感受野,分割結(jié)果中陸地區(qū)域無明顯孔洞,海陸邊界分割效果較理想,具有良好的分割性能。表4統(tǒng)計(jì)了同一實(shí)驗(yàn)環(huán)境下不同方法在測試數(shù)據(jù)集上的分割結(jié)果的各項(xiàng)評價(jià)指標(biāo)。由表4可見,所提方法的全局預(yù)測準(zhǔn)確度、F1分?jǐn)?shù)分別達(dá)到了0.9889,0.9915,均優(yōu)于所列其它方法。在海陸交界區(qū)域預(yù)測準(zhǔn)確度方面,所提方法的分割結(jié)果由4倍雙線性插值上采樣獲得,分割準(zhǔn)確度為0.7657,僅低于U-Net的0.7745。在處理速率方面,所提方法對于尺寸大小為1024×1024的輸入圖像,處理速率為0.079 s,即12.7 frames/s,在包含4張像素大小約為8000×6000的測試數(shù)據(jù)集上分割花費(fèi)的總時(shí)間為26.38 s,較其它方法有顯著的優(yōu)勢。

圖2 兩類方法的分割結(jié)果對比Fig.2 Comparison of segmentation results of two methods

表2 兩類方法在測試數(shù)據(jù)集上的分割結(jié)果對比Tab.2 Comparison of segmentation results of two methods on the test dataset

圖3 使用不同損失函數(shù)進(jìn)行訓(xùn)練的兩類方法分割結(jié)果對比Fig.3 Comparison of segmentation results of two methods using different loss function

圖4 實(shí)驗(yàn)4.4.2海陸分割結(jié)果細(xì)節(jié)Fig.4 The detailed view of the segmentation results of test 4.4.2

表3 使用不同損失函數(shù)的兩類方法在測試數(shù)據(jù)集上的分割結(jié)果對比Tab.3 Comparison of segmentation results of two methods using different loss function on the test dataset

圖5 不同方法分割結(jié)果對比Fig.5 Comparison of segmentation results of different methods

圖6 實(shí)驗(yàn)4.4.3海陸分割結(jié)果細(xì)節(jié)Fig.6 The detailed view of the segmentation results of test 4.4.3

表4 不同方法在測試數(shù)據(jù)集上的分割結(jié)果對比Tab.4 Comparison of segmentation results of different methods
(2) 網(wǎng)絡(luò)模型大小對比分析。圖7展示了不同網(wǎng)絡(luò)架構(gòu)模型的大小。由圖可見所提模型大小為46.3 MB,較BiSeNet減少50%以上,并小于輕量級(jí)的U-Net架構(gòu)。而與模型大小僅為8.3 MB的DFANet方法相比,所提模型具有更優(yōu)的分割性能。綜合上述實(shí)驗(yàn)結(jié)果可得,所提方法具有更優(yōu)的綜合性能,其能兼顧高分割準(zhǔn)確度和高分割速率,在網(wǎng)絡(luò)規(guī)模方面也具有相當(dāng)優(yōu)勢,具備智能前置的可能[22]。
4.4.4 網(wǎng)絡(luò)泛化性能分析
為驗(yàn)證所提方法的泛化性能,選取了高分三號(hào)聚束模式、精細(xì)條帶模式1、精細(xì)條帶模式2、標(biāo)準(zhǔn)條帶模式各1幅圖像進(jìn)行實(shí)驗(yàn)測試。由于被測模式數(shù)據(jù)與模型訓(xùn)練使用的超精細(xì)條帶模式數(shù)據(jù)的分辨率不同,因此對各模式圖像數(shù)據(jù)按相應(yīng)的比率進(jìn)行升降采樣處理。實(shí)驗(yàn)采用在高分三號(hào)超精細(xì)條帶模式數(shù)據(jù)上進(jìn)行訓(xùn)練的網(wǎng)絡(luò)模型對上述4種模式數(shù)據(jù)進(jìn)行測試,實(shí)驗(yàn)結(jié)果如圖8—圖11所示。

圖7 不同網(wǎng)絡(luò)架構(gòu)模型大小對比Fig.7 Comparison of the size of different models
由分割結(jié)果可見,所提方法在高分三號(hào)的不同工作模式下,均取得了較好的分割結(jié)果。表5統(tǒng)計(jì)了不同模式數(shù)據(jù)分割結(jié)果的各項(xiàng)評價(jià)指標(biāo),由表5可見,所提方法對各模式圖像數(shù)據(jù)的分割精度均在0.9939以上。需要注意的是,實(shí)驗(yàn)所選數(shù)據(jù)場景分布較為簡單,包含大量空闊海域和大塊島嶼,圖像內(nèi)海陸邊界區(qū)域占比較UFS模式測試數(shù)據(jù)集更少。而所提方法對于整塊海域和陸地區(qū)域的分割性能穩(wěn)定,陸地區(qū)域內(nèi)孔洞區(qū)域極少(對比其他模型),因而可發(fā)現(xiàn)在一些模式(如SL,SS)數(shù)據(jù)分割結(jié)果的部分評價(jià)指標(biāo)比UFS模式測試數(shù)據(jù)上的表現(xiàn)更好。上述實(shí)驗(yàn)結(jié)果充分說明所提網(wǎng)絡(luò)模型能夠?qū)W習(xí)到SAR圖像海陸場景的普遍特征,具有較好的泛化性。此外,上述實(shí)驗(yàn)基于高分三號(hào)衛(wèi)星數(shù)據(jù)開展,后續(xù)可進(jìn)一步研究所提模型對哨兵1號(hào)(Sentinel-1),TerraSAR-X等其他SAR衛(wèi)星圖像數(shù)據(jù)海陸分割的泛化性能。

圖8 聚束模式(SL)成像模式分割結(jié)果Fig.8 Segmentation result of SL mode

圖9 精細(xì)條帶模式1(FSI)成像模式分割結(jié)果Fig.9 Segmentation result of FSI mode

圖10 精細(xì)條帶模式2(FSII)成像模式分割結(jié)果Fig.10 Segmentation result of FSII mode

圖11 標(biāo)準(zhǔn)條帶模式(SS)成像模式分割結(jié)果Fig.11 Segmentation result of SS mode

表5 本文方法對各工作模式圖像數(shù)據(jù)的分割結(jié)果(%)Tab.5 Segmentation result under multi-mode by the proposed method (%)
本文提出一種基于改進(jìn)雙邊網(wǎng)絡(luò)的SAR圖像海陸分割方法。該方法通過空間路徑和上下文路徑分別快速提取SAR圖像空間位置特征和上下文語義特征信息,而后融合兩路特征進(jìn)行SAR圖像像素級(jí)分類,同時(shí)使用邊緣增強(qiáng)損失函數(shù)策略增強(qiáng)網(wǎng)絡(luò)對于邊界區(qū)域的學(xué)習(xí)程度,提升模型的分割能力。基于高分三號(hào)衛(wèi)星圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn),與當(dāng)前主流的分割網(wǎng)絡(luò)框架性能進(jìn)行對比,驗(yàn)證該方法的有效性。實(shí)驗(yàn)結(jié)果表明,該方法的分割準(zhǔn)確度和F1分?jǐn)?shù)分別達(dá)到了0.9889和0.9915,對尺寸大小為1024×1024的SAR圖像切片處理速率為12.7 frames/秒。同時(shí)網(wǎng)絡(luò)規(guī)模較小,占用計(jì)算資源少,具有較強(qiáng)的泛化性。研究內(nèi)容和成果可推廣應(yīng)用于艦船目標(biāo)檢測等相關(guān)任務(wù),具有較高的實(shí)際應(yīng)用價(jià)值。