劉鵬謝春華安文韜崔艷榮李良偉
(1.國家衛星海洋應用中心 北京 100081;2.自然資源部空間海洋遙感與應用研究重點實驗室 北京 100081;3.國家海洋環境預報中心 北京 100081;4.上海海洋大學海洋科學學院 上海 201306)
我國是海洋大國,海島眾多,海岸線漫長,海島海岸帶資源豐富。加快建設海洋強國對海島海岸帶的科學管理、合理保護和適度開發利用提出更高的要求,及時和準確地掌握海島海岸帶的自然環境、資源分布和開發利用狀況對于實現海島海岸帶的精細化管理具有重要意義。
由于海島海岸帶的自然環境十分復雜,傳統調查手段難以滿足科學管理的需求。自20世紀60年代以來,隨著遙感技術的不斷發展,遙感圖像的時空分辨率不斷提高,遙感逐漸成為發達國家調查研究海島海岸帶的必要手段。與可見光遙感相比,微波遙感具有不受云雨影響,可以全天候和全天時工作的優點,但空間分辨率較低。合成孔徑雷達(SAR)可以獲得較高的空間分辨率,被廣泛應用于環境監測、資源勘查、態勢評估和區域規劃等領域[1-2]。精準和高效地從SAR 圖像中提取地物信息,已成為各國的研究熱點。
根據在海岸帶土地利用分類系統具有較大影響力的美國海岸帶變化分析計劃(C-CAP),海岸帶土地利用類型可分為建設用地、農業用地、草地、林地、灌叢地、荒地、沼澤濕地、河口濕地、水域和水淹地[3]。目前許多國家和機構擁有非常先進的海島海岸帶監測技術,如美國國家海洋與大氣管理局(NOAA)、日本國立環境研究所(NIES)以及英國、荷蘭、芬蘭、瑞典、德國和法國的各種政府或商業研究中心。
國外學者對SAR 遙感海島海岸帶地物信息提取方法的研究起步較早,方法也相對成熟。在研究初期,海岸帶地物信息的提取方法是最大似然法和ISODATA 等基于像元的方法,這些方法對于中低空間分辨率的SAR 圖像來說效果尚可,而高分辨率SAR 圖像單個像元的紋理特征不足以反映地物的形狀特征,且各像元之間的拓撲關系有限,無法準確地反映真實的地物信息。Yamagata等[4]利用灰度共生矩陣,對ERS-1和JERS-1的單極化圖像進行紋理分析,完成對海岸帶濕地植被系統較高精度的地物分類;Lee等[5]提出基于Wishart分布的最大似然有監督分類算法,通過地物目標的電磁散射機制,極化SAR 數據可分解出很多能反映地物目標的特征;Cloude等[6]提出無監督分類算法,通過極化分解得到散射熵H和散射角α,從而對目標地物進行分類,已成為應用最廣泛的分類算法之一;Ghedira等[7]首次采用神經網絡方法,對Radarsat衛星SAR 圖像的海岸帶地物信息進行提取,取得不錯的效果;Moghaddam 等[8]將基于規則的決策樹算法用于單極化SAR 圖像的海岸帶地物分類;Arzandeh等[9]改進灰度共生矩陣紋理分析方法,對單時相Radarsat衛星圖像的海岸帶濕地進行分類,顯著地提高分類精度;Taft等[10]利用SAR 圖像的極化特征,實現坦桑尼亞候鳥冬季棲息地海岸帶地物信息的提取;Yamaguchi等[11]在Freeman-Durden 分解的基礎上,為表征螺旋體散射的分量增加第四個分量即螺旋散射分量,得到Yamaguchi散射模型,從而更準確地反映目標地物的散射特性。自2006年以來,深度學習理論的應用推動SAR 圖像地物信息提取技術的發展。例如:H?nsch 等[12]利用復數神經網絡進行極化SAR 的分類,取得不錯的效果;Geng等[13]提出深度監督壓縮神經網絡,用于提取SAR 圖像地物信息,網絡的監督懲罰機制能充分挖掘特征與標簽之間的相關信息,壓縮約束可以增強網絡的魯棒性,與傳統方法相比具有更好的分類性能。
國內應用SAR 圖像進行海島海岸帶地物信息提取的研究起步較晚,但也取得較好的成果。曹永鋒等[14]引入主動學習方法,通過對北卡羅來納州華盛頓縣海岸帶的全極化SAR 數據進行實驗,驗證主動學習對地物信息提取的有效性和可行性;Xie等[15]將稀疏自編碼器應用于極化SAR 的地物分類,該方法可以學習多層次特征,從而提高分類精度;Chen 等[16]利用改進的FCM 算法并結合Cloude-Pottier分解,探究SAR 圖像在江蘇沿海灘涂分類中的應用能力;Liu等[17]提出新型的受限玻爾茲曼機即WBRBM,結合SAR 圖像局部的鄰域信息,模型可以更快地收斂,從而提高訓練速度和縮短訓練時間;折小強等[18]提出基于極化熵結合混合廣義極值分布模型的全極化SAR 數據的潮間帶地物信息提取方法,并成功應用于上海崇明東灘潮間帶地物信息的提取;徐夢竹等[19]利用Freeman分解和Cloude-Pottier 分解提取的極化特征,與Shannon熵結合構建特征集,并通過自編碼器提取深層特征,使數據更具可分性,研究結果表明引入Shannon熵可顯著提高海水、沙灘和泥灘等不同地物的區分度,從而實現對全極化SAR 圖像中不同海島地物的有效區分。
目前國內外學者對SAR 遙感海島海岸帶地物信息提取的研究大多基于圖像的極化特征和紋理特征,雖已取得豐碩成果,但仍存在亟待解決的問題。例如:①不同類別濕地植被的后向散射系數重疊,大部分基于閾值分割的地物分類方法精度不高,尤其是對河口森林濕地和河口灌木濕地的區分;②表面粗糙度不同的沙灘與泥灘雖可用相同極化方式的SAR 圖像進行區分,但對干濕條件的要求較高,難以區分潮間帶的沙灘與泥灘;③采用交叉極化方式的圖像能較好地識別海岸線,但難以判別表面粗糙度不同的沙灘與泥灘;④多時相和多源的SAR 數據體量巨大,面對海量和冗雜的海島海岸帶數據,須應用更快速和更智能的算法挖掘其潛藏特征,從而更精確地提取海島海岸帶地物信息。
SAR 的成像原理如圖1所示。

圖1 SAR 成像原理
SAR 之所以能獲得較高的空間分辨率,主要是因為其利用多普勒效應。雷達發射電磁波的頻率和相對頻率分別為f0和f',電磁波的波長為λ,衛星與被觀測點之間的距離為r。衛星與被觀測點之間存在相對運動,相對速度w'為衛星速度矢量w在波束方向(方位角為ψ)上的投影,即w'=w ×cosψ。電磁波的傳播速度為c,雷達回波的多普勒頻率由相對運動引起的接收頻率和發射頻率之差即多普勒頻移Ω,由上式可得由于衛星速度遠小于電磁波傳播速度,可進一步推出多普勒頻移與方位角的關系,即,經微分可得頻移分辨率在整個采樣時間ts內,衛星移動距離XD =wts,可得SAR 的方位分辨率就相當于真實SAR的孔徑尺度D,這樣就通過合成孔徑技術獲得較大的天線孔徑,并提高方位分辨率。脈沖持續時間為τ,入射角為θ,可得距離分辨率;由于雷達脈沖寬度越窄,脈沖持續時間越短且距離分辨率越高,通過減小脈沖寬度和縮短脈沖持續時間,就可獲得較高的距離分辨率,從而提高雷達的空間分辨率。
采集到的SAR 數據屬于原始的二維數據,還不能稱之為圖像。在經過初步處理后即可轉化為單視復數據(SLC)和多視復數據(MLC)形式的圖像,SLC和MLC 又可進一步處理并轉化成極化SAR數據。
電磁波發射和接收的極化分為水平和垂直2種方式,根據電磁波發射和接收的組合方式,SAR 數據可分為單極化數據、多極化數據和全極化數據。如果SAR 傳感器對電磁波的發射和接收均為水平極化方式,其產生的SAR 數據為HH 單極化數據;同理,如果SAR 傳感器對電磁波的發射和接收均為垂直極化方式,其產生的SAR 數據為VV 單極化數據;如果發射和接收的組合方式為水平極化與垂直極化的兩兩完全組合,其產生的SAR 數據為全極化數據,其他組合方式產生的SAR 數據即多極化數據[20]。與單極化數據和多極化數據相比,全極化數據的信息量更加豐富,可展現更細致的地物信息,已成為重點研究對象。
由于SAR 圖像具有數據量大、多時相性、多源性、模糊性和空間維數高等特點,從SAR 圖像中準確獲取地物信息以及對SAR 圖像進行高效的特征提取仍存在一些問題。與此同時,隨著計算機技術的發展,人工智能理論逐漸成熟并得到廣泛應用,Hinton等[21]提出深度學習的概念。近年來,隨著網絡結構的改進和處理器性能的提高,計算機對大數據的高速處理技術日漸成熟,深度學習網絡在圖像處理、語音識別和自然語言處理領域取得突出成績[22]。利用深度學習網絡對海量SAR 數據進行處理,增強對不同數據來源和不同地物目標的適應性,可很好地表示SAR 圖像的空間特征和極化特征,實現準確和快速的解譯,有效對地物進行分類和識別。
卷積神經網絡(CNN)是深度學習最常用的網絡之一,是專門用來處理數據結構并與網格類似的神經網絡。SAR 圖像可被視為二維像素網格,在直接輸入SAR 圖像后,通過選擇合適的卷積核對圖像進行變換,可減少圖像預處理的工作量,同時可更好地利用圖像特征以及提高圖像分類的精度和魯棒性。此外,引入卷積神經網絡理論和模型還能更好地應對地物目標的非線性混合[23],對解決海島海岸帶地物信息提取中存在的不同地物混合等問題具有重要意義。
卷積神經網絡是由多個模塊組成的全局可訓練的人工神經網絡模型,每個模塊由卷積層、非線性激活層和池化層3個部分組成,最后由全連接層輸出結果。基本結構如圖2所示。

圖2 卷積神經網絡的基本結構
卷積層用于提取特征,通過對網絡中的各子區域進行更深入的學習,得到更加本質和更加抽象的特征。由于卷積是線性運算,通過卷積提取的特征也是線性的。為實現目標的非線性可分,須采用激活函數增加非線性映射運算提取非線性特征。常用的激活函數包括Sigmoid 函數、Tanh 函數和Re LU 函數3種。
(1)Sigmoid激活函數為:

該函數的輸出值為0~1,可以表示概率。該函數是傳統神經網絡最常用的激活函數之一,但也存在弊端。當輸入值偏向曲線兩側時,神經元的梯度值約為0,使得每次迭代參數的更新值非常小,梯度消失,網絡無法學習;當函數的輸出均值不為0時,后層節點的輸入均值必不為0,導致梯度值和參數更新的方向出現偏差,收斂速度緩慢。
(2)Tanh激活函數為:

該函數的輸出均值為0,收斂速度較快。但與Sigmoid函數存在同樣的問題,即當輸入值偏向曲線兩側時,易導致梯度消失。
(3)ReLU 激活函數為:

當x為負值時,導數恒為0,硬飽和;當x為正值時,導數恒為1,不會導致梯度消失。因此,該函數可在不依賴無監督的情況下,直接有監督地同時訓練多層網絡。
上述3種函數的曲線如圖3所示。

圖3 常用的激活函數
卷積后圖像的特征維度很大。例如:對于60×60(維)的圖像,若定義60個5×5(維)的卷積核提取圖像特征,每個卷積核得到的特征圖維度為(60-5+1)×(60-5+1)=3 136(維),60個卷積核將得到60×3 136=188 160(維)的特征向量。分類器很難學習如此高維的特征,且易過擬合,池化層即針對此類問題而產生。池化層又稱下采樣層,通過對特征圖進行稀疏處理,擴大感受野,保留最佳特征,降低特征圖維度,減小計算量,避免網絡過擬合,保持圖像的旋轉不變性。經過多次卷積池化操作后,須通過全連接層對網絡提取的特征進行合并整合,并輸出最終的結果。
3.2.1 網絡結構
早期的卷積神經網絡結構比較簡單,如經典的Le Net-5模型[24]主要應用于手寫體識別等相對單一的視覺識別領域。Krizhevsky 等[25]提出Alex Net模型,對局部神經元的活動創建競爭機制,增強模型的泛化能力;使用CUDA 加速網絡訓練,縮短訓練時間;首次將卷積神經網絡應用于Image Net大規模視覺識別挑戰賽,并一舉摘得桂冠。
隨后,卷積神經網絡備受各方關注,學者們根據各自的研究目的和應用領域,改進和優化卷積神經網絡的結構和參數。Simonyan等[26]探究卷積神經網絡的深度并提出VGG 模型,通過對不同層數的網絡在圖像分類中的結果,證明提升網絡深度可有效提高圖像分類精度。也有學者通過增加網絡寬度來提升卷積神經網絡的性能,但參數的增加不僅會大大增加計算量,而且會使網絡陷入過擬合。Google團隊提出名為Inception的新型結構[27],不僅能保持網絡稀疏性,而且能充分利用密集矩陣的計算性能。Inception結構在原模型的基礎上對卷積層進行分塊,使用3個不同大小的卷積核結合1個池化層構成新的卷積層,有效避免由于網絡模型密集導致的過擬合,同時也能解決傳統神經網絡使用隨機稀疏鏈接而產生的計算性能下降等問題,為卷積神經網絡的發展提供很好的結構依據(圖4)。

圖4 Inception結構
Springenberg等[28]對卷積神經網絡池化層的存在必要性提出質疑,并設計不含池化層的“完全卷積網絡”。這種網絡在結構上比其他卷積神經網絡更簡單,但性能可與其他卷積神經網絡相匹敵。He等[29]提出按一定的規則用卷積層堆疊不同的殘差模塊構建深度殘差網絡,從而解決退化問題,訓練誤差隨層數的增大而減小,誤差率遠低于VGG模型。
對于卷積神經網絡結構的研究具有廣闊的前景,目前主要形成兩大趨勢。①增加卷積神經網絡的深度,重點解決深層網絡存在的痼疾(如梯度消失),從而解決深層網絡的訓練問題;②優化卷積神經網絡的結構,降低深層網絡的復雜度,增強對神經網絡結構的認識,開發更加簡潔和高效的網絡,提升網絡性能。
3.2.2 訓練方法
由于卷積神經網絡屬于多層的前饋神經網絡,可用反向傳播算法及其衍生算法進行訓練[30]。然而越來越復雜的模型結構使得訓練所需的樣本集越來越大,反向傳播算法已不能滿足新模型的需求。近年來,學者們提出新方法來加速網絡訓練,根據加速機制可大致分為基于CPU 或GPU 的硬加速方法以及基于加速算法的軟加速方法。
硬加速方法是采用CPU 或GPU 等處理器編程實現卷積神經網絡快速訓練的算法。Krizhevsky等[25]提出的著名的Alex Net模型即采用GPU 加速訓練,從而減少訓練時間;Rajeswar等[31]提出的CPU 和GPU 訓練方法的訓練速度可比傳統訓練方法提高10~12倍。近年來,學者們還提出基于云計算的加速方法,如基于Apache Spark云計算環境的訓練方法[32]對卷積操作的加速效果明顯,訓練速度可比傳統訓練方法提高40~250倍。
軟加速方法通過加速算法提高訓練速度。Cong等[32]基于Strassen矩陣乘法的思想,通過降低卷積神經網絡的計算量來減少訓練時間,取得不錯的效果。Kim 等[33]在池化層前加入1個附加層,采用基于極限學習機的改進反向傳播算法對附加層中的參數進行優化,不僅極大地減少訓練時間,而且對小規模的樣本集訓練也有較高的準確率。
SAR 與光學傳感器的成像機制不同,SAR 圖像的亮暗可反映地物后向散射回波的強弱,即圖像越亮則回波越強,圖像越暗則回波越弱。地物表面越粗糙,SAR 接收的后向散射越強,圖像越亮,如海面和潮灘等表面相對光滑的地物在圖像上偏暗,而建筑和基巖海岸等表面相對粗糙的地物在圖像上偏亮。盡管某些地物的目視亮暗差異不明顯,但通過對訓練集的學習,卷積神經網絡能夠提取更本質和更抽象的特征,從而準確地分類地物。目前針對海島海岸帶地物信息提取的卷積神經網絡研究較少,但已有較好的成果。Bentes等[34]構建可重疊去噪和自動編碼的卷積神經網絡,實現對海洋目標的分類;馬麗媛[35]采用基于復數輪廓波的卷積神經網絡提取舊金山海灣地區的地物信息,在不同方向和不同尺度上逼近待分類的圖像,得到對SAR 圖像更稀疏的表示,整體精度提升5.29%;李金鑫[36]對比樣本集切片的大小對分類結果的影響,驗證卷積神經網絡應用于SAR 地物分類的高效性;Bentes等[37]利用卷積神經網絡實現對Terra SAR-X 高分辨率圖像提供的港口、油輪、貨船、海上平臺和風力發電機5個目標數據集的分類,并得到廣泛的應用??梢?卷積神經網絡用于SAR 遙感海島海岸帶地物信息提取具有較大發展潛力。與傳統方法相比,基于卷積神經網絡的地物信息提取方法精度更高,魯棒性和泛化能力更強。
現有的基于極化特征和紋理特征的海島海岸帶地物信息提取方法雖取得不錯的進展,但仍有一些尚未解決的問題。近年來,隨著深度學習浪潮席卷而來,卷積神經網絡在圖像處理領域的表現尤為亮眼。其通過提取圖像中地物的深層特征,可檢測出地物的細微差別以及應對地物目標的非線性混合。卷積神經網絡的不斷發展對提高海島海岸帶地物分類的準確率以及解決不同地物混合的問題具有重要價值。
卷積神經網絡在地物信息提取中的優勢大致可分為5個方面:①卷積層可以提取更本質和更抽象的特征,檢測出SAR 圖像中相似地物之間的細微差別;②應對非線性的優勢有助于解決不同地物混合的問題;③池化層可以篩選出最有價值的特征和減少冗余的特征,從而減小計算量;④結構簡單,網絡權值共享的特性可以極大地減少參數數量;⑤可直接將SAR 圖像的原始像素作為輸入值,而無須預先提取圖像特征,避免重復和煩瑣的圖像數據預處理工作。
基于目前卷積神經網絡在SAR 遙感海島海岸帶地物信息提取中的應用現狀,未來應在3個方面開展嘗試和探究。①由于卷積神經網絡在小規模樣本集中的優勢不明顯,可選取一些已經在大規模樣本集上訓練好的泛化能力強的模型,再輸入少量的研究樣本微調參數,從而減小工作量,且在理論上并不影響精度;②根據我國不同地區海島海岸帶的環境特異性,確定合適的結構參數,包括卷積核大小、卷積層數和學習率等;③嘗試構建較大規模的海島海岸帶SAR 圖像樣本集,更好地訓練所用的卷積神經網絡,為相關研究人員或業務部門提供樣本數據支持,為我國海島海岸帶監管提供精細化服務。