朱 明,楊如軍,蔣宇雯
廣西自然資源信息中心,廣西 南寧 530029
甘蔗是廣西重要農產品之一,20 世紀90 年代以來廣西的甘蔗種植面積一直居于全國首位,種植甘蔗對經濟發展與農民增收具有重要作用。及時獲取甘蔗種植區域的相關數據對于糖業宏觀調控、生產管理與政策制定具有重要意義[1],但長期以來廣西甘蔗的種植區域主要依靠抽樣調查統計,缺乏快速、準確、全面的獲取手段。近年來,高分辨率衛星影像的光譜分辨率、空間分辨率與時間分辨率不斷提高[2],為遙感提取甘蔗種植區域的相關數據提供了堅實的基礎。
傳統利用遙感手段提取甘蔗種植區域的方法主要是綜合利用影像的光譜、紋理等特征,使用人工設計的特征參數進行分類[3-5]。這些方法主要是利用若干有限維度的淺層特征,按一定的算法與解譯規則來提取地面作物。現實中地物在影像特征上存在區域差異性及表現的不確定性,同物異譜、同譜異物的情況較為常見[6];而且廣西甘蔗的種植區域地形復雜,地塊破碎、部分區域存在作物套種等[7]。這些不利因素增加了甘蔗種植區域提取的難度,制約了甘蔗種植面積的自動化提取精度與效率。近年來,深度學習(Deep Learning)技術[8]為大數據時代甘蔗種植區域提取提供了新的理論方法,解決了甘蔗影像特征提取、解譯等規則智能化的問題,為自動提取提供了新的解決方法與思路。
實驗區域位于廣西南寧市扶綏縣,北緯22°17′~ 23°57′、東經107°31′~108°06′,總面積2 841 km2,是廣西甘蔗主產區之一,甘蔗種植范圍大,具有較高的實驗價值。
SE-CNN 的訓練需要制作大量的訓練樣本,訓練樣本的數據源主要包括高分辨率衛星影像數據與甘蔗種植圖斑兩大類數據。實驗數據采用2000 國家大地坐標系和1985 國家高程基準。實驗區域的高分辨率衛星影像數據選取的是2018 年融合后的“高分二號”與“北京二號”衛星影像數據,包含紅、綠、藍及近紅外等4 個波段。所有的衛星影像數據均制作為正射影像數據,影像融合后分辨率為0.8 m,平面中誤差控制在5 個像素以內,所有影像數據均未進行勻光、勻色處理(見圖1)。地理國情監測數據選取的為2018 年數據成果中的甘蔗分類數據,數據生產完成時間略晚于高分辨率衛星影像數據拍攝時間。國情監測數據比例尺為1 ∶1 萬,已通過質檢驗收,數據精度滿足樣本制作要求。
研究小組在實驗區對訓練樣本中標注的甘蔗區域進行了外業核查,核實內業采集的甘蔗地塊與實際情況是否一致。同時,在工作底圖上注明外業核查發現的采集錯誤并進行實地補測,之后通過內業整理獲得最終樣本數據。
數據采集完成后,研究小組將所有甘蔗地塊的矢量數據轉換為圖斑柵格數據,并標注柵格數據的每個像素為甘蔗分類,標注后的圖斑柵格數據與高分辨率衛星影像疊加并裁切為訓練樣本切片,切片規格為512×512 像素。
實驗區內甘蔗地塊的尺度差異性較大,部分甘蔗地塊與周邊作物的邊緣較為模糊。為了使SE-CNN 能夠精確地提取甘蔗種植區域,模型必須具有良好的甘蔗影像特征提取能力以及平移、旋轉不變性等特點,并且能夠解決多次下采樣與卷積導致的特征圖分辨率過低、丟失語義空間信息等問題。SE-CNN 采用了編碼—解碼結構,其中編碼模塊主要用于提取甘蔗影像特征,最終形成高維影像特征圖;解碼模塊可以在高維甘蔗特征圖的基礎上,依據特征圖及低層信息逐步重建甘蔗地塊的空間分辨率,最終按像素輸出甘蔗種植地塊。整個模型中所有的訓練參數主要與卷積核相關,因此,在完成構建后,SE-CNN 可以處理任意大小的高分辨率衛星影像。

圖1 實驗區域影像樣例圖
1.2.1 編碼模塊設計
編碼模塊主要通過Inception 塊與ResNet來提取甘蔗的影像特征。在Inception 塊中使用4 種擴張率的卷積擴大SE-CNN 對影像的感知范圍,同時有效捕捉不同尺度的甘蔗影像特征。研究小組在Inception 塊中設置了1×1 卷積融合4種不同擴張率的卷積特征,實現了多尺度特征的融合,同時在Inception 塊之后串聯了154 層殘差網絡,殘差網絡中反復使用了1×1、3×3 與1×1 卷積模塊。這些結構在殘差網絡中反復串聯、搭配,形成101 層的深度神經網絡,完成對影像中甘蔗種植區域特征的深度提取。
1.2.2 解碼模塊設計
解碼模塊部分負責重建整景影像的空間分辨率,并輸出甘蔗種植區域的預測圖斑。使用卷積提取的甘蔗影像特征是高維特征,損失了甘蔗種植區域的細節信息與空間分辨率,研究小組為了在上采樣過程中恢復甘蔗種植區域的空間分辨率,通過上采樣插值來彌補卷積后丟失的空間信息,以及在上采樣后不斷融入編碼階段低層級的特征細節,擴充有效特征的信息量,補充缺失的真實特征信息。最終通過分類器將解碼后的數據輸出為預測結果。
深度神經網絡的訓練目的是通過誤差反向傳播算法盡可能實現與目標函數的擬合,本質是求解損失函數的極小值。SE-CNN 的損失函數是以交叉熵損失函數為基礎設計的,甘蔗種植區域提取是二分問題,因此,研究小組在損失函數中加入了強化二分的損失函數。具體的損失函數計算公式為:

公式(1)中,L為SE-CNN 的損失函數;Lc為交叉熵損失函數;5? 為hinge 損失函數。
Lc的計算公式為:

公式(1)中,5? 為hinge 損失函數;計算公式為:

研究小組發現,通過運用損失函數,可以在訓練過程中促使SE-CNN 側重于學習,有利于提取甘蔗種植區域的影像特征,在反復的迭代訓練后,可以讓神經網絡的輸出結果盡可能擬合參考真值。
此次實驗環境為Centos 7.3 操作系統,使用 Python 3.6.5 及TensorFlow 1.12 實 現SECNN,GPU 并行計算架構為Cuda 10.0。實驗設備使用1 臺圖形工作站,CPU 為I7-9700 K、采用4 路并聯NVIDIA GeForce RTX 2080TI 顯卡,64 GB 內存。實驗數據為15 000 張512×512像素切片,其中以80%切片作為訓練集,20%切片作為驗證集,用于檢測提取精度的數據為5 000×5 000 像素的北京二號0.8 m 高分辨率衛星影像數據,訓練過程中進行了320 次迭代訓練。
實驗中將影像劃分為甘蔗與非甘蔗2 種不同區域。為了分析對比SE-CNN 的提取精度,研究小組在實驗中采用了常用的U-Net 模型作為對比方法。從實驗區的甘蔗種植區域提取效果圖(見圖2)可以看出,SE-CNN 的提取結果更精細,能夠區分較小的田間道路,在田塊的提取上更精準。
為了更精確地分析實驗區甘蔗種植區域的提取精度,研究小組采用了總體精度、召回率、交并比以及Kappa 系數等4 種精度指標進行衡量。總體精度為正確提取像素的比重,召回率為模型的正樣本提取能力,交并比為正確提取甘蔗部分與參考真值間并集的比例,Kappa 系數為甘蔗種植區域提取的相似程度。
SE-CNN 的甘蔗種植區域提取總體精度達到93.91%,能準確地從衛星影像中提取各種形狀的甘蔗種植地塊(見表1)。研究小組通過橫向對比發現,SE-CNN 的提取精度優于常規語義分割神經網絡模型,與U-Net 相比,精度、IOU 等指標提升了3%以上。這說明SE-CNN 能夠從樣本中學習與提取更多的甘蔗影像特征,并且能夠利用這些特征提高提取精度。實驗結果表明,SE-CNN 針對高分辨率遙感影像設計的結構達到了預期目的,在同樣條件下具備較高的提取精度。

表1 實驗區2 種提取甘蔗種植區域的方法的精度對比表
遙感甘蔗區域提取本質是對影像數據的語義分割,提高影像語義分割精度,有助于進一步提升提取精度[9]。提高基于深度學習的高分辨率衛星影像提取的精度的關鍵在于準備數量充足、特征豐富的影像分類訓練樣本[10],并在此基礎上設計面向影像分類特征提取的深度神經網絡結構[11]。此次研究中,研究小組準備了1.5 萬張訓練樣本,確保SE-CNN 能夠自主學習大量的訓練樣本,以提取甘蔗種植區域的影像特征。在神經網絡設計階段,研究小組結合高分辨率衛星影像數據與甘蔗種植范圍提取任務特點,通過編碼模塊中不同擴張率的卷積組合,對不同尺度的特征進行捕捉,實現多尺度語義特征提取。在解碼模塊中,SECNN 提取的語義信息經過解碼后轉化為像素級的甘蔗種植區域,并輸出最終的統計結果。
研究結果表明,SE-CNN 能夠準確地從高分辨率衛星影像中提取甘蔗的種植區域,總體精度達到93.91%。但此次實驗中SE-CNN 也出現了部分提取錯誤的情況,這主要反映在甘蔗種植區域的邊緣(見圖3),主要是由地物壓蓋造成的。因為甘蔗生長茂盛,壓蓋了部分田間道路,導致道路的特征與甘蔗的特征非常接近,所以SECNN 誤將道路提取為甘蔗種植區域。這種情況在甘蔗長勢旺盛、植被復雜的區域更為明顯。

圖2 SE-CNN 方法與U-Net 方法提取甘蔗種植區域效果對比圖

圖3 甘蔗地塊邊緣提取錯誤示例圖
SE-CNN 能夠使用GPU 進行計算,明顯提升了處理效率,經過人工檢核,深度學習方法基本可以滿足自動化生產需要。
此次的研究還存在一些不足:需要投入較多的人力采集加工訓練樣本,往后還需從提高作業效率、降低提取成本的角度考慮小樣本、高精度的樣本集與神經網絡構建方法。此次研究主要針對的是可見光及近紅外波段,如果在現有基礎上融入高光譜特征,可以進一步增加特征維度,提高甘蔗種植區域的提取精度。
研究小組在研究基于深度學習的高分辨率衛星影像甘蔗種植區域提取方法的基礎上。根據影像數據特點與甘蔗種植范圍提取任務要求,研究并設計了編碼與解碼模塊,建立了具有編碼—解碼結構的SE-CNN 深度學習模型。實驗證明,將深度學習用于高分辨率衛星影像以提取甘蔗種植區域,能夠有效提高提取的精度與效率,為自動提取甘蔗種植區域提供了新的解決方法與技術路線。