張宏鳴 全 凱 楊亞男 楊江濤 陳 歡 郭偉玲
(1.西北農林科技大學信息工程學院, 陜西楊凌 712100; 2.西北農林科技大學水利與建筑工程學院, 陜西楊凌 712100;3.安徽理工大學測繪學院, 淮南 232001)
數字高程模型(Digital elevation model,DEM)[1]是將地表高程用數字形式表達的有序陣列,具有豐富的地學應用價值[2],被廣泛應用于水文分析、流域特征提取、城市規劃等方面。DEM的精度決定了地學信息提取及分析的準確度[3]。受測量成本和技術限制,高精度的DEM較難獲得[4-5]。衛星遙感是近年來獲取高精度DEM的較好方法。采用航空攝影、SAR(Synthetic aperture radar)、光探測等技術獲取DEM,在時間、成本和工作量上有著較大的優勢[6]。無人機遙感技術由于設備體積小、操作簡單、靈活性強等優勢而被廣泛應用于航空遙感、地面遙感、精準農業領域[7-8]。隨著多種數據獲取技術的發展,同一地區的遙感影像越來越多,具有多時相、多光譜、多分辨率的特點[9]。為了利用多源數據的互補性和合作性提取更加豐富的信息,學者們對數據融合技術進行了研究[10-11]。然而,由于安全性和保密性等原因,獲取多源數據極為困難。近年來,對低分辨率DEM重構直接獲取高分辨率DEM的超分辨率方法具有很強的可行性[12]。
DEM超分辨率方法的研究由來已久[13-16]。隨著計算機技術和人工智能的發展,研究發現,基于學習的方法能夠有效利用高效能計算機硬件的優勢,抽象地學習到高低分辨率數據之間的映射關系,從而提高DEM精度[17]。文獻[18]提出了非局部相似性的方法,利用測試區域同其他相似區域的關系重構DEM數據。文獻[19]使用稀疏混合估計法對10、20、40 m的DEM進行重構變換,研究了超分辨率對黃土高原DEM坡度的影響。文獻[20]設計了一種HNN神經網絡,對20、60、90 m的格網DEM進行超分辨率重構,進一步提高了格網DEM的重構精度。文獻[21]分析了幾種卷積神經網絡方法對DSM重構結果的影響,證明對于子像素級的DSM,超分辨率方法更易獲取更高精度的數據。文獻[22]提出了一種全卷積神經網絡算法,對衛星高程數據和實地測繪數據之間的映射關系進行研究,提升了公共DEM的精度。傳統端到端方法的網絡模型設計簡單,且運算快捷[23]。為了進一步提高結果的精度,有學者證明適度增加卷積網絡層數可獲得很好的效果[24]。但是,網絡層數的增加意味著更大的計算量和更多的時間消耗,不適用于實時數據處理。有學者提出了殘差學習思路,在網絡訓練時,只進行差值計算[25]。由于DEM高程往往較高,相對于普通圖像在這種訓練思路下獲益更大。因此,深層殘差卷積神經網絡可能是提升DEM精度的有效方法。
梯田DEM在農業領域應用廣泛。低分辨率梯田DEM的田坎、田埂等紋理過于模糊,不能準確表達實際地形特征[26]。通過超分辨率重構對梯田DEM的格網空間進行重新分配,能夠獲得更加精細和微觀的梯田地理信息表達[27-28]。本文利用無人機梯田DEM數據,采用深層殘差卷積神經網絡對低分辨率梯田DEM進行重構,獲取高分辨率DEM,并提取坡度。將高程結果和坡度結果分別與雙立方插值法、稀疏混合估計法的結果進行對比,以證明本文方法具有更強的學習數據和獲取地形特征的能力,以期為梯田DEM超分辨率重構方法的研究提供思路。
以渝中地區龍泉鄉黃土丘陵區典型旱梯田區為實驗區,地理坐標為104°10′58″~104°19′51″E,35°34′4″~35°40′56″N,具有一定的代表性。該實驗區DEM數據及其所在的黃土高原位置如圖1所示,原始分辨率為0.5 m,高程為1 951.03~2 545.55 m。
由于不同區域數據高程差距較大。為了減小誤差,使訓練集適應大部分梯田數據。選取具有不同高程特點的實驗樣區1、2、3為訓練樣本集。其中,實驗樣區1整體高程較高,實驗樣區2整體高程適中,實驗樣區3整體高程較低。選取面積較大的實驗樣區4作為測試樣本,地勢整體起伏較大,覆蓋高程范圍廣,能測試出更準確結果。樣本區域如圖2所示。
卷積神經網絡是一種基于卷積運算的前饋神經網絡,通過對大量樣本的有監督學習,將數據抽象化,并將特征提取的過程隱含在網絡中[29]。深層的卷積神經網絡結構可以加深層與層之間的聯系,更好地學習到復雜的網絡模型,提高網絡對高頻信息的表達能力[30]。本文將輸入數據預插值到重構尺寸,通過對數據的訓練,學習高低分辨率數據之間的映射關系,進而重構出高頻信息來達到重構效果。
1.2.1算法流程
整個算法流程可描述為:①對原始訓練樣本進行重采樣,生成低分辨率數據集,將二者混合得到高低分辨率樣本集。②對高低分辨率樣本集進行預處理,完成訓練數據集準備。③控制神經網絡結構,生成深層殘差卷積神經網絡。④對訓練數據進行特征提取,選取合適的損失函數對其訓練得到最優模型。⑤輸入測試數據,使用最優模型對其進行重構。⑥將輸出的數據轉換為DEM數據格式(ASCII碼)。⑦從高分辨率DEM數據中提取坡度。整體算法流程圖如圖3所示。
1.2.2網絡結構
使用一種深層的殘差網絡[31]進行訓練,這種殘差學習方法可以緩解加深網絡層數帶來的梯度爆炸問題,并有效減少整個網絡的參數。采用一種跳躍連接結構,假設y為映射目的層,x為輸入層,則殘差函數表達為
F(x)=y-x
(1)
此時,原始函數可定義為
y=F(x)+x
(2)
在每一次卷積操作后對輸出進行補零操作,保證輸入輸出數據尺寸相同,忽略偏差值,則整個殘差網絡可用數學公式表達為
H(x)=F(x,{Wi})+x
(3)
整個網絡共有22層。第1層處理輸入數據特征,中間20層每層包含64個3×3×64的卷積核,最后一層包含1個3×3×64的卷積核。將原始低分辨率DEM進行雙立方插值預處理到目標尺寸,輸入模型中得到高分辨率DEM。
用ReLU激活函數[32]對每次卷積的結果進行非線性擬合,相比于其他激活函數,由于其一定的稀疏性,能更好地擬合訓練數據。同時,其單側抑制性實現了對信號的部分響應,提高了訓練速度,公式為
σ(x)=max(0,x)
(4)
1.2.3損失函數
文獻[33]表明使用平均絕對誤差(Mean absolute error,MAE)損失函數訓練得到的結果較好,故本文使用MAE損失函數進行DEM數據訓練。
用均方根誤差(Root mean square error,RMSE)作為重構準確性評價標準,值越小,說明重構后的DEM結果相對于真實數據的差距越小,更加符合真實梯田地形地貌特征。
為了更清楚地展示重構結果,本文截取了局部DEM及其坡度計算結果,將深層殘差網絡法(Very deep convolutional networks super-resolution,VDSR)結果分別與雙立方插值法(Bicubic interpolation,CUBIC)[34]、稀疏混合估計法(Sparse mixed estimation,SME)[35]進行對比評價。用作差法、頻率曲線法和RMSE指標對結果進行統計分析,進一步驗證重構結果。
實驗中對原始測試數據進行雙立方插值之后得到對應的10、20、40 m的低分辨率數據。將該3種分辨率的數據采用不同方法重構成相應的高分辨率數據(5、10、20 m),從重構后的數據中提取坡度數據并與實際坡度數據進行對比。40 m到20 m的重構稱為R20,20 m到10 m的重構稱為R10,10 m到5 m的重構稱為R05。
對于深層殘差卷積神經網絡訓練方法,將高低分辨率DEM數據進行切割和旋轉操作,混合所有樣本共340個,挑選30個梯田特征較明顯的數據作為測試集。設置基本學習率為1×10-5,模型使用Adam優化方法,設定β1=0.9,β2=0.999,ε=1×10-8。訓練134 000次得到最佳模型。實驗使用Caffe、Matconvnet實現,用NVIDIA M4000 GPU進行訓練。
為了更好地展示實驗結果,將測試樣本(實驗樣區4)的典型梯田區域局部放大。3種方法生成的不同分辨率DEM和實際高分辨率DEM(Origin digital elevation model,OD)如圖4所示,從上到下的3行數據依次為R05、R10、R20的計算結果,顏色由綠變紅表示高程由低變高。
從DEM數據中提取坡度結果,由3種方法生成的不同分辨率DEM提取到的坡度結果和實際高分辨率坡度數據(Origin slope,OS)如圖5所示,3行數據從上到下分別為R05、R10、R20的計算結果,顏色由綠到紅表示坡度由平緩變陡峭。
隨著分辨率的升高,3種方法提取到的坡度整體精度得到提升,并且與實際結果逐漸接近,其中深層殘差網絡法在3種分辨率條件下均最好。
在不同的分辨率情況下,深層殘差網絡法提取結果在空間分布上明顯好于其他方法,尤其在較為平坦區域(田面)和較為陡峭區域(田埂)的重構結果,能夠提取到空間分布更加精確的紋理效果。
在分辨率較低情況下,深層殘差網絡法仍能保持相對較好的空間線條。
以R05為例,將雙立方插值法、稀疏混合估計法、深層殘差網絡法提取到的DEM數據分別同實際5 m DEM數據作差,結果如圖6所示。
雙立方插值法、深層殘差網絡法的DEM差值結果表現為田坎、陡坡處誤差較大,田面處誤差較小。稀疏混合估計法出現了誤差分布不一的情況,與數據本身的相關性并不大。
以R05為例,將3種方法提取到的坡度計算結果分別同實際5 m坡度數據作差。結果如圖7所示。圖像顏色綠色區域占比越大,該處理方法誤差越小,效果越好。
從圖7結果可以看出,雙立方插值法、深層殘差網絡法在田坎、陡坡處誤差較大,而田面處重構效果較好。稀疏混合估計法的誤差并未集中在某一類區域,整體分布較為分散,在田面處也出現了效果不好的現象。
深層殘差網絡法的坡度誤差很少會出現較長的連續條狀紋理,其誤差均集中在坡度較高的梯田區域,面積占比更大的田面區域絕大多數重構誤差低于5°。
將各方法結果同實際結果作差,計算DEM差值頻率和DEM累計差值頻率分布如圖8所示。深層殘差網絡法的高程誤差在0.5 m以內的區域占到了98.3%,稀疏混合估計法的高程誤差在0.5 m以內的區域占到了97%,與雙立方插值法接近。
將各方法結果同實際結果作差,計算坡度差值頻率和坡度累計差值頻率分布如圖9所示。從曲線圖中可以看到,3種方法均為深層殘差網絡法效果最好。與實際結果相比,深層殘差網絡法95%以上的區域誤差在5°以內,稀疏混合估計法93%區域誤差在5°以內,而雙立方插值法的這個比例在90%以下。
根據表1的差值結果分析,3種方法的高程和坡度誤差最小值均為0。由最大值來看,深層殘差網絡法的高程誤差和坡度誤差的最大值最小,而其他方法會造成誤差局部過大情況。就高程平均值來看,深層殘差網絡法與稀疏混合估計法相同,好于雙立方插值法。深層殘差網絡法在坡度誤差平均值上好于稀疏混合估計法和雙立方插值法。
由表2的RMSE結果可知,深層殘差網絡法在高程和坡度結果上與實地數據偏離最小。

表1 差值結果Tab.1 Difference result

表2 RMSE結果Tab.2 RMSE result
根據耗時時間分析,稀疏混合估計法處理時間為663.39 s,而深層殘差網絡法處理時間僅為2.16 s,較稀疏混合估計法提升了300多倍。雙立方插值法計算較為簡單,處理時間為0.052 s,消耗時間最少。深層殘差網絡法在處理時間上具有較大優勢。
(1)針對常規的DEM超分辨率重構方法精度不高、難以滿足實際需要的問題,提出一種卷積神經網絡方法對DEM進行超分辨率重構,并分別在DEM結果和坡度結果上與傳統插值法(雙立方插值法)和淺層學習法(稀疏混合估計法)進行對比分析。通過實驗驗證,本文方法在DEM上的差值平均值和RMSE結果分別為0.34、0.486 9 m,較其他方法均有所提升。在坡度上的差值平均值和RMSE結果分別為1.99°、2.738 7°,比其他方法的地形數據結果更加接近原始地形。處理時間僅為2.16 s,比淺層學習法提升300多倍。
(2)在多源數據難以獲得的現實情況下,利用多分辨率DEM數據之間信息的互補性,結合適當的深層網絡設計,可以更好地映射原始數據與結果數據之間的關系。采用殘差網絡學習方法,可以降低訓練難度。深層殘差網絡方法能夠有效提高DEM精度,為獲取高分辨率DEM提供了新的思路。