張永宏,許 帆,闞 希,曹海嘯
(1.南京信息工程大學 自動化學院,南京 210044;2.南京信息工程大學 濱江學院,江蘇 無錫 213982)
積雪在地球表面覆蓋范圍廣泛且變化活躍,其在可見光波段呈現的高反射率和低導熱性直接影響地表反照率、空氣及土壤的溫度,是反映全球能量平衡的重要指標[1]。新疆作為我國穩定的三大季節性積雪區之一[2],其大范圍積雪覆蓋的相關信息研究為亞洲季風氣候、降水等課題提供了可靠的參考來源,同時對當地淡水資源管理、強降雪等災害預防以及居民生產生活產生一定的影響,因此構建高精度、高效率、高穩定性的積雪覆蓋度反演模型具有重要的科學與現實意義。在多分辨率遙感衛星技術發展之前,新疆區域的積雪監測研究受地面氣象站點的數量少及不均勻分布的限制,無法提供范圍廣、空間代表性強的數據資料。
相比傳統二值化積雪遙感產品,基于亞像元尺度下的積雪覆蓋度(Fractional Snow Cover,FSC)估算產品能為下墊面類型復雜、混合像元嚴重以及邊緣信息模糊的積雪地區提供更細致、準確的積雪面積參數。目前,通過光學和微波遙感獲得積雪范圍遙感監測與制圖的衛星數據[3]。由于微波遙感數據受制于較低的空間分辨率,因此基于亞像元尺度的FSC 反演方法的研究多集中于光學遙感資料。光學遙感FSC 的反演算法大致分為線性回歸算法、基于光譜分析的混合像元分解算法和基于機器學習算法。
文獻[3]基于雪蓋算法提出FSC 與歸一化冰雪指數(NDSI)存在著正相關線性關系的概念,并給出了相應的計算模型,為后期各類型FSC 的估算研究提供了思路。隨著FSC 研究的不斷深入,研究人員發現經驗算法在處理地物類型復雜研究區域的FSC估算工作中存在一定的不足,僅利用各類型影響因子建立的積雪覆蓋度線性關系模型通常存在泛化能力較差、穩定性低的問題。
大多數研究人員通過構建混合像元分解模型來解決FSC 估算問題。文獻[4]提出基于Landsat8 TM的積雪制圖算法,通過決策樹的回歸與分類模型對TM 圖像進行解混。文獻[5]提出一種基于光譜線性混合與輻射傳輸的中分辨率成像光譜儀(MODIS)積雪覆蓋率和雪粒徑反演的模型(MODSCAG),該模型準確率較高,但容易產生大量無意義的負值。近年來,國內基于混合像元分解理論的研究也取得一些進展。文獻[6]通過對MOD09GA 數據進行純凈像元自動提取,并采用多端元光譜混合分析實現FSC 反演。文獻[7]利用空間光譜端元提取方法自動提取端元,通過全約束最小二乘法求解線性混合模型,基于此,提出國產FY-3D 衛星MERSI-II 資料積雪覆蓋率提取算法。混合像元分解方法在各項參數可靠的基礎上能夠解決積雪覆蓋度的估算問題,但在現實情況中參數的獲取面臨儲多困難,且該方法的運算量較大。
近年來,研究人員嘗試利用以深度學習為代表的人工智能技術解決數據來源廣、尺度不一的遙感數據解譯以及參數反演的問題。文獻[8]將MODIS地表反射率、NDSI、NDVI 和地表覆蓋類型數據作為輸入,基于人工神經網絡應用于FSC 估算。文獻[9]將小波分析技術與ANN 模型相結合,FSC 提取結果表明通過小波變換進行預處理,能夠顯著提高積雪覆蓋度估算精度。文獻[10]以MODIS 地表反射率數據、NDSI、地表溫度、海拔等數據作為輸入,以Landsat/ETM+積雪范圍作為樣本標簽,基于BP 神經網絡模型在黑河流域進行FSC 反演。文獻[11]使用線性回歸、混合像元分解及BP 神經網絡方法分別對山區FSC 進行估算,結果表明,在地形復雜的現實條件下,考慮多因素的線性回歸模型能夠實現更高的預測精度和穩定性。
隨著國產衛星遙感技術的快速發展,尤其是我國新一代地球靜止軌道氣象衛星風云四號A 星(FY-4A)的正式投入使用,其搭載的多通道輻射掃描計(AGRI)具有較高的時間分辨率,利用AGRI 時序特征可以提取更多相關信息。在FSC 反演過程中,預測模型的精度一定程度上依賴于數據源的空間分辨率,尤其在面對混合像元現象嚴重的研究區域時,通常不符合精度標準要求。
本文提出一種基于多尺度特征融合網絡的積雪覆蓋度估算方法。根據FY-4A/AGRI 遙感數據,基于ResNet 網絡結構,結合特征金字塔模式對卷積層特征圖進行重構,融合深度網絡中深、淺層特征的多尺度信息,增強網絡模型的特征表達能力,從而得到精度較高的積雪覆蓋度估算結果,同時為國產遙感衛星下的積雪大范圍覆蓋研究提供有效的FSC 參數。
新疆地區與西藏、東北地區并列,是我國季節性積雪資源最為豐富的省份之一[12]。研究結果表明,近五十年來新疆地區的積雪期一般從當年11 月份持續到次年3 月份,積雪空間分布規律遵循北多南少,積雪豐富區域大多分布在天山山區和新疆北部阿勒泰、塔城和伊犁河谷。新疆地區地理高程及研究數據源分布如圖1 所示(彩色效果見《計算機工程》官網HTML 版)。新疆年平均自然降水量僅為155 mm,積雪融水為河川徑流和生態發展提供了主要水資源[13]。降雪與融雪從兩個方面影響著當地長期的生產環境,過于頻繁的降雪使得牧區草場被積雪長時間覆蓋,難以保障畜牧正常覓食活動,而積雪消融期的融雪性洪水給當地居民的生產和生活帶來巨大的阻礙。由于新疆的地面氣象站分布稀疏,地面積雪觀測資料較為缺乏,因此高時空分辨率的遙感積雪資料對新疆地區積雪范圍監控有著重要意義。

圖1 新疆數字高程及研究數據源分布Fig.1 Distribution of digital elevation and research data sources in Xinjiang
1.2.1 FY-4A/AGRI 數據
FY-4A 是我國第二代地球靜止軌道(GEO)定量遙感衛星的首顆星[14],AGRI 作為其主要載荷之一,可實現分鐘級的區域快速掃描。輻射成像通道覆蓋了可見光、短紅外波、中波紅外和長波紅外等波段。本文使用AGRI L1 級產品2 000 m 空間分辨率的7通道影像數據作為主要研究數據,具體通道數據信息如表1 所示。

表1 FY-4A/AGRI 7 通道數據信息Table 1 Data information of FY-4A/AGRI 7 channels
由于地形起伏、大氣折射、地球自轉等因素導致遙感圖像在地理位置上發生變化[15]。為排除上述因素帶來的誤差,本文需要對原始影像數據結構進行重建。AGRI 數據預處理主要分為可見光近紅外波段定標、幾何校正、矢量裁剪3 個步驟。FY-4A/AGRI數據源預處理流程如圖2 所示。幾何校正采用地理位置查找表(GLT)將源影像轉換成0.02°等經緯度影像,以完成待處理數據中每個像元與地理空間信息的匹配,根據新疆區域矢量文件裁剪出感興趣區域文件,最終獲得預處理后的圖像。新疆地區FY-4A/AGRI 真彩圖像如圖3 所示(彩色效果見《計算機工程》官網HTML 版)。

圖2 FY-4A/AGRI 數據源預處理流程Fig.2 Preprocessing procedure of FY-4A/AGRI data source

圖3 新疆地區FY-4A/AGRI 真彩圖像Fig.3 True color images of FY-4A/AGRI in Xinjiang
1.2.2 地理信息數據源和特征參數
地理信息數據源包括地理高程數據、坡度和坡向數據。本文采用GTOPO30(Global 30 Arc-Second Elevation)作為高程數據。高程數據、坡度和坡向數據主要反映研究區域的地理特征,其中坡度和坡向數據由高程數據計算得出,增加坡度和坡向地理信息數據為FSC 提取模型的輸入增添了多樣性,同時也為積雪不規則分布地區的FSC 反演工作增加了穩定性因素,新疆地區坡度和坡向圖分別如圖4、圖5所示(彩色效果見《計算機工程》官網HTML 版)。

圖4 新疆地區坡度圖Fig.4 Slope map in Xinjiang

圖5 新疆地區坡向圖Fig.5 Aspect map in Xinjiang
1)歸一化冰雪指數(NDSI)用于區別云雪在AGRI 通道1 和通道5 反射率差異,如式(1)所示:

2)歸一化植被指數(NDVI)用于反映植被覆蓋情況,包括AGRI 通道5 和通道3,如式(2)所示:

1.2.3 積雪遙感產品(MOD10A1)
本文使用的MODIS 每日積雪產品MOD10A1來源于美國國家航空航天局(National Aeronautics and Space Administration,NASA)的地球觀測系統數據及信息系統網站[12],被廣泛用于積雪范圍的監測和研究。
為實現MODSI 數據的FSC 制圖,文獻[13]構建一種NDSI 和FSC 的線性關系模型,如式(3)所示:

本文將MOD10A1 產品數據投影到WGS84 地理坐標系,使用Google Earth Engine 大數據云平臺,根據式(3)輸出FSC 通道數據。
1.2.4 真值標簽
真值標簽的制作是有監督深度學習方法的關鍵步驟[16]。本文FSC 真值標簽來源于30 m 空間分辨率的Landsat8-OLI 陸地成像儀拍攝的影像,2019 年1 月29 日軌道號為147031 的Landsat8-OLI 遙感影像FSC 的真值提取圖像如圖6 所示,估算方法如下:

圖6 Landsat8-OLI 遙感影像積雪覆蓋度提取圖像Fig.6 Image extracted from Landsat8-OLI remote sensing FSC
1)基于Google Earth Engine 大數據平臺,篩選出云覆蓋不高于10%的Landsat8-OLI 影像,將符合要求的圖像按式(4)提取FSC;
2)將真值圖投影成WGS84 地理坐標系,將其與AGRI 預處理后的遙感數據進行像元對像元的地理配準,如式(4)所示:

3)使用ENVI 遙感數據處理工具,通過像素聚類方法將30 m 空間分辨率真值圖重采樣到2 000 m 空間分辨率。
用于FSC 研究的遙感數據規模龐大,其在不同波段的光譜信息和地理信息要素之間存在十分復雜的非線性關系,然而,深度學習方法具有較高的非線性擬合能力和運算效率[17]。在此基礎上,本文構建一個基于ResNet的改進網絡模型,對新疆地區FY-4A/AGRI FSC 進行估算與研究,其方法流程如圖7 所示。云/雪的誤判是影響積雪遙感產品精度的一個重要因素,當地形或氣象條件變得嚴峻時,尤其在新疆的高海拔地區,存在大量混淆信息。去云算法是根據FY-4A/AGRI 高時間分辨率特性,基于卷積神經網絡對積雪的時序特征進行提取,從而降低云雪誤判概率。

圖7 本文方法流程Fig.7 Procedure of the proposed method
2.1.1 殘差學習
網絡的加深可以提取更復雜的特征,以達到更高的預測精度,但是在網絡學習過程中僅采用堆疊層數、加深網絡的方式,通常存在梯度爆炸和梯度消失的問題[18]。深度殘差網絡(ResNet)通過構建恒等映射為向量輸入-輸出增加多條短路連接路徑,進而快速有效地解決網絡退化的問題。深度殘差網絡模型由若干個基本殘差單元組合而成,基本殘差單元如式(5)所示:

深度殘差網絡通過遞歸可將任意層的殘差單元的特征XL表達出來,如式(6)所示:

其中:Xl為對應殘差單元的輸入;F為殘差函數。
殘差單元的學習過程如圖8 所示,通過圖8 中捷徑連接的方式(相當于電路連接中的短路操作)直接將輸入Block 的x傳播到輸出位置,并將其作為初始結果H(x),當F(x)=0 時,即H(x)=x,以實現恒等映射。輸入信息的傳遞可通過捷徑連接方式跨過若干冗余層,再將誤差通過捷徑連接方式向上傳播。

圖8 殘差單元學習過程Fig.8 Learning process of residual unit
2.1.2 ResNet 網絡結構
相比卷積神經網絡的其他經典架構(如VGG、AlexNet 等),ResNet 具有層級結構清晰、特征表達能力較好、傳播效率高等優點,其主要結構由卷積層、池化層、全連接層組成,如圖9 所示。

圖9 ResNet 網絡結構Fig.9 Structure of ResNet network
ResNet 網絡模型具有較高的數據利用率、較低的冗余信息和良好的可優化性,能較好地匹配光譜信息與地理因素間的非線性關系,因此適用于解決遙感積雪覆蓋度反演的問題。但是ResNet 網絡深層的特征圖具有較低的分辨率,缺乏對空間幾何細節的表達,在一定程度上會影響模型的估算精度,在地形復雜、邊緣信息模糊的研究區條件下,難以呈現細節豐富的FSC 制圖。
深層特征圖和淺層特征圖在語義表達和空間表達方面具有不同的優勢[19]。基于深度殘差網絡和特征金字塔模式融合高層與低層特征的表達優勢,本文綜合考慮預測結果和地理空間分布兩個層面,提出一種更合理的FSC 估算方法。
2.2.1 降維和上采樣
由于ResNet 網絡的卷積過程是自底向上的,輸出的特征也是越來越深的,因此在初步的特征提取過程中,本文對高、低層特征圖自頂向下、由深至淺進行1×1 的卷積降維,使得高層特征圖的通道數與鄰近特征層的通道數相匹配。本文采用最鄰近差值法依次對降維后的每層特征進行尺度為2 的上采樣操作,該方法在保持高速率運算的同時,還最大程度地保留了語義信息。
2.2.2 特征重構
特征的提取與重構主要分為2 個步驟。
1)通過ResNet 網絡對FY-4A/AGRI 遙感圖像進行初步的特征提取,由于第1 個STAGE 卷積層輸出的低層特征不具備較多的語義信息,因此只對STAGE2~STAGE5 共4 個階段的激活特征進行重構,分別對應為c2、c3、c4、c5。STAGE2~STAGE5 每個階段的卷積層3×3。
2)c2、c3、c4、c5 共4 個階段特征圖遵循從高到低逐層上采樣的規律,將上采樣映射結果疊加到相同分辨率的鄰近層特征圖上,每個階段的輸出結果都作為下一個階段的輸入,分別對應為S1、S2、S3,重構過程如圖10 所示。其中:L1 為AGRI 7 通道光譜數據;L2 為地理數據層;X2 為尺度為2 的上采樣操作;將升采樣后的特征圖疊加到相應尺度的特征圖上,通過逐層的疊加與組合,最終生成增強的特征信息。重構過程的參數信息如表2 所示。

表2 特征重構參數信息Table 2 Parameters information of feature reconstruction

圖10 基于ResNet 改進網絡的積雪覆蓋度估算流程Fig.10 Estimation procedure of FSC based on ResNet improved network
損失函數通過度量真實值與預測值之間的偏差,以衡量模型預測效果[20]。本文對融合FY-4A/AGRI 光譜信息和地理特征信息后的遙感數據進行回傳損失,損失表達如式(7)所示:

其中:n為輸入圖像像素數量之和;ti為FSC 真實值;pi為FSC 預測值。
本文方法將2018 年11 月 至2020 年1 月FY-4A/AGRI 2 000 m 空間分辨率的L1 級數據的衛星影像數據作為主要數據來源。按照80%和20%的占比劃分為訓練集和測試集。選擇MODIS 過境新疆地區的MOD10A1 積雪產品V006 版本的遙感影像用于與本文FSC 估算方法進行對比分析。其中,MOD10A1 的載體為太陽同步極軌衛星,每日固定過境時間采用西八區計時規則,AGRI 研究數據采用與MOD10A1 成像時間最接近的5 時30 分的影像。真值標簽的設計與制作采用Landsat8-OLI 30 m 空間分辨率遙感圖像,篩選云量低于10%并符合要求的圖像,共計70 幅遙感源影像,驗證集4 幅遙感源影像。實驗硬件環境為:Intel i9-9900K 16 核心CPU、Nvidia RTX2080 Ti 11GB 顯存。軟件環境為:python3.7、Ptorch 學習框架、pycharm 集成開發環境。
本文采用新疆地區的A1、A2、A3、A4 共4 個樣本區作為主要研究區域,使用4 種不同的FSC 估算方法,分別為基于線性回歸算法代表的MOD10_FSC、基于深度學習算法的 BP-ANN_FSC、ResNet_FSC,以及本文提出的Our_FSC。本文將提取的Landsat 8 FSC 通道數據作為真值,基于FY-4A/AGRI 和MOD10A1 影像數據進行遙感FSC 的提取研究。圖11 為新疆地區FSC 比例化制圖(彩色效果見《計算機工程》官網HTML 版),其中圖像中FSC 值的區間為0~1,不同的比例值呈現在不同的顏色區間內。

圖11 新疆全景積雪覆蓋度比例化制圖Fig.11 Proportional mapping of panoramic FSC in Xinjiang
本文使用相關系數(R-Square)、解釋回歸模型方差得分(Explained Variance Score,EVS)和均方誤差(Mean Squared Error,MSE)作為模型的評估指標。表3 為不同FSC 估算方法與真值對3 種評估指標的擬合結果。本文方法在4 個樣本區與真值FSC的R-Square 平均值為0.57,EVS 平均值為0.65,MSE平均值為0.10。

表3 不同積雪覆蓋度估算方法與真值的擬合結果Table 3 Fitting results of different FSC estimation methods and true values
圖12 為 在A1(2018 年12 月5 日)、A2(2019 年1 月29 日)、A3(2019 年2 月14 日)、A4(2019 年11 月19 日)樣本區不同FSC 估算方法的比例化制圖對比(彩色效果見《計算機工程》官網HTML 版)。

圖12 不同積雪覆蓋率估算方法的比例化制圖對比Fig.12 Proportional mapping comparison among different FSC estimation methods
從4 組實驗提供的比例化制圖的成像效果可以得出以下結論:
1)MOD10_FSC 方法對比例值低于0.3 的區域不敏感,即呈現的藍紫色塊較少,且在部分區域的色塊呈現“過紅”現象,間接說明MOD10_FSC 方法會高估像元預測值。
2)BP-ANN_FSC 方法的比例化制圖整體成像效果與真值標簽圖相比,A1~A3 組實驗在積雪豐富區域存在較嚴重的低估現象。在A4 組實驗中,該方法與ResNet-FSC 方法出現了對積雪覆蓋度的低估現象。在BP-ANN_FSC 與相同分辨率的Our_FSC 方法的成像效果對比時,BP-ANN_FSC 方法的比例化制圖相近顏色色塊分布較為集中,說明該方法無法精準地預測比例值相差較小的區域。
3)ResNet_FSC 方法,雖然在A2組實驗中R-Square擬合精度略高于MOD10_FSC 方法,但平均精度和穩定性較低。與本文方法相比,ResNet_FSC 方法呈現的比例化制圖的紋理不清晰,對細節特征的表達能力較差,無法完成高精度的FSC 反演工作。
本文方法的主要優勢與特點在于:FY-4A/AGRI數據源具有較高的時間分辨率,從而提供更多的光譜信息特征;采用去云算法形成云掩膜,以降低云覆蓋因素帶來的干擾;基于ResNet網絡結構,結合特征金字塔模式對卷積層特征圖進行重構,以融合深層和淺層特征的表達優勢,從而更好地擬合光譜信息與地理因素間的非線性關系,在實現模型預測高精度的同時保證了FSC 制圖在地理空間分布上的高連續性。
積雪覆蓋度估算的相關研究在一定程度上依賴于遙感數據源的分辨率,然而現有深度網絡模型對源圖像的特征提取能力有限,對于中低分辨率遙感數據的反演效果不理想。本文提出一種基于多尺度特征融合網絡的積雪覆蓋度估算方法。通過融合深層和淺層特征的多重語義信息,同時融入地理信息數據,并結合AGRI 數據高時間分辨率的特性,以提高數據源和特征信息的整體利用率,從而得到更準確和合理化的積雪覆蓋度反演圖像。實驗結果表明,本文提出的FSC 估算方法能夠充分結合數據源優勢和深度學習方法的特點,相比MOD10_FSC、ResNet_FSC 等方法,該方法的R-Square 和EVS 均值分別為0.57 和0.65,能夠得到高精度的積雪覆蓋度估算結果。后續將針對不同地物類型進行分類討論,進一步提高模型精度和泛化能力。