曹德龍, 林震, 唐廷元, 李楚鈺, 王曉銳
(1.北京林業大學生態文明研究院,北京 100083; 2.北京市測繪設計研究院,北京 100038)
對自然資源進行監測有助于系統掌握自然資源及地表基質的數量、質量、空間分布、開發利用、生態狀況、動態變化,科學評價自然資源輔助經濟社會發展和生態文明建設中起到關鍵性支撐和制約作用。全面、清晰地監測、評估自然資源可以有效跟蹤不同時間尺度上自然資源的變化趨勢,滿足區域空間尺度上的生態監測需求[1],從而為維持生態平衡和社會經濟發展提供定量數據支持[2-3]。
目前自然資源調查監測中,遙感技術逐漸取代傳統的監測方法,成為一種研究熱點。高光譜遙感為當前遙感技術的前沿領域,高光譜遙感影像信息提取已成為礦物測繪、農業、環境、林業等領域實時應用的主要來源[4-5],為相關應用的數據分析提供了重要的支撐[6]。深度學習具有較強的泛化能力和高效的特征表達能力[7],可以對海量原始數據自動執行分層特征提取,減少人類對特征規則的定義、降低人工成本[8-9]。深度學習方法可以從高光譜影像中自動提取從低級到高層次的抽象特征,并實現準確的分類。目前,較多的深度學習方法采用2D-CNN提取高光譜影像的光譜和空間信息[10-11],這些方法在圖像預處理過程中易造成光譜信息丟失。為了有效利用高光譜影像豐富的光譜和空間信息,越來越多的研究[12-13]引入3D-CNN提取光譜和空間特征,提升高光譜影像分類的性能。Li等[13]提出一種輕量級高光譜影像3D-CNN分類方法,與2D-CNN相比提高了分類精度,說明3D卷積模塊可同時提取光譜和空間特征,結合高光譜影像具有較好的應用。遙感技術具有實時、快速、大范圍等優點,已深入應用于自然資源分析評估中。自然資源分析評估目的是整體上發現自然資源的現狀與變化態勢,為生態開發、保護、治理提供支撐。2015年原環境保護部發布修訂后的《生態環境狀況評價技術規范》(HJ 192—2015)[14],規范中定義了反映區域內整體生態環境狀態的生態指數(ecological index,EI)。該指數體系包括生物豐富度指數(biological richness index,BRI)、歸一化植被指數(normalized difference vegetation index, NDVI)、水網密度指數(water-network-density index,WNDI)、土地應力指數(land-stress index,LSI)、污染負荷指數(pollution load index,PLI)和環境約束指數(environment regulation index,ERI),這6個子指標分別反映了評價區域內生物豐富度、植被覆蓋度、水網密度、土地脅迫強度、污染物壓力和環境限制情況。在基于遙感的生態評價研究中,學者們在各個方面都取得了豐碩的成果[15],目前研究重點已從單一的用于生態環境監測的遙感信息發展為對各種遙感信息的綜合分析[16]。將衛星遙感數據與社會統計相結合,納入生態評價模式,也有助于挖掘驅動力,促進生態環境改善,落實生態文明建設行動[17]。
綜上所述,本研究為實現自然資源監測、評估的體系研究,以北京市北部部分區域為研究區,以珠海一號高光譜影像為數據源,在HRNet網絡中引入3D卷積模塊,提出3D-HRNet網絡構建用于自然資源調查監測的語義分割模型,并對比說明3D-HRNet網絡提取高光譜影像的自然資源的能力; 同時基于《生態環境狀況評價技術規范》的EI指數結合遙感數據構建EI生態評價模型,與《生態環境狀況公報》進行對比,探究遙感結合EI生態評價模型的可行性。
北京地處我國的華北地區,是我國的首都、直轄市、國家中心城市、超大城市[18]。北京中心位于E116°20′,N39°56′,總面積16 410.54 m2,常住人口2 188.6萬人。北京市的地形以平原、丘陵、山地為主,主要呈西北高、東北低的地勢,西、北和東北方向群山環繞,東南方向是緩緩向渤海傾斜的大平原。北京市懷柔區、密云區、順義區和延慶區區域內有平原、丘陵、山地等多種地形,同時包含大型水庫、河流、建設用地、耕地等多種土地利用類型。
本研究為了更好地研究基于深度學習的高光譜智能識別模型以及生態分析研究,以北京市北部懷柔區、密云區、順義區和延慶區的部分區域為研究區(圖1),利用珠海一號高光譜影像數據構建用于自然資源調查監測的深度學習語義分割模型、并進行遙感生態分析研究。

圖1 研究區
珠海一號高光譜衛星數據用于獲取北京市懷柔區、密云區、順義區和延慶區的部分區域自然資源類型,為了更好地反映區域內自然資源的分布特征,本研究綜合考慮季節氣候、影像質量、云量等因素選擇2020年4月2日拍攝的高光譜影像。高光譜影像空間分辨率10 m,光譜分辨率2.5 μm,波長范圍400~1 000 μm,共32個光譜波段。獲取高光譜數據后進行預處理[19],包括輻射校正、大氣校正、正射校正、影像鑲嵌等操作,消除傳感器、地面物體、大氣等因素的干擾,預處理的影像如圖2(a)所示。

(a) 珠海一號高光譜影像 (b) 標簽數據(土地利用類型圖)
為了構建用于自然資源調查監測的3D-HRNet語義分割模型,本研究整合武漢大學遙感信息工程學院的中國30 m土地覆蓋及其變化1985—2019年數據集[20]、中國科學院空天信息研究院2020年全球30 m地表覆蓋類型產品[21]、谷歌公司10 m全球土地利用數據集[22]3種數據集制作訓練標簽數據集,標簽數據類型包含耕地、林地、灌木、草地、水域和建設用地6類土地利用類型,如圖2(b)所示。利用3種覆蓋數據集在本研究區域地物類別進行歸類合并確定本區域的地物類別,然后將中國30 m土地覆蓋及其變化1985—2019年數據集和2020年全球30 m地表覆蓋類型產品重采樣為10 m空間分辨率,利用投票法對3種數據進行疊加處理,最后制作成訓練標簽數據集。
研究流程如圖3所示。

圖3 流程圖
本研究在HRNet網絡[23-24]的基礎上引入3D卷積模塊提出3D-HRNet網絡,構建用于自然資源調查監測的高光譜影像深度學習語義分割模型,與HRNet模型進行對比驗證3D-HRNet模型應用于高光譜自然資源調查監測的有效性; 通過生物豐富度、植被覆蓋度、水網密度、土地脅迫強度、污染物壓力、環境限制等6個角度構建EI生態指標,與北京市生態環境狀況公報對比,探究遙感EI生態指標對評價地區生態環境狀況的正確性。
2.1.1 3D-HRNet網絡
HRNet網絡是一種跨分辨率的信息交互、實現高分辨率豐富的語義特征豐富、多尺度融合的深度學習模型,網絡中保持高分辨率信息且并行連接多種分辨率。3D卷積模塊中窗口(filter)需在3個維度(輸入層的長、寬、高)上滑動進行卷積,識別和輸出的結構均為3D結構,相比2D卷積模塊能更好地描述高光譜影像中光譜信息和地物立體空間信息的對象關系。目前3D卷積塊已結合在3D-CNN網絡等相關網絡應用于醫學影像檢驗[25]、點云識別[26]等領域,實驗均表明3D卷積能較好地識別3D空間信息。
因此,本研究結合HRNet網絡的特點并在網絡框架中引入3D卷積模塊[27],提出了適用于自然資源監測的高光譜遙感影像深度學習語義分割模型,即3D-HRNet(圖4為網絡結構)。以北京市北部部分區域為研究區域,并與HRNet卷積網絡進行實驗對比,驗證了該網絡的有效性。3D-HRNet網絡的改進如下: 編碼器中,3D卷積模塊嵌入輸入端后,將3D卷積模塊提取的特征與輸入端數據相連接至HRNet網絡的編碼器,主要利用3D卷積層建立高光譜影像不同光譜之間的關系并提取有效的特征信息,同時連接輸入端從而減少原始信息的缺漏; 解碼器中,將編碼器中3D卷積模塊輸出特征與HRNet編碼器輸出特征相連接,接入HRNet網絡的解碼器中最后輸出結果,連接3D卷積模塊結果可保持網絡輸出結果的高分辨率。

圖4 3D-HRNet網絡結構
2.1.2 實驗環境和參數設置
實驗環境為Intel Core i7-12700F 2.1GHz 12核處理器、配備16G內存和Nvidia GeForce RTX 3060Ti; 軟件環境方面,使用Windows 11專業版64位操作系統,編程語言是Python 3.6,模型構建工具是Tensorflow2.0,圖形處理單元(graphic processing unit,GPU)計算平臺是CUDA 11.0。
在模型訓練過程中,批量(Batch)大小設置為16、初始學習速率(learning rate,LR)設置為0.001、優化器使用具有權重衰減的Adam(權重衰減系數為0.001)、迭代(epoch)為100次,并且選擇損失函數較低、驗證集精度最高的對應模型參數作為最終模型參數。
此外,將影像隨機切割成尺寸為256像素×256像素的圖片,并進行了水平翻轉、垂直翻轉、對角翻轉和90°旋轉的數據增強[28]操作,構建10萬張相關數據集,同時在模型訓練擬合階段對數據集以8∶2比例隨機劃分訓練數據集和驗證數據集。
2.1.3 精度評估
本研究使用召回率(Recall)、精確度(Precision)、F1分數、總體精度(Accuracy)和Kappa系數5個指標來評估自然資源提取精度,并定量評價所提方法在提取自然資源時的性能。
召回率也稱查全率,即研究區域內正確預測的一類自然資源像素數量與實際該類自然資源像素數量的比列,側重評估提取結果是否遺漏。精確度也稱查準率,即研究區域內正確預測的一類自然資源像素數量與預測結果中該類自然資源像素數量的比列,側重評估提取結果是否被誤判。F1分數結合了精確度和召回率的結果,是精確度和召回率的諧波平均值。總體精度是指對每一個隨機樣本,所分類的結果與檢驗數據類型相一致的概率。Kappa系數是一種衡量分類精度的指標,既用于一致性檢驗,也可用于衡量分類精度,代表著分類與完全隨機的分類產生錯誤減少的比例。各指標計算公式為:
,
(1)
,
(2)
,
(3)
,
(4)
,
(5)
式中:TP為預測的結果中被正確標識的數量;FP為預測的結果中被錯誤地識別為其他類型的數量;TN為預測的其他類型中被正確標識為其他類型的數量;FN為真實類型被錯誤地識別為其他類型的數量;P0為每一類正確分類的樣本數量之和除以總樣本數;Pe為真實樣本和預測樣本在給定樣本上隨機一致性的概率。
EI生態指數是評價生態環境的綜合指數,包含生物豐富度、植被覆蓋度、水網密度、土地脅迫、污染負荷、環境限制等子指數。生物豐富度用BRI表示,公式為:
BRI=0.5(0.35A1+0.21A2+0.28A3+0.11A4+0.04A5+0.01A6)/A
,
(6)
式中:A1為區域內林地面積;A2為區域內草地面積;A3為區域內水域面積;A4為區域內草地面積;A5為區域內建設用地面積;A6為區域內灌木面積;A為區域面積。《區域生物多樣性評價標準》(HJ 623—2011)中規定BRI的由棲息地質量指數(habitat-quality index,HQ)和生物多樣性指數(biodiversity index,BI)決定,而本研究的研究區域無生物多樣性變化,BRI僅與棲息地質量相關,因此公式中系數為0.5。
植被覆蓋度用NDVI表示,公式為:
,
(7)
式中:Pi為每個像素的NDVI值;n為區域像素個數。
水網密度情況用WNDI表示,公式為:
WNDI=W/A
,
(8)
式中W為水域面積。
土地脅迫強度用LSI表示,公式為:
LSI=(0.4A7+0.2A8+0.2A4+0.2A9)/A,
(9)
式中:A7為區域內嚴重流失面積;A8為區域內中度流失面積;A9為區域內其他用地面積。根據《水土流失分類分級標準》規定,由土地覆蓋類型、坡度、覆蓋面非耕作林草3個指標確定,植被覆蓋率、坡度與侵蝕程度如表1所示。

表1 植被覆蓋率、坡度與侵蝕程度關系表
參照生態環境部發布的《生態環境狀況評價技術規范》(HJ 192—2015),得出每個評價指標權重,最終計算區域內的EI生態指數值,其計算公式為:
EI=0.35BRI+0.25NDVI+0.15WNDI+
0.15(100-LSI)+0.10(100-PLI)+ERI。
(10)
由于本研究區內近10 a未發生重大、極端的環境污染事件,PLI和ERI設值為0。
本研究基于HRNet網絡引入3D卷積模塊提出3D-HRNet模型,以珠海一號高光譜遙感影像為數據集,構建用于自然資源調查監測的高光譜語分割模型,探究高光譜數據在自然資源調查監測中的應用。為了更全面地比較模型提取自然資源調查監測的性能,本研究選取山區(區域一)、平原(區域二)2種地勢的區域進行綜合比較,并分別利用HRNet模型、3D-CNN模型和3D-HRNet模型提取自然資源。
表2為監測結果對比,由表2可知,HRNet,3D-CNN和3D-HRNet這3種模型都具有較好的提取結果,能保持自然資源的邊界完整、清晰,但細節有一定差別。區域一主要為北京北部區域的山區,主要類型包含耕地、林地、水域、草地等。在區域一的HRNet模型預測結果中,耕地類型能完整地提取,出現誤判建設用地、漏提水域類型的問題; 3D-HRNet模型預測結果不僅完整提取水域類型,同時對建設用地、耕地這2種類型能相對準確地提取; 而3D-CNN表現介于HRNet模型和3D-HRNet模型之中,說明3D卷積能更好地識別高光譜遙感數據對地物的影響,同時表明3D-HRNet模型比3D-CNN模型識別自然資源能力更好。區域二主要為北京北部地區的平原地區,主要類型包含耕地、草地、大型水庫、建設用地等類型。在區域二的結果中,3D-HRNet模型、3D-CNN模型與HRNet模型識別結果相近,對平原地區的耕地、林地等自然資源提取具有較好的結果,但3D-HRNet模型在水域東北部區域錯誤提取成林地。從區域二真彩色影像可知,水域東北部區域出現與其他區域不同的顏色,疑似區域水體葉綠素較高造成與林地的光譜特性相似。根據結果,3D-HRNet模型提取自然資源優于3D-CNN模型、HRNet模型。

表2 自然資源監測結果對比
模型的精度如表3所示。由表3可知,3D-HRNet模型提取區域一的自然資源結果總體精度、F1分數和Kappa系數分別為0.86,0.86和0.75,區域二結果總體精度、F1分數和Kappa系數分別為0.79,0.79和0.75,平均總體精度為0.83、平均F1分數為0.82、平均Kappa系數為0.73,定量結果表明3D-HRNet模型可有效提取高光譜影像中的自然資源結果。同時與HRNet模型定量結果對比,總體精度高0.04、F1分數高0.04、Kappa系數高0.06; 比3D-CNN模型總體精度高0.04、F1分數高0.05、Kappa系數高0.06,表明3D-HRNet模型提取高光譜影像的自然資源結果更好,3D卷積模塊能更好地利用高光譜特性識別自然資源。

表3 模型精度對比表
本研究采用50 m×50 m的格網作為評價單元,利用高光譜影像提取生態環境評價因子,統計每個格網內的指標,從而反映研究區域的生態環境空間分布與差異性,最終計算得到各指標和EI結果圖。
北京市北部部分區域的生物豐富度、植被覆蓋度、水網密度、土地脅迫強度等結果分布圖如圖5所示。

(a) BRI (b) NDVI (c) WNDI (d) LSI
1)統計計算得出,2020年研究區的平均BRI為75.0,表明研究區的生態環境整體較好; 由圖5(a)中可知,在研究區的中部山區BRI較高、南部城市發展區生物豐富度較低。
2)2020年研究區的平均NDVI為78.9,由圖5(b)可知其分布與BRI相似,研究區的中部山區NDVI較高、南部城市發展區NDVI低,說明生物豐富度與NDVI呈正相關。
3)WNDI范圍為0~100,顏色越深、水網越密。由于研究區大部分為山區和城市建設區,WNDI分布大部分為0值。2020年研究區的平均WNDI為10.9,由圖5(c)可知,水網分布在密云水庫、懷柔水庫等區域。
4)由坡度與植被覆情況確定侵蝕程度,圖中綠色表示侵蝕程度最低,其次為黃色,橙色表示中度侵蝕,紅色表示嚴重侵蝕。2020年研究區的平均LSI為81.6,由圖5(d)可見,研究范圍內大多數區域侵蝕程度較輕。
圖6為研究區EI分布結果。由圖6可知,研究區的生態環境狀況與地勢、城市建設有關,中部山區區域的生態環境狀況較好,南部城市建設區域的生態環境狀況較低。通過EI指數計算公式得2020年研究區的平均EI指數為68.2,根據生態環境指標等級判定為良好,表明2020研究區生態環境較好,植被覆蓋率較高、生物多樣性較豐富。而《2020年北京市生態環境狀況公報》顯示全市生態環境狀況級別為“良”、 EI為70.2,與研究結果接近。

圖6 EI分布結果
以2020年珠海一號高光譜影像為數據源,構建用于自然資源調查監測的3D-HRNet深度學習語義分割模型提取北京市北部部分區域2020年自然資源分類結果,同時采用基于生物豐富度、植被覆蓋度、水網密度、土地脅迫強度、污染物壓力、環境限制等指數的EI生態評價模型對2020年研究區進行生態狀況評價。結果表明:
1)基于HRNet網絡引入3D卷積模塊提出3D-HRNet模型,提取自然資源具有較好的效果,總體精度為0.83,F1分數為0.83,Kappa系數為0.73。
2)3D-HRNet模型提取自然資源結果比HRNet模型的總體精度高0.04、F1分數高0.04、Kappa系數高0.06,比3D-CNN模型總體精度高0.04、F1分數高0.05、Kappa系數高0.06,說明3D卷積模塊對提取高光譜影像中的自然資源有一定提升,3D-HRNet模型提取能力比3D-CNN模型高。
3)EI生態評價模型由遙感數據提取的6個分項指標組成,是反映生態質量指標的良好整合,可以全面反映研究區生態環境質量。2020年研究區的平均EI值為68.2,等級為良好,與北京市生態環境狀況公報結論接近。
本研究提出3D-HRNet網絡應用于高光譜影像提取自然資源結果,3D卷積模塊能較好地識別各地物的光譜特性,但存在光譜特性相似的地物出現錯誤提取,例如水體中葉綠素較高區域錯誤識別成林地,后續將繼續優化網絡模型同時考慮同譜異物現象。同時利用遙感衛星數據構建EI生態評價模型,可快速、全面對生態環境進行評價,本次研究的EI生態評價模型具有較好的表現,與政府環境狀況公報結果相近。遙感衛星數據的時序長、范圍大等優點以及用于EI生態評價模型的有效性,為北京市生態狀況的時空分析奠定基礎,為北京市改善生態環境、促進綠色發展研究提供了數據支撐。
志謝:本實驗的高光譜影像數據由珠海歐比特宇航科技股份有限公司提供,同時標簽數據參考武漢大學遙感信息工程學院的中國30 m土地覆蓋及其變化1985—2019年數據集、中國科學院空天信息創新研究院2020年全球30 m地表覆蓋類型產品、谷歌公司10 m全球土地利用數據集,在此表示感謝。