朱琦, 郭華東, 張露,3, 梁棟, 劉栩婷, 萬祥星
(1.中國科學院空天信息創新研究院數字地球重點實驗室,北京 100094; 2.中國科學院大學,北京 100049;3.三亞中科遙感研究所,三亞 572029; 4.中國林業科學研究院資源信息研究所,北京 100091)
熱帶森林在生物多樣性保護、調節氣候變化、防止水土流失、碳匯估算等方面,起到重要的作用[1-2],是自然資源和生態環境的基礎。我國熱帶森林資源豐富,其中海南島熱帶天然林是我國連續分布面積最大、物種最豐富的熱帶林區。2006年,海南島熱帶天然林面積為65.90萬hm2,主要分布于海南島的五指山、尖峰嶺、霸王嶺、吊羅山、黎母山等中部林區[3]。但是由于人類對于熱帶森林的過渡利用和開發,熱帶雨林年毀林率逐年增加[4-5]。因此開展熱帶森林調查,及時準確地獲取植被類型覆蓋信息,是研究區域內生態環境建設的重點[6]。
遙感對地觀測技術的發展,為高效準確地獲取實驗區域內植被覆蓋度提供了有效途徑[7-8]。目前,遙感技術可以通過測定森林各項指標特征,協助提取森林覆蓋信息、劃分森林類型[8]、動態監測森林變化、監測植被生長狀態及發育情況等。國內外學者對于如何從遙感影像中自動提取地物信息進行研究[9],也形成了不同的分類體系,取得了豐富的成果。但是目前大多研究都集中在劃分森林類型和林種的粗分類,典型熱帶林種分類精細度依舊較差,無法實現對熱帶森林資源實時及準確的監測并獲取植被覆蓋類型信息。
基于多時相遙感數據的影像序列可以反映植被的季相特征以及物候變化規律,有效增加植被的識別精度,目前已經被應用于植被精細提取中[10]。無論從區域尺度的精細分辨到全球尺度的植被覆蓋信息提取[11-13],都證明了時序信息的價值。Shimabukuro等[14]利用長達18 a序列的Landsat數據獲取了美國猶他州北部因塔特山脈的森林林型分布及變化圖,結果較美國森林服務局精度提升60%; Pouliot等[15]提出了一種基于變化檢測的時序信息遙感分類方法,獲取了加拿大地區2000—2011年土地利用分類圖,結果同加拿大國家對于全球土地利用覆蓋產品保持一致性和高度準確性。上述研究通過使用多時相遙感數據獲取了研究區域內森林林型以及土地覆蓋類型的變化。但是目前針對多時相數據的引入相較于單時相數據對于分類精度的具體提升研究較為缺乏,同時對于多時相遙感影像數據分類中的具體策略,如進行影像分類的數量以及時序數據的組合方式等關注較少。
因此本文將多時相信息引入熱帶森林分類,重點研究如下問題: ①多時相比單時相在熱帶森林分類中的優勢; ②參與分類的多時相數據的數量與分類精度關系; ③參與分類的多時相數據的組合是否影響分類精度。從而提出一種基于時相數據的針對熱帶天然林的分類方法。由于多時相數據的處理和組合分析對數據數量和處理能力的要求,本文依托Google Earth Engine(GEE)平臺,以我國海南島熱帶天然林為研究對象,結合長時間序列Landsat8影像,明確遙感影像數量及組合方式對海南島熱帶天然林分類精度的影響,提出一種穩定的適合海南島天然林典型林型的時序分類方法,以期為海南島熱帶天然林監測與生態評估等提供有效數據支持。
尖峰嶺地區位于海南省西南部樂東黎族自治縣和東方市交界(N18°20′~18°57′,E108°41′~109°12′),總面積為640 km2。尖峰嶺地區地屬低緯度熱帶島嶼季風氣候,常年受西南季風和東南季風的影響,年度雨量分配不均勻,有明顯的干濕兩季。干季年平均氣溫最高可達到27~29 ℃,濕季氣溫較低,僅為16.2~20.6 ℃[16]。該地區自然環境優越,適合植被生長,存在一片我國現有面積較大,保持較完整的熱帶原始森林[17-18],森林覆蓋率達93.18%,類型豐富,包含了山頂苔蘚矮林、熱帶山地常綠闊葉林、熱帶山地雨林、熱帶常綠季雨林、熱帶半落葉季雨林等典型熱帶植被類型[19-20],是開展熱帶森林遙感分類研究的理想區域。研究區位置如圖1所示。

圖1 尖峰嶺研究區位置
1.2.1 遙感數據
本文采用GEE平臺提供的Landsat8衛星遙感數據開展相關研究。共獲取研究區域內2018年度Landsat8 OLI衛星影像29期,行列號分別為124/47和125/47。這些數據是經過輻射校正和幾何糾正等處理后的反射率產品[21- 23]。圖1中影像是GEE提供的Landsat8影像示意圖。
1.2.2 輔助數據
1)海南省土地利用分類圖。本文通過中國科學院地理科學研究所與資源研究所網站獲取2018年海南省中國土地利用遙感監測數據,空間分辨率為1 km。海南省土地利用類型主要包括耕地、林地、水域及居民地6個一級類型、25個二級類型。將TIFF文件導入GEE中,按編碼進行篩選,得到海南省主要林地分布圖,后續通過此林地分布圖獲取研究區域邊界,同時結合Google Earth高分辨率影像獲取分類樣本。
2)海南省數字高程模型數據。為方便后續進行樣本選擇以及結果驗證,本文使用的SRTM(the shuttle Radar topography mission)高程數據,空間分辨率為30 m。觀察到尖峰嶺林區存在明顯的由近海岸地區(平均海拔50 m)至林區腹地海拔逐漸攀升,且東部地區海拔較西部明顯偏高的現象。
本文采用的研究技術路線如圖2所示,包括數據預處理、森林分類類型確定、特征分析、時相數據分類方法以及驗證等步驟。

圖2 基于時相變化的海南島天然林遙感分類技術路線
本文采用的Landsat8數據是經過輻射校正和幾何糾正等處理后的反射率產品。此外為了獲取1 a內研究區每月一期的遙感數據,對同一月份的多景數據,采用GEE內置的Landsat.simpleComposite()方法進行合成,從而形成該月份的合成數據。合成過程中,該方法使用SimpleLandsatCloudScore()算法標注每個像素受到云的影響程度,然后選擇受到云影響最小的像素進行影像合成。經過處理,獲得了2018年1—12月每月的合成影像數據。
依據宋永昌[24]在2011年提出的海南島森林植被分類系統,參考在尖峰嶺研究區的實地調查,本文將該地區熱帶森林分為典型熱帶雨林、熱帶季雨林以及常綠闊葉林3種類型,分類級別屬于第三級植被型組類型??紤]到研究區域內,常綠落葉林只是零散地分布于常綠闊葉林之中,兩者之間并沒有明顯的區別,所以將常綠闊葉林和常綠落葉闊葉混交林分成一類,統一歸類為常綠闊葉林[25]。
基于上述熱帶森林分類類型,依據考察結果以及高分辨率影像人工判斷,選取分類樣本。利用這些樣本以及獲得的光學遙感影像,進一步分析典型熱帶雨林、熱帶季雨林以及常綠闊葉林類型的光譜特征、植被指數特征以及時序特征。
2.3.1 光譜特征
光譜特征是最基本的分類依據,基于Landsat8 影像中不同地物類別的典型光譜特征曲線,分析各類別在影像中體現的光譜差異性以及光譜域類別區分性。具體統計結果如圖3所示。圖3中柱狀圖代表3類地物在不同波段下的最大反射率與最小反射率的差,折線圖表示標準差,兩者數值越大代表待分類地物在此波段下區分度較高,有利于后續分類。根據圖3可知,3類地物在近紅外波段(B5),短波紅外1波段(B6)和短波紅外2波段(B7)有較大的亮度差及標準差,包含遙感信息豐富。有利于3類地物的區分; 值得注意的是,典型熱帶雨林在海岸、藍光、綠光和紅光波段都展示出較大差異,分析是由于其季相變化顯著,因此波段統計差異較大。
2.3.2 植被指數
植被指數可以有效反映地球表面植被覆蓋程度,反映植被的生長狀況。其在遙感分類中有助于增強遙感解譯以及目標識別能力,目前已經被廣泛地應用于土地覆蓋類型分類、農作物分析與識別、林地生長與檢測。本文中采用的植被指數主要有: 歸一化植被指數(normalized difference vegetation index,NDVI)、增強植被指數(enhanced vegetation index,EVI)、歸一耕作指數(normalized difference tillage index,NDTI)、陸表水分指數(land surface water index,LSWI)、土壤自適應植被指數(soil-adjusted vegetation index,SAVI)。具體計算公式分別為:
,
(1)
(2)
,
(3)
,
(4)
(5)
式中BLUE,RED,NIR,SWIR1,SWIR2分別代表藍光、紅光、近紅外、短波紅外1、短波紅外2波段影像。圖4反映了5類植被指數的統計信息,5種植被指數的標準差、亮度差均明顯大于原始光譜信息,其中NDTI與EVI指數包含信息又明顯優于其余植被指數,典型熱帶雨林NDTI指數差異性較大,常綠闊葉林相較于熱帶季雨林在NDVI指數體現較強差異。

圖4 植被指標信息統計
2.3.3 時序特征
由于單時相遙感影像包含信息量有限,無法反映地物類別隨時間變化的趨勢。同時對于植被分類來說,僅依靠單時相影像無法達到較好區分效果。故將2018年影像按照月份進行分組,研究時序特征對遙感分類精度的影響。
幾類典型波段以及植被指數時序統計如圖5所示,其中橫軸代表月份,縱軸代表該波段反射率。3種地物在光譜特性曲線的變化趨勢基本一致,其中常綠闊葉林同其余2類地物區分較為明顯,典型熱帶雨林和熱帶季雨林在光譜特性中差異并不大。海岸波段、藍光波段、綠光波段和紅光波段在3類地物的變化趨勢基本類似,區分度較小。植被指數特征差異較光譜特征明顯增大。同時在8—9月,常綠闊葉林與典型熱帶雨林和熱帶季雨林在多個波段的反射率有明顯變化,此時研究區即將進入旱季,常綠闊葉林開始出現落葉現象,之后進入10—11月,典型熱帶雨林和熱帶季雨林反射率均有所下降?;诖?,最終選擇近紅外波段(B5)、2個短波紅外波段(B6和B7)以及5類植被指數共計8組變量進行后續分類探究。

(a) 藍光波段 (b) 短波紅外波段

(c) NDVI (d) EVI

圖5 典型地物2018年度時相光譜特性曲線
利用前面合成的研究區2018年12期數據,以及熱帶森林類型的敏感特征集,獲取一個年度特征時相信息。考慮到支持向量機(support vector machine,SVM)在處理小樣本、非線性、高維數問題的優勢,選擇SVM作為本研究的分類器。其是由Vapnik于1995年提出,以結構最小原理和VC維理論為基礎,通過構造函數子集來達到風險最小化的目標,在大大降低了建模復雜度的同時,提高了分類器學習的能力,具有較高的實用性[26]。
本文設計如下4組實驗: ①首先探究單時相影像可以達到的分類精度; ②為了驗證多時相數據對于分類精度的影響,探究了不同時相數量下分類精度的變化; ③同時探究了使用篩選后特征與原始特征對于分類精度影響的對比; ④還設計了不同種時相數據的組合方式,如原始單時相分類精度較優或較差的組合,按照季度篩選影像的組合方式等,探究其對最終分類結果的影響。
本研究中分類的精度通過獲得混淆矩陣后,計算總體精度(overall accuracy,OA)和Kappa系數進行評估,評估過程中將隨機選取70%樣本用于訓練分類器,剩余30%樣本用于驗證分類結果。
依據第2.3節波段選擇的結果,首先對12期不同時相的Landsat8影像達到的分類精度進行了研究,分類精度如圖6所示。

圖6 多波段Landsat8影像分類結果
使用多波段進行分類時,在6—8月時期,研究區處于濕季,地區區分度較小,整體分類精度較低(55%); 分類精度最優值在每年的11月份,這與研究區進入干季的時間相同,此次諸如常綠闊葉林和熱帶季雨林均有落葉現象,而典型熱帶雨林仍保持常綠狀態,同其余2類地物有明顯的差異,因此整體分類精度較高。
為了分析多時相數據對分類的影響,將12期不同時相數據依次加入分類器,得到的分類結果精度如圖7所示。圖中橫坐標表示在原有月份基礎上,追加當前月份影像數據。

圖7 2018年月度時序分類精度變化
根據圖7,隨著時序影像的加入,OA及Kappa系數均持續提升,加入第二組時序影像時,OA提升最為明顯(10%), Kappa系數也有顯著的提升; 隨著影像的加入,兩者增加的趨勢逐漸變緩,最終穩定在90%左右。OA最終達到峰值(91.19%),Kappa系數同樣到達極值(0.868 5); 最后一組影像加入時,兩者均有小幅度的下降。通過對比混淆矩陣,整體而言,僅有小部分的熱帶季雨林和常綠闊葉林未得到良好區分,出現錯分現象,但是時序信息的加入對于遙感影像分類有明顯的促進作用。分類精度較單一時相分類精度有明顯提升。
為了分析時序影像分類時每次加入影像對于精度的提升,圖8表示從第二期影像加入時,每期影像加入時分類精度的提升,隨著時序影像序列的加入,OA及Kappa系數的提升逐漸進入平緩期,最終會出現負增長。分析兩者變化趨勢,在加入第5組數據后,每次加入時序影像對于分類精度的提升都在1~2百分點之內,對分類精度的影響較小。因此當時相數據達到一定數量后,分類精度提升有限,本研究中采用4景不同時相圖像可以得到最優的性能效率比。

圖8 OA及Kappa系數增加變化
由于參與遙感影像分類的波段間可能會具有較強的相關性,而使用相關性較強的波段進行分類在增加信息冗余的同時也會帶來更大的計算量??紤]到本文使用的5種植被指數可能會存在信息重復疊加,因此通過分析5種植被指數的相關性,并對其進行篩選。
為計算5種植被指數的相關程度,需要選取特定月份的數據。本文選取原始單月份分類精度最優的11月影像進行計算,這是考慮到由于11月份影像波段間差異最為顯著。得到的5種植被指數相關系數如表1所示。為了獲取信息最為豐富的植被指數波段,對每個植被指數同其余植被指數的相關系數進行取絕對值后求和。數值越大表示該指數同其余指數間相關性越強,根據表1可知,NDTI和EVI指數同其余整體相關性最弱,因此將其余3類植被指數去除,僅保留NDTI和EVI,重新進行分類。并與單時相影像分類精度進行對比。對比結果如圖9所示??傮w而言,同原始分類精度差異不顯著,略低于原始結果(平均降低1.5%),但是通過此方法可明顯減少冗余波段信息,提高分類效率。

表1 5種植被指數的相關系數

圖9 特征波段篩選前后OA對比
為了探究時序影像的加入順序以及不同組合方式對于分類精度的影響,進一步探究了不同種時間序列組合方式對于分類精度的影響,分組包括: a單時相分類結果從高到低排列; b單時相分類結果從低到高排列; c根據季度不同選?。?d選取春季及秋季云層含量由少到多排序。由于前文中得到當時相數據多于4景以后,分類精度提高能力有限,因此所采用的不同排序實驗都選擇4個時相圖像。最終分類精度結果如圖10所示,信息統計如表2所示。4組時序分類結果均有較明顯提升,a組由于本身分類精度較高,因此提升幅度最小,OA值提升11.78%,Kappa系數增幅25.02%; 其余3種時序組合,提升效果非常明顯,OA值提升25%左右,Kappa系數也有50%以上的提升。特別是原始分類精度較差結果以及使用數據更易獲取的云層含量較小的分類結果,相較于原始影像,時序結合影像的方式OA值分別提升27.15%和28.83%,達到0.721 5和0.844 6,Kappa系數也分別有66.88%和57.58%的提升。同時,使用季度時序影像可以通過使用包含豐富季相信息的4組影像組合,達到良好的分類效果,OA和Kappa系數的增幅分別為21.77%和47.45%。

(a) 精度較優影像組合 (b) 精度較差影像組合

(c) 季度影像組合 (d) 云量較少影像組合

表2 時序影像分類精度變化
分類結果表明,時序影像通過季度組合、精度較差結果組合以及更易獲取的含云量較小影像組合的方式,可以有效提升有限數據源的分類精度,為使用有限數據源進行遙感影像分類提供新的方法。
最終分類結果采用的是12期影像數據達到的最優分類結果,如圖11所示。尖峰嶺林區總面積640 km2,典型熱帶雨林、熱帶季雨林和常綠闊葉林,3類地物占總林區面積比例分別為49.1%,44.0%和6.9%,總體分類結果與預期及先驗知識基本吻合,其中,常綠闊葉林主要分布在海拔較低的近海岸地區,隨著海拔的攀升,熱帶季雨林占主導地位,典型熱帶雨林普遍分布在海拔較高處。這也證明了熱帶森林空間位置分布同海拔、濕度等自然因素密切相關。

圖11 海南島尖峰嶺天然林分類結果
本文主要基于熱帶森林分類的不精細不準確的現狀,結合目前熱帶地區熱帶森林類型精確識別與分類的需求,依托GEE遙感大數據處理平臺,使用長時間序列遙感影像探究復雜研究地形內,多波段、多時相遙感影像熱帶森林類型分類方法,同時發展出一套明確的適合海南島熱帶天然林分類使用的優化數量及組合方式。本文的主要結論如下:
1)結合Landsat8 OLI光學數據,分析了多波段光譜特征和5類植被指數(NDVI,EVI,NDTI,LSWI,SAVI)等特征對分類精度的影響。結果表明隨著具有額外信息的波段數量的增加,分類精度持續提升。結合多波段數據、5類植被指數以及時相信息的引入,均可有效提升分類精度。最終典型熱帶雨林、熱帶季雨林、常綠闊葉林3類地物的總體分類精度達到91.19%,總Kappa系數為0.866 2。結果表明尖峰嶺地區3類林種空間分布有明顯規律,常綠闊葉林主要分布在海拔較低,濕度較低區域; 熱帶季雨林主要分布在中高海拔地區; 典型熱帶雨林主要分布在高海拔高濕度地區,且面積最大,是林區內優勢林種。
2)重點研究了時序特征對于分類精度的影響,研究結果表明,隨著時序信息的不斷引入,海南島天然林的分類精度不斷提升; 在不斷引入時序信息時,加入第二期時序影像對于分類精度的提升最為明顯,可達10%以上; 隨著時相數據的不斷引入,分類精度逐漸趨于飽和,當加入到第五期時序影像序列后,每次分類精度的提升已經不足1%。
3)對時相信息的組合方式對于分類精度的影響進行探究,分類結果表明,當獲取時相數據有限時,通過季度組合以及使用更易獲取的含云量較小影像組合的方式,可以有效提升遙感影像天然林分類精度(平均分類精度提升25%左右),尤其是在參與分類的數據單獨分類精度較低時,其多時相組合對分類精度的提升更加明顯,體現了參與分類數據時相選擇的寬泛性。該研究對使用時相遙感數據開展時序遙感影像分類有積極意義。
綜上,本文發展的基于GEE多波段多時相的遙感影像熱帶森林類型分類方法,有效提升了以典型熱帶雨林、熱帶季雨林和常綠闊葉林為代表的林型分類精度。該方法可以明確適合海南島熱帶天然林分類的優化數量和組合方式,可以有效提升分類精度,改善了傳統熱帶森林類型分類粗糙的現狀,對多時相熱帶森林類型精細分類提供了新的方法和思路。