郭曉妮 劉曉農 宋亞斌 邢元軍 江騰宇



摘要:隨著遙感技術的快速發展,基于遙感影像和地面樣地的方法成為目前森林碳密度精確估算的主要手段,然而沒有找到具有普適性的建模因子和最佳的森林碳密度估算模型。鑒于此,本文通過分析研究區地面固定樣地碳密度與Landsat-5影像及其衍生波段的相關性,篩選出估算森林碳密度的敏感因子。采用三種回歸分析方法(逐步回歸、偏最小二乘回歸及非線性回歸)分別建立森林碳密度的最優遙感估算模型。結果表明:①參與建模的遙感因子中,1/TM3與森林碳密度的相關性最大,敏感性最高;②三種回歸分析方法建立的預測模型中,以4個遙感因子建立的非線性回歸模型預測精度最高,預測值與實測值得決定系數R2為0.74;③通過測算,研究區平均森林碳密度為14.36 t/hm2,變化范圍介于0.00~38.28 t/hm2之間。研究表明非線性回歸在區域森林碳密度反演方面具有一定的潛力。
關鍵詞: 林業遙感;回歸分析;相關性分析;Landsat5影像;森林碳密度
中圖分類號:S757.2 文獻標識碼:A 文章編號:1004-3020(2016)04-0017-05
Abstract: With the fast development of remote sensing technology, the method based on remote sensing image and sample plots has become the major means of accurate estimation of forest carbon density. However, there were still no universal factors and optimal models for the estimation of forest carbon density. The objective of this paper was to study the estimation of forest carbon density by combining plots data and remote sensing images of Landsat-5 using the methods of stepwise regression, partial leastsquares regression and nonlinear regression respectively. First, various remote sensing factors derived from Landsat5 images were generated using different transformations such as band ratios, vegetation indices calculation, principal component analysis and texture transformation. Then, effective remote sensing factors were selected to conduct the estimation of forest carbon density, according to the correlation analysis between the fixed sample plots and factors derived from Landsat5 images. Finally, the accuracy of Landsat5 derived maps was assessed using R2, Root Mean Square Error and Relative Error. The results showed that ①the correlation coefficients of 1/TM3 with plot values was the highest. ② Among the built models, the effect of nonlinear model built by four remote sensing factors was the best with R2 of 0.74. ③The mean value of forest carbon density of research area was 14.36 t/hm2, ranging from 0.00 to 38.38 t/hm2. This implied that nonlinear regression showed a certain potential in the aspect of region estimation of forest carbon density.
Key words: forestry remote sensing; regression analysis;correlation analysis;Landsat5 image; forest carbon density
作為陸地生態系統的主體,森林通過與大氣環境交換二氧化碳,在全球碳循環和氣候變化中發揮著重要作用。森林碳密度是理解和分析全球碳循環的基礎,也是研究全球變化的關鍵途徑。因此,如何快速地對區域森林碳密度進行精確估算已成為國內外學者廣泛關注的重大議題[1-4]。
近年來,國內外學者圍繞森林碳密度估算開展了大量研究,歸納起來比較常用的有:物理模型[5]、經驗模型[6-9]。物理模型法主要以PROSPECT+SAIL模型為主,從物理機理角度反演生物物理參數[10-13]?;诮涷灲y計模型的森林碳密度估算是利用衛星遙感數據獲取的參數信息與森林樣地碳密度進行統計分析,建立兩者的經驗關系來估算碳密度的一種方法。物理模型(過程模型)具有很強的通用性,然而輸入參數過多,需長時間多尺度的站點觀測數據[14],目前區域森林碳密度的遙感反演涉及不多。同物理模型相比,經驗模型法雖然存在模型參數隨時間或地點變化的缺陷,但因其簡單、計算效率高、容易實現的優點,廣泛用于森林碳密度的遙感估測。歸納現有經驗模型的研究成果可知,森林碳密度反演回歸模型以單因子的線性與非線性回歸居多,大部分研究只采用一種回歸方式,使用多種方法進行比較的研究較少。
鑒于此,論文以固定樣地和Landsat5影像為數據源,采用逐步回歸、偏最小二乘回歸和非線性回歸三種方法開展湖南攸縣森林碳密度的反演研究,同時對3種方法所得結果進行對比,旨在分析不同回歸分析方法的特點,找出對森林碳密度反演敏感性高的遙感因子。
1 材料與方法
1.1研究區概況
湖南省東部的攸縣,地處東經113°04′~113°43′,北緯27°04′~27°06′之間。境內四季分明,雨水充足,土壤肥沃,中亞熱帶季風濕潤氣候常綠闊葉林帶,年平均氣溫17.8℃,無霜期292 d,年降水量1 410 mm左右。全縣現有林地166 866.7 hm2,其中森林蓄積量和森林覆蓋率分別達到311.87 m3和57.24%。
1.2 數據來源及處理
1.2.1 遙感數據
研究采用的遙感數據為中分辨率的Landsat5影像,空間分辨率30 m×30 m,軌道號123/41,接收時間2009年8月21日,含云量0.66。采用ENVI 4.7軟件對Landsat5數據進行預處理,包括輻射校正、大氣校正、幾何校正和地形校正4個步驟。其中幾何校正每景影像選取24個控制點,總體誤差控制在半個像元之內;地形校正采用從雙向分布函數角度出發的Minneart模型進行,其在非朗伯體基礎上同時考慮了太陽和傳感器的空間光學信息,結果表明Minnaert模型明顯消除了地形對Landsat5影像的影響,達到了較好地消除效果。
1.2.2 固定樣地數據
以2009年湖南省森林資源連續清查固定樣地調查數據為測算樣本,根據攸縣森林資源分布情況,將固定樣地和遙感影像疊加,剔除被云覆蓋的樣地,最后保留78塊樣地作為研究樣本,計算樣地碳密度。樣地面積為25.82 m × 25.82 m,樣地調查因子包括地貌特征、土壤類型、植被類型以及與森林生物量相關的優勢樹種、胸徑等測樹因子75個,研究涉及的樣地因子主要包括縱坐標、橫坐標、海拔、樣地類別、地類、齡組、優勢樹種、平均樹高和平均胸徑。
1.3 研究方法
1.3.1 森林碳密度的計算
研究基于湖南攸縣森林資源一類調查數據,采用李??萚15]2010年建立的回歸模型,分樹種組計算樣地生物量,經濟林、灌木林采用平均生物量法求得,其平均生物量分別為23.7 t/hm2、19.76 t/hm2[16];混交林生物量,針葉混交林、闊葉混交林、針闊混交林分別按比例(6杉4馬、5軟闊5硬闊、3.6杉2.4馬2軟闊2硬闊)計算,含碳率取0.5。對無明確模型的樹種,采用近似樹種參數替代。為方便后續精度驗證工作的開展,研究通過隨機抽樣將樣本數據分為兩部分,其中三分之二的數據(52塊樣地)作為建模樣本,三分之一的數據(26塊樣地)作為驗證樣本。
1.3.2 變量設置與篩選
借助遙感手段估計森林碳密度分布,國內外學者已做過大量研究,其關鍵步驟是依據數據源的特征提取合適的遙感變量。在前期數據預處理基礎上,選取Landsat5的6個波段TM1、TM2、TM3、TM4、TM5和TM7分別進行倒數運算、比值運算(包括兩波段、三波段和四波段組合間的比值運算)、植被指數(包括NDVI、SAVI、ARVI和EVI四種指數)運算、主成分變換和紋理變換(包括均值、角二階矩、對比度、相關、相異、熵、逆差距和方差8種紋理因子),共生成88種基于Landsat5的遙感變量。為篩選合適的遙感因子,研究運用ArcGIS 10.0軟件提取固定樣地所在位置的遙感變量,采用SPSS 20.0軟件計算樣地森林碳密度值和遙感變量間的Pearson相關性和方差擴大因子,保留相關性高且獨立性高的遙感變量參與后續回歸建模。
1.3.3 反演及建模
森林碳密度的反演分三個階段進行:首先,分析建模因子與試驗區森林碳密度的相關性,開展逐步回歸分析建模和偏最小二乘回歸建模(PLSR);其次,在上述建模分析基礎上,選擇與森林碳密度相關性最高的建模因子開展單變量曲線估計,確定最佳曲線擬合模型,然后逐步引入新的自變量,建立多變量的非線性回歸模型,確定森林碳估計的最佳非線性回歸模型;最后,對三種回歸建模方法開展精度評價與分析。其中逐步多元回歸和非線性回歸采用SPSS20.0軟件實現,PLSR采用SIMCAP11.5執行,具體PLSR建模分三步進行:①分析參與建模的樣本點是否存在特異點;②通過計算交叉有效性和累積解釋量,確定潛在建模變量的個數;③開展森林碳密度的偏最小二乘回歸分析。
1.3.4 精度驗證
基于地面調查樣地的森林碳密度估計在由單木水平、樣地水平推算到區域水平的過程中存在大量的不確定性,忽略這些不確定性將導致區域森林碳密度的高估或低估。本文采用3個指標對Landsat5:判定系數(R2)、均方根誤差和估測精度。R2反映的是估測值與對應的實測值之間的趨勢線擬合程度;均方根誤差(RMSE)用于衡量估測值與實測值之間的偏差,能夠很好地反映估測模型的可靠性;估測精度值(EA)越大模型估測精度越高。
2 結果與分析
2.1 樣地數據分析
根據森林碳密度測算結果,對樣地碳密度進行統計(表1)。分析可知,研究區25.82 m×25.82 m固定樣地碳密度在0.00~39.27 t/hm2之間變化,標準差為8.39 t/hm2,且變異系數大于1.00,屬于強變異程度,說明各樣地森林碳密度存在較大的差異,數值分布合理。
2.2 相關性分析
采用SPSS 20.0分別計算樣地碳密度與遙感變量間的Pearson相關性,結果顯示基于Landsat5的遙感變量與樣地碳密度的相關性分別介于-0.455~0.497之間,表2列出了相關系數排在前8位的遙感因子。對于Landsat5數據,當顯著水平在0.01時,與森林碳密度達到顯著相關的變量有1/TM3、TM1var、Elevation、1/TM2、TM5、TM7mean等15個因子,其中1/TM3、1/TM2、1/TM1和TM2mean四個因子相關系數在0.450以上,特別是與1/TM3的相關性水平最高,達0.497;從方差擴大因子來看,VIF值大于10的有1/TM1、TM2mean等,其中最大值達到44.57,說明自變量間存在嚴重的多重共線性,研究采用逐步剔除法消除自變量間的多重共線性問題。經過篩選,研究最后保留13個因子參與森林碳密度的回歸建模:1/TM3、TM47、Elevation、TM7ent、NDVI、TM2con、TM2、TM3ent、1/TM5、TM1mean、PCA1、TM357、TM4mean。其中TM47=TM4/TM7,TM357=(TM3+TM5)/TM7,Elevation表示海拔,TM7ent、TM3ent分別表示TM7、TM3波段灰度共生矩陣的熵,TM2con表示TM2灰度共生矩陣的對比度,TM1mean、TM4mean分別表示TM1、TM4灰度共生矩陣的平均值,PCA1表示主成分分析的第一分量。
2.3 模型構建
在相關性分析的基礎上,采用SPSS20.0和SIMCAP11.5軟件分別構建研究區森林碳密度的多元逐步回歸分析模型和偏最小二乘回歸模型(表3)。為深入研究Landsat5遙感因子與森林碳密度的關系,筆者提出利用非線性回歸方法開展森林碳密度的反演。首先基于前期篩選的遙感因子,采用SPSS20.0軟件中的11種擬合方法開展基于單變量的非線性回歸,保留單變量最優曲線擬合模型(表3公式(3))。在單變量最優曲線擬合基礎上,以自變量與森林碳密度的相關性分析結果為參考,逐步引入新變量建立基于多變量的非線性回歸模型,經過多次運算和模型選取,森林碳密度的非線性最佳擬合結果(表3公式(4)),該模型的調整R2最高達0.580。
2.4 精度評價
精度評價是衡量森林碳密度反演模型效果的重要步驟。首先分別計算三種回歸方法所建模型的決定系數(R2)和所建模型的殘差,檢驗模型預測值和實際觀測值是否存在較好的線性擬合關系,以及殘差是否落在置信帶內[-2σ^,2σ^];其次根據26個驗證樣本計算三種回歸方法的均方根誤差和估測精度。具體精度檢驗結果(表4)。
分析可知非線性回歸效果最好,R2為0.74,估測精度最高,達74.87%;其次是偏最小二乘回歸(R2、估測精度分別為0.70和71.53%),逐步回歸效果最差(估測精度僅69.27%),同時三種回歸方法的均方根誤差分別為3.06,3.46,3.74,該結果與模型擬合分析結果一致,說明利用非線性回歸模型建立的估測模型效果最好。圖1給出了非線性回歸模型預測值與實測值的散點圖,分析可知非線性回歸模型擬合效果較好(R2為0.74),殘差分析結果與模型擬合效果一致,多元非線性回歸的殘差圖散點分布比較均勻,說明非線性回歸的擬合效果最好。
2.5 反演結果分析
為進一步評價模擬結果的正確性,研究將森林碳密度模擬結果與地面樣地值疊加(圖2),進而直觀反映模擬結果與地面樣地值的吻合程度。結果表明攸縣森林碳密度的模擬結果整體上與地面樣地實測值保持一致的分布趨勢:即由東向西逐漸減少,東部分布大面積的針葉成熟林,森林碳密度高;越向西,森林碳密度越低,最低值出現在湖泊所在的位置。酒埠江附近的大面積連續森林碳密度高值分布,充分反映了森林植被隨地表水分布的規律;而中南部和北部大面積的連續低值分布,則反映出人類活動對森林植被覆蓋的影響。采用ArcGIS 10.0軟件的“Summary statistics”工具進行統計可知,湖南攸縣2009年平均森林碳密度達14.36 t/hm2,具有一定的可信度和實用性。
3 結論
采用逐步回歸、偏最小二乘回歸和曲線估計方法對湖南攸縣森林碳密度進行估測,結合地面樣地調查結果,分析了森林碳密度與Landsat5遙感因子、地形因子的關系,建立了森林碳密度的回歸分析模型。采用R2、RMSE和相對誤差3個指標對回歸結果進行精度檢驗,結果表明:①參與建模的遙感因子中,1/TM3與森林碳密度的相關性最大,敏感性最高,其次是1/TM2、1/TM1和TM2mean;②三種回歸分析方法建立的3個預測模型中,以4個遙感因子建立的非線性回歸模型預測精度最高,預測值與實測值得決定系數R2為0.74,其次是偏最小二乘回歸,逐步回歸的擬合效果最低,預測值與實測值的決定系數為0.68;③通過測算,湖南攸縣平均森林碳密度為14.36 t/hm2,整體上空間格局與植被分布規律保持一致,即由東北向西南逐漸減少,最低值出現在西南部酒埠江所在的區域;④研究所選建模因子基本上為遙感因子,且構建的回歸分析模型多為線性模型,有關非線性模型和非遙感因子的引入,有待進一步探討。
參 考 文 獻
[1]Steffen W, Sanderson R A, Tyson P D, et al. Global Change and the earth system: a planet under pressure [M]. Springer Berlin. 2006:1100.
[2]Houghton Jt, Y Ding, Dj Griggs, et al. IPCC, 2001: Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third Assessment Report of the Intergovernmental Panel on Climate Change [J]. Cambridge, United Kingdom, New York, USA, Cambridge University Press, 2001, 881: 9.
[3]Canadell J G, Robert Dickinson. Global Carbon Project. Science Framework and Implementation [J]. Global Carbon Project. Science Framework and Implementation. Earth System Science Partnership, 2006: 80.
[4]鐘尋. 海南: 三年恢復海防林 [J]. 中國林業, 2007(6A): 1415.
[5]Chiesi M, Maselli F, Bindi M, et al. Modelling carbon budget of Mediterranean forests using ground and remote sensing measurements [J]. Agricultural and Forest Meteorology, 2005, 135(1): 2234.
[6]Hudak A T, Lefsky M A, Cohen W B & Berterretche M. Integration of lidar and Landsat7 data for estimating and mapping forest canopy height [J]. Remote Sensing of Environment, 2002, 82(2): 397416.
[7]Sun G, Ranson K J, Guo Z, Zhang Z, Montesano P, & Kimes D. Forest biomass mapping from lidar and radar synergies [J]. Remote Sensing of Environment, 2011, 115(11): 29062916.
[8]嚴恩萍,林輝,洪奕豐,等.杉木人工林葉面積指數估測及影響因子分析[J].水土保持研究,2013,20(4):7581.
[9]董立新,吳炳方,唐世浩.激光雷達GLAS與ETM聯合反演森林地上生物量研究[J].北京大學學報,2011,47(4):703710.
[10]蔡博峰,紹霞.基于PROSPECT+SAIL模型的遙感葉面積指數反演.國土資源遙感,2007(2):3943.
[11]Jacquemoud S. Inversion of the PROSPECT+SAIL canopy reflectance model from AVIRIS equivalent spectra: theoretical study. Remote Sensing of Environment, 1993, 44(2/3): 281292.
[12]劉照言,馬靈玲,唐伶俐.基于SAIL模型的多角度多光譜遙感葉面積指數反演[J].干旱區地理,2010,33(1):9398.
[13]陳艷華,張萬昌,雍斌.基于分類知識利用神經網絡反演葉面積指數.生態學報,2007,27(7):27852793.
[14]Peng C, Liu J, Dang Q, et al. TRIPLEX: a generic hybrid model for predicting forest growth and carbon and nitrogen dynamics [J]. Ecological Modelling, 2002, 153(1): 109130.
[15] 李??? 中國森林植被生物量和碳儲量評估[M].北京:中國林業出版社,2010:120.
[16]吳丹,邵全琴,劉紀遠,等.1985~2030年江西泰和縣森林植被碳儲量的時空動態[J].應用生態學報,2011,22(1):4146.
(責任編輯:鄭京津)