陳柏海,林 輝,孫 華
(中南林業科技大學林業遙感信息工程研究中心,長沙410004)
基于SPOT5影像的杉木胸高斷面積估測探討
陳柏海,林 輝,孫 華
(中南林業科技大學林業遙感信息工程研究中心,長沙410004)
采用角規實地調查黃豐橋林場90個杉木人工純林樣地胸高斷面積,利用樣地SPOT5遙感信息與地理信息,建立了杉木胸高斷面積多元線性回歸估測模型。首先對樣地采用GIS軟件進行緩沖處理,緩沖后每個樣地的面積為1 hm2;然后提取樣地遙感光譜信息與紋理信息等21個因子和4個GIS因子,采用逐步回歸分析法篩選出6個因子作為模型自變量;最后分別采用普通最小二乘法(OLS)和偏最小二乘法(PLS)建立了杉木胸高斷面積多元回歸模型。研究結果表明:OLS回歸模型的預測精度為82.2%,均方根誤差(RMSE)為5.12 m2/hm2;PLS回規模型的預測精度為83.9%,均方根誤差(RMSE)為4.21 m2/hm2,PLS和OLS回歸模型在杉木胸高斷面積估測中均取得了較好的效果,用中高分辨率遙感影像在估測森林結構參數上是可行的。
胸高斷面積;多光譜;SPOT5;多元統計分析
近年來,隨著高空間分辨率遙感影像的廣泛應用,GIS和GPS技術在森林資源調查和管理中應用的普及,在給外業工作者帶來極大方便的同時,也為借助3S技術對森林結構參數進行定量估測提供了所需的必要條件[1]。國外學者對此做了大量的研究[2-6]。研究表明,利用中高分辨率遙感影像各波段的灰度值線性或非線性的組合,能較好地反映森林的生長狀況和分布關系,與蓄積量、結構參數都有很好的相關關系,可作為定量因子,建立杉木胸高斷面積估測模型。
采用SPOT5影像作為遙感數據源,以研究區域1∶1萬地形圖經矢量化生成的DEM圖作為GIS數據源,對影像數據進行預處理,并提取相應的RS和GIS因子,結合地面實測數據,利用SPSS統計分析軟件,用普通線性回歸分析方法和偏最小二乘法,建立研究區的杉木胸高斷面積估測模型,為快速、高效、準確地估測杉木胸高斷面積提供理論依據。
1.1.1 研究區概況
研究區位于株洲攸縣黃豐橋國有林場內,總面積351.16 km2。林區內森林多樣性比較豐富,有木本植物400余種,主要以杉木、馬尾松人工林為主,各齡組分布合理。
1.1.2 SPOT5 數據
研究采用的數據拍攝時間為2009年11月28日3時6分13秒,它包含空間分辨率為10 m的4個多光譜波段,即綠波段(500~590 nm)、紅波段 (610~680 nm)、近紅外波段(780~890 nm)與短波紅外波段(1 580 ~1 750 nm)和分辨率為 2.5 m 的全色波段[7]。影像的拍攝太陽高度角和方位角分別為45.11°和158.74°。利用ENVI軟件對SPOT5影像進行預處理,主要包括輻射定標、大氣校正、幾何校正等。
1.1.3 外業調查與內業整理
外業調查時間為2009年10月至2010年11月,采用角規抽樣的方法對林分進行調查。在研究區范圍內,首先對影像進行初步解譯和判讀,對杉木人工純林所在的位置和面積進行分析和計算,以確定樣地布設的位置和數量要求。外業調查主要針對杉木中齡林和近熟林,并用帶坡度改正的角規調查林分每公頃斷面積,用激光測距儀或皮尺測量水平距離來確定邊界木;用GPS定位樣地坐標。在本次外業調查和相應的數據處理過程中都采用WGS-84坐標系統,以保證樣地的位置準確。
外業調查資料錄入計算機統計整理,形成與樣地相對應的每公頃杉木斷面積;然后樣點在SPOT5影像上緩沖面積為1 hm2的樣圓,以減少因GPS定位所帶來的誤差。由此,建立了地面調查點對應像元、像元灰度值和胸高斷面積之間的一一對應關系,為杉木胸高斷面積估測模型的建立提供依據。
利用SPOT 5遙感影像,選取一系列可能與斷面積估測相關的RS因子及DEM圖中提取的GIS因子,作為斷面積估測的自變量因子,以地面實測樣點斷面積為因變量,建立多元回歸模型。原始波段信息有多光譜波 B1,B2,B3,B4(也就是 SWIR,短波紅外波段)和全色波段PAN及相應波段的標準差;波段比值有可見光的 B1/B2(GRENRED),B4/(B1+B2)(SVR),B4/B3(MSI),(B3 - B2)/(B3+B2)(NDVI),B3/B2(RVI);紋理信息主要是能量(ASM)、對比度(CON)、相關(COR)、熵(ENT)、逆差距(IDM)、方差(VAR);在GIS因子方面,設置的主要因子有海拔、坡度、坡向、陰影等。共設置25個自變量。
1.3.1 逐步回歸分析
多元逐步回歸法的基本思路在于,自動地從大量可供選擇變量中選取最重要的變量,根據自變量對因變量作用程度的大小,保留作用程度大的變量,剔除作用小的變量[8],變量的引入和剔除是同時進行的。循環反復計算,直到所有該引入的變量都被引入,該剔除的變量均被剔除為止,保留的變量組合即為最優變量組合。
1.3.2 偏最小二乘法
偏最小二乘法是在建模過程中,集主成分分析、典型相關分析和線性回歸分析的特點,實現回歸建模、數據結構簡化以及變量之間的相關性分析。因此,它在分析結果中,可以提供一個更為合理的回歸模型[9]。一般情況下,偏最小二乘法回歸分析法并不需要選取所有m個成分來建立回歸方程,只需選用前h個成分,即可得到滿意的回歸模型。同時對結果進行交叉有效性檢驗(Q2),當Q2h≥0.097 5時,可認為引進新成分th會對模型預測能力有明顯改善作用。
1.3.3 精度評價方法
確定系數(R2)、均方根差(RMSE)、相對誤差(RE)是常用的對模型預測值和實測值之間進行評價和驗證的方法,其定義如下[8]:
確定系數(R2)可以用來檢驗估計值與實測值之間的線性顯著程度,變化范圍在0≤R2≤1,其中R2越接近于1,表明模型的預測能力越強,模型效果顯著。
均方根誤差(RMSE)表示實測值與估計值之間的離散程度,其值越小表示模型估計值與實測值之間的相對距離比較接近,即模型預測精度就越高。
相對誤差(RE)評價是以相對誤差絕對值的平均值作為模型精度評價指標,其值越小,模型的預測精度就越高。
計算公式:

式中:yi為實測值,為模型估計值,為實測平均值,n為樣本數。
自變量的選擇是建立回歸模型的關鍵。在建立的回歸模型中,應盡可能的剔除那些對斷面積估測沒有重要解釋作用的變量,從而達到簡而精的要求。
從總體90個樣本中,按斷面積大小分段選取70個樣本作為建模數據,其中包括最小斷面積與最大斷面積樣本數據;剩余20個樣本作為檢驗數據。計算各因子與斷面積之間的相關系數及方差擴大因子(VIF),結果見表1。
分析表1可知:與斷面積相關系數較大前3個變量是MSI、SVR、能量,說明這3個變量與斷面積有較好的相關性;負相關性方面居前3個變量是GRENRED、坡向、對比度,且這3個變量的絕對值都大于0.1。在所設置的25個自變量中,方差擴大因子(VIF)大于10的有10個,表明它們之間存在多重相關性,若將這些因子全部納入方程,估測模型的精度將無法保證。
在模型的篩選過程中,采用逐步回歸分析方法,以回歸系數顯著性檢驗中各自變量的F統計量的臨界概率值FSig≤0.05和 FSig≥0.10作為自變量引入或剔出模型的判斷標準,即:當Fin≥F0.05,該變量被引入模型,否則不引入;如果 Fout≤F0.10,該變量被剔除,否則保留。共選取了6個自變量:MSI,能量,B3MEAN,B4S,熵,GRENRED。
2.2.1 基于最小二乘法回歸模型的建立
利用逐步回歸分析所篩選出的6個自變量,相應的斷面積為因變量,用最小二乘法建立多元線性回歸模型。模型統計量見表2。

表1 遙感和GIS因子及其相關信息

表2 模型統計量
在表2中,復相關系數R=0.736,確定系數R2=0.542,校正確定系數 R2adj=0.496,估計值標準誤 =5.091。
方差分析結果見表3。
在表3中,可知模型回歸平方和為1 958.51,剩余平方和為1 634.30,總平方和為3 592.80,檢驗回歸方程的統計量 F值 =12.58,查 F檢驗表可得臨界值F0.05(6,63)=2.25,F > F0.05(6,63)表明模型在顯著性水平α=0.05下通過回歸方程檢驗,即所建回歸模型有效。也可通過表中顯著性值=0.0009<0.05來直接判斷回歸方程通過F檢驗(這里顯著性表示棄真概率,含義下同)。

表3 方差分析
回歸系數表見表4。
在表4中,各自變量的回歸系數:B4S=-3.176,B3MEAN=1.621,GRENRED= -0.2541,MSI=19.25,熵=9.214,能量=32.90;同時可知各變量所對應的t值及顯著性值,在表中各自變量顯著性值均小于0.05,表明在顯著性水平α=0.05下模型自變量各個回歸系數通過t檢驗,具有顯著性。

表4 模型回歸系數
綜上所述,用篩選所得的6個自變量建立的擬合回歸方程為:

式中:x1表示 MSI,x2表示能量,x3表示 B3MEAN,x4表示B4S,x5表示熵,x6表示GRENRED。
2.2.2 模型精度檢驗
利用20組檢驗數據對建立的斷面積估測模型進行預測精度檢驗,檢驗結果見表5。

表5 模型精度檢驗結果
以20組檢驗數據的預測值為橫坐標,實測值為縱坐標,繪制散點圖,如圖1所示。
由表5和圖1可知:以多光譜波段的綠紅波段比值、水分脅迫指數、紋理信息中的能量、熵、全色波段的標準差為自變量,用最小二乘法建立的杉木胸高斷面積估測模型,它的確定系數值為0.673 1,均方根誤差值為 5.12 m2/hm2,預測精度達到 82.2% 。

圖1 斷面積估計值與實測值比較
2.3.1 基于偏最小二乘法回歸模型的建立
利用逐步回歸分析所篩選出的6個自變量,相應的斷面積為因變量,用偏最小二乘法建立多元線性回歸模型。
偏最小二乘法的前5個成分的統計信息見表6。
由表6可知:校正確定系數R2adj隨著成分的增加而增大,當成分個數為3時,校正確定系數R2adj達到最大,其值為0.515,同時交叉檢驗因子Q23=0.101 >0.097 5,表明只需提取自變量的前3個成分就可用建立精度較高的回歸模型。

表6 偏最小二乘法統計信息
因此,設定自變量提取成分數為3,其回歸系數和變量投影重要性指標見表7。

表7 回歸系數與變量投影重要性表
變量投影重要性指每一個自變量對因變量集合的解釋能力,可通過變量投影重要指標值來測度。由表7可知:在所提取的3個成分中,按變量投影重要性指標值大小排序,可得6個自變量在估測模型中重要程度次序為:MSI>ASM>GRENRED>ENT>B3MEAN>B4S。同時,由此可得回歸模型為:

式中:x1表示 MSI,x2表示能量,x3表示 B3MEAN,x4表示B4S,x5表示熵,x6表示GRENRED。
2.3.2 模型精度檢驗
利用20組檢驗數據對建立的斷面積估測模型的預測精度進行檢驗,檢驗結果見表8。

表8 模型精度檢驗結果表
以20組檢驗數據的預測值為橫坐標,實測值為縱坐標,繪制散點圖如圖2所示。

圖2 斷面積估計值與實測值比較
由表8和圖2可知:以多光譜波段的綠紅波段比值、水分脅迫指數、紋理信息中的能量、熵、全色波段的標準差為自變量,用偏最小二乘法建立的杉木胸高斷面積估測多元線性回歸模型,其確定系數0.698 9、均方根誤差值為4.21 m2/hm2、預測精度達到83.9%。
本研究是在較小范圍內利用中高分辨率遙感影像對杉木胸高斷面積進行估測分析,主要是探索利用中高分辨率在森林結構參數建模中的應用能力。
1)利用SPOT5影像灰度值線性與非線性組合等25個自變量因子,經過逐步回歸篩選出6個自變量,同時按斷面積大小分段選取70個樣本作為建模數據,其中最小斷面積與最大斷面積必取,建立多元線性回歸模型;將剩余的20個樣本數據代入估測模型進行精度評價。其中最小二乘法估測精度為82.2%、偏最小二乘法為估測精度為83.9%,達到了較為理想的預測效果。
2)在建立回歸模型時,通過兩種不同的解算方法——最小二乘法(OLS)與偏最小二乘法(PLS),分別建立了兩種杉木胸高斷面積估測模型。比較可知,用PLS解算方法建立的估測模型比OLS建立的估測模型在估測精度上提高1.7%,每公頃斷面積估測的均方根誤差提高約1 m2/hm2,說明用PLS建立的回歸模型更能接近實測值。
總體來說,用中高分辨率的遙感影像來估測杉木胸高斷面積是可行的。同時,研究也存在著一定的不足:首先,因研究區域范圍不大,實測的總體樣本數據比較少,具有很強的地域性;其次,本研究對杉木胸高斷面積估測模型的自變量的篩選,僅使用逐步回歸分析來篩選自變量,沒有考慮其它可能存在對估測模型影響較大的自變量因子。
[1]李崇貴,趙憲文,李春干,等.森林蓄積量遙感估測理論與實現[M].北京:科學出版社,2006.43 -48.
[2]W Roberts,S Tesfamichael,M Gebreslasie,et al.Forest structural assessment using remote sensing technologies:an overview of the current state of the art[J].Southern Hemisphere Forestry Journal,2007,69(3):183-203.
[3] Ingram JC,Dawson TP and Whittaker RJ.Mapping tropical forest structure in south-eastern Madagascar using remote sensing and artificial neural networks[J].Remote Sensing of Environment,2005(94):491-507.
[4]Maselli F,Chirici G,Bottai L,et al.Estimation of Mediterranean forest attributes by the application of k-NN procedures to multitemporal Landsat ETM+images[J].International Journal of Remote Sensing,2005,26(17):3781 -3796.
[5]Wolter P,P.Townsend,and B.Sturtevant.Estimation of forest structural parameters using 5 and 10 meter SPOT - 5 satellite data[J].Remote Sensing of Environment,2009,113:2019 -2036.
[6]Song,C.Estimating tree crown size with spatial information of high resolution optical remotely sensed imagery[J].International Journal of Remote Sensing,2007,28(15):3305 -3322.
[7]林輝,孫華,熊育久,等.林業遙感[M].北京:中國林業出版社,2011.64 -69.
[8]袁志發,周靜芋.多元統計分析[M].北京:科學出版社,2006.138-145.
[9]王惠文.偏最小二乘回歸方法及其應用[M].北京:國防工業出版社,1999:200 -220.
Study on Basal Area Estimation of Chinese Fir Based on SPOT5 Images
CHEN Baihai,LIN Hui,SUN Hua
(Research Center of Forestry Remote Sensing& Information Engineering,Central South University of Forestry& Technology,Changsha 410004,Hunan,China)
Abstyact:The surveying of Chinese fir basal area by fielding 90 sample plots with angle gauges had been carried out in Huangfengqiao forest farm,the multiple linear regression estimation model of basal area was set up based on remote sensing and geographic information.First,each sample plot was buffered by GIS software to 1 hectare;Then from which 21 RS index factors such as spectral and texture information and 4 GIS index factors were extracted,in which 6 index factors were screened out as independent model variables through stepwise regression analysis;Last the multiple regression model was built by using OLS and PLS respectively.The results showed that:the model predicted accuracy was 82.2%and RMSE was 5.12 m2/hm2by using OLS;the model predicted accuracy was 83.9%and RMSE was 4.21 m2/hm2by using PLS;The adoption of OLS and PLS services well in basal area estimation,to estimate forest structural parameters can achieve good effects by using high resolution remote sensing images.
basal area;multispectral;SPOT5;multivariate statistical analysis
TP 79;S 757.2
A
1003—6075(2012)01—0044—05
2011—11—21
2011—12—13
湖南省高等學校科學研究項目“高分辨率遙感影像森林結構參數反演研究”(11C1313)。
陳柏海(1987—),男,湖南雙牌人,碩士,主要研究方向為遙感與林業信息工程。