潘 穎 丁鳴鳴 林 杰 代 僑 郭 賡 崔琳琳
(1.南京林業大學南方現代林業協同創新中心 南京 210037; 2.長江航道工程局有限責任公司華東分公司 南京 210011; 3.南京市水務局 南京 210036)
森林生態系統作為陸地生態系統的最大碳庫,在全球碳循環中扮演著源、庫、匯的作用,而城市森林作為城市重要的生命支撐系統,是城市可持續發展的基礎和保障(林文鵬等, 2008)。葉面積指數(leaf area index, LAI)通常被定義為植被葉、莖、花、果等組分的總面積與土地面積之比(Chenetal., 1996),是生態系統碳循環、水文和氣候等模型中不可或缺的重要組成參數,已被廣泛應用于森林監測、植被評價和農作物產量預估等(Mynenietal., 2002; Sonnentagetal., 2007)。LAI能夠反映植被水平覆蓋狀況和垂直結構特征,甚至枯枝落葉層厚薄和地下生物量多少,這些也是植被影響土壤侵蝕的主要方面(楊勤科等, 2006; 楊敏等, 2015)。因此,及時、準確、有效估算區域尺度上高質量植被LAI,對研究土壤侵蝕與植被的關系至關重要(Linetal., 2014)。
遙感具有及時、高效探測大面積目標地物光譜特征的能力,是獲取區域乃至全球尺度上植被參數的主要手段,利用遙感影像構建植被指數已被廣泛用于植被LAI反演研究中(Liangetal., 2015; Linetal., 2014; Liuetal., 2012)。林文鵬等(2008)基于SPOT5遙感影像建立實測LAI與植被指數之間的線性回歸關系,結果發現修正土壤調節植被指數(modified soil adjusted vegetation index,MSAVI)和優化葉綠素吸收率指數(modified chlorophyll absorption in reflectance index,MCARI)能夠消除土壤背景和葉綠素的影響,適用于城市森林LAI遙感反演,而歸一化植被指數(normalized difference vegetation index,NDVI)會受背景等因素不同程度的影響。楊敏等(2015)基于Landsat 8 OLI遙感影像構建隱含層為2層的反向傳播(back propagation,BP)神經網絡,模型不僅具有較高的LAI反演精度,而且具有較高的空間可靠性。姚雄等(2017)結合法國Pleiades遙感數據,利用12種遙感植被指數構建隨機森林(random forest, RF)林地LAI反演模型,結果發現RF模型不容易出現過擬合現象,其精度高于支持向量回歸(support vector regression,SVR)模型和BP神經網絡模型。
多角度遙感從不同方向多種角度對同一地物進行觀測,可提供豐富的地物信息,具備較強的植被結構參數反演能力,且能夠減少“異物同譜”和“同物異譜”等現象對反演結果造成的影響(楊貴軍等, 2011)。相比于單一角度垂直觀測的遙感數據,多角度遙感數據能夠反映植被立體結構信息和地物多維空間結構特征,可以改善傳統的單角度遙感數據反演植被LAI精度低等問題,對于有效反演地表植被結構參數具有重要意義(李新輝等, 2011; Wangetal., 2016)。Fan等(2009)基于多角度PROBA/CHRIS(project for on-board autonomy/compact high resolution imaging spectrometer)數據和混合冠層反射率模型提出一種新的高光譜方向二階導數方法(hyperspectral directional second derivative method,DSD),能夠有效消除背景影響,提高LAI反演精度。趙妍等(2013)指出,多角度遙感數據反演的LAI對研究森林植被生物量和森林生態系統碳水循環等具有重要意義。
經驗模型法和物理模型法是目前最常用的LAI反演方法。經驗模型法指在植被指數或反射率與LAI之間建立線性或非線性回歸模型,但模型易飽和,且通用性受限(Schlerfetal., 2006)。物理模型法指利用以物理方法為基礎的植被冠層反射率模型進行LAI反演,其中植被冠層輻射傳輸模型PROSPECT+SAIL(scattering by arbitrarily inclined leaves)——PROSAIL模型既考慮土壤的光學特性,又考慮植被的幾何結構特征,具有良好的模擬效果(楊貴軍等, 2011; 余金林, 2014; Jacquemoudetal., 2009)。谷成燕等(2013)、杜育璋等(2016)利用PROSAIL輻射傳輸模型模擬的植被冠層反射率建立查找表反演植被LAI,結果發現基于PROSAIL模型的植被LAI遙感反演結果與LAI實測值具有較高一致性,反演精度較高。
綜上可知,多角度遙感數據可以充分挖掘植被立體結構信息,隨機森林算法能夠減少反演過程中的過擬合現象,PROSAIL模型具有較好的植被冠層反射率模擬效果。由此可見,利用多角度遙感數據,結合PROSAIL輻射傳輸模型和隨機森林算法能夠提高植被LAI遙感反演精度,對研究森林生態系統碳循環具有重要意義。
鑒于此,本研究基于多角度PROBA/CHRIS遙感數據和野外實測數據,結合PROSAIL模型和隨機森林模型反演森林LAI,并對LAI反演結果進行精度驗證和評價,以期提高植被LAI遙感反演精度,為區域土壤侵蝕遙感定量監測提供新的方法和模型。
紫金山位于南京城區東郊,32°01′57″—32°06′15″N、118°48′00″—118°53′04″E,屬低山丘陵,土壤以黃棕壤為主(王春, 2009)。地處北亞熱帶季風性氣候區,四季分明,年均氣溫15.7 ℃以上,全年降水分布不均,年降雨量1 021 mm左右。典型地帶性植被類型為常綠-落葉闊葉混交林,主要由針葉林、闊葉林、落葉常綠混交林、針闊混交林和竹林等組成,樹木生長季主要為春夏季。紫金山大部分森林為人工林,森林覆蓋率80%,森林郁閉度0.75~0.8(王春, 2009; 陳添興, 2012)。
幕府山位于南京城區北面,32°07′47″—32°10′00″N、118°44′58″—118°51′06″E,主要由崗地、低山、河漫灘和少量平地組成(李林, 2004)。土壤主要為石灰巖殘丘和其他基性巖漿上發育起來的土壤以及少量人工土壤和碳酸土等(李林, 2004; 劉國華, 2004)。地處北亞熱帶濕潤氣候區,四季分明,熱量充沛,年均氣溫15.4 ℃,雨量充足,年降雨量800~1 000 mm,降水主要集中在6月中旬到7月中上旬。典型地帶性植被類型為常綠-落葉闊葉混交林,無明顯優勢樹種,樹木生長季主要為春夏季。幕府山森林以人工林為主、天然次生林為輔,群落結構分為喬木層、灌木層和草本層3個層次(李林, 2004)。
2.1.1 葉面積指數測定 于2017和2018年7—9月上旬進行LAI測定,選擇天空晴朗、無積云、能見度好的天氣,測定時間為6:30—10:30和14:00—17:30,盡量避免太陽直射。由于地面測定時間在遙感數據成像后2年,因此樣方選擇植被變化少、人為干擾小的區域(曹建軍等, 2013)。選取不同林分類型(針葉林、闊葉林、針闊混交林),在每種林分類型內選擇地勢坡度較緩、植被分布均勻且變化小的地區進行測定,樣方大小為10 m×10 m,采樣間距大于30 m,共114個樣方。采用LAI-2200C冠層分析儀,在每個樣方的4個角和中心點測定5個LAI,取其平均值作為該樣方的LAI。利用GPS記錄樣方地理位置,坐標參考WGS-84,重復測定2~3次,取其平均值作為結果。研究區內采樣點分布如圖1所示,不同植被類型的LAI實測值描述統計如表1所示。

圖1 采樣點分布Fig. 1 Distribution of sampling points

表1 采樣點不同植被類型的LAI描述統計Tab.1 Descriptive statistics of LAI values of different vegetation types in sampling points
2.1.2 葉片光譜測定 葉片光譜測定在天氣良好、無風或風力較小的條件下進行,采用美國產ASD FieldSpec Pro2500光譜輻射儀,測定時間為10:30—14:00。光譜范圍為350~2 500 nm,采樣間隔350~1 000 nm 范圍內為1.4 nm,1 000~2 500 nm 范圍內為2 nm。探頭視場角為25°。每片葉片取3個點進行測定,每個測點視場范圍內重復20次,取其平均值。光譜測定前后立即進行參考板校正(張海波等, 2014; 邢著榮, 2010; 劉天鳳, 2014)。
2.2.1 葉片面積測定 采用網格法測定葉片面積。首先將采集的新鮮葉片分為3組,每組10片,在方格紙上將每片葉子的輪廓用鉛筆描繪下來,然后利用方格面積與葉片面積呈正比的關系計算葉片面積(張清林等, 2011)。
2.2.2 葉片等效水厚度計算 在PROSAIL模型中,葉片含水量為等效水厚度(equivalent water thickness,Cw),定義為單位葉片面積單位質量葉片內含有的水分質量。計算公式如下:
Cw=(葉片鮮質量-葉片干質量)/
(葉片面積·ρ)。
(1)
式中:ρ為水的密度(g·cm-3)。
2.2.3 葉片干物質含量計算 葉片干物質含量(leaf dry matter content,Cm)指葉片內淀粉、纖維素和蛋白質等含量。在PROSAIL模型中,葉片干物質含量定義為單位葉片面積內的干物質質量(g·cm-2)。計算公式如下:
Cm= 葉片干物質質量/葉片面積。
(2)
2.2.4 葉綠素a、b含量測定 葉綠素a、b含量(chlorophyll a and b content,Cab)測定參考張清林等(2011)。取新鮮葉片3份,每份0.2 g,加入95%乙醇及適量石英砂和碳酸鈣粉,研磨成勻漿至組織發白,過濾,用UV2450-紫外可見分光光度計測量波長 665和649 nm處的消光度(D)。計算公式如下:
Ca=13.95×D665-6.88×D649;
(3)
Cb= 24.96×D649-7.32×D665;
(4)
色素含量(mg·g-1)=C·V/W/1 000。
(5)
式中:Ca和Cb分別為葉綠素a和葉綠素b濃度;D665和D649分別為波長 665和649 nm處的消光度;C為色素濃度(mg·L-1);V為提取液體積(mL);W為葉片樣品鮮質量(g)。
2.3.1 遙感影像數據 采用多角度PROBA/CHRIS遙感數據,影像獲取時間為當年7—9月,盡量選取無云影像(表2)。
PROBA衛星是歐空局2001年10月22日發射的新一代微衛星,為太陽同步軌道,軌道高度615 km,傾角97.89°。衛星上搭載緊湊式高分辨率成像分光計CHRIS、輻射測量傳感器SREM和碎片測量傳感器DEBIE。CHRIS作為一種成像裝置,成像模式多、光譜范圍寬、分辨率高,能夠獲取目標-55°、-36°、0°、36°和55°5種角度的觀測信息(角度為正表示前向觀測,角度為負表示后向觀測)(楊貴軍等, 2011)。CHRIS L1數據共有5種成像模式: 模式1為陸地和水成像; 模式2為水成像; 模式3、4和5主要為陸地成像。本研究選取Mode 3數據,共18個光譜波段,天底點地面分辨率為17 m。因多角度PROBA/CHRIS遙感數據受傳感器和云層影響較大,故只有2015年9月7日數據。研究區樹木生長季主要為春夏季,野外調查時間稍早于影像成像時間,對反演結果影響不大。

表2 多角度遙感數據源Tab.2 Multi-angle remote sensing data resources
2.3.2 遙感影像數據預處理 多角度PROBA/CHRIS遙感數據預處理主要包括去噪、云掩膜、大氣校正和幾何校正。首先,利用歐空局提供的HDFclean(http:∥www.earth.esa.int/proba/HDFclean v2.htm)軟件對影像進行去噪處理和缺失像元填充。由于獲取數據時天氣良好,沒有云層污染,因此未對數據進行云掩膜處理。然后,利用歐空局提供的BEAM軟件對CHRIS數據進行大氣校正。最后,使用校正好的南京市2007年TM遙感影像,在研究區內選擇15個地面控制點,采用二次多項式擬合法和雙線性內插法進行幾何校正,將誤差控制在0.5個像元內。由于多角度PROBA/CHRIS遙感數據獲取區域在研究區內,因此未進行影像裁切。
2.3.3 最佳波段選取 CHRIS Mode 3數據包含18個光譜波段,波段間具有較強相關性。為了選取信息量大、冗余性小的波段,利用主成分分析法對高光譜波段間的統計數據進行計算,并通過分析相關系數和協方差矩陣獲取最佳反演波段(Brogeetal., 2001)。首先,計算CHRIS影像波段間的相關系數矩陣,如圖2所示,18個光譜波段相鄰波段的相關系數較高,而間隔較遠波段間的相關性較弱,沿對角線明顯分塊,為方便最佳波段選取,將CHRIS影像波段分為波段1-5、6-11和12-18共3部分; 然后,計算各分段區的協方差矩陣和特征值,確定各分段區的主成分個數,進而計算每個主成分對波段的貢獻率,貢獻率越大,波段所含信息量越大; 最后,根據貢獻率大小選取最佳波段。第n波段第x主成分的貢獻率為:
(6)
式中:Pnx為第n波段第x主成分的特征向量;λx為第x主成分的特征向量; Varn為協方差矩陣中第n波段的方差。
最終確定CHRIS數據的最佳波段組合為第5、8和18波段,中心波長分別為570.9、676.0和1 022.0 nm。

圖2 CHRIS影像波段間的相關系數矩陣Fig. 2 Correlation coefficient matrix between CHRIS image bands
2.4.1 PROSAIL模型 PROSAIL模型整合葉片光學特性模型PROSPECT和冠層反射率模型SAIL,考慮土壤非朗伯特性、葉片鏡面反射、植被冠層熱點效應和葉傾角分布情況,使用2層冠層結構,同時考慮植被冠層水平和垂直方向上的異質性,能夠很好描述均勻植被冠層的反射特性,具有良好模擬結果,在LAI反演、生理生化參數反演以及光譜模擬等方面廣泛應用(谷成燕等, 2013; 趙虹等, 2014; 王李娟等, 2014)。PROSPECT模型是Jacquemoud等(1990)提出的基于ALLEN平板模型改進的輻射傳輸模型,主要用于計算 400~2 500 nm間隔5 nm的上行和下行輻射通量,從而得到葉片的反射率和透射率。SAIL模型是Verhoef(1984)基于SUITS模型發展的用于描述植被冠層二向性反射率的輻射傳輸模型。PROSAIL模型公式如下:
ρc=PROSAIL(LAI,ALA,N,Cab,
Cw,Cm,SL,Diff,θv,θs,φ) 。
(7)
式中:ρc為冠層反射率; LAI為葉面積指數; ALA為平均葉傾角(°);N為描述葉片內部細胞結構的參量,與植物種類和生長狀態有關,一般情況下單子葉植物N為1~1.5,雙子葉植物N為 1.5~2.5,老化葉N大于2.5(Darvishzadehetal., 2008);Cab為葉片葉綠素a、b含量(μg·cm-2);Cw為葉片等效水厚度(cm);Cm為葉片干物質含量(g·cm-2);SL為熱點參數; Diff為漫反射系數;θv和θs分別為觀測天頂角和太陽天頂角;φ為太陽與觀測相對方位角。
2.4.2 PROSAIL模型參數敏感性分析 為更好利用冠層反射率反演LAI,需了解各生化組分參數對冠層反射率變化的敏感程度和影響的波段區間(吳伶等, 2012)。參數敏感性分析是確定模型關鍵參數和控制模型效率非常有效的過濾工具,細化敏感性大的參數,將敏感性小的參數設為定值,既可建立完整的模擬集,又能減少數據的冗余性,有助于優化模型構建和參數反演(谷成燕等, 2013)。其中,定性分析是通過改變待分析參數取值,固定其他參數取值,得到一系列模擬的冠層反射率,基于冠層反射率曲線變化反映該參數的敏感性強度; 而定量分析則是考察在某個參考值附近一定范圍內,模型輸出的冠層模擬反射率變化情況(谷成燕等, 2013)。定性分析過程中模型各參數變化范圍選取依據如下: LAI變化范圍根據野外實測LAI范圍設置;N和SL參考石鋒(2012);Cab、Cw和Cm變化范圍根據實驗室測量數據范圍設置;θs、θv和φ取值根據觀測角度為0°時的影像頭文件信息設置。采用Spherical函數(蔡博峰等, 2007)模擬葉面積傾角,土壤背景選擇潮濕土壤,具體參數設置如表3所示。
2.4.3 PROSAIL模型適用性分析 利用PROSAIL模型模擬冠層反射率過程中,先通過PROSPECT模型模擬林地葉片反射率,再通過SAIL模型模擬林地冠層反射率。PROSPECT模型模擬葉片反射率時,需先與研究區實測葉片反射率進行匹配,通過不斷調試找到最適參數,使模型模擬反射率與實測反射率有較好匹配,匹配情況由誤差函數驗證(谷成燕等, 2013)。計算公式如下:
(8)

2.4.4 植被指數選取 LAI變化與葉片光學性質變化有關,與植被光譜紅光和近紅外波段反射率有很強相關性,基于特征波段構建的植被指數可用于估算LAI(Pearsonetal., 1972)。Broge 等(2001)研究發現,當直接使用多波段光譜數據反演 LAI 時,反演方法復雜且容易受影像中水汽吸收等因素干擾,而植被指數利用波段比值等方式,能夠減小冠層陰影和土壤背景等干擾因子的影響,從而突出植被信息,是估算植被葉面積指數的重要工具。
本研究借鑒以往經驗(姚雄等, 2017),選擇RVI(比值植被指數,ratio vegetation index)、NDVI、PVI(垂直植被指數,perpendicular vegetation index)、DVI(差值植被指數,difference vegetation index)、SAVI(土壤調節植被指數,soil adjusted vegetation index)、EVI(增強型植被指數,enhanced vegetation index)、MSAVI和SIPI[結構不敏感色素(植被)指數,structure insensitive pigment (vegetation) index]8 種對LAI敏感的植被指數,計算公式如表4所示。通過分析8種植被指數與LAI的相關性,選擇相關性較高的植被指數參與LAI建模和反演,相關性分析采用SPSS 20.0(SPSS Inc,USA)軟件進行。

表3 敏感性分析參數設置①Tab.3 Parameter settings of sensitivity analysis

表4 植被指數及其表達式①Tab.4 Vegetation indices and their expressions
2.4.5 隨機森林LAI反演 隨機森林是一種基于分類回歸樹的集成機器學習算法,是Breiman(2001)提出的Bagging算法的變體,其運算速度快、計算高效、預測準確性高,對異常值和噪聲有很好的容忍度,且由于樣本內部進行交叉檢驗,不會出現過擬合現象(呂杰, 2012; 吳志明等, 2018)。
本研究通過Python自帶的scikit-learn機器學習庫實現隨機森林算法的構建。將植被指數作為自變量,LAI作為因變量,選取70%樣本用于參數優化和模型構建,30%樣本用于模型檢驗。主要步驟如下: 1) 采用bootstrap技術進行重采樣,在原始數據集中有放回地隨機抽取n個樣本作為訓練集,生成對應決策樹,未被抽取到的樣本構成袋外數據集; 2) 假設有M個輸入變量,每株樹的節點從M個變量中隨機選擇k個,用于確定該節點的最佳分裂點; 3) 使每株決策樹都最大限度地生長而不剪枝,直至滿足分割終止條件; 4) 對所有決策樹求平均值獲得最終預測值。
首先將模擬的冠層反射率通過光譜響應函數模擬到多角度PROBA/CHRIS影像的b1(442 nm)~b18(1 019 nm)波段上,以與LAI相關性較高的植被指數作為自變量。其次確定回歸過程的關鍵參數,包括決策樹數量(n_estimators)、最大特征數量(max_features)、最大深度(max_depth)和分裂性能函數(criterion)。對于n_estimators,主要通過設置不同決策樹數量得到不同模型誤差,觀察誤差變化趨勢從而確定n_estimators;當n_estimators增加時,模型誤差趨于穩定,選擇該值為最佳n_estimators,在本研究中當決策樹數量達到1 000后,模型誤差趨于穩定,因此將1 000作為最佳n_estimators。max_ features設置為自動,max_depth默認為不輸入,criterion設置為均方誤差。
LAI反演過程的技術路線如圖3所示。

圖3 LAI反演技術路線Fig. 3 Pretreatment flow chart of LAI inversion
2.4.6 精度評價 決定系數(coefficient of determination,R2)被用于評價模型模擬值與實測值之間的擬合效果(Qietal., 2013),其值越接近于1,表明模型擬合精度越高。計算公式如下:
(9)
均方根誤差(root mean square error,RMSE)和平均絕對百分誤差(mean absolute percentage error,MAPE)被用于評價模型預測值與實測值之間的誤差,其值越小,表明模型精度越高。計算公式如下:
(10)
(11)

圖4 冠層反射率隨模型參數變化曲線Fig. 4 Curve of canopy reflectance with different model parameters
PROSAIL模型中各生化組分參數在不同波長下的冠層反射率如圖4所示。葉面積指數(LAI)對可見光波段(400~800 nm)范圍內的冠層反射率影響較小,對近紅外和短波紅外波段的冠層反射率影響較為顯著,冠層反射率隨LAI增大而增大;但隨著波段增加、LAI增大,冠層反射率變化幅度減小,逐漸趨于飽和。葉片結構參數(N)影響整個光譜范圍內的冠層反射率,N增大,植被多次散射效應增強,冠層反射率隨之增大,特別是綠光和整個紅外波段,冠層反射率逐漸增大。葉綠素a、b含量(Cab)對可見光波段范圍內的冠層反射率影響很大,冠層反射率隨Cab增加呈逐漸降低趨勢,綠光波段處較為敏感;800 nm后,Cab對冠層反射率幾乎沒有影響,冠層反射率趨于一致。葉片等效水厚度(Cw)對可見光波段范圍內的冠層反射率沒有影響,這是因為Cw主要通過水分對光譜的吸收作用影響冠層反射率;而水分對960 nm后的波段吸收較為明顯,冠層反射率隨Cw增大逐漸減小,變化較為顯著。葉片干物質含量(Cm)對可見光波段范圍內的冠層反射率幾乎沒有影響,原因可能是葉綠素吸收掩蓋了干物質含量對冠層反射率的影響(余金林, 2014);Cm對近紅外及其以外波段的冠層反射率影響較為明顯,冠層反射率隨Cm增大逐漸減小。熱點參數(SL)對可見光波段范圍內的冠層反射率無明顯影響,但在760~1 300 nm和1 400~1 850 nm波段,冠層反射率隨SL增大而增大,變化相對明顯。
由上述分析可知,LAI和N影響整個光譜范圍內的冠層反射率,尤其在近紅外波段影響最為顯著;Cab對400~800 nm可見光波段范圍內的冠層反射率影響較大;Cw主要影響960 nm后的光譜,冠層反射率隨Cw增大逐漸減小;Cm對近紅外及其以外波段的冠層反射率影響較為明顯,冠層反射率隨Cm增大逐漸減小;SL影響760~1 300 nm和1 400~1 850 nm波段的冠層反射率。各輸入參數敏感性大小為LAI>Cab>Cm>SL>N>Cw。
根據冠層反射率在相應波段的變化程度,結合波段主成分分析,確定多角度PROBA/CHRIS遙感數據的b5、b8和b18波段(分別為綠、紅和近紅外波段)參與敏感度計算,并將取值范圍按照波長劃分為5個等級。在參數取值不同的情況下,用各等級的冠層反射率計算模型中各參數的敏感度。計算公式(余金林, 2014)如下:
(12)
式中:Si為敏感度;Ri和Ri+1分別為第i等級和第i+1等級的冠層反射率。
由表5定量分析結果可知,各參數敏感性大小為LAI>Cab>Cm>SL>N>Cw,與定性分析結果一致。
LAI和Cab對冠層反射率影響較大,將其設為變化輸入參數,其余設為常量輸入參數。LAI取值范圍參照野外實測LAI及石鋒(2012)和邢著榮(2010);Cab取值范圍參照實驗室測量數據;Cm和Cw取值源于實驗室測得的大量不同樹種葉片生化組分參數的加權平均值;θv、θs和φ由多角度影像頭文件信息獲得;SL、N和ALA取值源于石鋒(2012)、蔡博峰等(2007)。PROSAIL模型的變化和常量輸入參數如表6、7所示。根據確定的模型輸入參數,利用PROSAIL模型模擬5種觀測角度下的冠層反射率,得到多角度冠層反射率模擬數據集。
由圖5a(以垂直向下觀測為例,觀測角度0°)可知,PROSPECT模型模擬葉片反射率與實測葉片反射率的一致性相對較好,模擬值與實測值之間線性方程的R2為0.992 7,RMSE為0.034 7,說明模型模擬葉片反射率精度較高,可用于進一步模擬林地冠層反射率。由圖5b可知,PROSPECT模型模擬葉片反射率與實測葉片反射率的絕對偏差(丨模擬值-實測值丨)較低,在紅光波段(550 nm附近)模擬值偏大,在近紅外波段(750 nm后)模擬值偏小,原因可能是模型中一些輸入參數沒有實測數據,結合參考文獻和經驗值會給模擬結果帶來一定誤差,另外實測葉片反射率還受天氣和試驗儀器等影響,會有一定偏差(邢著榮, 2010)。

表6 PROSAIL模型變化輸入參數和范圍Tab.6 Variable input parameters and ranges of PROSAIL model

表7 PROSAIL模型常量輸入參數Tab.7 Constant input parameters of PROSAIL model

圖5 PROSPECT模型模擬葉片反射率與實測葉片反射率Fig. 5 The relationship between the simulated and measured leaf reflectance
通過光譜響應函數,將PROSAIL模型模擬的35個樣方冠層反射率匹配到多角度PROBA/CHRIS遙感數據5種觀測角度的18個波段上,與多角度數據大氣校正后提取的樣方地表反射率進行精度對比。由表8可知,除了-55°外,其余由PROSAIL模型模擬的冠層反射率精度較高,其中0°的模擬精度最高,RMSE和MAPE 分別為0.047 3和0.376 1; -55°的模擬精度最低,RMSE和MAPE 分別為0.127 2和0.654 7。由此可見,PROSAIL模型模擬的冠層反射率適用于接下來的計算。不同觀測角度數據模擬的冠層反射率精度大小為0°>36°>-36°>55°>-55°。

表8 各角度模擬冠層反射率與影像反射率的精度評價Tab.8 Accuracies of simulated canopy reflectance and image reflectance at different angles
5種觀測角度下,實測LAI與模擬冠層反射率計算得到的植被指數之間的相關性分析結果如表9所示。可以看出,除了-36°和±55°的RVI和NDVI與LAI分別呈顯著相關(P<0.05)和顯著不相關外,其余6種植被指數在5種觀測角度下均與LAI呈極顯著相關(P<0.01)。除了MSAVI、SAVI和SIPI外,其余3種植被指數與LAI的相關系數均在0.8以上,其中PVI與LAI的相關系數最高,除55°外,均達到0.9以上。
0°和±36°觀測角度下,8種植被指數與LAI的相關系數由大到小依次為PVI、DVI、EVI、MSAVI、SAVI、SIPI、RVI和NDVI。±55°觀測角度下,8種植被指數與LAI的相關系數由大到小依次為PVI、DVI、EVI、SAVI、MASVI、SIPI、RVI和NDVI。8種植被指數均在0°觀測角度下與LAI的相關性最高。
由相關性分析結果可知,選取的8種植被指數均能較好反映林地LAI變化。除了RVI和NDVI外,其余6種植被指數在5種觀測角度下均與實測LAI呈極顯著相關,且相關系數均在0.5以上,可作為隨機森林模型的輸入參數。

表9 實測LAI與不同觀測角度下植被指數之間的相關性分析結果①Tab.9 Correlation analysis results of LAI and vegetation indices at different angles
由于多角度遙感數據可以獲取地面目標的立體結構信息,植被不同層次對冠層反射率的貢獻比例隨觀測角度改變而變化,因此基于多角度遙感數據進行參數反演能夠提高冠層結構參數的識別能力和反演精度(楊貴軍等, 2011)。為了探究角度變化和不同角度組合對森林LAI反演結果的影響,本研究利用每種角度模擬的冠層反射率計算每種角度的植被指數,構建單角度和多角度反演數據集,建立基于單角度和多角度數據的LAI-VI反演模型,角度組合形式如表10所示,共31種組合,其中單角度數據集5種、多角度數據集26種。

表10 LAI反演模型構建的角度組合方式Tab.10 Observation angle combinations of LAI inversion model
基于單角度數據的隨機森林LAI反演模型精度如表11所示。可以看出,在單角度LAI反演模型中,精度最高的為前向觀測角度55°(R2=0.915 7,RMSE=0.235 7,MAPE=0.042 6),該角度與衛星過境時的太陽天頂角(θs=61.88°)最接近,能較好表達植被的前向反射特點(楊貴軍等, 2011)。相比傳統垂直觀測角度0°,前向觀測角度55°模型的R2提高0.75%,RMSE和MAPE分別降低3.76%和5.12%。單角度LAI反演模型精度由高到低依次為55°、36°、0°、-55°、-36°。
基于多角度數據的隨機森林LAI反演模型精度最高的組合匯總如表12所示。可以看出,在多角度LAI反演模型中,精度最高的為0°、36°和55°的3角度組合(R2=0.918 4,RMSE=0.231 9,MAPE=0.041 5),相比單角度55°,R2提高0.29%,RMSE和MAPE分別降低1.61%和2.58%。相比傳統垂直觀測角度0°,3角度組合模型的R2提高1.05%,RMSE和MAPE分別降低5.31%和7.57%。

表11 基于單角度數據的隨機森林LAI反演模型精度Tab.11 Accuracies of random forest LAI inversion model based on single angle data
由表12還可以看出,增加1種觀測角度,模型反演精度有一定提高,特別是從1種角度增加到2種角度時,模型R2相比單角度55°提高0.21%,RMSE和MAPE分別降低1.15%和0.70%;當觀測角度從2種增加到3種時,模型反演精度也有所提高,模型R2提高0.09%,RMSE和MAPE分別降低0.47%和1.89%。但隨著角度組合數進一步增加,模型反演精度反而減小,特別是由4種角度增加到5種角度時,分析其原因可能是角度組合數過多會造成光譜信息冗余,且由于單角度-36°和-55°反演LAI時精度較低,因此包含這2種角度的模型精度會有所降低。由此可知,一方面,增加觀測角度可提供更多植被冠層結構信息,LAI反演精度隨觀測角度增加而增加,但另一方面,觀測角度過多會使像元空間重采樣、葉片陰影和土壤陰影等問題帶來更多不確定性,LAI反演精度反而下降。

表12 基于多角度數據的隨機森林反演模型精度Tab.12 Accuracies of random forest LAI inversion model based on multi-angle data
5種觀測角度下,PVI與LAI的相關性均最高。為了進一步證明隨機森林反演模型在區域尺度上反演森林LAI的優越性,本研究利用單角度和多角度數據分別構建基于像元尺度的LAI-PVI回歸模型,包括指數、線性、對數和冪函數模型,結果發現,指數模型的反演精度最高(表13)。相比非線性回歸模型,單角度隨機森林LAI反演模型的R2提高0.70%,RMSE和MAPE分別降低15.40%和11.98%; 多角度隨機森林LAI反演模型的R2提高0.79%,RMSE和MAPE分別降低6.72%和9.19%。由此可知,無論是單角度還是多角度數據,隨機森林LAI反演模型精度均高于非線性回歸模型,表明相比傳統回歸模型,隨機森林模型能夠明顯提高LAI反演精度,適用于區域植被LAI反演。

表13 基于單角度和多角度數據的非線性回歸模型反演精度最高的組合匯總Tab.13 Summary with the highest accuracies of non-linear regression models based on single and multi-angle data
綜上分析可知,基于多角度PROBA/CHRIS遙感數據的隨機森林LAI反演模型最佳角度組合為0°、36°和55°的3角度組合。鑒于多角度遙感影像的公共區域只有紫金山西部,因此本研究只對該區域進行LAI反演,得到紫金山西部區域LAI介于0.44~6.70之間,林地LAI均值為3.04,紫金山西部林地LAI整體上呈北部和南部高、中間低的空間分布格局(圖6)。
紫金山西部大部分林地的LAI高于3.0,而大部分城區的LAI低于2.0。林地北部和南部的LAI相對較高,結合野外調查數據和小班資源圖發現,紫金山林分類型以闊葉林為主,其次為針葉林和針闊混交林,且針葉林的LAI大部分高于3.5,林地垂直結構多為喬灌草; 而中間部分林地的LAI小于3.0,原因可能是該區域植被較稀疏,林分結構單一,林地垂直結構多為喬草。由于研究區植被類型復雜,多角度PROBA/CHRIS遙感數據的覆蓋區域較小,且建模數據比影像數據延后2年,加上影像范圍內缺少充足有效的實測植被冠層反射率數據,因此將模型移植到影像上的反演結果會存在一定偏差。
為進一步考察基于PROSAIL模型和多角度遙感數據的隨機森林LAI反演模型在紫金山西部林地的應用精度,本研究利用紫金山區域內20個樣方的實測LAI進行驗證。由圖7可知,LAI實測值與反演值的散點圖較好地分布在1∶1線附近,RMSE和MAPE分別為0.190 3和0.026 0,表明基于多角度遙感數據的隨機森林模型反演紫金山西部森林LAI是可行的,反演精度較高。傳統垂直觀測只考慮了林地水平覆蓋,而傾斜觀測與多種觀測角度組合可以捕捉到森林冠層結構和林地垂直結構,能夠顯著改善傳統垂直觀測反演LAI精度較低的問題。

圖6 基于PROBA/CHRIS遙感數據的0°、36°和55° 融合反演得到的LAI分布Fig. 6 The LAI distribution obtained by using 0°, 36° and 55° based on the PROBA/CHRIS data

圖7 LAI反演值與實測值的關系Fig. 7 The scatter plot between the measured LAI and estimated LAI
LAI可較好反映森林生長狀況,是評價森林健康的良好指標(楊慧喬等, 2014),其不僅影響森林的碳吸收,而且能夠通過改變感熱與潛熱通量比例直接影響區域乃至全球氣候(柳藝博等, 2012),因此準確估算森林LAI對研究森林生態系統及全球碳循環具有重要意義。研究表明,LAI與冠層反射率具有較強相關性(李映雪等, 2006)。目前,不少學者采用波段比值構建植被指數來反演林地LAI,單一植被指數包含的信息容易出現飽和現象(宋開山等, 2006),而植被指數過多也可能產生過擬合現象(楊福芹等, 2016)。隨機森林模型對數據集的適應力較強,具有很好的抗噪性能和擬合能力(姚雄等, 2017),但不少學者利用隨機森林進行參數反演時,直接將各種植被指數作為模型輸入參數,沒有對輸入參數進行篩選(韓兆迎等, 2016; 李粉玲等, 2015)。由于植被指數具有抗飽和、消除或降低土壤背景影響等能力,因此分析不同植被指數與LAI的相關性,選擇最佳植被指數作為輸入參數尤為重要。
PROSAIL模型整合葉片光學特性模型PROSPECT和冠層反射率模型SAIL,考慮土壤非朗伯特性、葉片鏡面反射、植被冠層熱點效應和葉傾角分布情況,能夠很好描述均勻植被冠層的反射特性;但PROSAIL模型模擬的光譜反射率只代表無空間尺度大小的“點”,且多角度PROBA/CHRIS遙感數據不同觀測角度對應的地面視場范圍不一致,從而導致像元分辨率存在一定差異(楊貴軍等, 2011)。本研究中PROSAIL模型的一些輸入參數沒有實測數據,結合參考文獻和經驗值會給模型模擬結果帶來一定誤差。此外,PROSAIL模型反演過程中可能受參數敏感性帶來的誤差影響,本研究只設置LAI為最敏感參數,其他參數設置為定值,也會影響到LAI反演精度。
由于多角度PROBA/CHRIS遙感數據容易受傳感器和天氣影響,數據獲取困難,且觀測角度重合區域較小,因此后續對多角度遙感數據反演LAI的研究可以嘗試利用其他易于獲取且具有多種觀測角度的影像數據,從而進一步擴大研究范圍,建立反演精度高、適用于更大尺度的LAI遙感反演模型。
1) PROSAIL模型中各輸入參數敏感性大小為LAI>Cab>Cm>SL>N>Cw,模擬的冠層反射率精度大小為0°>36°>-36°>55°>-55°。
2) 在選取的8種植被指數中,5種觀測角度下PVI與LAI的相關性最高,相關系數均達到0.9以上。除了RVI和NDVI外,其余6種植被指數在5種觀測角度下均與實測LAI呈極顯著相關,且相關系數均在0.5以上,可作為隨機森林模型的輸入參數。
3) 單角度LAI反演模型中,精度最高的為前向觀測角度55°(R2=0.915 7,RMSE=0.235 7,MAPE=0.042 6),該角度與衛星過境時的太陽天頂角最接近,能較好表達植被的前向反射特點。相比傳統垂直觀測角度0°,前向觀測角度55°模型的R2提高0.75%,RMSE和MAPE分別降低3.76%和5.12%。
4) 多角度LAI反演模型中,精度最高的為0°、36°和55°的3角度組合(R2=0.918 4,RMSE=0.231 9,MAPE=0.041 5),相比單角度55°,R2提高0.29%,RMSE和MAPE分別降低1.61%和2.58%。然而角度組合數過多會帶來光譜信息冗余、葉片和土壤陰影等問題。相比傳統垂直觀測角度0°,3角度組合模型的R2提高1.05%,RMSE和MAPE分別降低5.31%和7.57%。
5) 相比非線性回歸模型,單角度隨機森林LAI反演模型的R2提高0.70%,RMSE和MAPE分別降低15.40%和11.98%; 多角度隨機森林LAI反演模型的R2提高0.79%,RMSE和MAPE分別降低6.72%和9.19%。
6) 紫金山西部區域LAI介于0.44~6.70之間,林地LAI均值為3.04,林地LAI整體上呈北部和南部高、中間低的空間分布格局。