靖傳寶,周偉奇,*,錢雨果
1 中國科學院生態環境研究中心城市與區域生態國家重點實驗室,北京 100085 2 中國科學院大學,北京 100049
城市喬木樹種多樣性會影響其提供生態系統服務的能力,對改善城市環境、維持城市可持續發展有著重要的意義。研究表明,城市喬木樹種多樣性會在不同程度上影響城市樹木在降雨截留[1]、氣溫調節[2]、污染物削減[3]、鳥類[4]和昆蟲多樣性維護[5]、情緒調節[6]等方面的生態系統服務。量化城市喬木樹種多樣性是定量研究其生態系統功能和服務的前提。隨著全球城市化的快速推進,外來樹種被大量引入城市,導致城市內樹種多樣性水平變化劇烈[7],迫切需要快速、準確量化城市喬木樹種多樣性水平的方法。傳統的量化方法主要基于地面調查,效率低、成本高,難以滿足及時掌握城市喬木樹種多樣性信息的需求。因此,發展基于遙感技術,能夠準確高效地量化城市喬木樹種多樣性的方法具有重要的意義。
光譜變異性假說(Spectral Variation Hypothesis,SVH)和生產力假說(Productivity Hypothesis)是基于遙感技術反演喬木樹種多樣性的理論基礎。其中,前者認為光譜異質性(光譜異質性水平可采用分析單元內部的光譜標準差表示[8])越高,喬木樹種的多樣性也越高[9];后者認為喬木樹種豐富度與生產力存在相關關系[10]。可采用衡量生產力的歸一化植被指數(Normalized Difference Vegetation Index,NDVI),常用于反映喬木樹種的多樣性水平[11-12]。
上述假設在自然生態系統中得到了驗證,并應用于喬木樹種多樣性的遙感反演。許多學者研究發現遙感影像各波段及NDVI的標準差與喬木樹種多樣性之間的關系滿足光譜變異性假說和生產力假說,并進一步應用多元回歸、神經網絡等方法構建了光譜變異性與喬木樹種多樣性之間的關系模型,用于快速、準確地反演了喬木樹種的多樣性水平。但是,鮮有學者探討上述兩種假說在城市中的適用性及其應用。其可能原因是:自然生態系統中的遙感反演方法無法直接應用于城市生態系統中。自然生態系統具有景觀相對均質、喬木樹種多樣性水平低等特點,采用中、低空間分辨率影像能夠較準確地刻畫其喬木樹種多樣性水平[13-14]。而城市生態系統中的景觀異質性高、喬木斑塊面積小、單位面積的樹種多樣性水平高,中、低空間分辨率遙感影像通常為喬木斑塊和非喬木斑塊的混合像元,難以精確刻畫城市內的喬木樹種多樣性水平。因此,有必要在城市區域探討光譜變異性假說和生產力假說的適用性,并基于上述兩種理論探索城市喬木樹種多樣性遙感反演方法。
本文將通過探究高空間分辨率遙感數據的各波段光譜異質性、NDVI指數的異質性與喬木樹種多樣性水平之間的相關關系,發展基于高空間分辨率遙感數據的城市喬木樹種多樣性的快速反演方法。試圖回答以下科學問題:光譜變異性假說和生產力假說是否適用于城市喬木樹種多樣性的反演研究?
北京是中國首都及中國四個特大城市之一,是快速發展的典型城市[15]。1978—2016年,城市常住人口快速增長,從1987年的871.5萬增加到2016年的2172.9萬,年均增加34.2萬,年均增長2.4%[16]。北京屬于半濕潤大陸性季風氣候,夏季高溫多雨,冬季寒冷干燥,本地喬木樹種以暖溫帶闊葉林為主,同時有大量外來引進喬木樹種。
研究區選取北京五環內區域(39°28′—41°25′N,115°25′—117°30′E),占地面積667.81 km2。該區域是北京的主要建成區,截止2009年,其植被覆蓋度為32.8%[17]。區域內喬木豐富度為92種,常見種為龍爪槐(Sophorajaponica)、圓柏(Sabinachinensis)、銀杏(Ginkgobiloba)和毛白楊(Populustomentosa),4種樹種數量占區域喬木總數量的35%。其中,龍爪槐(S.japonica)數量最多,占區域總喬木數的12.6%。同時,喬木豐富度表現出空間異質性,居民區、社區公園、文教區內的豐富度明顯高于其他景觀類型[18]。由于快速地城市化,研究區內的外來物種比例持續增長,當前已增加至50%左右[19]。因此,北京五環內區域可作為在快速城市化背景下探究城市喬木樹種多樣性遙感反演方法的理想研究區。
1.2.1喬木樹種多樣性數據
居民區分布廣泛、易于調查,有利于發展喬木樹種多樣性反演方法,因而本研究針對居民區開展喬木斑塊多樣性地面調查。研究首先基于高分影像以均勻取樣為原則初步勾畫喬木樣地斑塊,并于2014年6月 至8月期間開展地面調查和邊界優化工作,共收集了395個有效的喬木斑塊(圖1),斑塊面積分布如圖2。喬木斑塊內物種數最大為20,最小為1,平均值為3.8(圖3)。

圖1 研究區及采樣點研究區內樣地分布喬木斑塊Fig.1 The study area and the sampling points Distribution of samples Tree patches

圖2 樣地的面積Fig.2 Area of sample plot

圖3 樣地的物種數Fig.3 The tree species of sample plot
參考已有研究[20],選擇香濃維納指數和辛普森指數表征斑塊的喬木樹種多樣性,兩個指數越大則多樣性水平越高,但各有偏重。香濃維納指數同時考慮物種數和物種比例,而辛普森指數側重對普通物種的度量,兩者常配合使用。具體公式如下:
(1)
(2)
式中,H′為香濃維納指數,D為辛普森指數,S為物種數目,Ni為種i的個體數,N為群落中全部物種的 個體數。
1.2.2光譜異質性數據
1)樣地的光譜異質性。光譜異質性以喬木斑塊的各波段或指數的光譜標準差來表征。本研究選用高空間分辨率的GeoEye-1遙感影像,在喬木斑塊尺度上提取光譜異質性特征。該影像包括四景數據,獲取時間均為2009年6月,具有全色波段(Pan:0.45—0.90 nm)、藍波段(Blue:0.45—0.51 nm)、綠波段(Green:0.51—0.58 nm)、紅波段(Red:0.655—0.690 nm)和近紅外波段(NIR:0.78—0.92 nm)五個波段,全色波段空間分辨率為0.5 m,其他波段空間分辨率為1.65 m,整個研究區內無云。對該影像處理工作主要包括幾何校正,波段合成和影像鑲嵌。幾何校正以Google影像為基準。研究共量化了6種光譜異質性,包括NDVI標準差(NDVISD)、藍波段標準差(BlueSD)、綠波段標準差(GreenSD)、紅波段標準差(RedSD)、近紅外波段標準差(NIRSD)和全色波段標準差(PanSD)。
喬木斑塊多樣性地面調查2014年6月至8月,而因高空間分辨率遙感數據獲取的限制,遙感影像獲取時間為2009年6月,但本研究通過選擇居民區內樣地的方式,能夠使兩種數據在時間上達到匹配。居民區建成后,其內部綠地極少重新規劃,喬木樹種多樣性水平將基本不變,即使研究區是快速發展的典型城市,其居民區仍可認為是樹種多樣性的穩定的區域。同時,選擇居民區時,本研究僅選擇2009年6月至2014年8月期間一直存在的居民區。
2)研究區范圍的光譜異質性。本研究選擇已有的研究區土地利用分類結果(圖4),并以分類結果中林地斑塊作為喬木斑塊,在喬木斑塊尺度上量化整個五環范圍內喬木斑塊的光譜標準差。該分類結果以上述GeoEye遙感影像為數據源,采用面向對象的圖像處理技術和非監督分類方法并結合手動修改獲得。其中,分類器選擇支持向量機,具體參數設置[21]:Kernel為rbf神經網絡,C=100000,gamma=0.0001。土地利用類型包括林地、草地、耕地、濕地、建設用地、裸地和其他用地。總體精度和Kappa系數分別為95.50%和0.89,其中林地的用戶精度和制圖精度分別為96.02%和93.56%。

圖4 土地利用分類圖Fig.4 Land use classification map
參照自然生態系統的喬木樹種多樣性反演方法,構建本研究的思路(圖5)如下:1)基于偏相關分析方法,探究喬木樹種多樣性與光譜異質性之間的相關關系,檢驗光譜變異性假說和生產力假說是否適用于城市區域;2)構建反演模型,探究高空間分辨率遙感影像對城市喬木樹種多樣性水平的反演能力。

圖5 本研究技術路線Fig.5 Flowchart of the analysis
1.3.1相關性分析
偏相關分析中,將面積作為控制變量,并分兩部分展開:1)分析光譜異質性數據(NDVISD、GreenSD、RedSD、PanSD、BlueSD和NIRSD)之間的相關性,用于探討自變量之間是否具有多重共線性,為多元線性回歸模型和BP神經網絡模型反演模型的選擇和構建提供重要依據;2)分析光譜異質性與喬木樹種多樣性指數(香濃維納指數和辛普森指數)之間的相關性,據此選擇與喬木樹種多樣性數據顯著相關的光譜異質性變量構建多元線性回歸模型和BP神經網絡模型。
1.3.2反演模型構建
自然生態系統中,常基于多元線性逐步回歸模型和神經網絡模型反演喬木樹種多樣性水平。本研究試圖從線性和非線性兩個維度刻畫喬木樹種多樣性與光譜異質性之間的關系,因而同時選擇了多元線性逐步回歸模型和神經網絡模型反演。為使得分析結果具有可比性,兩模型均選用了相同的自變量、因變量、訓練樣本集和模型精度驗證樣本集。參考已有研究[22],隨機選擇的365個喬木斑塊樣本構成訓練樣本集,剩余的30個樣本組成模型精度驗證樣本集。
多元線性逐步回歸模型用于構建喬木樹種多樣性與光譜異質性之間的線性關系,其構建包括以下幾個步驟:1)基于光譜異質性數據與喬木樹種多樣性數據之間的相關性分析結果,分別篩選出與香濃維納指數和辛普森指數顯著相關的影像因子作為自變量;2)對上述自變量分別與兩種多樣性指數進行多元線性逐步回歸分析,得到香濃維納指數和辛普森指數的多元線性回歸模型;3)應用該模型對測試樣本集進行反演。
BP神經網絡模型[23]具有強大的非線性映射能力,理論上可以逼近任意函數,用于構建喬木樹種多樣性與光譜異質性之間的非線性關系。該模型由輸入層、隱含層和輸出3層結構構成。其中,輸入層由輸入變量組成,即光譜異質性數據;輸出層由輸出數據組成,即喬木樹種多樣性水平。參照已有研究,模型參數設置如下:選擇與香濃維納指數和辛普森指數顯著相關的光譜異質性數據作為模型輸入,分別以斑塊香濃維納指數和辛普森指數作為模型輸出,網絡的拓撲結構均為(5,7,1)和(6,7,1),隱含層傳遞函數采用S型函數(transig),輸出層傳遞函數采用線性函數(purelin),網絡訓練的最大訓練次數為1000次,訓練函數為tranlm。
模型精度評價以喬木樹種多樣性反演結果與實際多樣性水平之間的差異為依據。采用決定系數(R2),均方根值誤差(root mean square error,RMSE)和平均偏差(mean normalized bias,MNB)[24]三個指標評估多元線性模型和BP神經網絡模型模型的反演精度。其中,R2能夠反映回歸方程對因變量y總變異的解釋比例,R2越大則反演模型精度越高。RMSE可以評估反演值與真實值之間的誤差,RMSE越小則反演模型精度越高。其公式為:
(3)
MNB用以評估系統誤差,MNB越小則反演模型精度越高。其表達式為:
MNB=100mean(xi-x)
(4)
1)各光譜異質性特征之間普遍存在正相關關系(表1)。其中,BlueSD、GreenSD以及RedSD兩兩之間的線性相關性最強(R=0.925-0.960,P<0.01);PanSD與BlueSD、GreenSD以及RedSD之間的線性相關強度次之(R=0.748-0.815,P<0.01);NIRSD與PanSD相關性相對較低(R=0.413,P<0.01),與GreenSD、RedSD、BlueSD以及NDVISD之間相關性不顯著。

表1 光譜異質性數據相關性Table 1 Correlation analysis of spectral heterogeneity′s data
顯著性水平:**P<0.01,*P<0.05;控制變量:樣地面積;NDVI標準差(NDVISD)、藍波段標準差(BlueSD)、綠波段標準差(GreenSD)、紅波段標準差(RedSD)、近紅外波段標準差(NIRSD)和全色波段標準差(PanSD)
2)喬木樹種多樣性與光譜異質性特征之間存在普遍正相關性。由表2可知:香濃維納指數和辛普森指數均與NIRSD線性相關性不顯著(P>0.05),與GreenSD、RedSD、BlueSD、PanSD和NDVISD呈現顯著正相關(P<0.05)。但相關程度存在差異,與香濃維納指數的相關強度由高到低分別為GreenSD、RedSD、BlueSD、PanSD和NDVISD,其皮爾森系數分別為0.229、0.214、0.204、0.197和0.168;與辛普森指數的相關強度由高到低分別為PanSD、NDVISD、GreenSD、RedSD和BlueSD,其皮爾森系數分別為0.202、0.189、0.174、0.144和0.136。

表2 光譜異質性數據與喬木樹種多樣性數據相關性Table 2 Correlation analysis between species diversity and spectral heterogeneity′s data
顯著性水平:**P<0.01,*P<0.05;控制變量:樣地面積;NDVI標準差(NDVISD)、藍波段標準差(BlueSD)、綠波段標準差(GreenSD)、紅波段標準差(RedSD)、近紅外波段標準差(NIRSD)和全色波段標準差(PanSD)
1)多元線性逐步回歸模型。利用訓練樣本集分別擬合獲得香濃維納指數和辛普森指數的多元線性逐步回歸模型。在多元線性逐次回歸分析中,剔除了PanSD和RedSD,得到香濃維納指數的線性回歸模型:
Y1=0.029X2+0.002X6-0.026X1+0.410(R2=0.094,P=0.00)
(5)
其中,Y1為香濃維納指數、X1為BlueSD、X2為GreenSD、X6為NDVISD;
剔除了GreenSD、RedSD和BlueSD,得到辛普森指數的線性回歸模型:
Y2=-0.005X5+0.001X6+0.280(R2=0.080,P=0.00)
(6)
其中,Y2為辛普森指數,X5為PanSD、X6為NDVISD。
2)模型精度分析。應用以上多元線性回歸模型,以及相同訓練樣本得到的非線性的BP神經網模型,分別估計香濃維納指數和辛普森指數。結果顯示,BP神經網模型香濃維納指數和辛普森指數的預測能力均顯著高于多元線性回歸模型。在多元逐步回歸預測模型中(圖6),香濃維納指數模型的決定系數(R2)、均方根值誤差(RMSE)和平均偏差(MNB)分別為0.167、36.27%和52.28%;辛普森指數模型的決定系數(R2)、均方根值誤差(RMSE)和平均偏差(MNB)分別為0.25、10.69%和19.95%。在BP神經網絡模型中(圖7),香濃維納指數模型的決定系數(R2)、均方根值誤差(RMSE)和平均偏差(MNB)分別為0.57、24.04%和42.16%;辛普森指數模型的決定系數(R2)、均方根值誤差(RMSE)和平均偏差(MNB)分別為0.72、4.44%和15.95%。

圖6 香濃維納指數反演值與實際值之間的關系Fig.6 The relationship between Shannon-Wiener′s calculated values and actual values

圖7 辛普森指數反演值與實際值之間的關系Fig.7 The relationship between Simpson′s calculated values and the actual values
3)基于上述模擬結果,選擇BP神經網絡對北京市的喬木樹種多樣性水平進行反演。以研究區的土地利用分類結果中提取的喬木斑塊為分析單元,應用BP神經網絡模型開展了研究區喬木樹種多樣性預測,并基于歸一化后的預測值(相對預測值)繪制研究區喬木樹種多樣性空間地圖(圖8、圖9)。

圖8 香濃維納指數空間分布圖Fig.8 The spatial distribution of Shannon-Wiener index

圖9 辛普森指數空間分布圖Fig.9 The spatial distribution of Simpson index
在城市中,光譜變異性假說和生產力假說得到了更好地詮釋。研究發現,與自然生態系統相比,城市生態系統中的喬木樹種多樣性與遙感影像光譜異質性之間不僅存在類似的正相關關系[25],甚至該關系顯著性和相關性水平更高[8]。可能的原因是:1)樣本中像元數量的差異。在自然生態系統中,一個樣本僅有少量像元,如9個像元;而本研究以斑塊為分析單元,單個樣本點包含的像元數是前述樣本的幾十倍甚至幾百倍;2)遙感影像分辨率的差異。一株喬木冠幅等于一個像元的大小是探究喬木樹種多樣性水平與遙感影像光譜異質性關系的最理想情況。而實際研究中,由于不同喬木具有不同的冠幅,難以找到完全與冠幅相匹配的遙感數據。針對同一樣本,與最理想情況的光譜異質性水平相比,中等分辨率遙感影像的光譜異質性水平常偏低,高空間分辨率遙感影像的光譜異質性水平常偏高;3)喬木樹種多樣性數據分布特征的差異。與自然生態系統相比,城市生態系統中喬木樹種多樣性的最低水平相似,而由于城市中大量地進外來物種[7],其內部喬木樹種多樣性水平具有更最高的水平,進而導致其極差更大。城市中喬木斑塊小、異質性強,如應用中等空間分辨率的遙感影像,樣地內包含的像元數較少、像元過大,難以刻畫其喬木樹種多樣性水平,因此,本研究建議采用高空間分辨率遙感影像探究城市喬木樹種多樣性水平。
神經網絡模型在刻畫非線性關系時具有明顯的優勢[26],更適合城市喬木樹種多樣性的反演。結果顯示,基于BP神經網絡構建非線性回歸反演能力明顯優于多元線性回歸模型(圖6、7)。這說明非線性模型能夠更好地刻畫城市喬木樹種多樣性與遙感影像光譜異質性之間的關系。然而,本研究僅采用最簡單的神經網絡模型對城市喬木樹種多樣性與遙感影像光譜異質性之間的關系開展初步地探索。未來建議采用非線性映射能力更強的神經網絡,進一步提高遙感反演喬木樹種多樣性的能力。
基于光譜變異性假說和生產力假說,本研究提出了一種基于遙感技術的城市喬木樹種多樣性反演方法,能夠定量表征城市喬木樹種多樣性的空間格局,可為城市喬木樹種多樣性地面調查和城市樹種的生態系統服務時空動態的研究提供新的思路和技術手段。城市喬木樹種多樣性地面調查結果的可信度和調查效率分別受到樣本的代表性和抽樣方法的直接影響。本研究構建的方法可量化城市喬木樹種多樣性水平的空間分布,可為地面調查提供分層抽樣的依據,有助于提高城市喬木樹種多樣性地面調查結果的可信度和調查效率。城市喬木樹種多樣性水平的時空動態是研究其生態系統服務動態的重要基礎,該方法可快速量化多期城市喬木樹種多樣性水平,為城市樹種的生態系統服務動態研究提供了必要的技術手段。