彭 羽,王 越,馬江文,范 敏,白 嵐,周 濤
1 中央民族大學生命與環境科學學院, 北京 100081 2 北京師范大學地表過程與資源生態國家重點實驗室, 北京 100875
遙感可以為群落物種組成、生態系統結構參數及其時空變化的研究提供豐富的信息。利用遙感技術進行植物多樣性估測,較傳統樣方調查法具有速度快、成本低、范圍大等優勢。因此,遙感技術逐漸成為研究生物多樣性的重要工具[1- 3]。目前利用遙感進行植物多樣性估測,基本可分為兩種方法:一是通過電磁波遙感信息直接評估單個物種、種群和物種多樣性;二是將遙感數據和環境參數應用到物種多樣性預測模型中,對物種多樣性進行間接估測[4- 5]。
在直接估測中,機載遙感技術應用于植物物種的直接識別。Valérie等采用兩組航空照片分別鑒定出309種樹冠,鑒定樹種正確率高達87%[6]。Akasheh等利用機載多光譜數字圖像(Airborne multi-spectral digital images,空間分辨率為0.5 m)為Rio Grande River河岸帶植被的物種分布進行制圖[7]。在光譜信息分析方面,NDVI(Normalized Difference Vegetation Index,NDVI)被廣泛應用于植物多樣性的估測[8- 12]。NDVI標準差與植物物種豐富度有顯著相關性[3]。基于NDVI的EVI指數更適合于指示半干旱環境的植物多樣性[13- 14]。其他基于NDVI改進的指數還有EVI (Enhanced Vegetation Index)[15], IRI(Infra Red Index), MIRI(Middle Infra Red Index)[16- 17], ARVI (Atmosphere Resistance Vegetation Index), SAVI (Soil Adjusted Vegetation Index)[15]等。由于這些光譜植被指數只應用較窄的電磁波段的遙感信息,因此植物多樣性預測精度受到一定限制[16- 17]。含有更高波譜分辨率的傳感器逐漸得到開發和利用。高光譜數據,擁有上百至數百個波段信息,涵蓋可見光到近紅外、中紅外和遠紅外,為植物多樣性的高精度監測評估提供了可能。但是,如何從大量的光譜數據中篩選關鍵信息,也成為高光譜植物多樣性指數估測的重要挑戰。
研究發現,采用線性回歸模型篩選敏感波段數據,能夠較好地利用光譜數據預測物種多樣性指數[18]。近年來,采用主成分分析法降低多光譜數據的冗余度,提取光譜主成分來擬合植物多樣性,也起到了很好的效果[19]。多元線性逐步回歸分析,能夠從大量的變量因子中篩選出少數的重要變量因子,已經廣泛的應用于植物營養元素含量[20]、光合生理生態[21]和地上生物量[22]的遙感分析。為此,本研究基于前人的研究結果,應用相關性分析、主成分分析和經驗波段選擇法,篩選敏感波段,對選擇的敏感波段進行多元逐步線性回歸,比較不同方法的擬合效果,探索高光譜數據對于植物物種多樣性估測的應用潛力,為植物多樣性的遙感估測提供參考。
研究區位于渾善達克沙地中部內蒙古自治區正藍旗(42°55′—43°5′N;115°10′—115°35′E)。正藍旗共包含3個鎮、8個蘇木和3個國營牧場,2016年草場面積占到了72.3%,植被種類相對豐富。該區屬于中溫帶半干旱大陸性季風氣候,主要由固定沙丘、半固定沙丘、流動沙丘和丘間低地、濕地等景觀組成 (圖1)。研究區植物物種多以沙生草本植物為主。
本研究在2017年7月到8月在渾善達克沙地中部內蒙古正藍旗進行,在固定沙丘、半固定沙丘、流動沙丘及低地4種生境的代表性區域共選取8個樣地(圖1),樣地大小為30 m×30 m。每個樣地沿對角線設置15個直徑為0.8 m的圓形草本樣方,共計120個樣方。每個樣方進行GPS定位,統計每一樣方內草本植物的種類、數量、高度和蓋度等數據,計算植物多樣性指數。本文采用常用的4個物種多樣性指數:豐富度(Richness,R)、Shannon-Wiener指數(H)、Simpson優勢度指數(D)、Pielou均勻度指數(E)。各樣地植物群落參數見表1。

圖1 研究地點及樣地示意圖Fig.1 The map shows study area and sample locations

樣地序號Sample location code優勢物種Dominant species樣方平均H指數Average H at plot level樣方平均蓋度Average cover at plot level1沙蒿(Artemisia desertorum),沙米(Ajriophyllum squarrosum)0.7836.2232沙蒿(Artemisia desertorum),冷蒿(Artemisia frigida)1.26215.0513沙蒿(Artemisia desertorum),冰草(Agropyron cristatum)1.83636.1134扁穗苔草(Blysmocarex nudicarpa),拂子茅(Calamagrostis epigeios)2.27247.7835沙蒿(Artemisia desertorum),褐沙蒿(Artemisia halodendron)0.5755.0766沙蒿(Artemisia desertorum),冷蒿(Artemisia frigida)0.83212.3347灰綠藜(Chenopodium glaucum),冰草(Agropyron cristatum)1.75531.6758扁穗苔草(Blysmocarex nudicarpa),披堿草(Elymus dahuricus)2.06344.806
采用手持式地物光譜儀FieldSpec H2 (ASD Corp., U.S.A.)采集各個樣方的冠層光譜。儀器光譜范圍為325—1075 nm,光譜分辨率為3 nm,采樣間隔為1 nm。光譜測量在風力小于3級的晴朗天氣下進行,采集時間為北京時間10:00—15:00。測量人員著黑色服裝,避免遮擋陽光,減少光譜干擾。光譜傳感器探頭垂直向下,保持在冠層上方1.8 m內,確保冠層充滿儀器的視場角,每一樣本重復測量10次取均值。測量前均同步測量參考白板反射的輻射光譜用于標定,并定時進行系統優化,以消除環境變化所帶來的影響。
將獲得的高光譜數據經濾波和去除噪音后,根據下式計算一階微分反射比(FD)。
FD=(Rλ(j+1)-Rλ(j))/Δλ
式中,FD是波段j和j+1之間中點處波長值為i的一階微分反射比,Rλ(j)是波段j的反射率,Rλ(j+1)是波段j+1的反射率,Δλ是波長j到j+1的間隔。FD分析用以消除土壤等環境背景值的影響,提取不同植物群落的光譜特征[23- 24],用于擬合植物物種多樣性指數。
為了降低數據冗余,提取能夠反映植物多樣性的重要光譜信息,本文采用3種方法選擇高光譜敏感波段。(1)Pearson相關分析法,對采集得到的375—1025 nm間波段的FD值與該樣方的植物多樣性指數進行雙變量相關性分析,篩選出顯著相關的波段。(2)主成分分析法(PCA),對采集的375—1025 nm波段的FD值進行主成分分析,根據各個波段對主成分的權重系數確定敏感波段。(3)經驗波段選取法,應用已有研究結果發現的對植物多樣性敏感波段,選擇這些經驗波段。
通過以上3種方法,分別篩選出待擬合的敏感波段。以敏感波段的FD值為自變量,植物多樣性指數為響應變量,利用逐步回歸分析方法,將90個植物樣方高光譜數據和植物多樣性指數進行回歸。對建立的多元逐步回歸方程進行基于相關性(R2)、顯著性(P值)、殘差(RMSE)、共線性程度(VIF)和方程復雜性(變量數)[25- 27]的比較,篩選出最優的回歸方程。最后,利用最優回歸模型,將30個未參與回歸建模的樣地高光譜數據代入,進行植物多樣性的擬合,并與實際測得的多樣性指數進行驗證,評估回歸模型的質量。濾波和FD在ViewSpec Pro 6.0 (Analytical Spectral Devices Inc., USA)中完成,相關分析、PCA和MSLR分析在SPSS 23.0和Excel 2010中完成。
相關性分析結果(表2)表明,與H指數顯著相關的波段最少,與R顯著相關的最多。與R和E指數顯著相關的波段多位于可見光和近紅外范圍,波段較寬;而與H和D指數顯著相關的波段相對較窄。
PCA 結果發現,第一主成分(61.56%)和第二主成分(35.90%)能夠解釋光譜數據變異率的97.46%,因此第一、二主成分有足夠的代表性。為了降低數據冗余,本文根據不同波段數值在第一、二主成分線性組合中的權重系數,進一步篩選特征波段。為了篩選到個數較少而貢獻值較大的特征波段,本文參考特征波段數/樣方數<1的標準[28],從651個波段中選取了90個特征波段。波長范圍為500—658 nm,權重系數均在0.7065以上(圖2)。

表2 與植物多樣性指數相關性顯著的敏感波段

圖2 植物多樣性敏感波段在第一、第二主成分的權重系數Fig.2 The weight coefficients of sensitive wavebands in the first and second principle components
以特征波段的FD值為自變量,植物多樣性指數為響應變量,進行逐步回歸分析,得到了136個逐步回歸方程。在進行相關性(R2)、顯著性(P值)、殘差(RMSE)、共線性程度(VIF)和方程復雜性(變量數)比較后,篩選出12個最優回歸方程(表3)。在篩選出的12個逐步回歸方程中,相關性(R2)最高的為基于相關性波段分析的H指數回歸方程,共線性較高的為基于經驗波段的E指數回歸方程,但是12個回歸方程的共線性都很低(VIF<10)。這些回歸方程的顯著性和相關性較高,殘差值和共線性值較低,可以作為植物多樣性指數的擬合模型。
將篩選出來的12個最優回歸方程,代入到另外30個植物樣方進行驗證。結果表明(圖3),回歸方程表現差異很大。對于通過主成分方法篩選出來的特征波段的回歸方程,擬合效果最好,其中H、D、E指數擬合顯著(r=0.40*,r=0.49**,r=0.65**)。而通過特征波段進行逐步回歸的方程擬合效果較差,通過相關性波段進行回歸的方程,僅有E指數擬合顯著。
高光譜擬合植物多樣性指數具有較高的復雜性,受多重因素影響。不同生境類型的光譜FD曲線表現不同(圖4)。流動沙地FD曲線在400—680 nm處明顯高于其他3種沙地類型,在近紅外波段(680—760 nm),FD值表現為丘間低地>固定沙地>半固定沙地>流動沙地。對實測值-擬合值相關性(圖4)的進一步分析表明,植被蓋度適中的固定沙地R, H和D指數的擬合值準確度較高,其中又以PCA波段選擇法擬合度較高。
特征波段選擇一直是高光譜遙感數據分析的中心問題。本文通過相關性分析法、PCA和經驗指數篩選法選擇了潛在的敏感波段,并經進一步的逐步回歸分析,選擇了少量的貢獻值最大的波段,進行了擬合效果比較。相關性分析對高光譜數據每一個波段的FD值進行了分析,縮小了波段范圍。相比其他方法建立的回歸方程,該方程變量的共線性程度最低,說明特征波段之間的冗余信息較少。但是該法在驗證中表現為不穩定,未能取得較好效果。其原因可能是由于數百個波段參數之間相關性分析中產生了交互影響效應,單個波段的貢獻難以通過相關性分析識別出來[20- 21]。說明相關性分析選擇的高相關波段,不一定是含有關鍵光譜信息的特征波段。而根據文獻研究篩選的敏感波段進行擬合的結果也不理想。由于沒有直接利用高光譜數據模擬植物多樣性指數的相關研究,經驗波段選擇的依據多是空間分辨率高于3 m的機載高光譜遙感圖像的分析結果[22, 29- 30]。本文是基于微尺度(0.8 m)植物樣方的高光譜數據進行的擬合分析,尺度的轉換以及傳感器的差異可能使選擇出來的特征波段難以適應。多項研究結果表明,高空間分辨率的遙感數據能夠提高植物多樣性的模擬效果[31]。因此不同分辨率遙感影像篩選的特征波段范圍會有差異。與相關性分析和經驗法選擇波段相比,基于主成分分析法選擇特征波段的回歸方程得到了最好的多樣性指數預測值。主成分分析能夠識別少量的含有大量光譜特征信息的特征波段,在其他傳感器遙感數據研究中也取得較好效果[19],表現出較高的穩定性。

圖4 不同生境沙地類型光譜FD曲線以及實測alpha多樣性指數與相關性分析、PCA和經驗波段法擬合多樣性指數之間的相關系數Fig.4 The FD curves of four kinds of sandy dunes, and the Pearson′s correlation coefficients between filed measured alpha-diversity indices and predicted values based on selected wavebands through correlation, PCA and empirical method, respectively*表示相關系數顯著性(P<0.05)

本文優選的光譜模型驗證精度表現一般,其原因可能在于植物多樣性遙感反演的復雜性。首先,研究地點是沙質草地,傳感器接受的植被信號受沙地強烈的反射光影響。本文篩選的主成分波段范圍為500—658 nm,也說明可見光是收集樣方光譜的主要部分。對于流動沙地和半固定沙地,對FD值的影響更明顯,擬合精度不高。其次,研究地點生境多樣,復雜的環境條件也會降低模型準確度。本研究地點為流動沙地、半固定沙地、固定沙地和低地,樣方植被蓋度范圍為5%—48%,收集到的樣方光譜數據差異性較高。本研究也通過分析四種生境條件下光譜模型的擬合度,發現同一光譜模型在不同生境會表現出明顯的差異。為了開發適宜性廣的光譜模型,沒有區分不同生境分別建模。因為在實際應用中,大面積的草地生態系統類型是多樣性生境類型的混合,研究的重點應該是開發能夠擬合大面積生態系統的普適性的遙感模型,發揮遙感進行大尺度植物多樣性指數估算的優勢。其三,沙地植物群落多樣性的光譜特征,還受樣方土壤類型、土壤含水量、群落復雜性、群落蓋度、地表凋落物、植株陰影等因素的影響[32]。研究表明,群落不同植物的高度差異、物種多樣性組成以及群落分層特征都將影響群落的光譜特征。例如,相同物種組成的植物群落,由于植株間蓋度、發育階段和葉片傾角的不同,而呈現出不同的光譜多樣性指數[32]。本研究也表明,植被蓋度中等的固定沙地的植物多樣性指數模型擬合效果較好(圖4)。如何將這些影響因素全部納入高光譜模型,尚需開展系列控制條件下的大量定量實驗研究。其四,不同植物多樣性指數的擬合效果也有差異。H, D, E指數擬合效果較好的原因,一是這些指數的計算考慮到了不同物種的多度,同時這些指數也不受取樣單位的影響,開發的光譜模型能夠反映這些特征。與之相反,物種豐富度的擬合效果較差。其原因可能是物種豐富度僅考慮單位樣方的種類數而沒有考慮其多度和比例[33],難以用光譜模型表達。一個樣方的植物群落光譜特征不僅受物種種類影響,也受物種組成比例的影響,因此豐富度指數與光譜模型的契合度較差。
由于植物物種多樣性空間分布具有尺度效應,不考慮尺度效應分析生物多樣性可能會導致錯誤的結論[19, 34]。遙感數據由于具有粒度效應和幅度效應[12, 35- 36],可以和植物多樣性空間尺度效應結合起來進行分析,探討適合于植物多樣性擬合的最優粒度和幅度。從微尺度到大尺度的多尺度研究有利于消除一般規則下的錯誤判斷,從而正確評估物種多樣性。隨著高分辨率高光譜衛星影像和近地面無人機高光譜遙感技術的發展,高光譜遙感數據和影像直接監測植物物種多樣性表現出了較大的應用潛力。本文基于敏感波段選擇方法,比較了不同選擇方法光譜模型擬合效果的差異,為高光譜應用于植物多樣性的遙感估測提供了初步參考。未來的研究可以利用不同空間尺度(從0.3 m到60 m的系列空間分辨率)的高光譜遙感數據,對不同空間尺度的植物多樣性的遙感模型特征進行比較,揭示植物多樣性遙感模型的尺度轉換機制。同時,開展不同生境類型(流動沙地、半流動沙地、固定沙地和低地)、不同季節和不同群落條件(蓋度、生活型、高度)下植物多樣性光譜特征的時空差異研究,探究普適性廣和精確度高的遙感模型,促進植物多樣性參數的快速和精準估測。