李光一,李海萍,萬華偉,李利平 (1.中國(guó)人民大學(xué)環(huán)境學(xué)院,北京 100872;2.貴州省生態(tài)氣象和衛(wèi)星遙感中心,貴州貴陽(yáng) 550002;.生態(tài)環(huán)境部衛(wèi)星環(huán)境應(yīng)用中心,北京 10009;.中國(guó)科學(xué)院空天信息創(chuàng)新研究院,北京 10009)
新疆獨(dú)特的地理環(huán)境和豐富的生態(tài)系統(tǒng),孕育了眾多的珍稀動(dòng)植物.2015 年發(fā)布的《中國(guó)生物多樣性保護(hù)優(yōu)先區(qū)域范圍》[1]中的35 個(gè)優(yōu)先區(qū)域中新疆有阿爾泰山、天山-準(zhǔn)格爾盆地、塔里木河流域、羌塘-三江源和庫(kù)姆塔格5 個(gè).2016 年又新建了霍城四爪陸龜和伊犁小葉白蠟2 個(gè)國(guó)家級(jí)自然保護(hù)區(qū).現(xiàn)有記載顯示,新疆有鳥類319 種,哺乳類79 種,其中37 種為我國(guó)特有,29 種為世界特有[2-3].
1949 年以來我國(guó)人口膨脹、耕地?cái)U(kuò)張帶來了水資源、草地和天然林減少,而沙地卻持續(xù)擴(kuò)張,生境的劇烈變化使物種豐富度不斷下降.據(jù)統(tǒng)計(jì),新疆野生動(dòng)物數(shù)量已不足20 世紀(jì)70 年代的25%,在《中國(guó)生物多樣性紅色名錄-脊椎動(dòng)物卷》中新疆有近危103 種、易危44 種、瀕危40 種、極危12 種、區(qū)域滅絕2 種,野外滅絕2 種[4],野生雙峰駝、新疆北鯢等國(guó)家一類保護(hù)動(dòng)物種群數(shù)量減少至瀕臨滅絕.生物多樣性降低使地區(qū)生態(tài)平衡、生態(tài)安全受到嚴(yán)重威脅.因此,研究影響物種豐富度的環(huán)境因子對(duì)維護(hù)新疆生物多樣性具有重要理論意義.
有關(guān)物種豐富度與環(huán)境因子的關(guān)系研究中,基于統(tǒng)計(jì)回歸的研究最普遍,劉路平[5]采用SPSS 軟件對(duì)山東省鳥類物種豐富度與環(huán)境因子的關(guān)系進(jìn)行了相關(guān)和多元線性回歸分析.劉澈等[6]在研究中國(guó)鳥類物種豐富度與環(huán)境因子的關(guān)系時(shí),采用Origin Pro 8 以及SPSS 進(jìn)行主成分分析,得到了更精簡(jiǎn)的影響因子組合.田凱[7]采用Pearson 線性相關(guān)分析研究武漢西北部野生脊椎動(dòng)物主要類群的豐富度與環(huán)境因子的關(guān)系.沈夢(mèng)偉等[8]利用R 和SAM 軟件,基于最小二乘法建立一元線性回歸模型,考察了氣候因子對(duì)兩棲動(dòng)物物種豐富度的解釋能力,并根據(jù)AIC 信息量準(zhǔn)則篩選出最優(yōu)模型及其所包含的變量.
由于地理環(huán)境的空間異質(zhì)性及相互依存性,單純運(yùn)用統(tǒng)計(jì)方法或建立單一的回歸模型并不能很好地解釋物種豐富度和環(huán)境因子的關(guān)系,GIS 技術(shù)則被廣泛地應(yīng)用于生物多樣性領(lǐng)域[9].同時(shí),隨機(jī)森林等新算法被逐步引入,該方法在評(píng)估環(huán)境因子對(duì)研究對(duì)象的重要性方面具有明顯優(yōu)勢(shì)[9],Lopatin等[10]基于隨機(jī)森林算法識(shí)別出模擬維管植物物種豐富度最重要的3 個(gè)環(huán)境變量,其結(jié)果與生態(tài)學(xué)理論一致.李紫晶[11]利用隨機(jī)森林模型篩選了影響草原和旱生灌叢生物多樣性、群落生物量重要的環(huán)境因子,并通過擬合模型分析了環(huán)境因素對(duì)二者的影響.有鑒于此,本文將提取新疆草地、林地、耕地作為研究區(qū),充分利用長(zhǎng)時(shí)間序列遙感產(chǎn)品的快速更新與優(yōu)化這一優(yōu)勢(shì),基于多種遙感參量及環(huán)境因素,通過對(duì)比隨機(jī)森林和探索性回歸分析結(jié)果,探討新疆地區(qū)鳥類與哺乳動(dòng)物多樣性與其影響因素間的關(guān)系,以期為該地區(qū)的生物多樣性保護(hù)提供科學(xué)的決策依據(jù).
1.1.1 物種分布數(shù)據(jù) 新疆地區(qū)鳥類和哺乳動(dòng)物物種分布數(shù)據(jù)源于李利平等人的研究成果,該數(shù)據(jù)根據(jù)《新疆鳥類名錄》[2]和《新疆哺乳類(獸綱)名錄》[3]中的物種實(shí)際分布范圍,經(jīng)數(shù)字化并投影轉(zhuǎn)換到WGS-84 大地坐標(biāo)系中得到10km×10km 物種分布矢量數(shù)據(jù),見圖1.屬性表包括網(wǎng)格中心坐標(biāo)、面積及鳥類與哺乳動(dòng)物的種數(shù)和科數(shù)等專題信息,如表1.由于后續(xù)分析采用的數(shù)據(jù)結(jié)構(gòu)為柵格數(shù)據(jù),故將物種分布矢量數(shù)據(jù)轉(zhuǎn)換為柵格格式.

圖1 新疆鳥類與哺乳動(dòng)物物種種數(shù)矢量網(wǎng)格Fig.1 Vector data of bird and mammal species in Xinjiang

表1 物種豐富度屬性表數(shù)據(jù)項(xiàng)示例Table 1 Examples of data in the species richness attribute table
1.1.2 植被數(shù)據(jù) 大多數(shù)鳥類和哺乳動(dòng)物偏向生活在有植被覆蓋的區(qū)域,故本文重點(diǎn)研究草地、林地和耕地等生境.因目前的植被指數(shù)已有大約40 多種,而歸一化植被指數(shù)(NDVI)、增強(qiáng)型植被指數(shù)(EVI)是最能直接反映植被覆蓋的遙感信息,除此之外本文還增加了葉面積指數(shù)(LAI)、光合有效輻射吸收比(FAPAR)和凈初級(jí)生產(chǎn)力(NPP)等能夠間接反映植被生長(zhǎng)狀態(tài)的因子,且這些因子不僅能夠直接反映動(dòng)物生境中植被群落在自然環(huán)境條件下的生產(chǎn)能力,表征陸地生態(tài)系統(tǒng)的質(zhì)量狀況,而且是判定生態(tài)系統(tǒng)碳源/匯和調(diào)節(jié)生態(tài)過程的主要因子.
NDVI 和NPP 源于中國(guó)科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心云平臺(tái)(http://www.resdc.cn/Default.aspx),NDVI 是對(duì)SPOT/VEGETATION 采用最大值合成法生成的1998 年以來的月度數(shù)據(jù).NPP 是基于光能利用率模型GLM_PEM 計(jì)算得到的2000~2010 年年度數(shù)據(jù),空間分辨率均為1km.
EVI 來自美國(guó)國(guó)家航空航天局(NASA)LP DAAC 數(shù)據(jù)集中2001~2010 年MODIS/Terra 數(shù)據(jù)產(chǎn)品MOD13A3,為月度1km 空間分辨率3 級(jí)正弦曲線投影產(chǎn)品.
LAI 和FAPAR 源于國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)中心(http://www.geodata.cn)平臺(tái)中GLASS 全球陸表特征參量產(chǎn)品LAI_modis 和FAPAR_modis 數(shù)據(jù)集,時(shí)、空分辨率為8d 和1km.
1.1.3 地形和氣候數(shù)據(jù) 全世界生存高度最高的哺乳動(dòng)物牦牛多在3000~5000m 的高寒地區(qū)生活,爬高極限可達(dá)6400m[12-13],可見海拔高度也是重要的生境因素之一,本文數(shù)字高程模型(DEM)為雷達(dá)地形測(cè)繪SRTM(Shuttle Radar Topography Mission)90m 分辨率的數(shù)據(jù).
氣候是動(dòng)物生境選擇的重要因素,如駱駝的特殊生理結(jié)構(gòu)使其具有很強(qiáng)的蓄水能力并適應(yīng)在熾熱的沙漠中行走[14],全球變暖使得鳥類的地理分布范圍向高緯度高海拔遷移[15-17].因此,本文選取溫度和降水作為生境的氣候因子,將資源環(huán)境數(shù)據(jù)云平臺(tái)的氣象站點(diǎn)監(jiān)測(cè)數(shù)據(jù)通過空間插值處理成2001~2010 年年均氣溫和年降水量連續(xù)分布數(shù)據(jù).
1.1.4 輔助數(shù)據(jù) 人類對(duì)物種豐富度具有正向影響和負(fù)面影響兩種,正向影響體現(xiàn)在人類所建立的自然保護(hù)區(qū)對(duì)物種多樣性的促進(jìn)作用,負(fù)面影響則通過對(duì)土地的開發(fā)利用而破壞物種棲息地產(chǎn)生.兩類數(shù)據(jù)中,自然保護(hù)區(qū)點(diǎn)位源于相關(guān)資料和文獻(xiàn)整理,2010 年1km 土地利用/土地覆蓋變化數(shù)據(jù)源自中科院中國(guó)土地利用遙感監(jiān)測(cè)數(shù)據(jù)庫(kù),均作為輔助數(shù)據(jù)對(duì)物種豐富度空間分布作解釋說明.
1.2.1 趨勢(shì)分析法 植被生長(zhǎng)是長(zhǎng)時(shí)間的累積過程,依據(jù)一個(gè)時(shí)間點(diǎn)的數(shù)據(jù)進(jìn)行評(píng)價(jià)的結(jié)果不夠準(zhǔn)確,通過長(zhǎng)時(shí)間序列數(shù)據(jù)得到特定時(shí)間段內(nèi)的綜合植被生長(zhǎng)狀態(tài)顯然更接近實(shí)際.夏季是植被的生長(zhǎng)季,也是動(dòng)植物種群最豐富的時(shí)期,已有相關(guān)研究表明,夏季(7~9 月)的遙感植被參數(shù)累積量能很好地代表新疆地區(qū)植被的空間分布格局,且與物種數(shù)量相關(guān)性最高[18-19].因此采用最大值合成法計(jì)算長(zhǎng)時(shí)間序列的年夏季累積量,公式如下:

式中:Ci表示i 年夏季累積量,MAX[Cj]為第j 月內(nèi)的月最大值.通過采用k 值趨勢(shì)分析法,逐像元對(duì)植被覆蓋的時(shí)間序列變化趨勢(shì)進(jìn)行分析[20].公式為:

式中:n 為研究期年數(shù),變化率k>0.001 表示改善趨勢(shì),-0.001≤k≤0.001 表示基本不變,k<-0.001 表示退化趨勢(shì).
1.2.2 隨機(jī)森林法(Random Forest, RF) 20 世紀(jì)80 年代Breiman 等[21]基于bagging 的思想提出了分類樹的算法,通過數(shù)據(jù)的多次分類與回歸,計(jì)算量得到降低.2001 年Breiman 把分類樹組合成隨機(jī)森林,通過自助法(bootstrap)重采樣技術(shù),從原始訓(xùn)練樣本集N 中,多次且有放回地隨機(jī)抽取n 個(gè)樣本,生成新的決策樹訓(xùn)練樣本集,再根據(jù)上述步驟生成m 棵決策樹并建立隨機(jī)森林,新的分類結(jié)果由分類樹的投票數(shù)所得分?jǐn)?shù)決定,其實(shí)質(zhì)是對(duì)決策樹算法的改進(jìn)[22].
作為一種新興且高度靈活的機(jī)器學(xué)習(xí)算法,RF 無需降維即能處理高維空間數(shù)據(jù)集,除了擬合變量間的關(guān)系外,對(duì)數(shù)據(jù)量綱和共線也不敏感,無需進(jìn)行歸一化、診斷、剔除等操作,而是將所有解釋變量全部輸入,通過比較某個(gè)變量在加入噪聲前后的模型OOB(袋外數(shù)據(jù))擬合誤差來判定該變量的重要性及其對(duì)模型的影響,若OOB 誤差下降大,說明該變量對(duì)模型貢獻(xiàn)也大,即重要性較高[23-24].模型最初主要通過R 語(yǔ)言中的隨機(jī)森林包實(shí)現(xiàn)[25],2019 年ArcGIS Pro 在其2.3 版本中增加了此功能模塊,既可對(duì)采樣點(diǎn)數(shù)據(jù)建模,也可對(duì)矢量或柵格數(shù)據(jù)建模,通過加入相應(yīng)的柵格或矢量變量可直接獲得預(yù)測(cè)結(jié)果的空間分布,比在編程中實(shí)現(xiàn)更加便捷、高效.
1.2.3 探索性回歸分析(Exploratory regression analysis, ERA)20 世紀(jì) 30 年代瑞典心理學(xué)家Thurstone[26]提出多因子分析理論,并在《心智向量》中系統(tǒng)闡述了多元分析的數(shù)學(xué)理論和邏輯基礎(chǔ).因子分析分為驗(yàn)證性和探索性兩類,探索性回歸分析能對(duì)輸入的候選變量間所有可能模型進(jìn)行評(píng)估,以尋找能最好解釋因變量的OLS 模型.建模前對(duì)所有因子進(jìn)行共線性診斷,診斷報(bào)告中方差膨脹因子值(VIF)用于度量變量的冗余度,并判斷不削弱模型解釋力時(shí)要剔除的變量;沖突值表示變量間的信息重疊度,0 表示無信息冗余;協(xié)變量表示與因變量線性相關(guān)并和其他自變量存在信息冗余的變量,應(yīng)予以剔除或控制.若兩個(gè)以上的VIF 值超過5.0,則根據(jù)VIF 值和沖突值大小剔除一個(gè)變量并重新建立OLS,直到冗余消失.因此基于以上參數(shù)剔除冗余變量,并對(duì)剩余變量進(jìn)行空間關(guān)系建模,既簡(jiǎn)化了模型又提高了精度.同時(shí),還可根據(jù)AIC 信息量準(zhǔn)則衡量模型的擬合優(yōu)度及復(fù)雜性,從而篩選出更精確的關(guān)系模型,經(jīng)精度檢驗(yàn)和綜合分析,生成標(biāo)準(zhǔn)殘差報(bào)告以驗(yàn)證結(jié)果的精度并得出結(jié)論.以上過程在ArcGIS Pro中實(shí)現(xiàn).
2.1.1 植被因子的時(shí)空特征 從土地利用中提取植被覆蓋區(qū),基于最大值合成法得到各植被因子逐年夏季累積值,運(yùn)用k 值趨勢(shì)分析法,得到各植被因子的空間變化及統(tǒng)計(jì)結(jié)果見圖2 和表2.

圖2 2001~2010 年植被覆蓋地區(qū)植被因子變化空間特征Fig.2 Spatial characteristics of vegetation factor changes in vegetation covered areas from 2001 to 2010

表2 2001~2010 年各植被因子變化統(tǒng)計(jì)(%)Table 2 Variation of vegetation factors from 2001 to 2010(%)
各植被因子的綜合變化率顯示,改善區(qū)域主要在天山北坡、塔里木盆地西部綠洲以及南部山地.植被生長(zhǎng)主要受水分和熱量影響,天山以北的準(zhǔn)噶爾盆地未完全封閉,氣流進(jìn)入形成地形雨,而南部的塔里木盆地被天山和昆侖山包圍而閉合,因而天山北坡降水多于南坡且植被條件易于改善,而南坡則因水分缺乏而不利森林生長(zhǎng).塔克拉瑪干沙漠附近人工綠洲面積有所增加,植被以改善和基本不變?yōu)橹?
阿爾泰山區(qū)、伊犁河附近、天山西段、塔城等地區(qū)植被呈退化趨勢(shì).相關(guān)研究表明,北疆準(zhǔn)噶爾盆地內(nèi)部的古爾班通古特沙漠中,固定半固定沙丘活化面積不斷擴(kuò)大,沙漠邊緣的流沙不斷向綠洲擴(kuò)展27].南疆各植被因子的變化差異明顯,總體上紅色退化區(qū)域較少,以基本不變和改善為主,說明生態(tài)環(huán)境保持良好,這與其他學(xué)者監(jiān)測(cè)的新疆植被動(dòng)態(tài)變化結(jié)果比較一致[20].
可見,2001~2010 年間大部分的植被覆蓋區(qū)NDVI 和EVI 均有變化,或改善或退化,無變化的區(qū)域極少,LAI 以退化和基本不變?yōu)橹?而FAPAR、NPP則三種變化普遍存在.北部與西北部雖資源豐富且自然保護(hù)區(qū)較多,但眾多的特色產(chǎn)業(yè)和旅游業(yè)等人類活動(dòng)干擾也較強(qiáng),植被退化趨勢(shì)明顯.西南部的帕米爾高原-昆侖山區(qū),FAPAR 與NPP 以改善和基本不變?yōu)橹?LAI 值卻有所降低,同一區(qū)域不同因子呈反向變化,進(jìn)一步說明單因子不能很好地解釋自然生境的變化趨勢(shì).
2.1.2 地形和氣候特征 新疆高差較大,常用的高程劃分標(biāo)準(zhǔn)難以詳細(xì)表達(dá)其內(nèi)部的地形差異,因此本文參考有關(guān)新疆地形特征的研究結(jié)果進(jìn)行劃分28],見圖3(a).此外,將無植被區(qū)設(shè)為空值(Null),提取植被覆蓋區(qū)域的年降水量(MAP)和年均氣溫(MAT),結(jié)果見圖3(b)和3(c).

圖3 新疆海拔分區(qū)以及植被覆蓋區(qū)域2010 年年降水量與年均溫空間分布Fig.3 Landform zoning and distribution of annual precipitation and average temperature in vegetation covered areas in 2010 of Xinjiang
可以看出,新疆地勢(shì)復(fù)雜,空間差異顯著,南疆高于北疆,西部高于東部.塔里木盆地、準(zhǔn)噶爾盆地和吐魯番盆地地勢(shì)較低.三大山脈中阿爾泰山相對(duì)較低,天山部分山段海拔超過4000m,昆侖山大部分為4000m以上[29].由于海拔和氣溫及降水的高相關(guān)性,氣溫和降水的空間差異也十分顯著,降水量北疆多于南疆,西部多于東部,山區(qū)多于盆地,盆地區(qū)由外向內(nèi)干旱高溫加劇,南疆氣溫高于北疆,盆地高于山區(qū)[30].

圖4 新疆地區(qū)自然保護(hù)區(qū)與人類活動(dòng)Fig.4 Natural reserves and human activities in Xinjiang
2.1.3 人類活動(dòng)空間特征 將現(xiàn)有15 個(gè)國(guó)家級(jí)和29 個(gè)自治區(qū)級(jí)自然保護(hù)區(qū)視為人類活動(dòng)的正向影響區(qū),將城鎮(zhèn)、居民點(diǎn)和其他建設(shè)用地作為負(fù)面影響區(qū),得到人類活動(dòng)的空間分布,見圖4.
國(guó)家級(jí)自然保護(hù)區(qū)集中分布在西北部的北屯、塔城和伊犁等地,自治區(qū)級(jí)則比較分散.人類活動(dòng)區(qū)域很小,且北疆多于南疆,人類活動(dòng)集中的區(qū)域一般保護(hù)區(qū)也較少,兩者僅有部分重疊.
2.2.1 隨機(jī)森林的棵數(shù) 為保證模型精度,建模前要判 定構(gòu)建森林的最佳決策樹棵數(shù).對(duì)于每個(gè)決策樹模型,假設(shè)訓(xùn)練樣本的特征數(shù)為m(本研究為8個(gè)環(huán)境因子),每次分類時(shí)根據(jù)信息增益選擇最好的特征進(jìn)行分裂.每棵決策樹的生成都需要自助采樣,余下 1/3 的數(shù)據(jù)未被選中,稱為袋外數(shù)據(jù)(OOB,out-of-ag),OOB 誤差斜率越小則表明決策樹棵數(shù)越理想,因此根據(jù)OOB 誤差確定最佳決策樹棵數(shù),分別在草地、林地和耕地生境中建模,結(jié)果見圖5.
鳥類和哺乳動(dòng)物在草地和耕地生境中,誤差變化有一定規(guī)律,決策樹在600 棵左右趨于平穩(wěn),林地生境中,鳥類和哺乳類動(dòng)物分別在700 棵和500 棵左右趨于穩(wěn)定.

圖5 袋外數(shù)據(jù)(OOB)誤差隨決策樹棵數(shù)的變化Fig.5 OOB changes with decision tree
2.2.2 環(huán)境因子重要性評(píng)估 將鳥類與哺乳動(dòng)物物種豐富度作為因變量,輸入8 個(gè)環(huán)境解釋變量,在ArcGIS Pro 中運(yùn)行隨機(jī)森林分類與回歸模塊,生成不同生境中各環(huán)境因子的重要性排序,見圖6.
鳥類在草地與耕地生境中各因子的重要性差異較大,在林地中則較小,這與鳥類更偏好森林生境有關(guān).三種生境中DEM 的重要性排序均較高,說明鳥類飛行高度對(duì)其生境選擇十分重要,在草地生境中最高為38.38%,遠(yuǎn)高于其他因子,表明新疆的草地分布高度與鳥類多樣性密切相關(guān).耕地生境中,年均溫最重要,葉面積指數(shù)影響最小,除氣候和地形外,各植被因子的重要性基本一致,表明耕地已成為鳥類重要的生境,能夠?yàn)槠涮峁┴S富的食物來源.

圖6 不同生境中影響鳥類(左)與哺乳動(dòng)物(右)豐富度的環(huán)境因子重要性排序Fig.6 The importance of determinants affecting the birds (left) and mammals (right) species richness in different habitats
對(duì)于哺乳動(dòng)物,各因子在三種生境中的作用差異顯著,氣候和地形在三種生境中的重要性均較高,以年均溫為最高,說明氣候?qū)Σ溉閯?dòng)物的生境選擇十分重要.草地生境中的年均溫最重要,年降水量次之,凈初級(jí)生產(chǎn)力重要性最低.林地生境中,EVI 有所提高,NPP 仍然最低,說明植被覆蓋度比凈初級(jí)生產(chǎn)力對(duì)哺乳動(dòng)物更重要.耕地生境中,年均溫度影響最大,葉面積指數(shù)最小,與鳥類相似的是,各植被因子的重要性也相對(duì)均勻,表明哺乳動(dòng)物在耕地生境中更看重氣候而非植被生長(zhǎng)情況.
2.3.1 環(huán)境因子的多重共線性診斷 以物種豐富度為因變量,輸入全部環(huán)境因子后得到不同生境中的共線性診斷結(jié)果,見表3.

表3 不同生境中的多重共線性診斷結(jié)果Table 3 Multicollinearity diagnosis results in different habitats

續(xù)表3
若兩個(gè)以上的VIF 值超過5.0,則根據(jù)VIF 值和沖突值大小剔除一個(gè)變量并重新建立模型,直到冗余消失.由表3 可見,草地和林地生境中,EVI、LAI 和NDVI 都產(chǎn)生了協(xié)變量,存在多重共線性,根據(jù)VIF 和沖突值依次剔除EVI 和LAI,剩余6 個(gè)解釋因子.耕地生境中,EVI 與LAI 存在共線性,故將EVI 剔除.
2.3.2 物種豐富度與環(huán)境因子的關(guān)系模型 多重共線處理后,對(duì)基于保留因子所建立的所有模型,依據(jù)AIC 信息量準(zhǔn)則進(jìn)一步篩選出不同生境中的最優(yōu)解釋模型,結(jié)果見表4.
可見,三種生境中鳥類和哺乳動(dòng)物的最優(yōu)模型及其影響因子均不同,由此也證明分別建立回歸模型的必要性.所有最優(yōu)模型的解釋力均在50%以上,耕地對(duì)于鳥類、林地對(duì)于哺乳動(dòng)物的模型解釋力最高,分別為69.9%和68.9%.
鳥類的三種生境模型均保留了FAPAR,說明植被生長(zhǎng)狀態(tài)與能量轉(zhuǎn)換能力對(duì)鳥類多樣性十分重要.草地中的鳥類受飛行高度限制,海拔是主要影響因子,NPP 次之.林地生境模型僅MAT、NPP 和FAPAR 三個(gè)變量,說明森林的溫度調(diào)節(jié)、植被覆蓋和能量轉(zhuǎn)換對(duì)鳥類豐富度具有重要意義.耕地因其作物種植而吸引鳥類棲息,故NPP 最具解釋力.此外,在草地和耕地生境中,年均溫的解釋能力均為負(fù)值,說明這兩類生境中溫度越高,鳥類豐富度越低.
有別于鳥類,哺乳動(dòng)物的三種生境模型均保留了MAT、MAP 和DEM 三個(gè)變量,說明氣候和地形是哺乳動(dòng)物多樣性的重要環(huán)境因子,且氣候的解釋力最強(qiáng).草地和耕地生境中年均溫的解釋力最強(qiáng),林地因其所具有的溫度調(diào)節(jié)作用,年降水量的解釋力最強(qiáng),且NPP 未被保留,說明植被的能量轉(zhuǎn)換能力弱于其他因素的影響,NDVI 的保留說明植被覆蓋度對(duì)哺乳動(dòng)物豐富度的影響更大.

表4 基于AIC 準(zhǔn)則得到的物種豐富度解釋模型Table 4 Interpretation model of species richness based on AIC
將隨機(jī)森林(RF)的因子重要性排序與探索性回歸分析(ERA)篩選的變量及最優(yōu)解釋模型進(jìn)行對(duì)比,以綜合評(píng)估影響鳥類和哺乳動(dòng)物豐富度的重要因子,三種生境中各因子的對(duì)比見表5.
鳥類在三種生境的模型中除NPP 外,其余因子的模型解釋力與RF 的重要性排序一致,表明保留因子的解釋力與重要性排序的差異可接受.NPP 和FAPAR 的重要性排序不靠前,但在回歸模型中均被保留,表明NPP 是鳥類物種豐富度差異的重要影響因素.草地生境中,海拔既是鳥類生境選擇的重要變量又是模型解釋力最強(qiáng)的變量,是影響鳥類豐富度的重要因子,這與生態(tài)學(xué)中鳥類棲息環(huán)境的海拔高度取決于其飛行高度的能力是一致的,不同的海拔高度適宜生存的鳥類種群及其數(shù)量不同,高海拔環(huán)境尤其是低氧與高寒迫使該區(qū)域鳥類具有較強(qiáng)的攜氧與能量代謝能力,以應(yīng)對(duì)缺氧環(huán)境,并在低溫環(huán)境中維持正常生命活動(dòng)[31-33].林地生境中,回歸模型未保留DEM,年均溫是最具解釋力的變量,兩種結(jié)果完全相反,說明林地的海拔高度對(duì)鳥類生存固然重要,但其內(nèi)部的溫度差異更能解釋其中的鳥類豐富度.由于人類活動(dòng)的亂砍亂伐,導(dǎo)致棲息地破碎化,全世界4000 多個(gè)物種的統(tǒng)計(jì)顯示,大約一半的物種正在經(jīng)歷生存區(qū)域的變化,向上并向兩極移動(dòng),以適應(yīng)全球變暖的趨勢(shì),然而向高海拔高緯度遷徙的鳥類需要尋找適宜自己生存的溫度環(huán)境,在高海拔林地的高寒環(huán)境中,生存的鳥類必須具備較強(qiáng)的耐寒能力,故森林內(nèi)部的溫度是鳥類生境選擇的重要因素[33-34].耕地模型中保留了前5 個(gè)因子,最具解釋力的是NPP,說明植被的能量創(chuàng)造力是表征耕地質(zhì)量好壞的典型特征值,直接影響鳥類是否選擇在其中生存.

表5 不同生境中影響物種豐富度的因子對(duì)比Table 5 Comparison of factors affecting species richness in different habitats
對(duì)于哺乳動(dòng)物,RF 重要性前三的MAT、MAP和DEM 也均保留在回歸模型中,說明氣候和海拔是影響哺乳動(dòng)物豐富度的重要因子.草地生境中,回歸模型篩選出的DEM 和NDVI 解釋力與RF 的重要性排序變換了位次,其余因子排序未變.林地生境中出現(xiàn)MAP 和MAT 的解釋能力排序交換.耕地與草地生境中的回歸模型相似,保留的DEM 和NPP 的重要性排序與回歸模型也發(fā)生交換,但兩種方法均顯示了年均溫、年降水量和海拔高度是哺乳動(dòng)物豐富度差異的重要解釋因子.這意味著在全球氣候變暖的大背景下,氣候變化改變著動(dòng)物的棲息環(huán)境,并在全國(guó)乃至全球范圍內(nèi)重新分配物種,導(dǎo)致許多物種瀕臨滅絕.
2.5.1 隨機(jī)森林模型的精度 ArcGIS Pro 建模時(shí)即會(huì)生成訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)的精度報(bào)告,除標(biāo)準(zhǔn)誤差(SE)外,還生成判定假設(shè)檢驗(yàn)結(jié)果的P 值,以及表示模型擬合程度的R2,R2越接近1 說明回歸直線對(duì)觀測(cè)值的擬合程度越好,越接近0 表示越差,精度評(píng)價(jià)結(jié)果見表6.
可見,基于前述決策樹棵數(shù)建立的模型中,在P值小于0.01的情況下,R2均大于0.7,表示模型擬合程度很好,SE 均小于0.1,表示誤差在可接受范圍內(nèi),實(shí)驗(yàn)結(jié)果具有顯著統(tǒng)計(jì)學(xué)意義.

表6 鳥類和哺乳動(dòng)物在不同生境下的隨機(jī)森林模型精度驗(yàn)證Table 6 Accuracy verification of random forest models of birds and mammals in different habitats
2.5.2 探索性回歸關(guān)系模型檢驗(yàn) 殘差是對(duì)實(shí)際觀察值與回歸估計(jì)值差異程度的一種評(píng)價(jià),若某一實(shí)驗(yàn)點(diǎn)的標(biāo)準(zhǔn)化殘差(SR)落在(-2,2)區(qū)間以外,表示可在95%置信度下將其判為異常實(shí)驗(yàn)點(diǎn),也就是說當(dāng)大約95%的標(biāo)準(zhǔn)化殘差在(-2,2)區(qū)間以內(nèi),誤差項(xiàng)基本服從正態(tài)分布,研究結(jié)果可信度較高.分別計(jì)算并繪制鳥類和哺乳動(dòng)物在三種生境中的殘差圖,見圖7.

圖7 鳥類(上)與哺乳動(dòng)物(下)三種生境模型的標(biāo)準(zhǔn)殘差Fig.7 Standard residual of models in three habitat for birds (top) and mammals (bottom)
鳥類和哺乳動(dòng)物在草地生境中的殘差均值小于眾數(shù),標(biāo)準(zhǔn)殘差圖呈峰值右偏的負(fù)偏態(tài)分布.鳥類在耕地生境中,存在兩個(gè)殘差眾數(shù),標(biāo)準(zhǔn)殘差呈雙峰分布.各模型的標(biāo)準(zhǔn)殘差在(-2,2)區(qū)間外的異常試驗(yàn)點(diǎn)均低于5%,且殘差項(xiàng)基本服從標(biāo)準(zhǔn)正態(tài)分布,說明所建回歸模型的誤差可接受.
本研究通過建立隨機(jī)森林的重要性評(píng)估模型和探索性回歸模型,可以在多個(gè)影響新疆地區(qū)鳥類與哺乳動(dòng)物物種豐富度的因素中識(shí)別出較重要的因子,不僅充實(shí)了生物多樣性研究方法,也提升了研究精度.水域不僅能夠?yàn)閯?dòng)物提供良好的適宜環(huán)境,也能提供必要的機(jī)體能量,針對(duì)新疆地域遼闊、地貌類型多樣的特點(diǎn),在今后的研究中可考慮水體面積對(duì)物種豐富度空間分布的影響,采用空間格網(wǎng)化后的柵格數(shù)據(jù),提取植被覆蓋區(qū)的各項(xiàng)環(huán)境因子,可深入分析鳥類和哺乳動(dòng)物在不同生境中的多樣性差異及主要影響因子.由于不同數(shù)據(jù)的空間尺度不同,本文在進(jìn)行多源數(shù)據(jù)融合的同時(shí),將環(huán)境因子數(shù)據(jù)進(jìn)行了重采樣的升尺度變換,平滑了空間差異性,從而降低了數(shù)據(jù)精度,雖然對(duì)于鳥類和哺乳動(dòng)物在種數(shù)層面的差異研究仍然比較有效,但勢(shì)必對(duì)研究結(jié)論產(chǎn)生一定影響.因此,在不同尺度層面上,對(duì)物種豐富度進(jìn)行相關(guān)研究,探討尺度變換對(duì)結(jié)果精度的影響值得后續(xù)深入研究.