張姍



摘要:針對歸一化植被指數(NDVI)在國際和國內研究中的應用及與其他數據的結合情況,對NDVI在不同研究領域中的深化應用及研究的最新進展進行了簡要介紹。同時通過一些案例的分析,得到了NDVI數據與其他數據結合研究的基本思路和方法論,在研究現狀方面,基于當前較為普遍的相關性分析,做深入的研究與探討,在值檢驗方法方面。對NDVI在不同的研究方向中的值檢驗方法進行了簡要分析,主要涉及到的就是顯著性檢驗,最后結合研究現狀和NDVI的局限,對當前研究進行了總結,以對后續研究提供想法。
關鍵詞:歸一化植被指數;值檢驗;研究方法;數據結合及相關性分析
中圖分類號:Q948 文獻標識碼:A 文章編號:1674-9944(2019)20-0025-04
1引言
歸一化植被指數(NDVI),是反映植被覆蓋與植被分布的重要數據,通過對NDVI在時間序列上的變化進行分析,能夠較為準確地獲取植被覆蓋度、植被物候、植被分布區域的變化規律,對深入研究全球氣候閉環和陸地生態系統具有十分重要的意義。
目前,已有一些研究,利用NDVI指數對全球或者區域的植被變化進行研究,Tingxiang Liu等利用NDVI數據,研究了1982~2015年中國東北地區植被物候變化,殷剛等通過研究長時間序列下中亞地區的NDVI數據,得到全球變化下中亞地區植被覆蓋度的變化和影響因子的相關度,梁守真等利用2000~2009的ND-VI數據,研究了時間序列下環渤海地區植被的變化情況。對于當前NDVI的數據結合,現有研究多用氣候數據,主要分析植被變化與氣候因子的關系。
在值檢驗和擬合公式方面,主要涉及到P值檢驗和擬合公式,同時也會涉及部分適用于NDVI數據的數學模型(主要是植被物候模型),擬合公式方面主要會涉及到SLOPE公式和線性偏相關公式。從而多角度地分析NDVI的應用與研究現狀,為后續研究提供借鑒。
2NDVI的研究方法
2.1SLOPE公式與植被覆蓋度
當前NDVI的研究方向,主要在于3個方面,研究植被覆蓋度變化及影響因素,研究植被物候變化及變化規律,研究植被變化(覆蓋度,物候,垂直地帶性,區域分布)與影響因子的相關性。
關于植被覆蓋度變化的研究,其主要的研究方向在于基于長時間序列的研究區研究,或是基于大尺度研究區的研究,同時也存在兩者相結合的情況,其主要落腳點在動態監測和原因分析。當前的研究方法是基于SLOPE公式反映的NDVI數據的變化情況,對植被覆蓋度的變化進行分析:
式(1)中:SLOPEE為回歸方程斜率;z,y分別為年份和年均NDVI)i為計算期間年份序號;n為計算的總年份。如果SLOPE
SLOPE的變化強度實際上就是指SLOPE的SLOPFE,1982~2015年全球NDVI的SLOPE隨高程變化的規律圖(圖1)總體上反映的是NDVI的垂直分異規律,即海拔上升,植被覆蓋度總體呈下降趨勢,但這種垂直分異的明顯程度在不同時間段存在不同,就折線圖數據而言,SLOPE值呈現1982~2000年減小,2005~2015年增加的情況,說明了垂直分異存在“相對不明顯一相對明顯一相對不明顯”的趨勢,基于此趨勢可以進一步探究影響垂直分異明顯性變化的原因。
2.2物候擬合函數與植被物候變化
關于植被物候及物候變化規律的研究,研究方向主要是關于長時間序列的植被物候變化的研究,其主要研究數據為GIMMS NDVI數據,簡要研究流程:首先是基于GIMMS NDVI數據提取每一年年內NDVI變化情況,然后根據時間序列提取多年的NDVI變化曲線,再利用擬合函數模型對原始的NDVI變化曲線進行擬合,主要的擬合函數模型有Savitzky-Golay濾波模型,不對稱高斯函數模型和雙logistic函數模型,可以根據最優擬合模型進行選擇,也可以將3種函數值進行線性變換(求平均,權重求和),最后選擇適當的分析法進行分析,得出結論。關于函數擬合方面,由于當前的技術層面無法達到年內不間斷連續監測NDVI值,同時由于云量等問題,部分NDVI值會存在空缺或者錯誤,所以需要用擬合模型對原始數據進行擬合,針對3種常用的函數擬合模型,本文主要介紹雙logistic函數模型,其函數模型結構如下:
f(t)=c1+c2g(t;x) (2)
式(2)可以看成是f(t)=b+ax的初等線性函數式,在研究性論文描述“C1和C2決定了函數的基線和振幅”,其實質也可以從初等函數中反應出來,C1=6,表示函數向上或向下平移的距離,C2=a,表示函數的增減性質,g(t;x)是一個高斯型函數,近似于正態分布的圖像,整個函數的線性與非線性取決于g(t;x),由于其近似正態分布的函數曲線,導致c1決定其下限值高度,即所謂基準高度,C2決定其振幅大小,即增加時增加的幅度,和減少時減少的幅度,這兩個幅度決定了函數的一個極值到基準線的垂直距離,即振幅;g(t;x)在雙logistic函數模型中其函數結構為:
2.3偏相關系數與相關性分析
關于植被變化及影響因子相關性的研究,在當前的研究中,主要涉及到的是氣候因子對于植被覆蓋度變化的研究,其研究一般思路是,利用NDVI與其他數據進行偏相關系數計算,從而得到各個因子在植被變化過程中的偏相關系數,從而判定影響植被變化的多種因素中,每個因素所占的地位。相關性分析的一般流程是:提取需要計算偏相關系數的因子在研究區和研究時間內的數據,然后計算各數據與其他數據的相關系數,再利用相關系數計算一階偏相關系數,用一階偏相關系數計算二階偏相關系數,遞歸計算直至k階偏相關系數計算完成,最后根據影響研究參數的各因子,k階偏相關值的大小,說明影響該參數的因子在影響過程中所占的地位。相關系數計算公式如下:
表2顯示的是林冠層截留量與各影響因素的偏相關系數,由表中數據可以看出,林外降雨量與林冠層截留量有較大關系,其次是風速與相對濕度,與其他因素的關系較小。
2.4偏相關系數變化分析
通過偏相關系數在長時間序列上的研究,可以發現,偏相關系數在長時間序列上并不是固定不變的,而且諸多研究中都能找到這種實例,如圖2t61。
圖2中可以明顯看出NDVIGS(GS is Growing sea-sons)和GT(GT is Growing temperature RNDVI-GT)的部分相關系數。在前15年和后15年有明顯的不同,同時從5個方面定義GS,發現偏相關系數都有明顯的降低,但是就研究而言,對于這種變化的原因研究的比較少,不僅僅需要從階段上來研究前后階段的變化,更應該從年際變化和年際變化反映的長時間序列的變化趨勢來研究,研究的簡要技術路線如圖3所示。
3顯著性檢驗與尺度轉換
3.1顯著性檢驗
顯著性檢驗,主要指利用擬合函數對不連續或者空缺值進行擬合假設時,需要檢驗擬合值與實際測量值的差異是否顯著,即擬合值與實際樣本的測量值間的差異,是擬合值的總體特征與實際測量值特征在根本上就不一致,還是擬合值與實測值之間的差異純屬機會變異。也就說,顯著性檢驗是檢驗數據反映真實情況程度的方法,常用的顯著性檢驗的方法是P值檢驗。
在NDVI的研究中很多涉及到P值檢驗的擬合計算,同時顯著性檢驗并不只是說明的是,數據值的大小,數據的變化趨勢,而是說明數據的可靠性,在對NDVI數據的研究中,往往涉及到植被的增長速率,植被的下降速率,植被的變化趨勢等問題,在大多數研究中,關于NDVI的這些結論,都利用了顯著性檢驗來檢驗擬合數據的可靠性,常用的P值界限有(0.01,0.05,0.1),當P>0.05或0.1時說明由數據得到的結論(如相關性,數據趨勢,數據增速)不顯著,當P<0.05或0.1時,說明由數據得到的結論顯著,但是并不是說沒有通過P值較小的顯著性檢驗的結論就不能使用或者說毫無價值:Gang Fu,Zhen xi Shen在研究修剪與氣溫變暖對青藏高原北部三大高寒草甸區植物生產力的影響時,得到了C區由于修剪造成的GPP下降14.4%的結論,該結論的P檢驗值只有0.082,遠大于0.001和0.005,但是在試探性研究中如果把P定為0.1,則在較高的P值下,該結論仍可以說明是顯著的。在NDVI與其他數據的相關性研究中,對于相關性的P檢驗則是說明兩組數據是否是顯著相關的,白建軍等在研究區域氣候因子與植被時空變化關系時,得到了植被月平均NDVI值和月降水量相關系數是0.808(n=132)P<0.001的結論,反映的是植被月平均NDVI值和月降水量相關系數的可靠性。由相關系數0.808顯著,可以得到植被月平均NDVI值和月降水量相關性較大的結論。
3.2尺度轉換
在研究NDVI數據與其他數據相關性時,常遇到數據尺度不一致的情況,在尺度由低分辨率向高分辨率轉化時,可以辦的方法是進行重采樣,再進行尺度轉換,在尺度上推時,選擇方法有很多:線性的方法可以選擇相鄰像元和求平均的方式,也可以選擇加權求和方式,進行尺度轉換,非線性的方式可以通過設立中間尺度,建立中間尺度與高低分辨率間的函數關系,由低分辨率向中間尺度轉換,再由中間尺度轉換到高分辨率,尺度轉換實例。
在研究中1982~2015年全球植被覆蓋的時空變化及其驅動因子時,NDVI數據分辨率為0.083度,氣象數據為0.25度,不能直接進行疊加運算。于是需要進行尺度轉換。此研究采用加權求和的方法將NDVI數據轉換至與氣象數據相同的尺度。轉換公式為:
4結論與討論
本文對NDVI的主要應用方向及研究方法進行了總結概括,深入探究了主要的NDVI研究方法及研究函數,研究結論實際上是一個NDVI數據的研究方法和研究思路,主要就有,植被覆蓋度對應的SLOPE函數研究,植被物候對應的雙logic函數模型研究,植被變化與其影響因子的相關性研究,偏相關系數的深入探討,顯著性檢驗和尺度轉換。關于NDVI數據其實也存在較大的局限性,NDVI公式為:
根據函數結構可以看出,NDVI是近紅外和紅波段的觀測數據進行非線性變換得到的,這種非線性變換對NDVI的低值部分數據來說是一種突出,對于高值部分來說是一種抑制,導致NDVI數據,在高值部分反應不靈敏,從而在對植被覆蓋度較高區域例如亞馬遜和剛果雨林的變化研究中,NDVI數據很少被采用。
如在研究熱帶雨林退化和碳儲量之間的關系時,Mohammed Alamgir等則使用的統計實測,在雨林中抽樣進行測量的方式進行研究,而非利用NDVI數據。同時在研究中非樹木覆蓋度的決定因素及敏感性時,Julie C.Aleman等使用分類型計算的方式,計算不同影響因子在模型中的相對重要性以及它們與植被覆蓋偏相關系數來量化每個預測因子的影響,在分析當前植被覆蓋分布及變化的同時,該研究基于數據,增加了對未來植被覆蓋度變化的預測,但該研究是從植被覆蓋度影響模型和MODIS three cover數據角度出發的。對于基于NDVI數據的植被覆蓋度及分布預測的深度研究還較少。最后基于大尺度長時間序列的NDVI變化及影響因子研究多考慮的是NDVI與其影響因子的線性相關性,但實際情況并不是所有影響因子與NDVI的關系都是簡單線性相關的,因此在非線性相關性方面還需要深入探究。