秦進春,張 麗,吳萬全
1.西安測繪研究所,陜西 西安,710054;2.地理信息工程國家重點實驗室,陜西 西安,710054;3.第三測繪導航基地,新疆 烏魯木齊,830002
?
基于加權高光譜植被指數的植被分類提取方法
秦進春1,2,張麗1,2,吳萬全3
1.西安測繪研究所,陜西 西安,710054;2.地理信息工程國家重點實驗室,陜西 西安,710054;3.第三測繪導航基地,新疆 烏魯木齊,830002
針對常見植被指數不能很好地降低非植被地物對植被分類提取的影響,設計了一種基于植被光譜特征的加權高光譜植被指數,并提出了一種基于加權高光譜植被指數的植被分類提取方案。先利用加權高光譜植被指數對植被信息進行提取,得到較為完整的植被分布信息,再利用典型分類算法進行植被分類,實驗結果表明,本文提出的方案能夠有效降低非植被地物的影響,提高植被分類提取的精度。
高光譜影像;光譜特征;加權高光譜植被指數;植被分類提取
植被研究的重要性不僅僅體現于它在地球生態系統中,甚至物質與能量交換過程里所扮演的重要角色[1],而且,它更是農業、生態學以及氣象等領域的重要研究對象。因此,對植被的生物和物理特性進行準確估計是十分必要的。典型高光譜影像分類方法在植被分類提取時,分類提取結果容易受到土壤等非植被地物的影響,分類提取精度不高,不利于對植被信息的進一步研究。因此,設計一種能夠降低甚至消除非植被地物對植被信息提取影響的分類提取方法變得非常必要。
植被指數以其計算簡單、效果明顯的優勢在遙感影像植被信息提取中得到了廣泛應用[2]。隨著高光譜遙感技術在植被研究領域應用的不斷深化,常規植被指數因其不能充分利用高光譜數據的光譜優勢,對光譜相似性較高的植被類型難以區分提取,已經適應不了高光譜植被分類提取的要求,因此,發展能夠充分利用高光譜數據優勢的高光譜植被指數,能夠解決這一問題。
本文以植被光譜特征分析為切入點,設計了一種能夠結合多個植被光譜特征波段的加權高光譜植被指數,并將該植被指數應用到高光譜影像植被信息提取中;在此基礎上,提出了基于加權高光譜植被指數的植被分類提取方法,即在加權高光譜植被指數提取植被信息后,再使用支持向量機(support vector machine,SVM)等典型分類方法對植被進行分類,從而最大限度地降低植被分類提取過程中非植被信息的影響。最后,通過對同一高光譜影像中植被信息的不同分類提取方法實驗,對比了典型分類提取方法與本文提出方法的提取效果差異。
2.1植被典型光譜特征分析
高光譜影像數據能夠獲取植被近乎連續的光譜曲線[3],其中就包含了能夠表達植被診斷性光譜特征的特征波段,結合植被理化特征和光譜曲線的幾何特點就能夠較好地確定植被典型光譜特征波段的位置,為建立各典型光譜特征波段之間的聯系打下基礎。
植被光譜曲線在不同的生長周期和環境下具有不同的光譜特征曲線,這里以綠色植被為例,對植被光譜曲線中的典型特征進行簡單分析。圖1展示的是美國宇航局建立的USGS典型地物光譜數據庫中的核桃樹光譜曲線。
從圖中曲線可以看出,在紅光波段到近紅外波段(0.68~0.75μm)范圍內,綠色植被葉面反射率由低到高形成一個反射“陡坡”,這是植被獨有的光譜反射特征,稱為“紅邊”特征,也是識別植被類型的重要依據[4]。通過植被光譜微分變換等光譜增強方法處理后[5],可以看到植被除了具有“紅邊”特征外,在藍光、綠光和紅光波段都有典型的特征變化,因此將這些特征抽象化到一條光譜曲線中,如圖1所示。A特征點為藍光吸收谷,是綠色植被在藍光波段的反射率最小值;B特征點為綠峰,是綠色植被光譜在綠波段的反射率最大值;C特征點是紅光吸收谷,是綠色植被光譜在紅光波段的反射率最小值;D特征點為近紅外波段高反射平臺起點。從圖中四個特征點的分布可以看出其基本代表了植被在可見光-近紅外波段范圍內的典型特征,能夠較為準確地描述植被光譜特征變化走向,并且不同植被在這四個點的位置關系比較穩定[6]。

圖1 核桃樹葉光譜曲線
2.2加權高光譜植被指數構建
通過對植被典型光譜特征的分析可知,高光譜影像數據中包含診斷性植被光譜特征的波段較多;而常規的寬波段植被指數只能對少數波段作簡單的線性關系處理,不能充分地利用高光譜數據中蘊含的植被診斷性光譜特征波段。通過分析寬波段植被指數的構建原理[7],可以發現植被指數都是建立在近紅外波段與紅光波段的反射率差異基礎上的,換言之就是在植被“紅邊”特征的基礎上做文章。而“紅邊”特征表現了植被獨特的內部結構所造成的光譜變化,同理可以將植被“藍邊”、“綠邊”等特征引入到高光譜植被指數中。
高光譜影像數據中每一個地物像元都可以提取出一條近乎連續的光譜曲線,上述四個植被光譜特征點就可以認為是植被光譜曲線上的四個離散點,因此假設高光譜植被指數與四個光譜點的光譜反射率呈線性關系,可以將植被指數表示為式(1)的形式,稱之為加權高光譜植被指數(Weighted Hyperspectral Vegetation Index,WHVI)。
WHVI=l1ρB+l2ρG+l3ρR+l4ρNIR
(1)
式中,ρB、ρG、ρR、ρNIR分別為藍光波段吸收谷、綠光波段反射峰、紅光波段吸收谷、近紅外波段高反射平臺起點處的光譜反射率。為了驗證提出的假設,需要尋找四個參數l1、l2、l3、l4與高光譜數據之間存在的定量關系,并且求解出這四個參數。對四個參數的確定原則應該是能夠突出植被在四個點位的光譜特征,擴大植被與土壤等非植被地物光譜的差異性。據此,結合原始光譜特征增強變換的相關知識,從變換特征中去尋找參數使得植被與非植被光譜差異擴大。

圖2 二階導數值與四個光譜位置的關系
在對植被微分光譜進行分析的過程中發現,圖2中的四個光譜位置點的二階導數與其吸收峰谷具有相關性。利用數據統計分析方法可以發現植被指數二階導數值與植被在四個點位的光譜特征呈正相關或者負相關關系。根據二階導數的性質,它能夠反映函數的凹凸性,在植被光譜曲線上就是反應其吸收谷和吸收峰。本文所選擇的四個光譜特征點所對應的二階導數值與其所處光譜曲線位置的關系為:在A和C點上二階導數值與其呈正相關關系,在B和D點上二階導數值與其呈負相關關系,并且這些相關性在一幅影像中是穩定的。
結合光譜微分知識,土壤的光譜曲線“峰”、“谷”特性較少,因此其導數曲線上的值均不大。而植被具有明顯的“峰”、“谷”特征,尤其是在紅邊位置附近其導數值為一個高峰,說明二階導數對土壤背景光譜具有較好的抑制效果,并且將A、B、C、D四個點位處二階導數的正負關系以權的形式賦給四個點的反射率值后,能進一步增大植被與非植被的光譜差異。因此,WHVI中四個參數可能與四個光譜位置點的二階導數值有近似的線性聯系,并且能夠增大植被光譜與土壤光譜之間的差異。經過多次試驗表明,以四個光譜位置點的二階導數值ρ″B、ρ″R、ρ″G、ρ″NIR代替相應參數進行植被提取,能夠取得較好的提取效果。可以得出WHVI的表達式為:
(2)

土壤等非植被地物對植被的分類提取會產生一定的影響[8],而WHVI能夠較好地從影像中提取出植被信息,從而最大限度地降低非植被地物對植被分類提取的影響。基于此,本文提出利用WHVI對高光譜影像數據中的植被信息進行提取,在得到比較完整的植被分布信息后,利用SVM等典型分類方法進行植被再分類提取,期望能夠最大限度地降低非植被信息對植被分類提取精度的影響。基于WHVI的植被分類提取方法流程如下圖所示。

圖3 基于WHVI的植被分類提取試驗流程
實驗中為了體現實驗效果,作如下設定和說明。首先,利用WHVI對高光譜數據進行預處理后,將非植被信息對應的高光譜像元的光譜值均設置為一個相等的值(實驗結果中顯示為黑色),這樣就大大簡化了非植被地物在分類提取中的數據量。其次,實驗只對算法整體分類提取精度和Kappa系數進行了計算,沒有計算每個類別的用戶分類精度。一方面是因為實驗中的高光譜影像數據沒有地面實測數據,而是以影像上采集的測試樣本作為比對標準;另一方面是因為在理論上利用植被指數提取前后植被測試樣本是沒有變化的,只有非植被地物在植被指數提取過后被歸屬到一個類別中,因此,計算每個植被類別的用戶分類提取精度并不能反映本文提出的植被分類提取方法的優越性,但是總體分類精度卻能很好地反映算法的性能以及對數據的適應性。最后,試驗結果中以“R”表示原始高光譜數據,“R-分類方法”表示直接利用原始高光譜數據進行植被分類提取的結果,“R-WHVI”表示原始高光譜數據經過加權高光譜植被指數提取的結果,“R-WHVI-分類方法”表示基于加權高光譜植被指數的植被分類提取的結果。
4.1實驗數據
實驗數據獲取區域為美國貝爾茨維爾地區(Beltsville,USA)的一片植被與農業交界處,影像拍攝于2010年6月,影像內主要的覆蓋物是植被與農作物[9]。根據Spec TIR公司在網站上提供的信息可以看出,該數據地面空間分辨率約為2.2m,獲取光譜范圍為390~2450nm,光譜分辨率為5nm。高光譜數據的大小為320像素×600像素,數據原始波段數為360個。該數據的假彩色圖像(R:101,G:57,B:35)和樣本分布如圖4所示,其樣本數量信息如表1所示。

(a)假彩色圖像 (b)樣本分布圖4 貝爾茨維爾高光譜數據假彩色圖像及樣本分布圖
表1貝爾茨維爾高光譜數據樣本信息

標號名稱數量標號名稱數量1森林3522密集農作物3023長勢農作物3594初生農作物3115裸土地2746陰影343
4.2基于WHVI的植被信息提取實驗
為了驗證本文提出的WHVI對高光譜植被提取的有效性,試驗選擇了目前使用比較廣泛的NDVI[10]、NDVI705[11]作為WHVI的對比試驗組。首先利用Landsat TM5濾波函數對高光譜數據進行卷積運算,得到具有6個波段的Landsat TM5多光譜數據,并且以第四個波段作為近紅外波段NIR,第三個波段作為紅光波段R構建NDVI。然后根據NDVI705的計算公式,找到高光譜數據里與波長0.705μm和0.750μm相對應的波段,根據實際波段情況構建NDVI705。利用上述三種植被指數對貝爾茨維爾高光譜數據進行植被提取試驗,得到提取結果如圖5所示。
從結果中可以看出,NDVI、NDVI705在一定程度上能夠消除土壤背景對植被的影響,但是在植被覆蓋密度較低時,植被信息提取效果就不理想,而WHVI能夠較好地克服土壤背景對植被的影響,對數據中橢圓標示的稀疏植被提取效果較好。此外,三種植被指數均能較好地將農田中的陰影提取出來,但是NDVI和NDVI705對森林中的部分陰影提取較差,WHVI的提取結果則更接近實際情況。因此,本文設計的WHVI能夠更好地適應高光譜數據,對高光譜數據的波段信息利用更加充分,提取結果也優于常規植被指數。通過實驗也發現幾個需要進一步研究的問題,首先,WHVI屬于經驗型植被指數,其建立過程是基于試驗分析與假設基礎上的,正確提取植被樣本光譜特征對WHVI的計算至關重要;其次,WHVI中四個二階導數加權值不是固定的,對不同的影像進行植被提取時,都需要計算每個像元光譜的二階導數值,使得WHVI的計算量比常規高光譜植被指數要大;最后,植被微分光譜對光譜噪聲較為敏感,因此在使用WHVI提取前需要對高光譜數據進行平滑去噪處理。

圖5 貝爾茨維爾高光譜數據植被提取結果
4.3基于WHVI的植被分類提取實驗

圖6 貝爾茨維爾高光譜數據植被分類提取結果
表2貝爾茨維爾高光譜數據植被分類提取精度比較

名稱SVM分類Fisher分類SAM分類R-總體分類精度(%)88.9191.8777.25R-Kappa系數0.87500.90260.7272R-WHVI-總體分類精度(%)92.2596.0382.77R-WHVI-Kappa系數0.90710.95830.7937
利用SVM、Fisher和SAM分類[12]等方法對原始高光譜數據和經過加權高光譜植被指數預處理后的數據進行植被分類提取,實驗結果表明,經過植被指數預處理后三種方法的總體分類精度均比未使用植被指數處理的分類精度高,分別提高了3.34%、4.16%和5.52%。從Kappa系數的分布可以看出,經過植被指數預處理后的分類提取效果要比未處理的分類提取效果要更加貼合實際。經過加權高光譜植被指數預處理后,植被邊緣更加清晰,對初生農作物、長勢農作物和密集農作物的區分也更加準確。
對植被信息進行準確的分類提取是植被研究的重要內容之一。本文在分析植被光譜特征的基礎上,設計了一種能夠更好地適應高光譜數據的加權高光譜植被指數。為了降低非植被地物對植被分類提取的影響,提出先利用植被指數對高光譜影像中植被要素進行提取,而后在提取基礎上利用SVM、Fisher和SAM等典型分類方法對植被進行再分類。該方法能夠降低非植被地物的影響,提高了植被分類提取精度。
[1]李小文.遙感原理與應用[M].北京:科學出版社,2008.
[2]田慶久,閡樣軍.植被指數研究進展[J].地球科學進展,1998,13(4):327-333.
[3]余旭初,馮伍法,楊國鵬等.高光譜影像分析與應用[M].北京:科學出版社,2013.
[4]聞兵工.地物光譜特征分析技術研究[D].鄭州:信息工程大學,2009.
[5]劉偉.基于光譜特征分析的匹配與分類技術研究[D].鄭州:信息工程大學,2008.
[6]譚倩,趙永超,童慶禧等.植被光譜維特征提取模型[J].遙感信息,2001(1):14-18.
[7]羅亞,徐建華,岳文澤.基于遙感影像的植被指數研究方法述評[J].生態科學,2005,24(1):75-79.
[8]Kauth R,Thomas G.The TasselledCap—a Graphic Description of the Spectral-temporal Development of Agricultural Crops as seen by Landsat[C].LARS Symposia, 1976:159.
[9]Beltsville[EB/OL].[2013-05-20].http://www.Spectir.com/free-data-samples.
[10]TuckerC.Red and Photographic Infrared Linear Combinations for Monitoring Vegetation[J].Remote Sensing of the Environment, 1979(8):127-150.
[11]Elvidge C, Chen Z.Comparison of Broad-band and Narrow-band Red and Near-infrared Vegetation Indices[J].Remote Sensing of Environment, 1995,54(1):38-48.
[12]童慶禧,張兵,鄭蘭芬.高光譜遙感——原理、技術與應用[M].北京:高等教育出版社,2006.
Vegetation Classification and Extraction Method Based on Weighted Hyperspectral Vegetation Index
Qin Jinchun1,2, Zhang Li1,2, Wu Wanquan3
1.Xi’an Research Institute of Surveying and Mapping, Xi'an 710054,China 2.State Key Laboratory of Geo-information Engineering, Xi’an 710054,China 3.The Third Surveying, Mapping & Navigation Base, Urumqi 830002,China
As the common vegetation index is not effective in reducing the impact of non-vegetation feature on vegetation classification and extraction, a weighted hyperspectral vegetation index is designed based on vegetation spectral characteristics. A vegetation classification and extraction method based on weighted hyperspectral vegetation index is proposed to reduce the impact of non-vegetation in the processing of vegetation classification. With this method, the index is used to extract vegetation from hyperspectral image at first, and then SVM classification algorithm is employed to classify vegetation. The results show that the method can effectively reduce the impact of non-vegetation on vegetation classification, and improve the overall classification and extraction accuracy.
hyperspectral image;spectral characteristic;weighted hyperspectral vegetation index(WHVI);vegetation classification and extraction
2015-08-18。
秦進春(1989—),男,研究實習員,主要從事高光譜影像應用技術研究。
P231
A