張富華,黃明祥,張 晶,包 鋼,包玉海
(1.首都師范大學,北京 100048;2.內蒙古師范大學,內蒙古呼和浩特 010022)
利用高光譜識別草地種類的研究
——以錫林郭勒草原為例
張富華1,黃明祥2,張 晶1,包 鋼2,包玉海2
(1.首都師范大學,北京 100048;2.內蒙古師范大學,內蒙古呼和浩特 010022)
以錫林郭勒草原典型的羊草、針茅、日陰菅、隱子草為研究對象,測量4種草地光譜,利用光譜微分法對原始光譜數據進行處理,在提取草地光譜7個特征參數的基礎上,采用相關性分析和主成分分析方法精選紅邊斜率、綠峰位置、綠峰值和紅谷位置4個參數。基于所選的4個光譜特征參數,采用多層感知神經網絡模型對草地種類進行識別,精度達到80.3%,同時對比7個特征參數與4個特征參數對草地種類識別精度的影響,發現草地種類識別精度從69.0%提高到80.3%。本研究可為大面積草地物種資源的遙感調查和監測提供科學依據。
高光譜;草地;種類;識別;神經網絡模型
草地是我國陸地上最大的生態系統,對發展畜牧業、保護生物多樣性、保持水土和維護生態平衡有著重大的作用和價值。正確地識別草地植被種類是草地資源利用保護和區域生物多樣性的研究的基礎和依據,現行的草地識別方法主要是依靠一些成本高、費時、費力的野外調查方法或利用大比例尺的航片來進行判讀。近年來高光譜遙感發展迅速,成為當前遙感技術的前沿領域。高光譜遙感可用于草地分類和生物量估測等研究[1],傳統的草地高光譜研究停留在對光譜反射特征的分析和比較[2],此統計分類方法缺乏伸縮性,難以處理大訓練集。近年來,神經網絡模型作為一種基于模式識別的數據挖掘技術,適宜于高維度的分類問題,具有較好的自適應能力,在多光譜遙感分類中得到廣泛應用[3-4]。
本文選取了錫林郭勒草原4種典型草地植被為研究對象,利用光譜微分、相關性分析、主成分分析提取光譜特征,并采用神經網絡算法進行草地種類識別。本研究可為航空航天草地類型識別和資源調查提供科學依據。
研究區草地植被采樣點選在東烏旗、烏拉蓋、蘇尼特右旗和錫林浩特市四地,研究對象為錫林郭勒草原的4種典型植被:羊草、針茅、日陰菅、隱子草。樣點研究區屬錫林郭勒草原,平均海拔1000 m左右,氣候呈明顯的溫帶大陸性特征。
1.采樣方法和數據處理
本研究采用美國ASD公司的FieldSpec-3便攜式光譜儀在研究區內隨機測量羊草、針茅、日陰菅、隱子草4種草地植被的高光譜。為去除測量系統誤差及不確定性因素的干擾,本研究利用ViewSpec Pro對野外實測的典型草地植物光譜數據進行預處理,包括去除野外獲取的有明顯錯誤的數據及反射率大于1和明顯低于正常值的數據、清除包含在信號內的少量噪聲、剔除水汽吸收波段[5]。經數據預處理后,共得到111個合格的樣本,其中羊草24個、針茅42個、日陰菅25個、隱子草20個。本研究僅保留了植物特征明顯且噪聲較小的350—1300 nm作為后續分析波段,4種草地植被的平均光譜反射率曲線如圖1所示。
2.高光譜特征提取與分析
高光譜數據包含的信息豐富,波段數量多,數據量大,如果直接用于分類,不僅會因計算量過大而導致分類過程耗時較長,增加后續分析的難度,也可能因引入噪聲而降低分類精度。提取植被頻譜波形特征(第一、二導數,峰,谷等)是降低數據維度、保留有用信息、提高分類精度、避免休斯現象的有效方法[6]。本研究首先計算光譜反射率在350—1300 nm內的一階微分[7-8],然后提取紅邊位置、紅邊斜率、紅邊面積、紅谷位置、紅谷值、綠峰位置和綠峰值7個光譜特征參數,并以此作為后續分析和應用的基礎。

圖1 錫林郭勒草原典型植被的反射光譜曲線
3.多層感知神經網絡模型
人工神經網絡是20世紀80年代中后期迅速發展起來的一個前沿領域,因其良好的預測性和實用性被廣泛應用于各個領域[9-10]。本研究采用SPSS Statistics 17.0的Neural Networks模塊構建了多層感知神經網絡分類模型,以4類草地植被類型為輸出,以提取的光譜特征參數為輸入,神經網絡模型的隱藏層數為1,隱藏層的節點個數為7,且其激活函數為雙曲正切函數,優化算法采用調整的共軛梯度法,輸出層的激活函數為Softmax,誤差函數為交叉熵。將111個光譜樣本分為2部分,81個作為訓練樣本,剩下30個作為測試樣本。
1.草地光譜特征分析
從4種草地光譜曲線(如圖1所示)可以看出,羊草的光譜反射率總體上高于其他3類植被光譜,尤其是在800—1300 nm和350—500 nm之間,羊草的反射率都明顯其他3類草地。針茅、日陰菅和隱子草光譜反射率較為一致,但日陰菅光譜在350—500 nm之間光譜反射率最低,而在1100—1300 nm之間,其反射率最高,日陰菅這一波譜特征較為明顯。而針茅和隱子草的光譜較為接近,尤其是在可見光范圍內,光譜差別較少,僅在近紅外隱子草較針茅光譜反射率大,但差距也不大。
為了進一步分析4類草地光譜的特征,對光譜數據進行一階微分處理后,分別提起了所選的7個特征參數,各特征參數的平均值、標準差和變異系數見表1。總體來看,紅邊、綠峰和紅谷位置變異系數小,而紅邊斜率、紅邊面積、綠峰值和紅谷值變異系數相對較大,其中紅谷值的變異系數總體來說最大,針茅的紅谷值變異系數達35.98%。盡管紅邊位置、綠峰位置和紅谷位置的變異系數總體不大,這也從側面印證了3個特征參數的波段值較為穩定,是植被光譜的特征性波段,同時也可以看出4種草地光譜之間對應的紅邊、綠峰和紅谷位置較為接近,其中就紅邊位置來看,羊草>針茅>隱子草>日陰菅,而針茅和日陰菅相差1 nm,差距最小。此外,羊草的紅邊斜率和綠峰值高于其他3種草地植被,日陰菅的紅邊斜率、綠峰值和紅谷值最低。

表1 特征參數的平均值、標準差、變異系數
2.草地光譜特征參量提取
為了進一步提取特征參數,降低用于草地種類光譜分類的維度,本研究對7個特征參數進行了相關分析和主成分分析,分析結果見表2、表3和表4。從相關系數矩陣(表2)可以看出,紅邊斜率與紅邊面積、綠峰值與紅谷值具有加強的相關性,其他變量間相關性不強,其中紅邊斜率與紅邊面積的相關系數達0.978,綠峰值與紅谷值的相關系數為0.802,都呈正相關。從主成分分析(表3)可以看出,前3個主分量累計貢獻就達85.13%,表4是提取的前3個主分的因素矩陣,從中可以看出紅邊斜率、紅邊面積和綠峰值主要構成了主成分1,綠峰值和紅谷值主要構成了主成分2,而成分3主要是由紅谷位置構成的,而紅邊位置對3個主分的貢獻率較低,分別只有0.434、-0.239和0.644。因此,通過相關性和主成分分析可以看出,所提取的7個特征參量中,紅邊斜率與紅邊面積、綠峰值與紅谷值之間的相關性較大,并且從構成前3個主分的特征變量來看,紅邊位置特征貢獻較小,為了降低應用光譜進行草地類別識別的維度,后續利用神經網絡進行草地種類光譜劃分時不再考慮紅邊面積、紅谷值和紅邊位置3個特征參量。

表2 相關系數矩陣

表3 方差分解主成分提取分析

表4 主成分矩陣
3.草地種類識別
根據草地光譜特征參量提取結果,以紅邊斜率、綠峰值、綠峰位置和紅谷位置4個變量為神經網絡的輸入,其分類結果見表5。從表中可以看出,訓練總體精度為80.20%,測試的總體精度達83.30%,測試和訓練精度較高、且較為平穩。在4種草地種類中,日陰菅的精度最高,測試樣本沒有錯分情況;羊草的訓練精度較低,而測試精度較高,精度較不穩定,主要錯分到針茅和日陰菅兩類;隱子草主要錯分到羊草和針茅;針茅主要錯分到了羊草。以上4類草地種類的識別精度分析可以看出,盡管特征參量的變異系數大,造成類間不易劃分,但由于神經網絡在自學習、自組織和自適應的優勢,基于神經網絡的草地種類識別總體精度較高。
同時,為了比較特征變量篩選對草地種類識別的影響,以最初所選的7個特征變量為輸入,神經網絡參數設置相同,訓練和測試樣本不變,其草地種類識別結果見表6。從表中可以看出,相比篩選后的4變量草地種類識別精度,訓練和測試精度都有所降低,其中訓練精度下降不多,測試精度從83.3%下降到69%,除了日陰菅的4變量訓練分類精度從80%升高到90%外,其他草地種類識別精度基本都是降低,而針茅識別精度相對穩定,精度降低很小,羊草和隱子草分類精度降低較大。從以上分析可以得出,總體來看,經過特征變量篩選后,通過去除變量間冗余信息量,能夠提高草種類識別精度,說明特征變量的篩選很重要,對后續分析和應用能產生影響,并不是變量越多越好。

表5 4個特征變量神經網絡分類結果

表6 7個特征變量神經網絡分類結果
本研究采集并分析了錫林郭勒草原羊草、針茅、日陰菅、隱子草的光譜特征,研究發現4種草地的光譜較為相似,其中羊草在800—1300 nm和350—500 nm間的光譜反射率高于其他3種草地光譜,日陰菅光譜在350—500 nm之間光譜反射率最低,在1100—1300 nm之間反射率最高。通過一階微分光譜提取了紅邊位置、紅邊斜率、紅邊面積、紅谷位置、紅谷值、綠峰位置和綠峰值7個草地特征參數,采用相關分析和主成分分析發現,紅邊斜率與紅邊面積、綠峰值與紅谷值之間的相關性較大,構成前3個主分量的特征變量來看,紅邊位置特征貢獻較小。根據光譜特征提取結果,以紅邊斜率、綠峰值、綠峰位置和紅谷位置作為神經網絡的輸入進行草地種類的識別,草地種類識別精度達83.30%,神經網絡作為數據挖掘的有效手段,能較好識別不同草地光譜,進而劃分出不同草地種類。本研究可為基于遙感技術開展錫林郭勒草原草地資源的植被分類、調查與動態監測等提供技術支撐。
[1] 吳建付,陳功,楊紅麗,等.利用高光譜技術進行草地地上生物量估測[J].草業與畜牧,2009(4):1-3.
[2] 楊紅飛,李建龍,穆少杰,等.新疆三種主要草地植被類型的高光譜反射特征研究[J].草業學報,2012,21 (6):258-266.
[3] 張友水,馮學智,阮仁宗,等.基于GIS的BP神經網絡遙感影像分類研究[J].南京大學學報:自然科學版,2003,39(6):806-813.
[4] 楊國鵬,余旭初,馮伍法,等.高光譜遙感技術的發展與應用現狀[J].測繪通報,2008(10):1-4.
[5] 龍娟.基于光譜特征分析的野鴨湖濕地典型植物信息提取方法研究[D].北京:首都師范大學,2011.
[6] 蓋穎穎,范聞捷,徐希孺,等.基于高光譜數據的呼倫貝爾草原花期物種識別和覆蓋度估算[J].光譜學與光譜分析,2011,31(10):2778-2783.
[7] 林文鵬,趙敏,張翼飛,等.基于SPOT遙感影像的城市森林葉面積指數反演[J].測繪科學,2008,33 (2):57-60.
[8] 方紅亮,田慶久.高光譜遙感在植被監測中的研究綜述[J].遙感技術與應用,1998,13(1):62-69.
[9] 王三明,蔣軍成,姜慧.基于人工神經網絡理論的系統安全評價[J].工業安全與防塵,2001,27(2):27-30.
[10] 錢育蓉,賈振紅,于炯,等.BP-ANN在荒漠草地高光譜分類研究中的應用[J].計算機工程與應用,2011,47(12):225-228.
Identification of Grass Species Based on Hyperspectrum——A Case Study of Xilin Gol Grassland
ZHANG Fuhua,HUANG Mingxiang,ZHANG Jing,BAO Gang,BAO Yuhai
P237
B
0494-0911(2014)07-0066-04
2014-03-03
內蒙古自然科學基金(2011BS0609;2012MS0607);內蒙古自治區科技計劃(20110524);國家自然科學基金(40901233)
張富華(1987—),女,山東日照人,碩士生,研究方向為遙感與GIS應用。
黃明祥
張富華,黃明祥,張晶,等.利用高光譜識別草地種類的研究——以錫林郭勒草原為例[J].測繪通報,2014(7):66-69.
10.13474/ j.cnki.11-2246.2014.0228