楊可明 卓偉 劉二雄
摘要:利用美國SVC HR-1024I型地物光譜儀對盆栽玉米葉片進行光譜測定,同時用SPAD-502葉綠素儀測定葉片的葉綠素含量?;趯崪y光譜的微分處理結果,獲取光譜位置、光譜面積、植被指數3個方面的11個光譜特征參數(spectral characteristic parameters,SCP),分析這11個SCPs與葉綠素含量的相關性,并對這些參數進行主成分分析(principal component analysis,PCA);然后,利用這11個SCPs及其PCA結果建立誤差反向傳播(error back propagation,BP)神經網絡輸入因子,并構建了玉米葉片葉綠素含量BP反演模型(簡稱SCP-PCA-BP模型)。另外,選取與葉綠素含量相關性較高的8個SCP,建立常規的線性回歸模型并預測葉綠素含量。反演結果表明:SCP-PCA-BP反演的預測值與實測值之間的決定系數(r2)達到0.968 7,均方根誤差(RMSE)為0.893 9;而用線性回歸模型反演時,只有基于SCP中微分光譜藍邊面積、面積比值、歸一化面積參數的預測效果較好,其中歸一化面積的預測效果最好,預測值與實測值之間r2為0.704 0,RMSE為2.895。因此可知,與常規的線性回歸模型相比,SCP-PCA-BP反演模型在預測玉米葉片葉綠素方面具有更好的預測效果。
關鍵詞:光譜特征參數;主成分分析;玉米葉片;BP神經網絡;葉綠素含量;BP反演模型
中圖分類號: TP75;S127 文獻標志碼: A 文章編號:1002-1302(2016)07-0147-04
葉綠素在植物的整個生理生態過程中非常重要,能夠間接地反映植物的生長狀況[1],葉綠素含量的高低可以作為植物受外界脅迫或是環境因子干擾狀態下的重要指標[2]。因此,快速、高效、大面積地測量植被葉片中葉綠素含量在農學、生態學、林學等領域均具有重要的實用價值。目前,基于高光譜遙感的精準農業及其應用研究取得了較大進展,特別是葉綠素含量等生化成分反演是其近年來的研究熱點之一[3-4]。高光譜遙感數據不僅具有極高的光譜分辨率(波段寬度
大量研究證明,利用高光譜遙感技術可以成功估算植被葉片中的葉綠素含量。Mutanga等通過研究證實,紅邊位置一般與植物冠層的葉綠素或氮素含量有較好的相關性[11];Inoue等通過研究水稻(Oryza sativa)冠層的高光譜數據與其生理狀態間的關系發現,可以通過構建可見光、近紅外區域內高光譜數據的多元回歸模型來反演水稻葉片的葉綠素含量[12];梁亮等基于最小二乘支持向量回歸(least squares support vector regression,LS-SVR)算法建立了小麥冠層葉綠素含量高光譜反演模型,并能準確估測葉綠素含量[13];李云梅等利用線性回歸模型分析了水稻葉片中的葉綠素含量[14];楊杰等對350~2 500 nm范圍內的光譜采用任意2個波段組合的方式構建一系列比值與歸一化光譜指數,篩選出了可敏感反映水稻上部葉片葉綠素含量的高光譜指數SR(728,709)、ND(780,712)[15];周春艷等通過研究基于多參數神經網絡建模的葉綠素含量精細反演方法,驗證了多參數反向傳播(back propagation,BP)神經網絡模型可以有效地提高活體植物葉綠素含量預測精度[16]。研究成果多集中于通過多元統計分析方法探尋敏感波段構建葉綠素含量反演模型,因此本研究通過利用所提取的玉米葉片微分光譜特征參數(spectral characteristic parameter,SCP)建立基于主成分分析(principal component analysis,PCA)的BP神經網絡葉綠素含量反演模型,即SCP-PCA-BP模型,同時利用光譜特征參數構建線性回歸模型進行葉綠素含量的估算,通過比較2種模型的葉綠素含量反演精度,發現SCP-PCA-BP模型能更加快速、精確地估算玉米葉片葉綠素含量。
1 材料與方法
1.1 光譜數據的測定
本試驗對象為實驗室盆栽玉米,于2014年7月17日采用SVC HR-1024I型高性能地物光譜儀對玉米葉片進行光譜數據采集,葉片光譜數據采集范圍為350~2 500 nm,其中350~1 000 nm的光譜采樣寬度為1.5nm,光譜分辨率為 35 nm;1 000~1 850 nm的采樣寬度為3.6 nm,光譜分辨率為95 nm;1 850~2 500 nm的采樣寬度為2.5 nm,光譜分辨率為6.5 nm。采集過程應滿足的條件包括光譜儀配套功率為50 W的鹵素燈光源、4°視場角的探頭,探頭應保持垂直于葉片表面40 cm,輸出的光譜曲線由3條原始的掃描光譜經過自動平均所得。為了準確地測定玉米葉片光譜數據,在測量時將玉米葉片放置于用黑色塑料袋包裹的硬紙片上。光譜反射系數經專用平面白板標準化。
1.2 葉綠素含量的測定
在玉米葉片光譜數據采集完成后,于2014年7月18日使用SPAD-502葉綠素測定儀測定玉米葉綠素含量,為了獲得準確的葉綠素濃度值,每個樣本葉片選定5個不同位置重復測定5次,最后將測得的5個葉綠素含量求平均,作為每張葉片葉綠素含量的實測值。
1.3 光譜一階微分處理
光譜微分技術就是數學模擬反射光譜以提取不同的光譜參數。在植被光譜處理中,應用光譜微分能夠部分消除大氣效應、陰影與土壤等植被環境背景的影響,從而較好地反映植物的本質特征。光譜一階微分可近似表達為:
R′(λi)=[R(λi+1)-R(λi-1)]/(λi+1-λi-1)。
(1)
式中:λi-1、λi、λi+1為相鄰波長,nm;R(λi+1)、R(λi-1)分別為波長λi+1、λi-1對應的光譜反射率;R′(λi)為波長λi對應的一階微分曲線值。
1.4 光譜特征參數提取
利用一階微分處理的光譜可提取光譜特征參數,本研究共提取了11個玉米葉片的SCP。由表1可見,這些SCP主要分為光譜位置參數、光譜面積參數、光譜植被指數參數3種類型。同時,運用SPSS軟件對這11個SCP與基于SPAD-502實測的葉綠素含量進行皮爾遜(Pearson)相關分析,結果見表2。
表1中微分光譜的面積變量中的紅邊面積(SDr)、藍邊面積(SDb)的計算公式為:
SDr(或 SDb)=∑ni=1R′(λi)[(λi+1-λi)+(λi-λi-1)]2。
(2)
從表2中得到的相關系數可以看出,樣本的葉綠素含量與藍邊幅值(Dr)、藍邊位置(Db)、綠峰反射率(Rg)、藍邊面積(SDb)、比值植被指數(Rg/Ro)、歸一化植被參數(Rg-Ro)/(Rg+Ro)呈明顯的負相關,其中與藍邊面積(SDb)的相關系數最大,為-0.773 2;葉綠素含量與藍邊位置(λb)、面積比值(SDr/SDb)、歸一化面積(SDr-SDb)/(SDr+SDb)呈明顯的正相關關系,相關系數分別為0.675 1、0.790 0、0.801 0。
2 基于SCP主成分輸入因子的BP神經網絡
2.1 BP神經網絡模型
BP神經網絡是1986年由Rumelhart、McCelland為首的科學家小組提出的,為1種多層前饋型神經網絡,即誤差反向傳播算法的學習過程,由信息的正向傳播、誤差的反向傳播2個過程組成,可以實現從輸入到輸出的任意非線性映射[17-18]。BP神經網絡的拓撲結構主要包括輸入層(input layer)、隱含層(hidden layer)、輸出層(output layer)。在光譜分析中,BP神經網絡是一種非常重要的模式識別方法,特別適合解決一些復雜的映射問題。
2.2 SCP的主成分分析
主成分分析主要用于數據壓縮、數據解釋,其分析結果主要用于回歸、指標遴選、多維度評價、系統演化過程分析以及質量控制等方面[19-20]。在應用BP神經網絡構建參數預測模型時,有時神經網絡的數據輸入端有很多指標,并且這些指標存在一定的共線性。如果將所有的數據指標都作為神經網絡的輸入端,不僅會增加網絡模型的復雜度,而且會降低整個網絡的性能(包括神經網絡的學習收斂速率、是否會出現過擬合現象等),從而大大增加計算時間,甚至影響結果預測精度。PCA可以消除原始變量間的共線性,在盡可能多地保留原始數據信息的前提下,對數據進行主要成分提取,進而減少輸入層神經網絡個數,改善網絡拓撲結構與預測效果。
在植被葉綠素含量BP模型構建過程中,PCA與BP神經網絡的結合主要是在數據輸入端,通過PCA對數據進行降維,減少輸入層神經元的個數,增強網絡性能,增強預測效果。本研究利用MATLAB R2010a對11個SCP進行PCA處理,得到的特征值及方差貢獻率見表3。
表3中的方差貢獻率、累計方差貢獻率分別表示各個主成分所反映的原始參數的信息量和這些主成分所反映的原始參數數據量的總和。從表3可以看出:前5個互不相關主成分變量的累計貢獻率達到98.841%,可以認為用前5個主成分可以代替原有參數的所有信息,并用于建立預測模型。樣本前5個主成分得分情況見表4。
3 葉綠素含量的SCP-PCA-BP模型反演
3.1 構建SCP-PCA-BP反演模型
基于PCA提取SCP主要成分作為BP神經網絡輸入層,用于反演玉米葉片葉綠素含量,即為所建立的SCP-PCA-BP反演模型,主要包括3個部分:利用PCA技術對11個光譜特征參數進行主成分分析,并提取11個SCP的主要成分作為BP神經網絡的輸入層因子;確定BP神經網絡拓撲結構以及最佳隱含層神經元的個數;BP神經網絡預測。
3.2 SCP-PCA-BP模型的葉綠素含量反演
本研究所構建的BP神經網絡一共有3層,即輸入層、隱含層、輸出層。將表4中各主要成分的得分作為SCP-PCA-BP反演模型的BP輸入層神經元,以相對應樣本葉綠素含量為輸出層神經元,在玉米葉片45個葉綠素數據中隨機抽取35個作為訓練樣本的學習目標,其余樣本數據作為網絡仿真預測數據。設置隱含層神經元數為5個,網絡學習速率為0.05,網絡訓練的迭代次數為2 000次,允許誤差為0.000 1。當神經網絡訓練完畢后,利用剩余的15組樣本葉綠素含量值作為測試數據檢驗模型,SCP-PCA-BP模型訓練與檢驗精度的真實值、預測值之間的決定系數r2分別為0.937 9、0892,均方根誤差(root mean square error,RMSE)分別為1269 3、1.730 2;最后將所有樣本的數據作為輸入矢量P進行模擬預測,并將得到的預測值與真實值進行擬合,擬合結果的真實值與預測值之間的決定系數r2為0.968 7,RMSE為0893 9,其擬合結果見圖1、圖2,其中RMSE計算公式為:
RMSE=∑ni=1(yi-y^i)2/n。
(3)
式中:RMSE為預測值與真實值之間的均方根誤差;yi為真實值;y^i為預測值;n為樣本數,個。
3.3 基于線性回歸模型的反演比較
從表2中選擇與葉綠素含量相關性較高的8個SCPs分別作為影響因子預測樣本中的葉綠素含量,以SCP為自變量、葉綠素含量為因變量建立線性回歸模型。表5列舉了各
特征參數與葉綠素含量的線型回歸預測模型,模型預測精度將模型的決定系數r2以及真實值與預測值之間的均方根誤差作為評價指標。
由表5中的線性回歸模型預測結果可知,歸一化面積的預測效果最好,該模型的決定系數r2達到0.7040,高于其他特征參數的回歸預測模型;葉綠素含量真實值與預測值之間的均方根誤差RMSE為2.849,低于其余特征參數回歸模型。基于藍邊面積所構建的回歸預測模型決定系數r2為 0.691 9,均方根誤差RMSE為2.895,其預測結果明顯好于其余6個預測模型。因此,利用這8個SCP構建線性回歸模型預測葉綠素含量時,優先考慮歸一化面積(SDr-SDb)/(SDr+SDb),其次考慮藍邊面積(SDb)。
4 結論
本研究通過測定玉米葉片的高光譜數據和葉綠素濃度相對值,對獲取的光譜數據進行均值、微分處理,提取了11個光譜特征參數(SCP),并對這些參數和葉綠素含量進行了相關性分析、主成分分析、回歸分析、神經網絡預測分析,通過這些分析得到以下結論:
(1)在列舉的11個SCPs中與玉米葉片中葉綠素含量相關性最高的是歸一化面積(SDr-SDb)/(SDr+SDb)參數,與葉綠素含量呈顯著正相關,相關系數為0.801 0;其次為面積比值(SDr/SDb)參數,相關系數為0.790 0。
(2)在利用SCP進行回歸分析與預測的結果中,歸一化面積的預測效果最好,葉綠素含量真實值與預測值之間的決定系數r2為0.704 0,均方根誤差RMSE為2.849;其次為基于藍邊面積所構建的回歸預測模型,決定系數r2為 0.691 9,均方根誤差RMSE為2.895。說明歸一化面積和藍邊面積可以用于回歸分析預測玉米葉片中的葉綠素含量。
(3)對SCP進行主成分分析獲得的玉米葉片SCP前5個主要成分,這5個主要成分的累計方差貢獻率達到98841%,保留了原始數據的絕大部分光譜信息,因此這5個主要成分可以近似代替原有參數參與建立BP神經網絡預測模型,即SCP-PCA-BP反演模型并用于盆栽玉米葉片的葉綠素含量反演。模型的檢驗結果中葉綠素含量真實值與預測值之間的決定系數r2為0.892,均方根誤差RMSE為 1.730 2。最后將所有樣本的數據作為輸入矢量P進行模擬預測,擬合結果的真實值與預測值之間的決定系數r2為0968 7,均方根誤差RMSE為0.893 9。與線性回歸預測模型相比,SCP-PCA-BP反演模型大大提高了玉米葉片葉綠素含量的預測精度。
參考文獻:
[1]劉 璇,林 輝,臧 卓,等. 杉木葉綠素a含量與高光譜數據相關性分析[J]. 中南林業科技大學學報,2010,30(5):72-76.
[2]吉海彥,王鵬新,嚴泰來. 冬小麥活體葉片葉綠素和水分含量與反射光譜的模型建立[J]. 光譜學與光譜分析,2007,27(3):514-516.
[3]宋開山,張 柏,王宗明,等. 大豆葉綠素含量高光譜反演模型研究[J]. 農業工程學報,2006,22(8):16-21.
[4]施潤和,莊大方,牛 錚,等. 基于輻射傳輸模型的葉綠素含量定量反演[J]. 生態學雜志,2006,25(5):591-595.
[5]王 強,易秋香,包安明,等. 基于高光譜反射率的棉花冠層葉綠素密度估算[J]. 農業工程學報,2012,28(15):125-133.
[6]朱凌紅,周 澎,王忠民,等. 高光譜數據與葉綠素含量及植被指數的相關性研究進展[J]. 內蒙古民族大學學報:自然科學版,2014,29(1):41-44.
[7]Broge N H,Mortensen J V. Deriving green crop area index and canopy chlorophyll density of winter wheat from spectral reflectance data[J]. Remote Sensing of Environment,2002,81(1):45-57.
[8]Maire G L,Francois C,Dufrene E. Towards universal broad leaf chlorophyll indices using PROSPECT simulated database and hyperspectral reflectance measurements[J]. Remote Sensing of Environment,2010,89(1):1-28.
[9]陳婉婧,閻廣建,呂 琳,等. 大豆葉片水平葉綠素含量的高光譜反射率反演模型研究[J]. 北京師范大學學報:自然科學版,2012,48(1):60-65.
[10]姚付啟,張振華,楊潤亞,等. 基于紅邊參數的植被葉綠素含量高光譜估算模型[J]. 農業工程學報,2009,25(增刊2):123-129.
[11]Mutanga O,Skidmore A K. Red edge shift and biochemical content in grass canopies[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2007,62(1): 34-42.
[12]Inoue Y,Penueleus J,Nouevllon Y,et al. Hyperspectral reflectance measurements for estimating eco-physiological status of plants[J]. Proc Spie,2001,4151: 153-163.
[13]梁 亮,楊敏華,張連蓬,等. 基于 SVR 算法的小麥冠層葉綠素含量高光譜反演[J]. 農業工程學報,2012,28(20):162-171.
[14]李云梅,倪紹祥,王秀珍.線性回歸模型估算水稻葉片葉綠素含量的適宜性分析[J]. 遙感學報,2003,7(5):364-371.
[15]楊 杰,田永超,姚 霞,等. 水稻上部葉片葉綠素含量的高光譜估算模型[J]. 生態學報,2009,29(12):6561-6571.
[16]周春艷,華燈鑫,樂 靜,等. 基于神經網絡的葉綠素含量精細測量建模方法研究[J]. 光譜學與光譜分析,2015,35(9):2629-2633.
[17]費 強,趙武云,戴 飛,等. 基于BP神經網絡及遺傳算法的組合式板齒脫粒裝置參數優化[J]. 江蘇農業科學,2014,42(3):351-354.
[18]梁 帆,楊莉莉,崔世鋼,等. 基于神經網絡的油菜成熟度等級視覺檢測方法[J]. 江蘇農業科學,2015,43(8):403-405.
[19]袁曉慶,李奇峰,李 琳,等. 基于主成分分析法的農業信息化評價研究[J]. 江蘇農業科學,2015,43(3):398-402.
[20]馮英娜,劉衛東,朱士農,等. 茄子農藝性狀和品質性狀的相關性及主成分分析[J]. 江蘇農業科學,2015,43(1):166-168.