彭曉偉,張愛(ài)軍,2,楊曉楠,王 楠,趙 麗
(1.河北農(nóng)業(yè)大學(xué)國(guó)家北方山區(qū)農(nóng)業(yè)工程技術(shù)研究中心,河北 保定 071000;2.河北省山區(qū)研究所,河北 保定 071000;3.河北農(nóng)業(yè)大學(xué)機(jī)電工程學(xué)院,河北 保定 071000;4.河北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,河北 保定 071000)
葉綠素直觀(guān)反映作物的生長(zhǎng)狀態(tài),其含量與植被脅迫、光合作用能力以及健康狀況密切相關(guān)[1-2],很大程度決定了作物的產(chǎn)量[3-4]。及時(shí)準(zhǔn)確地估算葉綠素含量有助于發(fā)現(xiàn)葉片缺素癥狀,從而避免作物減產(chǎn)。目前,估測(cè)葉綠素的方法主要為點(diǎn)位采樣測(cè)定,及基于衛(wèi)星遙感影像大面積估算[5]。其中,點(diǎn)位測(cè)定依賴(lài)作物葉片組織,耗時(shí)耗力,難以實(shí)時(shí)、大范圍估測(cè)[6];衛(wèi)星遙感影像時(shí)空分辨率較低、存在易受到大氣及空間輻射影響等缺陷也嚴(yán)重制約大面積評(píng)估作物生長(zhǎng)狀態(tài)的精度[7]。無(wú)人機(jī)技術(shù)的出現(xiàn)以其高時(shí)空分辨率、低干擾及使用簡(jiǎn)便靈活的優(yōu)點(diǎn),填補(bǔ)了現(xiàn)有農(nóng)業(yè)監(jiān)測(cè)技術(shù)的缺陷,能通過(guò)監(jiān)測(cè)氮素含量[8]、葉綠素[9]、葉面積指數(shù)[10]等生理生化指標(biāo)快速精準(zhǔn)評(píng)估大田作物長(zhǎng)勢(shì)[11]。因此,無(wú)人機(jī)航測(cè)在農(nóng)業(yè)生產(chǎn)中的廣泛應(yīng)用有助于指導(dǎo)農(nóng)業(yè)生產(chǎn)及保證作物產(chǎn)量,并為集群農(nóng)業(yè)管理提供新技術(shù)、新思路。
高光譜數(shù)據(jù)反演葉綠素含量的研究已相當(dāng)成熟,400~700 nm波段的透射率及反射率與葉綠素含量高度相關(guān),眾多研究通過(guò)構(gòu)建不同的數(shù)學(xué)模型來(lái)量化高光譜數(shù)據(jù)與葉綠素含量的關(guān)系[12]。一元線(xiàn)性回歸模型,及多元線(xiàn)性回歸模型被廣泛應(yīng)用于構(gòu)建光譜一階導(dǎo)數(shù)與葉綠素含量的關(guān)系,其精度(R2>0.8)較高,具有估測(cè)葉綠素含量的能力[13-14]。但單一的線(xiàn)性關(guān)系不足以表征變量間的相互作用,模型參數(shù)具有極大的局限性[15]。亦有研究基于敏感波段建立優(yōu)化型土壤調(diào)節(jié)指數(shù)TCARI(Transformed chlorophyll absorption ratioindex)/OSAVI(Optimization of soil adjust vegetation index),以估測(cè)植株的葉綠素含量[16]。隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,基于大數(shù)據(jù)基礎(chǔ)的機(jī)器學(xué)習(xí)方法提升了葉綠素含量估算數(shù)學(xué)模型的適用性和精度[17]。BP神經(jīng)網(wǎng)絡(luò)能大大提高利用高光譜反射數(shù)據(jù)估算玉米葉綠素含量的精度[18],支持向量機(jī)和粒子群優(yōu)化算法亦能對(duì)作物葉綠素含量有較優(yōu)(R2>0.88)的精度估算[19-20]。現(xiàn)有基于高光譜估算葉綠素含量的研究基本基于單一的數(shù)學(xué)模型,集中在作物的某一生育期[21-22],而對(duì)于多模型結(jié)合能否有效估算不同生育期的葉綠素含量這一問(wèn)題仍缺乏充分的回答。因此,構(gòu)建不同數(shù)學(xué)模型估算葉綠素含量有助于補(bǔ)充科研空缺,為多模型綜合估算農(nóng)作物長(zhǎng)勢(shì)提供科學(xué)基礎(chǔ)。
本研究基于無(wú)人機(jī)平臺(tái),通過(guò)機(jī)載高光譜相機(jī)進(jìn)行田間光譜測(cè)定,并綜合分析農(nóng)作物的長(zhǎng)勢(shì)狀況,探究不同模型對(duì)不同生育期谷子葉綠素含量估算的適宜性。并且,選擇了不同生育期的最佳參數(shù),基于一元線(xiàn)性模型、PLSR模型及BP神經(jīng)網(wǎng)絡(luò)建立估算模型,比較不同模型的估測(cè)精度及其對(duì)谷子各時(shí)期的適用性。
分別在拔節(jié)期(8月11日)、抽穗期(8月21日)、灌漿期(9月10日)、成熟期(9月28日)利用大疆公司經(jīng)緯M600 Pro無(wú)人機(jī)搭載雙利合譜公司10 cm分辨率的Gaiasky mini 2-VN高光譜相機(jī)對(duì)谷子冠層的光譜進(jìn)行采集,無(wú)人機(jī)飛行高度為200 m,測(cè)量時(shí)段為10∶00—14∶00,天氣晴朗無(wú)風(fēng)。無(wú)人機(jī)測(cè)量前用白板進(jìn)行校正,以保證數(shù)據(jù)的準(zhǔn)確性,每個(gè)小區(qū)均隨機(jī)采集3個(gè)樣點(diǎn)的光譜數(shù)據(jù),并利用ENVI 5.3對(duì)每個(gè)小區(qū)的光譜數(shù)據(jù)進(jìn)行校正。與光譜測(cè)量同步,使用日本柯尼卡美能達(dá)公司葉綠素儀(SPAD-502)測(cè)定樣點(diǎn)附近5株植株的葉綠素含量,每片葉子均勻測(cè)量3次,取平均值作為樣本的葉綠素含量,實(shí)現(xiàn)與葉片光譜數(shù)據(jù)的一一對(duì)應(yīng)。
1.2.1 一元函數(shù)模型及植被參數(shù)的選取 采用五點(diǎn)加權(quán)平滑法對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,并利用SPSS 20.0軟件計(jì)算光譜數(shù)據(jù)與葉綠素值的相關(guān)性,從而選取相關(guān)系數(shù)最大的波段即特征光譜,采用指數(shù)函數(shù)、一元線(xiàn)性函數(shù)、對(duì)數(shù)函數(shù)、多項(xiàng)式以及冪函數(shù)構(gòu)建葉綠素含量估算模型,選取最優(yōu)的函數(shù)模型作為葉綠素含量的一元線(xiàn)性回歸模型,光譜反射率中的近紅外波段會(huì)受到作物中葉片的色素、水分、細(xì)胞結(jié)構(gòu)的影響,而這些影響會(huì)導(dǎo)致可見(jiàn)及近紅外區(qū)域特定范圍內(nèi)特定位置與特定面積的改變[23],基于光譜曲線(xiàn),計(jì)算植被指數(shù)及三邊參數(shù)(表1),并建立相應(yīng)的擬合方程。

表1 基于光譜曲線(xiàn)構(gòu)建的植被指數(shù)和三邊參數(shù)
1.2.2 偏最小二乘回歸 偏最小二乘回歸方法(Partial least squares regression,PLSR)集主成分分析、典型相關(guān)分析及多元回歸分析的優(yōu)點(diǎn)為一體,可以有效解決多元回歸分析中的變量高度自相關(guān)及噪聲問(wèn)題[24-25]。除此之外,模型具有一定的預(yù)測(cè)功能,而且允許在樣本數(shù)量少于自變量個(gè)數(shù)的條件下回歸建模,且能在最終模型中包含原有的所有自變量,亦于辨識(shí)系統(tǒng)信息與噪聲。本研究中,光譜參數(shù)為自變量,葉綠素含量為因變量。為了避免過(guò)度擬合,引入交叉驗(yàn)證以確定 PLSR模型中的主成分?jǐn)?shù)量[26]。當(dāng)R2值大于 0.5 時(shí),PLSR模型被認(rèn)為對(duì)結(jié)果有良好的預(yù)測(cè)[27]。一般具有最大的Q2和最小的RMSECV(交叉驗(yàn)證均方根誤差)的PLSR模型最優(yōu)。計(jì)算公式如下:

PLSR使用SIMCA-P14.1計(jì)算。SIMCA-P14.1是由Sartorius Stedim公司開(kāi)發(fā)的一款多元變量統(tǒng)計(jì)分析軟件,通過(guò)SIMCA-P14.1的PLS模塊建立回歸模型,計(jì)算得出主成分個(gè)數(shù)、解釋能力、累積解釋能力、交叉驗(yàn)證均方根誤差(RMSECV)和變量投影重要性(VIP)。
1.2.3 BP神經(jīng)網(wǎng)絡(luò)模型 本研究構(gòu)建了一個(gè)輸入層、一個(gè)輸出層、五個(gè)隱含神經(jīng)元、一個(gè)輸出所構(gòu)成的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,迭代次數(shù)為1 000,學(xué)習(xí)精度為0.01。訓(xùn)練目標(biāo)為均方根誤差小于0.001。BP神經(jīng)網(wǎng)絡(luò)算法的參數(shù)如表2,針對(duì)各時(shí)期108組谷子葉片樣本,利用神經(jīng)網(wǎng)絡(luò)建立葉綠素估算模型,選取各個(gè)時(shí)期的入選植被指數(shù)作為輸入層,以谷子葉片的葉綠素值作為輸出層,隱含層由公式1確定節(jié)點(diǎn)數(shù),經(jīng)過(guò)多次模擬訓(xùn)練,最優(yōu)節(jié)點(diǎn)數(shù)確定為9。用其中72個(gè)樣本作為建模集,32個(gè)樣本為測(cè)試集,在Matlab 2019b軟件中通過(guò)編寫(xiě)程序代碼進(jìn)行BP神經(jīng)網(wǎng)絡(luò)建模,對(duì)各生育期谷子葉片葉綠素值進(jìn)行訓(xùn)練,建立不同生育期谷子葉片葉綠素值的BP神經(jīng)網(wǎng)絡(luò)模型。

表2 BP神經(jīng)網(wǎng)絡(luò)算法參數(shù)
式中,k為輸入層單元數(shù);m為輸出層單元數(shù);α為[1,10]之間的常數(shù)。
1.2.4 模型精度檢驗(yàn) 本研究采用決定系數(shù)(Coefficient of determination,R2)、均方根誤差RMSE(Root mean square error)兩個(gè)指標(biāo)來(lái)評(píng)估模型的精度,主要公式如下:
據(jù)報(bào)道,截至2018年6月25日,第一批中央環(huán)保督察“回頭看”已通報(bào)32起環(huán)境違法問(wèn)題,均為企業(yè)所為。中央環(huán)保督察組“回頭看”通報(bào)典型案例,湖北鄂州葛店開(kāi)發(fā)區(qū)敷衍整改,臭氣擾民問(wèn)題依然如故;湖南岳陽(yáng)綠色化工產(chǎn)業(yè)園云溪片區(qū)企業(yè)偷排問(wèn)題突出,嚴(yán)重影響松楊湖水環(huán)境質(zhì)量;吉林省遼源市整改敷衍應(yīng)對(duì),52個(gè)企業(yè)的工業(yè)廢水、生活廢水直接排入仙人河,黑臭問(wèn)題依然突出。

不同生育期的谷子葉片葉綠素值如表3所示,谷子葉片葉綠素含量在不同生育期呈先增加后減少的趨勢(shì),最大值出現(xiàn)在抽穗期,約為66.40。

表3 谷子葉片葉綠素含量統(tǒng)計(jì)分析
谷子葉片的光譜反射率變化趨勢(shì)基本一致,而光譜反射率隨著葉綠素的增加呈現(xiàn)出降低的趨勢(shì)(圖1a)。在可見(jiàn)光波段400~700 nm,拔節(jié)期和抽穗期谷子分別在550、660 nm處存在明顯的吸收峰和吸收谷。在此波段內(nèi),光譜反射率并不隨葉綠素含量線(xiàn)性變化,而呈先增加后減小的趨勢(shì),SPAD值分別為44.80、50.14及60.40時(shí),對(duì)應(yīng)的光譜反射率歸一化均值分別為0.048、0.054、0.050,有10.86%和3.0%的增幅。反射率在700~780 nm波段開(kāi)始急劇上升,SPAD值分別為44.80、50.14及60.40的光譜反射率歸一化均值分別為0.582、0.573、0.648,有1.87%的降幅和11.24%的增幅。在780~1 300 nm波段,亦有一個(gè)明顯的吸收峰(800 nm)和一個(gè)明顯的吸收谷(900 nm),其中,3種葉綠素含量對(duì)應(yīng)的光譜反射率的歸一化均值亦隨著葉綠素的增加存在1.70%和18.56%的增加。
如圖1b所示,近紅外波段的光譜一階導(dǎo)數(shù)可以顯著地增強(qiáng)紅邊波段,紅邊波段的一階導(dǎo)數(shù)光譜是整個(gè)波段范圍的最大值,對(duì)應(yīng)為反射率在600~800 nm的強(qiáng)吸收效應(yīng)。SPAD值分別為44.80、50.14及60.40時(shí),對(duì)應(yīng)的一階導(dǎo)數(shù)光譜反射率歸一化均值分別為0.298、0.401、0.339,有34.70%和13.93%的增幅。在700~780 nm波段,740 nm左右出現(xiàn)波峰,780 nm處出現(xiàn)波谷,SPAD值分別為44.80、50.14及60.40的一階導(dǎo)數(shù)光譜反射率的歸一化均值分別為0.619、0.667、0.635,有7.70%和2.65%的增幅。在780~1 300 nm波段,SPAD值分別為44.8、50.14及60.4的一階導(dǎo)數(shù)光譜反射率的歸一化均值分別為0.391、0.448和0.363,有14.67%的增幅和7.16%的降幅。

圖1 谷子葉片不同SPAD值下的光譜反射率
光譜特征參量與葉綠素的相關(guān)性分析顯示,NDVI、GNDVI、PSNDa、PSSRc、RENDVI及Dy與不同生育期的葉綠素均呈極顯著相關(guān)關(guān)系(表4)。因此,可用NDVI、GNDVI、PSNDa、PSSRc、RENDVI及Dy6種指數(shù)作為建立估算谷子葉綠素含量的自變量。

表4 光譜特征參數(shù)與谷子葉片葉綠素的相關(guān)系數(shù)(n=108)
如表5所示,在不同生育期,分別基于一次線(xiàn)性、二次非線(xiàn)性、指數(shù)及對(duì)數(shù)形式構(gòu)建各因子與葉綠素含量的對(duì)應(yīng)關(guān)系。在拔節(jié)期和抽穗期NDVI與葉綠素含量有較好的對(duì)應(yīng)關(guān)系(R2>0.52),估算值也具有最小的殘差(RMSE<2.28)。在灌漿期和成熟期,RENDVI(R2=0.51,RMSE=2.21)、PSSRc(R2=0.62,RMSE=2.47)則分別對(duì)葉綠素含量估算有較好的適用性。其中,NDVI的二次非線(xiàn)性、一次線(xiàn)性模型分別在拔節(jié)期和抽穗期表現(xiàn)良好;RENDVI、PSSRc則分別以一次線(xiàn)性及指數(shù)形式出現(xiàn)在灌漿期和成熟期。

表5 基于光譜指數(shù)的谷子葉片葉綠素含量預(yù)測(cè)模型
基于高相關(guān)的光譜特征參數(shù)NDVI、GNDVI、PSNDa、PSSRc、RENDVI及Dy構(gòu)建了谷子葉片葉綠素含量PLSR預(yù)測(cè)模型(表6)。PLSR模型的Q2均高于0.56,對(duì)因變量的解釋程度一般,R2均在0.6以上,而預(yù)測(cè)集的R2在0.55~0.71之間,其RMSECV在1.41~2.66之間。在拔節(jié)期,PLSR模型的第一主成分對(duì)葉綠素變化的解釋能力為67.8%,加入第二、三主成分解釋能力增加到82.7%、95.8%;抽穗期、灌漿期和成熟期PLSR模型對(duì)葉綠素的總解釋能力分別為63.1%、84.5%和84.7%。

表6 谷子葉片葉綠素值與敏感光譜指數(shù)的PLSR模型
由圖2可知,在拔節(jié)期PLSR模型第一主成分Dy和PSSRc權(quán)重較大,分別在負(fù)側(cè)和正側(cè)起主導(dǎo)作用。第二主成分則為RENDVI(正側(cè))和GNDVI(負(fù)側(cè))起主導(dǎo)作用。抽穗期分析結(jié)果與成熟期一致,PLSR模型第一主成分Dy(負(fù)側(cè))和NDVI(正側(cè))權(quán)重較大,起主導(dǎo)作用,第二主成分則由NDVI(正側(cè))和GNDVI(負(fù)側(cè))起主導(dǎo)作用。在灌漿期,第二主成分的正側(cè)權(quán)重由NDVI變?yōu)镈y,其他權(quán)重結(jié)果與抽穗期一致。

圖2 谷子葉片SPAD值的第一、第二 PLSR模型組分權(quán)重
PLSR主成分權(quán)重顯示了光譜指數(shù)對(duì)葉綠素的重要程度,通過(guò)挖掘光譜指數(shù)的變量投影重要性(VIP),可以更全面地表達(dá)光譜指數(shù)的相對(duì)重要性,如表7,4個(gè)時(shí)期的NDVI與PSNDa及PSSRc對(duì)葉綠素的變量投影重要性均大于1,NDVI(VIP抽穗期=1.38,VIP灌漿期=1.17,VIP成熟期=1.33),PSNDa(VIP抽穗期=1.30,VIP灌漿期=1.18,VIP成熟期=1.24);拔節(jié)期葉綠素的光譜指數(shù)與其他時(shí)期有所不同,主要表現(xiàn)為RENDVI(VIP拔節(jié)期=1.18),該參數(shù)對(duì)拔節(jié)期葉綠素的影響達(dá)到最大。葉綠素的變量投影重要性表明,NDVI、PSNDa和PSSRc是影響不同時(shí)期谷子葉綠素的最重要光譜指數(shù)。

表7 各敏感光譜指數(shù)對(duì)SPAD值的投影重要性(VIP)
表8列出了基于6個(gè)光譜參數(shù)構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型,以6個(gè)光譜參數(shù)(NDVI、GNDVI、PSNDa、PSSRc、RENDVI、Dy)作為模型的輸入層,葉綠素含量作為輸出層,經(jīng)過(guò)多次訓(xùn)練隱含層達(dá)到最佳精度,從建模集來(lái)看,4個(gè)時(shí)期的模型決定系數(shù)均大于0.84,模型的穩(wěn)定性較高,而其中模型在灌漿期達(dá)到最佳估測(cè)精度,建模集R2達(dá)到了0.96,而RMSE最低,說(shuō)明該時(shí)期的模型穩(wěn)定性和預(yù)測(cè)能力較好。

表8 不同時(shí)期的建模結(jié)果
從圖3可以看出,相比于傳統(tǒng)的一元模型,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)谷子葉片的SPAD值估測(cè)具有較高的精度,4個(gè)時(shí)期的預(yù)測(cè)精度均在0.66以上。谷子在灌漿期具有較好的預(yù)測(cè)精度(R2=0.80)和較小的均方根誤差(RMSE=1.82),在成熟期雖然預(yù)測(cè)精度較高,但其均方差誤差RMSE達(dá)到了2.49,表示模型的穩(wěn)定性較差,而拔節(jié)期和抽穗期的預(yù)測(cè)精度及均方差誤差相差不大,模型預(yù)測(cè)效果較好。

圖3 谷子各時(shí)期光譜反射率BP神經(jīng)網(wǎng)絡(luò)模型測(cè)試集SPAD值預(yù)測(cè)結(jié)果
研究表明,谷子在生育期葉綠素含量呈現(xiàn)先增高后降低的趨勢(shì),從拔節(jié)期到抽穗期葉片均處于營(yíng)養(yǎng)生長(zhǎng)階段,葉綠素含量不斷增加。到了灌漿期谷子從營(yíng)養(yǎng)生長(zhǎng)階段進(jìn)入生殖生長(zhǎng)階段,此階段葉綠素含量逐漸下降,這可能是由于植物體內(nèi)的營(yíng)養(yǎng)元素從供給植株生長(zhǎng)轉(zhuǎn)向供應(yīng)籽粒的發(fā)育和形成[28]。在400~1 000 nm之間,由于谷子葉面內(nèi)部細(xì)胞壁和細(xì)胞空隙間折射率的影響,導(dǎo)致波段范圍內(nèi)的高反射率及差異性[12]。而葉綠素的含量也會(huì)引起光譜反射率的變化,在波段范圍內(nèi),光譜反射率會(huì)隨著葉綠素的增加而降低,這與陳瀾等[29]的研究結(jié)果一致。作物產(chǎn)生“紅移”現(xiàn)象,其主要原因是由于作物即將成熟時(shí),葉綠素向著葉黃素的轉(zhuǎn)變[30-31]。
本研究采用一元線(xiàn)性模型對(duì)不同生育期的葉片葉綠素進(jìn)行估測(cè),王丹[32]、趙占輝[33]等分別對(duì)夏玉米、玉米冠層的葉綠素進(jìn)行高光譜建模,均發(fā)現(xiàn)NDVI與SPAD值得關(guān)系密切,與本文部分研究結(jié)果一致,4個(gè)生育時(shí)期最佳模型的建模集及驗(yàn)證集精度在0.4~0.6之間,由此可以看出利用一元線(xiàn)性模型進(jìn)行建模有一定的局限性,在一定程度上制約著葉綠素的反演精度[34-35],因此本研究利用BP神經(jīng)網(wǎng)絡(luò)對(duì)葉綠素進(jìn)行非線(xiàn)性模型構(gòu)建,可以看出,利用BP神經(jīng)網(wǎng)絡(luò)建模可使模型精度大幅度提高,模型的回歸擬合結(jié)果R2在0.6~0.8之間。
1)不同SPAD值的光譜反射率具有相似的光譜特征,表現(xiàn)為光譜反射率會(huì)隨著葉綠素的增加而降低,在740 nm處吸收特征越來(lái)越明顯。
2)在拔節(jié)期和抽穗期以NDVI光譜指數(shù)為自變量建立的二次函數(shù)模型(R2=0.52,RMSE=1.97)和線(xiàn)性模型(R2=0.60,RMSE=2.28)效果最佳,而灌漿期和成熟期分別以RENDVI和PSSRc建立的指數(shù)模型(R2=0.51,RMSE=2.21)和二次函數(shù)模型(R2=0.62,RMSE=2.47)的效果最佳,可以較好地估算出該時(shí)期的葉綠素變化。
3)利用偏最小二乘法建模的精度(R2)在拔節(jié)期、抽穗期、灌漿期和成熟期分別為0.67、0.57、0.60、0.88,模型的預(yù)測(cè)精度(R2)分別為0.55、0.66、0.56、0.71。NDVI、PSNDa和PSSRc是影響不同時(shí)期谷子葉綠素的最重要光譜指數(shù)。
4)在BP神經(jīng)網(wǎng)絡(luò)中,在拔節(jié)期、抽穗期、灌漿期和成熟期的建模集精度(R2)分別為0.95、0.84、0.96、0.67,模型的預(yù)測(cè)精度(R2)分別為0.67、0.67、0.79、0.75,綜合比較,相較于偏最小二乘回歸模型與一元線(xiàn)性模型,利用BP神經(jīng)網(wǎng)絡(luò)建模效果最佳。