呂小艷,薛 琳,競 霞,張 超,徐海清,朱啟法
(1西安科技大學(xué)測繪科學(xué)與技術(shù)學(xué)院,西安710054;2中國農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京100083;3安徽皖南煙葉有限責(zé)任公司,安徽宣城242000)
煙草作為中國的重要經(jīng)濟(jì)作物,科學(xué)化、精細(xì)化的管理對于提高煙草質(zhì)量至關(guān)重要,煙草施肥、長勢與品質(zhì)的監(jiān)管主要依據(jù)于煙草生化參數(shù),葉綠素作為煙草主要生化參數(shù)之一,是葉片葉綠體內(nèi)進(jìn)行光合作用的主要色素[1],并且可用于煙草氮素狀況、產(chǎn)量[2-5]等的預(yù)測。快速精準(zhǔn)無損地估測煙草葉片的葉綠素含量,有助于及時掌握煙草的長勢狀況,為種植管理者提供科學(xué)依據(jù)。
傳統(tǒng)實(shí)驗(yàn)室化學(xué)測定葉綠素含量的方法耗時,同時對作物具有破壞性。SPAD(soil and plant analyzer development)值可準(zhǔn)確表征葉綠素含量,但獲取SPAD值時需要反復(fù)接觸葉片,不適于大范圍葉綠素信息的獲取[6]。高光譜數(shù)據(jù)具有快速、無損特點(diǎn),已廣泛應(yīng)用于SPAD值的估測[7-11]。
目前,利用高光譜估算SPAD值的研究中,主要通過反射率原始數(shù)據(jù)[12]、變換數(shù)據(jù)[13-15]、微分?jǐn)?shù)據(jù)[16,17]與SPAD的關(guān)系,反演SPAD值。而利用微分?jǐn)?shù)據(jù)估測SPAD值的研究中,主要基于整數(shù)階微分,但整數(shù)階微分忽略了微分光譜的漸變信息,限制了估測模型的精度[18]。分?jǐn)?shù)階微分作為整數(shù)階微分的拓展,可以突出光譜的細(xì)微信息[19-21]。王敬哲等[22]通過分?jǐn)?shù)階微分處理的光譜數(shù)據(jù),研究了荒漠土壤鉻含量反演,得出分?jǐn)?shù)階微分優(yōu)于一階微分。Fu等[23]通過研究地面高光譜遙感和Landsat 8 OLI數(shù)據(jù)的Grünwald-Letnikov分?jǐn)?shù)階微分光譜數(shù)據(jù)與土壤有效鉀含量的相關(guān)性,表明分?jǐn)?shù)階微分可描述光譜數(shù)據(jù)的微小差異,茹克亞·薩吾提等[24]利用經(jīng)過對數(shù)變換和分?jǐn)?shù)階微分處理的光譜計(jì)算的植被指數(shù)建立偏最小二乘模型,實(shí)現(xiàn)了小麥葉綠素含量的估算。
上述研究表明,對高光譜數(shù)據(jù)進(jìn)行分?jǐn)?shù)階微分處理可挖掘高光譜數(shù)據(jù)的細(xì)微信息,且利用分?jǐn)?shù)階微分估測葉綠素含量是可行的,但目前該方法應(yīng)用于煙草生化參數(shù)估測的研究較為鮮見,煙草是典型的雙子葉植物,它的收獲對象為葉片,估測葉片的SPAD值對于預(yù)測煙草產(chǎn)量具有重要意義。煙草旺長期是煙草的重要生育期,此時煙草的葉片數(shù)、葉面積、干物質(zhì)積累迅速增加,是決定葉數(shù)、葉面積和葉重的關(guān)鍵時期,也是決定產(chǎn)量和品質(zhì)的重要階段。因此,本文以旺長期煙葉為研究對象,在以高光譜數(shù)據(jù)估測煙葉SPAD值的基礎(chǔ)上,提出了利用高光譜分?jǐn)?shù)階微分估測煙葉SPAD值的方法,研究分?jǐn)?shù)階微分光譜在煙葉SPAD值估測中的可行性,以期為煙草長勢監(jiān)測提供科學(xué)依據(jù)。
以安徽省宣城市(29°56′48′—31°19′30′N,117°57′54"—119°38′39′E)為研究區(qū),該區(qū)域?qū)儆诘湫偷膩啛釒Ъ撅L(fēng)氣候,年平均溫度為15.6℃,年降水量1200~1500 mm,無霜期8個月,適宜煙草種植[25]。煙草品種為‘云煙97’,大田生長期為3月中下旬至7月下旬,種植行距1.2 m,株距0.45 m左右。試驗(yàn)選取能夠代表該研究區(qū)特性的煙田16塊,每個田塊布設(shè)5個樣點(diǎn),樣點(diǎn)之間相距50 m,共80個樣點(diǎn)。
2019年5月7日—11日,采用美國SVC HR-640i型全波段地物光譜儀,實(shí)地采集煙葉高光譜數(shù)據(jù)。測量時天氣晴朗、無風(fēng)。視場角為25°,探頭垂直向下。北京時間11:00—15:00進(jìn)行光譜測量,以煙草的中部葉為測量目標(biāo),每片葉子采集5次光譜數(shù)據(jù),將平均值作為該樣本光譜反射率數(shù)據(jù),每次測量前后均用標(biāo)準(zhǔn)參考板進(jìn)行標(biāo)定。該儀器有640通道,光譜探測范圍為350 nm~2500 nm。在350~1000 nm波段的帶寬≤1.5 nm,1000~1890 nm 波段的帶寬≤14 nm,1890~2500 nm波段的帶寬≤10 nm。對應(yīng)于煙葉光譜的測定位置,采用SPAD-502便捷式葉綠素儀測定煙葉的SPAD值,每片葉子測量3次SPAD值,取平均值作為該葉片的SPAD值。
1.3.1 光譜數(shù)據(jù)預(yù)處理及最優(yōu)變換方式確定 便于分?jǐn)?shù)階微分光譜的計(jì)算,將反射率光譜重采樣為間隔1 nm,并利用Savitzky-Golay(SG)濾波進(jìn)行平滑去噪。此外,利用原始反射率(R)和8種變換的反射率數(shù)據(jù)[倒數(shù)(1/R)、對數(shù)(logR)、均方根(SqrtR)、倒數(shù)對數(shù)(log(1/R))、對數(shù)倒數(shù)(1/logR)、均方根倒數(shù)(1/SqrtR)、多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變換(SNV)]與SPAD值進(jìn)行相關(guān)性分析,通過統(tǒng)計(jì)達(dá)到0.001顯著水平的波段數(shù),以確定估測煙葉SPAD值的最優(yōu)光譜變換方式,波段數(shù)越多表明與煙葉SPAD值的響應(yīng)關(guān)系越優(yōu)。由表1可知,SNV變換光譜與SPAD值達(dá)到0.001顯著水平的波段數(shù)量最多為654,表明SNV變換光譜與SPAD值的響應(yīng)關(guān)系最優(yōu),因此,SNV為最優(yōu)變換方式。

表1 變換光譜與SPAD值達(dá)到0.001水平相關(guān)的波長數(shù)量
1.3.2 高光譜分?jǐn)?shù)階微分 分?jǐn)?shù)階微分是整數(shù)階微分的擴(kuò)展,常用的分?jǐn)?shù)階微分采用Grünwald-Letnilov(G-L)方法,其定義如式(1)[26]。

為了確定輸入模型的特征波長,提高模型精度。首先通過分析煙葉分?jǐn)?shù)階微分光譜與煙葉SPAD值的相關(guān)性,去除未達(dá)到0.001顯著水平的波長,實(shí)現(xiàn)數(shù)據(jù)降維;然后基于RF算法及OOB重要性方法實(shí)現(xiàn)特征波長的篩選。
RF是通過Bootstrap的方法抽取訓(xùn)練樣本集,每個樣本未被抽中的概率為(1-2/n)n=0.368,(n足夠大時),這些未被抽中的樣點(diǎn)成為OOB[27],然后利用OOB,計(jì)算每個波長變量的重要性,其具體步驟如下[28]:
(1)以袋外樣本數(shù)據(jù)對n顆回歸樹測試,得到每棵樹t的OOB誤差(errOOBt);
(2)以隨機(jī)擾動方法打亂袋外樣本數(shù)據(jù)中變量XK的值,形成新袋外測試集,以新OOB測試集對n顆回歸樹測試,得到擾動后每棵樹t的OOB誤差(errOOB′t);
(3)計(jì)算兩次測試的OOB誤差的差值的平均值,即為單棵樹對變量XK重要性得分,計(jì)算如公式(2)所示。

雖然OOB對波長進(jìn)行了的重要性評價,但最終波長數(shù)量的過多或過少都會影響模型的準(zhǔn)確率和穩(wěn)定性。為此,本文將波長按照重要性從大到小進(jìn)行排序,選取排序前20的波長,依次增加波長的數(shù)量作為RF模型的自變量,即,第一次僅用排序第一的波段建模,第二次使用排序第一、二的波段建模(1≤e≤20,e為波長數(shù)量),SPAD值為因變量,構(gòu)建估測煙葉SPAD值模型,以決定系數(shù)(determination coefficient,R2)的最大值確定特征波長。
將樣本數(shù)據(jù)(g=80)按照2:1的比例隨機(jī)分成訓(xùn)練集(g=60)和驗(yàn)證集(g=20),以特征波長為自變量,SPAD為因變量,基于RF算法建立煙葉SPAD值估測模型,并通過R2和均方根誤差(root mean square error,RMSE)2個指標(biāo)對煙葉SPAD估測模型進(jìn)行精度驗(yàn)證。
表2為不同階次下估測煙葉SPAD值的特征波長數(shù)量及特征波長,通過分析不同階次的特征波長可知,估測煙葉SPAD值的特征波長主要有葉綠素強(qiáng)反射區(qū)的綠波段(499、500 nm),葉綠素強(qiáng)吸收帶的紅邊波段(634、636、702、703、732nm)、反映煙草冠層和葉片細(xì)胞結(jié)構(gòu)的近紅外波段(972、1286、1289、1295、1298、1316 nm)、和煙草含水量狀況相關(guān)的短紅外波段(1450、1453、1456、1806 nm)。

表2 不同階次特征波長數(shù)量及特征波長對應(yīng)表
以特征波長為自變量,煙葉SPAD值為因變量,建立RF-SPAD模型,模型精度如表3所示。由表3可知,RF-SPAD模型訓(xùn)練集R2的范圍為0.824~0.925,比較穩(wěn)定且較高。RF-SPAD模型驗(yàn)證集R2的范圍為0.346~0.690,RMSE的范圍為2.782~3.932,驗(yàn)證集精度最高的模型為1.9階次的RF-SPAD模型,R2=0.690,RMSE=2.799,其R2比0、1、2階次分別提高了22.1%、42.6%、87%,RMSE比0、1、2階次RMSE分別減少了13.5%,20.2%,27.8%。由煙葉實(shí)測與估測SPAD值散點(diǎn)圖(圖1)可以看出,SPAD小于44時,估測SPAD大于實(shí)測SPAD,在SPAD大于44時,估測SPAD小于實(shí)測SPAD,表明該模型在SPAD值低時會高估SPAD值,而在SPAD值較高時,會低估SPAD值。

圖1 1.9階次的RF-SPAD模型估測SPAD值與實(shí)測SPAD值的擬合關(guān)系

表3 RF-SPAD模型精度

續(xù)表3
為了進(jìn)一步確定分?jǐn)?shù)階微分的優(yōu)越性,利用偏最小二乘(PLS)和BP神經(jīng)網(wǎng)絡(luò)(BP)模型建立了估測煙葉SPAD值的PLS-SPAD、BP-SPAD模型,模型精度見表4,由表4可知,BP-SPAD模型的最優(yōu)估測精度在1.1階,R2為0.589較0、1、2階分別提高了25.8%、25.6%、38.0%,RMSE為3.219比0、1、2階分別減少了9%、15.7%、13.6%;PLS-SPAD模型的最優(yōu)估測精度在1.4階,R2為0.660較0、1、2階分別提高了19.7%、41.6%、145.4%,RMSE為2.870比0、1、2階分別減少了17.6%、22.0%、33.4%。

表4 PLS-SPAD、BP-SPAD模型驗(yàn)證集精度
為了更有效地利用高光譜估測葉綠素含量,林少喆等[29]通過數(shù)學(xué)變換后的反射率光譜構(gòu)建了不同光譜變換形式下冬小麥冠層SPAD值監(jiān)測模型,結(jié)果表明不同光譜變換形式下適宜模型的組合可提高SPAD值監(jiān)測效果;武倩雯等[30]以玉米抽雄期葉片為研究對象,探究了葉片葉綠素含量與多種高光譜參數(shù)的關(guān)系,表明預(yù)測玉米抽雄期葉綠素含量的最佳模型為:y葉綠素=6912x760+44.878(x760為760 nm處的光譜反射率一階微分值)。盡管這些研究表明,通過對原始反射率光譜進(jìn)行數(shù)學(xué)變換可以較好地估測葉綠素含量,但未結(jié)合分?jǐn)?shù)階微分,而本文在最優(yōu)變換的基礎(chǔ)上利用分?jǐn)?shù)階微分算法對光譜進(jìn)行了處理,挖掘了高光譜信息估測葉綠素的潛能,為提高葉綠素估測模型的精度提供了更大的可能。
在葉綠素含量估測模型構(gòu)建方面,本文除了建立RF-SPAD模型,為了進(jìn)一步確定分?jǐn)?shù)階微分的優(yōu)越性,還建立了PLS-SPAD、BP-SPAD模型,發(fā)現(xiàn)利用分?jǐn)?shù)階微分處理后的高光譜數(shù)據(jù)所建立的煙葉SPAD值估測模型較整數(shù)階微分具有較好的穩(wěn)定性和預(yù)測能力。但在不同的估測模型中,精度最高時所對應(yīng)的階次不同,RF-SPAD模型為1.9階次、BP-SPAD模型為1.1階次,PLS-SPAD模型為1.4階次,表明葉綠素含量估測模型精度的變化除了受特征波長的影響,還受到RF、BP、PLS自身性能的影響,即使基于相同的因變量與自變量方法,但使用不同的機(jī)器學(xué)習(xí)建模方法,得出的結(jié)果會存在差異。
受高光譜數(shù)據(jù)采集的限制,本文僅在煙草旺長期建立了煙葉SPAD值估測模型,隨著煙草生長地域、品種、生育期的變化,光譜與SPAD值的響應(yīng)關(guān)系也會發(fā)生變化,因此該模型是否適用于不同煙草品種、不同生育期煙葉SPAD值的預(yù)測還需進(jìn)一步驗(yàn)證。再者本研究僅利用地面高光譜數(shù)據(jù)研究了分?jǐn)?shù)階微分在葉綠素含量估測中的可行性,應(yīng)用于無人機(jī)遙感、衛(wèi)星遙感數(shù)據(jù)的效果如何,是今后研究大尺度葉綠素含量估測的方向。
本文基于高光譜分?jǐn)?shù)階微分光譜,利用1.9階次的特征波長所構(gòu)建的RF-SPAD模型R2=0.690,較0、1、2階次分別提高了22.1%、42.6%、87.0%,RMSE=2.799,比0、1、2階分別減少了13.5%,20.2%,27.8%,表明利用分?jǐn)?shù)階微分光譜進(jìn)行煙葉SPAD值估測是可行的,為高光譜數(shù)據(jù)定量估測作物SPAD值提供了新的思路。