李金敏 陳秀青,2 楊 琦 史良勝,*
基于高光譜的水稻葉片氮含量估計的深度森林模型研究
李金敏1陳秀青1,2楊 琦1史良勝1,*
1武漢大學(xué)水資源與水電工程科學(xué)國家重點實驗室, 湖北武漢 430072;2長江勘測規(guī)劃設(shè)計研究有限責(zé)任公司, 湖北武漢 430010
高光譜遙感已經(jīng)成為快速診斷作物水氮狀態(tài)的一種有效手段。然而, 傳統(tǒng)的回歸方法和機器學(xué)習(xí)往往難以挖掘高光譜的全部信息, 深度神經(jīng)網(wǎng)絡(luò)又通常需要大量的訓(xùn)練數(shù)據(jù), 因此本研究試圖探索在少量數(shù)據(jù)條件下構(gòu)建深度學(xué)習(xí)模型并實現(xiàn)葉片氮含量的精準估計。通過在湖北省監(jiān)利縣開展了連續(xù)2年不同氮素脅迫水平的水稻試驗, 測量了作物全生育期內(nèi)的216組冠層光譜和葉片氮含量?;谝浑A導(dǎo)數(shù)光譜, 本文構(gòu)建了一種新的深度學(xué)習(xí)模型(深度森林DF)來進行葉片氮含量的反演, 并與2種經(jīng)典機器學(xué)習(xí)模型(隨機森林RF和支持向量機SVM)和一種深度神經(jīng)網(wǎng)絡(luò)模型(多層感知器MLP)進行比較。結(jié)果表明, 在基于少量高光譜數(shù)據(jù)的情況下, DF對水稻葉片氮含量的估算精度要高于MLP, 其中預(yù)測精度最高的模型為全波段光譜反演的DF模型(2=0.919, RMSE=0.327)。在2種經(jīng)典機器學(xué)習(xí)模型中, RF的估計效果優(yōu)于SVM, 但2種模型結(jié)果都不夠穩(wěn)定。研究表明, 深度森林可以提升高光譜反演葉片氮含量的精度和穩(wěn)定性, 并且可以通過多粒度掃描相對減輕過擬合程度。該研究結(jié)果可為少量數(shù)據(jù)條件下快速監(jiān)測作物葉片氮含量提供參考。
葉片氮含量; 深度學(xué)習(xí); 機器學(xué)習(xí); 高光譜遙感; 水稻
氮是作物生長過程中必不可少的元素, 它在作物蛋白質(zhì)與核酸的合成中起到非常關(guān)鍵的作用。合理的氮肥供給可以促進作物生長, 但是過量的氮肥施用會帶來水體污染和溫室氣體過量排放等問題[1-2]??焖贌o損的葉片氮含量估計對于實施農(nóng)田精準管理是至關(guān)重要的。與傳統(tǒng)的破壞性取樣方法相比, 遙感技術(shù)已經(jīng)被認為是一種快速、動態(tài)、無損監(jiān)測農(nóng)田環(huán)境和作物生長狀況的有效手段[3-5]。自從Curran等[6]揭示了光譜信號與葉片氮含量之間的物理機制后, 研究者們開發(fā)出越來越多的算法用于解譯高光譜信息, 試圖更加精準地估計葉片氮含量。
線性方法, 如植被指數(shù)法、多元線性回歸和偏最小二乘回歸等, 由于原理簡單、操作方便, 已經(jīng)被廣泛應(yīng)用于光譜反演作物水氮及葉綠素含量的研究中[7-12]。然而, 高光譜數(shù)據(jù)通常有著很高的維度, 與葉片氮含量之間存在著高度的非線性關(guān)系, 導(dǎo)致這些方法很難挖掘出高光譜數(shù)據(jù)中隱藏的全部信息[7]。經(jīng)典的機器學(xué)習(xí)算法如隨機森林(random forest, RF)和支持向量機(support vector machine, SVM)等, 也被認為是準確高效的葉片氮含量估計方法[13-16]。但是這些機器學(xué)習(xí)算法的估計精度差異很大, 很少有一種穩(wěn)健的模型可以在各種數(shù)據(jù)集上表現(xiàn)出穩(wěn)定的預(yù)測效果。
深度學(xué)習(xí)(deep learning, DL)善于發(fā)現(xiàn)高維數(shù)據(jù)的信息[17], 目前在農(nóng)業(yè)領(lǐng)域已經(jīng)有了一些成功的應(yīng)用, 比如作物分類、病蟲害監(jiān)測和產(chǎn)量預(yù)測等[18-20]。深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)是深度學(xué)習(xí)領(lǐng)域中最為熱門的算法, 但是深度神經(jīng)網(wǎng)絡(luò)通常需要大量的數(shù)據(jù)來滿足訓(xùn)練要求。在農(nóng)田管理過程中獲取葉片氮含量標簽的成本很高, 導(dǎo)致其數(shù)據(jù)量很小(通常為幾百個數(shù)據(jù)), 因此深度學(xué)習(xí)在高光譜反演葉片氮含量的研究中進展緩慢[21]。Zhou等[22]在2019年提出了深度森林算法(deep forest, DF), 可以不基于神經(jīng)網(wǎng)絡(luò), 通過多粒度掃描和級聯(lián)森林實現(xiàn)DNN中特征轉(zhuǎn)化、層間處理和足夠復(fù)雜度的3個主要功能。其中, 級聯(lián)森林可以保證模型訓(xùn)練的深度, 而多粒度掃描可以降低數(shù)據(jù)處理的維度, 因此可以適用于少量數(shù)據(jù)的訓(xùn)練。目前深度森林及其改進模型已經(jīng)成功地應(yīng)用在高光譜圖像處理[23]、雷達目標分類[24]和水稻霜害種子識別[25]等研究領(lǐng)域。
鑒于深度學(xué)習(xí)在高光譜估計葉片氮含量方面的研究仍不充分[26], 本文探索在數(shù)據(jù)量較少的情況下(如幾百個數(shù)據(jù))構(gòu)建基于高光譜的水稻葉片氮含量估計的深度森林模型。通過設(shè)置不同水稻氮素處理水平, 獲取2年水稻全生育期的216組冠層高光譜和葉片氮含量數(shù)據(jù), 進行一階導(dǎo)數(shù)預(yù)處理, 并首次將深度森林算法應(yīng)用于葉片氮含量估計, 通過與傳統(tǒng)機器學(xué)習(xí)模型(隨機森林RF和支持向量機SVM)和深度神經(jīng)網(wǎng)絡(luò)模型多層感知器(multi-layer perceptron, MLP)進行對比, 嘗試理解不同算法在少量數(shù)據(jù)條件下的性能差別。
于2018年和2019年, 在湖北省監(jiān)利縣(29°49′21″N, 112°50′54″E)開展了連續(xù)2年不同氮素水平脅迫的水稻試驗。試驗小區(qū)分布、面積大小和處理水平如圖1和表1所示, 其中2018年氮肥處理水平為N0 (0 kg hm–2)、N1 (43 kg hm–2)、N2 (86 kg hm–2)、N3 (130 kg hm–2), 2019年氮肥處理水平為N0 (0 kg hm–2)、N1′ (50 kg hm–2)、N2′ (100 kg hm–2)、N3′ (150 kg hm–2), 每個氮素水平設(shè)置3個重復(fù), 在空間上隨機分布, 一共12塊試驗田。2018年水稻試驗完成10次觀測, 光譜采集日期為2018年7月14日、7月22日、7月28日、8月5日、8月15日、8月25日、9月5日、9月15日、9月25日、10月12日。2019年完成8次觀測, 光譜采集日期為2019年5月11日、5月21日、6月02日、6月15日、6月30日、7月17日、7月28日及8月9日。每次觀測12塊試驗田的高光譜和葉片氮含量, 最終得到216個數(shù)據(jù)樣本。
采用地物光譜儀(型號: FieldSpec F, R4ASD公司)獲取作物的冠層光譜反射率數(shù)據(jù)(350~2500 nm), 光纖探頭視場角為25°。光譜的測定選擇在晴朗無云的天氣下, 測量時間為10:00—14:00。每次測量將探頭垂直向下高于冠層頂部1 m左右, 測量前后用白板進行校正。每個試驗小區(qū)內(nèi)隨機選取8個點進行觀測, 每個點測量10次, 最終各小區(qū)的光譜反射率為8個點10次測量的平均值。采用三階多項式和25個數(shù)據(jù)點移動窗口的S-G濾波平滑, 并對光譜數(shù)據(jù)進行一階導(dǎo)數(shù)處理。此外, 所有的光譜反射率數(shù)據(jù)都剔除了1350~1450 nm、1800~2000 nm、2400~2500 nm的水分吸收帶。
在每次光譜測量之后, 從每個試驗小區(qū)隨機選取24片葉子, 隨機分為3組作為重復(fù), 用來測量作物的葉片氮含量。在105℃下殺青30 min, 使作物體內(nèi)的酶失活, 然后在70℃下烘至恒重。將干燥的葉片磨碎后通過0.5 mm的篩管, 對每個樣品的粉末進行半微量凱氏定氮法測定葉片總氮濃度, 葉片氮含量以百分比的形式表示, 統(tǒng)計結(jié)果如表2。

表1 2年水稻試驗小區(qū)的面積和處理水平
2018年氮肥處理水平為N0 (0 kg hm–2)、N1 (43 kg hm–2)、N2 (86 kg hm–2)、N3 (130 kg hm–2), 2019年氮肥處理水平為N0 (0 kg hm–2)、N1′ (50 kg hm–2)、N2′ (100 kg hm–2)、N3′ (150 kg hm–2)。
Nitrogen level of 2018: N0 (0 kg hm–2), N1 (43 kg hm–2), N2 (86 kg hm–2), N3 (130 kg hm–2). Nitrogen level of 2019: N0 (0 kg hm–2), N1′ (50 kg hm-2), N2′ (100 kg hm–2), N3′ (150 kg hm–2).

表2 2年水稻試驗葉片氮含量的統(tǒng)計特征
1.4.1 機器學(xué)習(xí)模型 隨機森林(RF)由Breiman[27]在2001年提出, 是一種集成機器學(xué)習(xí)學(xué)習(xí)算法, 采用自助采樣法抽取樣本, 利用不同的樣本構(gòu)建獨立的決策樹, 通過平均這些決策樹的輸出可以得到最終的模擬結(jié)果。支持向量機(SVM)通過非線性函數(shù)將原始數(shù)據(jù)映射到高維特征空間, 從而可以在更高維的空間上解決原始數(shù)據(jù)不能線性分割的難題。表3中列出了隨機森林和支持向量機的主要超參數(shù)調(diào)優(yōu)結(jié)果。
1.4.2 多層感知器 多層感知器(MLP)是一種典型的深度神經(jīng)網(wǎng)絡(luò), 通過輸入層神經(jīng)元接收外界輸入, 由多個隱藏層與輸出層神經(jīng)元對信號進行加工, 引入激活函數(shù)處理神經(jīng)元的輸出并增強非線性, 采用誤差后向傳播算法調(diào)整網(wǎng)絡(luò)中的權(quán)重實現(xiàn)模型優(yōu)化。表3列出了多層感知器的主要超參數(shù)調(diào)優(yōu)結(jié)果。
1.4.3 深度森林 深度森林(DF)是一種新的深度學(xué)習(xí)算法[22-23], 在多粒度掃描階段, 設(shè)置窗口在原始特征向量上滑動, 并利用基學(xué)習(xí)器(隨機森林)對掃描出的特征進行學(xué)習(xí), 提取出數(shù)據(jù)的原始信息。如圖2所示, 假定原始特征維度為400, 通過一個維度為100的窗口滑動, 默認滑動步長為1, 從而可以掃描出301個100維的特征向量。然后將這些100維的向量進行隨機森林回歸訓(xùn)練, 可以得到301個特征值, 這些特征值被依次拼接成一個301維的特征向量作為級聯(lián)森林的輸入。在本研究中采用了3種不同的滑動窗口, 分別為原始特征長度的1/4、1/8和1/16, 通過不同維度的窗口滑動, 更加全面地挖掘數(shù)據(jù)信息。
在級聯(lián)森林階段, 通過基學(xué)習(xí)器(隨機森林)對上一層傳遞的信息進行訓(xùn)練, 產(chǎn)生新的增強特征, 并將增強特征與多粒度掃描轉(zhuǎn)換后的特征進行拼接,拼接后的特征向量則傳遞到下一個級聯(lián)進行訓(xùn)練。除了第1個級聯(lián)是直接采用多粒度掃描階段的特征向量, 隨后的每一層都是采用拼接向量作為輸入。在每一層產(chǎn)生新的特征向量后, 都會在測試集上進行驗證, 如果在測試集上的精度有所提升, 則將特征信息傳遞給下一個級聯(lián)繼續(xù)運算; 如果測試集精度沒有提升, 則模型終止訓(xùn)練, 輸出最終預(yù)測結(jié)果。深度森林模型的主要超參數(shù)設(shè)置見表3。
1.4.5 參數(shù)設(shè)置和模型評價 本研究中的模型構(gòu)建與驗證分析都是基于Python語言編程完成的, 5種模型調(diào)參之后的主要超參數(shù)設(shè)置見表3, 其余未列出的超參數(shù)均為Python函數(shù)庫默認值。模型評價結(jié)果采用決定系數(shù)2和均方根誤差RMSE作為評價指標,



表3 4種模型關(guān)鍵超參數(shù)設(shè)置
圖3為2019年不同施氮處理的水稻拔節(jié)期冠層高光譜反射率(剔除水分吸收帶), 可以發(fā)現(xiàn)在不同施氮水平下, 水稻冠層光譜反射率的變化趨勢基本相同。在350~680 nm處, 光譜反射率很低, 在550 nm處出現(xiàn)綠峰; 從680 nm到760 nm處存在一個很明顯的“紅邊”效應(yīng), 光譜反射率顯著提升。在可見光波段處, N3′處理下的光譜反射率最小, 而N0處理下的光譜反射率最大, 而在760 nm以后, 施氮量大的N3′反射率明顯高于其他, 且反射率隨著施氮量的減少而降低, 這與前人研究一致[7,11]。
氮素水平: N0 (0 kg hm–2), N1′ (50 kg hm–2), N2′ (100 kg hm–2), N3′ (150 kg hm–2)。
Nitrogen level: N0 (0 kg hm–2), N1′ (50 kg hm–2), N2′ (100 kg hm–2), N3′ (150 kg hm–2).
基于一階導(dǎo)數(shù)光譜構(gòu)建了隨機森林(RF)和支持向量機(SVM)模型, 得到水稻葉片氮含量估計結(jié)果。從表4和圖4中可以得到, RF預(yù)測集最大的2p為0.891, 相應(yīng)RMSEp最小值為0.378; SVM最大2p為0.755, 相應(yīng)RMSEp最小值為0.568。其中RF在可見光波段估計精度較差,2p只有0.804; 而SVM在3種波段上的2p都低于0.8。綜合比較2種經(jīng)典機器學(xué)習(xí)算法, 隨機森林模型對于水稻葉片氮含量的估計效果要優(yōu)于支持向量機。
研究表明可見光波段和近紅外波段對于葉片氮含量都有吸收特征, 可見光波段主要與葉綠素有關(guān)(430 nm、460 nm、640 nm、660 nm等), 近紅外波段以蛋白質(zhì)的響應(yīng)為主(1020 nm、1510 nm、1980 nm、2060 nm、2180 nm等)[6-7,28]。但是支持向量機模型不能很好地完成水稻葉片氮含量的估計, 隨機森林模型在可見光波段估計精度也相對較差, 因此可能需要更加深度的模型來解譯高光譜信息。
基于少量的水稻冠層高光譜數(shù)據(jù), 本研究構(gòu)建了一種新的深度學(xué)習(xí)模型(深度森林DF)用來估計葉片氮含量, 并與傳統(tǒng)的多層感知器MLP模型進行比較, 估計結(jié)果匯總于表5, 圖5顯示了2種方法估計精度最高的結(jié)果。從表中可知, MLP預(yù)測集決定系數(shù)2p最大值為0.872, 相應(yīng)均方根誤差RMSEp最小值為0.392; DF最大2p為0.919, 相應(yīng)RMSEp最小值為0.327。綜合比較2種深度學(xué)習(xí)算法可以發(fā)現(xiàn), 在小數(shù)據(jù)集情況下, DF對水稻葉片氮含量的估計精度要高于MLP。與Yu等[26]的研究結(jié)果相比, 考慮到其訓(xùn)練數(shù)據(jù)是在實驗室內(nèi)對單片葉子進行光譜測量得到的, 本研究利用的是水稻田中原位觀測的冠層高光譜數(shù)據(jù), 土壤和水汽的干擾更強, 而DF在預(yù)測集上最大的2p為0.919, 仍比Yu等[26]的研究中采用SAE-FNN算法得到的0.903要大, 因此本文所構(gòu)建的深度森林模型可以適用于少量數(shù)據(jù)條件下的訓(xùn)練, 并且預(yù)測精度比一些神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的深度學(xué)習(xí)模型還要高。

表4 隨機森林和支持向量機對水稻葉片含氮量估算效果分析

表5 2種深度學(xué)習(xí)模型對水稻葉片含氮量估算效果分析
通過表4和表5的對比表明, MLP的預(yù)測精度在全波段和近紅外波段上低于RF; 而DF可以顯著提高經(jīng)典機器學(xué)習(xí)在葉片氮含量上的估計精度。在全波段光譜反演中, DF的2p比RF提升了0.03; 在可見光波段反演中, DF的2p提升了0.10; 在近紅外波段反演中, DF的2p提升了0.03。相比于在小數(shù)據(jù)集上表現(xiàn)不穩(wěn)定的傳統(tǒng)機器學(xué)習(xí)算法(RF和SVM), 通過多粒度掃描和級聯(lián)結(jié)構(gòu)構(gòu)建的深度森林模型不僅大大改善了葉片氮含量的估計效果, 同時還提升了模型的穩(wěn)健性。
高光譜遙感已經(jīng)成為作物葉片氮含量快速無損監(jiān)測的有效手段, 但是在高光譜反演模型中, 傳統(tǒng)的回歸方法和機器學(xué)習(xí)往往不夠穩(wěn)定, 深度神經(jīng)網(wǎng)絡(luò)又通常需要大量的訓(xùn)練數(shù)據(jù)。例如, Hu等[29]在利用深度學(xué)習(xí)進行人臉識別任務(wù)中, 認為500,000張圖像樣本是相對較大的樣本, 而10,000張圖像樣本是小數(shù)據(jù)。Koppe等[30]指出相對于數(shù)據(jù)獲取較易(如在線社交媒體平臺或基于智能手機和移動傳感器的數(shù)據(jù))的研究領(lǐng)域, 在人類精神病學(xué)研究中可用的數(shù)據(jù)屬于小樣本, 其數(shù)量通常小于10,000個。然而, 在利用高光譜反演葉片氮含量的眾多研究中, 數(shù)據(jù)量通常都不超過1000, 如Yi等[31]利用195個水稻冠層高光譜數(shù)據(jù)構(gòu)建人工神經(jīng)網(wǎng)絡(luò), 進而監(jiān)測其冠層氮素水平; 田永超等[8]對360個水稻光譜數(shù)據(jù)構(gòu)建植被指數(shù)模型, 實現(xiàn)葉片氮含量的精準估計; Tan等[32]利用192個水稻高光譜反射率數(shù)據(jù)構(gòu)建BPSO-SVR模型, 定量地解譯出寒地水稻的冠層全氮含量。正是由于冠層高光譜反射率和氮素標簽數(shù)據(jù)獲取的成本較高, 數(shù)據(jù)量較小(通常為幾百), 導(dǎo)致其深度學(xué)習(xí)研究進展緩慢。Fu等[33]的綜述研究表明, 目前只有Yu等[26]的研究中構(gòu)建了針對甜菜葉片高光譜圖像數(shù)據(jù)集的深度學(xué)習(xí)模型, 但是如何利用深度學(xué)習(xí)來解譯野外復(fù)雜環(huán)境下的冠層高光譜信息并實現(xiàn)氮素水平的精準估計, 仍然缺乏相應(yīng)研究。本研究以水稻為研究對象, 通過在全生育期內(nèi)獲取水稻的冠層光譜和葉片氮含量數(shù)據(jù), 嘗試在小數(shù)據(jù)集(216個樣本)條件下構(gòu)建新的深度學(xué)習(xí)模型(深度森林DF), 并與經(jīng)典機器學(xué)習(xí)模型(隨機森林RF和支持向量機SVM)和深度神經(jīng)網(wǎng)絡(luò)模型(多層感知器MLP)進行比較。結(jié)果表明, DF的估計精度高于MLP, 也高于同類研究中的SAE-FNN算法[26], 證明在小數(shù)據(jù)條件下深度森林模型可以實現(xiàn)精準的氮素估計。
此外, 還可以發(fā)現(xiàn), 由于光譜數(shù)據(jù)的維度都是成百上千, 而田間試驗獲取的樣本數(shù)量通常只有幾百, 因此本研究中幾乎所有的模型都存在一定的過擬合現(xiàn)象, 這在其他文獻中也有反映。例如, Yao等[34]的高光譜估計冬小麥葉片氮含量研究中, 通過一階導(dǎo)數(shù)處理的支持向量機模型建模集2為0.96, 預(yù)測集R為0.78; Yu等[26]的高光譜估計油菜葉片氮含量研究中, 深度學(xué)習(xí)模型SAE-FNN10建模集2為0.952, 預(yù)測集2為0.903。盡管過擬合現(xiàn)象不可避免, 但是對比隨機森林RF和深度森林DF, 在全波段上建模集和預(yù)測集2之差從0.09縮減到0.06, 在可見光波段上從0.17縮減到0.08, 在近紅外波段上從0.09縮減到0.06。這也許可以解釋為DF中的多粒度掃描階段可以利用窗口滑動減小數(shù)據(jù)處理的維度, 從而減輕相對過擬合的程度。
根據(jù)以往文獻報道, 由于作物葉片中蛋白質(zhì)和葉綠素對不同光譜的響應(yīng)程度不同, 因此有必要同時利用可見光和近紅外區(qū)域的吸收特征來進行葉片氮含量的估計[35]。然而, 不同方法和不同光譜數(shù)據(jù)提取出的關(guān)鍵波長有著很大的差別。例如, Feng等[7]的研究指出由葉綠素導(dǎo)致的光譜強吸收主要在可見光波段(如紅、藍波段); Wang等[36]研究表明通過對葉片氮估計構(gòu)建PLSR、SPA-MLR、RFR等模型, 提取出的重要波長主要在可見光波段(400~760 nm); 而Yao等[34]研究中利用包絡(luò)線去除法和植被指數(shù)法選擇的關(guān)鍵波長主要位于紅邊和近紅外區(qū)域。與傳統(tǒng)的研究方法不同, 本文中采用的深度森林模型結(jié)果表明, 無論是可見光波段、近紅外波段光譜, 還是全波段光譜, 深度森林都能實現(xiàn)精準的葉片氮含量估計(2>0.9), 這表明深度森林通過多粒度掃描和級聯(lián)森林2個模塊, 實現(xiàn)了特征轉(zhuǎn)化、層間處理和足夠復(fù)雜度3個功能, 從而可以充分挖掘高光譜數(shù)據(jù)中的隱藏信息。
在基于少量高光譜數(shù)據(jù)構(gòu)建的深度學(xué)習(xí)模型中,深度森林對水稻葉片氮含量的預(yù)測精度高于多層感知器, 其中預(yù)測精度最高的模型為全波段光譜反演的深度森林模型(2=0.919, RMSE=0.327)。在本文采用的2種經(jīng)典機器學(xué)習(xí)模型中, 隨機森林的表現(xiàn)優(yōu)于支持向量機, 但2種模型的表現(xiàn)都不夠穩(wěn)定。深度森林可以提升經(jīng)典機器學(xué)習(xí)模型對葉片氮含量的估計精度和穩(wěn)定性, 并且可以通過多粒度掃描減輕模型相對過擬合程度。
[1] Zhang X, Davidson E A, Mauzerall D L, Searchinger T D, Dumas P, Shen Y. Managing nitrogen for sustainable development., 2015, 528: 51–59.
[2] Yu C, Huang X, Chen H, Godfray H C J, Wright J S, Hall J W, Gong P, Ni S, Qiao S, Huang G. Managing nitrogen to restore water quality in China., 2019, 567: 516–520.
[3] Vigneau N, Ecarnot M, Rabatel G, Roumet P. Potential of field hyperspectral imaging as a non destructive method to assess leaf nitrogen content in wheat., 2011, 122: 25–31.
[4] 高林, 楊貴軍, 李長春, 馮海寬, 徐波, 王磊, 董錦繪, 付奎. 基于光譜特征與PLSR結(jié)合的葉面積指數(shù)擬合方法的無人機畫幅高光譜遙感應(yīng)用. 作物學(xué)報, 2017, 43: 549–557. Gao L, Yang G J, Li C C, Feng H K, Xu B, Wang L, Dong J H, Fu K. Application of an improved method in retrieving leaf area index combined spectral index with PLSR in hyperspectral data generated by unmanned aerial vehicle snapshot camera., 2017, 43: 549–557 (in Chinese with English abstract).
[5] 吾木提·艾山江, 買買提·沙吾提, 陳水森, 李丹. 基于GF-1/2衛(wèi)星數(shù)據(jù)的冬小麥葉面積指數(shù)反演. 作物學(xué)報, 2020, 46: 787–797. Umut H, Mamat S, Chen S S, Li D. Inversion of leaf area index of winter wheat based on GF-1/2 image., 2020, 46: 787–797 (in Chinese with English abstract).
[6] Curran P J. Remote sensing of foliar chemistry., 1989, 30: 271–278.
[7] Feng W, Yao X, Zhu Y, Tian Y C, Cao W X. Monitoring leaf nitrogen status with hyperspectral reflectance in wheat., 2008, 28: 394–404.
[8] 田永超, 楊杰, 姚霞, 曹衛(wèi)星, 朱艷. 利用葉片高光譜指數(shù)預(yù)測水稻群體葉層全氮含量. 作物學(xué)報, 2010, 36: 1529–1537. Tian Y C, Yang J, Yao X, Cao W X, Zhu Y. Monitoring canopy leaf nitrogen concentration based on leaf hyperspectral indices in rice., 2010, 36: 1529–1537 (in Chinese with English abstract).
[9] 陳兵, 韓煥勇, 王方永, 劉政, 鄧福軍, 林海, 余渝, 李少昆, 王克如, 肖春華. 利用光譜紅邊參數(shù)監(jiān)測黃萎病棉葉葉綠素和氮素含量. 作物學(xué)報, 2013, 39: 319–329. Chen B, Han H Y, Wang F Y, Liu Z, Deng F J, Lin H, Yu Y, Li S K, Wang K R, Xiao C H. Monitoring chlorophyll and nitrogen contents in cotton leaf infected by Verticillium wilt with spectra red edge parameters., 2013, 39: 319–329 (in Chinese with English abstract).
[10] 吳亞鵬, 賀利, 王洋洋, 劉北城, 王永華, 郭天財, 馮偉. 冬小麥生物量及氮積累量的植被指數(shù)動態(tài)模型研究. 作物學(xué)報, 2019, 45: 1238–1249. Wu Y P, He L, Wang Y Y, Liu B C, Wang Y H, Guo T C, Feng W. Dynamic model of vegetation indices for biomass and nitrogen accumulation in winter wheat., 2019, 45: 1238–1249 (in Chinese with English abstract).
[11] 李宗飛, 蘇繼霞, 費聰, 李陽陽, 劉寧寧, 戴宇祥, 張開祥, 王開勇, 樊華, 陳兵. 基于高光譜數(shù)據(jù)的滴灌甜菜葉片全氮含量估算. 作物學(xué)報, 2020, 46: 557–570. Li Z F, Su J X, Fei C, Li Y Y, Liu N N, Dai Y X, Zhang K X, Wang K Y, Fan H, Chen B. Estimation of total nitrogen content in sugarbeet leaves under drip irrigation based on hyperspectral characteristic parameters and vegetation index., 2020, 46: 557–570 (in Chinese with English abstract).
[12] 陳秀青, 楊琦, 韓景曄, 林琳, 史良勝. 基于葉冠尺度高光譜的冬小麥葉片含水量估算. 光譜學(xué)與光譜分析, 2020, 40: 891–897. Chen X Q, Yang Q, Han J Y, Lin L, Shi L S. Estimation of winter wheat leaf water content based on leaf and canopy hyperspectral data., 2020, 40: 891–897 (in Chinese with English abstract).
[13] 張筱蕾, 劉飛, 聶鵬程, 何勇, 鮑一丹. 高光譜成像技術(shù)的油菜葉片氮含量及分布快速檢測. 光譜學(xué)與光譜分析, 2014, 34: 2513–2518. Zhang X L, Liu F, Nie P C, He Y, Bao Y D. Rapid detection of nitrogen content and distribution in oilseed rape leaves based on hyperspectral imaging., 2014, 34: 2513–2518 (in Chinese with English abstract).
[14] 李旭青, 劉湘南, 劉美玲, 吳伶. 水稻冠層氮素含量光譜反演的隨機森林算法及區(qū)域應(yīng)用. 遙感學(xué)報, 2014, 18: 923–945. Li X Q, Liu X N, Liu M L, Wu L. Random forest algorithm and regional applications of spectral inversion model for estimating canopy nitrogen concentration in rice., 2014, 18: 923–945 (in Chinese with English abstract).
[15] Liang L, Di L, Huang T, Wang J, Lin L, Wang L, Yang M. Estimation of leaf nitrogen content in wheat using new hyperspectral indices and a random forest regression algorithm., 2018, 10: 1940.
[16] 依爾夏提·阿不來提, 買買提·沙吾提, 白燈莎·買買提艾力, 安申群, 馬春玥. 基于隨機森林法的棉花葉片葉綠素含量估算. 作物學(xué)報, 2019, 45: 81–90. Ershat A, Mamat S, Baidengsha M, An S Q, Ma C Y. Estimation of leaf chlorophyll content in cotton based on the random forest approach., 2019, 45: 81–90 (in Chinese with English abstract).
[17] LeCun Y, Bengio Y, Hinton G. Deep learning., 2015, 521: 436–444.
[18] Mohanty S P, Hughes D P, Salathé M. Using deep learning for image-based plant disease detection., 2016, 7: 1419.
[19] Yang Q, Shi L, Han J, Zha Y, Zhu P. Deep convolutional neural networks for rice grain yield estimation at the ripening stage using UAV-based remotely sensed images., 2019, 235: 142–153.
[20] Zhong L, Hu L, Zhou H. Deep learning based multi-temporal crop classification., 2019, 221: 430–443.
[21] Sun J, Yang J, Shi S, Chen B, Du L, Gong W, Song S. Estimating rice leaf nitrogen concentration: influence of regression algorithms based on passive and active leaf reflectance., 2017, 9: 951.
[22] Zhou Z, Feng J. Deep forest., 2019, 6: 74–86.
[23] Liu X, Wang R, Cai Z, Cai Y, Yin X. Deep multigrained cascade forest for hyperspectral image classification., 2019, 57: 8169–8183.
[24] Zhang J, Song H, Zhou B. SAR target classification based on deep forest model., 2020, 12: 128.
[25] Zhang L, Sun H, Rao Z, Ji H. Hyperspectral imaging technology combined with deep forest model to identify frost-damaged rice seeds., 2020, 229: 117973.
[26] Yu X, Lu H, Liu Q. Deep-learning-based regression model and hyperspectral imaging for rapid detection of nitrogen concentration in oilseed rape (L.) leaf., 2018, 172: 188–193.
[27] Breiman L. Random forests., 2001, 45: 5–32.
[28] Berger K, Verrelst J, Féret J, Wang Z, Wocher M, Strathmann M, Danner M, Mauser W, Hank T. Crop nitrogen monitoring: recent progress and principal developments in the context of imaging spectroscopy missions., 2020, 242: 111758.
[29] Hu G, Peng X, Yang Y, Hospedales T M, Verbeek J. Frankenstein: learning deep face representations using small data., 2017, 27: 293–303.
[30] Koppe G, Meyer-Lindenberg A, Durstewitz D. Deep learning for small and big data in psychiatry., 2020, 46: 176–190.
[31] Yi Q, Huang J, Wang F, Wang X, Liu Z. Monitoring rice nitrogen status using hyperspectral reflectance and artificial neural network., 2007, 41: 6770–6775.
[32] Tan K, Wang S, Song Y, Liu Y, Gong Z. Estimating nitrogen status of rice canopy using hyperspectral reflectance combined with BPSO-SVR in cold region., 2018, 172: 68–79.
[33] Fu Y, Yang G, Li Z, Li H, Li Z, Xu X, Song X, Zhang Y, Duan D, Zhao C. Progress of hyperspectral data processing and modelling for cereal crop nitrogen monitoring., 2020, 172: 105321.
[34] Yao X, Huang Y, Shang G, Zhou C, Cheng T, Tian Y, Cao W, Zhu Y. Evaluation of six algorithms to monitor wheat leaf nitrogen concentration., 2015, 7: 14939–14966.
[35] Kokaly R F. Investigating a physical basis for spectroscopic estimates of leaf nitrogen concentration., 2001, 75: 153–161.
[36] Wang J, Chen Y, Chen F, Shi T, Wu G. Wavelet-based coupling of leaf and canopy reflectance spectra to improve the estimation accuracy of foliar nitrogen concentration.l, 2018, 248: 306–315.
Deep learning models for estimation of paddy rice leaf nitrogen concentration based on canopy hyperspectral data
LI Jin-Min1, CHEN Xiu-Qing1,2, YANG Qi1, and SHI Liang-Sheng1,*
National Key Laboratory of Water Resources and Hydropower Engineering Science, Wuhan University, Wuhan 430072, Hubei, China;2Changjiang Survey Planning, Design and Research Co., Ltd., Wuhan 430010, Hubei, China
Rapid and nondestructive detection of crop nitrogen status is crucial to precision agriculture management. Hyperspectral remote sensing has been proposed to be a powerful tool for expediently monitoring crop nitrogen status. However, conventional regression methods and machine learning (ML) are difficult to utilize the full information of hyperspectral data, and deep neural networks (DNN) usually require a huge number of training data. Therefore, we attempt to construct deep learning models with a small amount of data and achieve accurate estimation of leaf nitrogen concentration (LNC). A two-year field experiment of paddy rice with four nitrogen levels were conducted at Jianli, Hubei province, China. A total of 216 samples containing canopy hyperspectral data and rice LNC were measured during two growing seasons. Based on the first derivative of hyperspectral data, a new deep learning model (deep forest, DF) was constructed for LNC estimation and compared with two traditional machine learning models (random forest, RF and support vector machine, SVM) and one deep neural network model (multi-layer perceptron, MLP). The results showed that, based on a small number of hyperspectral data, deep forest acquired higher accuracy than MLP. And the optimal estimation (2= 0.919, RMSE = 0.327) was obtained by the deep forest model based on full-wave band spectrum (350–2500 nm). Between two classical machine learning models, random forest achieved better results than SVM, but both methods were unstable. In conclusion, deep forest improved the prediction accuracy and model robustness for all band situations, and alleviated the degree of overfitting by multi-grained scanning. These results can provide a deep insight to detect crop nitrogen status rapidly when confronted with limited data.
leaf nitrogen concentration; deep learning; machine learning; hyperspectral remote sensing; paddy rice
10.3724/SP.J.1006.2021.02060
本研究由國家自然科學(xué)基金項目(51861125202)資助。
This study was supported by the National Natural Science Foundation of China (51861125202).
史良勝, E-mail: liangshs@whu.edu.cn
E-mail: jinmlee@whu.edu.cn
2020-08-24;
2020-12-01;
2021-01-04.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20210104.1140.002.html