張 敏,劉 濤,孫成明*
(1.揚州大學農學院江蘇省作物遺傳生理重點實驗室/江蘇省作物栽培生理重點實驗室,江蘇揚州 225009;2.揚州大學江蘇省糧食作物現代產業技術協同創新中心,江蘇揚州 225009)
小麥地上部生物量(以下簡稱生物量)是反映作物生長狀況的重要指標之一。為了實現小麥的最佳生長和減少環境污染,農民需要通過不同生育時期的生物量信息來判斷小麥長勢,進一步指導施肥。而且在接近生育后期時估算作物的生物量還可用于產量預測[1]。在傳統手段上準確測定作物生物量需要破壞性取樣[2],這不僅費時費力,而且通常不適用于大面積監測[3]。
隨著科學技術的發展,遙感技術逐漸被用于農業監測,為在局部和區域尺度上定量估測作物生物量提供了一種經濟高效的方法[4-5]。同時,近乎連續光譜的高光譜傳感器的出現,為準確估測生物量等作物理化指標開辟了新的道路[6]。隨著無人機(UAV)硬件和軟件的快速發展,基于無人機平臺的遙感監測越來越多地用作數據收集工具,其操作簡單、超高的軟硬件集成度、靈活的飛行高度等特點可以快速獲取大量遙感數據,而且較低的飛行高度大大提高了遙感數據的空間分辨率[7]。
早期一些RGB相機和多光譜相機計算的顏色指數或植被指數(VI)在估測農學參數時存在一定限制,如基于多光譜的紅波段和近紅外波段得到的歸一化差異植被指數(NDVI),它在估測生物量或葉面積指數時容易出現飽和現象[8-9]。因此,它不能用來準確估測非常密集的冠層生物量[10]。然而,基于高光譜計算的植被指數被認為對量化植被生物量更加敏感[11]。研究結果表明,由特定波段構建的歸一化差異植被指數(NDVI)可以提高生物量估測精度。Hansen等[12]的研究中表明,基于NDVI(718、720 nm)的線性模型在用于估算冬小麥生物量時準確度很高。Cho等[13]使用機載高光譜圖像發現基于NDVI(740、 771 nm)的線性模型用于估測草的生物量時比基于傳統NDVI(665、 801 nm)的線性模型精度更高。Ren等[14]研究表明,基于NDVI(693、 862 nm)的線性模型相對于土壤調整植被指數(SAVI)估測的荒漠草原綠色生物量具有更好的估測性能。
鑒于此,以設置不同品種、氮肥梯度和密度處理的小麥大田試驗為基礎,筆者利用無人機平臺搭載高光譜相機獲取不同時期小麥冠層反射光譜數據,利用高光譜通道多、光譜分辨率高、信息豐富等特點,提取17種不同的植被指數,充分挖掘冠層反射光譜信息;通過將植被指數與生物量進行相關性分析,篩選與生物量相關性達到顯著水平的植被指數構建各生育期生物量的偏最小二乘回歸模型(PLSR),并將3個生育時期數據融合在一起構建生物量全生育期估測模型,旨在尋找不同生育時期生物量敏感植被指數,構建多時期生物量估測模型,提高生物量估測精度。
1.1 試驗地概況試驗于2020—2021年在儀征市大儀鎮(119°10′E,32°30′N)進行,試驗區全年溫暖濕潤,雨水充沛,四季分明,屬亞熱帶季風氣候地區。常年主導風向為東南風,多年平均降水量約1 014 mm,多年平均氣溫約15.1 ℃,多年平均日照時長約6 h。
1.2 試驗材料該試驗以揚麥23號、鎮麥9號和寧麥13號為研究對象。
1.3 試驗方法試驗設置4個氮肥梯度:225.0 kg/hm2(N1處理)、202.5 kg/hm2(N2處理)、180.0 kg/hm2(N3處理)、157.5 kg/hm2(N4處理);2個條播密度:225萬株/hm2(M1處理)和300萬株/hm2(M2處理)基本苗。肥料采用含氮量44%的樹脂包衣控釋氮肥(控釋期180 d),磷鉀肥分別為P2O5含量為12%的過磷酸鈣和K2O含量為60%的KCl,施用量均為120 kg/hm2,所有肥料均于播前底施。于2020年11月3日播種,小區面積為18 m2,重復2次,共48小區。
1.4 數據獲取方式
1.4.1小麥地上部生物量測定。分別于小麥拔節期、孕穗期、開花期進行田間取樣。各處理隨機選取20株長勢均勻的小麥植株,剪掉根系,清水洗凈,放入烘箱在105 ℃下殺青30 min后將溫度調節到80 ℃繼續烘干至恒重,稱取干重后換算成單位面積地上部干物重,即地上部生物量。
1.4.2光譜數據獲取過程。于拔節期、孕穗期、開花期采用DJI M600 PRO無人機搭載GaiaSky-Mini2機載高光譜成像系統獲取試驗田塊高光譜圖像數據,飛行高度為100 m,手動規劃航線坐標點,采用定點懸停掃描,航向和旁向重復率均為80%,飛行任務開始前校準鏡頭調整曝光時間,起飛后拍攝地面3張不同反射率灰布,為后期圖像反射率校準提供參考標準。每次飛行時間為10:30—11:30,天氣晴朗、無強風。
1.5 數據分析方法
1.5.1光譜數據預處理。使用SpecView對原始數據依次進行鏡頭校準、反射率校準、大氣校正即可得到校準后的高光譜圖像數據。使用HiSpectralSticher軟件對校準后的高光譜圖像進行拼接。使用Envi 5.3軟件并利用Subset Data from ROIs工具對拼接完成的高光譜圖像進行裁剪。
1.5.2植被指數提取。該研究利用MATLAB R2020a軟件,通過預處理后的高光譜圖像分別計算和提取了每個處理較為常用的17種植被指數(詳細植被指數名稱見表1)。關于這些植被指數的研究較多,在小麥的生長監測中早已被證明具有很高的相關性和可靠性。

表1 植被指數及計算方法
1.6 建模方法及模型驗證指標為了構建最佳的小麥生物量估測模型,采用偏最小二乘回歸(PLSR)進行建模,PLSR融合了主成分分析法和多元線性回歸算法,有效地消除了多元線性回歸中各變量的共線性,剔除了冗余信息,以提高計算的效率[28]。該研究利用Python 3.9和scikit-learn庫進行PLSR建模,訓練集和驗證集比例為3∶1。通過決定系數(R2)、均方根誤差(RMSE)檢驗模型的精度。

2.1 各生育期植被指數與生物量的相關性分別對拔節期、孕穗期、開花期和全生育期的植被指數和生物量進行相關性分析,結果見表2。拔節期、孕穗期、開花期樣本數均為24個,全生育期樣本數為72個。從表2可以看出,拔節期17種植被指數中與生物量相關性最低的是WBI指數,相關系數僅為-0.286,其余指數與生物量的相關性均達到極顯著相關水平,其中相關系數最高的是DVI和RDVI指數,相關系數均為0.784。孕穗期TCARI指數與生物量的相關性最低,相關系數為0.188,未達到顯著相關水平;除NPCI指數和MCARI指數與生物量只達到顯著相關水平外,其余植被指數均與生物量均達到極顯著相關水平,其中相關系數最高的指數是GNDVI,系數為0.766。開花期有4個植被指數與生物量達到極顯著相關水平,相關系數最大的是WBI,為-0.642。全生育期除GNDVI與生物量相關性未達到顯著水平、NPCI達到顯著水平外,其余15種植被指數與生物量的相關性均達到極顯著相關,其中相關系數最高的是WI指數,相關系數為-0.799。

表2 基于高光譜數據的不同植被指數與生物量的相關性
2.2 基于顯著相關植被指數的小麥生物量模型構建根據前述相關分析的結果可知,在小麥拔節期、孕穗期和全生育期各有16種植被指數與生物量達到顯著相關水平,在小麥開花期有8種植被指數與生物量達到顯著相關水平。該研究以達到顯著相關為篩選標準,利用各生育期與生物量達到顯著相關水平的植被指數構建偏最小二乘回歸模型,并繪制訓練集生物量1∶1線圖(圖 1)。
從圖 1可以看出,各時期生物量的估測值和真實值均較為均勻的對稱分布在1∶1線兩側,圖1D(全生育期)和1B(孕穗期)中各點圍繞1∶1線分布更加緊湊,線性趨勢更為明顯,圖1A(拔節期)中各點分布更為松散,松散程度最高的是圖1C(開花期)。與之對應的是各生育期生物量模型的決定系數(R2),R2最高的是全生育期為0.82,孕穗期精度次之,R2為0.72,拔節期和開花期R2分別為0.61和0.54。孕穗期、拔節期、開花期生物量模型均方根誤差(RMSE)依次為461.74、472.05、742.97 kg/hm2,R2越高則RMSE越低,但R2最高的全生育期模型的RMSE反而也是最高,為818.60 kg/hm2。

注:A.拔節期;B.孕穗期;C.開花期;D.全生育期。
2.3 基于顯著相關植被指數的小麥生物量模型驗證表3是各生育期小麥生物量PLSR估測模型中各植被指數對應的權重和常數項。利用各生育期預留的小麥生物量驗證數據代入到模型中對各生物量估測模型進行精度驗證,同時繪制真實值和估測值的1∶1線圖(圖 2)。

表3 各生育期生物量PLSR模型參數
從圖 2可以看出,圖2D中各點分布最靠近1∶1線,而且均勻分布在線的兩側,50%左右的點幾乎分布在線上;圖2A、B中各點分布也較為均勻,圖2C中各點分布效果最差。各生育期PLSR模型的驗證精度均較建模精度有所提高,拔節期、孕穗期、開花期和全生育期的R2分別為0.68、0.82、0.57和0.93,較建模R2分別提高0.07、0.10、0.03和0.11,RMSE分別為354.92、402.09、652.86和519.67 kg/hm2,較建模RMSE分別降低了117.13、59.65、90.11和298.93 kg/hm2。

注:A.拔節期;B.孕穗期;C.開花期;D.全生育期。
該研究中不同生物量與植被指數相關性分析可以看出,拔節期和孕穗期生物量與各植被指數的相關性的相關程度很高,分別有16和14種植被指數達到極顯著相關,而且拔節期相關系數絕對值大多達到0.7,孕穗期相關系數絕對值普遍在0.6以上;而開花期17種植被指數中只有8種達到顯著相關,其中4種達到極顯著相關,許多在拔節期和孕穗期均極顯著相關的植被指數在開花期均未達到顯著相關。這可能是因為拔節期和孕穗期小麥植株冠層葉片不夠密集、葉片重疊率低,而到了開花期植株冠層茂盛、空間重疊率高,導致植被指數出現飽和現象[15]。Gao等[8-9]的研究都認為基于多光譜的紅波段和近紅外波段得到的歸一化差異植被指數(NDVI),它在估測生物量或葉面積指數時容易出現飽和現象,Clevers等[10]認為,光譜飽和現象使得一些植被指數在估測密集植被的冠層生物量時精度受限。陳鵬飛等[29]研究指出,NDVI與OSAVI可用于準確估測中低生物量信息,在較高冠層生物量條件下估測能力顯著下降。該研究結果同樣表明,模型在估算拔節期和孕穗期的生物量精度高于開花期,這可能是由于開花期植被相對較密,使得光譜飽和現象更為嚴重。此外,有研究表明,機器學習模型對訓練數據的量具有較高的要求[30-32]。對于全生育期而言,數據量的增加使得模型被訓練得更為充足,各指數的信息被挖掘得更為充分,這也解釋了利用全生育期數據訓練的模型相較而言,精度提升明顯。盡管RMSE相較拔節期和孕穗期有所提高,這是由于融入了開花期的數據,使得實測生物量的基數增大。
該研究提取了基于無人機高光譜數據共提取了的17種植被指數,并通過相關性分析篩選了各生育期與生物量相關系較高的植被指數,以構建最優的PLSR模型。結果顯示,各生育期與生物量存在顯著相關系的植被指數存在差異,其中在拔節期,相關系數最高的是DVI(r=0.784)和RDVI(r=0.784);孕穗期最高的是GNDVI(r=0.766);開花期最高的是WBI(r=-0.642);全生育期最高的是WI(r=-0.799)。該研究所構建的PLSR模型能夠很好地擬合生物量與植被指數之間的關系。對于拔節期,精度達到0.68;孕穗期精度達到0.82;開花期精度達到0.57;全生育期精度達到0.93;該研究中,在低植被覆蓋的拔節期和孕穗期,模型受到的飽和效應較小,精度也高于高植被覆蓋的開花期;此外,具有更多訓練樣本的全生育期具有更高的精度。
整體而言,該研究結合相關系分析和PLSR算法所構建的小麥生物量估算模型具有良好的精度,能夠為田間作物長勢監測與農田生產決策提供有效的信息與參考。