陶惠林 徐良驥 馮海寬 楊貴軍 苗夢珂 林博文
(1.安徽理工大學測繪學院, 淮南 232001;2.北京農業信息技術研究中心農業農村部農業遙感機理與定量遙感重點實驗室, 北京 100097;3.國家農業信息化工程技術研究中心, 北京 100097; 4.北京市農業物聯網工程技術研究中心, 北京 100097)
快速、準確地監測作物長勢對農業管理者的田間管理經營具有指導性,能夠有效促進精準農業的發展,保障糧食安全[1-5]。作物長勢監測的傳統手段是通過人眼定性識別,隨著科技飛速發展,遙感衛星和無人機遙感成為作物長勢監測的重要技術手段。然而,遙感衛星運行周期長,獲取過程中存在粗糙分辨率和氣象影響等因素,監測效果并不理想[6-7]。無人機遙感技術憑借飛行器操作和起降方便、快速靈活、高效和獲取的影像分辨率較高等優點[8-15],監測效果較優。無人機遙感技術中,傳感器通常為數碼相機、多光譜相機和高光譜相機,前2種傳感器的波段較少,不能充分獲取與作物長勢密切相關的波段信息。無人機高光譜相機具有較多波段,可以充分獲得作物長勢信息,深入挖掘波段信息,能夠高效監測作物長勢[16-27]。
生物量和葉面積指數是作物長勢的重要指標,近些年,關于無人機遙感監測的研究較多。文獻[28]通過無人機數碼相機和高光譜數遙感據,利用最小二乘法估算大豆開花期、結莢期、鼓粒期和成熟期的鮮生物量,結果顯示,大豆4個生育期構建的估算模型均有較高的精度,具有較高的可靠性。文獻[29]獲取無人機多光譜影像,篩選了22種植被指數,利用一元回歸、多元逐步回歸、反向傳播神經網絡算法構建高潛水位礦區的玉米生物量反演模型,實現了準確估算,并提高了反演模型精度。文獻[30]利用無人機遙感數據,使用4種機器學習算法,將結構與光譜信息融合,構建玉米生物量估算模型,得出無人機遙感影像融合機器學習算法能夠準確有效地估算玉米生物量。文獻[31]篩選出15種光譜指數,結合神經網絡算法估測玉米葉面積指數,發現利用神經網絡估測的效果優于僅通過光譜指數構建的模型。文獻[32]把通過原始全波段光譜反射率、連續投影算法提取的有效波段反射率以及各類 F_VI 和 E_VI 作為自變量,使用最小二乘和偏最小二乘回歸等方法構建了棉花的 LAI 估算模型,得出以植被指數構建的模型估算效果優于以光譜反射率構建的模型。文獻[33]基于獲取的無人機高光譜數據,估算冬小麥LAI,研究得出比值型光譜指數RSI(494,610)是估算LAI的最佳參數,通過lg(RSI)構建的線性模型,預測的LAI與實測值擬合性較高。文獻[34]通過遙感數據估算作物冠層水平并進行驗證,結果表明遙感數據估算LAI的效果較好。
以上研究均通過單個生物量或葉面積指數監測作物長勢情況。本文以冬小麥為研究對象,利用無人機成像高光譜數據,將冬小麥生物量和葉面積指數按照平均權重的原則,構建長勢監測指標(Growth monitoring indicator,GMI),利用多元線性回歸(Multiple linear regression,MLR)、偏最小二乘(Partial least squares regression,PLSR)和隨機森林(Random forest,RF)分別構建冬小麥不同生育期和全生育期的長勢監測指標反演模型,探討無人機高光譜結合長勢監測指標對冬小麥的監測效果,為冬小麥的田間管理提供科學依據。
研究區位于北京市昌平區小湯山鎮國家精準農業研究示范基地(116°34′~117°00′E,40°00′~40°21′N),該區域屬于暖溫帶大陸性季風氣候,整年平均溫度11.8℃,平均降水量約40 mm,研究區位置見圖1。研究選取的小麥品種為京9843(J9843)和中麥175(ZM175)。氮素處理分為4種:N1,尿素施用量0 kg/hm2;N2,尿素施用量195 kg/hm2;N3,尿素施用量390 kg/hm2;N4,尿素施用量585 kg/hm2。水分處理包括:雨養;正常,675 m3/hm2;過量,1 012.5 m3/hm2。采用正交試驗設計,每種處理16個小區,3個重復,共48個試驗小區,試驗設計見圖2。
1.2.1地面數據
分別獲取了拔節期(2015年4月21日)、挑旗期(2015年4月26日)、開花期(2015年5月13日)和灌漿期(2015年5月22日)的冬小麥數據。生物量:每個采樣區域隨機取30棵植株,經過莖葉分離,放入干燥箱105℃下殺青處理,再將樣本在80℃條件下干燥2 d以上,直到恒質量,將稱量結果除以樣本獲取面積即為生物量。葉面積指數:將取回的樣本處理后通過CI-203型激光葉面積儀測定葉面積,除以單位面積的單莖數,得到葉面積指數。在不同生育期地面數據測量同時獲取了地面高光譜數據,利用美國ASD公司的高光譜輻射儀(ASD Field SpecFR Pro 2500型), 測量時間是12:00—14:00,儀器的探頭視場角保持為25°,距離冬小麥冠層1 m并垂直向下,隨機測量20次,計算光譜反射率平均值。
1.2.2無人機高光譜數據
利用八旋翼無人機遙感平臺,攜帶的傳感器為Cubert UHD185 Firefly型成像光譜儀(德國),質量470 g,采樣間隔4 nm,125通道。獲取了4個生育期的無人機高光譜數據,將高光譜影像先校正處理,再通過俄羅斯Agisoft LLC公司開發的Agisoft PhotoScan軟件拼接影像,得到4個生育期的正射影像,如開花期的高光譜影像如圖3所示。最后在ArcGIS中通過繪制矢量提取不同小區的反射率,將提取的值求平均即為各小區的反射率[32]。
1.3.1分析方法
采用多元線性回歸、偏最小二乘和隨機森林3種方法[35-37]。MLR、PLSR和RF方法均在Matlab環境中實現[38-41]。
1.3.2光譜指數選取
關于高光譜研究眾多,根據研究成果,選取了MSAVI、MSR、OSAVI、NDVI、SR、NDVI×SR、MCARI、TCARI、TCARI/OSAVI與MCARI/OSAVI共10種光譜指數[42-45],通過分析這10種指數,選擇合適的光譜指數參與模型構建。
1.3.3長勢監測指標構建
將生物量和葉面積指數組合成長勢監測指標。分別對生物量和葉面積指數進行歸一化處理,公式為
(1)
(2)
式中Xm——各生育期生物量
Xn——各生育期葉面積指數
Wm——歸一化后的生物量
Wn——歸一化后的葉面積指數
考慮生物量和葉面積指數在冬小麥不同生育期所占比例不同,但無法知道所占比例確切值,故將生物量和葉面積歸一化后且各按0.5權重在長勢監測指標中進行分配,公式為
(3)
式中GMI——長勢指標
1.3.4模型建立、驗證和精度評價
采用MLR、PLSR和RF 3種方法,分別構建了冬小麥4個生育期和全生育期的長勢監測反演模型,將每個生育期48個數據的2/3樣本作為建模數據,另外1/3樣本作為驗證數據。
采用決定系數R2(Coefficient of determination)、均方根誤差(Root mean squared error,RMSE)和標準均方根誤差(Normalized root mean squared error,NRMSE)驗證模型的精度。R2越高,模型效果越好,RMSE和NRMSE值越小,其模型的預測精度越高[46-47]。
為了驗證無人機高光譜數據的可靠性,將獲取的地面高光譜數據與其對比分析,結果見圖4。從圖4可看出,地面和無人機高光譜數據曲線變化有差異,在680~750 nm范圍變化較為一致,光譜反射率都是快速增加,反射率較高,兩高光譜曲線都在550 nm左右位置出現第1次峰值,為綠峰,波長680 nm時,出現第1次谷值,為紅谷[48];750~950 nm范圍兩傳感器光譜曲線變化較為明顯,無人機高光譜隨著波長增加反射率下降較快,曲線波動較大,而地面高光譜反射率下降不明顯,曲線較為穩定。綜合來說,獲取的無人機高光譜數據和地面高光譜保持高度的一致性,可以用于構建模型。

圖4 冬小麥不同生育期無人機和地面高光譜對比
將冬小麥4個生育期和全生育期的光譜指數與生物量、葉面積指數、GMI進行相關性分析,結果見表1。由表1可知,拔節期,僅MCARI和MCARI/OSAVI表現無顯著相關,其他指數都表現顯著相關,相關系數絕對值最大的是0.727,為光譜指數SR和NDVI×SR與GMI的相關系數;挑旗期,除MCARI外,各指數均達到顯著水平,大部分為極顯著(0.01水平),此時期相關系數最高值為NDVI與GMI的相關系數,為0.798;開花期,TCARI和MCARI/OSAVI無顯著相關,其余指數都是極顯著相關,SR與GMI的相關系數較高,絕對值達0.840;灌漿期,MCARI/OSAVI與TCARI無顯著相關,剩余指數表現為顯著相關,光譜指數與GMI的相關性仍然較強,相關性最好的指數是NDVI×SR,相關系數為0.835。根據各生育期相關性,發現光譜指數NDVI、SR、MSR、NDVI×SR在冬小麥拔節期、挑旗期、開花期、灌漿期4個生育期均表現出與GMI有很強的相關性,相關系數絕對值高于這4個光譜指數與生物量、葉面積指數的相關系數,將這4個光譜指數作為建模的因子,構建GMI反演模型。

表1 不同生育期光譜指數與各指標相關系數絕對值
注:*表示0.05水平顯著,** 表示0.01水平顯著。
根據光譜指數與GMI的相關性結果,篩選出相關性較強的4個光譜指數,分別建立冬小麥不同生育期的單光譜指數反演模型,回歸結果見表2。由表2可以看出,NDVI、SR、MSR、NDVI×SR在各個生育期表現不同,差異較大。拔節期,建模和驗證集的R2最大值分別是0.522 9與0.625 1,對應的光譜指數是NDVI×SR,RMSE和NRMSE最小,分別是0.108 8、0.085 4和18.49%、14.26%;建模和驗證效果最差的是MSR,建模和驗證的R2分別是0.429 8和0.563 1。挑旗期,4個光譜指數建立的回歸模型較拔節期各模型擬合效果有所提高,建模集中NDVI的R2高于0.6,R2達到此生育期的最高值0.617 6,RMSE和NRMSE達到最低,分別是0.111 5和19.64%,驗證集NDVI的R2不是最高,但考慮建模集R2相比其余3個光譜指數差值較大,NDVI為挑旗期效果最好的指數;效果最差的指數是SR。開花期,各模型的R2達到0.63以上,擬合性最優、精度最高的是SR,建模和驗證的R2和NRMSE是0.682 7、0.762 7和16.82%、13.65%,擬合性最差和精度最低的是NDVI,建模和驗證的R2和NRMSE為0.632 5、0.651 9和18.10%、16.53%。灌漿期,建模集NDVI的R2值最大,NDVI為此生育期的最佳光譜指數,表現最差的指數是MSR。全生育期,各光譜指數表現最優的是NDVI×SR,表現最差的是MSR,建模的R2和NRMSE分別為0.554 7、0.491 9和19.48%、20.81%。

表2 冬小麥不同生育期的單光譜指數回歸模型
利用MLR、PLSR和RF分別構建各個生育期的生物量、葉面積指數和GMI反演模型,建模和驗證結果見表3、4,驗證樣本的擬合效果見圖5~7。根據表3、4和圖5~7可知,不同生育期和不同方法構建的模型效果有差異。就不同生育期而言,拔節期,各模型的R2較低,但RMSE與NRMSE也較低,模型預測精度整體較高,不同方法構建的生物量和葉面積指數模型R2相差較小,反演模型效果接近,GMI模型R2高于同方法下的生物量和葉面積指數R2,模型效果較佳;挑旗期,不同模型的R2高于挑旗期,RMSE和NRMSE也略高于拔節期,綜合比較,預測精度高于拔節期所建的模型,而生物量、葉面積指數和GMI模型表現效果和拔節期相似;開花期,各模型的R2較大,RMSE與NRMSE較小,相比其他生育期,此時期的模型效果最好,預測的生物量、葉面積指數和GMI精度最高,其中依然是GMI反演模型表現最好;灌漿期,各模型的R2僅次于開花期,此生育期模型效果較優。通過分析4個生育期建模和驗證結果,不同生育期中均表現為GMI反演模型優于生物量和葉面積指數模型,進一步對比不同方法,發現基于MLR的GMI模型效果最優,基于PLSR的GMI模型次之,基于RF的GMI模型最差,其中在開花期3種模型效果達到最佳,精度最高,基于MLR、PLSR和RF的GMI模型建模R2、RMSE與NRMSE分別是:0.716 4、0.096 3、15.90%;0.674 1、0.103 2、17.04%;0.611 7、0.112 8、18.63%。綜合模型分析結果,各生育期中開花期表現效果最優,其次是灌漿期、挑旗期,最后是拔節期;GMI反演模型優于生物量和葉面積指數反演模型;3種GMI模型中,模型的效果和預測精度從強到弱為MLR-GMI、PLSR-GMI、RF-GMI。
根據不同生育期模型優選,選取拔節期、挑旗期和開花期的模型MLR-GMI,將模型應用于3個生育期的無人機高光譜影像中,得到3個生育期的GMI分布圖,如圖8所示。圖中各生育期的GMI分布情況和預測一致,挑旗期GMI分散,但中部小區值較高,為0.5~1.0,整體分布較差,各小區差異明顯;拔節期除了西部和東部小區GMI值較小,其余小區GMI較大,也為0.5~1.0;開花期整個試驗小區GMI都較高,且各小區GMI分布效果較好,此時期GMI可以反映冬小麥長勢情況,隨著冬小麥生育期推移,生育后期長勢較生育前期較為穩定,開花期GMI分布明顯優于別的生育期。根據3個時期的影像可以分辨出各生育期和各小區的長勢差異,識別出長勢較好和較差的區域。
當前,利用高光譜估算作物長勢的研究已經很多,但常用的是地面高光譜,且是對單一的長勢指標進行監測,無法成像和直觀地識別。本研究通過無人機高光譜獲取了冬小麥拔節期、挑旗期、開花期和灌漿期的田間和影像數據,利用新構建的長勢監測指標(GMI),監測了冬小麥的長勢情況,取得了較高的反演精度,為地、空一體化作物長勢監測提供了新的方法。

表3 不同生育期反演GMI建模分析

表4 不同生育期反演GMI驗證分析

圖5 不同生育期檢驗樣本基于MLR實測值和預測值擬合結果

圖6 不同生育期檢驗樣本基于PLSR實測值和預測值擬合結果

圖7 不同生育期檢驗樣本基于RF實測值和預測值擬合結果

圖8 不同生育期的GMI空間分布
研究發現,不同生育期建立的單光譜指數模型有較大差異,在開花期表現較好,灌漿期和挑旗期次之,而在拔節期表現較差。造成的原因可能是:不同生育期,NDVI、SR、MSR和NDVI×SR對冬小麥的敏感程度不同。GMI是由生物量和葉面積指數構成的,生物量和葉面積指數在各個生育期中分布不同,開花期生物量和葉面積指數都較高,故表現較好。
通過多個光譜指數構建的各生育期的3種GMI反演模型,MLR-GMI模型表現效果最好,PLSR-GMI次之,RF-GMI最差。文獻[49]也證明了利用多元線性估算葉綠素效果優于偏最小二乘,可能原因是:優選了與GMI相關性較強的指數用于模型的構建。單個指數線性估算時模型本身就比較好,多個指數結合了各指數對GMI的敏感性,信息量更足,再利用MLR估算,模型效果和精度會有所提高。RF適合大數據處理,較小數據集處理效果和優勢降低[50-51]。
MLR-GMI和PLSR-GMI模型效果均好,獲得了較高的反演精度,單個光譜指數構建的模型,反演精度不如多個光譜指數構建的模型。這是因為單個光譜指數構建的模型只包含單個光譜指數信息,光譜信息不足,而光譜是由可見光到近紅外組成,其他波段對反演模型的構建同樣重要。同時,單個光譜指數反演的模型會因為信息不足缺少穩定性,光譜指數過多也會造成模型復雜,保持反演模型的自變量均衡較為重要,MLR-GMI和PLSR-GMI模型是通過4個光譜指數構建的,反演效果更佳。本文構建的MLR-GMI估算效果最高R2達到0.716 4,而陸國政等[52]反演葉面積指數最高R2只有0.701,說明指標GMI較優。
此外,本研究采用了生物量和葉面積指數這2個長勢指標組成新的長勢監測指標,生物量和葉面積指數在冬小麥各生育期所占的比例有差別,不能準確確定各時期的分配情況,兩指標存在著相互影響的關系。生物量和葉面積指數在不同生育期所占比例不同,對單個生育期影響較小,另外葉面積指數會因為環境變化而積累,隨著生長期推移,生物量會逐漸增加[53]。同時,從某種程度上,兩指標組成的GMI并不是越大越好,可能存在相互增強或減弱的作用。而本文是將兩指標根據平均權重進行分配,未來對長勢指標在不同生育期的相互影響和分配情況要進行進一步研究,以便更充分地了解作物的長勢情況。
(1)冬小麥各個生育期大部分光譜指數都與GMI顯著相關,相關性較好,且NDVI、SR、MSR、NDVI×SR與GMI的相關性高于光譜指數與生物量、葉面積指數的相關性。拔節期,相關系數絕對值最大的是光譜指數SR和NDVI×SR(相關系數為0.727);挑旗期,相關性最高的是光譜指數NDVI(相關系數為0.798);開花期,光譜指數SR的相關系數絕對值最高(相關系數為0.840);灌漿期,NDVI×SR達到最強相關性(相關系數為0.835)。
(2)選擇與GMI相關性較強的4個光譜指數,分別建立了冬小麥4個單生育期和全生育期的一元回歸模型。拔節期、挑旗期、開花期、灌漿期和全生育期表現最好的光譜指數分別是NDVI×SR、NDVI、SR、NDVI和NDVI×SR,對應的建模R2分別為0.522 9、0.617 6、0.682 7、0.630 2和0.554 7。
(3)構建的4個生育期生物量、葉面積指數和GMI反演模型,不同生育期均表現為GMI模型最優;且開花期模型表現效果最好,其他生育期表現強弱依次是灌漿期、挑旗期、拔節期,而對比3種GMI反演模型,MLR-GMI模型效果和預測精度最好,PLSR-GMI次之,RF-GMI最差。因此,開花期所構建的反演模型MLR-GMI能夠更好地預測GMI,建模R2、RMSE和NRMSE分別是0.716 4、0.096 3和15.90%。
(4)對拔節期、挑旗期和開花期無人機高光譜影像填圖,可以很好地反映各時期冬小麥的長勢情況。基于無人機高光譜數據反演GMI能夠很好地監測冬小麥長勢,為無人機高光譜遙感反演方法監測作物長勢提供了重要的技術依據。