邵亞杰 湯秋香 崔建平 李曉娟 王 亮 林 濤
(1.新疆農業大學農學院, 烏魯木齊 830052; 2.新疆農業科學院經濟作物研究所, 烏魯木齊 830091;3.農業農村部荒漠綠洲作物生理生態與耕作重點實驗室, 烏魯木齊 830091; 4.新疆大學機械工程學院, 烏魯木齊 830046)
及時準確獲取作物的長勢信息對提高農業生產的信息化、智能化水平具有重要的意義[1]。葉面積指數(Leaf area index,LAI)指單位土地面積上植物葉片占土地面積的倍數[2],是反映植被密度、冠層結構與功能、生物學特性與生態環境因子的重要生理指標,可作為塑造合理冠層調控措施,提高光能利用效率的重要判斷依據[3]。傳統的LAI測量主要包括比重法、掃描法、光電或圖像法(冠層儀),只能進行小面積的人工測量[4-5],測量結果相對精準,但存在費時費力、破壞性強、監測尺度小等問題[4],難以幫助政策部門和生產部門形成有效的長勢評估和農事干預。因此,在區域尺度上開發快速、無損、精確的LAI高效監測方法,對解決這一問題至關重要。
利用無人機遙感反演作物的LAI,可以避免效率低、成本高、田間操作困難等問題。該方法在農田LAI的大范圍監測中被證明是有效的[5-7]。在LAI的遙感反演方法中,來自植物冠層的光譜吸收和反射特征起著關鍵性作用[8]。植被指數(Vegetation indexs, VIs)通過根據兩個或多個波段的冠層反射率組合來突出植被的特定屬性,通常在可見光和近紅外范圍內[9]。如:王軍等[10]在大豆的LAI遙感監測中提出,與其他4個VIs相比,NDVI對大豆的反演精度較好(R2=0.74);張敏等[11]在對4個植被指數選擇時發現增強型植被指數(Enhanced vegetation index, EVI),EVI得到了較高的估算結果(R2=0.64)。然而僅利用VIs進行密植作物的LAI估算時,常常存在一定的局限性。主要問題是高覆蓋度的冠層結構容易限制對LAI的估算[12]。此外,VIs在作物不同生長階段、病蟲害等條件的影響下會發生變化[13-14]。而遙感影像中豐富的紋理信息(Texture features, TFs),不僅可以表征作物的冠層結構,還能夠減小“同譜異物”和“同物異譜”的影響,成為有效減少作物生長后期冠層密閉以及受病蟲害等因素干擾等的重要途徑。因此,近年來關于融合遙感影像中的光譜和紋理特征估算作物長勢的研究逐漸增多。研究表明,VIs結合TFs可顯著提高生物量[15]、葉綠素含量[16]、植被覆蓋度[17]等作物長勢信息的估算精度。周聰等[18]、LI等[19]的研究均證實,無論是基于圖像的小波能量紋理和光譜特征相結合或者是灰度共生矩陣紋理特征結合顏色指數的模型輸入參數,均較單一參數類型的水稻LAI估算模型具有更高的準確性。這些研究為估算作物LAI提供了一種新的方法。然而此方法在棉花LAI的遙感監測中的應用效果還鮮有報道。
棉花是中國重要的經濟作物之一,在經濟發展中占據重要地位[20]。雖然前人使用無人機遙感影像在水稻、玉米和小麥等作物的LAI估算方面已有大量研究,但目前結合VIs和TFs在估算密植作物棉花LAI的應用仍較少。因此針對精準、高效獲取棉花長勢信息的重要性,發揮無人機靈活機動的優勢,通過“點-面”結合的方式對棉花長勢進行實時、宏觀、快速地監測和估算,可以因地制宜制定棉花精準生產管理措施。本研究以新疆阿克蘇地區棉花為研究對象,擬采用機器學習和深度學習算法,分別構建基于VIs、TFs和二者融合參數作為特征輸入變量的棉花LAI估測模型,對比分析3種參數選擇條件下,LAI估算精度的差異;為新疆棉田實現LAI的快速、無損、定量監測提供一種可靠的方法,為農田變量施肥、精準灌溉等精細化管理提供技術支撐。
試驗地點位于新疆農業科學院阿瓦提棉花科研示范基地(40°27′N,80°21′E),如圖1所示,該區域屬暖溫帶大陸性干旱氣候,年平均氣溫10.40℃,年平均降水量46.70 mm,年平均蒸發量1 890.70 mm,無霜期211.00 d,年均日照2 679.00 h。農業生產完全依賴于灌溉。試驗區土壤質地為砂壤土,田間持水率為28.92%,土壤肥力屬于中等,土壤pH值為7.33。當地主要高產栽培技術為膜下滴灌技術。

圖1 研究區位置及處理小區Fig.1 Location and processing area of study area
采用雙因素裂區試驗設計,以對LAI有顯著影響的密度和施氮量為調節因子,以施氮量(純氮)為主區,設置N1(0 kg/hm2)、N2(300 kg/hm2)和N3(600 kg/hm2)3個水平,密度為副區,設置M1(1.35×105株/hm2)、M2(1.80×105株/hm2)和M3(2.25×105株/hm2)3個水平;即共有9個處理,每個處理重復3次,每3幅膜劃定一個小區,小區面積49 m2(長7 m,寬7 m)。
供試棉花品種為新陸中88號。采用“一膜三行三管”76 cm等行距機采棉種植模式,株距11 cm,磷肥(P2O5,150 kg/hm2)和鉀肥(K2O,150 kg/hm2)全部作為基肥,在播種時一次性施入,氮肥30%作為基肥,70%作為追肥,等量分10次隨水滴入。其他管理措施參照當地標準。
1.3.1地面數據獲取
于蕾期(6月27日)、花期(7月23日)、鈴期(8月17日)、吐絮期(9月7日)選取長勢均勻的4個不同測量位點,于18:00—20:00,陽光穩定、無云時,進行LAI測量。測量采用CI-110型植物冠層數字圖像分析儀(Li-Cor Inc.,美國),分別選取A、B、C、D 4個位點(圖2),每個位點測量3次,取其平均值即得到各位點的平均LAI。其中位點A在中行主莖下方,位點B在中行與邊行中點處,位點C在邊行主莖下方處,位點D在露地中間位點處。

圖2 棉花種植方式及LAI測量位點Fig.2 Cotton planting pattern and LAI measurement site
1.3.2無人機影像獲取
獲取田間LAI的當天,利用Matrice M210 RTK V2型無人機搭載多光譜相機(MicaSence RedEdge,美國)進行棉田冠層圖像提取。拍攝于13:00—15:00,太陽高度角與地面近乎垂直時進行,航線設計任務高度30 m,航向重疊率75%,旁向重疊率75%,航速2 m/s,采用等間隔拍照,拍照間隔為2 m。飛行前使用多光譜傳感器拍攝輻射定標版,以便后期進行影像輻射標定。
多光譜相機共有5個通道,分別為藍、綠、紅、近紅外、紅邊波段,對應波長分別為475、560、668、840、717 nm,半高寬(FWHM)分別為20、20、10、40、10 nm,無人機影像劃分示意圖如圖3所示。

圖3 無人機影像測量位點劃分示意圖Fig.3 Schematic of image measurement point division by drone
1.3.3無人機數據預處理
1.3.3.1圖像拼接
利用Pix4D Mapper軟件對影像數據進行拼接與輻射校正。首先將原始圖像數據導入軟件,讀取影像POS數據,設置影像相機配置信息,選擇農業多光譜拼接模式,然后設定拼接過程中的匹配特征點數量和輸出影像類型,生成點云和紋理信息,最后輸出數字正射影像。
1.3.3.2小區裁剪
采用ArcGIS map 軟件裁剪影像,先根據地面信息確定待測試驗區域,建立區域shape文件在影像中勾畫出試驗區邊界;使用裁剪工具對試驗區shape進行裁剪,生成試驗區域柵格數據并通過數據轉換輸出試驗區影像數據。
1.3.3.3光譜反射率提取
使用ENVI軟件對裁剪后影像提取光譜反射率。本文中選取小區反射率均值作為該小區的光譜反射率。
1.3.4植被指數與紋理特征選取
植被指數是由兩個或多個波段反射率經一定方式組合而成的參數。本研究根據已有的研究成果,選取LAI監測方面效果較好的9種植被指數,計算公式如表1所示。

表1 植被指數計算公式Tab.1 Vegetation index
紋理是一種反映圖像中同質現象的視覺特征,體現物體表面的具有緩慢變換或周期性變化的表面組織結構排列屬性。本文使用ENVI 5.3軟件進行基于二階概率統計濾波(Co-occurrence measures)的方式來實現圖像TFs的提取,對近紅外波段進行提取共獲取8類TFs:均值(MEA)、方差(VAR)、協同性(HOM)、對比度(CON)、相異性(DIS)、信息熵(ENT)、二階矩(SEM)和相關性(COR)。紋理分析時選取窗口尺寸為7×7,空間相關矩陣偏移X和Y默認為1。
1.4.1模型構建及反演
使用每個位點的LAI參與構建估算模型。不同VIs與地面LAI數據相關性分析后,選取相關性較高的VIs和TFs,用于棉花LAI的估算模型構建。全生育時期共獲得432個LAI數據樣本,由于本文的LAI實測數據需要耗費大量人工,雖然盡可能多地進行實測以保證模型訓練精度,但數據集仍屬于小規模樣本集,因此本文按比例6∶4劃分訓練集和驗證集。隨機選取其中60%(259個樣本)作為建模集,40%作為訓練集(173個樣本),反演LAI時選擇最優估算模型對試驗小區均值進行反演。
1.4.2支持向量機回歸
支持向量機(Support vector regression,SVR)是在分類模型的框架下發展起來的一種被廣泛使用的機器學習方法。其主要思想是將輸入樣本映射到高維空間,在此空間內建立了一個超平面,對所有落入此平面內的樣本不計算損失,只有平面外的數據才計入損失函數,通過引入距離修正損失函數使訓練樣本與超平面的距離最小化,此時的超平面是擬合的函數[29]。SVR因其通用性、穩健性和有效性顯示出良好的估算潛力,能夠處理高維數據和非線性問題,并且具有較好的泛化能力[30-31]。本研究采用Scikit-Learn(0.21.3)包中的支持向量回歸函數在Python 3.7環境中實現支持向量機算法。由于損失函數(Gamma)、誤差懲罰因子C和核函數影響支持向量機的性能,參數設置中Kernel選擇常用的徑向基核函數(Rbf),懲罰因子C為1.0,損失函數Gamma為1/n_Features。
1.4.3偏最小二乘回歸法
偏最小二乘回歸法(Partial least squares regression, PLSR)是集合多元線性回歸、主成分分析及相關性分析3種方法優點于一身的統計分析方法[32]。當數據集中變量較多且因變量與自變量具有多重相關性時,傳統的線性回歸無法精確地對因變量進行分析,從而導致構建的模型精確度較低,此時使用PLSR方法可以提高模型精度。PLSR通過依次選擇正交因子來增大因變量與自變量之間的協方差,并以交叉檢驗的方式來確定模型中的因子數等,該方法減少了數據冗余,有利于提高計算效率。PLSR適用于多個高度共線性的變量來建立預測模型,可以有效地解決自變量之間的多重共線性問題以及數據維度較高的情況[33]。本研究采用Scikit-Learn(0.21.3)包中的偏最小二乘回歸函數在Python 3.7環境中實現支持PLSR算法。本文設置主成分個數為2,其余參數按照默認使用。
1.4.4深度神經網絡
神經網絡是基于感知機的擴展,而深度神經網絡(Deep neural network,DNN)可以理解為有很多個隱藏層的神經網絡。DNN內部的神經網絡層可以分為3類:輸入層、隱藏層和輸出層,通過堆疊多個隱藏層來達到提取更高階的特征信息,這些信息在回歸預測中有助于提高性能[34]。DNN模型現已成為解決各種分類和回歸問題的方法[34-36]。本文設計的網絡結構包含輸入層、隱藏層和輸出層,結構中層與層直接全連接,同層之間的神經元不連接。DNN共分為4層:1個輸入層、2個隱藏層和1個輸出層。將圖像中提取的植被指數、紋理特征和紋理指數轉換為與每個測量點LAI相對應的一維向量,以此作為輸入層,輸入層設置為3個神經元,隱藏層的每層神經元個數依次是6、4,輸出層設置為1個神經元,并以最終輸出結果來估算LAI。在DNN模型中選取ReLU作為激活函數,使用均方根誤差作為優化函數,選擇均方誤差作為損失函數,迭代100次。本研究采用Python 3.7基于Keras 2.3.0框架搭建了此網絡結構。
1.4.5模型驗證
選取決定系數(Coefficient of determination,R2)、均方根誤差(Root mean square error,RMSE)和相對均方根誤差(Relative root mean square error, RRMSE)作為評價估算模型的指標[36]。估算模型和驗證模型的R2越大,RMSE和RRMSE越小,表明模型穩定性越好,預測精度越高。
棉花各生育時期實測棉花LAI結果如表2所示,隨著棉花生長,不同密度與施氮量處理下棉花LAI總體呈現先增大后緩慢降低的趨勢。每個時期獲得108 個樣本,生育期累計獲得432 個樣本。LAI平均值由蕾期(1.82)增加至花期(2.81)后,在鈴期、吐絮期逐漸下降,吐絮期平均值為1.85。各生育時期標準差為0.21~0.27,方差在0.04~0.07之間,變異系數在0.08~0.12之間。結果表明,標準差、方差、變異系數較小,說明LAI的離散程度小,即LAI分布均勻。

表2 棉花葉面積指數數據統計Tab.2 Cotton leaf area index data statistics
VIs與LAI相關性分析結果如圖4所示。結果表明,VIs與LAI均呈現顯著正相關,且相關系數為0.747~0.830。在所選的VIs中VI(nir/red)與VI(nir/green)相關性較高,分別為0.822、0.830。圖4表明隨著LAI的增加,VIs增加,但在LAI大于2.0時,NDVI、GNDVI、SAVI、OSAVI和MSAVI的增長幅度減小。

圖4 LAI與植被指數相關性分析Fig.4 Correlation analysis between LAI and spectral parameters
由于VIs與LAI之間均存在顯著相關性,為避免數據產生大量冗余,因此引入相關系數絕對值|r|最高的4個植被指數(VI(nir/green)、VI(nir/red)、GNDVI、OSAVI)作為自變量,以LAI為因變量,構建了SVR、PLSR和DNN的LAI估算模型。同時,通過比較模型估計值與實測值來驗證模型的估算精度(R2、RMSE、RRMSE),如表3所示,3種建模算法的估算精度為0.72~0.78,PLSR模型具有最低的估算精度(建模集R2=0.72,驗證集R2=0.68),而DNN模型具有最高的估算精度(建模集R2=0.78,驗證集R2=0.71),表明DNN模型的估算精度最好。

表3 基于植被指數的棉花LAI估算結果評價Tab.3 Evaluation of LAI estimation results of cotton based on vegetation index
圖5表明LAI與近紅外波段反射率相關性最佳,因此本文選擇該波段提取TFs,并篩選出與LAI相關系數絕對值|r|最高的MEA、HOM、ENT和SEM作為自變量,構建了基于SVR、PLSR和DNN算法的LAI估算模型。在模型變量的選擇方面,使用TFs變量構建的LAI估算模型精度低于VIs,在模型算法方面,3種建模算法的精度為0.51~0.62(表4),其中PLSR的精度最低(建模集R2=0.51,驗證集R2=0.49),SVR精度最高(建模集和驗證集的R2分別為0.62、0.58)。

表4 基于紋理特征的棉花LAI估算結果評價Tab.4 Evaluation of LAI estimation results for cotton based on texture features

圖5 LAI與紋理特征相關性分析Fig.5 Correlation analysis between LAI and textural characteristics
本文依據相關系數絕對值|r|來篩選VIs和TFs的最佳組合為VI(nir/red)、VI(nir/green)、HOM和MEA,表5反映了基于SVR、PLSR和DNN算法構建LAI估算模型的結果。相比之下,SVR算法具有最高的估算精度(建模集:R2=0.82,RMSE為0.20,RRMSE為0.09;驗證集:R2=0.78,RMSE為0.22,RRMSE為0.10)。VIs和TFs組合構建LAI的SVR估算模型比VIs、TFs估算的模型精度分別提高7.89%、32.26%。

表5 基于植被指數和紋理特征結合的棉花 LAI估算結果評價Tab.5 Evaluation of cotton LAI estimation results based on combination of vegetation index and texture features
本研究中LAI最優估算模型為SVR模型,基于此模型對棉花4個生育時期LAI進行反演,最終得到棉花各生育期的LAI空間分布圖(圖6)。結果表明,棉花LAI隨著生育期的推進呈現先增加后減小的趨勢,在花期達到最大值。蕾期反演的LAI在1.54~1.97之間,N2M3處理下的LAI達到最大值;花期反演的LAI在2.15~2.86之間,同樣為N2M3處理的LAI達到最大值;鈴期反演的LAI在2.11~2.34之間,N3M2處理下的LAI達到最大值;吐絮期反演的LAI在1.60~2.03之間,在N1M3處理下LAI達到最大值。在空間分布上,棉花葉面積指數因不同的施氮量和密度處理具有明顯差異,LAI較好的處理為N2M3處理。

圖6 棉花不同生育期LAI時空分布圖Fig.6 Spatial and temporal distributions of LAI in different growth stages of cotton
無人機是一種新型遙感數據獲取平臺,具有分辨率高、作業效率高的優點,在農業領域監測作物長勢信息等方面具有重要作用。多光譜傳感器可以獲取遙感所需的紅、綠、藍、紅邊和近紅外5個重要波段的數據,相較于RGB三通道數碼相機和高光譜傳感器,無人機搭載多光譜傳感器具有成本低、數據處理簡單等特點,應用于農業遙感領域具有一定的優勢。有學者研究利用無人機搭載多光譜傳感器組成的低空遙感平臺,對冬小麥LAI[37]、大豆LAI[38]的反演研究結果表明,利用無人機多光譜影像對作物LAI進行估算是可行的。本研究通過無人機搭載多光譜傳感器采集棉田遙感影像對棉花LAI進行估算。本研究基于VIs和TFs構建不同算法的棉花LAI反演模型,結果證明了基于無人機多光譜影像估算棉花LAI的可行性。
在模型變量的選擇方面,根據VIs與TFs對棉花LAI的敏感程度,選擇相關性較高的變量,可以有效提高反演模型精度。本研究基于LAI與VIs和TFs的相關性來選擇模型變量,綜合利用棉花生長季內多生育時期光譜信息對棉花LAI進行估算。此方法相較于單一生育時期進行估算LAI更加科學合理,能夠有效提高LAI的估算精度。王修信等[39]對林地LAI的估算方法研究表明,利用多光譜植被指數NDVI、RSR、SAVI構建的估算模型精度最高,R2達到0.83,RMSE為0.19。王亞杰[40]以EVI、OSAVI、SAVI、NDVI、RDVI構建了玉米LAI反演模型,R2為0.91。本文選取相關性較高的VI(nir/green)、VI(nir/red)、GNDVI和OSAVI構建估算模型,基于VIs的DNN估算模型的估算精度R2為0.78,RMSE為0.22,RRMSE為0.10。對于不同研究區、使用不同的建模方法、不同的VIs得到的模型,雖然基本具有較好的估算結果,但在精度上會有一定的差異。在傳統的統計分析中通常選用單一VIs進行構建LAI估算模型,但單一VIs所包含的信息比較片面且存在不同程度的飽和性[41]。紋理能表征物體表面的內在特性,同時TFs提供了更多的植被冠層結構信息,可以提高LAI的估算精度。因此,將更多的光譜信息作為變量以構建估算模型十分重要。本文研究發現在僅使用TFs對棉花LAI估算時,估算精度小于VIs估算模型。而在估算LAI時加入TFs有利于提升模型的準確性,結合VIs和TFs構建的SVR估算模型的驗證集R2分別提高9.86%、34.48%。為以后估算作物的LAI研究提供了新的思路。本研究已經證明了采用加入TFs來估算棉花LAI的方式能夠有效提高估算精度,但是否存在更好的估算方式還有待研究。其次,本研究使用的是皮爾遜相關系數的方法來確定模型構建時的輸入參數,而且在選擇VIs和TFs中僅選擇了相關系數絕對值|r|最高的4個進行建模與評價,而對于其他的特征參數篩選方法還需要進一步研究。
建模算法的選擇對于估算作物長勢信息的估測精度影響較大。目前利用無人機多光譜影像進行植物生長參數的估算研究,主要通過光譜參數與實測值建立經驗統計或機器學習模型進行估測。牛慶林等[42]基于無人機影像數據監測玉米LAI,使用逐步回歸分析方法建立估算模型,R2為0.63,RMSE為0.40。而傳統的線性回歸方法對模型的估算精度往往不高,而機器學習以獨特的優勢逐漸替代了傳統逐步回歸,在作物長勢監測中得到了廣泛應用[43]。王瑛等[44]基于六旋翼無人機獲取小麥冠層多光譜影像,結果發現SVR構建小麥LAI估算模型效果最佳,R2達到0.83,RMSE為0.29。而本研究則是構建了1種深度學習估算模型和2種機器學習模型,DNN模型通過加入多個隱藏層,使用Sigmoid和ReLU等非線性激活函數,使得DNN模型能夠挖掘出數據之間的復雜關系,從而實現模型估算性能的提高。本文通過選取不同的參數組合方式進行建模,有助于發揮DNN模型的特征融合優勢。SVR模型能夠將數據映射至高維特征空間,在高維特征空間上建立一個超優平面決策邊界,從而進行樣本分類,SVR克服了傳統線性回歸方法的不足,在解決本研究中小樣本和非線性問題時具有獨特優勢[45]。PLSR是結合了PCA、MLR和CCA 3種分析方法的優勢,在單因變量和多個自變量的回歸分析中,該方法簡單穩定且精度較高[46]。因此本文選擇這3種方法建立棉花LAI的估算模型。3種算法在不同參數組合建模的方式中,估算精度由大到小均呈現為VIs和TFs融合模型、VIs模型、TFs模型。在僅使用VIs構建估算模型時,深度學習DNN模型的估算精度最高,而基于VIs和TFs融合構建時使用SVR估算模型效果最佳,R2為0.82,RMSE為0.20,證明將SVR算法用于構建VIs和TFs結合的棉花LAI估算模型具有較好的應用前景。本研究得出SVR模型優于DNN模型和PSLR模型,SVR模型和DNN模型差距較小,原因可能是PLSR模型主要用于處理多元線性回歸問題,而SVR和DNN則能夠處理非線性問題。DNN模型的特點是能夠捕捉復雜的數據特征,SVR模型的特點則是可以處理高維數據,本研究使用全生育期的數據進行構建估算模型,包含了多個特征和多個時刻的測量值,這個多維數據集可能提高了SVR模型的估算能力。雖然使用SVR和DNN模型估算棉花LAI具有較好的結果,但后續研究中也可以嘗試更多的模型構建算法。
本研究利用無人機搭載多光譜傳感器獲取多生育時期棉花冠層光譜影像,通過分析光譜指數和紋理信息與LAI的定量關系,選擇VIs、TFs和二者融合的方式,運用SVR、PLSR和DNN構建棉花LAI估算模型,VI(nir/green)、VI(nir/red)、GNDVI、OSAVI、MEA與LAI具有較高的相關性;采用SVR建立的LAI估測精度最高(R2=0.78,RMSE為0.22,RRMSE為0.10);在3種估算模型中,植被指數與紋理特征相結合的SVR模型較VIs、TFs模型精度分別提高7.89%和32.26%。