石浩磊,曹紅霞?,張偉杰,朱珊,何子建,張澤
1 西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,陜西楊凌 712100;2 石河子大學(xué)農(nóng)學(xué)院,新疆石河子 832003
【研究意義】棉花是我國(guó)重要的經(jīng)濟(jì)作物,在新疆乃至全國(guó)農(nóng)業(yè)經(jīng)濟(jì)中占據(jù)重要地位[1]。葉面積指數(shù)(leaf area index,LAI)是反映作物長(zhǎng)勢(shì)[2]、相關(guān)生理指標(biāo)[3]、光合效率[4]、呼吸蒸騰作用[5]的關(guān)鍵參數(shù),在作物長(zhǎng)勢(shì)監(jiān)測(cè)上具有廣泛應(yīng)用[6]。研究不同生育期、多生育期無(wú)人機(jī)多光譜數(shù)據(jù)棉花LAI 估測(cè)模型,明確不同生育期間棉花LAI 估測(cè)模型變化規(guī)律,對(duì)實(shí)時(shí)掌握棉花長(zhǎng)勢(shì)并因地制宜進(jìn)行田間科學(xué)管理具有重要意義。【前人研究進(jìn)展】目前,對(duì)作物L(fēng)AI 的觀測(cè)主要通過(guò)地面田間測(cè)量[7]、作物生長(zhǎng)模型[8]、衛(wèi)星遙感[9]等方法。衛(wèi)星遙感技術(shù)因其具有較好的時(shí)間、空間尺度優(yōu)勢(shì),已成為大規(guī)模監(jiān)測(cè)作物L(fēng)AI 的主要方式[10-11]。然而,衛(wèi)星遙感技術(shù)易受自然環(huán)境影響同時(shí)其數(shù)據(jù)處理復(fù)雜,難以應(yīng)對(duì)農(nóng)田尺度上LAI 的精準(zhǔn)監(jiān)測(cè)[12]。近年來(lái),無(wú)人機(jī)遙感信息獲取技術(shù)被廣泛應(yīng)用于農(nóng)業(yè)領(lǐng)域[13-15]。其快速、高效獲取農(nóng)田作物信息的特征滿足了精準(zhǔn)農(nóng)業(yè)和智慧農(nóng)業(yè)發(fā)展的需要,應(yīng)用前景廣闊,發(fā)展?jié)摿薮骩16]。部分研究人員已經(jīng)開(kāi)展了基于無(wú)人機(jī)多光譜的作物生長(zhǎng)與生理指標(biāo)監(jiān)測(cè)研究[17-20]。在使用無(wú)人機(jī)遙感技術(shù)監(jiān)測(cè)作物L(fēng)AI 時(shí),主要有經(jīng)驗(yàn)?zāi)P头ê臀锢砟P头ā=?jīng)驗(yàn)?zāi)P头ㄊ腔诮y(tǒng)計(jì)學(xué)的方法以建立某種經(jīng)驗(yàn)?zāi)P凸剑悄壳皩?shí)踐中應(yīng)用最多的方法。陶惠林等[21]使用無(wú)人機(jī)和ASD 光譜儀,發(fā)現(xiàn)使用多元線性回歸的方法可以取得較好的冬小麥LAI 預(yù)測(cè)模型;曹中盛等[22]使用無(wú)人機(jī)獲取水稻葉片數(shù)碼影像,提取顏色指數(shù)和紋理特征,分析其在不同生育期的相關(guān)性,取得了較好的結(jié)果;付虹雨等[23]使用無(wú)人機(jī)多光譜相機(jī)集合機(jī)器學(xué)習(xí)算法,建立了對(duì)苧麻L(zhǎng)AI 的估測(cè)模型。上述研究證實(shí)了無(wú)人機(jī)數(shù)據(jù)對(duì)作物L(fēng)AI 的估測(cè)潛力,但針對(duì)棉花LAI 估測(cè)研究相對(duì)較少。田明璐等[24]通過(guò)動(dòng)態(tài)搜索相應(yīng)植被指數(shù)定義所使用波段范圍內(nèi)的反射率極值的方法,發(fā)現(xiàn)以植被指數(shù)為自變量可以取得較好的棉花盛蕾期LAI 反演模型,但該研究只探求了單一生育期的LAI 反演效果,沒(méi)有對(duì)棉花多個(gè)生育期的反演變化規(guī)律進(jìn)行闡述;馬怡茹等[25]對(duì)出苗后不同天數(shù)的棉花LAI 建立數(shù)據(jù)集合實(shí)現(xiàn)了無(wú)人機(jī)高光譜技術(shù)對(duì)棉花LAI 的監(jiān)測(cè),但對(duì)不同生育期棉花的LAI 沒(méi)有進(jìn)行單獨(dú)分析;韓建文等[26]使用不同分辨率無(wú)人機(jī)多光譜影像數(shù)據(jù)對(duì)棉花花鈴期LAI 進(jìn)行估測(cè)研究,結(jié)果表明使用RF 算法可以實(shí)現(xiàn)對(duì)棉花花鈴期的LAI 高精度估測(cè),但同樣存在只針對(duì)單一生育期研究的問(wèn)題。【本研究切入點(diǎn)】目前,應(yīng)用無(wú)人機(jī)多光譜遙感對(duì)棉花不同生育期LAI估測(cè)變化情況的研究相對(duì)較少,棉花從現(xiàn)蕾期開(kāi)始進(jìn)入營(yíng)養(yǎng)生長(zhǎng)和生殖生長(zhǎng)的并進(jìn)時(shí)期,及時(shí)掌握棉花田間動(dòng)態(tài)以應(yīng)對(duì)長(zhǎng)勢(shì)差異變化,以此制定具體的田間管理措施是實(shí)現(xiàn)精準(zhǔn)農(nóng)業(yè)的需要。作物L(fēng)AI 隨時(shí)間動(dòng)態(tài)變化,要實(shí)現(xiàn)無(wú)人機(jī)在農(nóng)田尺度上的LAI 精準(zhǔn)監(jiān)測(cè),有必要探明不同生育期作物L(fēng)AI 變化與基于無(wú)人機(jī)遙感信息所建立模型之間的響應(yīng)。現(xiàn)有的應(yīng)用無(wú)人機(jī)多光譜遙感技術(shù)監(jiān)測(cè)棉花LAI 的文獻(xiàn)中,地面實(shí)測(cè)數(shù)據(jù)主要通過(guò)取試驗(yàn)區(qū)內(nèi)3 株代表性植株來(lái)代表試驗(yàn)小區(qū)均值,本研究為了增加試驗(yàn)樣本容量引入內(nèi)外側(cè)棉花概念并驗(yàn)證其可行性,嘗試通過(guò)該方法以提升對(duì)試驗(yàn)小區(qū)內(nèi)棉花LAI 的反演精度。【擬解決的關(guān)鍵問(wèn)題】結(jié)合地面實(shí)測(cè)的棉花現(xiàn)蕾期、初花期、結(jié)鈴期、吐絮期LAI 數(shù)據(jù)與無(wú)人機(jī)多光譜遙感數(shù)據(jù),采用植被指數(shù)和顏色指數(shù)兩種常見(jiàn)指數(shù),對(duì)不同生育期棉花LAI 采用偏最小二乘、嶺回歸、隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)5 種機(jī)器學(xué)習(xí)算法建立模型,探明不同生育期以及多生育期無(wú)人機(jī)監(jiān)測(cè)棉花LAI的變化規(guī)律,為新疆棉花田間管理提供科學(xué)依據(jù)和技術(shù)支持。
試驗(yàn)于2021 年6—9 月在石河子市146 團(tuán)北泉鎮(zhèn)新疆天業(yè)集團(tuán)高標(biāo)準(zhǔn)農(nóng)田示范區(qū)進(jìn)行(85°58′13″E,44°28′49″N)。示范區(qū)位于準(zhǔn)噶爾盆地南緣,瑪納斯河西岸,屬典型的溫帶大陸性氣候。氣候干旱,主要以灌溉農(nóng)業(yè)為主,主要經(jīng)濟(jì)作物為棉花。區(qū)域內(nèi)光熱資源充足,蒸發(fā)較大。無(wú)霜期為170 d 左右,大于0 ℃的活動(dòng)積溫約為4 100 ℃,大于10 ℃的活動(dòng)積溫約為3 600 ℃。年降水量在(160±40)mm。示范區(qū)毗鄰蘑菇湖水庫(kù),受水庫(kù)影響,試驗(yàn)地地下水埋深3 m 以下,平均土壤含鹽量為12—18 g·kg-1,土壤鹽分類型以硫酸鹽為主,種植的棉花品種為‘惠遠(yuǎn)72’。試驗(yàn)地如圖1 所示。

圖1 試驗(yàn)地概況Fig.1 Overview of the test site
設(shè)置2 個(gè)生育期灌水淋洗試驗(yàn),灌溉水量均為作物需水量的80%(80% ETc),采用地表膜下滴灌和地下滴灌相結(jié)合的灌水方式,2 個(gè)試驗(yàn)均設(shè)置3 個(gè)相同的生育期淋洗水量水平,W1:120 mm、W2:240 mm、W3:360 mm,且均在3 個(gè)生育期的第1 次灌水施加淋洗水量。試驗(yàn)1 設(shè)置3 個(gè)地表地下交替滴灌起始時(shí)間:分別在苗期(Z1)、現(xiàn)蕾期(Z2)、初花期(Z3)第1 次淋洗時(shí)開(kāi)始進(jìn)行異次地表地下交替滴灌(異次表示相鄰兩次灌水過(guò)程中一次膜下滴灌一次地下滴灌,依次交替進(jìn)行),共計(jì)9 個(gè)處理,詳見(jiàn)表1。試驗(yàn)2 設(shè)置5 種次灌水量在地表和地下滴灌間的分配組合:膜下100%+地下0(F1)、膜下75%+地下25%(F2)、膜下50%+地下50%(F3)、膜下25%+地下75%(F4),膜下0+地下100%(F5),共15 個(gè)處理,詳情見(jiàn)表2。2 個(gè)試驗(yàn)共計(jì)24 個(gè)小區(qū),每個(gè)小區(qū)面積7 m×8 m。試驗(yàn)水源為當(dāng)?shù)厍F渲蠩Tc 根據(jù)ETc=ET0×Kc 獲得,ET0由試驗(yàn)區(qū)小型自動(dòng)氣象站數(shù)據(jù)計(jì)算獲得,Kc 為作物系數(shù),每 7 d灌水一次。

表1 試驗(yàn)1 處理設(shè)計(jì)Table 1 Test 1 treatment design
棉花播種時(shí)間為4 月中下旬,種植方式在傳統(tǒng)的一膜三管六行種植模式基礎(chǔ)上,在3 條地表滴灌帶下方30 cm 處增設(shè)地下滴灌帶,具體如圖2 所示,棉花種植間距為10 cm,株距10 cm,寬行為70 cm,膜寬200 cm,膜間距為30 cm,其中外側(cè)棉花主要指遠(yuǎn)離滴灌帶且靠近膜間裸地的棉花,內(nèi)側(cè)棉花主要指靠近滴灌帶且遠(yuǎn)離膜間裸地的棉花。

圖2 小區(qū)種植示意圖Fig.2 Schematic diagram of community planting (cm)
1.3.1 棉花LAI 的測(cè)定 采用傳統(tǒng)破壞性取樣打孔稱重法進(jìn)行LAI 的測(cè)定[27],有研究表明比重法測(cè)定LAI 具有較高的精度[13]。分別取內(nèi)側(cè)和外側(cè)棉花3 株代表性植株地上全葉片進(jìn)行打孔稱重,以測(cè)定棉花LAI[28]。3 株棉花的平均值代表采樣點(diǎn)的均值,棉花生長(zhǎng)的現(xiàn)蕾期和結(jié)鈴期各采得36 個(gè)樣本,初花期和吐絮期各采得48 個(gè)樣本,多生育期共計(jì)168 個(gè)樣本。采集時(shí)間見(jiàn)表3。

表3 試驗(yàn)數(shù)據(jù)采集時(shí)間表Table 3 Schedule of test data acquisition
1.3.2 無(wú)人機(jī)數(shù)據(jù)的獲取與處理 使用大疆精靈4多光譜版一體化無(wú)人機(jī)于每次地面采樣試驗(yàn)同期獲取棉花多光譜影像數(shù)據(jù),同時(shí)采集藍(lán)光(blue)、綠光(green)、紅光(red)、近紅外(NIR)、紅邊(red edge)5 個(gè)波段的多光譜圖像(在現(xiàn)蕾期和花鈴期只收集了18 個(gè)小區(qū)影像信息)。導(dǎo)入地面控制點(diǎn)的三維空間位置信息進(jìn)行地理校正。采用DJI Terra 軟件生成研究區(qū)域的正射影像。DJI Terra 生成包含5 個(gè)多光譜指數(shù)的文件以及對(duì)應(yīng)波段的DN 值數(shù)據(jù),5 種多光譜指數(shù)主要包括:歸一化差植被指數(shù)(NDVI)、綠度歸一化差植被指數(shù)(GNDVI)、歸一化差紅邊指數(shù)(NDRE)、葉片葉綠素指數(shù)(LCI)、優(yōu)化的土壤調(diào)節(jié)植被指數(shù)(OSAVI)。將所得圖像導(dǎo)入ENVI 軟件進(jìn)行裁剪獲取試驗(yàn)區(qū)大小的影像數(shù)據(jù)方便數(shù)據(jù)處理,并通過(guò)選取感興趣區(qū)域獲取棉花生長(zhǎng)內(nèi)外側(cè)相關(guān)無(wú)人機(jī)影像數(shù)據(jù)。根據(jù)圖像計(jì)算了19 種相關(guān)顏色指數(shù),進(jìn)行數(shù)據(jù)預(yù)處理后最終選擇5 種顏色指數(shù),分別為修正紅綠植被指數(shù)(MGRVI)、紅綠植被指數(shù)(GRVI)、綠葉指數(shù)(GLA)、超紅指數(shù)(EXR)、大氣阻抗植被指數(shù)(VARI)。文中使用的相關(guān)指數(shù)見(jiàn)表4。

表4 相關(guān)指數(shù)計(jì)算Table 4 Calculation of relevant indices
1.3.3 相關(guān)模型的構(gòu)建 選取5 種機(jī)器學(xué)習(xí)算法用以估算棉花LAI 數(shù)據(jù),分別為偏最小二乘(partial least squares regression,PLSR)、嶺回歸(ridge regression,RR)、隨機(jī)森林(random forest,RF)、支持向量機(jī)(support vector machine,SVM)、神經(jīng)網(wǎng)絡(luò)(back propagation,BP)算法,以上模型通過(guò)Python3.9 的Scikit-learn 機(jī)器學(xué)習(xí)庫(kù)構(gòu)建,代碼在Pycharm2022 中實(shí)現(xiàn)。將試驗(yàn)1 和試驗(yàn)2 數(shù)據(jù)匯總,各生育期數(shù)據(jù)按照2∶1 劃分為訓(xùn)練集和驗(yàn)證集,各生育期訓(xùn)練集和驗(yàn)證集的總和組成多生育期數(shù)據(jù)集合,使用訓(xùn)練集建立模型,使用驗(yàn)證集來(lái)評(píng)價(jià)模型性能。在模型訓(xùn)練中使用了6 折交叉驗(yàn)證來(lái)避免過(guò)擬合情況的出現(xiàn)。
1.3.4 評(píng)價(jià)指標(biāo) 采用決定系數(shù)(coefficient of determination,R2),平均絕對(duì)值誤差(mean absolute error,MAE)和歸一化均方根誤差(normal root mean square error,NRMSE)評(píng)價(jià)模型精度[38]。R2用于評(píng)價(jià)估測(cè)值和實(shí)測(cè)值的擬合程度,其值越接近1 則模型擬合效果越好;MAE 和NRMSE 用于評(píng)價(jià)估測(cè)值和實(shí)測(cè)值的實(shí)際偏差,其值越小則模型擬合效果越好。
對(duì)棉花各生育期LAI 采樣結(jié)果按照內(nèi)側(cè)和外側(cè)進(jìn)行分析,并計(jì)算各采樣點(diǎn)樣本的基本特征,如表5 所示。從總體上看,覆膜棉花LAI 隨著生育期的變化呈先增長(zhǎng)后下降的趨勢(shì)。LAI 峰值出現(xiàn)在初花期,初花期內(nèi)外側(cè)棉花LAI 均值分別為4.79 和3.79。通過(guò)方差分析,現(xiàn)蕾期、初花期、結(jié)鈴期內(nèi)側(cè)棉花葉面積指數(shù)均值均顯著大于外側(cè)(P<0.05)。在各生育期樣本的變異系數(shù)均大于17%。各生育期實(shí)測(cè)棉花LAI 的變異性較強(qiáng),且內(nèi)外側(cè)差異較大。一方面說(shuō)明按照內(nèi)側(cè)和外側(cè)采樣能夠?yàn)榻酉聛?lái)模型的精準(zhǔn)反演提供數(shù)據(jù)支持,另一方面表明有必要通過(guò)內(nèi)側(cè)外側(cè)區(qū)分以實(shí)現(xiàn)對(duì)試驗(yàn)區(qū)LAI 的精準(zhǔn)預(yù)測(cè)。

表5 采樣點(diǎn)LAI 分析Table 5 Sampling point LAI analysis
為了闡明各指數(shù)間及與棉花LAI 的相關(guān)關(guān)系,對(duì)各個(gè)生育期及多生育期多光譜指數(shù)和顏色指數(shù)間以及各指數(shù)與棉花LAI 進(jìn)行了相關(guān)性分析,分析結(jié)果如圖3 所示。

圖3 各生育期及多生育期數(shù)據(jù)集合相關(guān)指數(shù)間以及各指數(shù)與棉花LAI 相關(guān)系數(shù)熱圖Fig.3 Heat map of correlation coefficients between data sets of different growth stages and multiple growth stages, as well as between each index and cotton LAI
選擇的指數(shù)在各時(shí)期彼此間均呈現(xiàn)顯著相關(guān)(P<0.05)。總體而言,多光譜指數(shù)與顏色指數(shù)間的相關(guān)性隨著生育期的進(jìn)行而呈現(xiàn)下降趨勢(shì),在現(xiàn)蕾期多光譜指數(shù)與顏色指數(shù)的相關(guān)性最強(qiáng),相關(guān)系數(shù)介于0.63—0.85。對(duì)于多光譜指數(shù),NDVI 與GNDVI 在各生育期的相關(guān)系數(shù)介于0.81—0.88,兩者相關(guān)性最強(qiáng);OSAVI 與NDRE在各生育期的相關(guān)系數(shù)介于0.48—0.53,兩者相關(guān)性最弱。各多光譜指數(shù)間相關(guān)關(guān)系隨生育期變化而波動(dòng)。對(duì)于顏色指數(shù),在各生育期間各顏色指數(shù)間相關(guān)性極強(qiáng),且各顏色指數(shù)間相關(guān)性不隨生育期的變化而變化。對(duì)于多生育期數(shù)據(jù)集合,多光譜指數(shù)NDVI 與OSAVI 的相關(guān)性最強(qiáng),且NDVI 與各顏色指數(shù)間相關(guān)性最強(qiáng)。顏色指數(shù)間相關(guān)性極強(qiáng),且差異不明顯。多光譜指數(shù)間的相關(guān)性隨著生育期變化而變化在一定程度上說(shuō)明多光譜指數(shù)具有反映棉花生長(zhǎng)發(fā)育不同階段的潛力,顯然顏色指數(shù)不具備這樣的特征,后續(xù)的結(jié)果分析也印證了這一假設(shè)。
選擇的指數(shù)在各時(shí)期均與棉花LAI 存在顯著性(P<0.05),多光譜指數(shù)相關(guān)系數(shù)介于0.35—0.85,顏色指數(shù)相關(guān)系數(shù)介于0.49—0.71,相關(guān)系數(shù)絕對(duì)值較大的指數(shù)多為多光譜指數(shù),顏色指數(shù)與棉花LAI 的相關(guān)系數(shù)絕對(duì)值較小。在棉花初花期出現(xiàn)了多光譜指數(shù)和顏色指數(shù)相關(guān)系數(shù)的最大值,相關(guān)系數(shù)分別為0.85(NDVI)與0.71(GLA)。在多生育期LAI 集合上,顏色指數(shù)和多光譜指數(shù)相關(guān)系數(shù)較各生育期低,其中OSAVI 相關(guān)性最大,為0.69。在各個(gè)數(shù)據(jù)集中,多光譜指數(shù)與棉花LAI 相關(guān)系數(shù)NDVI>GNDVI>LCI≈NDRE>OSAVI,顏色指數(shù)間差異不明顯。綜上所述對(duì)于同一生育期不同指數(shù),多光譜指數(shù)與LAI 的相關(guān)性優(yōu)于可見(jiàn)光指數(shù)。對(duì)于不同生育期同一指數(shù),多光譜指數(shù)與LAI 的相關(guān)性隨生育期的變化而變化,除OSAVI 外其余多光譜指數(shù)的相關(guān)性在初花期和吐絮期要高于現(xiàn)蕾期和結(jié)鈴期,OSAVI 指數(shù)與LAI 相關(guān)性最大值出現(xiàn)在初花期和結(jié)鈴期,多光譜指數(shù)相關(guān)性變化程度較為明顯,顏色指數(shù)與LAI 的相關(guān)性幾乎不隨生育期的變化而變化。
為了建立和評(píng)價(jià)不同指數(shù)對(duì)棉花LAI 的估測(cè)模型,并探究不同生育期的模型變化規(guī)律,使用5 種機(jī)器學(xué)習(xí)算法構(gòu)建了各數(shù)據(jù)集合的棉花LAI 的估測(cè)模型,基于不同指數(shù)與機(jī)器學(xué)習(xí)算法建立模型的驗(yàn)證集合結(jié)果如圖4 所示。從選用指數(shù)上看,棉花各生育期模型中多光譜指數(shù)優(yōu)于顏色指數(shù),且各指數(shù)模型預(yù)測(cè)性能隨著生育期的變化呈現(xiàn)規(guī)律性。對(duì)于多光譜指數(shù),從現(xiàn)蕾期到初花期各指數(shù)模型預(yù)測(cè)性能均呈現(xiàn)上述趨勢(shì),在現(xiàn)蕾期后各指數(shù)模型性能規(guī)律性開(kāi)始變化。NDVI、GNDVI、OSAVI 模型預(yù)測(cè)性能在現(xiàn)蕾期后隨著生育期的變化呈下降趨勢(shì);LCI 模型預(yù)測(cè)性能逐漸上升;NDRE 模型預(yù)測(cè)性能產(chǎn)生波動(dòng)。在現(xiàn)蕾期和初花期擬合效果上,NDVI>GNDVI>OSAVI>NDRE>LCI,在結(jié)鈴期和吐絮期擬合效果上,NDVI>LCI>NDRE>GNDVI>OSAVI。對(duì)于顏色指數(shù):各顏色指數(shù)在各生育階段上擬合效果較差且差異不明顯,在現(xiàn)蕾期與結(jié)鈴期各模型間出現(xiàn)了較大的波動(dòng),在初花期和吐絮期較為平穩(wěn)。總體上決定系數(shù)R2介于0.1—0.5。在多生育期數(shù)據(jù)集合擬合效果上,多光譜指數(shù)表現(xiàn)為GNDVI>LCI>NDRE>NDVI>OSAVI。各顏色指數(shù)則表現(xiàn)為擬合效果接近,且均優(yōu)于多光譜指數(shù)GNDVI。

圖4 各生育期及多生育期數(shù)據(jù)集合模型性能變化圖Fig.4 Performance change of data collection model for each growth stage and multiple growth stages
從模型結(jié)果上看,RF 模型和BP 模型在各生育期下獲得了較高的估計(jì)精度。不同生育期下棉花LAI 的反演最優(yōu)模型如表6 所示。在各生育期最優(yōu)指數(shù)均為NDVI,現(xiàn)蕾期和吐絮期的LAI 最佳估計(jì)模型為BP,現(xiàn)蕾期最優(yōu)模型驗(yàn)證集R2為0.720,MAE 為0.239,NRMSE 為0.163,吐絮期最優(yōu)模型驗(yàn)證集R2為0.730,MAE 為0.371,NRMSE 為0.180。初花期和結(jié)鈴期的LAI 最佳估計(jì)模型為RF,初花期最優(yōu)模型驗(yàn)證集R2為0.809,MAE 為0.288,NRMSE 為0.120,結(jié)鈴期最優(yōu)模型驗(yàn)證集R2為0.746,MAE 為0.398,NRMSE為0.147。對(duì)棉花LAI 最優(yōu)預(yù)測(cè)模型出現(xiàn)在棉花的初花期,最優(yōu)模型預(yù)測(cè)性能相較現(xiàn)蕾期提高12.37%,較結(jié)鈴期提高8.45%,較吐絮期提升10.82%。對(duì)于同一生育期相同指數(shù),不同算法模型在預(yù)測(cè)性能上產(chǎn)生一定的差異性,RF 與BP 擬合效果均較好且較為相近,其余3 種算法擬合效果差異不明顯。對(duì)于不同的生育期,同一多光譜指數(shù)所構(gòu)建的模型反演效果有差異,但初花期構(gòu)建模型的反演精度優(yōu)于其他生育期。在多生育期擬合效果上,較各生育期預(yù)測(cè)模型性能出現(xiàn)了明顯下降,最優(yōu)指數(shù)為GNDVI,最優(yōu)估測(cè)模型為BP,模型驗(yàn)證集R2為0.386,MAE 為0.700,NRMSE 為0.198。

表6 各生育期和多生育期最優(yōu)模型Table 6 Optimal model for each growth stage and multiple growth stages
由圖5 分析可知,各最優(yōu)模型算法擬合回歸曲線斜率均小于1,這表明算法在棉花LAI 偏小時(shí)估測(cè)結(jié)果偏大,在棉花LAI 偏大時(shí)的估測(cè)結(jié)果偏小。初花期基于NDVI 的RF 模型驗(yàn)證集斜率最接近1,該模型的預(yù)測(cè)性能最佳。

圖5 各生育期及多生育期數(shù)據(jù)集合最優(yōu)模型散點(diǎn)圖Fig.5 Scatterplot of optimal model of data collection for each growth stage and multiple growth stages
棉花的LAI 隨生育期的變化而變化,呈現(xiàn)先增加后降低的趨勢(shì),本研究中初花期棉花LAI 達(dá)到峰值。內(nèi)外側(cè)棉花的長(zhǎng)勢(shì)狀況受土壤水分、鹽分狀況、根系分布情況等多種因素影響[39-40]。新疆多為鹽漬土,內(nèi)側(cè)棉花鹽分淋洗效果較好且土壤水分含量較高,膜下滴灌對(duì)外側(cè)棉花淋洗效果較差,且遠(yuǎn)離滴灌帶的膜間土壤處于積累鹽分的過(guò)程,這些原因會(huì)導(dǎo)致外側(cè)棉花受到的脅迫大于內(nèi)側(cè),引起內(nèi)外側(cè)棉花生長(zhǎng)的不均勻并進(jìn)一步影響棉花產(chǎn)量[39,41]。脅迫差異導(dǎo)致同一膜內(nèi)不同位置的棉花LAI 產(chǎn)生顯著差異,在本研究中外側(cè)棉花的LAI 在現(xiàn)蕾期、初花期、結(jié)鈴期顯著低于內(nèi)側(cè)棉花,在棉花正射影像圖中也可以觀察到類似于條帶狀的差異性。在本研究中區(qū)分內(nèi)外側(cè)棉花并以此建立數(shù)據(jù)集合以增加樣本數(shù)量并通過(guò)方差分析驗(yàn)證了差異性的存在,一方面為進(jìn)一步構(gòu)建反演模型提供了數(shù)據(jù)支撐,另一方面棉花在現(xiàn)蕾期開(kāi)始進(jìn)入營(yíng)養(yǎng)生長(zhǎng)和生殖生長(zhǎng)的并進(jìn)時(shí)期,在此后及時(shí)精準(zhǔn)掌握田間差異并采取一定的田間管理措施可以緩解內(nèi)外側(cè)棉花產(chǎn)量差異,如有研究表明提高灌水頻率可以在一定程度上緩解膜內(nèi)棉花生長(zhǎng)的內(nèi)外差異[41]。同時(shí)也提示使用合適的取樣方法在一定程度上能夠更好地反映試驗(yàn)區(qū)內(nèi)作物長(zhǎng)勢(shì)的真實(shí)情況。精準(zhǔn)農(nóng)業(yè)是未來(lái)農(nóng)業(yè)的發(fā)展趨勢(shì),在通過(guò)遙感技術(shù)對(duì)棉田進(jìn)行分析時(shí),充分考慮到棉花種植時(shí)內(nèi)側(cè)與外側(cè)差異是有必要的。
當(dāng)引入的指數(shù)較多時(shí),可以通過(guò)相關(guān)性分析對(duì)指數(shù)進(jìn)行初步篩選以提升擬合模型的效率[42-43]。NDVI在各生育期與LAI 的相關(guān)性均最高,這與前人研究結(jié)果一致[44-45]。在多生育期集合中,GNDVI 相關(guān)性最好,結(jié)合建模結(jié)果來(lái)看,這可能與GNDVI 在各生育期建模結(jié)果差異不明顯有關(guān)。同時(shí)在多生育期數(shù)據(jù)集中,多光譜指數(shù)OSAVI 與LAI 的相關(guān)性低于顏色指數(shù)。總體而言,LAI 與多光譜指數(shù)相關(guān)性較強(qiáng),與顏色指數(shù)相關(guān)性較弱,這與前人的研究結(jié)果一致[46]。通過(guò)圖3 可以觀察到顏色指數(shù)在各生育期內(nèi)相關(guān)性極強(qiáng),最小的相關(guān)系數(shù)達(dá)到了0.98,這種顏色指數(shù)間的強(qiáng)相關(guān)性在前人的研究中也有所體現(xiàn)[47]。各時(shí)期多光譜指數(shù)之間的差異性大于顏色指數(shù),在應(yīng)對(duì)LAI 隨生育期變化層面上作出了更為明顯的反饋,進(jìn)一步說(shuō)明多光譜相機(jī)可以更好揭示棉花生長(zhǎng)發(fā)育過(guò)程中的變化,同時(shí)也解釋了本文中基于多光譜指數(shù)建立的模型要優(yōu)于顏色指數(shù)建立的模型。
與前人利用無(wú)人機(jī)遙感技術(shù)反演農(nóng)作物的研究相比[21,23-24],本研究使用不同生育期的多光譜指數(shù)及顏色指數(shù)對(duì)棉花LAI 進(jìn)行估測(cè),使用機(jī)器學(xué)習(xí)算法選取出多個(gè)生育階段最優(yōu)模型。在研究中4 個(gè)生育期模型驗(yàn)證集的R2介于0.720—0.809,充分證明了使用無(wú)人機(jī)遙感技術(shù)對(duì)棉花多生育期LAI 反演的潛力。所得出的模型在訓(xùn)練集和驗(yàn)證集上R2均有一定提升,且為棉花多個(gè)生育期的LAI 監(jiān)測(cè)提供了理論支撐。棉花LAI監(jiān)測(cè)模型的性能是隨生育期變化的過(guò)程,相關(guān)指數(shù)與建模方法在特定時(shí)期取得較好效果,這與作物的生長(zhǎng)發(fā)育密切相關(guān)。有研究認(rèn)為葉綠素含量的變化會(huì)影響作物的光合能力,進(jìn)而引起作物葉片的可見(jiàn)光吸收能力改變,影響相關(guān)指數(shù)的數(shù)值變化,從而在一定程度上影響不同生育期的LAI 預(yù)測(cè)能力[21]。在本研究中對(duì)棉花LAI 監(jiān)測(cè)的最佳生育期在棉花初花期,有研究將棉花花期和結(jié)鈴期并稱為花鈴期,此時(shí)是棉花生長(zhǎng)的關(guān)鍵時(shí)期,以往基于無(wú)人機(jī)遙感的對(duì)棉花相關(guān)生理生長(zhǎng)參數(shù)的研究往往基于這一時(shí)期[48-49]。使用多光譜遙感技術(shù)監(jiān)測(cè)作物L(fēng)AI 的過(guò)程中普遍會(huì)出現(xiàn)相關(guān)指數(shù)過(guò)飽和的問(wèn)題,這在一定程度上制約了LAI 預(yù)測(cè)模型性能的提升,有研究證實(shí)圖像紋理指標(biāo)與多光譜指數(shù)相結(jié)合可以在一定程度提升LAI 預(yù)測(cè)性能[26]。在本研究中多生育期數(shù)據(jù)集合反演效果相較于單一生育期并不理想,并不能通過(guò)建立多生育期數(shù)據(jù)集合的方式來(lái)實(shí)現(xiàn)對(duì)任一時(shí)期棉花LAI 的監(jiān)測(cè),相較于前人使用高光譜相機(jī)進(jìn)行全生育期研究的多生育期的棉花LAI 反演模型的R2下降近20%[25],高光譜相機(jī)在精度方面優(yōu)于多光譜相機(jī),且高光譜數(shù)據(jù)處理方式的多樣性在一定程度上導(dǎo)致了兩者反演模型差異的出現(xiàn)。本文所建立的多生育期模型較差一方面可能因?yàn)楦髦笖?shù)在各生育期擬合結(jié)果本身存在差異性,另一方面可能因?yàn)閰^(qū)分內(nèi)外側(cè)后增大了樣本的差異性。通過(guò)圖5 觀察到驗(yàn)證集合斜率小于1 說(shuō)明了模型在LAI 偏小或偏大時(shí)會(huì)產(chǎn)生較大的誤差進(jìn)而影響模型的預(yù)測(cè)結(jié)果。通過(guò)圖4 不難看出,各個(gè)生育期的相關(guān)指數(shù)相關(guān)性差異并不明顯,棉花LAI 卻始終處于動(dòng)態(tài)變化的階段,這種變化不匹配的差異性可能導(dǎo)致了棉花多生育期數(shù)據(jù)集合預(yù)測(cè)性能的下降,限制基于多光譜指數(shù)對(duì)棉花LAI 經(jīng)驗(yàn)?zāi)P偷慕50]。在多生育期數(shù)據(jù)集合上,GDNVI 在指數(shù)中表現(xiàn)最好,OSAVI 表現(xiàn)最差,GDNVI 在LAI 的預(yù)測(cè)上具有更好的變化適應(yīng)性。顏色指數(shù)在各生育期和多生育期數(shù)據(jù)集內(nèi)表現(xiàn)平穩(wěn),GLA 是相對(duì)優(yōu)秀的顏色指數(shù),但總體上顏色指數(shù)擬合效果較差。
機(jī)器學(xué)習(xí)算法已被廣泛應(yīng)用于無(wú)人機(jī)影像對(duì)農(nóng)作物L(fēng)AI 的研究[51-52]。本文采用的5 種機(jī)器學(xué)習(xí)算法包括了在處理多數(shù)據(jù)問(wèn)題上有優(yōu)勢(shì)的偏最小二乘;能夠有效減少數(shù)據(jù)過(guò)擬合的嶺回歸算法;以及被廣泛應(yīng)用于處理非線性問(wèn)題的SVM、RF、BP 算法。通過(guò)圖4可以看到,選用適當(dāng)?shù)乃惴ㄔ谝欢ǔ潭壬嫌兄谔嵘藁↙AI 的監(jiān)測(cè)性能[53]。在多光譜指數(shù)上5 種機(jī)器學(xué)習(xí)算法對(duì)于LAI 均有很好的預(yù)測(cè)性能,其中RF 模型和BP 模型取得結(jié)果較好,其余3 種模型效果差異不明顯,這與前人研究結(jié)果一致[17,53]。SVM 算法在抗干擾性上存在一定劣勢(shì),這可能是限制該算法模型效果的原因[54]。偏最小二乘回歸和嶺回歸具有較高的穩(wěn)定性,但是預(yù)測(cè)能力較RF 和BP 模型有差異。這種現(xiàn)象存在的原因可能是偏最小二乘回歸和嶺回歸主要用于處理多元線性回歸問(wèn)題,RF 和BP 算法可以較好地處理非線性的擬合問(wèn)題[55]。先進(jìn)的機(jī)器學(xué)習(xí)算法可以有效提高遙感反演精度[56]。在顏色指數(shù)上,5 種機(jī)器學(xué)習(xí)算法對(duì)于LAI 的預(yù)測(cè)性能均較差且差異不大,單通過(guò)顏色指數(shù)無(wú)法獲得棉花LAI 的優(yōu)秀反演模型。多光譜指數(shù)與顏色指數(shù)模型在現(xiàn)蕾期和結(jié)鈴期表現(xiàn)出較初花期和吐絮期更大的不同模型間的波動(dòng),這可能與對(duì)應(yīng)生育期的樣本容量變化有關(guān),樣本容量的增大使得各模型之間的差異性縮小同時(shí)更為穩(wěn)定。各最優(yōu)擬合模型算法回歸斜率均小于1,這表明算法在處理棉花LAI 偏小時(shí)估測(cè)結(jié)果偏大,在棉花LAI 偏大時(shí)的估測(cè)結(jié)果偏小,該現(xiàn)象是使用機(jī)器學(xué)習(xí)算法針對(duì)作物L(fēng)AI預(yù)測(cè)而出現(xiàn)的普遍現(xiàn)象,這一現(xiàn)象也存在于前人研究中[25]。本文僅使用了一年的棉花試驗(yàn)數(shù)據(jù),且計(jì)算指數(shù)相對(duì)較少,缺少對(duì)無(wú)人機(jī)影像信息的紋理分析,未來(lái)應(yīng)當(dāng)考慮結(jié)合無(wú)人機(jī)紋理特征,并進(jìn)一步增加樣本數(shù)量,同時(shí)結(jié)合多年試驗(yàn)數(shù)據(jù),開(kāi)拓覆膜棉花LAI 的最優(yōu)估測(cè)模型并提升模型適應(yīng)性。
試驗(yàn)區(qū)內(nèi)外側(cè)棉花LAI 存在顯著性差異。棉花LAI 的估測(cè)模型隨著生育期的變化而變化,在各生育期內(nèi)NDVI 是估測(cè)棉花LAI 的最優(yōu)指數(shù),BP 模型與RF 模型均能夠取得較優(yōu)的估測(cè)效果。多生育期數(shù)據(jù)集合對(duì)棉花LAI 估測(cè)效果較差,最優(yōu)指數(shù)為GNDVI,最優(yōu)模型為BP,最優(yōu)模型驗(yàn)證集R2為0.386,MAE為0.700,NRMSE 為0.198。本研究中估測(cè)棉花LAI最優(yōu)窗口期在初花期,多光譜指數(shù)和顏色指數(shù)均得到了最優(yōu)的估測(cè)效果,最優(yōu)指數(shù)為NDVI,最優(yōu)模型為RF,最優(yōu)模型驗(yàn)證集R2為0.809,MAE 為0.288,NRMSE 為0.120。使用先進(jìn)的機(jī)器學(xué)習(xí)算法能夠獲得較好的棉花LAI 估測(cè)精度。