











摘要:為準確實時分析獼猴桃樹的生長健康狀況,以陜西關(guān)中平原獼猴桃樹為研究對象,構(gòu)建葉片高光譜數(shù)據(jù)集;基于隨機法和Kennard-Stone方法劃分數(shù)據(jù)集,采用競爭自適應(yīng)重加權(quán)采樣算法(CARS)、主成分分析法(PCA)和迭代保留信息變量算法(IRIV)提取樣本的特征波段;進而采用多元線性回歸(MLR)、嶺回歸(RR)、偏最小二乘回歸(PLSR)、支持向量回歸(SVR)和隨機森林回歸(RFR)等方法建立葉片葉綠素含量智能檢測模型。模型對比分析表明,基于CARS算法所提取的81個特征波段建立的CARS-RR模型預(yù)測效果最好,驗證集上的R2為0.86,RMSE為2.71。因此,提出的智能檢測模型能夠基于光譜信息無損檢測獼猴桃樹葉綠素含量,進而分析果園整體健康狀況,為后續(xù)果園精細化管理提供決策支撐。
關(guān)鍵詞:獼猴桃;葉綠素含量;回歸模型;高光譜;波段提取
中圖分類號:S663.4; TP391.4
文獻標識碼:A
文章編號:2095-5553(2024)12-0154-08收稿日期:2024年4月23日
修回日期:2024年7月23日
*基金項目:陜西省重點研發(fā)計劃項目(2023—YBNY—080);陜西省自然科學(xué)基礎(chǔ)研究計劃(2023—JC—YB—489);西安市科技計劃(24NYGG0031);國家級大學(xué)生創(chuàng)新訓(xùn)練計劃項目(202310712098)
第一作者:霍迎秋,男,1978年生,河北玉田人,博士,高級實驗師;研究方向為人工智能農(nóng)業(yè)應(yīng)用。E-mail: fallying@nwsuaf.edu.cn
通訊作者:胡少軍,男,1980年生,湖北松滋人,博士,副教授;研究方向為數(shù)字農(nóng)業(yè)。E-mail: hsj@nwsuaf.edu.cn
Intelligent detection of chlorophyll content in kiwifruit leaves based on hyperspectroscopy
Huo Yingqiu1, 2, 3, Ling Chendong1, Sun Jianghao1, Cai Jiatian1, Hu Shaojun1, 2, 3
(1. College of Information Engineering, Northwest A amp; F University, Yangling, 712100, China; 2. Research Center of Shaanxi Agricultural Information Intelligent Perception and Analysis Engineering Technology, Yangling, 712100, China;3. Key Laboratory for Agricultural Internet of Things, Ministry of Agriculture and Rural Affairs, Yangling, 712100, China)
Abstract: To accurately and precisely analyze the growth and health status of kiwifruit trees, a leaf hyperspectral dataset was constructed using kiwifruit trees in the Guanzhong Plain of Shaanxi Province. The dataset was divided based on the stochastic method and the Kennard-Stone method, and the characteristic bands of the samples were extracted using the competitive adaptive reweighted sampling (CARS), principal component analysis (PCA), and iteratively retains informative variables (IRIV) algorithms. Multiple linear regression (MLR), ridge regression (RR), partial least squares regression (PLSR), support vector regression (SVR) and random forest regression (RFR) were used to establish an intelligent detection model for leaf chlorophyll content. Comparative analysis of the models showed that the CARS-RR model based on the 81 feature bands extracted by the CARS algorithm had the best prediction effect, with an R2 of 0.86 and an RMSE of 2.71 on the validation set. Therefore, the proposed intelligent detection model can detect the chlorophyll content of kiwifruit trees based on the spectral information in a nondestructive manner. Furthermore, it can analyze the overall health status of the orchard, providing decision-making support for subsequent refined orchard management.
Keywords: kiwifruit; chlorophyll content; regression model; hyperspectroscopy; characteristic bands extraction
0 引言
葉綠素含量是獼猴桃樹主要的生化參數(shù),是光合作用能力、葉片氮含量和作物發(fā)育階段的指示器。檢測獼猴桃葉片的葉綠素含量,對獼猴桃樹的長勢監(jiān)測、施肥調(diào)控具有重要意義。作物葉片的葉綠素含量普遍采用生化檢測和儀器測量兩種方式進行檢測。傳統(tǒng)的生化檢測手段需要管理人員在現(xiàn)場采樣并送至實驗室進行化學(xué)分析,往往費時費力且耗時較長,并且結(jié)果受影響較大。SPAD值可表征葉綠素含量,通常采用便攜式葉綠素儀進行測定,但不方便進行大范圍葉綠素含量監(jiān)測[1]。高光譜技術(shù)提供了便捷的葉綠素?zé)o損檢測方法,近年來國內(nèi)外已有許多研究人員開展了基于高光譜技術(shù)的葉綠素含量檢測方法研究。
Singhal等[2]使用逐步判別分析(SDA)從玉米高光譜數(shù)據(jù)的1 024個波段中提取出24個特征波段。Wang等[3]使用相關(guān)系數(shù)連續(xù)投影算法(CC-SPA)從小米葉片高光譜圖像的771個波段數(shù)據(jù)中提取出7個特征波段,分別使用全波段數(shù)據(jù)和特征波段數(shù)據(jù)對小米葉片葉綠素含量進行回歸建模。Nofrizal等[4]使用三種降維方法對同一高光譜數(shù)據(jù)進行降維,提取出對應(yīng)的特征波段,構(gòu)建識別建模,并對比分析不同模型的準確度,結(jié)果顯示主成分分析法(PCA)是茭白葉片高光譜數(shù)據(jù)特征波段提取的最佳方法。
賴佳政等[5]使用偏最小二乘回歸(PLSR)、支持向量回歸(SVR)和隨機森林回歸(RFR)等5種方法估測烤煙葉片葉綠素含量,結(jié)果表明,RFR的估測效果最好,其驗證集R2達0.919。Bhadra等[6]使用PLSR、RFR、SVR和極限學(xué)習(xí)回歸(ELR)建立高粱葉片的葉綠素含量回歸模型,結(jié)果顯示,SVR的葉綠素含量預(yù)測效果優(yōu)于其他模型,而PLSR和ELR的建模時間更少。Kanning等[7]使用PLSR對冬小麥的葉片葉綠素含量LCC和葉面積指數(shù)LAI進行預(yù)測,基于預(yù)測的LCC和LAI再進一步使用SMLR對糧食產(chǎn)量進行預(yù)測,其預(yù)測結(jié)果的R2達0.88。劉爽等[8]使用PLSR、最小二乘支持向量機回歸(LSSVM)和Lasso回歸建立大豆葉片葉綠素含量的反演模型,結(jié)果顯示,基于一階微分光譜指數(shù)的LSSVM模型精度最高,其驗證集R2為0.836 0。
目前,以獼猴桃樹為研究對象,基于獼猴桃葉片高光譜數(shù)據(jù)建立葉綠素含量回歸模型的研究鮮有報道。與蘋果樹、橘樹等果樹不同,獼猴桃屬藤本植物,需搭架種植,其他作物的葉綠素含量回歸模型可能并不適用于獼猴桃。
因此,基于獼猴桃葉片的高光譜數(shù)據(jù),采用競爭自適應(yīng)重加權(quán)采樣算法(CARS)、主成分分析(PCA)和迭代保留信息變量算法(IRIV)提取高光譜特征波段,進而采用多元線性回歸(MLR)、嶺回歸(RR)、PLSR、SVR和RFR建立獼猴桃葉片葉綠素含量的估測模型具有重要的意義。
1 材料與方法
1.1 采樣區(qū)劃分
研究區(qū)位于陜西省楊凌農(nóng)業(yè)高新技術(shù)產(chǎn)業(yè)示范區(qū)大寨街道杜寨村(東經(jīng)108°04′05″,北緯34°17′38″)。該區(qū)域地處關(guān)中平原腹地,氣候類型為大陸性季風(fēng)型半濕潤氣候,年平均氣溫12.9 ℃,土壤肥沃,地況良好,是獼猴桃理想的生長環(huán)境。經(jīng)實地考察,研究區(qū)內(nèi)規(guī)則分布著22行藤架,每2行藤架的間隔距離約為5 m,每行藤架的長度約為4 m,因此可將每2行之間的獼猴桃架間區(qū)域再細分成5行4列的20個采樣區(qū)。按照這個劃分規(guī)則可將整個研究區(qū)域劃分為420個邊長為1 m的采樣區(qū),采樣區(qū)劃分情況如圖1所示。
1.2 高光譜數(shù)據(jù)采集與葉綠素含量測定
以FieldSpec4高光譜儀(探頭視角25°,采集范圍為350~2 500 nm,經(jīng)重采樣后的光譜間隔為1 nm)采集獼猴桃葉片的高光譜數(shù)據(jù)。在2022年8月8日采集了獼猴桃葉片的高光譜數(shù)據(jù),該日天空晴朗,無風(fēng)。采樣時,在每個采樣區(qū)按照五點取樣法確定5個采樣點,在每個采樣點使用光譜儀采集一片能被太陽完整照射的葉片的高光譜數(shù)據(jù)。在該采樣區(qū)的每個采樣點均完成數(shù)據(jù)采集后取均值作為該采樣區(qū)的高光譜數(shù)據(jù),最終得到420個采樣區(qū)的高光譜數(shù)據(jù)。由于高光譜數(shù)據(jù)的光譜兩端存在數(shù)據(jù)波動較大、雜亂的情況,為了避免對建模和特征波段的提取效果產(chǎn)生影響,使用Savitzky-Golay平滑對高光譜數(shù)據(jù)進行平滑以減小噪聲。
使用SPAD-502Plus便攜式葉綠素儀在采樣點測量獼猴桃葉片的SPAD值作為葉綠素含量值。測量時,在葉片一側(cè)的上、中、下位置各測量1次,再在葉片另一側(cè)的對稱位置各測量一次。采集結(jié)束后,每個采樣區(qū)的值取平均,最終得到420個采樣區(qū)的葉綠素含量值。
1.3 獼猴桃葉片樣本劃分
采用隨機法(RS)和Kennard-Stone(KS)方法將獼猴桃葉片樣本劃分為建模集和驗證集[9, 10]。取336個(80%)獼猴桃葉片樣本數(shù)據(jù)作為建模集,其余84個(20%)作為驗證集。總體樣本、建模集和驗證集的描述性統(tǒng)計如表1所示。從表1中得出,與RS相比,KS劃分建模集的值范圍與總樣本相同(24.10~60.70),可以有效反映總體樣本的情況。
1.4 特征波段提取
使用標準正態(tài)變量(SNV)方法將經(jīng)過平滑處理后的獼猴桃高光譜數(shù)據(jù)標準化,再采用競爭自適應(yīng)重加權(quán)采樣算法(CARS)、主成分分析(PCA)和迭代保留信息變量算法(IRIV)提取特征波段。
1.4.1 競爭自適應(yīng)重加權(quán)采樣算法
CARS模擬達爾文理論“適者生存”的原則,結(jié)合蒙特卡洛采樣和PLS回歸系數(shù)進行特征波段選擇[11]。以350~2 500 nm的高光譜全波段作為CARS算法的輸入。在提取特征波段時,采用十折交叉驗證法[12],對獼猴桃的高光譜數(shù)據(jù)進行50次采樣,即N=50。每次采樣時選擇剩余樣本的80%作為訓(xùn)練集,
20%作為預(yù)測集,建立PLSR模型,并記錄第i個波段PLS回歸系數(shù)絕對值的權(quán)重。利用指數(shù)遞減函數(shù)(EDF)ri=aeki計算第i次采樣保留的波段比例。剔除權(quán)重較小的波段,得到第i次采樣保留的波段數(shù)量ni=rip。根據(jù)設(shè)置的采樣次數(shù),不斷進行PLSR并計算交叉驗證均方根誤差RMSECV,選擇RMSECV最小的波段集合作為提取的特征波段。
1.4.2 主成分分析
PCA通過正交變換方法,將高維的光譜信息投影到低維的坐標空間,并最大限度地保留了原始光譜的有效信息,是一種有效的數(shù)據(jù)精簡方式[13]。為了比較CARS算法和PCA算法在高光譜數(shù)據(jù)降維方面對模型性能的影響,將350~2 500 nm的高光譜全波段作為PCA算法的輸入。
1.4.3 迭代保留信息變量算法
在計算資源有限的實際應(yīng)用場景中,應(yīng)盡可能降低模型規(guī)模,可采取選擇較小的波段范圍的策略。葉綠素含量的變化主要影響可見光區(qū)域的反射率,對紅外光區(qū)域的影響較小[14]。因此,重點關(guān)注可見光區(qū)域與一部分近紅外區(qū)域的特征波段,以350~1 000 nm區(qū)間的波段作為IRIV算法的輸入,期望在降低模型規(guī)模的同時保持預(yù)測精度。
IRIV基于二進制矩陣重排過濾器,充分考慮到變量之間的相互作用,將變量分類成強信息變量、弱信息變量、無信息變量和干擾信息變量[1]。輸入波段經(jīng)過算法反復(fù)迭代,得到對獼猴桃葉片葉綠素值敏感的特征波段。算法每次迭代生成一個隨機化矩陣,矩陣的每一行代表變量的一組隨機組合。基于變量的隨機組合建立PLS模型,并計算交叉驗證均方根誤差。對于每個波長變量,計算包含和不包含該波長變量時RMSECV的平均值MEANinclude和MEANexclude,得到兩者之差
DMEAN=MEANinclude-MEANexclude (1)
根據(jù)DMEAN值和Mann-Whitney U檢驗的P值將變量分類,如表2所示[15]。剔除無信息變量和干擾信息變量,反復(fù)迭代直至只剩下強信息變量和弱信息變量。最后進行反向消除,得到特征波長變量。
1.5 建模方法
分別以CARS、PCA和IRIV方法提取的特征波段作為特征,采用MLR、RR、PLSR、SVR和RFR建立獼猴桃葉片葉綠素值的檢測模型。
1.5.1 多元線性回歸
MLR對一個或多個自變量X和因變量Y之間關(guān)系進行建模,基本形式為
Y=β0+β1X1+β2X2+…+βnXn (2)
式中:βi——回歸系數(shù)。
1.5.2 嶺回歸
RR在標準多元線性回歸的基礎(chǔ)上加入L2正則化,可抑制標準多元線性回歸的過擬合問題。本文使用網(wǎng)格搜索(GridSearchCV)算法對正則化參數(shù)λ在0~1區(qū)間內(nèi)進行最佳選擇。
1.5.3 偏最小二乘回歸
PLSR綜合了多元線性回歸、典型相關(guān)分析和主成分分析的思想,是一種用于解決變量之間多重共線性問題的多元回歸方法[16]。使用網(wǎng)格搜索算法從1到特征波段數(shù)之間的整數(shù)范圍內(nèi),選擇PLSR的最佳成分數(shù),代表建模效果最佳時主成分包含的波段數(shù)量。
1.5.4 支持向量回歸
SVR是支持向量機(SVM)的應(yīng)用分支,二者的思想都是最大化支持向量間的間隔。SVR能夠在保證模型精度的同時降低擬合函數(shù)的復(fù)雜度,對于有限樣本和非線性問題有很多優(yōu)勢。本文使用高斯徑向基函數(shù)(RBF)作為SVR的核函數(shù),使用網(wǎng)格搜索對懲罰因子C和核函數(shù)參數(shù)γ進行最佳選擇,二者均在10-3~103之間均勻分布的7個值中選擇。
1.5.5 隨機森林回歸
RFR是隨機森林應(yīng)用分支,是一種基于決策樹的集成學(xué)習(xí)算法。RFR通過隨機抽取樣本和特征,構(gòu)建多棵不相關(guān)的決策樹,將所有樹的預(yù)測值取平均,得到森林的回歸預(yù)測值。
1.6 模型檢驗
使用決定系數(shù)R2和均方根誤差RMSE檢驗?zāi)P皖A(yù)測獼猴桃葉片葉綠素含量值的性能,其計算分別如式(3)和式(4)所示。R2表示因變量方差中可被自變量解釋的比例,即模型準確預(yù)測數(shù)據(jù)的能力,R2越接近1則模型的預(yù)測能力越強。RMSE用于衡量模型預(yù)測值和樣本真實值之間的差異程度,RMSE越小則模型的預(yù)測效果越好,誤差越小。
R2=1-∑c/t=1(y-y′)2/c/∑c/t=1(y-y-)2/c (3)
RMSE=∑c/t=1(y′-y)2/c (4)
式中:y′——葉綠素估算值;
y——葉綠素實測值;
y-——葉綠素實測值的平均值;
c——樣本總數(shù)。
2 結(jié)果與分析
2.1 獼猴桃葉片光譜特征分析
將樣本按葉綠素含量值由高到低排序,選取四分位數(shù)、最小值和最大值樣本,分析其原始光譜的反射率曲線(圖2)。由于葉綠素含量的變化主要影響可見光區(qū)域的光譜反射率[14],故從全波段中截取350~1 000 nm波長范圍用于繪制反射率曲線。從圖2中可以看出,5個葉綠素值對應(yīng)的光譜反射率具有一致的變化趨勢。在500~600 nm之間存在一個波峰,這是葉綠素反射綠光的特性所致。在500 nm和670 nm附近存在兩個波谷,這是因為葉綠素具有吸收藍光和紅光的特性。在680~750 nm之間反射率急劇上升,在750~1 000 nm之間反射率維持在0.6左右。整體而言,獼猴桃葉片的光譜反射率符合“一峰兩谷一平臺”的特點[17]。對比不同葉綠素值樣本的反射率可知,在500~600 nm的波峰區(qū)域,隨葉綠素值減少,反射率有增加的趨勢,最小葉綠素值(24.10)在553 nm處達到了最大反射率0.19。
2.2 提取特征波段
2.2.1 CARS方法篩選
以350~2 500 nm全波段作為CARS算法的輸入,設(shè)置采樣次數(shù)為50,交叉驗證次數(shù)為10,算法選擇采樣過程中RMSECV最小的波段集合作為提取的特征波段。CARS算法特征波段選擇過程如圖3所示。
從圖3可以看出,在第1輪蒙特卡洛迭代中,RMSECV為3.27;隨著采樣次數(shù)的增加,剩余波段數(shù)減小的速度逐漸放緩,RMSECV也逐漸減小,并在采樣次數(shù)為24時達到最小值2.68,此時剩余81個波段,將其作為特征波段;當(dāng)采樣次數(shù)大于30后,RMSECV急劇增加,大于未采樣時的RMSECV。因此,從全波段中選出部分波段進行葉綠素含量回歸建模可以提高建模精度,但使用追求過少的波段進行建模也會導(dǎo)致更差的建模效果。
2.2.2 PCA方法篩選
為了比較CARS算法和PCA算法進行高光譜數(shù)據(jù)降維對后續(xù)模型性能的影響,以350~2 500 nm全波段作為PCA算法的輸入,采用主成分累積貢獻率來判斷有效主成分[18]。各主成分的方差貢獻率和累計貢獻率如表3所示,其中PC1的方差貢獻率最高,為71.77%,前8個主成分的累計貢獻率已達到99%,因此選擇前8個主成分能夠有效降維并保留大部分光譜信息。
2.2.3 IRIV方法篩選
以350~1 000 nm區(qū)間的波段作為IRIV算法的輸入,設(shè)置PLS模型的最大主成分數(shù)為10,交叉驗證次數(shù)為5[19]。IRIV算法一共進行8輪迭代,每輪迭代開始前的保留變量個數(shù)如圖4所示。在前3輪迭代中,保留變量的個數(shù)急劇減少,第4輪迭代開始前剩余變量數(shù)為70。第7輪迭代結(jié)束后保留了37個變量,隨后進行反向消除。第8輪的反向消除結(jié)束后,最終得到15個特征波長,有9個特征波長處于可見光區(qū),6個處于近紅外區(qū)。根據(jù)特征波長的DMEAN值和Mann-Whitney U檢驗的P值可知,在15個特征波長中,3個為強信息變量(397 nm、401 nm、715 nm),12個為弱信息變量(407 nm、644 nm、645 nm、676 nm、691 nm、703 nm、875 nm、876 nm、877 nm、918 nm、927 nm、928 nm)。
2.3 模型建立
2.3.1 基于CARS篩選的特征波段建立模型
將CARS算法篩選出的81個特征波長作為特征,分別采用RS和KS兩種樣本劃分方式對獼猴桃葉片葉綠素值進行回歸建模,結(jié)果如表4所示。
對比各個模型在建模集上的識別精度發(fā)現(xiàn),在基于RS和KS劃分方式的模型中,CARS-RFR的識別精度均為最佳,其在RS劃分樣本上的R2和RMSE分別為0.955 2和1.491 7,在KS劃分樣本上的R2和RMSE分別為0.958 4和1.482 0。對比驗證集識別精度可知,在基于RS劃分方式的模型中,CARS-RR的識別精度最佳,其R2和RMSE分別為0.861 9和2.705 8,相較于CARS-MLR,R2增加了7.34%,RMSE降低了16.28%。在基于KS劃分方式的模型中,CARS-RR的效果仍為最佳,其R2和RMSE分別為0.793 2和2.904 1,相較于CARS-MLR,R2增加了8.72%,RMSE降低了12.56%。可見嶺回歸能夠有效抑制標準多元線性回歸導(dǎo)致的過擬合問題。
綜上所述,在以CARS算法提取的特征波段為特征所建立的模型中,CARS-RR在驗證集上取得最高的R2和最低的RMSE,可作為估測獼猴桃葉片葉綠素值的最佳模型。
2.3.2 基于PCA篩選的特征波段建立模型
為了與CARS算法進行對比,采用PCA方法對獼猴桃葉片高光譜數(shù)據(jù)進行降維。將PCA降維得出的8個主成分作為特征,對獼猴桃葉片葉綠素值進行建模,結(jié)果如表5所示。
對比各個模型在建模集上的識別精度發(fā)現(xiàn),在基于RS和KS劃分方式的模型中,PCA-RFR的識別精度均為最佳,其在RS劃分樣本上的R2和RMSE分別為0.958 4和1.437 6,在KS劃分樣本上的R2和RMSE分別為0.958 4和1.495 0。對比驗證集識別精度可知,無論在RS劃分樣本還是KS劃分樣本上,PCA-MLR、PCA-RR和PCA-PLSR的識別精度幾乎一致。PCA-MLR、PCA-RR和PCA-PLSR在RS劃分樣本上的R2約為0.72,RMSE約為3.85,在KS劃分樣本上的R2約為0.62,RMSE約為3.68,在5個模型中表現(xiàn)最佳。因此,在以PCA主成分為特征的模型中,PCA-MLR、PCA-RR和PCA-PLSR均可作為識別獼猴桃葉片葉綠素含量的最佳模型。由于這3個模型的精度幾乎一致,以PCA-MLR作為代表,將其作為基于PCA方法的最佳模型。
2.3.3 基于IRIV篩選的特征波段建立模型
將IRIV算法篩選出的15個特征波段作為特征,分別采用RS和KS兩種樣本劃分方式對獼猴桃葉片葉綠素值進行回歸建模,結(jié)果如表6所示。
對比各個模型在建模集上的識別精度發(fā)現(xiàn),在基于RS劃分方式的模型中,IRIV-RFR的識別精度最佳,其R2和RMSE分別為0.959 3和1.421 5,而其余模型的R2和RMSE分別在0.80和3.15左右。在基于KS劃分方式的模型中,IRIV-RFR的識別精度仍然為最佳,其R2和RMSE分別為0.963 3和1.382 1,而其余模型的R2和RMSE分別在0.83和3.00左右。總體而言,以IRIV-RFR在建模集上的效果最佳,且KS劃分效果好于RS劃分。
對比驗證集識別精度可知,在基于RS劃分方式的模型中,IRIV-RR的效果最佳,其R2和RMSE分別為0.775 8和3.447 1。相比于IRIV-MLR,IRIV-RR的R2增加了0.27%,RMSE降低了0.46%。IRIV-PLSR也達到了較好的識別精度,其R2和RMSE分別為0.775 1和3.452 9,略遜于IRIV-RR。在基于KS劃分方式的模型中,IRIV-PLSR效果最佳,其R2和RMSE分別為0.628 6和3.769 2。IRIV-RR也達到了較好效果,其R2和RMSE分別為0.626 4和3.780 2,略遜于IRIV-PLSR。總體來說,IRIV-RR和IRIV-PLSR在驗證集上都達到較好的識別精度。與CARS算法所篩選的81個特征波段和PCA方法保留的8個主成分相比,IRIV算法保留的特征波段數(shù)量僅為15個,實現(xiàn)在減小特征數(shù)量的同時,保持模型的預(yù)測精度。
2.4 模型對比
繪制基于三種特征波段提取方法的最優(yōu)模型(CARS-RR、PCA-MLR和IRIV-RR)在RS和KS驗證集樣本上的實測值與預(yù)測值偏離情況對比圖,如圖5所示。
從圖5可以看出,在基于RS和KS兩種劃分方式的模型中,CARS-RR的實測值與預(yù)測值偏離程度均為最小,具有最高的預(yù)測精度,在RS驗證集樣本上的R2為0.86,RMSE為2.71;在KS驗證集樣本上的R2為0.79,RMSE為2.90。PCA-MLR的特征波段數(shù)量僅為8,但識別精度不及CARS-RR。IRIV-RR的特征波段數(shù)量為15,與CARS-RR相比,減少了特征波段數(shù)量,但IRIV-RR的實測值與預(yù)測值仍然較為緊密地分布在標準線兩側(cè),保持了較高的預(yù)測精度。總的來說,CARS-RR模型的精度最高,而IRIV-RR模型能夠減少特征波段數(shù)量并保持精度,更適合實際應(yīng)用。
3 討論
葉綠素含量是表征作物生長狀況的重要指標,葉綠素含量的無損、快速、大尺度檢測具有重要價值[20]。研究表明,獼猴桃葉片的高光譜反射率具有“一峰兩谷一平臺”的特征,這與符欣彤等[17]的研究結(jié)果一致。CARS、PCA和IRIV 3種方法均能有效地提取對獼猴桃葉片葉綠素值敏感的特征波段,大幅降低光譜數(shù)據(jù)的維度,但3種方法提取的特征波段存在差異。CARS從350~2 500 nm的高光譜全波段中提取出81個特征波段,PCA從全波段中保留8個主成分,IRIV從350~1 000 nm的局部波段中提取出15個特征波段,導(dǎo)致模型效果存在差異。基于CARS特征波段的模型識別效果優(yōu)于基于PCA主成分、IRIV特征波段的模型,原因可能是CARS所提取的特征波段保留更豐富的光譜信息。嶺回歸是一種用于處理自變量多重共線性問題的有偏回歸估計方法,通過損失部分精度獲得對病態(tài)數(shù)據(jù)具有耐受性的模型[21, 22]。在基于CARS和IRIV特征波段提取方法的模型中,嶺回歸達到較好的效果,且與多元線性回歸相比,嶺回歸的效果均有不同程度的提升。
采用3種特征波段篩選方法和5種機器學(xué)習(xí)方法構(gòu)建獼猴桃葉片葉綠素含量的智能檢測模型,為后續(xù)使用無人機高光譜遙感大面積地獲取獼猴桃園的葉綠素含量,監(jiān)測果園健康狀況提供理論支撐。此外,僅反映2022年夏季陜西關(guān)中平原獼猴桃的情況,今后仍需研究不同年份、不同生育期的獼猴桃生長狀況,總結(jié)出不同時期的葉綠素含量規(guī)律,提高模型對不同生育期獼猴桃的普適性。
4 結(jié)論
構(gòu)建獼猴桃葉片高光譜數(shù)據(jù)集,采用RS和KS數(shù)據(jù)集劃分方式,基于CARS、PCA和IRIV算法提取獼猴桃葉片的特征波段,對獼猴桃葉片葉綠素值回歸模型進行研究。
1)基于CARS特征波段的CARS-RR模型預(yù)測獼猴桃葉片葉綠素值的效果最好,其在RS驗證集樣本上的R2為0.86,RMSE為2.71;在KS驗證集樣本上的R2為0.79,RMSE為2.90。
2)CARS算法所提取的特征波段優(yōu)于PCA、IRIV算法。基于CARS特征波段建立的模型識別效果優(yōu)于基于PCA主成分、IRIV特征波段的模型。
3)基于IRIV特征波段的IRIV-RR模型能夠減少特征波段數(shù)量并保持預(yù)測精度。IRIV算法從350~1 000 nm區(qū)間的波段中提取出3個為強信息變量、12個為弱信息變量,減少特征波段數(shù)量,且IRIV-RR模型保持較高的預(yù)測精度。
研究結(jié)果可基于獼猴桃高光譜數(shù)據(jù)監(jiān)測果園的葉綠素含量,進而分析果園健康狀況,能夠為后續(xù)果園的智能化管理提供決策支持。
參 考 文 獻
[1] 于雷, 章濤, 朱亞星, 等. 基于IRIV算法優(yōu)選大豆葉片高光譜特征波長變量估測SPAD值[J]. 農(nóng)業(yè)工程學(xué)報, 2018, 34(16): 148-154.
Yu Lei, Zhang Tao, Zhu Yaxing, et al. Determination of soybean leaf SPAD value using characteristic wavelength variables preferably selected by IRIV algorithm [J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(16): 148-154.
[2] Singhal G, Bansod B, Mathew L, et al. Chlorophyll estimation using multi-spectral unmanned aerial system based on machine learning techniques [J]. Remote Sensing Applications: Society and Environment, 2019, 15: 100235.
[3] Wang X, Li Z, Wang W, et al. Chlorophyll content for millet leaf using hyperspectral imaging and an attention-convolutional neural network [J]. Ciência Rural, 2020, 50(3).
[4] Nofrizal A Y, Sonobe R, Yamashita H, et al. Estimating chlorophyll content of Zizania latifolia with hyperspectral data and random forest [J]. International Journal of Engineering and Geosciences, 2022, 7(3): 221-228.
[5] 賴佳政, 李貝貝, 程翔, 等. 基于無人機高光譜遙感的烤煙葉片葉綠素含量估測[J]. 智慧農(nóng)業(yè)(中英文), 2023, 5(2): 68-81.
Lai Jiazheng, Li Beibei, Cheng Xiang, et al. Monitoring of leaf chlorophyll content in flue-cured tobacco based on hyperspectral remote sensing of unmannedaerial vehicle [J]. Smart Agriculture, 2023, 5(2): 68-81.
[6] Bhadra S, Sagan V, Maimaitijiang M, et al. Quantifying leaf chlorophyll concentration of sorghum from hyperspectral data using derivative calculus and machine learning [J]. Remote Sensing, 2020, 12(13): 2082.
[7] Kanning M, Kühling I, Trautz D, et al. High-resolution uav-based hyperspectral imagery for lai and chlorophyll estimations from wheat for yield prediction [J]. Remote Sensing, 2018, 10(12): 2000.
[8] 劉爽, 于海業(yè), 張郡赫, 等. 基于最優(yōu)光譜指數(shù)的大豆葉片葉綠素含量反演模型研究[J]. 光譜學(xué)與光譜分析, 2021, 41(6): 1912-1919.
Liu Shuang, Yu Haiye, Zhang Junhe, et al. Study on inversion model of chlorophyll content in soybean leaf based on optimal specrtal indices [J]. Spectroscopy and Spectral Analysis, 2021, 41(6): 1912-1919.
[9] Kennard R W, Stone L A. Computer aided design of experiments [J]. Technometrics, 1969, 11: 137.
[10] 劉偉, 趙眾, 袁洪福, 等. 光譜多元分析校正集和驗證集樣本分布優(yōu)選方法研究[J]. 光譜學(xué)與光譜分析, 2014, 34(4): 947-951.
Liu Wei, Zhao Zhong, Yuan Hongfu, et al. An optimal selection method of samples of calibration set and validation set for spectral multivariate analysis [J]. Spectroscopy and Spectral Analysis, 2014, 34(4): 947-951.
[11] Li H, Liang Y, Xu Q, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration [J]. Analytica Chimica Acta, 2009, 648(1): 77-84.
[12] 撒繼銘, 江河, 謝凱文, 等. 基于隨機蛙跳算法的特征波長優(yōu)選[J]. 光學(xué)學(xué)報, 2021, 41(15): 235-243.
Sa Jiming, Jiang He, Xie Kaiwen, et al. Characteristic wavelength optimization based on random frog algorithm [J]. Acta Optica Sinica, 2021, 41(15): 235-243.
[13] 胡會強, 位云朋, 徐華興, 等. 基于高光譜成像技術(shù)和主成分分析對粉葛年限的鑒別[J]. 光譜學(xué)與光譜分析, 2023, 43(6): 1953-1960.
Hu Huiqiang, Wei Yunpeng, Xu Huaxing, et al. Identification of the age of puerariae thomsonii radix based on hyperspectral imaging and principal component analysis [J]. Spectroscopy and Spectral Analysis, 2023, 43(6): 1953-1960.
[14] 張俊逸, 高德華, 宋迪, 等. PROSPECT模型的特征波長優(yōu)化與作物葉綠素含量檢測[J]. 光譜學(xué)與光譜分析, 2022, 42(5): 1514-1521.
Zhang Junyi, Gao Dehua, Song Di, et al. Wavelengths optimization and chlorophyll content detection based on prospect model [J]. Spectroscopy and Spectral Analysis, 2022, 42(5): 1514-1521.
[15] Yun Y, Wang W, Tan M, et al. A strategy that iteratively retains informative variables for selecting optimal variable subset in multivariate calibration [J]. Analytica Chimica Acta, 2014, 807: 36-43.
[16] 孫紅, 鄭濤, 劉寧, 等. 高光譜圖像檢測馬鈴薯植株葉綠素含量垂直分布[J]. 農(nóng)業(yè)工程學(xué)報, 2018, 34(1): 149-156.
Sun Hong, Zheng Tao, Liu Ning, et al. Vertical distribution of chlorophyll in potato plants based on hyperspectral imaging [J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(1): 149-156.
[17] 符欣彤, 常慶瑞, 張佑銘, 等. 基于Stacking集成學(xué)習(xí)的獼猴桃葉片葉綠素含量估算[J]. 干旱地區(qū)農(nóng)業(yè)研究, 2023, 41(4): 247-256.
Fu Xintong, Chang Qingrui, Zhang Youming, et al. Estimation of kiwifruit leaf chlorophyll content based on Stacking ensemble learning [J]. Agricultural Research in the Arid Areas, 2023, 41(4): 247-256.
[18] 劉子揚, 馮帥, 趙冬雪, 等. 無人機高光譜遙感的水稻葉瘟病的光譜特征提取與檢測方法研究[J]. 光譜學(xué)與光譜分析, 2024, 44(5): 1457-1463.
Liu Ziyang, Feng Shuai, Zhao Dongxue, et al. Research on spectral feature extraction and detection method of rice leaf blast by UAV hyperspectral remote sensing [J]. Spectroscopy and Spectral Analysis, 2024, 44(5): 1457-1463.
[19] 梁琨, 劉全祥, 潘磊慶, 等. 基于高光譜和CARS-IRIV算法的‘庫爾勒香梨’可溶性固形物含量檢測[J]. 南京農(nóng)業(yè)大學(xué)學(xué)報, 2018, 41(4): 760-766.
Liang Kun,Liu Quanxiang,Pan Leiqing, et al. Detection of soluble solids content in ‘Korla fragrant pear’ based on hyperspectral imaging and CARS-IRIV algorithm [J]. Journal of Nanjing Agricultural University, 2018, 41(4): 760-766.
[20] 江凱倫, 安吉慶, 趙雨薇, 等. 采用RNCA-PSO-ELM的水稻葉綠素光譜特征分析與反演[J]. 農(nóng)業(yè)工程學(xué)報, 2022, 38(8): 178-186.
Jiang Kailun, An Jiqing, Zhao Yuwei, et al. Analysis and inversion of rice chlorophyll spectral characteristics using RNCA-PSO-ELM[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(8): 178-186.
[21] 張智韜, 王海峰, Karnieli A, 等. 基于嶺回歸的土壤含水率高光譜反演研究[J]. 農(nóng)業(yè)機械學(xué)報, 2018, 49(5): 240-248.
Zhang Zhitao, Wang Haifeng, Karnieli A, et al. Inversion of soil moisture content from hyperspectra based on ridge regression [J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(5): 240-248.
[22] 彭濤, 趙麗, 張愛軍, 等. 土壤全氮的無人機高光譜響應(yīng)特征及估測模型構(gòu)建[J]. 農(nóng)業(yè)工程學(xué)報, 2023, 39(4): 92-101.
Peng Tao, Zhao Li, Zhang Aijun, et al. UAV hyperspectral response characteristics and estimation model construction of soil total nitrogen [J]. Transactions of the Chinese Society of Agricultural Engineering, 2023, 39(4): 92-101.