張 佩,陳鄭盟,馬順登,尹 帝,江海東※
(1.南京農業大學農業部作物生理生態與生產管理重點實驗室、江蘇省現代作物生產協同創新中心、國家信息農業工程技術中心,南京 210095;2. 江蘇省氣象局,南京 210008;3. 福建省煙草公司龍巖市公司,龍巖 364000)
隨著數碼圖像技術的成熟和高分辨率相機設備的普及,通過分析彩色數碼圖像來描述植物表型性狀和生長狀況的工作越來越多[1-4]。數字彩色圖像包含豐富的植物形態、結構和顏色信息[5-6],已經被用來研究作物葉綠素含量[7]、營養狀況[8]、逆境脅迫程度[9]。由于數碼圖像信息與植物生長已經被證實有著較好的相關性,因此,逐漸有學者開始利用作物圖像來開展產量估測[10-11]。
加色混色模型(Red-Green-Bule,RGB)模型是數碼圖像最常用的顏色分析方法[12],其葉色分布模式有兩種:正態分布或者偏態分布[13-15]。在統計學中,常用的偏態分布特征參數有均值、中位數、眾數、偏度和峰度等,正態分布是一種特殊的數據分布模式,其特點是均值、中位數、眾數三者合一,偏度為0[16]。在以往的多數研究中,研究人員把植株冠層葉色分布當作正態分布或者近似正態分布處理[17-19],這導致獲得的統計量只有各通道均值一項,信息量較少,只能以各通道均值及其組合參數近似描述植物葉色深淺情況。同時,也忽略了其他參數在葉色定量描述中的意義,無法真實、準確地描述葉色分布情況,極大地限制了RGB模型的應用。僅有少量研究者開展了葉色色階按偏態分布進行處理的嘗試,發現茶葉新葉和老葉的偏度明顯不同[13],玉米葉片中的水分狀況跟葉片RGB模型中灰度通道的偏度相關[14],煙草葉片SPAD值(Soil and Plant Analyzer Development)與紅色(Red,R)通道均值和偏度相關[15]。這些研究基于偏態分布得到了均值、中位數、眾數、偏度和峰度5種共20個常用的RGB模型偏態參數。這些參數不僅極大地拓展植物葉片顏色信息,而且能從顏色深淺、分布的偏向性及集中度三個方面系統地描述葉色。但是這些偏態分布的研究都是器官層面的,在作物生產上的應用需要上升到群體層面。因此,本研究擬進一步驗證作物群體圖像是否符合偏態分布模式,并探索RGB模型偏態分布模式在大豆產量預估上的應用前景。不同的大豆栽培措施能夠產生不同的群體特征并影響最終的產量[20-22]。為了嘗試利用RGB模型偏態參數無損快速地預測大豆產量,本研究以大豆新品系曲莖為材料,通過不同的種植密度和氮肥用量處理形成不同的群體,利用無人機分別于花期、莢期和鼓粒期采集冠層圖像,分析群體圖像色階偏態分布的特征,然后分別提取RGB圖像R、綠(Green,G)、藍(Blue,B)3個顏色通道及灰度(Gray,Y)圖像的正態參數、偏態參數,運用多元回歸法構建基于無人機RGB圖像偏態參數的大豆產量預測模型,并基于不同栽培措施和不同品種條件下大豆的產量進行驗證,以期為無損快速的智能化大豆產量預測提供一種可靠的思路與方法。
大豆新品系曲莖由南京農業大學國家大豆改良中心提供,用于建模和同品種不同栽培措施間驗證;徐豆18由江蘇徐淮地區徐州農業科學研究所提供,用于不同品種間驗證。試驗在安徽省滁州市瑯琊區三官鎮(32°32′N,118°30′E)實施,試驗地面積12 m×50 m,壤土,全氮1.01 g/kg、速效磷16.33 mg/kg、速效鉀101.3 mg/kg和有機質16.8 g/kg。試驗地氣象數據來自安徽省氣象信息中心。
2020年6月12日播種,10月1日收獲。大豆生育期間(6月12日—9月30日)累計降水量為843.6 mm,完全滿足生長的水分需求,無灌溉。氮肥基施和花期追肥,以尿素施用。氯化鉀150 kg/hm2和過磷酸鈣300 kg/hm2基施。行距0.5 m,每穴播5~6粒,留苗3株。小區面積3 m×4 m。
建模試驗。試驗品種為曲莖,采用裂區試驗,主區為種植密度:15×104株/hm2(穴距0.4 m)、22.5×104株/hm2(穴距0.27 m),30×104株/hm2(穴距0.20 m)和37.5× 104株/hm2(穴距0.16 m)。副區為氮肥用量:75、150、225 kg/hm2(以N計,下同)。基追比為5:5。每個試驗處理設3個重復小區(下同)。
驗證試驗1(氮肥運籌)。試驗品種為曲莖,采用裂區試驗,主區為氮肥用量:75、150、225 kg/hm2。副區為基追比:0:10、5:5和10:0。密度為22.5×104株/hm2(穴距0.27 m)。
驗證試驗2(不同品種)。試驗品種為徐豆18,采用裂區試驗,主區為密度:24×104株/hm2(穴距0.25 m)和36×104株/hm2(穴距0.17 m)。副區為氮肥基追比:0:10、5:5、10:0。
每個小區取1 m2大豆植株用于最終產量測定。
無人機數碼圖像采集于2020年大豆花期(7月29日)、莢期(8月15日)及鼓粒期(9月5日)3 個關鍵生育期09:00左右進行。7月29 日、8月15日和9月5日09:00天氣晴好,氣溫分別為29.2、34.8 和31.5 ℃,風速分別為1.8、2和1.0 m/s。無人機(Hudsan zino,中國)飛行高度設置為 30 m,靜止拍攝,圖像采集鏡頭(Sony,日本)分辨率為3 840×2 160 像素,光圈進光量F=0.8,曝光時間0.05 s,ISO感光度為100,源圖像以*.JPG格式保存。
圖像色階分布的偏度和峰度參數均由高階方程計算得到[16]。在概率論中,矩是用來描述統計樣本的某些特征數值,即求平均值,用E表示。中心矩(Central moment)定義為,對于正整數k,如果E(X)存在,且,則稱為整體樣本統計量X的k階中心距。其計算公式[16]如下:
其3階中心距μ3用來定義X的偏度S(x):
其4階中心距μ4用來定義X的峰度K(x),
式中x為單個樣本值,μ為中心矩,f(x)為概率密度函數。
1.5.1 圖像處理及其RGB模型顏色特征參數提取
采用Photoshop軟件根據試驗區域對樣品原始圖像進行切割,并將切割后的圖像保存為.JPG圖像格式。參照Chen等[15]的方法,采用MATLAB 2016R軟件對葉片圖像色階分布進行偏態分析,共得到葉色偏態參數(20個),即R通道色階的均值(RMean)、中位數(RMedian)、眾數(RMode)、偏度(RSkewness)及峰度(RKurtosis),G通道色階的均值(GMean)、中位數(GMedian)、眾數(GMode)、偏度(GSkewness)及峰度(GKurtosis),B通道色階的均值(BMean)、中位數(BMedian)、眾數(BMode)、偏度(BSkewness)及峰度(BKurtosis),及Y圖像色階的均值(YMean)、中位數(YMedian)、眾數(YMode)、偏度(YSkewness)及峰度(YKurtosis),其中RMean,GMean,BMean,YMean構成葉色正態參數(4個)。
1.5.2 不同通道色階分布的正態檢驗
采用MATLAB運用lillietest及jbtest函數分別對大豆冠層彩色圖像R、G、B三個通道及Y圖像色階分布情況進行Lilliefors和Jarque-Bera 正態性檢驗。
1.5.3 色階累積直方圖制作
采用MATLAB運用imhist函數獲取圖像色階累積直方圖。
1.6.1 方差分析
選取建模試驗的36個小區樣本,以3個發育期(花期、莢期和鼓粒期)為分類因子,采用SPSS軟件對20個葉色偏態參數進行方差分析,采用最小顯著性差異(Least-Significant Difference,LSD)方法及杜肯(Duncan’s)方法[23]進行多重比較(顯著水平α=0.05)),以分析花期、莢期和鼓粒期大豆冠層圖像的葉色偏態特征參數的差異性。
1.6.2 回歸模型構建
選取曲莖36個小區樣本建模,采用SPSS軟件,以大豆產量作為因變量,分別以3個發育期的葉色正態參數(12個)、葉色偏態參數(60個)作為自變量,采用基于最小二乘法的逐步回歸方式[24]建立線性模型F1、F2(表1)。當回歸方程顯著性檢驗P≤0.05時,自變量移入回歸方程;當回歸方程顯著性檢驗P≥0.1時,自變量移出回歸方程。同時,對備選回歸模型進行決定系數優選、回歸模型及回歸系數顯著性檢驗、回歸模型自變量共線性診斷[23],最終確定最佳回歸模型表達式。

表1 大豆產量預測模型結構 Table 1 Structure of prediction model for soybean yield
1.6.3 模型預測準確度比較
為了驗證預測模型的準確度,運用模型對建模試驗組樣本和2個驗證樣本組(氮肥運籌試驗樣本和品種試驗樣本)產量進行預測,并對其預測準確度進行計算,如式(4)[25]所示:
式中PA為模型預測準確度,%;yP為模型計算得到的產量預測值,kg/hm2;y為產量實測值,kg/hm2。
隨機選取一個建模小區分析大豆群體冠層無人機圖像的色階累積分布情況,結果如圖1所示。
圖1 所示,不同生育期大豆群體冠層圖像紅(R)、綠(G)、藍(B)三個通道及灰度圖像色階累積直方圖均呈現偏態分布;參照色階值為100的標志線可看出,不同生育期、不同通道的分布直方圖還表現出不同的偏離程度,花期后隨著生育期的推移,各通道色階分布先向橫坐標軸0端移動后向255端移動。進一步對各通道色階分布數組進行Lilliefors和Jarque-Bera 正態性檢驗,結果表明,兩種檢查的正態假設統計量H值均為1,即否定正態分布假設;而統計量分布概率檢測顯著性P值均為0.001,小于0.05,說明不同生育期大豆群體冠層圖像不同通道的葉色色階分布均不符合正態分布,結合圖1可以看出,葉色分布為偏態分布。
不同生育期大豆群體冠層具有不同的外觀表型,反映到葉色參數上,則呈現出在不同生育期間的差異性,且不同參數的變化特征不同(表2)。從葉色深淺來看,R、G、B三個通道及Y圖像的均值、中位數及眾數在花期-莢期-鼓粒期呈現先降后升的變化特征,其中,三個生育期冠層圖像R、G通道及Y度圖像色階眾數和B通道色階平均值、眾數間具有顯著差異,莢期冠層圖像R、G通道及Y圖像的平均值和中位數顯著低于花期和鼓粒期。

表2 不同生育期大豆冠層圖像的葉色偏態特征參數差異 Table 2 Differences of leaf color skewness characteristic parameters of bean population images at different growth stages
從色階分布偏向性來看(表2),R、G、B三個通道及Y圖像的偏度與均值、中位數、眾數呈現相反的變化特征,二者在花期-莢期-鼓粒期一致呈現先升后降的變化特征,且R、G、B通道和Y圖像色階偏度在三個生育期間均具有顯著差異。
從色階分布集中度來看(表2),與偏度類似,各通道峰度在花期-莢期-鼓粒期也呈現先升后降的變化特征,且莢期各通道色階峰度和其他2個生育期間均具有顯著差異。
由此可以看出,花期、莢期和鼓粒期大豆群體冠層圖像具有不同的顏色特征,基于偏態分析得到的20個偏態參數可全面系統地反映這些差異特征,這為將RGB模型的偏態參數用于預測大豆產量提供了生理解釋及數學基礎。
分別以葉色正態參數和葉色偏態參數為自變量,構建葉色參數與大豆產量的多元回歸模型,并綜合考慮方程的擬合優度及自變量共線性檢測結果,確定最優模型。結果發現,采用花期、莢期和鼓粒期三個時期12個冠層RGB圖像正態參數無法建立大豆產量的預測模型,這可能是由于正態參數反映的大豆冠層葉色信息有限,只反映了顏色的深淺,無法全面地表達大豆冠層葉色信息特征。采用花期、莢期和鼓粒期三個時期共60個冠層圖像偏態參數構建的葉色偏態參數-大豆產量的預測模型F2,如式(5)所示:
式中F2為大豆產量,kg/hm2;PRKurtosis為莢期冠層RGB圖像R通道色階的峰度;PYKurtosis為Y圖像色階的峰度。從模型的擬合效果來看,模型F2的決定系數R2為0.235,P=0.012且P<0.05,通過了回歸模型顯著性檢驗,可用于產量預測。 采用式(5)計算建模組大豆產量預測結果,如表3所示,對建模組36個處理小區的預測準確度普遍超85%,平均為91.30%,其中23個小區的預測準確度超90%,13個小區樣本的預測準確度不小于95%。

表3 建模集基于回歸模型的大豆產量預測準確度 Table 3 Accuracy of regression model for soybean yield prediction based on establishment dataset
應用模型F2分別對2個驗證組(氮肥運籌試驗樣本和不同品種試驗樣本)的產量進行預測,比較預測產量與實測值,結果見表4。

表4 驗證集基于回歸模型的大豆產量預測準確度 Table 4 Accuracy of regression model for soybean yield prediction based on validation dataset
由表4可知,本文模型對氮肥運籌試驗18個處理小區的預測準確度普遍超85%,平均為87.33%,其中8個小區的預測準確度超90%,4個小區樣本的預測準確度超95%;對不同品種試驗18個處理小區的預測準確度平均為78.69%,其中6個小區的預測準確度超90%,3個小區樣本的預測準確度超95%。結合建模組和驗證組總體看來(表3和表4),采用葉片偏態參數的模型對大豆產量的預測準確度平均可達85.50%。
基于RGB模型進行植物生長性狀評估及產量估計已在水稻、小麥、玉米等作物中廣泛應用[14,26]。傳統的圖像色階分析方法是基于正態分布的假設前提下對數據進行分析,它是一種方便的近似取值的方法,所能獲取的顏色信息較少,主要以R、G、B等三個顏色通道的色階均值為主,雖然有不少研究人員提出了這三個基礎參數的多種組合參數,但仍不能全面、真實地反映葉色的分布情況[27],也無法描述葉色變化的生理學意義[13-14],限制RGB模型的更廣泛應用。在本試驗條件下,花期、莢期和鼓粒期等三個生育期只有12個冠層RGB圖像正態參數,無法運用多元逐步回歸法擬合大豆產量的線性變化,這可能是由于正態參數只是反映了冠層顏色的深淺,不能反映其他生長特征。
單張葉片圖像RGB模型的各通道色階遵循偏態分布[13-15]。而本研究應用大豆群體冠層圖片,驗證了大豆在花期、莢期和鼓粒期三個不同生育期的冠層數碼圖像的RGB模型色階同樣遵循偏態分布。本研究中三個生育期各通道色階峰度均小于3(見表2),說明了色階分布曲線較扁平[16],即冠層葉色色階值分布分散,集中度低,反映田間大豆個體植株長勢存在一定不均一性。不同生育時期各通道色階的偏度在-0.5~0.5之間(見表2),說明各通道色階近似正態分布[16],但有一定的偏向性。可見基于偏態分析得到的葉色參數可系統地從葉色深淺程度、分布偏向性和集中度3個方面定量地描述冠層顏色信息。進一步分析不同生育期大豆冠層圖像顏色的偏態參數特征發現,大豆冠層圖像顏色的5類偏態參數在花期、莢期和鼓粒期間普遍具有顯著差異,且反映葉色深淺信息的色階均值、中位數、眾數從花期至鼓粒期的變化趨勢與反映葉色偏向性的偏度和反映葉色集中度的峰度相反。這說明基于數碼圖像RGB模型的色階偏態參數在各生育期具有不同的特征,它們可較精準地反映各生育期大豆冠層顏色特征,為將RGB模型色階的偏態參數用于預估大豆產量提供了生理解釋及數學基礎。
對3個生育時期的60個偏態參數進行逐步回歸分析,可構建基于大豆莢期冠層RGB圖像R通道色階的峰度(PRKurtosis)和Y圖像色階的峰度(PYKurtosis)的多元逐步回歸方程,且方程通過了顯著性水平檢驗。這可能是由于作物群體是由許多個體有機組成的,個體與群體之間、個體與個體之間彼此制約、相互影響[28-29],從而形成有著不同葉色均勻程度的冠層結構,反映到參數值上,表現為不同的峰度。同時,模型在建模組和驗證組均具有較高的預估精度,其中對建模組(曲莖)預測準確度平均達91.30%,各處理小區的預測準確度普遍超85%;對不同栽培措施(氮肥運籌)處理的的預測準確度也普遍超85%,平均為87.33%;對不同品種的預測準確度略低,平均為78.69%。
同時也發現,基于偏態參數構建的大豆產量預測模型雖然通過了顯著性檢驗,但R2較低,這說明模型精度還有更多地提升空間。除了RGB模型參數外,基于數碼圖像可提取的顏色信息還包括 HSV顏色模型參數(色調、飽和度和明度)[30]、Lab顏色模型參數(亮度、a通道值及b通道值)[31];而除了顏色信息外,還可提取葉面紋理參數(如對比度、相關度、熵、同質性和對角二階矩)[32]。這些多維參數能夠更加全面準確地反映大豆冠層圖像信息,可以為產量預測模型的構建提供更多的信息輸入因子,可能進一步提高模型精度,為利用圖像信息進行大豆產量模型構建提供更多的可能。
綜上所述,基于偏態分布模式的RGB模型能提供更詳細的大豆冠層圖像信息,系統地從深淺程度和分布偏向性、集中度3個方面定量地描述冠層顏色信息,從而建立具有較高準確性的產量預測模型,可廣泛用于不同生產條件的大豆產量預測。同時無人機[33]和數碼相機的使用提高了圖像獲取的效率并降低了圖像獲取的成本,更有利于本方法的推廣應用。
本文探索了偏態分布模式加色混色(Red-Green-Bule,RGB)模型在大豆產量預測上的應用。結果如下:
1)大豆冠層數碼圖像的光學三原色RGB模型色階遵循偏態分布。通過偏態分析得到的偏態參數可很好地表征不同生育期冠層顏色信息特征,且不同類型葉色信息參數隨著生育期推移呈現不同的變化規律。
2)基于RGB模型偏態參數可構建大豆產量預測模型,模型通過了顯著性檢驗。且模型對不同品種和不同栽培措施下大豆產量預測效果均較好,預測準確度平均達85.50%。基于大豆冠層圖像信息進行實時、快速和無損地預測大豆產量,可彌補傳統實地取樣測產耗時耗力、破壞性和主觀誤差大等不足。
模型精度還有更多的提升空間。未來將繼續探索可描述冠層信息的其他顏色參數和紋理參數,為產量預測模型的構建提供更多更全面的冠層信息,最終為無損快速的智能化的大豆產量預測提供更多的思路與方法。
致謝:感謝加拿大卡爾頓大學的安子越使用MATLAB軟件對數據作處理。