楊紅云,周 瓊,楊 珺,孫玉婷,路 艷,殷 華
(1.江西農業(yè)大學 軟件學院,江西 南昌 330045; 2.江西省高等學校農業(yè)信息技術重點實驗室,江西 南昌 330045; 3.江西農業(yè)大學 計算機與信息工程學院,江西 南昌 330045)
在水稻栽培管理中,氮肥對糧食作物產量的貢獻率約占50%[1]。精準施氮可以減少水稻生長過程中的無效分蘗,提高有效成穗率,優(yōu)化群體結構,改善田間植株生長狀況,減輕病蟲害的發(fā)生,進而促進水稻終產量的形成[2]。近年來,許多學者圍繞水稻氮素營養(yǎng)狀況診斷進行了大量研究。李金文[3]應用葉綠素計獲取水稻葉片生理生態(tài)學特征用于氮素診斷;孫棋[4]發(fā)現(xiàn),水稻拔節(jié)期冠層圖像的顏色特征參量可反映水稻拔節(jié)期氮素營養(yǎng)狀況;李嵐?jié)萚5]發(fā)現(xiàn),水稻冠層色彩參數(shù)與水稻氮素營養(yǎng)指標具有較好的相關性;王遠等[6]分割水稻冠層圖像提取的特征參數(shù)——紅光標準化值(NRI)與SPAD值、葉片含氮量具有良好的相關關系;劉江桓[7]應用水稻葉片顏色特征參數(shù)進行擬合分析發(fā)現(xiàn),不同生育期水稻頂三葉的顏色特征參數(shù)可反映水稻氮素營養(yǎng)狀態(tài);邵華等[8]發(fā)現(xiàn),738 nm處的水稻冠層一階微分光譜反射率與冠層葉片氮素含量相關性較高;祝錦霞等[9-10]基于水稻拔節(jié)期頂三葉的顏色特征數(shù)據(jù)與水稻冠層數(shù)據(jù)建立水稻氮素水平識別回歸模型;陳利蘇[11]應用圖像處理和支持向量機(SVM)進行溫室水培水稻氮素營養(yǎng)診斷,取得了較好的結果,但在其他試驗場景下的應用較受限;王樹文等[12]發(fā)現(xiàn),水稻冠層高光譜反射率與氮含量具有顯著相關性;Yuan等[13]借助數(shù)碼相機研究了水稻氮素狀況與葉片綠度的關系,發(fā)現(xiàn)葉片中部比葉尖和葉片基部更適于開展水稻氮素診斷,分蘗期和孕穗期是評估水稻氮素狀況的關鍵診斷階段。近年來,應用高光譜進行農作物氮素診斷的研究也相繼被報道。孫小香等[14]獲取晚稻4個生育期冠層的高光譜數(shù)據(jù),發(fā)現(xiàn)基于冠層光譜指標和BP神經網絡進行水稻葉片氮素含量估算的效果較好;張晶等[15]應用SPA-RDI-SVM模型進行甜菜葉片含氮量預測;白麗敏等[16]應用SPA-PLS模型進行冬小麥冠層全氮含量預測;單貴蓮等[17]應用多花黑麥草敏感波段光譜反射率R760與植株含氮量建立線性回歸模型,效果較好;張國圣等[18]應用沈稻47分蘗期葉片高光譜的歸一化差值植被指數(shù)(NDVI)與同期氮素含量建立線性回歸模型,效果較好;李穎等[19]應用概率神經網絡基于室內盆栽水稻的冠層光譜進行氮素營養(yǎng)診斷識別分類,分蘗期、拔節(jié)期和抽穗期的總體識別準確率分別為74%、75%和71%。本研究擬通過高光譜技術獲取分蘗期水稻的頂三葉光譜數(shù)據(jù),應用機器學習方法建立大田水稻氮素營養(yǎng)診斷模型并開展分類識別,旨在摸索一種可準確判別大田環(huán)境下水稻氮素營養(yǎng)狀況的普適性高、易于推廣的方法。
試驗于2018年在江西省南昌市江西農業(yè)大學試驗田進行。土壤基本理化性狀如下:pH值5.3,全氮1.02 g·kg-1,全磷0.48 g·kg-1,全鉀14.22 g·kg-1,有機質19.46 g·kg-1,堿解氮112.31 mg·kg-1,速效磷11.65 mg·kg-1,速效鉀123.84 mg·kg-1。
以中嘉早17水稻品種為試驗材料。依施氮水平差異設4個處理:N0,不施N;N1,基肥、分蘗肥、穗肥分別施N 114.0、45.6、68.4 kg·hm-2;N2,基肥、分蘗肥、穗肥分別施N 163.0、65.2、97.8 kg·hm-2;N3,基肥、分蘗肥、穗肥分別施N 212.0、84.8、127.2 kg·hm-2。各處理統(tǒng)一基施P 750 kg·hm-2。所有處理均于4月9日播種,4月28日移栽,栽插密度為13.3 cm×26.6 cm,人工移栽,其他田間管理按常規(guī)栽培要求進行。
試驗使用ASD野外光譜分析儀采集光譜數(shù)據(jù),其波長范圍為350~2 500 nm。采樣時正值水稻分蘗期(5月17日),每個處理取60片水稻頂三葉葉片,共計240片。以每片葉片為一個樣本。每個樣本分別采集葉尖、葉中、葉枕3條光譜,以其平均值作為該樣本的光譜反射率值,數(shù)值處理在Viewspec Program軟件中進行。光譜測量時,每間隔15 min進行一次標準白板校正。
由于光譜數(shù)據(jù)會受到譜線平移、高頻隨機噪聲和光散射等因素的干擾,為保證所建模型的精度和穩(wěn)定性,需對光譜進行預處理,以最大限度地挖掘光譜數(shù)據(jù)中的有效信息,提升其信噪比。常見的光譜預處理方法包括多元散射校正(MSC)、變量標準化校正(SNV)、平滑算法(SG)、歸一化、基線校正等[20]。本研究分別采用MSC、SNV、SG方法進行對比試驗。
主成分分析(PCA)是將篩選出的能夠反映水稻施氮水平類別的幾個特征指標重新組合,形成一組無關聯(lián)、信息不重疊的幾個綜合指標替代原有的影響指標,視實際需求從中提取若干能夠反映原有指標信息的綜合指標,以有效地對水稻施氮水平進行預測分類[21]。
連續(xù)投影算法(SPA)是一種前向變量選擇方法,能有效尋找含有最低限度冗余信息的變量組,使變量之間的共線性達到最小。SPA算法能夠從大量的光譜變量中提取少數(shù)幾個共線性小的光譜特征波長代表原始的光譜數(shù)據(jù),從而將數(shù)據(jù)降維,減少模型的輸入變量,提高模型計算速度。以均方根誤差(RMSE)為評價指標,以RMSE最小值下的波長個數(shù)確定特征波長個數(shù)[22]。
SVM在解決非線性、小樣本數(shù)據(jù)集、高維空間模式識別等問題上獨具優(yōu)勢。核函數(shù)是SVM的理論基礎。常用的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)、sigmoid核函數(shù)[23]。本研究選用徑向基核函數(shù)作為SVM模型的核函數(shù)。
水稻葉片原始反射光譜及經不同方法預處理后的光譜曲線如圖1所示。從圖1-A的原始光譜可以看出,不同施氮水平下,水稻葉片光譜反射率曲線表現(xiàn)出相同的走向趨勢。在綠波段(約560 nm)處可見明顯的反射峰,即“綠峰”;在紅波段(約685 nm)處可見明顯的吸收谷,即“紅谷”;在近紅外波段(>760 nm)處出現(xiàn)一個較高的反射平臺。圖1-B~D分別是經過MSC、SNV、SG預處理后的光譜曲線圖,可以看出:MSC處理后的光譜反射率值區(qū)間與原始光譜相近,與SNV處理后的光譜走勢相近;SNV處理后的光譜反射率值區(qū)間與原始光譜差異較大;SG處理后的光譜反射率曲線中各樣本分布緊密。

a,原始光譜;b,MSC處理后的光譜;c,SNV處理后的光譜;d,SG處理后的光譜。a, Original spectrum; b, Spectrum after MSC; c, Spectrum after SNV; d, Spectrum after SG.
對經過不同方法預處理后各處理的樣本分別進行主成分分析。如圖2所示:MSC處理后主分成1(PC1)的貢獻率為82.11%,主成分2(PC2)的貢獻率為7.31%;SNV處理后PC1的貢獻率為81.60%,PC2的貢獻率為7.73%;SG處理后PC1的貢獻率為56.59%,PC2的貢獻率為26.30%。經過3種方法的預處理后,PC1與PC2的累積貢獻率均超過80%且低于90%,各處理的樣本點重疊嚴重,難以對不同處理的樣本進行區(qū)分;因此,考慮采用基本能夠反映原樣本信息的累積貢獻率超過99.98%的前24個主成分作為SVM的輸入變量,3種預處理方法的前24個主成分的累積貢獻率如表1所示。
若采用全波段進行建模,時間較長,且包含過多冗余信息;因此,采用SPA對經不同方法預處理后的光譜數(shù)據(jù)提取特征波長(圖3),以最小RMSE值下的波長個數(shù)作為特征波長數(shù)量。對于經過MSC處理后的光譜數(shù)據(jù),最小RMSE值為0.431 13,對應的最佳波長個數(shù)為12,篩選的特征波長分別是350、374、728、750、1 004、1 187、1 801、1 937、2 465、2 475、2 495、2 500 nm;對于經過SNV處理后的光譜數(shù)據(jù),最小RMSE值為0.480 39,對應的最佳波長個數(shù)為15,篩選的特征波長分別是350、396、504、700、715、746、1 326、1 438、1 674、1 929、1 981、2 170、2 461、2 495、2 500 nm;對于經過SG處理后的光譜數(shù)據(jù),最小RMSE值為0.371 95,對應的最佳波長個數(shù)為19,篩選的特征波長分別是350、352、396、419、425、475、646、685、695、708、739、854、1 000、1 001、1 365、1 803、2 013、2 179、2 490 nm。
將所有供試樣本按照2∶1的比例隨機分成建模集和預測集2個集合,其中建模集有160個樣本(每個處理各40個),預測集有80個樣本(每個處理各20個)。以PCA獲取的前24個主成分,和SPA算法獲取的特征波長作為模型輸入?yún)?shù),將4個處理的氮素水平分別標記為1、2、3、4,作為模型的輸出參數(shù),采用SVM建立水稻氮素營養(yǎng)診斷模型,并開展水稻氮素營養(yǎng)診斷識別,分類結果如表2所示。對于3種光譜預處理方法而言,PCA-SVM模型在預測集上的準確率均高于SPA-SVM模型。其中,對于MSC預處理方法,PCA-SVM模型在預測集上的準確率比SPA-SVM模型高出25.00個百分點;對于SNV預處理方法,法,PCA-SVM模型在預測集上的準確率比SPA-SVM模型高出21.25個百分點;對于SG預處理方法,PCA-SVM模型在預測集上的準確率比SPA-SVM模型高出10.00個百分點。對于PCA-SVM模型,經過MSC預處理的模型在預測集上的準確率最高,經過SNV預處理的模型次之,經過SG預處理的模型最低;對于SPA-SVM模型,經過SNV預處理的模型在預測集上的準確率最高。綜合各模型在建模集和預測集上的準確率,MSC-PCA-SVM模型的效果最佳,在建模集和預測集上的準確率分別達99.38%和97.50%,其在預測集上的實際分類與預測分類結果如圖4所示,圖中縱坐標為氮素水平(類別標簽),橫坐標為測試樣本編號,對于N0、N1、N3處理的樣本(對應縱坐標為1、2、4)全部識別正確,對于N2處理的樣本(對應縱坐標為3),有2個被誤判為N1處理(對應縱坐標為2)。

a,經MSC預處理;b,經SNV預處理;c,經SG預處理。a, After MSC; b, After SNV; c, After SG.
表1 不同預處理方法前24個主成分的累積貢獻率
Table1Cumulative contribution rate of the first 24 principal components after different pretreatments

預處理方法Pretreatment累計貢獻率Cumulativecontributionrate/%MSC99.9867SNV99.9859SG99.9949

a,b,MSC+SPA;c,d,SNV+SPA;e,f,SG+SPA。
本研究采用不同光譜預處理方法對分蘗期水稻的葉片高光譜數(shù)據(jù)進行預處理,分別采用PCA和SPA算法進行參數(shù)選取,基于SVM建立水稻氮素營養(yǎng)診斷分類模型。結果顯示,用MSC-PCA-SVM模型開展水稻葉片氮素營養(yǎng)診斷分類,其在預測集上的識別準確率高達97.50%,僅有少數(shù)樣本被誤判,可有效識別處于缺氮和氮過量水平的水稻葉片,從而對水稻氮素營養(yǎng)狀況做出初步判斷。
表2 各模型的分類預測結果
Table2Classification prediction results of different models

建模方法Model輸入?yún)?shù)數(shù)量No.ofinputvariables準確率Accuracy/%建模集Trainingset預測集PredictionsetMSC-PCA-SVM2499.3897.50MSC-SPA-SVM1284.3872.50SNV-PCA-SVM2498.7596.25SNV-SPA-SVM1586.8875.00SG-PCA-SVM2410082.50SG-SPA-SVM1992.5072.50

圖4 MSC-PCA-SVM模型在預測集上的識別分類結果
本研究采用高光譜技術獲取水稻氮素營養(yǎng)診斷分類模型的輸入特征數(shù)據(jù),并采用機器學習方法建立水稻氮素營養(yǎng)診斷分類模型,研究結果可為作物生長過程反演虛擬研究提供支持,同時為作物氮素營養(yǎng)診斷識別分類提供了一種有效可行的方法,對于科學指導作物施肥也具有參考意義。
顧清等[24]應用圖像處理技術和SVM獲取葉片黃化比例、葉尖G值、葉片面積3個特征值進行氮素營養(yǎng)診斷,但難以識別氮過量樣品。本研究中建立的水稻氮素營養(yǎng)診斷分類模型,能夠很好地識別出缺氮(N0處理)和高氮(N3處理)樣品,但對于N2處理的樣品,有2個被誤判為N1處理,這可能是因為這2個處理的樣本間相似程度較大,不易于區(qū)分。今后應加強對類似樣品的識別研究。
本研究僅對2018年在中嘉早17品種水稻上獲取的破壞性高光譜數(shù)據(jù)進行了分析,屬于水稻氮素營養(yǎng)診斷的初步研究,尚存在許多值得改進之處。在今后的研究中,擬增加供試水稻品種,豐富不同年限不同時期不同葉位的水稻植株特征數(shù)據(jù)庫,對模型輸入?yún)?shù)的選取做進一步研究,同時對非破壞性水稻參數(shù)的測量獲取開展研究,以便建立更具通用性和實用性的水稻氮素營養(yǎng)診斷識別模型。此外,還擬聯(lián)合水稻植株的其他參數(shù),開展更為細致的等級分類,或通過獲取水稻冠層圖像、光譜數(shù)據(jù)進行氮素反演,建立優(yōu)化的識別模型,為水稻精準施肥提供理論依據(jù)。