王曉珂, 趙春江, 董大明
(1.首都師范大學(xué),北京 100097; 2.北京市農(nóng)林科學(xué)院北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097)
肥料是農(nóng)業(yè)生產(chǎn)的基礎(chǔ)物質(zhì)之一,它可以為植物提供必需的營(yíng)養(yǎng)元素,并且能夠改善土壤的性質(zhì)、提高土壤的肥力水平[1]。在肥料生產(chǎn)時(shí),通過(guò)檢測(cè)氮、磷、鉀等微量元素的含量可以較好地控制肥料質(zhì)量[2],從而確保農(nóng)作物的產(chǎn)量并避免環(huán)境污染[3]。目前國(guó)內(nèi)公認(rèn)的肥料檢測(cè)方法大都是先采樣后分析,通過(guò)化學(xué)檢測(cè)的方式測(cè)量肥料中各種元素的含量[4]。這樣做不僅費(fèi)時(shí)費(fèi)力,不能對(duì)肥料成分進(jìn)行實(shí)時(shí)評(píng)價(jià),并且檢測(cè)用的試劑可能會(huì)對(duì)環(huán)境造成二次污染[5]。近年來(lái),一些學(xué)者嘗試應(yīng)用光學(xué)方法對(duì)肥料進(jìn)行檢測(cè),這些方法有望實(shí)現(xiàn)快速測(cè)量[6]。但在肥料生產(chǎn)中,肥料處于高速移動(dòng)狀態(tài),生產(chǎn)線移動(dòng)過(guò)程帶來(lái)測(cè)量的很多難題,目前的研究成果尚不能支持這種高通量檢測(cè)。
近紅外光譜是一種快速且無(wú)損的光譜學(xué)方法,被廣泛應(yīng)用于多種農(nóng)產(chǎn)品和食品測(cè)量[7-9],如Wang等應(yīng)用近紅外光譜測(cè)量水果中各種營(yíng)養(yǎng)元素的含量[10-11]。也有一些學(xué)者利用近紅外光譜測(cè)量土壤養(yǎng)分,如Knadel等應(yīng)用近紅外光譜測(cè)量土壤中有機(jī)碳、有機(jī)氮、全碳、全氮等的含量[8,12-13];Li等應(yīng)用近紅外光譜對(duì)土壤進(jìn)行分類(lèi)[14-15]。因此,利用近紅外光譜對(duì)未出廠的肥料進(jìn)行快速無(wú)損的檢測(cè)有著一定的可行性。
利用近紅外光譜對(duì)生產(chǎn)線上的肥料養(yǎng)分進(jìn)行測(cè)量是一個(gè)新挑戰(zhàn),由于移動(dòng)中的光譜獲取受到多種因素影響,不同種類(lèi)肥料的模型傳遞性較差,更為重要的是,全波段光譜的運(yùn)算量過(guò)大,難以實(shí)現(xiàn)實(shí)時(shí)性。因此本研究的主要目標(biāo)為:(1)研究針對(duì)移動(dòng)中肥料近紅外光譜的預(yù)處理方法,從而能夠最大限度地降低由于樣本移動(dòng)而產(chǎn)生的噪聲;(2)建立先分類(lèi)、再定量的算法模型,從而能夠應(yīng)用于不同種類(lèi)和不同廠家的肥料。
試驗(yàn)中使用的肥料樣品均來(lái)自中國(guó)常用的肥料廠商,分別為芭田、新洋豐、嘉施利、史丹利(表1)。所有肥料樣本均取自生產(chǎn)線,并由北京市土肥站根據(jù)國(guó)標(biāo)方法進(jìn)行氮、磷、鉀的測(cè)試分析,給出實(shí)測(cè)值。在研究中,樣本隨機(jī)分為校正集和預(yù)測(cè)集。

表1 不同廠家肥料樣本養(yǎng)分含量分布
本試驗(yàn)利用美國(guó)Thermo Antaris傅立葉變換近紅外光譜儀(4 000~10 000 cm)采集肥料樣品的近紅外光譜,儀器的最高分辨率為8 cm。光譜儀內(nèi)置了積分球。此外,光譜儀的出光口經(jīng)光纖擴(kuò)充改造,可以在積分球和對(duì)外光路之間自動(dòng)切換。為了模擬生產(chǎn)線上肥料的快速移動(dòng)狀態(tài),筆者設(shè)計(jì)了1個(gè)自動(dòng)勻速旋轉(zhuǎn)的樣本臺(tái),角速度為12°/s。在光譜儀的入光口附近增加了1個(gè)鹵素?zé)簦跇悠饭庾V采集時(shí),控制鹵素?zé)糨椪諛悠罚瑢?shí)現(xiàn)漫反射測(cè)量。在樣本臺(tái)上方設(shè)置2個(gè)反射鏡,分別反射光源和樣本的光線。
樣本光譜測(cè)量前首先關(guān)閉近紅外光源,直接測(cè)量光譜并作為參黑光譜。再控制光路切換到積分球,測(cè)量獲得參白光譜。測(cè)量過(guò)程中,旋轉(zhuǎn)臺(tái)的轉(zhuǎn)速為12°/s,每個(gè)樣本測(cè)量時(shí)間為30 s。為了快速完成測(cè)量,儀器的分辨率設(shè)置為8 cm。1 h更換1次存黑存白的背景光譜。研究中所采用的光譜預(yù)處理算法和建模算法在Unscrambler 9.7平臺(tái)下完成。
本次試驗(yàn)于2016年9—10月在北京市農(nóng)林科學(xué)院展開(kāi),共采集了412組近紅外光譜,肥料的近紅外吸收特征光譜分布在4 000~10 000 cm-1(1 000~2 500 nm)(圖1)。

從圖1可以看出,由于不同廠家的肥料樣品中所含的化學(xué)成分可能不同,導(dǎo)致不同廠家肥料的光譜特征有著較為明顯的差異。同時(shí)也可看出,同一廠家肥料的光譜特性較為集中,很難通過(guò)肉眼觀察到光譜特征隨成分的變化規(guī)律。由于近紅外光譜特征復(fù)雜,沒(méi)有明顯的吸收峰,很難用單一或少數(shù)變量實(shí)現(xiàn)氮、磷、鉀元素含量的回歸分析。所以,采用PLS方法對(duì)數(shù)據(jù)降維回歸[16],將所有光譜數(shù)據(jù)基于全波段直接進(jìn)行PLS建模的結(jié)果如表2所示。

表2 基于所有廠家的全波段光譜數(shù)據(jù)直接建模的校正集相關(guān)參數(shù)值
注:r2表示確定系數(shù);RMSE表示均方根預(yù)測(cè)誤差。
由表2可知,所有光譜數(shù)據(jù)直接建模的模型中r2較低,且RMSE較高,這說(shuō)明了不同廠家光譜差異較明顯,模型不具有通用特性。因此,基于全波段建模時(shí)采用1個(gè)PLS模型針對(duì)1個(gè)特定廠家的方式,表3為不同廠家直接建立PLS模型的參數(shù)值。

表3 不同廠家基于全波段分別建模的校正集相關(guān)參數(shù)值
從表3可以看出,針對(duì)不同廠家單獨(dú)建模的方式對(duì)于模型的性能有一定提高,但部分廠家和部分元素仍然不能滿足定量化分析的要求,比如芭田肥料鉀元素的校正集確定系數(shù)僅有0.65。通過(guò)比較分析固定狀態(tài)和移動(dòng)狀態(tài)下的模型預(yù)測(cè)能力發(fā)現(xiàn),這可能是由于移動(dòng)過(guò)程中帶來(lái)的噪聲的影響。由于移動(dòng)過(guò)程中會(huì)產(chǎn)生光的散射等干擾問(wèn)題,這會(huì)在很大程度上影響光譜質(zhì)量。
為了達(dá)到更好的模型性能指標(biāo),采用Norris求導(dǎo)作為預(yù)處理方法來(lái)對(duì)原始光譜進(jìn)行去噪處理,從而試圖降低移動(dòng)中的影響[16-18]。圖2為芭田肥料的原始光譜及其經(jīng)過(guò)預(yù)處理方法后的光譜特征,從圖2中可以清楚地看到,經(jīng)過(guò)Norris求導(dǎo)預(yù)處理后的光譜數(shù)據(jù)較好地去除了各類(lèi)噪聲的影響。

表4中的數(shù)據(jù)顯示,Norris求導(dǎo)預(yù)處理方法可提高P和K的預(yù)測(cè)能力,較好地消除了移動(dòng)等噪聲的影響。

表4 芭田肥料樣品原始光譜與Norris求導(dǎo)光譜分別PLS建模的性能指標(biāo)
合適的預(yù)處理方法提高了光譜質(zhì)量,從而降低了移動(dòng)過(guò)程對(duì)定量化分析的影響。但如表2所示,不同廠家的肥料由于成分差異較大,很難用統(tǒng)一的模型實(shí)現(xiàn)定量。因此,通過(guò)先定性分類(lèi)-再定量計(jì)量的模式實(shí)現(xiàn)模型的高效傳遞。
從圖3可以看出,通過(guò)對(duì)全部廠家的肥料原始光譜數(shù)據(jù)進(jìn)行主成分分析(PCA),可以很好地將數(shù)據(jù)進(jìn)行分類(lèi)[16,19],圖的分類(lèi)結(jié)果證明先分類(lèi)、再采用不同的模型計(jì)算肥料成分的想法是可行的。整體算法的設(shè)計(jì)思路如圖4所示,即先用PCA分類(lèi)器對(duì)不同廠家肥料進(jìn)行分類(lèi),再針對(duì)不同廠家,采用預(yù)先建立的對(duì)應(yīng)的PLS模型進(jìn)行定量化計(jì)算。研究結(jié)果表明,這一算法適用于研究中采用的全部4種肥料,對(duì)肥料中微量元素的預(yù)測(cè)能力如表5所示。
本研究通過(guò)一系列試驗(yàn),證明了對(duì)移動(dòng)中的肥料近紅外光譜數(shù)據(jù)進(jìn)行PLS建模并實(shí)時(shí)預(yù)測(cè)氮、磷、鉀元素的含量是可行的。適當(dāng)?shù)念A(yù)處理方式能夠降低由于樣本移動(dòng)而產(chǎn)生的噪聲,進(jìn)而提高系統(tǒng)的確定系數(shù)的同時(shí)降低系統(tǒng)的均方根誤差,本系統(tǒng)預(yù)測(cè)的準(zhǔn)確率在88%以上;通過(guò)實(shí)現(xiàn)先PCA分類(lèi),再進(jìn)行定量的算法模型,為開(kāi)發(fā)能夠應(yīng)用于不同肥料廠家的設(shè)備提供了理論支撐。



表5 PCA分類(lèi)器分類(lèi)后建模的結(jié)果