穆炳宇, 薛建新,張淑娟,任 銳,廉孟茹,池江濤
(山西農(nóng)業(yè)大學工學院,山西晉中 030801)
花椰菜(Brassica oleracea L. var. botrytis L.),俗稱花菜、菜花或椰菜花,屬十字花科一年生植物。花椰菜營養(yǎng)價值高,其中以維C 的含量最為豐富;還含有異硫氰酸鹽化合物,可有效抗癌防癌[1]。但是,花椰菜在受到暴曬、凍害或者水分流失后會出現(xiàn)褐變、腐爛,從而失去食用價值[2]。花椰菜容易受到蟲害的影響,導(dǎo)致黑腐病發(fā)生,使得花球、根莖處呈現(xiàn)黑色霉層,形成爛菜花,造成減產(chǎn)甚至絕收。目前,花椰菜的品質(zhì)檢測主要靠人工來完成,尚未有針對花椰菜新鮮和腐爛的判別研究。
近年來,近紅外光譜技術(shù)已經(jīng)廣泛應(yīng)用于農(nóng)產(chǎn)品品質(zhì)的無損檢測中。何寬等人[3]利用光譜成像技術(shù),結(jié)合光譜信息分割法實現(xiàn)了對采后藍莓腐爛病的無損檢測,準確率達97.5%以上。孫海霞等人[4]使用光譜技術(shù)對黑斑鮮棗進行了識別,通過SPA 提取的特征波長獲得主成分圖像,采用BP-NN 和CNN建立識別模型,判別準確率分別為78.3%和90.0%。Shijie Tian 等人[5]使用透射可見/ 近紅外技術(shù)實現(xiàn)了對發(fā)霉蘋果核的檢測,對以往直徑較大的健康蘋果被誤認為患病,核心發(fā)霉且直徑較小的蘋果被誤認為健康的現(xiàn)狀作出了改進。Roberto Ciccoritti 等人[6]將近紅外和化學計量學方法結(jié)合,成功地用于改善獼猴桃在收獲和儲存期間的質(zhì)量控制,減少了水果損失。劉燕德等人[7]應(yīng)用近紅外光譜技術(shù),采集黃龍病、缺損和健康3 類葉片樣本的光譜信息并進行建模分析,結(jié)果表明,近紅外光譜技術(shù)可以對柑橘黃龍病進行檢測。
采用可見/ 近紅外光譜技術(shù)對花椰菜的腐爛進行PLS 建模分析,首先對不同的預(yù)處理方法進行對比,并進行特征波長提取方式的模型比較,在此基礎(chǔ)上,選出最優(yōu)的花椰菜判別模型,以期為在線無損檢測花椰菜品質(zhì)的設(shè)備研究提供理論依據(jù)。
花椰菜樣品于2019 年9 月采摘自山西省太谷區(qū),當日運至試驗室。選擇新鮮和表面有黑斑的腐爛花椰菜各170 朵,進行光譜數(shù)據(jù)的采集。將采集到的光譜數(shù)據(jù)使用Kennard-Stone 算法按3∶1 的比例劃分為校正集254 朵(新鮮127 朵,腐爛127 朵)和預(yù)測集86 朵(新鮮43 朵,腐爛43 朵)。
Field Spec 3 型光譜儀, 美國ASD (Analytical Spectral Device) 公司產(chǎn)品,光譜范圍為350~2 500 nm。使用ASD View Spec Pro V5.0 軟件采集花椰菜同一位置的信息3 次,取平均光譜值;去除兩端光譜噪聲后,選擇500~2 200 nm 的光譜數(shù)據(jù)進行后續(xù)判別分析。
1.3.1 原始光譜預(yù)處理
為提高數(shù)據(jù)的使用質(zhì)量、減少不必要的環(huán)境干擾,對光譜數(shù)據(jù)進行預(yù)處理是十分必要的。試驗采用如下方法對光譜進行預(yù)處理:
標準正態(tài)變量變換(Standard normal variate transformation,SNV)[8]可使得光譜受到樣本表面顆粒和曲面的光程變化的影響最小[9]。S-G 平滑算法(Savitzky-Golay Smoothing)[10]可對數(shù)據(jù)進行多項式最小二乘擬合并且加權(quán)平均,以消除噪聲、減少隨機誤差對試驗造成的影響。基線校正(Baseline)[11]可用來修正光譜采集中,因樣本差異和環(huán)境所導(dǎo)致的吸收峰偏移。
1.3.2 光譜特征波長的提取
若使用全波段建模,不僅耗時,而且預(yù)測模型包含大量無用信息。因此,建模之前的特征波長提取極為關(guān)鍵。試驗采用回歸系數(shù)法(Regression coefficient,RC)、連續(xù)投影算法(Successive projections algorithm,SPA)[12]、隨機蛙跳(Random frog,RF)算法來對波長進行優(yōu)選。基于偏最小二乘法(Partial least squares,PLS) 原理,RC 法通過局部極值的選擇而確定最佳波段[13]。SPA 法可消除特征波長間的共線性問題。RF 法可使用較少的變量迭代建模[14]。
1.3.3 建模分析
PLS 是由H.Wold 在1966 年最先提出的[15-16],其可以應(yīng)用于大小樣本的研究,提取出的數(shù)據(jù)信息與待測指標之間相關(guān)性好。
光譜數(shù)據(jù)的預(yù)處理、PLS 建模等在The Unscrambler X 10.1 中進行。SPA,RF 在Matlab R2014b軟件中實現(xiàn)。通過校正集均方根誤差(RMSEC) 與決定系數(shù)(R2c) 來評價所建模型的準確度,當決定系數(shù)越接近1,均方根誤差越接近于0 時,所建模型效果最佳[17]。
新鮮和腐爛花椰菜的平均光譜曲線見圖1。
由圖1 可知,500~2 200 nm 波段范圍內(nèi),完好與腐爛花椰菜樣本曲線的整體趨勢一致,但是腐爛樣本的光譜反射率顯著高于完好樣本的光譜反射率,這可能是由于腐爛花椰菜樣本表面有黑斑,導(dǎo)致反射率升高。
為降低噪聲和環(huán)境因素對光譜采樣的影響,試驗對原始樣本的數(shù)據(jù)進行預(yù)處理分析。
不同預(yù)處理方法的PLS 模型校正效果見表1。

表1 不同預(yù)處理方法的PLS 模型校正效果
通過觀察表1 可知,經(jīng)過不同預(yù)處理的建模精度普遍高于原始光譜建模精度。由此可知,3 種不同預(yù)處理方式均可達到降噪的效果,其中Baseline 后的校正集建模精度最高,其RMSEC 達0.095 3,R2c 達0.963 7。
2.3.1 SPA 法特征波長的提取
SPA 法可提高建模的速度和效率。
基于SPA 算法的最佳變量選擇見圖2。
如圖2 所示,特征波長數(shù)為10 時,RMSE 為最小,值為0.148 64,所提取的10 個波長數(shù)換算為波長即為752,1 083,2 189,1 494,530,523,519,703,568,513 nm,重要程度依次遞減。
2.3.2 RC 法特征波長的提取
RC 法是通過對經(jīng)基線校正預(yù)處理數(shù)據(jù)所建立的PLS 模型提取回歸系數(shù),選取RC 曲線中的局部極值作為特征波長值,所提取的19 個特征波長如圖3 所示。
基于RC 法特征波長的提取見圖3。
2.3.3 RF 法特征波長提取
經(jīng)Baseline 法預(yù)處理后的數(shù)據(jù),采用RF 算法來提取特征波長。RF 原理是基于蒙特卡洛算法采樣,隨機性大,因此需要多次運行提高準確率,結(jié)果如下:
基于RF 法特征波長的提取見圖4,3 種方法提取的特征波長見表2。

表2 3 種方法提取的特征波長
由表2 可知,3 種特征波長提取方法所提取的特征波長個數(shù)依次為SPA (10 個)、RC (16 個)、RF(10 個),其中1 083 nm 波長在3 種方法中均被提取;567,703 nm 波長被SPA 與RC 提取;790,1 083,2 115 nm 波長被RC 與RF 提取。
使用The Unscrambler X 10.1 中的PLS 進行建模分析,所建3 種PLS 模型(SPA,RC 和RF) 的系數(shù)和判別結(jié)果如下所示。
不同特征波長提取的PLS 建模預(yù)測結(jié)果見表3。

表3 不同特征波長提取的PLS 建模預(yù)測結(jié)果
由表3 可知,經(jīng)RC 提取的特征波長建模效果最優(yōu),對新鮮和腐爛花椰菜的判別準確率均為100%。
利用可見/ 近紅外技術(shù)對新鮮和腐爛花椰菜進行檢測研究,通過PLS 對不同的預(yù)處理方法進行了數(shù)學模型分析。結(jié)果表明,Baseline 預(yù)處理效果最好,RMSEC 為0.095 3,R2c 為0.963 7;利用SPA,RC,RF 3 種方法進行特征波長提取,分別建立PLS 模型進行判別,結(jié)果表明經(jīng)RC 提取特征波長建模的效果最好,對于新鮮和腐爛花椰菜的判別準確率均為100%,試驗可為相關(guān)在線無損檢測設(shè)備的研究提供理論基礎(chǔ)。