馬帥帥 于慧春 殷 勇 袁云霞 李 欣 薛書凝
(河南科技大學(xué)食品與生物工程學(xué)院,河南 洛陽 471023)
黃瓜本身營養(yǎng)豐富,風(fēng)味獨特,深受人們喜愛,是世界范圍內(nèi)普遍栽培的重要蔬菜作物。但黃瓜采摘后容易失水萎蔫、衰老,新鮮度降低,口感變差,食用價值降低,影響其市場銷量。而傳統(tǒng)果蔬的品質(zhì)檢測方法主要有感官評定、化學(xué)檢測法等[1],感官評定主觀性強,且無法對其內(nèi)部進行準確評定。化學(xué)檢測法精度高,但耗時、費力、工藝復(fù)雜,測定結(jié)果受前處理影響較大,無法實現(xiàn)其快速檢測。
近年來,高光譜成像技術(shù)因其“圖譜合一”、速度快、樣品無需預(yù)處理等優(yōu)點,在果蔬的品質(zhì)檢測領(lǐng)域中獲得較多的應(yīng)用研究[2]。利用高光譜圖像中的光譜信息,結(jié)合化學(xué)計量學(xué)方法,可以實現(xiàn)對被檢測樣品每一點口感風(fēng)味等食用品質(zhì)指標(如可溶性固形物、水分、酸度及硬度等)以及營養(yǎng)品質(zhì)指標(如淀粉、色素等)的預(yù)測和評估;利用高光譜圖像信息,結(jié)合圖像處理方法,可以實現(xiàn)對樣品外部品質(zhì)(如傷痕、形態(tài)等)的檢測。因此,高光譜技術(shù)可以同時檢測樣品的內(nèi)部和外部品質(zhì),在果蔬品質(zhì)檢測領(lǐng)域呈現(xiàn)出極大發(fā)展?jié)摿Α?/p>
目前高光譜圖像技術(shù)在黃瓜病蟲害[3]、葉片含水量[4]、黃瓜葉片葉綠素含量[5]及過氧化酶活性[6]等方面的檢測及評價都有研究報道,但在黃瓜新鮮度方面的研究很少,且建立的理化值預(yù)測模型精度不高,穩(wěn)定性較差[7]。由于高光譜圖像數(shù)據(jù)信息量龐大,且存在大量冗余多重共線性信息,會嚴重影響預(yù)測模型的精度及可靠性,因此應(yīng)用時需要進行特征波長的選擇。
黃瓜的水分含量與硬度可以反映黃瓜的新鮮狀態(tài)且二者具有顯著相關(guān)性,可以作為關(guān)鍵指標對貯藏期間黃瓜新鮮度進行判別評價[8]。試驗擬采用高光譜成像技術(shù)對不同貯藏時間的黃瓜樣品進行檢測,在對原始高光譜數(shù)據(jù)進行預(yù)處理以去除噪聲干擾的基礎(chǔ)上,研究硬度和失水率的適宜特征提取方法,并建立判別模型,以期實現(xiàn)對貯藏黃瓜新鮮度的快速、準確評價。
質(zhì)構(gòu)儀:SMS TA.XT Express型,英國,Stable Micro Systems公司;
電子天平:DT-500B型,常熟市佳衡天平儀器有限公司;
高光譜圖像采集系統(tǒng)(見圖1):由高光譜成像儀(IST50-3810型,德國Inno-Spec公司)、500 W的光纖鹵素?zé)?RK90000420108型,德國Esylux公司)、移動裝置和計算機組成,實驗室自行搭建。
黃瓜:德瑞特D19,河南省洛陽市大張超市。
1.3.1 貯藏與采樣 將新鮮采摘的黃瓜樣品500 kg,存放于貯藏庫(溫度25 ℃、濕度80%)。對常溫貯藏的黃瓜每隔1 d取樣一次,即對黃瓜貯藏第1,3,5,7,9,11天取樣,并分別進行硬度、失水率和高光譜檢測。

1. 樣本 2. 光源 3. 光譜儀 4. 輸送裝置 5. 計算機
1.3.2 硬度測定 采用質(zhì)構(gòu)儀選擇果蔬硬度測試模型,測試參數(shù)設(shè)置:探頭直徑5 mm,觸發(fā)力值5.0 g,下行速度1 mm/s,測中速度0.5 mm/s,上行速度1 mm/s。試驗當天從貯藏庫不同貨架隨機選取6根黃瓜,距離黃瓜頭部2 cm處徑向均勻選取3個測試點,取其平均值作為該天黃瓜樣本的硬度值。
1.3.3 失水率的測定 黃瓜入庫當天從貯藏庫不同貨架隨機選取6根黃瓜,依次順序編號,樣品重量用電子天平測量,按式(1)計算失水率。取6根黃瓜樣品失水率平均值作為該天黃瓜樣本的失水率值。
(1)
式中:
a——失水率,%;
W——每根黃瓜原始重量,g;
w——相應(yīng)黃瓜當天的重量,g。
1.3.4 高光譜檢測 通過預(yù)試驗確定高光譜檢測參數(shù):成像儀物鏡高度350 mm,曝光時間90 ms,載物平臺的移動速度1.20 mm/s。儀器光譜采集范圍371.05~1 023.82 nm,光譜分辨率2.8 nm,采樣間隔為0.49~0.51 nm,在光譜范圍內(nèi)共采集1 288個波段。試驗當天從貯藏庫不同貨架隨機選取10根黃瓜,從黃瓜頭部2 cm處開始,均勻切片,每片厚度約2 mm,每根黃瓜切5片,共計50片樣本。黃瓜片逐一平放在洗凈的玻璃平皿中,置于輸送帶上進行高光譜數(shù)據(jù)采集。
1.4.1 黑白校正 用ENVI5.1軟件選取黃瓜樣本圖像中感興趣區(qū)域,對高光譜圖像進行黑白板校正。校正方法:在同一采集環(huán)境下,采集標準白色校正板得到的全白標定圖像(反射率接近99%),關(guān)閉相機鏡頭采集全黑標定圖像(反射率接近0%),并按式(2)計算得到校正后圖像[9]。
(2)
式中:
R——校正后高光譜圖像;
I——原始黃瓜高光譜圖像;
B——全黑標定圖像;
W——全白標定圖像。
1.4.2 原始光譜數(shù)據(jù)的預(yù)處理 為減少環(huán)境噪聲及儀器自身的系統(tǒng)誤差對光譜信息的干擾,分別采用Savitzky-Golar法(SG)、多元散射校正(MSC)和標準正態(tài)變量變換(SNV) 3種方法對原始高光譜數(shù)據(jù)進行預(yù)處理,并根據(jù)相關(guān)系數(shù)(R2)和均方根誤差(RMSE)進行結(jié)果對比。
1.4.3 特征波長的選擇 由于原始光譜數(shù)據(jù)存在共線性,為了減少模型運算量,提高計算精度,對預(yù)處理之后的光譜數(shù)據(jù)采用競爭性自適應(yīng)重加權(quán)算法(CARS)、偏最小二乘(PLS)、連續(xù)投影算法(SPA),分別進行特征波長的提取。
CARS方法是基于蒙特卡羅采樣和偏最小二乘(PLS)模型中回歸系數(shù)的一種特征波長選擇方法,旨在選擇最具有競爭力的波數(shù)組合[10-11]。其通過蒙特卡羅采樣選擇的校正集樣本建立對應(yīng)的PLS模型,計算該次采樣中波長回歸系數(shù)的絕對值權(quán)重,去掉權(quán)重較小的波長后,采用自適應(yīng)重加權(quán)采樣的方法選擇波長來建立PLS模型,選取交互驗證均方根誤差(RMSECV)最小的PLS模型對應(yīng)的波長為特征波長[12]。
偏最小二乘回歸系數(shù)法[13],是在PLS建模過程中得到的,是集主成分分析、典型相關(guān)分析于一體的一種特征波長提取方法。通過偏最小二乘回歸分析,得到權(quán)重回歸系數(shù),并根據(jù)回歸系數(shù)的極值進行特征波長的提取。
連續(xù)投影算法(SPA)[14]可以將波長變量間的共線性消除,有效避免信息重疊,從而用很少的信息量來代表多數(shù)樣本的光譜信息[15-16],特征波長最終的選擇結(jié)果為最小交互驗證均方根誤差(RMSEV)對應(yīng)的波長變量個數(shù)。
1.4.4 模型的建立 采用BP神經(jīng)網(wǎng)絡(luò)[17](back propagation neural network,BPNN)方法構(gòu)建檢測模型。BPNN是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),采用經(jīng)驗風(fēng)險最小和梯度下降法計算目標函數(shù)最優(yōu)值從而逼近函數(shù)表達[18],使信號正向傳播和誤差反向傳播交替循環(huán)進行,信號正向傳播一次計算相應(yīng)的誤差一次,讓誤差沿著梯度負方向下降一個很小的變化量,將得到的誤差變化量反向傳播到BPNN各層,然后對各層參數(shù)的值進行調(diào)整,再進行下一次循環(huán)。當BPNN的誤差收斂到一個較為穩(wěn)定的范圍,可認為各層參數(shù)的值達到了理想狀態(tài),模型達到了最優(yōu)狀態(tài)。
如表1所示,在貯藏期間硬度值隨貯藏時間增長總體呈下降趨勢,其中第3~5天硬度值下降趨勢最明顯。

表1 黃瓜硬度值
如表2所示,貯藏中黃瓜在第1~3天失水速率最高,可能是貯藏室整體環(huán)境溫濕度不穩(wěn)定造成的,環(huán)境穩(wěn)定后隨貯藏時間增長黃瓜樣本失水率總體平穩(wěn)增加。
去除876.97~1 023.82 nm明顯存在噪聲的波段,保留371.05~876.47 nm范圍內(nèi)的平均光譜進行后續(xù)分析。各不同貯藏日期黃瓜樣本原始光譜曲線如圖2所示。
2.4.1 高光譜圖像預(yù)處理 分別采用SG、SNV、MSC 3種方法對光譜進行預(yù)處理,并基于預(yù)處理后的全光譜數(shù)據(jù)建立硬度和失水率指標的BP預(yù)測模型,結(jié)果如表3所示。
由表3可知,SG法預(yù)處理效果較好,其對硬度和失水率預(yù)測的R2分別為0.82,0.84,RMSE分別為0.03,0.39。但是整體R2較低,均在0.8左右,說明基于全波長信息的預(yù)測模型效果不理想,大約只有80%的有效信息,在全波長高光譜信息中存在較多的冗余信息,降低了模型的精度和可靠度,因此需對全波長高光譜進行特征波長的選擇。

表2 黃瓜失水率

圖2 黃瓜原始光譜圖

表3 3種預(yù)處理方法的BP分析結(jié)果
圖3為經(jīng)SG卷積平滑法處理后的光譜數(shù)據(jù)。對比圖2和圖3可以發(fā)現(xiàn),經(jīng)SG法預(yù)處理后,減少了噪聲和暗電流等因素對光譜數(shù)據(jù)的影響,曲線更平滑,更有利于模型的構(gòu)建。
2.4.2 特征波長的選擇 圖4為CARS方法特征波長提取過程。如圖4(a)所示,隨著采樣次數(shù)的增加,優(yōu)化變量數(shù)逐步下降;圖4(b)中RMSECV值表明了基于CARS選擇的特征波長建立的PLS模型的效果,RMSECV值越小表明模型效果越好,*號即為RMSECV值最小的位置,對應(yīng)RMSECV值最小的位置采集次數(shù)為59次,得到黃瓜硬度指標的較優(yōu)特征波長個數(shù)為25個。同理,黃瓜失水率的采樣次數(shù)為70次,得到的較優(yōu)特征波長個數(shù)為20個,篩選過程如圖4(c)和(d)所示。

圖3 SG處理后黃瓜光譜圖
運用PLS方法提取硬度和失水率特征波長個數(shù)分別為13,16個,得到黃瓜特征光譜的權(quán)重系數(shù)圖,如圖5所示。從權(quán)重系數(shù)圖看,絕對值越大的波長點代表這些波長對模型的影響越大,這些波長都處在波峰或者波谷位置,第1主成分和第2主成分波動小,樣本間的差異不明顯;第3主成分波動大,樣本間的差異明顯,所以選取第3主成分回歸系數(shù)波峰和波谷所對應(yīng)的波長為特征波長。
SPA提取特征波長個數(shù)均為20個,特征波長提取如圖6所示。

圖4 基于CARS特征波長提取

圖5 基于PLS特征波長提取
基于不同方法所篩選出的各個特征波長結(jié)果如表4所示。
2.4.3 特征波長下黃瓜硬度和失水率判別模型分析 分別基于3種方法提取的特征波長建立BPNN模型。每個等級的黃瓜樣品的50條高光譜中35條作為訓(xùn)練集,15條作為預(yù)測集。
BPNN模型結(jié)果如表5所示。在BPNN模型中,迭代次數(shù)設(shè)置1 000次,學(xué)習(xí)速率為0.001,訓(xùn)練目標為0.000 1,隱含層神經(jīng)元函數(shù)選擇tansig函數(shù),輸出層神經(jīng)元函數(shù)選擇purelin函數(shù),網(wǎng)絡(luò)訓(xùn)練函數(shù)選擇trainlm函數(shù)。在BPNN硬度模型中,輸入層神經(jīng)元個數(shù)為25,13,20個,分別對應(yīng)CARS、PLS和SPA選取的硬度特征波長個數(shù);在BPNN失水率模型中,輸入層神經(jīng)元個數(shù)分別為20,16,20個,分別對應(yīng)CARS、PLS和SPA選取的失水率特征波長個數(shù)。輸出層神經(jīng)元數(shù)為6,對應(yīng)樣品種類。隱含層層數(shù)越多,精度越高,但網(wǎng)絡(luò)結(jié)構(gòu)越復(fù)雜,訓(xùn)練時間越長[19],最終選擇的隱含層層數(shù)均為1。隱含層神經(jīng)元個數(shù)的選擇參照式(3),經(jīng)調(diào)試,隱含層神經(jīng)元個數(shù)為23時,判別效果最佳。
(3)
式中:

圖6 基于SPA特征波長提取

表4 特征波長提取結(jié)果

表5 特征波長下BPNN判別正確率
N——隱含層神經(jīng)元個數(shù);
n——輸入層神經(jīng)元個數(shù);
m——輸出層神經(jīng)元個數(shù);
a——常數(shù)。
由表5可知,3種模型的預(yù)測效果均明顯改善,SPA提取的特征波長建立的BPNN判別模型效果較好,硬度訓(xùn)練集和測試集正確率分別達到95.24%,91.67%,失水率訓(xùn)練集和測試集正確率分別達到97.78%,95.00%。與全波長光譜信息的預(yù)測模型相比,預(yù)測的精度大大提高。由表6可知,SPA選擇的特征波長建立的判別模型對硬度和失水率的判別效果均較好,R2和RMSE值均優(yōu)于其他特征波長選擇方法。
基于SPA方法提取的特征光譜信息,構(gòu)建BPNN硬度和失水率預(yù)測模型,預(yù)測結(jié)果如圖7、8所示。

表6 特征波長下BPNN模型判別分析結(jié)果

圖7 BPNN硬度模型訓(xùn)練和驗證結(jié)果

圖8 BPNN失水率模型訓(xùn)練和驗證結(jié)果
研究通過對原始高光譜數(shù)據(jù)的預(yù)處理及特征波長的提取,建立黃瓜硬度和失水率預(yù)測模型。采用Savitzky-Golar法、多元散射校正和標準正態(tài)變量變換3種方法對高光譜原始數(shù)據(jù)進行處理,基于全波段信息建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,結(jié)果表明Savitzky-Golar法預(yù)處理更優(yōu);在Savitzky-Golar法預(yù)處理基礎(chǔ)上,采用競爭性自適應(yīng)重加權(quán)算法、偏最小二乘、連續(xù)投影算法3種方法進行特征波長提取;基于特征波長,建立BP神經(jīng)網(wǎng)絡(luò)判別模型。李丹等[20]曾對黃瓜水分進行預(yù)測,通過對900~1 700 nm波段范圍內(nèi)的特征波長下建立的偏最小二乘水分預(yù)測模型,模型的相關(guān)系數(shù)和均方根誤差分別為0.86和0.111。文中基于連續(xù)投影算法提取的特征波長所建立的預(yù)測模型,精度明顯高于其他特征波長選取方法;硬度和失水率訓(xùn)練集準確率分別為95.24%,97.78%,測試集準確率分別為91.67%,95.00%,預(yù)測結(jié)果相對于全波長預(yù)測精度大大提高。
研究下一步解決的問題是硬度和失水率共同特征波長的提取并構(gòu)建多理化指標預(yù)測模型,特征波長提取方法仍然是模型構(gòu)建的關(guān)鍵點,是值得不斷深入分析和研究的問題。