邢書海,張淑娟,孫海霞,陳彩虹,李成吉
(山西農業大學工學院,山西太谷030801)
近紅外光譜技術作為一種高效、無損、易操作、可實時在線檢測的新型檢測技術,已被廣泛應用于果蔬檢測中,并取得了顯著成果,在水果品質檢測方面應用廣泛[1]。SIRISOMBOON等[2]使用近紅外光譜技術檢測番茄的力學性狀,采用多元散射校正(MSC)對光譜進行預處理,建立的校正模型相關系數為0.95,最低標準誤差為0.35,偏差為0.19。KAVDIR等[3]運用可見光和近紅外光譜技術測量不同品種酸黃瓜的硬度、表皮和果肉的顏色、干物質含量,采用偏最小二乘法(PLS)建立校正預測模型,結果得到了酸黃瓜的硬度、表皮顏色、果肉顏色和干物質含量最好的PLS校正模型,決定系數分別為0.70、0.89、0.34、0.65。目前,國內已有學者利用近紅外光譜技術對西瓜、蘋果、梨、鮮棗等[4-11]進行研究,但未見對西葫蘆的研究。
西葫蘆是人們愛吃的蔬菜之一,其果實呈圓筒形,果形較小,果面平滑,以采摘嫩果供菜用。西葫蘆皮薄、肉厚、汁多和富含水分,受到廣大消費者的喜愛。溫室大棚種植西葫蘆已成為一些地區農民增加收入的一項重要來源。目前,西葫蘆的品質檢測和分級分選還是依靠人工來完成。硬度是反映果蔬品質的重要指標[9,12],也是西葫蘆在收購、流通、銷售過程中需要關注的重要指標。因此,研究針對西葫蘆的快速、方便、無損硬度品質檢測技術是非常必要的。
本試驗應用可見/近紅外反射光譜技術快速獲取西葫蘆漫反射近紅外光譜,對西葫蘆硬度品質進行檢測,為今后在線快速無損檢測果蔬硬度提供理論依據。
本研究的光譜數據采集采用美國ASD(Analytical Spectral Device)公司生產的ASD FieldSpec3型光譜儀,采樣波段范圍為350~2 500 nm,光譜采樣間隔為1 nm,掃描次數30次,分辨率3.5 nm,光纖探頭視場角度為30°。采用漫反射方式進行西葫蘆樣品光譜信息采集。光源采用與光譜儀配套的14.5 V的鹵素燈。
所有試驗樣品采摘于山西省太谷縣范莊溫室大棚蔬菜生產基地。選取大小均勻、表面無機械損傷的西葫蘆樣本200個,在室溫下貯藏。西葫蘆采集光譜數據時,隨機抽取進行編號、標記和光譜數據采集,在自制的暗室內進行光譜采集(圖1),運用ASDFieldSpec3型光譜儀按編號順序采集樣品的漫反射光譜數據,光譜分辨率為3nm(350~1000nm),掃描波長范圍為 350~2 500、1 000~2 500 nm,采樣間隔設置為1.4nm(350~1000nm)和2nm(1000~2 500 nm),數據間隔為1 nm。樣品的縱軸(果柄-果蒂軸)與操作臺平行,每個正常西葫蘆樣品都以縱軸為轉軸旋轉180°采集2次,每次采集掃描30次,然后取平均值作為該樣品的實測光譜信息。采集的原始光譜信息如圖2所示。
西葫蘆硬度測定采用美國FTC公司生產的TMS-PRO型食品物性分析儀(質構分析儀),檢測精度為0.015%,選用P/2n針狀探頭,選取西葫蘆赤道部位向陽面和背陰面分別測定,進行3次穿刺試驗,保證刺入點位置與光譜采集位置一致,記錄并取平均值作為果實硬度數據。設置測前速度5 mm/s,貫入速度 1 mm/s,測后速度 6 mm/s,最小感知力5 g,穿刺深度4 mm。硬度計算公式如下。
其中,F為硬度值(N);p為物性分析儀測量值(g);g為重力加速度,取 9.8 N/kg。
為了消除光譜采集過程中來自高頻隨機噪音、基線漂移、樣本不均勻和光散射等的影響,對采集的光譜數據進行預處理。卷積平滑法[13](S-G)是一種常用的光譜數據處理方法,可以消除采集光譜時產生的隨機誤差,減少噪聲。多元散射校正[14](MSC)主要用來消除由于散射與顆粒尺寸以及分布不均勻帶來等因素的影響,它可以提高對有用信息的提取,獲得較優的光譜。標準正態變換[15](SNV)主要是對光譜數據進行標準正態化處理,消除采集光譜數據的散射光所產生的誤差。采用卷積平滑法進行光譜預處理,此時能很好濾除各種因素產生的高頻噪音,再進行多元散射校正(MSC)、標準正態分布(SNV)和卷積平滑法(S-G)以及幾種方法相結合對光譜數據進行處理。之后,再應用主成分回歸(PCR)、逐步多元線性回歸(SMLR)和偏最小二乘回歸(PLSR)建模方法分別對西葫蘆硬度品質進行建模分析。
通過建模樣本均方根誤差(RMSEC)與預測樣本均方根誤差(RMSEP)來評價所建模型的精確性。當校正集和驗證集的相關系數越接近1和均方根誤差越接近于0時,并且校正集和驗證集的均方根誤差越接近,表明所建模型較優。
由表1可知,樣品硬度最小值為3.06 N,最大值為4.79 N,平均值為3.89 N。運用SPXY法以3∶1的比例劃分校正集和預測集,最終選取校正集樣本136個,預測集樣本44個。

表1 樣本硬度測量結果
采用不同的方法對原始光譜進行預處理,應用偏最小二乘回歸PLSR的建模算法會產生不同的效果。通過運用PLSR算法對經過平滑處理、SNV、MSC預處理的光譜數據進行建模分析,以確定最好的建模模型(表2)。

表2 PLSR多種預處理建模分析結果
由圖3可知,運用原始光譜數據經平滑處理與標準正態變換(SNV)處理的光譜數據建立的PLSR預測模型,校正集相關系數為0.979,預測集相關系數為0.976,較其他模型建模最優。使用多元散射校正(MSC)和標準正態變換(SNV)來消除西葫蘆果實表面紋理、大小以及均勻度等因素的影響[16]。2種校正方法進行對比,SNV作為光程校正效果更好,校正的相關系數較高。
為了驗證不同建模算法優劣,運用PCR和SMLR分別對 SNV、MSC、S-G+SNV 以及 S-G+MSC預處理的光譜數據進行建模分析比較,進行最優硬度檢測預測模型確定(表3)。

表3 PCR和SMLR對光譜數據建模結果
通過對比分析不同預處理和不同建模方法在350~2 500 nm全波段光譜數據建模,應用PLSR對經過S-G+SNV預處理的光譜數據進行建模的效果最好。采用PLSR建模效果最好,原因在于PLSR算法適用于復雜分析體系的全波段光譜數據,數據矩陣分解與回歸相互結合,使得特征向量直接與樣品性質相關,所建預測模型更為穩健。為了驗證模型的可靠性和準確性,運用模型對44個驗證樣本進行預測,結果如圖4所示,預測相關系數為0.886,預測均方根誤差為0.126。
本研究在350~2500nm光譜范圍內利用可見/近紅外漫反射光譜技術對西葫蘆的硬度指標進行檢測,建立了基于可見/近紅外漫反射光譜檢測西葫蘆硬度指標的方法和模型。試驗共研究了180個西葫蘆樣品,采用主成分回歸(PCR)、逐步多元線性回歸(SMLR)和偏最小二乘回歸(PLSR)進行模型建立,對比光譜平滑處理、SNV、MSC處理建模結果的影響,通過對比不同處理方法建模后的效果,結果表明,PLSR進行建模的模型最優。預測模型得到西葫蘆硬度真實值和預測值的相關系數達0.886。本研究表明,可見/近紅外漫反射光譜可作為一種快速無損的檢測技術來評價西葫蘆硬度指標,并對西葫蘆在線無損檢測的進一步研究有借鑒意義。