方 瑤,謝天鏵,郭 渭,白雪冰,李鑫星*
1. 中國農業大學信息與電氣工程學院食品質量與安全北京實驗室,北京 100083 2. 中國農業大學工學院,北京 100083
隨著生活物質水平逐步提高,人們對于牛肉消費要求趨向于新鮮、 衛生。但消費者在選擇好品質的肉時只能根據肉類品種、 商家廣告等判斷肉類好壞[1]。目前,我國的肉類銷售仍以冷凍儲藏為主,長期的冷凍儲藏會導致冷鮮肉的質量逐漸發生變化。使用傳統的理化分析法檢測肉質時存在耗費試劑量大、 檢測周期長和人力要求高等問題[2]。通過基于高光譜多參數融合的冷鮮肉品質無損檢測既可以避免傳統破壞性檢測對產品的破壞,又可以實現對產品準確、 快速的實時檢測[3]。
高光譜成像作為一項新興的檢測成像技術,具有無損、 快速、 精度高等優勢,被廣泛應用于食品安全檢測中[4]。國內外許多學者將高光譜技術應用于豬、 羊、 魚等[5-8]的肉質檢測,He[9]等采用HSI技術成功在全波段內預測了三文魚的硬度、 內聚性、 黏性。有研究使用高光譜成像方法實現了冷藏腐敗過程魚肉蛋白質和脂肪變化檢測。但很少有學者對冷鮮牛肉的品質檢測進行研究。
牛肉質地特性[10-12],例如硬度、 回復性、 彈性、 粘著性、 膠著度、 咀嚼度等是決定肉類產品整體質量的關鍵參數。因而冷鮮肉質的測定對肉質品質檢測具有重要的意義。
以不同儲藏時間和溫度的冰鮮牛肉作為研究對象,重點分析研究在冰鮮牛肉冷凍儲藏處理過程中其蛋白質構成的特性: 粘著性、 回復性等復雜變化。采集其對應的高光譜圖像,分別采用一階微分、 多元散射校正、 二元一階微分、 標準正態變換對高光譜數據進行預處理; 采用連續投影法(SPA)篩選出最優波長; 分別使用偏最小二乘法(PLSR)和主成分回歸法(PCR)建立預測模型。最終建立基于特征波長的高光譜與多參數的冷鮮肉品質檢測模型。
實驗所用樣本為北京市美廉美超市所購買的新鮮的牛肉背部肌。購買后立即將牛肉分成126份,平均分配到0,4和8 ℃三個恒溫箱中,每個溫度下的每塊樣品使用無菌袋單獨包裝,進行編號,在每個溫度的恒溫箱中放入溫度記錄儀。實驗共進行十四天,每天從每個恒溫箱中取出三個樣本進行實驗。
高光譜圖像采集設備采用中國農業大學信息與電氣工程學院的GaiaSorter高光譜分選儀,采集軟件為SpecView,選用波段為1 000~2 500 nm的近紅外光譜相機獲取冷鮮肉的光譜反射率,手動調節焦距至圖像最清晰,每次采集圖像后按式(1)進行黑白校準
(1)
式(1)中,Ra為隨機矯正后的高精度光譜波形圖像,Ba為標準校正黑板反射光譜圖像;Wa為標準白板反射光譜圖像;Ia為隨機利用高精度光譜圖像采集處理系統進行采集后得到的高精度光譜波形圖像。TPA(質構分析)參數采集使用Stable Micro Systems質構儀,采用圓柱型探頭,直徑為6mm,默認返回速度為4.5 mm·s-1,兩次壓縮等待時間間隔為2 s,每個樣本采樣三次。
冷鮮肉的貨架期一般為14 d,是理想的試驗周期。本研究以牛肉背部肌為試驗樣本,每天對0,4和8 ℃三個溫度下儲存的冷鮮牛肉采集3個樣本的高光譜圖像及質構特性參數,取平均值。獲取高光譜數據的軟件為ENVI5.3。ENVI(the environment for visualizing images)是一個完整的專業遙感軟件圖像處理分析平臺,匯集于其中的遙感軟件圖像處理分析技術覆蓋遙感圖像處理數據的精確定標、 數據流的融合、 信息提取等各種信息變換。對每一幅高光譜圖像設置50×50的感興趣區域(region of interest, ROI),計算所有興趣區域的高光譜圖像平均值, 得到表示所選感興趣區域的高光譜圖像反射率與光譜波長之間關系值的曲線, 將得到的光譜數據導出。實驗所研究的對象為牛肉背部肌,每一塊樣品中不均勻地分布著牛肉脂肪沉淀,手動選擇ROI區域可以一定程度排除脂肪沉淀干擾。
利用新型質構儀器測定冷鮮牛肉質構得到具有粘聚性、 回復性等六個主要質構測量指標,指標在不同牛肉貯藏時間溫度下隨保存時間的變化趨勢顯示如圖1所示。硬度、 彈性、 咀嚼度、 膠著度隨時間變化未呈現明顯的遞增或遞減趨勢,說明大多數質構參數指標波動大,測量時干擾較多,數據存在一定的誤差,建模時需要篩選指標以保障模型的精確度。其中,測量精度較高的指標有: 粘聚性、 回復性。隨時間下降,粘聚性和回復性下降趨勢明顯說明牛肉品質隨著儲藏時間的增加而下降,新鮮度降低。0~5 d下降趨勢較緩,第6天以后下降速度加快,第11天左右出現上升趨勢。這可能是由于儲存后期肉質腐敗程度大,導致大量水分丟失、 組織結構受到很大破壞、 底部效應增強所導致[13]。為了篩選精確度較高的質構特性指標,建立質構特性預測模型,結果如表1所示,粘聚性和回復性預測集準確度較高,其余指標預測集準確度均遠低于0.5,模型誤差超出容錯范圍,舍去。最終,選擇粘聚性和回復性作為參數建模。

圖1 不同質構參數隨時間變化曲線(a): 硬度隨時間變化; (b): 彈性隨時間變化; (c): 咀嚼度隨時間變化;(d): 粘聚性隨時間變化; (e): 膠著度隨時間變化; (f): 回復性隨時間變化Fig.1 Curve of different texture parameters changing with time(a): Hardness over time; (b): Resilience of hardness over time; (c): Chewiness of hardness over time; (d): Cohesivencess of hardness time; (e): Stalemate of hardness over time; (f): Resilience of hardness over time

表1 質構特性參數結果Table 1 Results of texture characteristic parameters
分別采用Kennard-Stone和SPXY算法將實驗樣本劃分為訓練集和預測集,其中篩選出35個訓練集樣本,7個預測集樣本。KS算法通過歐氏距離選擇樣本進入訓練集,以充分保證樣本集的選取具有代表性和均勻性。SPXY在計算樣品間距離時將自變量和因變量同時考慮在內。為了保證樣本模型分析精度能夠達到最佳,訓練樣本模型應該在結構組成上和性質上與預測到的樣本模型基本相同。對每種方法得到的樣本劃分結果以粘聚性作為參數分別采用全波段建模以確定最終的數據劃分方式。
為了比較不同樣本劃分方式效果的優劣,采用相對標準偏差RSD及相關系數R2作為指標選擇最佳預處理方法,結果如表2所示。由表2可知,經過SPXY和KS劃分后的樣本數據建立的偏最小二乘模型訓練集和預測集相關系數分別為0.769 3和0.596 6,均優于無劃分方式的相關系數0.554 7,說明樣本劃分的必要性。使用KS算法樣品劃分后的建模預測集相關系數為0.596 6。使用 SPXY算法樣品劃分后建模預測集相關系數為0.769 3。兩者相對標準偏差接近,SPXY劃分結果相關系數相較于KS算法更接近1。綜上所述,SPXY建模效果優于KS算法,采用SPXY作為樣本劃分方式。

表2 不同樣本劃分方式結果Table 2 Results of different sample partitioning methods
圖2為冰鮮牛肉原始光譜曲線。不同時間測量的光譜曲線整體趨勢相近。隨著儲藏時間延長,曲線在1 100 nm處峰值增加,1 200 nm處的峰谷降低,這可能是由于肌紅蛋白的轉化和降解。由于原始光譜包含許多噪聲干擾,例如光譜基線漂移,隨機噪聲等等,影響光譜建模的準確性,可導致模型的精確度降低,因此對原始光譜進行預處理十分必要。研究中使用一階微分、 二階微分、 多元散射校正、 標準正態變換對高光譜數據進行預處理,處理后采用全波段建模以確定最終預處理方式,結果如表3所示。

圖2 冰鮮牛肉原始光譜曲線Fig.2 Raw spectral curve of chilled beef

表3 不同預處理方式結果Table 3 Results of different pretreatment method
從表3數據可得,使用預處理后的光譜數據建立的冷鮮牛肉品質模型的準確度總體上升。以粘聚性為參數時,經SNV處理后光譜的模型準確度高于其他預處理方法,R2約為0.81,模型具有較高精度。在以回復性為參數建模時,D2st預處理效果最好,相關系數達到0.867 4,RSD為0.099 4。在選用不同質構參數建立偏最小二乘模型時,相同預處理方法對模型的精確度的提升效果不同。由表3確定以粘聚性、 回復性為參數建模時分別采用SNV、 D2st作為原始光譜預處理方法。預處理后總體建模準確度在0.7~0.8左右,這可能是參數測量時存在較大誤差,數據波動性較大,穩定性差的緣故。
經預處理后的全波段牛肉品質預測模型的效果得到改善。全波段光譜存信息量過大且包含大量冗雜數據,因此預測模型需要優化。主要使用連續投影法(SPA)對不同光譜的最優波段進行篩選。SPA選擇含有最少多余信息的波長變量組合以最小化信息重復疊加。圖3展現了SPA應用算法分析得到的每個特征波長在SNV預處理后的全波段反射光譜上的幾個具體位置。SPA提取特征波長結果詳見表4。由表4可知,相比于無特征波長提取,SPA從原始光譜中提取了4個特征波長,有效減小了全波段建模包含的大量噪聲信息的缺點,使模型的精確度得到保障的同時提高了模型的運行速度。

圖3 SPA選取最優特征波長Fig.3 Optimal wavelength selected by SPA

表4 提取特征波長后建模結果Table 4 Modeling results after feature wavelength extraction
現階段常用的預測變量建模和計算方法主要有PLSR,PCR和ANN等。PLSR通過投影分別將要預測的變量和其他觀測變量映射到一個新的空間, 來幫助尋找一個基于線性回歸的模型。分別采用SNV和D2st對數據進行預處理。對提取特征波長后的光譜進行粘聚性、 回復性預測模型的建立和分析。結果如表5和表6所示。

表5 基于PLSR的建模結果Table 5 Modeling results based on PLSR

表6 基于PCR的建模結果Table 6 Modeling results based on PCR
由表5對比可知,使用PLSR建模時,以粘聚性和回復性為參數的模型精確度分別為0.879 8和0.880 6。使用PCR建模時,以粘聚性和回復性為參數的模型精確度分別為0.728 8和0.766 04。基于PLSR的牛肉品質參數預測模型的相關系數總體較高于基于PCR模型的相關系數,說明PLSR的建模效果優于PCR,這可能由于PCR模型中與組分值無關的一些變量可能也具有很大的權重,導致使用PCR建模存在一定的誤差。
對原始冷鮮牛肉高光譜數據進行預處理,采用SPA算法篩選出最優波段,提取特征波段輸入PLSR算法中,構成基于高光譜的冷鮮牛肉粘聚性、 回復性的預測模型,得到不同質構特性參數的預測值。最小二乘回歸結果如圖4(a,b)所示。

圖4 質構參數回歸模型(a): 粘聚性真實值與預測值散點圖;(b): 回復性真實值與預測值散點圖Fig.4 Regression model of TPA(a): Scatter plots of true and predicted values of cohesivencess; (b): Scatter plots of ture and predicted values of resilience
結果表明: 基于SPA-PLSR的牛肉品質預測模型具有較高的精度,當預測參數分別為粘聚性、 回復性的識別指數分別為0.856 6和0.840 7。
采用粘聚性、 回復性作為綜合評價冷鮮牛肉品質的參數,建立了基于高光譜的牛肉品質預測模型。采用SPXY對光譜進行樣本劃分,生成35個訓練集樣本和7個預測集樣本,分別使用SNV和D2st對原始光譜數據進行預處理。采用SPA提取特征波長,將特征波段和質構特性參數作為PLSR輸入,建立了基于高光譜與牛肉品質(粘聚性、 回復性)預測模型,模型相關系數分別為0.879 8和0.880 6。經過模型數據可靠性檢驗,該質構預測模型精確度較高,適用于對牛肉品質的在線快速檢測。