陳遠哲,王巧華,2,*,高 升,梅 璐
(1.華中農業大學工學院,湖北 武漢 430070;2.農業農村部長江中下游農業裝備重點實驗室,湖北 武漢 430070)
皮蛋又稱松花蛋、彩蛋,其風味獨特,營養豐富,氨基酸比例均衡,易消化吸收,是我國特有的一種傳統蛋制品[1]。皮蛋加工歷史悠久,主要利用堿和鹽腌制而成,其形成過程一般會從溶液狀態轉變為溶膠狀態,進而轉變為富有彈性的凝膠狀態[2-4]。但腌制液中的堿濃度過高時,凝固的蛋清蛋白會水解液化,使已經吸附的結合水又以自由水的狀態釋放出來,此過程稱為堿傷[5-7]。影響皮蛋凝膠品質主要有腌制液濃度、腌制溫度、蛋殼氣孔大小等因素[8-14]。出缸期皮蛋的凝膠強弱是工廠對皮蛋分級的一個重要衡量標準。而彈性與皮蛋凝膠品質相關,凝膠越好,皮蛋的彈性就越大[15];含水率作為食物中重要的衡量指標,對皮蛋的內部品質、質構特性及風味會產生較大影響[16];因此,彈性和含水率可以作為消費者進行購買時的重要參考指標,但是皮蛋彈性目前只能依靠手掂方式估算,含水率只能依據生化檢測方法計算,繁瑣低效。
高光譜成像技術是將光譜技術與圖像技術相結合,探測待測物體的二維集合空間的圖像信息和一維的光譜信息,具有簡便、快速、無損、準確等優點,已成功應用于肉類、果蔬等品質的分析與檢測[17-22]。近年來,國內已有對皮蛋品質的相關報道,分別從皮蛋破損、斑點、分級、微量元素等方面進行研究,劉龍等[23]根據皮蛋蛋殼的聲學特性,采用小波變換和BP神經網絡相結合的方法對皮蛋蛋殼破損進行檢測;吳玲等[24]利用機器視覺技術分析不同腌制配方對皮蛋表面斑點形成的影響,最終確定最佳生產配方;王巧華等[25]利用機器視覺結合近紅外光譜技術,對優質皮蛋、次品皮蛋和劣質皮蛋進行檢測和分級,其中優質蛋的識別率為96.49%,次品蛋識別率為94.12%,劣質蛋的識別率為100%;黃郁杰等[26]采用絡合滴定法與原子吸收光譜法測定了皮蛋中的鉛含量,但這并不能滿足快速、高效、檢測的要求。目前關于皮蛋凝膠內部品質高光譜成像檢測的研究鮮見報道。
本實驗以皮蛋為研究對象,采集出缸期皮蛋的高光譜信息,建立光譜信息與皮蛋凝膠品質含水率和彈性的回歸模型,進而實現出缸期皮蛋凝膠品質的可視化分析與不同品質皮蛋的預測。
材料為市面上常見的青殼皮蛋,由湖北神丹健康食品有限公司提供,由經驗豐富的工人挑選大小相近,顏色相似、蛋殼無破損的出缸期皮蛋作為實驗樣本,其中優質蛋105個,合格蛋75個,建??倶颖緮禐?80 顆。將選取的樣本依次編號,優質蛋樣本編號為1~105,合格蛋樣本編號為106~180,按照編號依次對樣本去除蛋殼進行光譜信息采集和理化指標的測定。
Zolix Hyper SIS-VNIR-CL高光譜成像系統(美國海洋光學公司)如圖1所示,該系統主要由高光譜成像光譜儀(芬蘭Spectral Imaging公司)、CCD工業相機(日本Hamamatsu公司)、1 支Cob款帕燈(功率24 W,顏色為暖白;北京卓立漢光儀器有限公司)、1 臺絲桿式位移步進電機控制平臺(北京卓立漢光儀器有限公司)等部件組成。光譜的波段范圍為450~1 000 nm(含有520 個波長),光譜的分辨率為2.8 nm,整個采集過程在暗箱中進行。通過提取450~1 000 nm的三維光譜圖形信息,分析不同波段和圖像像素的特征,進行皮蛋凝膠品質的內部指標可視化分析與檢測。

圖1 高光譜成像系統Fig. 1 Hyperspectral imaging system
TMS-PRO型質構儀 美國FTC公司;101電熱鼓風干燥箱 上海捷呈實驗儀器有限公司。
1.3.1 圖像的采集與校正
高光譜圖像采集之前,需將儀器預熱20 min后進行實驗。實驗時,在圖像采集臺上放置自制帶孔燈箱,打開光源,將去殼皮蛋鈍端朝下放置在透光孔處。高光譜成像系統參數設置:樣本與鏡頭距離為300 nm,相機曝光時間0.15 s,步進電機移動速率為2 mm/s,移動范圍為0~200 mm。為消除光照和相機暗電流工作不穩定性的影響,需對高光譜成像系統進行黑白校正[27-28]。全黑圖像ID、全白圖像IW分別通過遮蓋鏡頭、掃描標準白板獲得;將皮蛋放在載物平板上獲取原始高光譜透射圖像IR;校正圖像IC按式(1)計算:

利用ENVI軟件(美國Exelis VIS公司)選擇整顆皮蛋的圖像作為感興趣區域(region of interst,ROI)高光譜數據,ROI大小在200×200像素左右,將提取ROI的平均光譜作為對應的透射原始光譜[27]。
1.3.2 彈性值測定
利用質構儀進行質地多面剖析(texture profile analysis,TPA)實驗,測定皮蛋彈性值。首先在質構儀上裝上P/5平底柱形探頭,然后在彈性測定程序中設置參數:測試前速率30 mm/min,測試速率60 mm/min,測試后速率60 mm/min,壓縮程度40%,測試時間間隔5 s。
1.3.3 含水率的測定
光譜采集和彈性值測定之后,將皮蛋去殼切碎放入食物攪拌器中攪拌,依次稱取每顆皮蛋大約10 g作為樣本。采用GB 5009.3—2016《食品中含水率的測定》。取潔凈鋁盒,加熱、干燥后稱量為m3,放入樣本后的鋁盒質量為m1,然后在105 ℃電熱鼓風干燥箱內烘干后樣本和鋁盒的質量為m2,按式(2)計算樣品中皮蛋含水率(X):

1.4.1 光譜數據預處理
為解決光譜信息信噪比低、光譜變動及光譜重疊等問題,利用Matlab2016a軟件對采集的光譜數據進行處理。保留450~1 000 nm波段的光譜數據,對原始光譜進行卷積平滑(Savitzky-Golay,S-G)處理可以有效消除基線漂移、傾斜等噪聲;一階導數(first derivation,FD)處理,可以消除與波長無關的變量,該方法可以提高模型準確性;并計算S-G后光譜數據的S-G-FD。
1.4.2 異常樣本剔除
皮蛋高光譜數據采集和理化值測定時,由于儀器、人為操作不當等因素使數據中存在異常點,所得到的模型會偏離真實模型,此時不能代表數據的主體信息,均方根誤差波動較大,甚至得到錯誤的結論[28-31]。利用蒙特卡羅偏最小二乘(Monte Carlo-partial least squares,MCPLS)法可以同時檢測光譜信息和彈性、含水率的異常值,由交叉驗證均方根誤差達到最小值確定最佳主成分數,根據計算得到的樣本誤差均值和標準差為準,其值越大,則判定為異常樣本。
1.4.3 特征波長的選擇
全波長共含有520 個波長變量,為使光譜變量之間共線性達到最小以及降低光譜冗雜信息的變量組,本實驗采用連續投影算法(successive projection algorithm,SPA)和無信息消除(uninformative elimination,UVE)法進行特征波長選取。
SPA是一種前向循環的特征變量篩選方法,可以過濾掉無用信息,大大降低數據間的共線性影響[32]。UVE法是淘汰一些與變量關聯非常小的波長。具體實現為向原始光譜數據中隨機添加同行列一定數量級(本實驗采用大小0~10-6)的噪聲,每剔除一個樣本,將剩下的樣本作為訓練集建立最小二乘回歸模型,每次得到回歸模型的回歸系數α通過可信度Y判斷是否選取該波長點。模型系數按式(3)計算:

式中:Yi為第i個波長點處的模型系數;mean(αi)為模型平均回歸系數;std(αi)為方差;當|Yk|>max|Ym|時,則選取該波長點,其中,k取1~520,m取450~1 000。
1.4.4 樣本集的劃分
采用光譜理化值共生距離(sample set partitioning based on joint X-Y distance,SPXY)法對剔除后樣本的彈性和含水率按3∶1比例進行校正集和預測集劃分,統計分析計算出校正集和預測集樣本的最小值、最大值、平均值和標準差。
1.4.5 回歸和分類模型的建立與評價
多元逐步回歸(multiple stepwise regression,MSR)是在逐步回歸基礎上改進的一種建模方法,能夠建立多個自變量與因變量之間的關系模型。而MSR模型適用于光譜變量數少于理化值數的情況,因此本實驗采用由SPA和UVE算法提取的波長建立回歸模型。
BP神經網絡是人工神經網絡的一種,目前被廣泛適用。它是按照誤差逆向傳播算法訓練的多層前饋神經網絡,由大量的神經元聯結構成,具有很強的非線性函數逼近能力,并擁有強大的容錯率。本實驗采用BP對競爭性自適應重加權算法(competitive adaptive reweighting sampling,CARS)提取的特征波長建立出缸期不同品質皮蛋的預測模型。
回歸模型建立后,采用測試集的決定系數R2、均方根誤差(root mean square error,RMSE)和相對分析誤差(relative percent deviation,RPD)對皮蛋彈性和含水率的估算模型進行評價。當決定系數R2越接近1、RMSE越小,表明模型效果越好;其中,當RPD>2時,模型具有極好的預測能力,當RPD為1.4~2時,模型效果一般,可以進行粗略評估,當RPD<1.4時,該模型無法對樣本進行預測[33];而分類模型的性能采用混淆矩陣對出缸期不同品質皮蛋進行評估預測。
1.4.6 偽彩色圖像處理技術
偽彩色處理是根據特定的準則對灰度值賦予彩色的處理,可以將單色圖像變換成給定彩色的分布圖像。該技術可以提高對圖像細節的辨別力,達到圖像增強的效果。本研究利用最優回歸模型分別估算出缸期不同品質皮蛋高光譜圖像上每個像素點的彈性值和含水率,結合偽彩色圖像處理技術生成彈性值和含水率的彩色分布圖。
對高光譜圖像上ROI提取光譜,光譜波長范圍為450~1 000 nm,共520 個波長,獲得優質蛋與合格蛋的原始光譜和平均光譜曲線如圖2所示??梢钥闯觯煌焚|皮蛋的光譜曲線變化趨勢基本相同;在450~643 nm(可見光波段)光譜的透射率整體升高,由于皮蛋蛋殼氣孔數量和內膜結構特性對凝膠品質的影響,造成對可見光吸收減弱,從而在波長570 nm附近出現第1次透射率波谷;由于C—H鍵二級倍頻和一級倍頻的吸收,在波長640 nm附近出現光譜上的最高峰;在波長657~910 nm(可見-近紅外波段)光譜的透射率持續下降,這是因為在波長900 nm附近對皮蛋凝膠中水分子O—H鍵吸收減弱形成的第2次波谷。皮蛋腌制期腌制液濃度、腌制溫度、蛋殼氣孔大小等因素使出缸期皮蛋的光譜發生了明顯變化[34-35],主要表現為優質蛋比合格蛋對光的吸收更強。因此,可以根據光譜間的差異進行皮蛋凝膠品質彈性和含水率的估算。

圖2 出缸期皮蛋光譜曲線Fig. 2 Spectral curves of preserved eggs
利用SPSS軟件中的Pearson相關分析法對不同預處理的光譜數據和含水率、彈性進行相關性分析,其相關性曲線如圖3所示。在圖3a中,皮蛋含水率與原始光譜在可見光波長范圍內呈負相關,且相關性不斷增高,在波長667 nm處相關性最高,相關系數為-0.732,由于腌制期腌制液濃度、蛋殼氣孔大小、內膜結構等因素對凝膠特性的影響,使穿過吸收區域水層的光能太少,造成在近紅外波長范圍相關系數基本趨近0,不相關;含水率與S-G光譜數據的相關性和原始光譜相似,但相關性有所提高,在波長672 nm處相關性最高,相關系數為-0.836;FD后的光譜與含水率相關性曲線呈正負起伏變化,波長在623 nm處相關性最大,相關系數為0.753;S-G-FD組合變換的相關性曲線與FD相關性曲線相似,在波長625 nm處相關性達到0.851。在圖3b中,經S-G處理后光譜數據與原始光譜數據相似,兩者分別在可見光波長671 nm和657 nm處相關性最高,相關系數為0.715、0.794;經FD處理后的光譜數據與S-G-FD處理后的相似,在可見光波長754 nm和757 nm處相關性最高,相關系數為0.704、0.786;由此可見,原始光譜與不同預處理方法的光譜在可見光波長520~760 nm范圍內的相關性較高,表明可以通過預處理方法有效提高光譜數據與皮蛋含水率、彈性的相關性。

圖3 皮蛋含水率、彈性與光譜數據的相關性Fig. 3 Correlation between water content and springiness of preserved eggs and spectral data
實驗中儀器、人為操作不當等因素造成的異常數據由MCPLS分析法剔除,結果如圖4a所示。彈性值異常樣本檢測以預測誤差平均值3.24,預測誤差標準差0.631為標準,共剔除異常樣本8個,分別為13、24、47、63、85、117、146和161號樣本。剔除后的樣本決定系數R2由原來的0.726 5提升到了0.812 4。由圖4b所示,光譜值和含水率的蒙特卡羅分析檢測中未出現較大的平均值偏差和標準偏差,因此沒有進行異常樣本剔除。

圖4 彈性值、含水率MCPLS法異常樣本剔除Fig. 4 Elimination of abnormal samples by MCPLS method for springiness and water content
如表1所示,實驗中共180 個樣本,利用SPXY法將剔除異常值的彈性和未剔除異常值的含水率樣本結合光譜信息按照3∶1的分布范圍為16.36%~39.64%,校正集和預測集的標準差分別為3.322 4%、3.284 5%;含水率的分布范圍為46.15%~74.50%,校正集和預測集的標準差分別為6.342 7%、6.421 5%;通過SPXY法劃分的彈性和含水率校正集的分布范圍大于預測集,說明數據具有代表性。

表1 利用SPXY算法劃分樣本集的數據統計Table 1 Data statistics of sample sets divided by SPXY algorithm
為減少光譜數據的冗雜性,提高模型的運行速度,采用SPA和UVE算法提取不同預處理和原始光譜數據的特征波長并建立回歸模型。以彈性指標和原始光譜為例介紹特征波長提取的過程。如圖5所示,建立SPA彈性模型,初始設定提取波長變量范圍為5~30,提取步長為1;由圖5a可知,RMSE最小為0.394 7,對應模型中變量的個數為10 個,即經SPA提取的最優波長點有10 個,優選出波長點的位置如圖5b的原始光譜索引顯示,所選波長變量占總波長的1.923%。不同預處理的光譜由SPA提取的波長結果如表2所示。

圖5 SPA提取波長過程Fig. 5 Extraction of characteristic wavelengths by SPA

表2 SPA提取波長結果Table 2 Results of extraction of characteristic wavelengths by SPA algorithm
利用UVE法提取特征波長,如圖6所示,建立UVE的彈性模型,初始設置噪聲矩陣最大穩定性絕對值的90%作為剔除閾值,圖中黃色曲線為光譜變量的穩定性值,紅色曲線為噪聲變量信息的穩定值。以閾值±27.43為界,兩條水平虛線之外是需要保留變量,虛線之外為剔除的變量,最終經UVE變量選取出12個波長變量,波長點的位置在圖6b中顯示,所選波長點占總波長的2.31%。由UVE選取的波長結果如表3所示。

圖6 彈性的UVE提取特征波長Fig. 6 Extraction of characteristic wavelengths by UVE for springiness

表3 UVE算法提取波長結果Table 3 Results of extraction of characteristics wavelengths by UVE algorithm
分別以SPA和UVE算法提取的特征波長建立不同預處理后的光譜數據MSR模型,計算每種模型在預測集中彈性和含水率的估算值,回歸模型效果如表4所示??梢钥闯?,對皮蛋含水率來說,基于UVE算法經S-G-FD預處理后的模型性能最好,決定系數R2為0.882,RMSE為0.583,RPD為2.1;用于預測彈性指標經S-G-FD預處理后的SPA-MSR模型性能最好,決定系數R2為0.903,RMSE為0.348,RPD為2.2。建立的含水率和彈性的MSR模型如圖7所示,可以看出,2 種特征提取方法結合MSR模型分別對含水率和彈性取得了不錯的估算結果。

表4 皮蛋彈性和含水率模型預測結果Table 4 Parameters of prediction models for springiness and water content of preserved eggs

圖7 含水率和彈性預測值和實測值散點圖Fig. 7 Scatter plots for predicted values versus measured values of water content and springiness
以光譜透射率X為自變量,建立的最優預測含水率和彈性的MSR回歸模型方程:

式中:YW為含水率預測值;YS為彈性預測值;Xi為特征波長處的透射率(下標表示波長/nm)。
利用UVE-MSR和SPA-MSR模型分別估算出缸期皮蛋高光譜圖像的每個像素點的含水率和彈性,結合Matlab編程,采用偽彩色圖像處理技術生成含水率和彈性的分布圖[36],不同的顏色和深淺程度代表不同品質皮蛋的含水率和彈性,結果如圖8所示。圖8a、b中,不同品質皮蛋的蛋清凝膠部分主要呈淺藍色和綠色,不同的是合格蛋的蛋黃部分主要呈黃色和淺紅色,含水率主要集中為52%~65%,優質蛋的蛋黃部分主要呈黃色和深紅色,含水率主要分布在57%~69%之間,優質蛋的含水率要高于合格蛋的含水率;圖8c、d中,不同品質皮蛋的蛋清凝膠部分主要呈淺藍色和綠色,不同的是優質蛋蛋黃部分要比合格蛋的蛋黃部分顏色淺,合格蛋的彈性主要分布在26%~38%之間,優質蛋的彈性主要分布在29%~42%之間,優質蛋的彈性值要高于合格蛋。通過可視化不同品質皮蛋的分布圖,可以直觀看出皮蛋的不同部位的含水率和彈性值,從理論上有助于分析皮蛋內部品質變化規律,從應用上有助于后續在線檢測皮蛋凝膠品質。

圖8 不同品質皮蛋含水率和彈性分布圖Fig. 8 Water content and springiness distribution maps of preserved eggs of different quality grades
為快速準確地預測出缸期不同品質皮蛋,采用CARS算法進行特征波長的提取。采樣過程中,CARS算法以彈性的標準值篩選出10 個特征波長473、504、541、583、619、654、699、748、827 nm和937 nm,如圖9所示。再以特征波長作為輸入值,建立BP預測模型。對優質蛋與合格蛋樣本按照2∶1劃分訓練集和預測集,模型參數:最大訓練次數為200、學習率為0.1、誤差為0.1。如圖10所示,由混淆矩陣可以看出,出缸期不同品質皮蛋的預測總準確率為98.3%,預測結果較為理想。

圖9 CARS特征波長選擇Fig. 9 Selection of characteristic wavelengths by CARS

圖10 混淆矩陣Fig. 10 Confusion matrix
出缸期不同品質的皮蛋光譜變化趨勢基本相同,不同的是,優質蛋比合格蛋對光的吸收更強。對出缸期皮蛋的原始光譜進行不同的預處理可以提高與含水率、彈性的相關性,在可見光波長520~760 nm范圍內不同預處理的光譜數據與含水率、彈性的相關系數較高,經S-GFD處理后的光譜在625 nm處與皮蛋含水率相關性最高,為0.851;經S-G處理后的光譜在657 nm處與皮蛋彈性相關性最高,為0.794。
基于SPA和UVE算法提取特征波長建立的MSR預測模型。預測含水率的最優模型為UVE-MSR,R2和RMSE分別為0.882、0.583,RPD為2.1;預測彈性的最優模型為SPA-MSR,R2和RMSE分別為0.903、0.348,RPD為2.2。
分別利用UVE-MSR、SPA-MSR預測模型計算出缸期不同品質皮蛋每個像素點的含水率和彈性值,結合偽彩色圖像處理技術生成可視化分布圖,實現出缸期不同品質皮蛋的含水率、彈性值的評價。
基于CARS提取的特征波長建立的BP模型對出缸期不同品質皮蛋進行預測,總準確率為98.3%,表明高光譜技術可以實現對不同品質的皮蛋進行預測。