趙紫竹,衛勇 ,張乃遷,常若葵,吳海云,劉華,單慧勇,楊仁杰,郭小英
(1.天津農學院工程技術學院,天津300384;2.Biological and Agricultural Engineering Department,Kansas State University,M anhattan KS 66502,USA)
牛奶中營養元素豐富,被譽為“白色血液”,其脂肪、蛋白質含量是評價牛奶品質的重要指標[1-2]。目前,常用牛奶檢測方法分析過程繁瑣,無法提供在線測試[1]。近年來,應用近紅外光譜技術快速在線測量牛奶品質是一個研究熱點[3-6]。據報道采用近紅外光譜技術可檢測牛奶中干物質含量及品質[7-8]。Fu等(2014)采用高光譜成像技術有效檢測了摻假牛奶中低含量(≤1.0%)的三聚氰胺。在國內應用高光譜定量檢測牛奶中成分含量報道較少。僅有張倩倩等建立模型對牛奶中蛋白質成分含量進行預測。本文利用高光譜成像技術,分別采用PLS法、二維相關技術結合N-PLS法,建立了牛奶中的脂肪含量預測模型,并分析了兩種預測模型在測量牛奶脂肪含量上的適用性。
實驗中所用牛奶為市面購買Vitamin D Milk(總脂肪質量濃度8 g/240 mL),Hiland牌2%R educed Fat M ilk(總脂肪質量濃度5 g/240 mL),1%Low Fat Milk(總脂肪質量濃度2.5 g/240 mL),Fat Free Skim Milk(總脂肪質量濃度0 g/240 mL)。實驗中所用脂肪含量梯度牛奶樣品均為上述牛奶混合配制,配制后每240 mL中總脂肪量分別為0,0.5,1,…,7.5,8 g共17個梯度。樣品配制后使用攪拌器攪拌20 min使牛奶中脂肪充分均勻,然后取樣,放置于直徑為70 mm的培養皿中,液面高度為8 mm,用于高光譜測試。表1為樣品質量濃度。

表1 牛奶脂肪質量濃度
實驗室采用美國堪薩斯州立大學高光譜儀,采集過程如圖1,成像系統的光譜范圍為400~1000 nm,光譜分辨率<4 nm,共有141個波段,空間分辨率CCD像元為8微米,圖像分辨率為1024像素×400像素。
采集數據前首先對高光譜成像系統進行黑白校正,為了使實驗結果更加精確,同一脂肪質量濃度測量3次。

圖1 數據采集過程
在高光譜圖像數據采集過程中,由于光源在不同波段下的光強不同以及相機中暗電流的作用對圖像帶來較大的噪音干擾,這些噪音信息會影響高光譜圖像數據的質量,因此在高光譜圖像數據采集之前必須要對系統進行黑白校正,以消除噪音信息的干擾[11-12]。首先,將相機鏡頭蓋上,得到全黑參考高光譜圖像,再將白板放置在電移動平臺,采集到全白參考高光譜圖像,根據公式(1)進行黑白校正。

式中,Ic為校正后高光譜圖像;Iraw為原始高光譜圖像;Idark為全黑參考高光譜圖像;Iwhite為全白參考高光譜圖像。
首先根據高光譜圖像選取感興趣區域,再提取感興趣區域的光譜值作為數據分析對象。圖2為牛奶樣品的單波長圖像,選取培養皿中心部分為分析區域,分析區域大小為60像素×60像素。提取分析區域內所有高光譜反射值,取每一個波段下3 600個像素點的平均值作為該波段的光譜值。即
并根據式(2)對光譜數據采用歸一化處理方法[13],

式中:IN為光譜歸一化值;Ii為各個波長下光譜反射值;m ax(I)為光譜反射最大值;min(I)為光譜反射最小值。

圖2 牛奶樣品高光譜圖像
圖3為牛奶樣品在401.95~965.54 nm內的光譜歸一化反射平均值光譜圖。圖3中,橫坐標為波長,縱坐標為光譜歸一化反射值。由圖3可以看出,牛奶樣品在652 nm、607 nm下產生較大的吸收峰,但不同脂肪含量的牛奶樣品的光譜圖僅有細微的差別,由于平均光譜圖中包含信息較少,區別小,樣品數量多,光譜數據量大,為了更好的探索牛奶中脂肪含量對光譜反射值的影響,還需要對光譜數據中所包含的有用信息進一步的探索。

圖3 牛奶樣品的平均光譜圖
實驗共有51個樣品,按照60%,40%的比例分為校正集和測試集,既校正集由34個樣品組成,測試集由17個樣品組成。將所有牛奶樣品的光譜值的二維矩陣作為輸入變量,建立PLS模型對牛奶中的脂肪質量濃度進行定量分析。
主成分數量的選擇對建立具有較高精度的模型十分關鍵,如果選擇主成分數過大,則容易將噪音信號也擬合進去,對模型過度擬合,反之,如果主成分數選擇過小,則對模型擬合不夠,主成分數過大或過小都會影響模型的擬合精度,削弱模型預測能力[14-15]。為了選擇最優主成分個數,首先對校正集采用交叉驗證方法,計算在不同主成分數下的校正均方根誤差REMSEC值(如圖4)。由圖4可知,當主成分數為3時RMSEC趨于平緩,因此選擇3個主成分建立PLS模型。

圖4 PLS模型中主成分數對RMSECV的影響
利用光譜歸一化反射平均值建立PLS模型,對校正集中的34個樣品進行預測,并將校正集中牛奶脂肪含量的實際值與預測值進行一元線性回歸,結果如圖5,回歸方程為y=0.9879x+0.4242,其相關系數R2為0.9851,RMSEC為0.3066。

圖5 PLS模型校正集樣品預測結果
為了對所牛奶脂肪含量預測模型精度進行評價,并檢驗預測模型是否具有通用性,將未參與校正集建模的17個測試集樣品帶入校正模型進行驗證計算,預測結果見表2,并對預測集中牛奶脂肪含量的預測值與實際值進行一元線性回歸,結果如圖6,回歸方程為y=1.022x-0.08541,相關系數R2為0.9913,預測均方根誤差RMSEP為0.2409。由圖可見,PLS模型建立的預測模型對牛奶中脂肪含量的預測具有較高的精度,能夠精確地預測牛奶中的脂肪含量。

圖6 PLS模型預測樣品預測結果
將牛奶脂肪含量為0的樣品分別與其余脂肪含量的牛奶樣品進行二維相關計算,將所有牛奶樣品二維相關計算后得到的三維矩陣作為輸入變量,建立N-PLS模型對牛奶中的脂肪含量進行定量預測,
經二維相關計算后共有48個牛奶樣品參與模型建立及測試,按照60%,40%的比例分為校正集和測試集,既校正集中有32個牛奶樣品,測試集中有16個牛奶樣品。N-PLS模型主成分數的選擇也同樣重要,主成分數對模型精度有較大的影響。首先對校正集采用交叉驗證法,計算在不同主成分數下的R EMSEC值(如圖7)。由圖7可以看出,當主成分數為8時RMSEC值趨于平緩,因此選擇8個主成分建立N-PLS模型。

圖7 PLS模型中主成分數對RMSECV的影響
利用光譜歸一化反射平均值建立N-PLS模型,對校正集的32個牛奶樣品中脂肪含量進行預測,并將牛奶脂肪含量的實際值與預測值進行一元線性回歸,結果如圖8所示,回歸方程為y=1.0031x-0.017,相關系數R2為0.9999。RMSEC為0.0255。

圖8 N-PLS模型校正集樣品預測結果
對所建立的牛奶脂肪含量預測模型進行評價,檢驗模型是否具有通用性,將沒有參與建模的16個測試集牛奶樣品帶入N-PLS預測模型進行驗證計算,預測結果見表2,對牛奶脂肪含量的預測值與實際值進行一元線性回歸,結果如圖9,回歸方程為y=1.026x-0.1199,相關系數 R2為 0.9976,RMSEP為0.1247。
表2為PLS模型與N-PLS模型對預測集中17個牛奶樣品中脂肪質量濃度的預測結果。在PLS模型當中,絕對誤差絕對值最大為0.39,絕對誤差最小為0.03。在N-PLS模型當中,絕對誤差絕對值最大為0.303,最小為0.01。通過表3-2能直觀的看到,N-PLS模型的預測能力略高于PLS模型,尤其是在對脂肪低含量值的預測,N-PLS模型高于PLS模型。

表2 PLS、N-PLS模型預測結果

圖9 N-PLS模型對預測集預測結果
本文在高光譜反射成像系統下,采集不同脂肪質量濃度牛奶樣品的高光譜圖像數據,根據高光譜圖像選取適當的分析區域,并提取分析區域內所有光譜數據取每個波段下的平均值,將光譜數據進行歸一化處理,并進行二維相關計算,建立PLS模型與N-PLS模型進行比較,其中PLS模型校正集R2為0.9851,RMSEC為 0.3066,預測集 R2為 0.9913,RMSEP為0.2409。N-PLS模型校正集R2為0.9999,RMSEC為0.0255,預測集R2為0.9976,RMSEP為0.1247。結果表明,高光譜成像技術可以應用于對牛奶中脂肪質量濃度的檢測,而且具有很高的預測精度,并且采用適當的模型可以進一步提高預測精度。二維相關計算與N-PLS方法相結合的模型預測精度優于傳統的PLS方法建立的模型,尤其是對脂肪質量濃度較低的牛奶樣品。
參考文獻:
[1]陽麗芝,陳志偉.牛奶中脂肪檢測技術研究進展[J].食品科學,2011(1):270-273.
[2]張華秀.近紅外光譜法快速檢測牛奶中蛋白質與脂肪含量[D].中南大學,2010.
[3]趙明富,施玉佳,羅彬彬,王念,曹李華,羅松.基于近紅外透射光譜的牛奶中脂肪和蛋白質含量檢測[J].激光雜志,2014(1):44-45,50.
[4]陽麗芝,陳志偉.牛奶中脂肪檢測技術研究進展[J].食品科學,2011,32(1):270-273.
[5]王晶,王加啟,卜登攀,等.近紅外光譜技術在牛奶及其制品品質檢測中的應用[J].光譜學與光譜分析,2009,29(5):1281-1285.
[6]韓東海,魯超,劉毅.純牛奶、還原奶、摻假奶、牛奶新鮮度的近紅外檢測[C]//中國乳制品工業協會第十一次年會,2005.
[7]李曉云,王加華,黃亞偉,等.便攜式近紅外儀檢測牛奶中脂肪、蛋白質及干物質含量.光譜學與光譜分析,2011,31(3):665-668.
[8]楊仁杰,劉蓉,楊延榮,等.用二維相關近紅外譜和多維主成分分析判別摻雜牛奶.光學精密工程,2014,22(9):2352-2358.
[9]FU X,KIM MS,CHAO K,et al.Detection of melamine in m ilk pow ders based on N IR hyperspectral imaging and spectral sim ilarity analyses[J].Journalof Food Engineering,2014,124(1):97-104.
[10]張倩倩,譚琨.2015.基于高光譜的牛奶中真蛋白質含量反演.光譜學與光譜分析,35(12):3436~3439.