吳 雙 王 杰 俞雅茹 涂 斌 鄭 曉 何東平
(武漢輕工大學機械工程學院1,武漢 430000) (武漢輕工大學食品科學與工程學院2,武漢 430000)
基于拉曼和近紅外光譜特征層融合的食用油MUFA和PUFA含量檢測
吳 雙1王 杰1俞雅茹1涂 斌1鄭 曉1何東平2
(武漢輕工大學機械工程學院1,武漢 430000) (武漢輕工大學食品科學與工程學院2,武漢 430000)
針對食用油中單不飽和脂肪酸(MUFA)和多不飽和脂肪酸(PUFA)含量的快速檢測問題,研究探索應用拉曼(Raman)和近紅外(NIR)光譜以及特征層數據的融合,結合化學計量學分析,建立食用油MUFA和PUFA含量預測模型。重點研究各種預處理算法對模型預測能力的影響。應用競爭性自適應重加權采樣(CARS)提取Raman和NIR光譜的特征波長,應用網格搜索(GS)算法選取支持向量機回歸(SVR)模型的參數組合(C,g)值,分別建立基于拉曼和近紅外光譜的特征波段的SVR預測模型;建立基于特征層的多源光譜融合的SVR預測模型。試驗表明,基于特征層融合建立的Raman-NIR-SVR模型能夠實現食用油MUFA和PUFA含量的快速預測,且預測效果更優。其中預測MUFA含量的SG15-ALS-Nor-CARS-MSC-CARS-SVR模型的預測集決定系數R2為0.977 3,與單光譜中最優含量預測模型相比增加了2.43%;而預測PUFA含量的MA11-airPLS-Nor-CARS-MSC-CARS-SVR模型的預測集R2為0.993 0,比較最優單光譜數據建立的SVR模型增加了2.57%。結果表明,采用特征層融合方法建立的含量預測模型的綜合性能優于基于單光譜數據建立的模型。
單不飽和脂肪酸 多不飽和脂肪酸 特征層融合 支持向量機回歸
食用油不僅可以提高食品的感官性質,增強飽腹能力,而且提供人體所需的植物淄醇、不飽和脂肪酸、谷維素等營養物質,對身體健康和保健作用越來越大[1]。食用油中包含單不飽和脂肪酸(Monounsaturated Fatty Acid,MUFA)和多不飽和脂肪酸(Polyunsaturated Fatty Acid,PUFA),MUFA具有保護心臟、降低血糖和膽固醇、調節血脂、防止記憶下降等功能[2],PUFA不僅有MUFA的功能,還具有通過排除體內多余脂肪實現減肥的作用[3]。然而,一些不法人員為謀取暴利,使用變質原料加工食用油或將劣質油或低價值油摻入高價值油中,使食用油中的不飽和脂肪酸含量減少,損害消費者權益,影響人的身體健康。
現有的檢測食用油PUFA和MUFA含量的方法是采用色譜和質譜等方法,此方法需要借助昂貴的儀器及嚴格的實驗條件,遠不能滿足現場快速準確檢測的要求。因此,探索一種能快速、靈敏度高的動態分析檢測食用油的技術對提高油脂企業品質監管,保障食用油市場和消費者權益等方面具有重要意義[4]。近年來,拉曼(Raman)光譜和近紅外(NIR)光譜技術用于食用油品質檢測成為國內外研究的熱點。這是由于光譜技術是一種快速、簡便、無損分析技術,并且具有測量時間短,不需要對待測樣本預處理,易于實現在線分析,已經被廣泛應用于醫藥、食品、煙草、農業和石化等領域[5-6]。Raman光譜的特征峰的位置和強度能夠直觀的反映待測樣品的化學基團、結構及其變化信息[7],而NIR技術主要基于光譜波段范圍與含氫基團(O—H、N—H、C—H)振動的合頻、倍頻的吸收區一致,故其光譜反映待測樣品的有機分子O—H、N—H、C—H等基團的特征信息[8]。既然2種光譜都能反映待測樣品的信息,那么將2種光譜融合來提高定性定量分析的準確性成為了研究的新方向。
本試驗重點研究了特征層數據融合技術對含量預測模型的作用。數據融合技術是對來自多個信息源的數據進行自動檢測、估計、相關及組合等處理,一個多層面、多級的數據處理過程,產生新的有意義的信息,對目標識別是一種新的方法,目前數據融合技術已經被應用在自動目標識別、機器人、醫療、石化、食品和水質檢測等領域[9-10]。本研究基于近紅外、拉曼及兩者融合的光譜結合化學計量法建立了食用油MUFA和PUFA含量預測的SVR模型。通過比較單光譜和融合光譜對模型預測能力的影響,為準確建立MUFA和PUFA含量預測的回歸模型提供可靠依據。
1.1 脂肪酸含量檢測樣本
按照GB/T 17377—2008,采用Angilent 7890-5975 GC-MS型氣相色譜儀對大豆油、菜籽油、茶籽油、花生油等55個正常食用油的脂肪酸含量進行氣相色譜測定,所得到的脂肪酸含量為總脂肪酸的質量百分數。采用SPXY(Sample set Portioning based on joint x-y distances)算法按3:1的比例選取油脂肪酸成分含量預測模型的校正集和預測集樣品。脂肪酸含量統計如表1所示。

表1 脂肪酸含量統計
1.2 設備及儀器
選用RamTraceer-200激光拉曼光譜儀(歐普圖斯,中國)采集拉曼光譜數據,其參數為:激光波長為785 nm,分辨率≤8 cm-1,光譜采集波數范圍250~2 340 cm-1,最大激光功率為320 mW,積分時間參數設置為5 s,激光功率為220 mW。同時選用實驗室自主研發的激光近紅外光譜儀(AXSUN,USA)采集近紅外光譜數據。其主機為Axsun XL410,光譜測定范圍為1 350~1 800 nm,掃描次數32次,分辨率為3.5 cm-1,波長重復性為0.01 nm,信噪比(250 ms,RMS)>5 500:1。
1.3 拉曼和近紅外光譜采集
每個樣品裝樣3次,采集3次穩定的譜圖后取其平均圖譜作為最終圖譜,室溫下測定。采集樣品的拉曼原始光譜,選取信噪比較高的780~1 800 cm-1示于圖1。圖2為采集樣品的近紅外原始圖。

圖1 拉曼原始光譜

圖2 近紅外原始光譜
1.4 光譜數據預處理和基線校正
拉曼光譜采用移動平均11點平滑法(MA11)和Savitzky-Golay[11]濾波15點平滑法(SG15)消除光譜噪聲,自適應迭代重加權懲罰最小二乘(airPLS)和非對稱最小二乘法(ALS)算法進行基線校正,以1 454 cm-1附近的特征峰強度為基準進行歸一化(Nor)處理。圖3是經SG15-ALS-Nor預處理的拉曼光譜。airPLS[12]是懲罰最小二乘法結合自適應迭代加權而得到的一種易于實現拉曼光譜背景扣除的算法,對拉曼光譜進行基線校正時,只需要設置影響背景平滑程度的參數λ,試驗中設置參數λ=105。而ALS則是Boelens等[13]提出的懲罰最小二乘法結合非對稱加權而得到的一種易于實現拉曼光譜背景扣除的算法,對拉曼光譜進行基線校正時需要設置平滑(smoothness)和非對稱加權(asymmetry)參數組合(smo,asy),試驗中設置參數smo=106,asy=10-2。

圖3 經過SG15-ALS-Nor預處理拉曼光譜
近紅外光譜采用的預處理方法有:多元散射校正(MSC)、標準正態變量變換(SNV)、標準正態變量變換和去趨勢技術聯用算法(SNV_DT)。圖4是經過SNV_DT預處理的近紅外光譜。

圖4 經過SNV_DT預處理近紅外光譜
1.5 光譜特征波長提取
競爭性自適應重加權采樣方法(CARS)[14]是采用偏最小二乘(PLS)交叉驗證建模,結合蒙特卡羅(MC)采樣技術,根據PLS模型的交互檢驗均方差(RMSECV)值選擇波長變量子集,RMSECV值最小時選取對應的變量區間作為建模的特征變量。試驗中MC采樣次數設為100,根據PLS模型的10折交互檢驗均方差值選擇波長變量子集。
將預處理(MA11-ALS-Nor、MA11-airPLS-Nor、SG15-ALS-Nor、SG15-airPLS-Nor)的拉曼和預處理(SNV、MSC、DT、SNV_DT)的近紅外光譜應用CARS提取特征變量,將提取后特征波段光譜分別應用于拉曼和近紅外光譜、多源光譜特征層融合SVR模型的建立。
1.6 建模方法、參數優化方法及模型評價指標
支持向量機(SVM)在解決小樣品、非線性及高維模式識別中表現出許多特有的優勢,成為克服“維數災難”和“過學習”等困難的強有力手段[15]。SVM
方法可細分為支持向量機分類(SVC)和支持向量機回歸(SVR)2種方法[16]。而本試驗選用支持向量機回歸法建立食用油MUFA和PUFA含量的快速預測模型。SVR方法需要設置懲罰因子C和RBF核函數的參數g的輸入值,不同的參數組合(C,g)值對SVR模型的檢測效果存在較大差異,人為地設置參數,很難確定最佳參數組合,因此本實驗采用GS法優化食用油MUFA和PUFA檢測模型的參數組合(C,g),建立預測能力較強的SVR模型[17]。試驗中以校正集和預測集的決定系數R2和均方誤差(MSE)作為模型的評價標準。
2.1 食用油MUFA含量預測的SVR模型
2.1.1 食用油MUFA含量預測的拉曼、近紅外SVR模型
采用4種不同預處理的拉曼光譜經CARS提取的特征變量作為SVR模型的輸入量,選用RBF核函數,采用GS算法對組合參數(C,g)進行尋優,建立特征波段含量預測SVR模型。同理,建立基于4種不同預處理的近紅外光譜的CARS-SVR模型。表2為拉曼、近紅外光譜結合SVR建模得到的MUFA含量預測結果和模型參數。
從表2中可以看出,拉曼、近紅外光譜結合化學計量學方法建立的SVR模型都能夠實現食用油MUFA含量的快速預測。采用DT預處理方法的近紅外光譜建立的CARS-SVR模型對預測集樣品預測效果最好,預測集決定系數R2和均方誤差(MSE)為0.953 0、1.29E-3,校正集和預測集的MSE相差較小,預測能力強。基于拉曼光譜建立的CARS-SVR模型的校正集決定系數R2較近紅外有一定程度的增加,但是前3個模型的預測集R2最高才0.852 7,遠低于NIR-SVR模型,采用預處理方法(SG15-airPLS-Nor)建立的Raman-CARS-SVR模型的預測集R2提升到0.932 0,但校正集和預測集的MSE相差較大,模型預測效果較之NIR-DT-CARS-SVR差。圖5為近紅外光譜的食用油MUFA的DT-CARS-SVR模型對預測集樣品的預測結果圖。

表2 拉曼、近紅外光譜結合SVR建模得到的MUFA含量預測結果

圖5 DT-CARS-SVR對預測集樣品的預測結果
2.1.2 特征層多源光譜數據融合食用油MUFA含量預測SVR模型
將經過特征波長提取方法優選的拉曼和近紅外光譜數據同時作為SVR模型的輸入變量,建立特征層多源光譜數據融合的MUFA含量快速預測Raman-NIR-SVC模型;建立的特征層融合SVR模型預測結果和模型參數見表3。
從表3中可以看出,基于特征層融合建立的Raman-NIR-SVR模型能夠實現食用油MUFA含量的快速預測。經過特征波長提取的拉曼和近紅外2種光譜數據融合建立的Raman-NIR-SVR模型預測集決定系數R2均在0.943 4以上,最高達到0.977 3,模型預測能力強,其中SG15-ALS-Nor-CARS-MSC-CARS-SVR模型的校正集和預測集的R2為0.996 8和0.977 3。與單光譜中最優的NIR-DT-CARS-SVR模型比較,使用特征層融合的SG15-
ALS-Nor-CARS-MSC-CARS-SVR模型的預測集和校正集的R2分別增加了5.63%、2.43%。結果表明使用特征層融合建立的MUFA含量的快速預測的SVR模型的預測效果要好于單獨使用Raman和NIR光譜建立的SVR預測模型,說明Raman和NIR 2種光譜具有互補效果。圖6為拉曼和近紅外光譜的特征層融合的食用油MUFA的SG15-ALS-Nor-CARS-MSC-CARS-SVR模型對預測集樣品的預測結果圖。

圖6 SG15-ALS-Nor-CARS-MSC-CARS-SVR模型對預測集樣品的預測結果
2.2 食用油PUFA含量預測SVR模型
2.2.1 食用油PUFA含量預測拉曼、近紅外光譜SVR模型
將拉曼光譜經過預處理及CARS特征波長提取后得到的光譜數據作為SVR模型的輸入變量;近紅外光譜則經過預處理后進行CARS特征波長提取,得到的光譜數據作為SVR模型的輸入變量,然后分別建立PUFA含量預測SVR模型。基于拉曼、近紅外光譜數據建立的含量預測SVR模型預測結果和模型參數見表4。

表3 基于特征層多源光譜融合的Raman-NIR-SVR模型MUFA預測結果

表4 拉曼、近紅外光譜結合SVR建模得到的PUFA含量預測結果

表5 基于特征層多源光譜融合的Raman-NIR-SVR模型PUFA預測結果
從表4中可以看出,拉曼、近紅外光譜結合化學計量學方法建立的SVR模型能夠實現PUFA含量的快速預測。就Raman-SVR模型而言,經過SG15-airPLS-Nor-CARS處理的光譜數據建立的模型對預測集樣品預測效果最好,預測集決定系數R2為0.941 3。而對于NIR-SVR模型,采用SNV_DT-CARS處理的光譜建立的模型的預測效果最好,預測集決定系數R2和均方誤差(MSE)為0.967 3、7.88E-4,預測能力強,實際應用價值大。對比2種單光譜建立的CARS-SVR模型,NIR-SNV_DT-CARS-SVR模型的含量預測的綜合性能最好。圖7為近紅外光譜的PUFA的SNV_DT-SVR模型對預測集樣品的預測結果圖。

圖7 SNV_DT-SVR模型對預測集樣品的預測結果
2.2.2 特征層多源光譜數據融合食用油PUFA含量預測SVR模型
將經過特征波長提取方法優選的拉曼和近紅外光譜數據同時作為SVR模型的輸入變量,建立特征層融合的食用油PUFA含量快速預測Raman-NIR-SVR模型。建立PUFA含量的特征層融合SVR模型預測結果和模型參數見表5。
從表5中可以看出,基于多源光譜的特征層融合建立的Raman-NIR-SVR模型能夠實現食用油PUFA含量的快速預測。經過特征波長提取的激光拉曼和近紅外兩種光譜數據融合建立的Raman-NIR-SVR模型校正集和預測集決定系數R2均在0.983 9以上,且校正集和預測集的均方誤差(MSE)相差較小,模型預測能力和穩定性強,其中MA11-airPLS-Nor-CARS-MSC-CARS-SVR模型的校正集和預測集決定系數R2為0.995 8和0.993 0。比較最優單光譜數據建立的NIR-SNV_DT-CARS-SVR模型,校正集和預測集決定系數R2分別增加了4.59%、2.57%,預測效果更好。結果表明使用特征層多源光譜數據融合建立的PUFA含量預測模型的預測效果優于單獨使用拉曼光譜和近紅外光譜建立的模型。圖8為拉曼和近紅外光譜的數據層融合的PUFA的MA11-airPLS-Nor-CARS-MSC-CARS-SVR模型對預測集樣品的預測結果圖。

圖8 MA11-airPLS-Nor-CARS-MSC-CARS-SVR模型對預測集樣品的預測結果
應用光譜數據融合技術,在特征層建立融合拉曼和近紅外光譜的食用油MUFA和PUFA含量的快速預測模型,實現了基于多源光譜特征層數據融合的食用油MUFA和PUFA含量的快速預測。研究表明,近紅外、拉曼光譜法結合SVR建立的NIR-SVR模型能夠實現食用油MUFA、PUFA含量的快速預測。使用特征層多源光譜數據融合建立的食用油MUFA、PUFA含量預測模型的預測效果優于單獨使用拉曼光譜和近紅外光譜建立的含量預測模型。結果表明,本研究提出的技術路線能夠實現食用油MUFA和PUFA含量的快速預測,而基于特征層融合建立的定量回歸模型提高了預測的準確性,為其他食用植物油品質在快速檢測的問題上提供借鑒。
[1]楊帆,薛長勇.常用食用油的營養特點和作用研究進展[J].中國食物與營養,2013,19(6):63-66
Yang F,Xue CY.Research Advancement of Nutritional Characteristics and Functions of Common Edible Oils[J].Food and Nutrition in China.2013,19(6):63-66
[2]張偉敏,鐘耕,王煒.單不飽和脂肪酸營養及其生理功能研究概況[J].糧食與油脂,2005(3):13-15
Zhang WM,Zhong G,Wang W.Study Survey of Nutrition and Biological Function of MUFA[J].Cereals and Oils.2005(3):13-15
[3]王萍,張銀波,江木蘭.多不飽和脂肪酸的研究進展[J].中國油脂.2008,33(12):42-46
Wang P,Zhang YB,Jiang ML.Research advance in polyunsaturated fatty acid[J].China Oils and Fats,2008,33(12):42-46
[4]薛雅琳,王雪蓮,張蕊,等.食用植物油摻偽鑒別快速檢驗方法研究[J].中國糧油學報,2010,25(10):116-118
Xue YL,Wang XL,Zhang R,et al.An Authentication Method of Edible Vegetable Oils[J].Chinese Cereals and Oils Association,2010,25(10):116-118
[5]褚小立,許育鵬,陸婉珍.用于近紅外光譜分析的化學計量學方法研究與應用進展[J].分析化學,2008,36(5):702-709
Chu XL,Xu YP,Lu WZ.Research and Application Progress of Chemometrics Methods in Near Infrared Spectroscopic Analysis[J].Chinese J.Anal.Chem.,2008,36(5):702-709
[6]鄧之銀,張冰,董偉,等.拉曼光譜和 MLS-SVR的食用油脂肪酸含量預測研究[J].光譜學與光譜分析,2013,33(11):2997-3001
Deng ZY,Zhang B,Dong W,et al.Research on Prediction Method of Fatty Acid Content in Edible Oil Based on Raman Spectroscopy and Multi-Output Least Squares Support Vector Regression Machine[J].Spectroscopy and Spectral Analysis,2013,33(11):2997-3001
[7]FAN Ya,LI Shuang,XU Da-peng.Raman Spectra of Oleic Acid and Linoleic Acid[J].Spectroscopy and Spectral Analysis,2013,33(13):3240-3243
[8]陸婉珍,袁洪福,徐廣通.現代近紅外光譜分析技術[D].北京:中國石化出版社,2000
Lu WZ,Yuan HF,Xu GG.Modern near infrared spectral analysis technology[D].Beijing:Sinopec press,2000
[9]滕召勝,郁文賢.基于數據融合的智能水分快速測定儀[J].電工技術學報,1999,14(5):71-73,80
Teng ZS,Yu WX.An Intelligent Instrument of Quick Measuring Moisture Content Based on Data Fusion[J].Transactions of China Electrotechnical Society,1999,14(5):71-73,80
[10]穆海洋,李艷君,單戰虎,等.便攜式多源光譜融合水質分析儀的研制[J].光譜學與光譜分析,2010,30(9):2586-2590
Mu HY,Li YJ,Dan ZH,et al.Development of a Multi-Spectra Based Portable Water Quality Analyzer[J].Spectroscopy and Spectral Analysis,2010,30(9):2586-2590
[11]謝軍,潘濤,陳潔梅,等.血糖近紅外光譜分析的Savitzky-Golay平滑模式與偏最小二乘法因子數的聯合優選[J].分析化學,2010,38(3):342-346
Xie J,Pan T,Chen JM,et al.Joint Optimization of Savitzky-Golay Smoothing Models and Partial Least Squares Factors for Near-infrared Spectroscopic Analysis of Serum Glucose[J].Chinese J.Anal.Chem.,2010,38(3):342-346
[12]Zhang Z M,Chen S,Liang Y Z.Baseline correction using adaptive iteratively reweighted penalized least squares[J].Analyst,2010,135(5):1138-1146
[13]H.E.M.Boelens,R.J.Dijkstra,P.H.C Eilers,et a1.New background correction method for liquid chromatography with diode array detection,infrared spectroscopic detection and Raman spectroscopic detection[J].Journal of Chromatography A,2004,1057(1-2):21-30
[14]Li H D,Liang Y Z,Xu Q S,et al.Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J].Analytical Chimica Acta,2009,648(1):77-84
[15]Vapnik,Vladimir Naumovich.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1999
[16]涂斌,宋志強,鄭曉,等.基于激光近紅外的稻米油摻偽定性-定量分析[J].光譜學與光譜分析,2015,35(6):1539-1545
Tu B,Song ZQ,Zhang X,et a1.Qualitative-Quantitative Analysis of Rice Bran Oil Adulteration Based on Laser Near Inf rared Spectroscopy[J].Spectroscopy and Spectral Analysis,2015,35(6):1539-1545
[17]Shen Xiong,Zheng Xiao,Song Zhiqiang,et al.Rapid Identification of Waste Cooking Oil with Near Infrared Spectroscopy Based on Support Vector Machine.In:Li D,Chen Y(eds)Computer and computing technologies in agriculture VI,Berlin:Springer,2013,392(1):11-18.
Content Detection of MUFA and PUFA Integrated Based on Characteristic Fusion of Raman and Near Infrared Spectrum
Wu Shuang1Wang Jie1Yu Yaru1Tu Bin1Zheng Xiao1He Dongping2
(School of Mechanical Engineering,Wuhan Polytechnic University1,Wuhan 430000) (College of Food Science and Engineering,Wuhan Polytechnic University2,Wuhan 430000)
It was explored in this paper that characteristic fusion of Raman-NIR was combined with Chemometrics to establish monounsaturated fatty acid(MUFA)and polyunsaturated fatty acids(PUFA)content prediction model to solve the problem of their content rapid prediction.It focused on what effects various pretreatment algorithms had on prediction model.Competitive adaptive reweighted sampling(CARS)was used to extract the characteristic wavelength of Raman and NIR spectra,grid search(GS)algorithm to select the parameter combination(C,g).The author established SVR model based on characteristic wavelength of Raman and NIR spectra respectively,and based on characteristic fusion did SVR model.The experiment showed that based on feature fusion of Raman-NIR the SVR model was better to realize fast prediction.For MUFA content,prediction set determination coefficientR2of SG15-ALS-Nor-CARS-MSC-CARS-SVR model was 0.977 3,compared with the optimal prediction model of the single spectra,which increased by 2.43%;and for MUFA,MA11-airPLS-Nor-CARS-MSC-CARS-SVR modelR2was 0.995 8,comparing the optimal single spectra SVR model increased by 2.57%.Result showed that comprehensive performance of the prediction model established by feature fusion method was better than the model based on single spectral data.
monounsaturated fatty acid,polyunsaturated fatty acids,characteristic fusion,support vector machine
TS225.1
A
1003-0174(2017)11-0158-07
2016湖北省糧食科技創新與成果轉化(20165104),武漢市科技攻關計劃(2013010501010147),武漢工業學院食品營養與安全重大項目培育專項(2011Z06),武漢輕工大學研究生創新(2014CX005)
2016-10-24
吳雙,女,1989年出生,碩士,利用光譜技術檢測食用油的成分
鄭曉,男,1958年出生,教授,利用光譜技術檢測食用油的成分