潘 釗, 崔耀耀,2, 吳希軍* , 劉婷婷, 苑媛媛
(1. 燕山大學 測試計量技術及儀器河北省重點實驗室, 河北 秦皇島 066004;2. 燕山大學 信息科學與工程學院, 河北 秦皇島 066004)
“民以食為天,食以安為先”,食品安全始終是人們關注的熱點問題。植物油摻雜摻假現象普遍存在,嚴重損害了消費者的健康,然而由于植物油所含成分類似且比例相近,因此不易鑒別其真偽。
熒光光譜分析技術由于其靈敏度和準確度日益提高,是一種重要而有效的檢測分析手段。三維熒光光譜具有靈敏度高、選擇性好、信息含量豐富、不破壞物質結構等優點,是諸多專家學者在植物油檢測研究中的熱點選擇[1-2]。熒光光譜的解析和特征信息的有效提取始終是熒光分析中的難點與關鍵問題。近期有研究者將數字圖像處理技術中幾何圖像矩算法與光譜方法結合,用于對熒光物質的直接定量分析[3-6],這些方法無需預處理,直接提取目標分析物的重要特征,用于進一步的定性和定量分析,通過圖像矩的多分辨能力解決諸如重疊峰、噪聲和散射等干擾問題。
形狀是最直觀的圖像信息的表現方式,幾何矩中的Tchebichef矩對形狀信息的描述沒有冗余,并且沒有傳統幾何矩中的坐標空間轉化以及連續積分近似所帶來的誤差[7-8]。本文在沒有任何數據預處理的前提下,直接應用Tchebichef矩提取熒光光譜數據的特征,結合聚類分析算法實現了摻偽芝麻油的鑒別并通過逐步回歸建立了定量模型。實驗結果表明Tchebichef矩能夠有效地提取光譜的特征信息,驗證了該方法用于定性和定量分析的可行性。
從市場購得不同品牌、同品牌不同批次的芝麻油、玉米油、大豆油、菜籽油和芝麻香精,其中包括芝麻油樣本14個(Z1~Z14),大豆油樣本4個(D1~D4),玉米油樣本7個(Y1~Y7),菜籽油樣本1個(C1),芝麻香精樣本2個(J1,J2);在實驗室配置芝麻油摻偽樣本:菜籽油和芝麻香精按不同體積比配置混合樣本9個(JC1~JC9),樣本分布見表1。
采用FS920熒光光譜儀(英國Edinburgh Instruments公司)測量各植物油樣本的熒光光譜,激發波長范圍設置為250∶10∶550 nm,發射波長范圍設置為260∶2∶750 nm;激發和發射端狹縫寬度為1.11 mm,對應光譜分辨率為2 nm。

表1 植物油樣本
對表1中各樣本進行熒光光譜掃描,得到相應的熒光光譜數據,樣本JC5的三維熒光光譜圖和等高線圖如圖1所示。熒光光譜中熒光強度記為n×m維的矩陣(n對應發射波長,m對應激發波長),將矩陣中的熒光強度值映射到[0, 255]灰度范圍內,則熒光強度矩陣可以被視為“灰度圖像”。如圖2所示,該圖像可以完全地表示三維熒光光譜中的強度。

圖1 JC5的三維熒光光譜圖(a)和等高線圖(b)

圖2 JC5的灰度圖
2.3.1 Tchebichef矩
對于大小N×N像素的圖像,用f(x,y)表示圖像坐標(x,y)處的灰度值,則該圖像的p+q階Tchebichef矩定義為:
p,q=0,1,…,N-1,
(1)
其中,tp,N(x)為n階Tchebichef多項式,定義為:
tp,N(x)=
而ρ(n,N)是歸一化系數,定義為:
(3)
Tchebichef矩是一種以離散的正交多項式為基函數的正交矩,因而在圖像信息的表征上沒有信息冗余[7-8]。考慮到矩的計算復雜度以及對圖像描述能力的完整性,本文初步選擇前11+11階(p+q階)Tchebichef矩(共121個矩特征)提取樣本特征,用于對樣本的定性和定量分析。
2.3.2 聚類分析
為最大化類間對象的異質性和類內對象的同質性,聚類分析把對象集合進行分組,使同一類中的個體之間相似性強于該個體與其他類對象的相似性[9-10],樣品間的距離采用歐氏距離,利用類平均法計算聚類樹形圖。
設樣品X1,X2,…,Xn為總體樣本,記第i個樣品Xi=(xi1,xi2,…,xip)(i=1,2,…,n),其中第i個樣品Xi和第j個樣品Xj之間的歐式距離定義為:
(4)
類與類之間的平均距離定義為樣品對之間的平方距離的平均值。XK和XL之間的平方距離定義為:
(5)
2.3.3 逐步回歸
從低階到高階的圖像矩描述了圖像的整體形狀,其中包括目標化合物、噪聲和不相關分量的完整信息[2]。建立線性模型時,如果把所有特征全部考慮進去,會引入噪聲和不相關分量等無意義的矩特征,從而影響定量的精度。因此,為了建立一個最優的回歸方程,本文選用逐步回歸作為對矩特征的優選方法。逐步回歸根據自變量(Tchebichef矩)對因變量(相對體積)的影響大小,將對因變量影響顯著的自變量引入方程,并剔除影響不顯著的自變量,最終得到最優回歸方程。
離散正交矩可以有效地提取不同層次上灰度圖像的信息,不同階的矩或其組合可以描述圖像中不同的信息[6](如目標化合物、噪聲、不相關分量等信息),因此選擇特定階的矩或其組合就可以實現對樣本的定性和定量分析,并且可以去除重疊峰、噪聲和散射等干擾問題。
鑒別樣本是否為摻偽芝麻油,首先應觀察樣本是否和純芝麻油屬于一類。利用類平均法對純芝麻油樣本(Z1~Z15)、芝麻香精樣本(J1、J2)與摻偽樣本(JC1~JC9)進行聚類,得到如圖3的聚類樹形圖,其中橫坐標表示樣本間的歐式距離,縱坐標表示樣本。當選取前1+2階Tchebichef矩作為樣本的特征信息組合時,即可完全區分摻偽樣本。由圖3可知,在歐式距離L=1.68以上水平被分為2類,純芝麻油樣本(Z1~Z14)被分為一類,芝麻香精樣本(J1、J2)與摻偽樣本(JC1~JC9)被分為一類。通過以上分類結果可知,部分Tchebichef矩特征即可有效區分摻偽樣本,且能確定摻偽樣本中含有芝麻香精成分。
摻偽樣本被正確區分之后,仍需對其所含的成分進行鑒別,以便對其進行定量分析。由大豆油樣本(D1~D4)、玉米油樣本(Y1~Y7)、菜籽油樣本(C1)構造樣本庫。并把摻偽樣本(JC1~JC9)與樣本庫進行聚類,選擇1+2階Tchebichef矩可得如圖4所示的聚類樹形圖。由圖4可知,在歐式距離L=2.13以上即可將菜籽油樣本(C1)與摻偽樣本(JC1~JC9)分為一類,而大豆油樣本(D1~D4)和玉米油樣本(Y1~Y7)在L=1.49以上也被完全區分,從而可知摻偽樣本含有菜籽油。因此少數Tchebichef矩特征即可鑒別摻偽樣本的成分。

圖3 摻偽芝麻油樣本聚類樹形圖

圖4 摻偽芝麻油成分聚類樹形圖
Fig.4 Dendrogram of doping sesame oil’s ingredients
應用摻偽樣本(JC1~JC9)、菜籽油樣本(C1)、芝麻香精樣本(J1)建立定量線性模型。對樣本的121個Tchebichef矩特征向量{T1,1,T1,2,…,T11,11} 進行逐步回歸,相關系數最高的項T9,9首先進入方程,其次T11,6和T5,10進入方程,當回歸方程中有3個變量時,逐步回歸方程線性相關度最高(R=0.999),剔除剩余變量,相應的回歸方程如下,其中A是摻偽樣本中一種目標化合物的相對體積,T的下標表示階數(p,q):
(1)芝麻香精模型:
AJ=4.1159-18.681T5,10-58.76T9,9-113.24T11,6, RMSE:0.125,R: 0.999,R-Adj=0.999,F-Ktest value=2.34e+03,p-Kvalue=7.21e-11。
(2)菜籽油模型:
AC=5.8841+18.681T5,10+58.76T9,9+113.24T11,6, RMSE: 0.125,R: 0.999,R-Adj= 0.999,F-Ktest value=2.34e+03,p-Kvalue=7.21e-11。
其中對回歸曲線檢驗的P值(p-Kvalue=7.21e-11)均小于0.05,說明相對體積A和Tchebichef矩的線性關系是顯著的,模型擬合圖如圖5所示。

圖5 逐步回歸結果
本文利用圖像處理技術中Tchebichef矩結合聚類分析和逐步回歸建立了對摻偽芝麻油快速、準確的定量和定性分析方法。未作數據預處理,直接用Tchebichef矩提取三維光譜數據的特征,在此基礎上通過聚類分析和逐步回歸實現對摻偽芝麻油的鑒別,并準確解析其組成成分及含量。實驗結果表明該方法能夠有效提取光譜的特征,并能夠得到良好的定性和定量結果,為質監部門及生產企業提供了新的油品鑒別手段。在此基礎上,未來的研究會朝著增加樣本數量以進一步完善光譜數據庫的方向進行,并分析討論該算法對不同油種之間的適用性,以進一步提高檢測的效率和實用性。
參考文獻:
[1] 吳希軍, 潘釗, 趙彥鵬, 等. 熒光光譜及平行因子分析法在植物油鑒別中的應用 [J]. 光譜學與光譜分析, 2014, 34(8):2137-2142.
WU X J, PAN Z, ZHAO Y P,etal.. Application of fluorescence spectroscopy and parallel factor analysis in the identification of vegetable oils [J].Spectrosc.Spect.Anal., 2014, 34(8):2137-2142. (in Chinese)
[2] 吳希軍, 田瑞玲, 孫夢菲, 等. 基于熒光光譜及矩陣分析的植物油鑒別技術 [J]. 光譜學與光譜分析, 2016, 36(7):2155-2161.
WU X J, TIAN R L, SUI M F,etal.. Identification technology of vegetable oil based on fluorescence spectroscopy and matrix analysis [J].Spectrosc.Spect.Anal., 2016, 36(7):2155-2161. (in Chinese)
[3] ZHAI H L, ZHAI Y Y, LI P Z,etal.. A simple approach to quantitative analysis using three-dimensional spectra based on selected Zernike moments [J].Analyst, 2012, 138(2):683-687.
[4] JING C, BAO Q L, HONG L Z,etal.. A practical application of wavelet moment method on the quantitative analysis of Shuanghuanglian, oral liquid based on three-dimensional fingerprint spectra [J].J.Chromat. A, 2014, 1352:55-61.
[5] CHEN J, LI B Q, XU M L,etal.. Krawtchouk image moment method for the simultaneous determination of three drugs in human plasma based on fluorescence three-dimensional spectra [J].Talanta, 2016, 161:99-104.
[6] LI B Q, CHEN J, XU M L,etal.. The determination of multi-components utilizing 1 H NMR three-dimensional spectra combined Tchebichef moments [J].Chemomet.Intell.Lab.Syst., 2016, 156:128-136.
[7] MUKUNDAN R, ONG S H, LEE P A. Image analysis by Tchebichef moments [J].IEEETrans.ImageProc., 2001, 10(9):1357-1364.
[8] 張輝, 周健, TOUMOULIN C, 等. Tchebichef矩的快速算法 [J]. 東南大學學報(自然科學版), 2006, 36(5):857-862.
ZHANG H, ZHOU J, TOUMOULIN C,etal.. Fast algorithm for Tchebichef moments [J].J.SoutheastUniv.(Nat.Sci.Ed.), 2006, 36(5):857-862. (in Chinese)
[9] 梁曼, 黃富榮, 何學佳, 等. 熒光光譜成像技術結合聚類分析及主成分分析的藻類鑒別研究 [J]. 光譜學與光譜分析, 2014, 34(8):2132-2136.
LIANG M, HUANG F R, HE X J,etal.. Identification of algae by fluorescence spectroscopy combined with cluster analysis and principal component analysis [J].Spectrosc.Spect.Anal., 2014, 34(8):2132-2136. (in Chinese)
[10] 劉丙新, 李穎, 韓亮, 等. 基于光譜反射率數據的水面油種鑒別研究 [J]. 光譜學與光譜分析, 2016, 36(4):1100-1103.
LIU BI X, LI Y, HAN L,etal.. Identification of surface oil based on spectral reflectance data [J].Spectrosc.Spect.Anal., 2016, 36(4):1100-1103. (in Chinese)

潘釗(1982-),男,河北石家莊人,博士,副教授,2012年于燕山大學獲得博士學位,主要從事熒光檢測技術、光電檢測技術和光譜分析方面的研究。

E-mail: panzh_zach@hotmail.com吳希軍(1979-),男,河北邯鄲人,博士,副教授,2010年于燕山大學獲得博士學位,主要從事光纖傳感與光譜測試系統設計等方面的研究。
E-mail: wuxijun@ysu.edu.cn