鐘方平,李張赟,韋尚鋒,胡佳欣,王永波
貴州大學林學院(貴陽 550025)
核桃仁中含有較多的蛋白質和人體必需的不飽和脂肪酸,對人體具有重要的營養、藥用和保健價值,是一種老幼皆宜的堅果食品[1]。由核桃仁精制而成的核桃粉被越來越多地應用于蛋白飲料行業,滿足消費者的新需求[2]。核桃粉與花生粉或葵花籽粉比較相似,直觀上很難辨別,且兩者的價格相差較大,一些不法商販為謀取暴利制造偽劣食品,導致市場上售賣的核桃粉摻假摻雜現象與日俱增,嚴重侵害消費者權益。食品質量安全問題日益突出,食品摻雜摻假、添加劑濫用、微生物超標等問題不斷曝光,促使人們對食品質量要求越來越高[3-5]。為此,建立快速鑒別摻雜核桃粉有一定現實意義。中紅外光譜(mid-infrared spectroscopy,MIR)是物質在中紅外區的吸收光譜,它可將物質分子基團的振動和轉動信息轉化為可視化的波數、峰高和峰性[6]。利用中紅外光譜的定性和定量分析技術在各個領域得到較為廣泛的推廣和應用。孫燕等[7]利用中紅外圖譜分析儀并結合化學計量學,判別饒河當地的蜂蜜樣品和其他地區蜂蜜樣品,準確率為90.3%;徐一茹等[8]利用近紅外光譜和中紅外光譜法建立的基于偏最小二乘法的校正模型,實現對小麥粉中的灰分、水分、面筋品質指標的檢測分析;趙琦等[9]闡述了中紅外光譜在食用油、肉食品、糖類食品等的摻假檢測中的應用。與傳統的理化分析方法存在耗時長、不環保、花費高等缺點相比,中紅外光譜法具有檢測速度快、樣品用量少、經濟環保等優點。鑒于此,試驗分析核桃粉摻雜花生粉和葵花籽粉的紅外光譜信息,并評價PLS-DA和SIMCA這2種分類器用于核桃粉摻雜的模型鑒別效果。
核桃(貴州赫章)、花生及葵花籽干果樣本均采自貴州本地市場。用物理冷軋法除去材料油脂后,用粉碎機粉碎,過0.075 0 mm(200目)孔徑篩,得到自制的脫脂核桃粉、花生粉和葵花籽粉。將制作好的樣本烘干后,用自封袋進行分裝,放入干燥器待用。
KBr(光譜純,Macklin)。
壓片機(配有壓片磨具,DF-4B,天津港東科技);傅里葉變換紅外光譜儀(美國PerkinElmer);電子分析天平(JF2004,余姚市金諾天平儀器有限公司)。
用Spectrum 10進行光譜預處理;用The Unscrambler X進行光譜預處理和建模;用Origin 2021進行作圖。
1.3.1 樣品準備
以脫脂核桃粉為研究對象,分別摻入1%,5%,10%,20%和40%(W/W)的脫脂花生粉、脫脂葵花籽粉。摻雜樣品制備參考Karunathilaka等[10]描述的幾何稀釋法。即:(1)準確稱取60 g脫脂核桃粉和40 g脫脂花生粉(脫脂葵花籽粉),放入直壁玻璃瓶中,通過15次倒置進行混勻;(2)稱取50 g步驟1中初始混合物,按照1∶1(W/W)的比例加入脫脂核桃粉稀釋,依然通過15次倒置混勻。重復此過程,多次加入脫脂核桃粉稀釋,直至得到試驗所需摻雜10%,5%和1%的脫脂核桃粉混合物。
1.3.2 中紅外光譜數據采集
使用KBr壓片法制作掃描樣品,樣品與溴化鉀混合質量百分比為1%[11-12]。利用傅里葉變換紅外光譜掃描儀采集每個摻雜百分比樣品的光譜信息。每次使用儀器之前預熱30 min,掃描范圍設定為4 000~400 cm-1,掃描次數4次,分辨率4 cm-1。掃描前扣除H2O和CO2的干擾。每一摻雜水平重復20個樣本,共收集220個樣本光譜數據。
1.3.3 光譜數據預處理
為去除試驗過程中環境、儀器及操作引起的系統誤差的影響,用Spectrum 10和The Unscrambler X軟件對原始光譜數據進行基線校正、Savitsky-Golay(SG)7點平滑、多元散射校正(MSC)預處理[13]。由圖1(a)可知平滑處理可以明顯減小光譜的噪聲。SG+MSC處理后的圖如圖1(b)所示。

圖1 隨機樣本原始光譜與經預處理光譜圖
1.3.4 模型評價
主成分分析(principal component analysis,PCA)是將多個重要指標轉化為少數信息不重疊的綜合指標的多元統計方法,利用方差最大原則,對掃描的光譜數據信息中包含的自變量進行歸一化預處理,并且能夠在信息丟失、損耗最小的前提下,通過排除它們相互重疊部分的信息來達到降維的目的,常用于紅外光譜分析方法的數據處理中[14-15]。
簇類獨立軟模式分類(soft independent modeling of class analogy,SIMCA)用于建立主成分回歸模型,模型需要采用交叉驗證的預測殘差平方,為訓練集每個類建立PCA模型。將訓練集模型與測試集樣本進行擬合,根據訓練集與測試集的相似程度分類。
判別偏最小二乘法(partial least squares-discriminant analysis,PLS-DA)是基于判別分析基礎上的PLS算法,是以Y變量為二進制變量來取代濃度變量。這種分類方法不僅可將混合的訓練集樣品根據主要成分進行分類,在此基礎上還可以確定未知訓練集的歸屬。
判別過程:(1)創建訓練集樣品的定義分類變量(分類變量用數值變量賦值);(2)用訓練集的樣品變量(Y)和中紅外光譜數據(X)進行PLSR建模;(3)用建立的PLS模型,對測試集樣品進行判別分析。
分類判別標準(閾值0.5):(1)當測試集分類變量預測值的偏差<0.5時,說明判定樣品屬于該訓練集;(2)當測試集分類變量預測值的偏差≥0.5時,說明判定樣品不確定。
由圖2可以看出,不同摻雜物和摻雜質量比的脫脂核桃粉的中紅外光譜圖存在一定區別,主要表現在3 414 cm-1附近有1個很強的吸收峰,這與O—H鍵的伸縮振動有關,2 926 cm-1附近的峰為—CH2的反對稱伸縮振動,1 746 cm-1附近峰為油脂的C=O伸縮振動,1 639 cm-1附近為蛋白質酰胺Ⅰ帶的C=O伸縮振動吸收峰,1 537 cm-1附近為酰胺Ⅱ帶中N—H彎曲振動和C—N的伸縮振動吸收峰,1 162 cm-1附近為酯基C—O伸縮振動吸收峰[16-17],669 cm-1附近的峰為C—S—C對稱伸縮振動吸收峰,618 cm-1附近的峰與硫酸鹽SO42-不對稱變角振動有關[18]。

圖2 不同摻雜質量比的脫脂核桃粉中紅外光譜圖
PCA是模式識別中使用最基礎、廣泛的統計分析法[19],圖3為11類不同摻雜比核桃粉的主成分2D橢圓置信區間圖。PC1解釋了98.3%方差,PC2為0.8%,前2個主成分解釋方差達到99.1%,各類樣品之間無重疊。不同樣品之間的品質差異可以通過主成分得分圖上的間隔距離反映,樣品間距越大代表其特性差異越明顯。由圖3可知,各樣品間特征差異明顯。

圖3 不同摻雜質量比核桃粉的PCA分析
試驗根據脫脂核桃粉中摻雜物不同,分為摻雜脫脂葵花籽粉和摻雜脫脂花生粉,摻雜比率分別為0,1%,5%,10%,20%和40%,共11類樣品。各類樣品按3∶1的比例隨機選取15個作為訓練集,5個作為測試集。選擇最大主成分數5,對每一類樣品的訓練集進分別進行PCA[20],建立SIMCA模型。
在用SIMCA進行PCA聚類分析中,一般采用聚類中心之間的距離(類間距)評價聚類的效果,而聚類結果好壞的關鍵是合適特征的選取[21]。類與類之間差異越明顯,類間距則越大。試驗中不同摻雜質量比樣品模型類間距見表1。明顯看出純核桃粉與不同摻雜質量比的葵花籽粉以及花生粉之間類間距大。

表1 不同摻雜質量比樣本類間距
用建立的SIMCA模型對測試集樣本進行檢驗,結果見表2。摻雜不同質量比葵花籽粉樣品的訓練集和測試集模型的識別率均為100%。摻雜花生粉的訓練集識別率都為100%,測試集都在80%以上。

表2 SIMCA模型在顯著性水平α=0.1%條件下最佳訓練和測試結果
PLS-DA訓練集和測試集的建立方法同2.2。選擇最佳主成分:摻雜葵花籽粉為5,摻雜花生粉為7。采用完全交叉驗證策略[22]。用決定系數R2值,RMSEC值和RMSECV值對模型進行評價。從表3可知,摻入葵花籽粉和花生粉分類變量間的相關性較好,其模型的訓練集和測試集的R2大于0.93,RMSE值均小于0.5,且訓練集和測試集的RMSE差值未超過0.2,訓練集樣品的識別率大于70%。測試集建模的結果表明,該模型有著良好的自我分類能力。

表3 PLS-DA建模結果
利用PLS-DA模型對測試集樣本進行驗證,圖4(a)是模型對在核桃粉中摻雜不同質量比的葵花籽粉樣本進行判別分析。可以看出:測試集中不同樣本分類變量的預測值分別不同,純的脫脂核桃粉分類變量的預測值接近0.5,在0~1范圍之內;另外摻雜1%葵花籽粉、5%葵花籽粉、10%葵花籽粉、20%葵花籽粉和40%葵花籽粉分類變量的預測值分別接近1,1.5,3,3.5和5,且偏差均小于0.5。測試集中大部分樣本被正確識別,識別率為77%。

圖4 PLS-DA模型預測值
圖4(b)是測試集樣本中花生粉樣本的結果。測試集純脫脂核桃粉的分類變量預測值小于0.5,且偏差均小于0.5;測試集除純脫脂核桃粉的分類變量預測值其余都大于0.5,偏差小于0.5。根據PLS-DA法的判別準則,識別率為83%。不同質量比花生粉可以明顯地分開判別。
對采集的原始紅外光譜數據進行基線校正、Savitsky-Golay(SG)7點平滑、多元散射校正(MSC)預處理,可以有效去除試驗過程中環境、儀器及操作引起的系統誤差的影響,這與張朱珊瑩等[23]研究結果相同。直觀上不同摻雜質量比樣品的中紅外光譜圖特征有一定區別,卻不能直接精確判別摻雜其他物質,還需要通過其他的方法進行進一步區分。
在不同摻雜比核桃粉的PCA定性分析中,前2個主成分解釋方差達到99.1%。主要差異表現在縱坐標PC1上達到98.3%,在王曉玲等[24]低場核磁共振結合化學計量學方法快速檢測摻假核桃油中,PC1和PC2共保留99%的原始數據信息,可將純核桃油與摻入葵籽花油的核桃油樣品明顯區分。此次試驗PC2的貢獻率與之相比較小,但已達到使用要求,分類樣品很明顯,間距距離長、差異大,可有效證明摻雜不同百分比的樣品與脫脂純核桃間存在明顯的品質差異。
SIMCA方法可以明確判斷出錯誤分類樣本的歸屬,并找到誤分樣品的去處。用SIMCA進行PCA聚類分析,明顯得到純脫脂核桃粉與不同摻雜質量比的葵花籽粉及花生粉之間類間距大,且模型識別率為80%以上、訓練集識別率均為100%。說明中紅外光譜結合SIMCA法能有效、快速地識別脫脂核桃粉中摻雜脫脂葵花籽粉和脫脂花生粉。PLS-DA的判斷結果只是比較淺層次的判斷正誤,不能從中觀察到錯誤的源頭,因為該模型中的類別值只是一個假設值[25]。在建立的PLS-DA模型中,模型分類識別的正確率要求在60%以上[26],試驗結果達到標準(71%~87%),說明該法用于摻入葵花籽粉和花生粉的核桃粉樣品分類鑒別可行。但因樣品選擇的最佳主成分數較高,模型數據會出現過擬合現象,使RMSEC值過低,測試誤差偏高,導致試驗PLS-DA法測試集識別率低于SIMCA法測試集識別率。
運用PCA從定性的角度對摻雜脫脂核桃粉樣品進行分析,整體摻雜樣品無重疊,特征差異明顯。用SIMCA進行PCA聚類分析,明顯看出純脫脂核桃粉與不同摻雜質量比的葵花籽粉以及花生粉之間類間距大,且SIMCA模型對未知測試集樣本的識別率為80%~ 100%、訓練集識別率均為100%。說明中紅外光譜結合SIMCA法能有效、快速地識別脫脂核桃粉中摻雜不同比例的脫脂葵花籽粉和脫脂花生粉。另外PLS-DA建立模型,各樣本訓練集和測試集的R2超過0.932 6,RMSE值小于0.5,訓練集和測試集樣品的識別率在71%~87%。說明在嚴格的試驗條件下,PLS-DA法是可行的。試驗運用中紅外光譜法結合3種化學計量學方法(PCA、SIMCA、PLS-DA)鑒別核桃粉中摻雜花生粉和葵花籽粉都獲得滿意的結果。經比較采用中紅外光譜結合SIMCA法鑒別效果最佳,可以實現對核桃粉中摻雜不同比例脫脂花生粉和脫脂葵花籽粉的快速鑒別。