喬春艷,張雪茹,鄭衛民,李 玲,劉永峰,
(1.陜西師范大學食品工程與營養科學學院,陜西西安 710119;2.西安市奶牛育種中心,陜西西安 710075)
陜西羊奶粉產量和產品市場占有量均穩居全國第一,其品質監測十分重要[1]。作為羊奶的主要產品,羊奶粉是直接由鮮羊奶加工制作而成的。其中純羊奶粉不添加任何其它輔料,基本保留了羊奶本身的營養成分,有較長的貯藏期,日益龐大的消費人群與地區[2]。由于產地、季節、飼料、環境等因素的影響,羊奶品質會有差異,經過殺菌、濃縮、干燥等處理后,羊奶粉中各營養成分也會不同,盡可能多保留羊奶營養成分和提高奶粉質量仍是乳品企業正在攻克完善的問題。羊奶粉作為多組分物質,成分復雜,蛋白質、脂肪、乳糖、水分、灰分等品質指標常被用于評價奶粉質量[3-6]。此外,酸度常被用于評價奶粉新鮮程度[7]。各品質指標檢測主要依賴于國家標準的要求檢測,若要實現大批量樣品檢測及生產實時監控,則會耗時費力,成本高昂,且不適于監測部門的快速便捷檢測。
近紅外光譜分析技術作為一項綠色技術,操作方便、原理簡單、無損快速,可實現同時對大批量樣本多個指標的檢測[8]。近紅外光譜技術已經廣泛應用于乳及乳制品品質[9-12]及摻假[13-14]等監測研究,可以為乳及乳制品質量監控提供有效技術支持。其中,何佳艷等[15]結合近紅外光譜和偏最小二乘法建立了奶粉中脂肪含量預測模型,楊福臣等[16]探究了影響近紅外光譜建立乳粉中蛋白質和脂肪模型的因素,鄒婷婷等[17]建立了奶粉蛋白質的近紅外定量模型,吳靜珠等[18]首次建立配制奶粉的品質指標的近紅外模型。以上研究主要是針對同一種類或某一指標奶制品預測模型的建立,而對市售羊奶粉多個品質指標的研究較少,尤其對酸度的研究更是少見。因此,建立一個適用于分析多種奶粉產品品質指標的通用模型尤為緊迫。
綜上,本研究以陜西羊奶粉、純羊奶粉為樣本集,采用近紅外光譜技術對羊奶粉中蛋白質、脂肪、乳糖、水分、酸度和總灰分6個品質指標建立獨立模型,并優化和驗證最終獲得以135個羊奶粉為樣本集建立的通用模型,以期對市售羊奶粉質量的快速準確評估,為奶粉的規范化生產應用提供依據。
從超市購買羊奶粉共135個,按產地分為:陜西地區(93個)、非陜西地區(42個),按種類分為:純羊奶粉(108個)、配方奶粉(27個);硫酸銅、石油醚、亞鐵氰化鉀、乙酸鎂、氫氧化鈉 西安晶博生物科技有限公司。
Infraxact型多功能近紅外光譜儀(波長范圍為570~1850 nm,檢測器為硅銦鎵砷)、Kjeltec 2300全自動凱氏定氮儀 瑞典福斯公司;ST310脂肪提取儀 FOSS分析儀器公司;U-3000高效液相色譜儀美國熱電公司;WGLL-125BE電熱鼓風干燥箱 上海福瑪實驗設備有限公司;SX2-2.5-10NP馬弗爐上海一恒儀器有限公司。
1.2.1 奶粉樣品光譜的采集 將奶粉樣品均勻鋪滿于2/3的樣品杯中,采用近紅外光譜儀對其進行掃描。掃描前,對儀器預熱1 h并進行自檢。掃描過程中保持室溫25 ℃左右,并嚴格控制室內濕度,保證環境的一致性。通過儀器自帶的ISI scan軟件,獲取奶粉樣品的近紅外光譜數據,每個樣本重復掃描3次,取平均值作為原始近紅外光譜數據。
1.2.2 羊奶粉成分含量的測定 蛋白質含量測定采用全自動凱氏定氮儀基于GB 5009.5-2016中的凱氏定氮法測定;脂肪含量采用脂肪提取儀用GB 5009.6-2016中的索氏提取法測定;乳糖含量采用高效液相色譜儀基于GB 5009.8-2016中的蒽酮比色法測定;水分含量采用電熱鼓風干燥箱基于GB 5009.3-2016測定;總灰分含量采用馬弗爐基于GB 5009.4-2016測定;酸度用GB 5009.239-2016中的酚酞滴定法測定。每個樣品設置3個重復。
1.2.3 羊奶粉定標模型的建立和驗證 利用WinISI III軟件對羊奶粉6個品質指標的化學測定值結合近紅外光譜數據建立定標模型,采用改進最小二乘法回歸法(modified partial least squares, MPLS)建模時,對原始近紅外光譜數據分別以無散射處理(None)、去散射校正(Detrend only)、標準正態變量變換(standard normal variate, SNV Only)、標準正態變量變換結合去趨勢算法(SNV and Detrend)、多元離散校正(Standard multiplicative scatter correction,Standard MSC)、加權多元散射校正(Weighted MSC)、反向多元離散校正(Inverse MSC)等7種平滑處理與4種導數處理相結合共計28種方式進行預處理。其中,3種導數處理(1、4、4、1;2、8、8、4;1、4、8、4;1、8、8、1)中的數值依次代表導數處理的階數、導數的數據間隔、一次平滑點數和二次平滑點數[19-20]。利用WinISI III軟件通過得分矩陣計算樣品的馬氏距離(GH)和鄰域距離(NH),GH≥3.0和NH≥0.6的視為異常樣品。將剩下的樣品按照3:1比例隨機分成定標集和驗證集[21]。
定標模型建立后,通過交叉驗證標準誤差(standard error of cross validation, SECV)和交叉驗證相關系數(1 minus the variance ration, 1-VR)來判定定標模型的預測性能。SECV表示定標建模過程中進行交叉驗證時所獲得的預測值與化學分析值標準偏差;1-VR是定標建模過程中,進行交叉驗證時所得到的相關系數,即模型對樣品集濃度變化所能描述出的百分率。SECV值越小,1-VR值越大,則說明建立的定標模型預測性能越好。通過驗證集偏差(Bias)、預測標準誤差(standard error of prediction, SEP)、預測決定系數(coefficient of determination for validation,RSQ)、相對分析誤差(relative percent deviation,RPD)來判定該模型預測準確性。Bias、SEP分別表示定標模型參考值與預測值的偏差和相對偏差,預測決定系數(RSQ)表示模型擬合效果,相對分析誤差(the ration of performance to deviation, RPD)表示模型預測能力。Bias值和SEP值越小,RSQ值越接近于1,RPD值大于3.0,則說明建立的模型預測精度越高[22-23]。
1.2.4 通用模型預測評價 以全部羊奶粉樣品作為研究對象,建立蛋白質、脂肪、乳糖、水分、酸度和總灰分6個品質指標的通用模型;再分別以陜西羊奶粉樣品、純羊奶粉樣品作為研究對象,建立6個品質指標的2組獨立模型。用陜西羊奶粉、純羊奶粉的驗證集去檢驗通用模型的預測性,用Bias值、SEP值、RSQ值進行綜合評價。
2.1.1 羊奶粉總樣本集劃分 全部羊奶粉樣品各品質指標的原始集(N=135)、定標集(N=95~97)和驗證集(N=34)見表1。可以發現,蛋白質、脂肪、乳糖、水分、酸度和總灰分6個指標異常樣品數略有差異,各指標分別剔除了5、6、6、5、5、4個異常樣品。驗證集的6個品質指標數值范圍基本涵蓋于定標集對應品質指標數值范圍內,說明可以用于全部羊奶粉樣本的外標建模與驗證分析。

表1 全部羊奶粉樣品各品質指標的分集Table 1 Diversity of each quality index of all goat milk powder samples
2.1.2 陜西羊奶粉樣本集劃分 陜西羊奶粉樣品各品質指標的原始集(N=93)、定標集(N=65~68)和驗證集(N=23)見表2。蛋白質、脂肪、乳糖、水分、酸度和總灰分6個指標分別剔除了5、5、4、5、5、2個異常樣品。驗證集的6個品質指標數值范圍基本涵蓋于定標集對應品質指標數值范圍內,說明可以用于陜西羊奶粉樣本的外標建模與驗證分析。

表2 陜西羊奶粉各品質指標的分集Table 2 Diversity of Shaanxi province goat milk powder quality indexes
2.1.3 純羊奶粉樣本集劃分 純羊奶粉樣品各品質指標的原始集(N=108)、定標集(N=77~80)和驗證集(N=27)見表3。蛋白質、脂肪、乳糖、水分、酸度和總灰分6個指標分別剔除了1、4、4、2、6、3個異常樣品。驗證集的6個品質指標數值范圍基本涵蓋于定標集對應品質指標數值范圍內,說明可以用于純羊奶粉樣本的外標建模與驗證分析。

表3 純羊奶粉各品質指標的分集Table 3 Diversity of each quality index of pure goat milk powder
從羊奶粉樣品的近紅外反射原始光譜結果(圖1)可知,135個羊奶粉的特征吸收波段光譜曲線趨勢相似。由于奶粉中成分復雜,不同成分對應的不同基團(如甲基、亞甲基等)或同一基團在不同化學環境中近紅外吸收波長與強度都有明顯差別,所以成分的光譜吸收強度不同,波段也不同,本實驗選擇全譜波段進行分析。

圖1 羊奶粉樣品的近紅外反射原始光譜圖Fig.1 Near infrared reflectance spectra of the raw goat milk samples
為避免在光譜采集過程中由于儀器噪音、暗電流等及奶粉樣品等產生的光譜曲線不重復、基線漂移,光譜信息重疊、散射等干擾現象影響到建模的精度。本研究利用WinISI III軟件以平滑處理與導數算法相結合的28種處理算法對上述6個品質指標采集到的近紅外光譜數據分別進行預處理建立了MPLS定標模型。通過交叉驗證誤差(SECV)和交叉驗證相關系數(1-VR)來判定各品質指標建立的定標模型,最終篩選出6個品質指標的最優MPLS定標模型結果見表4。本文測定的6個品質指標中同一指標在不同模型里最優預處理方法有差異,同一模型里不同指標的最優預處理方法也有不同,這除了和模型樣本集有關外,與各指標對應吸收的近紅外波譜段也有關。從表4可知,對比未經處理定標模型的SECV和1-VR值可以發現,經過預處理定標模型的SECV值下降了38.2%~78.4%,1-VR值提升了0.2%~13.0%,SECV值越小,1-VR值越大,建立的模型越好[22]。綜上,本研究選取的近紅外光譜數據預處理方法可以有效提高模型的穩健性和預測性。
對于全部羊奶粉樣品6個品質指標的通用模型最優預處理組合:蛋白質為Inverse MSC和2、8、8、4,脂肪為Weighted MSC和2、8、8、4,乳糖為SNVDetrend和1、4、4、1,水分為SNV-Detrend和1、1、8、8,總灰分為Standard MSC和1、4、8、4,酸度為SNV-only和2、8、8、4。其中蛋白質、脂肪、乳糖、水分、總灰分、酸度最優模型所對應的SECV值分別為:0.091、0.064、0.297、0.025、0.060和0.176,1-VR值分別為:0.999、0.999、0.998、0.998、0.999和0.974。
對于陜西羊奶粉樣品6個品質指標的獨立模型最優預處理組合:蛋白質為Weighted MSC和2、8、8、4,脂肪為Weighted MSC和2、8、8、4,乳糖為Inverse MSC和1、4、4、1,水分為Standard MSC和1、1、8、8,總灰分為None和2、8、8、4,酸度為Standard MSC和1、4、4、1。其中蛋白質、脂肪、乳糖、水分、總灰分、酸度最優模型所對應的SECV值分別為:0.094、0.063、0.327、0.026、0.065和0.242,1-VR值分別為:0.999、0.999、0.998、0.998、0.999和0.954。
對于純羊奶粉樣品6個品質指標的獨立模型最優預處理組合:蛋白質為None和2、8、8、4,脂肪為Inverse MSC和2、8、8、4,乳糖為Inverse MSC和1、4、4、1,水分為SNV-Detrend和1、4、8、4,總灰分為None和1、4、4、1,酸度為Standard MSC和2、8、8、4。其中蛋白質、脂肪、乳糖、水分、總灰分、酸度最優模型所對應的SECV值分別為:0.081、0.057、0.206、0.021、0.063和0.173,1-VR值分別為:0.993、0.999、0.994、0.998、0.983和0.970。
通過比較全部羊奶粉樣品建立的通用模型和僅以陜西羊奶粉樣品建立的獨立模型6個品質指標的SECV值和1-VR值(表4)來評估模型的預測性能發現,酸度預測模型性能提高,酸度的通用模型相比獨立模型的SECV值降低了3.2%,1-VR值提升了0.2%,其余5個品質指標的模型預測性能均一致,因為SECV值越小,1-VR值越大,模型效果越好,所以本研究建立的定標模型中通用模型優于陜西羊奶粉獨立模型。同樣,對比全部羊奶粉樣品建立的通用模型和僅以純羊奶粉樣品建立的獨立模型6個品質指標的SECV值和1-VR值(表4)來評估模型的預測性能發現,除脂肪、水分得到的模型預測性能一致外,蛋白質、乳糖、灰分和酸度的預測模型性能均有提高,這4個品質指標的通用模型相比獨立模型SECV值降低了1.7%~44.2%,1-VR值提升了0.4%~1.6%,所以本研究建立的定標模型中通用模型優于純羊奶粉獨立模型。

表4 羊奶粉各品質指標的最優MPLS定標模型Table 4 Optimal MPLS calibration model for each quality index of goat milk powder samples
2.3.1 陜西地區獨立模型的外部預測驗證 通過陜西羊奶粉驗證集對6個品質指標建立的獨立模型進行檢驗(表5),發現蛋白質、脂肪、乳糖、水分、總灰分和酸度模型的Bias值均接近于0;SEP值分別為0.168、0.317、0.412、0.043、0.191和0.407;RSQ值分別為0.998、0.997、0.996、0.993、0.989和0.889,除酸度外,其余指標模型RSQ值均大于0.98且接近于1,RPD值除酸度外其余指標均大于3。一般Bias值和SEP值越小,RSQ值越接近于1,RPD值大于3,表明建立的模型預測能力越好[22-23]。酸度模型的RSQ值為0.889,小于0.9,一般大于0.9模型預測效果更好[22],RPD值為2.713,小于3,綜合說明酸度模型預測能力一般。因此驗證了陜西羊奶粉除酸度外其余5個品質指標的獨立模型均具有很好的預測能力。

表5 羊奶粉各品質指標定標模型的驗證結果Table 5 Validation results of calibration model for each quality index of goat milk powder samples
對得到的陜西羊奶粉集蛋白質、脂肪、乳糖、水分、總灰分和酸度的實測值與預測值進行配對t檢驗,計算得出t值依次為-1.745、-0.896、0.120、0.270、1.351、-1.398,P值 依 次 為0.095、0.380、0.905、0.790、0.190、0.176,P值均>0.05,說明實測值與預測值之間無顯著差異。
2.3.2 純羊奶粉獨立模型的外部預測驗證 通過純羊奶粉驗證集對6個品質指標建立的獨立模型進行檢驗(表5),發現蛋白質、脂肪、乳糖、水分、總灰分和酸度模型的Bias均接近于0;SEP值分別為0.103、0.100、0.304、0.027、0.084和0.301,RSQ值分別為0.990、0.998、0.990、0.995、0.977和0.933,通過RPD值進行再次檢驗,各指標模型RSQ值均大于3。因此驗證了純羊奶粉6個品質指標的獨立模型均具有很好的預測能力。
對得到的純羊奶粉蛋白質、脂肪、乳糖、水分、總灰分和酸度的實測值與預測值進行配對t檢驗,計算得出t值依次為-0.320、-1.581、0.329、-0.325、1.531、-0.199,P值依次為0.752、0.126、0.745、0.748、0.138、0.844,P值均>0.05,說明實測值與預測值之間無顯著差異。
2.3.3 通用模型的外部預測驗證 通過全部羊奶粉驗證集對6個品質指標建立的通用模型進行檢驗(表5),發現蛋白質、脂肪、乳糖、水分、總灰分和酸度模型的Bias均接近于0;SEP值分別為0.114、0.227、0.732、0.034、0.157和0.206,RSQ值分別為0.999、0.998、0.990、0.995、0.993和0.970,通 過RPD值進行再次檢驗,各指標模型RSQ值均大于3。因此驗證了全部羊奶粉6個品質指標通用模型均具有很好的預測能力。
對得到的全部羊奶粉集蛋白質、脂肪和酸度的實測值與預測值進行配對t檢驗,計算得出t值依次為-0.555、-1.193、0.539、0.966、1.270、-0.023,P值依次為0.583、0.241、0.594、0.341、0.213、0.982,P值均>0.05,說明實測值與預測值之間無顯著差異。
2.3.4 通用模型的適用性驗證 用陜西羊奶粉、純羊奶粉的驗證集分別檢驗以全部羊奶粉建立的通用模型的適用性。利用WinISI III軟件中的結果監控操作,并用驗證集樣品對通用模型預測結果進行監控,觀察這6個品質指標的樣品散點圖(圖2)可看出,陜西羊奶粉、純羊奶粉和全部羊奶粉的各預測集樣品點均分布在回歸曲線兩側。表明通用模型對預測陜西羊奶粉集和純羊奶粉集的這6個品質指標是適用的。

圖2 羊奶粉樣品各品質指標測定值和預測值的相關性Fig.2 Correlation between measured and predicted values of each quality index of goat milk powder samples
通過比較陜西羊奶粉預測集驗證獨立模型與通用模型的預測相對誤差(表6),發現蛋白質、脂肪、水分和酸度4個品質指標的通用模型中預測相對誤差均小于獨立模型的值,乳糖和總灰分的獨立模型中預測相對誤差和通用模型一致,說明通用模型對陜西羊奶粉集這6個品質指標可達到更好的預測能力。因為獨立模型和通用模型樣本集都包含純羊奶粉和其他配方奶粉,而通用模型的樣本量及地域包括更廣泛,說明樣本的差異性及樣本量對模型建立的穩健性與適用性有一定影響。

表6 獨立模型和通用模型預測適用性比較Table 6 Comparison of applicability between independent model and general model
通過比較純羊奶粉預測集驗證獨立模型與通用模型的預測相對誤差(表6),發現蛋白質、脂肪、乳糖、水分和總灰分的通用模型預測相對誤差均大于或等于獨立模型的值,酸度的通用模型預測相對誤差小于獨立模型的值,說明通用模型對純羊奶粉酸度指標可達到更好的預測能力,而獨立模型對蛋白質、脂肪、水分和總灰分的預測能力更好。因為通用模型樣本集包含了純羊奶粉之外的其他類型配方羊奶粉,由于不同類型羊奶粉的蛋白質、脂肪、水分和總灰分的含量差異較大,參數范圍較廣,所以相比純羊奶粉建立的獨立模型,通用模型對純羊奶粉這4個指標的預測誤差相對就會變大。但是兩種模型的預測相對誤差的差值只在-0.001%~-0.105%之間,差值較小。還可以發現酸度的通用模型預測相對誤差小于獨立模型的值,說明通用模型對純羊奶粉酸度的預測能力更好。通過比較兩者的樣本集發現,其樣本集均包含了不同類型的羊奶粉,因為酸度在不同類型羊奶粉中差異較小,而且通用模型的樣本量更大,所以通用模型可實現對純羊奶粉酸度更好的預測性。
綜上所述,通用模型對陜西地區羊奶粉的6個品質指標預測均是可行的,對于純羊奶粉的乳糖、酸度指標預測也是可行的,但是對于純羊奶粉的蛋白質、脂肪、水分和總灰分的預測能力不如獨立模型。
奶粉的蛋白質、脂肪、乳糖、水分和總灰分是主要的營養指標,酸度是鑒定奶粉質量參數之一,故選擇這6項品質指標對奶粉進行評價是非常有參考意義的[24]。對于這6項指標的測定方法一般采用化學分析法,需要對樣品進行前處理,如果樣本量較大的話,該方法還非常耗時耗樣,成本高昂,結果易受干擾[24]。而近紅外光譜分析技術作為一項綠色無損檢測手段,操作簡單,檢測快速,可以完成大批量的數據分析,還可達到對樣品多個指標的同時檢測,無需樣品處理,減少了樣品需求量且耗時很短,節約成本且結果穩定[8,25]。所以,本研究選擇近紅外技術對羊奶粉的這6項指標進行檢測。
由于奶粉組成復雜,在光譜預處理中,導數處理可提高重疊峰的分辨率和靈敏度,減少背景干擾,消除基線漂移[20,26],隨著導數階數增加,一些高頻噪音及組分干擾會被消除,多元散射校正和標準正態變量校正方法可以消除由于奶粉樣品顆粒形狀、粒徑大小、分布均勻程度等物理因素差異引起的光譜散射現象。故本研究選用了一階導數和二階導數兩種算法與平滑處理結合的光譜預處理方法,更好提升了光譜數據的有效性。MPLS相比傳統的PLS可以提升模型的預測精度及適用性。呂建波[27]建立了PLS和MPLS的液態純牛奶品牌鑒別模型,結果表明MPLS模型的鑒別精度更高。因此,本研究直接采用MPLS建立羊奶粉中蛋白質、乳脂肪、乳糖、水分、總灰分和酸度6項指標的定標模型,為羊奶粉的實時監測提供了有效的技術支持。
本研究建立的通用模型中樣品選擇了來自于國內外多個市區45個品牌不同規格的純羊奶粉和配方羊奶粉,樣品具有較廣泛的適應性。利用近紅外光譜分析技術建立的6個指標的獨立模型和通用模型中預測參數均有差異。在陜西獨立模型和純羊奶粉獨立模型中酸度的RSQ值相比其余5個指標均為最低,表明預測性能相比其他5個指標均較弱。可能原因是:近紅外光譜的原理是反映含氫基團有機物的倍頻合頻信息[28],而酸度指標是對物質中游離羧酸基團數量的計量標準,一般采用酸堿滴定法測定物質酸度值。本文酸度指標的化學檢測法其結果優于近紅外光譜技術對羊奶粉酸度的檢測,說明酸度指標的模型穩健性還有待提高。但是兩者酸度RSQ值均在0.8以上[29],表明近紅外光譜技術可以用于實際生產中大量羊奶粉樣品的酸度檢測。
本研究基于近紅外光譜技術對羊奶粉蛋白質、脂肪、乳糖、水分、總灰分和酸度品質指標分析,分別以陜西羊奶粉和純羊奶粉為研究對象建立了6項指標的獨立模型,并以全部羊奶粉集為研究對象建立了6項指標的通用模型。通用模型對預測陜西地區羊奶粉的蛋白質、脂肪、水分和酸度4個品質指標,純羊奶粉的酸度指標預測均優于獨立模型。但是純羊奶粉的獨立模型對蛋白質、脂肪、水分和總灰分4項指標預測能力更好,后期可進行更大樣本的投入與模型方法優化,從而進一步探討、驗證通用模型對這4項指標的預測性能。綜上,本研究所建通用模型、獨立模型均可實現對多種市售羊奶粉主要品質指標的快速定量無損檢測,為市售羊奶粉產品尤其是陜西地區羊奶粉、純羊奶粉的實時監測提供有效的技術支持。