黃 蕾,韋紫玉
(1.崇左市糧油質量監督檢測中心,廣西 崇左 532200;2.廣西科技大學經濟與管理學院,廣西 柳州 545006)
大米作為我國主糧之一,在日常飲食中占據重要的地位。在大米收購、貯藏、加工過程中,其水分含量是一項不可或缺的檢測指標[1]。傳統大米水分含量多采用GB 5009.3—2016《食品安全國家標準食品中水分的測定》[2]中的直接干燥法,但該方法操作過于繁瑣、耗時長,導致大米的水分含量檢測效率低。因此,開展大米水分含量快速無損檢測方法的研究具有重要的意義。
近紅外光譜 (Near Infrared Spectrometry,NIRS)分析技術以其簡單準確、快速高效、綠色無損等優點廣泛應用于食品、醫藥、化工、材料等領域[3-4]。目前,近紅外光譜技術在大米品質檢測中的應用已有諸多報道,孫永海等人[5]利用近紅外漫反射技術采集了吉林大米樣品的光譜數據,并建立了基于BP 神經網絡的定量模型,準確率達到了96.67%。李路等人[6]采用近紅外光譜技術對海南大米樣品的蛋白質、脂肪、總糖、含水量進行檢測,實現了快速檢測大米主要營養成分的功能。苗雪雪等人[7]采集了湖南大米樣品的光譜數據后,建立了移動窗口偏最小二乘(NMPLS) 大米水分定量模型,實現了大米水分含量的快速測定。路輝等人[8]利用近紅外光譜技術對江蘇大米樣品的直鏈淀粉、蛋白質、脂肪、水分含量進行了檢測,建立了偏最小二乘定量模型,實現了多品質指標的快速檢測。然而,目前國內采用近紅外光譜技術檢測大米品質的研究所用樣品大多產地單一,而我國大米產地分布廣泛,各地區大米成分存在差異,導致所建立的水分含量近紅外定量模型普適性較差。
因此,收集來自不同地區的大米樣品,結合化學計量學方法對其近紅外光譜數據和水分含量進行分析處理,建立大米水分含量預測模型,并優選多種預處理方法和建模方法,旨在實現基于近紅外漫反射光譜技術對多個產地的大米水分含量的快速無損檢測。
大米樣品:收集不同地區的大米樣本共120 個,分別來自江蘇?。?0 個)、廣東?。?0 個)、遼寧?。?0 個)、湖北省 (20 個) 和海南省 (20 個),樣品編號、分裝后保存于實驗室陰涼處。
S450 型近紅外光譜分析儀,上海棱光技術有限公司產品;電熱恒溫干燥箱,紹興市蘇珀儀器有限公司產品;高速多功能粉碎機,永康市鉑歐五金制品有限公司產品;電子天平,上海市菁海儀器有限公司產品。
將大米樣品置于實驗室陰涼處24 h,每個樣品選取150 g 左右置于粉碎機粉碎后裝袋備用。選用K-S(Kennard-Stone) 方法劃分樣品集合,按照7∶3 的比例劃分校正集和預測集,最終選取84 個樣品作為建立模型的校正集,剩余的36 個樣品作為驗證模型的預測集。
1.3.1 大米水分含量檢測
按照GB 5009.3—2016 中的直接干燥法檢測大米樣品的水分含量,具體操作流程為稱取5 g(精確至0.001 g) 樣品放在干燥皿中,置于101~105 ℃干燥箱中烘干4~6 h 至恒質量,取出后置于干燥器中干燥0.5 h,再次對樣品進行稱量,計算得出水分含量。
1.3.2 光譜數據采集
S450 型近紅外光譜分析儀的工作波長范圍為900~2 500 nm,選取全波段進行光譜數據采集。在室溫條件下,稱取50 g 樣品裝入樣品池后進行光譜采集,設置分辨率12 nm,采樣間隔1 nm,掃描時每次樣品旋轉120°,每個樣品均重復采集3 次,取平均光譜作為該樣品的最終測量光譜,以減少因裝樣不均勻造成的誤差。
1.3.3 近紅外建模方法
(1) 光譜預處理。預處理方法可以有效消除光譜采集過程中由于環境、背景等因素產生的噪聲信息,提高預測模型的穩定性[9]。使用Matlab 軟件對光譜數據進行預處理,包括Savitzky-Golay 平滑(SGF)、矢量歸一化(Standard Normal Variate transformation,SNV) 結合一階導數、歸一化、多元散射校正(Multiplicative Scatter Correction,MSC) 和二階導數等方法,旨在篩選出最優的光譜預處理方法。
(2) 模型建立。分別利用偏最小二乘回歸(Partial Least Square Regression,PLSR) 和主成分回歸(Principal Component Regression,PCR) 建立預測模型,將5種預處理方法分別與2種建模方法兩兩結合,構成10種不同建模路徑,按照評價指標選擇出最優建模方法。
采用多個指標對建立的模型進行評價,以校正集相關系數(Rc)、預測集相關系數(Rp)、校正均方根標準差(RMSEC)、預測均方根標準差(RMSEP)為評價指標。當相關系數R 越接近1,均方根標準差越小,說明模型的性能越優異。
采用直接干燥法檢測的大米樣品水分含量。
大米水分含量統計表1。

表1 大米水分含量統計
由表1 可知,樣本整體的水分含量范圍為13.09%~20.93%,范圍分布較廣,基本涵蓋大米水分含量的變化范圍。校正集大米樣品的水分含量范圍為13.09%~20.93%,預測集大米樣品的水分含量范圍為13.14%~20.55%,驗證集是校正集的子集,能夠更好地對定量模型進行驗證。
不同產地大米水分含量分布散點見圖1。

圖1 不同產地大米水分含量分布散點
由圖1 可知,江蘇、湖北、廣東、海南4 個地方的樣品水分含量差異性較小,而東北大米的水分含量較高,可能是由于地理因素,但較好的數據區分度會提高定量模型的預測性能。
近紅外光譜主要是由于分子振動的非諧振型使分子振動從基態向高能級躍遷時產生[10]。
樣本的原始近紅外光譜圖見圖2。

圖2 樣本的原始近紅外光譜圖
由圖2 可知,不同樣本在相同波長的吸光度存在一定的差異,可能是由于樣品內部化學成分含量不同。水分子由O-H 鍵構成,而游離O-H 鍵的組合頻產生的吸收峰出現在波長1 950~1 980 nm,一級倍頻產生的吸收峰出現在波長1 440~1 480 nm。其他吸收峰主要是C-H 鍵、N-H 鍵的振動伸縮和彎曲伸縮產生的[11],不再進行具體分析。
以不同產地大米樣品的平均光譜為代表,觀察光譜數據的差異。
不同產地大米樣品平均光譜對比圖見圖3。

圖3 不同產地大米樣品平均光譜對比圖
由圖3 可知,光譜數據存在差異性,但光譜差異非常小且總體趨勢相似,因此選擇不同地區大米樣品光譜數據建立的定量預測模型具有普遍適用性。
按照試驗設計中預處理方法和建模方法對光譜數據進行分析處理。
大米水分近紅外光譜模型性能對比見表2。
由表2 可知,PCR 法建立的模型預測精度均高于PLSR 法建立的模型,是由于PCR 能有效去除噪聲信息,提高了模型預測性能[12]。其中,MSC 結合PCR 法建立的模型預測效果最好,此時模型的Rc和RMSEC分別為 0.948 8,0.004 8,Rp和 RMSEP分別為0.936 2,0.006 5,這是由于MSC 能夠消除因顆粒分布不均勻、顆粒大小不同產生的散射影響。

表2 大米水分近紅外光譜模型性能對比
MSC 預處理后的光譜圖見圖4。
由圖4 可知,光譜在1 470,1 960 nm 處的O-H鍵吸收峰非常明顯。

圖4 MSC 預處理后的光譜圖
2.4.1 內部交叉驗證
使用校正集的樣本數據進行內部交叉驗證。
校正集樣品的水分含量預測散點圖見圖5。

圖5 校正集樣品的水分含量預測散點圖
由圖5 可知,校正交叉驗證相關系數R 為0.948 8,交互驗證均方根標準差(RMSEPCV) 為0.006 9,預測效果較好。從圖5 也可看出,校正集數據點均勻地分布在擬合方程兩側,擬合程度比較高。
2.4.2 外部樣本驗證
為了驗證預測模型的準確性和可靠性,使用預測集樣本數據對已建立的校正集模型進行評價。結果表明,預測集相關系數為0.936 2,RMSEP 為0.006 5,而校正集的RMSEC 為0.005 8,2 個指標都比較小且僅相差0.000 7,說明預測模型準確可靠,能夠應用在大米水分含量的檢測中。
預測集樣品的水分含量預測散點圖見圖6。
由圖6 可知,模型預測結果的的平均相對誤差為3.385 3%,平均絕對誤差為0.54%,表明定量預測模型的性能良好。

圖6 預測集樣品的水分含量預測散點圖
收集來自各5 個地區具有代表性的大米樣品,采集近紅外光譜數據并測定水分含量。使用多種預處理方法和建模方法建立大米水分預測模型并優化,比較各模型的預測效果,選擇最優預處理和建模方法。結果表明,經MSC 預處理的PCR 模型預測性能最佳,校正集與預測集相關系數分別為0.948 8,0.9362;RMSEC 和 RMSEP分別為 0.004 8,0.006 5,能夠應用于大米水分含量的檢測中。
在前人研究的基礎上,選擇了不同地區的大米樣品,擴大了模型應用范圍,實現了基于近紅外光譜技術對不同產地的大米水分含量的快速無損檢測,提高預測模型的穩定性和抗干擾能力,為各地區大米水分的無損檢測提供了參考。