路 輝 彭彬倩 馮曉宇 沈曉芳
(江蘇省農墾農業發展股份有限公司1,南京 210019)(江南大學食品學院2,無錫 214122)
大米的食味品質與糊化特性等理化指標密切相關。大米的主要成分是淀粉,淀粉糊化特性是評價大米食用品質重要指標,是淀粉熱物理性特征的一種表現,并與大米蒸煮的質構評價有著緊密的聯系[1,2]。衰減值反映大米米糊的熱穩定性,回生值反映米粉糊冷卻過程中的冷糊穩定性[3]。采用GB/T 24852—2010《大米及米粉糊化特性測定 快速粘度儀法》測定各組分耗時耗力、費用昂貴。近紅外光譜法具有多指標同時檢測、快速無損、成本低等優點[4],在谷物[5,6]、蛋制品[7]、乳制品[8]等行業均應用廣泛。
目前國內外一些學者已利用近紅外光譜技術對大米的直鏈淀粉、蛋白質等營養指標含量無損檢測方面做了探索性研究。謝新華等[9]利用近紅外技術建立了近紅外分析數學模型,實現對稻米育種早代材料直鏈淀粉含量的測定,又建立了稻米淀粉黏滯特性崩解值(衰減值)模型。陸艷婷等[10]以稻谷、糙米、精米、糙米粉和精米粉為掃描材料分別建立了粳稻直鏈淀粉含量的預測模型。Sampaio等[11]采用過程分析技術對水稻直鏈淀粉的近紅外光譜多變量模型進行了優化。Bagchi等[12]建立了大米直鏈淀粉和蛋白質含量的近紅外光譜最佳校準方法——改進偏最小二乘法。這些化學計量學方法,取得了較好的結果(r>0.85),但建立大米品質模型的工作存在兩個不足:1)針對大米中蛋白質、水分等基本營養成分研究較多,但大米糊化特性檢測方面的報道較少;2)缺少基于一定區域內的大米品質定量模型建立。
本研究以126份產自江蘇省的大米為研究對象,測定大米中各糊化特性指標,同時采集同份樣品的近紅外漫反射光譜,為搭建品質模型提供基礎數據。在近紅外光譜全波段的基礎上篩選最佳光譜預處理方式,再通過人為逐一排除法剔除干擾波段建立偏最小二乘定量模型。從而對大米糊化特性指標模型進行了探究,為大米行業實現快速食味品質評價提供參考。
90個品種126個大米樣品由江蘇省農墾農業發展股份有限公司提供(表1),其中包含有粳米、糯米和秈米,均產自江蘇省。RVA 4500型快速黏度分析儀,Antaris II近紅外分析儀。

表1 90個大米品種名稱
1.2.1 大米糊化特性指標的測定
根據GB/T 24852—2010《大米及米粉糊化特性測定 快速粘度儀法》,測定峰值黏度、最低黏度、最終黏度、衰減值、回生值、糊化溫度,每份樣品重復至少3次,取平均值。
1.2.2 樣品近紅外光譜采集
Antaris II近紅外分析儀以漫反射模式掃描采集每份大米樣品的光譜信息。光譜掃描范圍:4 000~10 000 cm-1;分辨率:8 cm-1;掃描頻數:64次;測量間隔:3.857 cm-1;變量數:1 557;增益為8×;所有光譜均采用背景空氣光譜作為空白對照。將樣品杯中樣品倒回樣品袋,重新掃描近紅外光譜,3次采集得到平均光譜,以減少樣品分布不均勻帶來的誤差。
1.2.3 光譜處理與建模
采用馬氏距離剔除異常點后從樣本隨機選出20份作為驗證集,剩余樣本作為校正集,保證兩集的樣本化學值均勻分布,采用偏最小二乘(PLS)回歸法建立大米各糊化特性指標的校正模型,根據交叉驗證均方誤差(RMSECV)確定主因子數。為了優化模型,采用光譜預處理結合特征波段篩選。首先,光譜預處理采用多元散射校正(MSC)、標準正態變化(SNV)、一階導數(1st)、二階導數(2nd)和Savitzky-Golay濾波平滑(SG),其中,Savitzky-Golay濾波平滑設定多項式的取值范圍為7,階數為3。其次,將全波段劃分不同區間,采用手動法[13]篩選特征波段。
模型評判與驗證:校正集相關系數rc、和校正集均方誤差(RMSEC)作為直接衡量模型優劣的主要指標。使用相對分析誤差(RPD)對各組分模型進一步評估,若RPD≥2.0,說明模型建立優良,可用于日常實際定量檢測;若2.0>RPD≥1.4,說明模型較好,但用于實際應用任需進一步改良;若RPD<1.4,說明模型不能用于定量檢測[14-16]。最后,收集驗證集20份樣品(不參與建模)的近紅外光譜圖,通過比較模型預測值與化學值進行驗證。
圖1為大米樣本原始近紅外光譜圖,10 000~12 500 cm-1之間的區域光譜信息較少,因此未被用于開發校準模型,通過Antaris II 近紅外分析儀采集近紅外光譜范圍為4 000~10 000 cm-1。由于不同樣本各成分含量存在差異,不同大米樣本的光譜吸光度是不同的[17],但每條光譜趨勢相似,難以以肉眼評判特定波段峰值與指標含量的關系,通過TQ Analyst軟件將光譜進行預處理及波段的剔篩,從而利用偏最小二乘法建立各組分的定量模型。

圖1 大米樣本近紅外光譜圖
異常點剔除后的總樣本數據統計如表2所示。峰值黏度、最低黏度和最終黏度指標的樣品集數目沒有出現異常值。衰減值、回生值和糊化溫度指標剔除樣本數3~5份,剩余數目均大于120份。除了糊化溫度的化學值變異系數為5.07%,說明數據較為集中,其余指標的變異系數均較大,在20.36%~38.90%之間,說明數據分別廣泛,離散度高,為建立穩健的定量模型提供基礎。

表2 大米各糊化特性指標的化學值統計表
排序每個指標中的化學值,每連續6個數值中5個歸為校正集,1個為驗證集,其中,各指標驗證集均為20份,其余為校正集(兩集不存在交集)。如表3所示,峰值黏度的變幅為726~2 897、818~2 866;最低黏度的變幅為205~2 207、214~2 170;最終黏度的變幅為299~3 352、317~3 274;衰減值的變幅為428~1 118、450~1 112;回生值的變幅為94~1 459、103~1 273;糊化溫度的變幅為67.5~85.6、68.1~85.5。可見驗證集變幅范圍包含在校正集內,校正集所建模型可以運用于驗證集樣品,且校正集與驗證集的平均值和標準偏差相近,可見校正集與驗證集的內樣本分布相似,選擇合理。

表3 大米樣本校正集和驗證集劃分
通過測定大米樣品中糊化特性指標,該數據與近紅外光譜一起用于建立PLS定量模型。在沒有特征光譜的情況下,光譜預處理是優化PLS模型的方式之一。隨著光譜預處理的選擇不同,rc、RMSEC和RPD值也發生了變化。如表4所示,基于全波段的不同光譜預處理下,衰減值和糊化溫度模型均在SG處理下取得最小RMSEC,此時rc達到最大,分別為0.540 5和0.650 5,RPD均提升了0.1。采用SNV光譜預處理,回生值模型最佳,rc為0.890 5,RMSEC為146,與無任何光譜預處理比較,RPD提升到2.3。峰值黏度、最低黏度、最終黏度作為大米糊化特性主要指標,三者有較強的相關性,模型在一定程度上具有相似度,均在1st預處理下表現最佳,此時,三者的rc>0.8,分別為0.825 5、0.835 6和0.872 4,相較于無光譜預處理,三個模型的RPD值也有顯著提升,分別為1.7、1.8和2.1。這些結果表明,不同的光譜預處理將導致rc、RMSEC和RPD的差異。

表4 基于全波段的不同光譜預處理下建模結果
主因子數變大可以防止欠擬合,但主因子數過大往往會單方面使校正集搭建的模型過擬合,不利于驗證集的結果,因此選擇合適的主因子數很重要[18,19]。根據交叉驗證均方誤差確定主因子數,即RMSECV最小的時候選擇主因子數,峰值黏度、最低黏度和最終黏度主因子數均為3、衰減值和回生值取6,糊化溫度取7。
光譜范圍的選擇可以有效地提取有效的光譜信息,避免過擬合,提高模型的精度。采用人工方法[13]將全波段分為12個大范圍,11個分割點依次為:4 500、5 000、5 500、6 000、6 500、7 000、7 500、8 000、8 500、9 000、9 500 cm-1。在最佳光譜預處理條件下,依次移除一個光譜范圍,其他波段用于建模所得rc與全波段(4 000~10 000 cm-1)下的rc比較,結合TQ Analyst軟件給出的建議波段進行了嚴格篩選,排除了與組分無關的波段。
采用不同的光譜范圍選擇和預處理方法以建立大米樣品各糊化特性指標的最佳模型(表5)。在4 022~6 010 cm-1、8 001~8 937 cm-1下,糊化溫度模型的rc由0.650 5提升至0.696 8,RMSEC由2.75降低為2.60,RPD提高了0.1。而衰減值和回生值效果增加不明顯,rc沒有得到明顯提升。從相關系數大小來看,峰值黏度、最低黏度和最終黏度模型的預測值和實測值顯示出良好的相關性,三者的rc均提升顯著,由0.8均增加至0.9以上,分別為0.913 1、0.923 2和0.939 9,RPD > 2.0,分別為2.4、2.6和2.9,說明模型可用于精準的實際定量檢測。經過最佳譜區的選擇能有效提高模型的預測性和準確度。

表5 基于最優光譜預處理的特征波段下建模結果
圖2為大米品質指標預測值(Y軸)與化學值(X軸)的散點圖,分別為PLS模型和化學測定方法得到的數據,得到的擬合曲線,結果表明,衰減值和糊化溫度的線性擬合情況不佳(圖2d和圖2f),散點偏離擬合線相較多,rc約為0.6,RPD也不超過1.4,由于糊化特性指標的測定方法允許誤差本身較大,建模結果不穩健,因此,利用近紅外光譜技術檢大米糊化特性指標在現有文獻中研究較少,而峰值黏度、最低黏度、最終黏度和回生值只有少數點與擬合線略有分離,且rc均在0.85以上,尤其前三者是主要糊化特性指標,rc>0.9,rc分別為0.913 1、0.923 2和0.939 9,符合穩健模型的要求,說明模型可用于實際樣品的準確測定。

圖2 大米糊化特性指標的定量模型
為進一步研究模型的可行性,采用最小二乘法擬合得到PLS模型和化學法分析得到驗證集各糊化特性指標的擬合線。圖3為經優化后的模型預測值和實測值的散點圖(驗證集)。衰減值和糊化溫度模型的預測集結果較差(rp<0.67),實際預測能力不理想,考慮衰減值與回生值均為間接計算而得,增大了數據誤差,且前者變異系數比后者小18%(表2),同時糊化溫度變異系數最小(僅為5.07%),表明數據離散程度差,分布欠佳,校正模型不穩健。其他指標驗證效果良好,尤其是最終黏度和回生值的預測線性效果良好,rp>0.85,rp分別為0.864 0和0.874 4(圖3c和圖3e)。現有文獻中較少涉及采用近紅外光譜法檢測大米糊化特性參數,而檢測大米淀粉含量的文獻則較多,由于大米的糊化特性與淀粉含量間有較強的相關性[20],因此在一定程度上兩者的檢測模型具有可比性。黏度模型的rp略低于陸艷婷等[10]建立稻谷中直鏈淀粉模型的rp值(R2=0.813 6),但峰值黏度、最低黏度、最終黏度和回生值的rp>0.8且RPD>2.0(表5),說明模型建立優良,可用于定量檢測,與田曉琳等[21]建立小米黏度模型的(0.863 6≥rp≥0.618 9)的研究一致。

圖3 大米各糊化特性指標的驗證模型
將驗證集20個樣本的化學值與預測值進行配對t檢驗,在95%的置信區間下,峰值黏度、最低黏度、最終黏度、衰減值、回生值和糊化溫度的P值分別為0.651、0.426、0.302、0.827、0.563和0.517,均大于0.05,表明化學值與近紅外光譜法所得預測值之間無顯著性差異(P>0.05)。綜合考慮,峰值黏度、最低黏度、最終黏度和回生值的預測效果較好,其余指標的預測結果較差。
本實驗以產自江蘇省大米為研究對象,建立了基于偏最小二乘法的大米糊化特性指標定量模型。選擇合適的譜區范圍和光譜預處理方法可以有效地提高模型的性能,并通過驗證集進一步觀察了模型的可靠性。結果表明,衰減值和糊化溫度的rp在0.6左右,峰值黏度、最低黏度、最終黏度和回生值的結果為0.874 4≥rp≥0.812 1,表明模型的預測值與實測值接近,預測效果良好,各指標的校正集線性擬合結果基本符合實際定量檢測要求。綜上,該模型為利用近紅外光譜法快速無損檢測大米糊化特性指標提供了研究基礎,這將有利于大米資源的合理利用。