劉紅梅,申 濤,張文怡,石習文,戴 濤,白 濤,肖應輝
湖南農業大學農學院,湖南 長沙 410128
水稻是世界及我國重要的糧食作物之一,全球超過一半的人以大米為主食,我國則有60%以上的人口以大米為主食。隨著生活水平的提高,人民對米質的要求越來越高,因此,水稻品質改良育種尤其重要。稻米膠稠度與米飯的柔軟度和粘稠度有關,能反映稻米蒸煮食味品質的優劣[1-2]。化學方法測定膠稠度操作繁瑣、 測試周期長、 檢測過的樣品不能繼續用于育種研究,不利于育種工作者對早世代品種的快速篩選[3]。近紅外分析技術可快速檢測有機物含量[4],能無損地檢測稻米品質,對加快優質稻的育種進程具有重要意義。近紅外分析技術在醫藥、 農業等領域已得到廣泛的研究應用[5-7],而在稻米膠稠度檢測方面的研究少有報道。因此,本研究收集南方稻區主栽或新育成的水稻品種(組合)為材料,測定其膠稠度的化學值,收集其近紅外光譜,采用偏最小二乘法,建立稻米膠稠度的近紅外分析模型,以期為稻米膠稠度的快速無損檢測提供參考。
收集137份南方稻區主栽或新育成的水稻品種(組合)。
1.2.1 稻米膠稠度化學值的測定
按NY/T 83—2017《米質測定方法》測定稻米膠稠度的化學值。準確稱取經過100目篩的精米米粉100 mg(±1 mg),加入定制的試管內,防止米粉粘在試管口壁,4次重復。用移液管加入95%乙醇麝香草酚藍溶液0.2 mL,并輕微搖動試管,使米粉充分分散而不沉淀結塊; 再加0.2 mol·L-1的KOH溶液2.0 mL,并輕輕搖動試管,勿使米粉沉淀,將試管立即放入沸水浴中加熱8 min,試管口蓋上玻璃珠,保持試管內液面低于水浴鍋水面,且在加熱過程中米膠高度始終維持在試管長度的2/3,不應超過或者溢出; 加熱完畢將試管取出,取下玻璃珠將試管置于試管架上靜置5~10 min后,置于冰浴冷卻20 min,然后將試管平放于米膠測定箱內(25±2 ℃),1 h后以mm為單位測量米膠長度。
1.2.2 近紅外光譜的采集
用近紅外光譜分析儀(波通 DA7200)掃描樣品獲得近紅外漫反射光譜值,掃描波長范圍為950~1 650 nm,識別度為5 nm,環境溫度控制在25 ℃,每個樣品重復掃描4次,對光譜值進行均值化處理。
用The Unscrambler 9.7(CAMO)分析軟件,基于偏最小二乘法(PLS)分別對校正集樣品采用不同數據預處理方式和不同波長段的近紅外光譜進行建模。為了防止模型過擬合,采用交互檢驗確定最佳主因子數。
1.3.1 校正集樣品預處理方式的篩選
將平滑(smoothing)、 多元散射校正(multiplicative scatter correction, MSC)、 標準正態變量轉換(standard normal variate transformation, SNV)、 一階導數(first derivative)、 二階導數(second derivative)等預處理方法單獨或組合共20種預處理方式分別對原始光譜進行處理,根據模型評價指標確定最佳預處理方式。
1.3.2 最佳波長段的選擇
因樣品的近紅外光譜在某些波長段明顯的吸收峰,分別對這些表現出明顯吸收峰的波長段及其復合波長段進行稻米膠稠度的近紅外光譜分析,通過對比各模型評價指標確定最佳波長段。
1.3.3 模型評價指標
以校準相關系數(R)、 校準標準差(SEC)、 校準均方根誤差(RMSEC)、 檢驗相關系數(r)、 檢驗標準差(SECV)、 檢驗均方根誤差(RMSECV)作為衡量稻米膠稠度近紅外模型預測效果的主要指標。模型的相關系數越接近1越好,綜合使用相對百分比偏差(relative percent deviation,RPD)進一步對模型預測效果進行評價。若RPD≥3,說明該模型檢測精確度高,可用于相關組分的檢測; 若2.5≤RPD<3,說明所建立的近紅外模型檢測效果一般,可用于相關組分的定量分析,但其精度需進一步修正提高; 若RPD<2.5,則說明使用該近紅外模型進行分析檢測比較困難[8]。
1.3.4 模型檢驗
將用于驗證集的30份樣品(不參與建模)用DA7200采集其近紅外光譜,用已經建立的稻米膠稠度近紅外分析模型預測膠稠度,建立預測值和化學值的對比表格,計算其絕對誤差和配對t測驗的p值,以判斷該近紅外模型檢測膠稠度的可行性。
表1為校正集和驗證集稻米膠稠度的分布情況。校正集范圍為43.0~94.0 mm,平均值為71.0 mm,標準差為12.2 mm。樣本膠稠度分布范圍較廣,且驗證集兩端極值在校正集之中,保證了模型預測值的準確性、 實用性。

表1 稻米膠稠度的化學值統計表Table 1 The chemical value of rice gel consistency
從校正集和驗證集綜合來看,由表2可知,采用平滑處理其校正集的校準相關系數(R)、 校準標準差(SEC)、 校準均方誤差(RMSEC)分別為0.970 0,2.971 8和2.957 9; 驗證集的檢驗相關系數(r)、 檢驗標準差(SECV)、 檢驗均方根誤差(RMSECV)分別為0.964 2,3.342 1和3.227 1,相對百分比偏差RPD=3.780 5(>3),說明平滑處理的近紅外分析模型效果最佳。

表2 不同預處理方法稻米膠稠度近紅外模型的評價指標Table 2 Evaluation indexes of NIR model of rice gel consistency under different treatments

續表2
從圖1可知校正集樣品吸收峰主要分布在950~1 100,1 100~1 300和1 300~1 650 nm,所以分別對這3個波長段及組合950~1 100,1 100~1 300,1 300~1 650,950~1 300,1 100~1 650和950~1 650 nm等6個波長段的稻米膠稠度近紅外光譜經平滑處理后,用偏最小二乘法(PLS)建立各波長段的稻米膠稠度近紅外分析模型。由表3可知在波長段(1 100~1 650 nm)的建模效果最好,其校正集模型評價指標R,SEC和RMSEC分別為0.969 4,3.003 0和2.989 0; 驗證集模型評價指標r,SECV和RMSECV分別為0.963 8,3.261 1和3.245 9,相對百分比偏差(RPD)為3.758 6,吸收峰越高其相關性越大。

圖1 校正集近紅外光譜Fig.1 Near infrared spectra of the calibration samples

表3 稻米膠稠度在不同波長段近紅外分析模型的評價指標Table 3 Evaluation Indexes of near infrared analysis models of rice gel consistency at different wavelength bands
通過軟件分析,如圖2,圖3,剔除殘差高的11個異常樣品后模型評價指標進一步提高,校正集評價指標R,SEC和RMSEC分別為0.979 0,2.540 6和2.527 3; 驗證集的評價參數r,SECV和RMSECV分別為0.974 1,2.820 6和2.805 8,RPD為4.419 4,提高了模型的準確性。

圖2 稻米膠稠度近紅外分析的殘差和杠桿值Fig.2 The leverage and residual of rice gelconsistency by near infrared analysis

圖3 稻米膠稠度建立的回歸模型預測值與其化學值的相關性圖
用DA7200收集30份驗證集樣品的近紅外光譜值,用新建立的稻米膠稠度近紅外模型檢測其膠稠度,并將稻米膠稠度的化學值與近紅外光譜檢測值進行對比分析,結果如表4,其絕對誤差范圍在0.198 6~6.502 4 mm,均符合GB/T 22294—2008 《大米膠稠度的測定》誤差標準,膠稠度40~60 mm時誤差不超過5 mm,膠稠度大于60 mm時誤差不超過7 mm。
對驗證集稻米膠稠度近紅外檢測值和化學測定值進行配對t檢驗,結果如表5,p值為0.726>0.05,表明用此近紅外模型檢測和化學方法分析得到的結果無顯著差異,即用此新建的近紅外模型檢測稻米膠稠度是可靠的。

表4 驗證集模型預測值與化學測定值Table 4 Predicted value and chemical value of validation set

表5 驗證集稻米膠稠度的模型檢測值和化學測定值的配對t檢驗Table 5 Paired t test of model prediction value and chemical value of rice gel consistency in validation set
用DA7200掃描獲得了137份南方稻區稻米的近紅外漫反射光譜,樣品膠稠度范圍為43.0~94.0 mm,覆蓋了大部份稻米膠稠度范圍。采用偏最小二乘法(PLS)分別經20種預處理方式和6組波長段下建立近紅外分析模型。根據模型評價指標判斷最佳預處理方式為平滑處理,最佳建模波長段為1 100~1 650 nm。對經過平滑預處理的1 100~1 650 nm波長段建立的近紅外分析模型進行參數評價,校正集的R,SEC和RMSEC分別為0.979 0,2.540 6和2.527 3,驗證集的r,SECV,RMSECV和RPD分別為0.974 1,2.820 6,2.805 8和4.419 4,模型參數較優。用新建的近紅外模型對30份驗證集樣品(未參與建模)進行檢測,與化學值進行配對t檢驗,近紅外檢測值與化學值絕對誤差在0.198 6~6.502 4 mm,配對t檢驗p=0.726(>0.05),表明此近紅外分析模型可用于稻米膠稠度的檢測。與同組分的其他研究結果相比[2],此近紅外分析模型檢測效果更佳,其建模評價指標和外部驗證結果都更優,能用于稻米膠稠度的分析檢測,并能為今后稻米膠稠度的近紅外分析的相關研究提供理論參考。
近紅外光譜分析在農業領域的研究及應用還有待加強。為了提高模型的準確性,采用了20種不同的預處理方式和6組波長段處理,發現經平滑處理的1 100~1 650 nm波長段建立的近紅外分析模型效果最佳,且經驗證表明此模型可用于稻米膠稠度的分析檢測。是否還有更好的預處理方法? 是否在其他波長段包含更多的膠稠度信息? 是否其他建模方法建立的模型更精確? 這些有待進一步探索。因此,為了獲得更準確的近紅外分析模型,(1)可以嘗試足夠多的光譜預處理方法或者開發新的預處理方法以減少光譜的影響因素; (2)可考慮用不同的回歸分析模型進行建模以選擇更優的建模方法。