高彥彬
摘要:在中國,為了方便生產和銷售,一些稻谷被加工成糧食成品以滿足市場需求。因此,稻谷的質量控制已迫在眉睫,如何快速、準確地判斷出稻谷儲藏過程中理化特性變化情況就顯得尤為重要。
關鍵詞:稻谷儲藏過程;理化特性;變化研究
前言:稻谷儲藏過程中理化特性會發生很多變化,其中主要以脂肪酸的指標變化為重要代表,脂肪酸值可作為判定稻谷理化特性發生變化程度的標準之一。本文設計并組裝了便攜式近紅外光譜(NIRS)系統,用于判斷稻谷儲藏過程中的脂肪酸的變化情況。
1.材料及樣品
1.1稻谷儲藏試驗及樣品制備
稻谷的近紅外(NIR)光譜包含了多種有機成分的大量信息,應用近紅外光譜技術檢測稻米品質的光譜儀大多為商用儀器,不利于現場快速分析。因此便攜式近紅外光譜系統可以實現稻谷儲藏過程中脂肪酸值的動態監測。偏最小二乘(PLS)回歸算法是建立光譜化學計量學模型最常用的方法之一。當分析樣品為固體顆粒時,收集的近紅外光譜中將存在嚴重的乘性散射效應,這將嚴重影響PLS模型的性能。乘法散射校正(MSC)和標準正態變量(SNV)是近紅外光譜散射校正中應用最廣泛的方法。然而,當原始光譜包含較大的化學變化時,MSC和SNV方法表現不佳。因此,可以引入加權乘性散射校正變量選擇(WMSCVS)算法對原始光譜進行校正,以獲得更可靠的PLS監測模型。試驗中使用的稻谷從當地超市購買,每袋5公斤。稻谷是在25°C的恒溫下購買和儲存的。每月對儲存的稻谷進行取樣,使用便攜式NIRS系統進行光譜采集。采樣時,從每個袋子的不同位置采集四個樣本,每個樣本為20克(精確到0.01克),每月采集20個樣本。因此,在6個月內總共可以獲得120個樣本。
1.2近紅外光譜采集
便攜式NIRS系統由五個部件組成:光源(鹵素(HL-2000))、光強衰減器(中國上海愛德光學儀器有限公司)、反射模塊、光譜儀(NIRQuest512海洋光學)和個人計算機。在光譜數據采集之前,使用SpectraSite軟件(海洋光學)設置儀器參數并記錄光譜數據。儀器參數設置如下:光譜積分時間為5s;平滑度設置為3;收集的光譜范圍為899.20 nm至1724.71 nm,共有512個變量。收集光譜數據時,室內溫度保持在25°C。將稻谷樣品置于內徑為6 cm的皮氏培養皿中。使用便攜式近紅外光纖探針對樣品進行三次掃描,將三個測量光譜的平均光譜作為樣品的原始光譜。
1.3數據分析
使用變量選擇的加權乘性散射校正算法(WMSCVS)是Wu等人于2019年開發的一種近紅外光譜校正和特征選擇方法。該算法受變量優化可以有效地提取一些特征的啟發,提出在多元參數估計過程中使用變量選擇來獲得加權最小二乘(WLS)的權重系數。在運行WMSCVS算法的過程中,變量的選擇基于去除基線的光譜。變量選擇算法設計基于模型總體分析(MPA)。在每次迭代中,使用加權自舉采樣(WBS)生成變量子集,并使用指數遞減函數(EDF)控制采樣變量的數量。在WMSCVS算法中,當考慮使用基于MPA的變量選擇來設置WLS的權重時,有兩個優點。一是變量的選擇可以保證散射校正性能的最優性。二是MPA從大量子模型中提取信息,有利于變量選擇的穩定性。
2.結果與討論
2.1校準集和預測集樣本的劃分
在數據分析之前,根據以下規則劃分校準集和預測集的樣本。首先,將所有120份稻谷樣品的脂肪酸值從小到大排列。然后,每四個樣本中的兩個中間樣本中的任何一個被放入預測集中,其余三個被放入校準集中。因此,校準集有90個稻谷樣本,而預測集有30個稻谷樣本。
2.2特征波長的選擇
WMSCVS算法的設計思想是基于MPA而成立的,它使用WBS在迭代過程中生成變量子集,EDF控制采樣變量的數量。這會導致優化特征波長的數量和位置在每次運行WMSCVS算法后發生變化。因此,為了消除這些不確定性對最終特征波長選擇和PLS模型結果的影響,在相同的參數設置下,WMSCVS算法獨立運行50次,并在本研究中對50次獨立運行后的結果進行統計分析。雖然WMSCVS算法每次運行后選擇的特征波長有一些差異,但有幾個波長區域選擇的頻率較高,這些變量對應的波長選擇頻率越高,對稻米脂肪酸值的貢獻越大,與稻米脂肪酸值的變化相關值的聯系程度也隨之越高,可以更好地反映出稻谷貯藏過程中的脂肪酸值的變化情況。
2.3基于特征波長的PLS模型結果
研究得出了WMSCVS算法50次獨立運行后獲得的特征波長變量建立的最佳PLS模型的結果。50個最優PLS模型的平均RCV 2值為0.9737,方差為0.0011。其RMSECV的平均值為0.3566,方差為0.0015。這些結果表明,盡管WMSCVS算法具有一定的隨機性,根據多次運行WMSCVS算法后獲得的波長變量,它們的RCV 2和RMSECV值都有小的波動。盡管WMSCVS算法的隨機性導致每次獲得的特征波長存在一些差異,但每次獲得的波長組合與目標屬性高度相關。這進一步驗證了NIRS中包含的信息實際上是被檢測對象的綜合信息。因此,在建立定量模型之前,有必要對特征波長進行優化。此外,50個最優PLS模型的最優LVs均為10。
2.4特征波長優化過程的結果
在特征變量優化過程中,WMSCVS算法采用EDF策略減少每次迭代的變量空間,并在此過程中通過五次交叉驗證確定保留的特征波長。隨著迭代次數的增加,波長變量空間變得越來越小,無用信息逐漸被移除,PLS模型的RMSECV值也隨著無用信息的移除而降低。在第31次迭代中,PLS模型的RMSECV值達到最小值0.3528,此時,對應的波長數為18,然后,隨著迭代次數的不斷增加,波長變量空間進一步壓縮,PLS模型的RMSECV值開始逐漸增加,直到迭代結束。PLS模型的RMSECV值增加的原因是,隨著變量空間的進一步壓縮,一些有用的信息將被刪除。因此,在此過程中,PLS模型的性能下降是合理的。原始光譜中存在嚴重的加性基線偏移和倍增效應,通過WMSCVS算法進行正交投影預處理后,可以很好地消除額外的基線效應和可能的光譜變化。包含較大光譜形狀變化的波長變量主要包含關于乘法散射效應的信息,而WMSCVS算法中的WLS可以將非信息變量的權重設置為零,從而最小化乘法散射效應的影響。因此,WMSCVS算法選擇的特征波長是波長周圍區域變化較小的波長變量。
2.5不同散射校正方法下PLS模型結果的比較
本次研究還得出了基于不同散射校正方法預處理的光譜的最優PLS模型的結果。在研究的過程中,基于散射校正光譜建立的PLS模型的性能明顯優于基于原始光譜建立的PLS模型。此外,與SNV和MSC方法相比,基于WMSCV校正和優化光譜的PLS模型具有最好的性能。基于原始光譜建立的最優PLS模型的性能,特別是預測過程中的泛化性能并不令人滿意,這主要是因為光譜散射效應的存在嚴重影響了LVs的挖掘。因此,基于散射校正光譜的三種最優PLS模型的性能明顯優于基于原始光譜的最優PLS模型。其次,盡管MSC和SNV都可以對光譜進行散射校正,但它們都可以對全光譜數據進行散射校正。當原始光譜包含較大的化學變化時,MSC和SNV的校正性能較差。然而,WMSCVS算法應考慮到在實際應用中無法獲得純組分光譜的信息,因此它可以選擇部分變量來估計散射參數,這不僅可以壓縮變量空間,而且可以減少非信息變量的影響。因此,基于WMSCVS算法校正和優化的波長變量建立的PLS模型可以幫助本研究獲得更好的預測性能。
4.結語
本研究開發了一套便攜式近紅外光譜系統來監測稻谷儲藏中脂肪酸的含量。在建立化學計量學模型的過程中,引入WMSCVS算法對便攜式近紅外光譜系統獲得的原始光譜進行散射校正和特征波長優化,驗證了算法的穩定性。結果表明,采用WMSCVS算法對光譜數據進行校正和優化,可以有效地提高PLS回歸模型的檢測性能。因此,可以推斷,隨著化學計量學的發展,便攜式近紅外檢測系統在稻谷儲藏過程中理化特性變化研究中的應用將越來越成熟。
參考文獻:
張瑛,吳先山,吳敬德,楊世祥,童繼平,鄭樂婭,佘德紅,吳躍進.稻谷儲藏過程中理化特性變化的研究[J].中國糧油學報,2003(06):20-24+28.
張欣,施利利,湯云龍,汪楠,汪健,柳剛剛,張琴,漆國杰.稻谷儲藏過程中主要品質的變化研究[J].食品科技,2018,43(03):122-125.