李路,黃漢英*,李毅,趙思明,楊素仙
1(華中農業大學 工學院,湖北 武漢,430070) 2(華中農業大學 食品科技學院,湖北 武漢,430070)
脂肪含量是評價稻谷品質的重要指標[1]。而其傳統測定方法存在過程繁瑣、條件不易控制、藥品消耗大、費時費力等不足。近紅外光譜分析技術以其檢測過程簡單迅速、耗材少、無損、分析重現性好、成本低等優點,在糧食、蔬果、肉制品等方面的檢測中得到了廣泛的應用[2-4]。
目前國內外學者利用近紅外分析技術做了一些食品檢測方面的研究,BAGCHI等[5]、SUN等[6]和XIE等[7]建立了稻米中蛋白質及淀粉含量的檢測模型。SIRISOMBOON等[8]研究了稻谷中黃曲霉素的近紅外檢測方法。張中衛等[9]、郭中華等[10]和趙明富等[11]建立了牛奶中脂肪和蛋白質含量的數學模型。林家永等[12]對不同品種和儲存期限的大米水分、脂肪酸值進行檢測。上述研究所建立的數學模型對食品主要營養成分的檢測都能取得較好的精度,檢測結果的決定系數R2大多在0.8以上,但是模型的建立思路主要集中在2個方面:(1)根據食品營養成分中特殊化學基團所對應的近紅外光譜特征波長建立模型,具有模型簡單,物理意義明確的優點,但檢測結果不穩定,精度不高;(2)利用近紅外光譜全波長建立模型,具有適應性廣,精度理想的優點,但模型復雜,計算量較大。
本文針對模型性能與復雜度的矛盾關系,采用競爭性自適應重加權采樣(competitive adaptive reweighted sampling,CARS)[13]方法,在稻谷近紅外光譜的全波段,篩選出適量的特征波長,然后采用多元線性回歸法建立稻谷脂肪含量的檢測模型,在保證較好模型性能的前提下盡量減小計算量,為快速檢測稻谷主要營養成分提供新的方法。
試驗材料包含A4A/R326、巨風A/R257、廣占S/R166、中9A/R591、岡紅1A/R15等46個品種的稻谷,由黃岡農科院提供,產自海南省。袋裝封存于陰涼處,收獲至試驗在2個月內完成。將部分品種按質量1∶1的比例兩兩混合,得到44個混合樣本,共計90個稻谷樣本。
近紅外光譜儀:漫反射式Supnir-2720近紅外光譜儀,杭州聚光科技股份有限公司。其測定范圍為1 000~1 799 nm,光譜采樣間隔為1 nm,光譜分辨率為10 nm。為減小誤差,每個樣本掃描3次。稻谷籽粒置于樣本盤內,且裝滿、壓實,逐一掃描。
按照GB/T 5511—2008《糧油檢驗 糧食中粗脂肪含量測定》中的索氏抽提法[14]測定稻谷的脂肪含量,取3次測定的平均值。
1.4.1 樣本集劃分
運用Kennard-Stone方法[15]對90個稻谷樣本進行分組,80%為校正集,20%為驗證集,分別用于模型的建立與驗證。Kennard-Stone方法基于變量之間的歐氏距離,在樣本光譜的特征空間中均勻選取樣本,依次選取歐氏距離最遠的點,進入校正集,留下馬氏距離居中的點在驗證集之中[16]。這樣可使光譜差異較大的樣本全部進入校正集,從而在一定程度上避免了校正集樣本分布的不均勻。
1.4.2 近紅外光譜預處理
預處理能將光譜的有效信息放大,且將光譜壓縮在相同的范圍進行比較,消除了基線漂移、樣品不均勻、光散射、光程變化等對光譜的影響。選擇合適的預處理方法,對提高模型的檢測能力和精度十分重要。本文運用歸一化、一階導、二階導等預處理方法中的一種或多種的組合對稻谷近紅外光譜做預處理。然后根據不同預處理方法所建立模型的性能指標來確定最終的光譜預處理方案。
1.4.2.1 歸一化
在建立近紅外定量模型前,為了將光譜的有效信息放大,常采用歸一化來進行預處理,使光譜數據的方差為1,均值為0,將光譜數據放在相同的范圍進行比較[17]。本文運用Z-score歸一化進行預處理試驗。
1.4.2.2 一階導
導數法可消除基線偏移、背景干擾出現的譜線重疊,呈現變化明顯的波峰波谷,提供比原始光譜更清晰的光譜輪廓變化[18]。
1.4.2.3 二階導
原始光譜經過二階導數處理后,會變得很尖銳,有利于更好的確定波峰和波谷的位置,可使各吸收峰變得更容易區分。二階導數可以消除基線的線性傾斜[19]。
1.4.3 特征波長篩選
稻谷脂肪的近紅外光譜波長點數為800個,而樣本數是90個,利用此數據進行回歸分析,共線性非常嚴重。利用CARS方法[20]對特征波長進行篩選可簡化模型,并提高模型的檢測能力。
1.4.4 建模
為了降低模型的運算量,便于后續研究中在線快速檢測系統的開發,使用多元線性回歸方法建立基于近紅外光譜分析技術的稻谷脂肪含量檢測模型,以模型的決定系數(R2)、定標標準差(RMSEC)、相對偏差來評價模型的穩定性、檢測能力和優劣。當R2越趨近于1,RMSEC和相對偏差的值越趨近于0,則模型的穩定性和檢測能力越好,在實際中的檢測越準確。同時,在建模的過程中通過顯著性指標進一步對特征波長進行優選,使模型進一步簡化。
圖1為90個稻谷樣本的近紅外光譜圖。可見,不同樣本的近紅外光譜在總體趨勢上是一致的。但由于物質成分含量的微小差異,不同樣本的吸光度略有不同。

圖1 90個稻谷樣本的原始近紅外光譜圖Fig.1 Original Near-infrared spectra of ninety rice samples
采用Kennard-Stone法選取校正集與驗證集,結果見表1。驗證集的范圍包含在校正集內,分組合理。

表1 Kennard-Stone 分組結果Table1 Results of Kennard-Stone
4種預處理方法后的結果如圖2和表2所示。由表2可知,運用一階導處理后所建模型的決定系數最大、定標標準差最小,因此選用一階導為最佳的預處理方法。

圖2 經過4種預處理后的光譜圖Fig.2 Spectra after 4 preprocessing methods

序號預處理方法R2RMSEC1歸一化0.94800.23572一階導0.95890.22363二階導0.64520.30204一階導+歸一化0.83450.2956
對光譜進行預處理后,采用CARS方法對稻谷脂肪的特征波長進行多次篩選,其篩選過程如圖3所示。圖3-a為篩選過程中選出變量的變化趨勢,隨著運行次數的增加,保留的變量數越來越少,且由快到慢呈指數函數遞減。圖3-b為波長變量篩選過程中交叉驗證均方差RMSECV的變化趨勢,在1~53次采樣過程中,RMSECV呈現遞減趨勢,表明篩選過程中剔除了與樣本性質無關的變量,此時對應的變量數為34,53次后開始遞增,說明篩選過程中開始剔除了與稻谷脂肪含量相關的變量,從而導致RMSECV值增大,可見在第53次時,已將無關變量全部剔除,最后保留波長數34個。圖3-c中“*”所對應的點即為RMSECV最低點,圖3-c中各線表示隨著運行次數增加各波長變量回歸系數的變化趨勢。特征波長篩選時蒙特卡羅采樣次數為100,挑選出的34個特征波長見圖4。

圖3 稻谷脂肪特征波長篩選圖Fig.3 Key wavelengths selection of fat in rice
運用多元線性回歸方法,以34個特征波長建立稻谷脂肪含量的檢測模型,將顯著性不高的特征波長剔除,優選特征波長,最終得到30個特征波長,回歸系數及顯著性見表3。檢測模型的具體形式為:

圖4 稻谷脂肪特征波長的分布情況(o表示特征波長)Fig.4 Distribution of key wavelengths (shown by “o”) for fat in rice
y=b+∑aixi
(1)
式中:y,稻谷脂肪含量;b,回歸常數項;ai,各特征波長的回歸系數;xi,特征波長的吸光值經過一階導數處理后的數值;i=1 000, 1 001, … , 1 799,波長所對應的納米數。
表3為稻谷脂肪檢測模型的參數及其顯著性。可見,在x1 343、x1 489和x1 583處,回歸系數的絕對值最大,說明這些特征波長對模型的影響最大,t值相對較大,說明對模型的影響較顯著。其中,1 343 nm反映了C—H基團的第二組合頻和O—H基團的伸縮振動的二級倍頻吸收帶,1 489 nm反映了O—H基團的伸縮振動的二級倍頻,1 583 nm反映了O—H基團的伸縮振動的一級倍頻吸收帶。檢測模型的決定系數R2為0.958 9,定標標準差RMSEC為0.223 6,相對偏差為5.53%,說明模型具有較好的穩定性和準確性。

表3 稻谷脂肪檢測模型的參數及其顯著性Table 3 Parameters and significances of fat prediction model
利用上述回歸方程預測18個驗證集的脂肪含量,偏差的絕對值最大為0.716 1,最小為0.003 2,模型驗證的決定系數R2為0.825 0,校驗標準差RMSEP為0.339 8,相對偏差為8.55%,說明所建模型具有較好的檢測能力。
本文首先采集了90個稻谷樣本的漫反射近紅外光譜,使用Kennard-Stone法選取了校正集與驗證集。然后對比了歸一化、一階導、二階導、一階導+歸一化等4種預處理方法對模型性能的影響,使用CARS法確定了與稻谷脂肪含量檢測相關的近紅外特征波長。最后利用多元線性回歸理論對特征波長進行優選,并建立了基于近紅外光譜分析技術的稻谷脂肪含量的檢測模型。結果表明,稻谷紅外光譜的最佳預處理方法為一階導,與稻谷脂肪含量檢測相關的近紅外特征波長為30個,其中最典型的特征波長為:1 343、1 489和1 583 nm。檢測模型的決定系數R2為0.958 9,定標標準差RMSEC為0.223 6,相對偏差為5.53%。將檢測模型用于驗證集,偏差的絕對值最大為0.716 1,最小為0.003 2,模型驗證的決定系數R2為0.825 0,校驗標準差RMSEP為0.339 8,相對偏差為8.55%,說明所建模型具有較好的穩定性和檢測能力。
[1] 黃麗, 柏蕓, 韓文芳, 等. 稻米質量對食品安全的影響[J]. 中國糧油學報, 2013, 28(4): 113-117.
[2] MILICA M P, JASNA S M. Near infrared spectroscopy-advanced analytical tool in wheat breeding, trade, and processing [J]. Food and Bioprocess Technology, 2013, 6: 330-352.
[3] 陳辰, 魯曉翔, 張鵬, 等. 玫瑰香葡萄貯藏期間糖酸品質的近紅外檢測[J]. 食品與發酵工業, 2015, 41(6): 175-180.
[4] 涂斌, 陳志, 彭博, 等. 基于多源光譜特征融合技術的花生油摻偽檢測[J]. 食品與發酵工業, 2014, 42(4): 169-173.
[5] BAGCHI T B, SHARMA S G, CHATTOPADHYAY K. Development of NIRS models to predict protein and amylose content of brown rice and proximate compositions of rice bran [J]. Food Chemistry, 2016, 191(1): 20-27.
[6] SUN Cheng-xiao, YU Yong-hong, DUAN Bing-wu, et al. Rapid prediction of rice quality characteristics by near-infrared reflectance spectroscopy for breeding programs [J]. Cereal Chemistry, 2014, 91(3): 270-275.
[7] XIE L H, TANG S Q, CHEN N, et al. Optimisation of near-infrared reflectance model in measuring protein and amylose content of rice flour [J]. Food Chemistry, 2014, 142: 92-100.
[8] SIRISOMBOON C D, PUTTHANG R, SIRISOMBOON P. Application of near infrared spectroscopy to detect aflatoxigenic fungal contamination in rice [J]. Food Control, 2013, 33(1): 207-214.
[9] 張中衛, 溫志渝, 曾甜玲, 等. 微型近紅外光纖光譜儀用于奶粉中蛋白質脂肪的定量檢測研究[J]. 譜學與光譜分析, 2013, 33(7): 1 796-1 800.
[10] 郭中華, 王磊, 金靈, 等. 基于近紅外透射光譜的乳制品蛋白質、脂肪含量檢測[J]. 光電子·激光, 2013(6): 1 163-1 168.
[11] 趙明富, 施玉佳, 羅彬彬, 等. 基于近紅外透射光譜的牛奶中脂肪和蛋白質含量檢測[J]. 激光雜志, 2014(1): 44-45.
[12] 林家永, 范維燕, 薛雅琳, 等. 稻米儲藏品質近紅外光譜快速判定技術及儀器研發[J]. 中國糧油學報, 2011, 26(7): 113-118.
[13] LI Hong-dong, LIANG Yi-zeng, XU Qing-song, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1): 77-84.
[14] GB 5009.5—2010. 食品安全國家標準: 食品中蛋白質的測定[S].
[15] 陳鑫. 基于智能算法的近紅外光譜分析預測模型建立方法研究[D]. 無錫:江南大學, 2013.
[16] 張華秀, 李曉寧, 范偉, 等. 近紅外光譜結合CARS變量篩選方法用于液態奶中蛋白質與脂肪含量的測定[J]. 分析測試學報, 2010, 29(5): 430-434.
[17] 王艷陽, 魏永霞. 基于Z比分數的參考作物騰發量計算方法優選[J]. 節水灌溉, 2015, 29(3): 52-54.
[18] 宋麗華. 花生籽仁蛋白質含量近紅外光譜模型的建立及育種應用[D]. 保定:河北農業大學, 2011.
[19] 白雁, 余振喜, 孫素琴, 等. 近紅外漫反射光譜技術測定牛膝中蛻皮甾酮[J]. 中草藥, 2005, 36(9): 115-118.
[20] 劉星, 單楊, 李高陽. CARS結合PLS-LDA法識別奶牛飼料中土霉素的可行性研究[J]. 包裝與食品機械, 2012, 30(4): 1-4.