劉蕊 張軍 范海闊
(1中國熱帶農業科學院椰子研究所海南文昌571339;2農業農村部文昌椰子種質資源圃海南文昌571339)
椰子樹是熱帶地區重要的木本油料作物[1],椰子油是從新鮮成熟椰肉中制得的一種油脂[2]。具備藥用、抗氧化活性、減肥美容等[3-5]功效,受到消費者青睞。作為一種功能性油脂,椰子油可用于食品加工、護膚品和生物燃料生產等[6-8],應用十分廣泛。椰子油是椰子的重要加工產品,根據USDA數據,2016年世界椰子油消費總量達到321萬噸。鑒于椰子油的重要性,選育含油量高的品種是椰子的重要育種方向,篩選高含油量的優良種質是椰子育種的重要內容。傳統的油料作物含油量檢測主要通過索氏抽提等方法,檢測步驟繁瑣,所需時間較長,不能實現高通量快速檢測。在科研與實際生產中,需要建立一種椰子肉含油量的快速檢測方法,這對于椰子種質的高效鑒定評價以及椰子油產量的預測十分必要。近紅外光譜是一種高效、無損、易操作、可實時在線檢測的技術,已經被廣泛應用于醫藥、食品、農產品[9-12]等檢測中。有關近紅外光譜技術在油脂檢測方面的報道較多,主要應用于油料作物含油量檢測等方面。奚如春等[13]依據油茶種子吸收光譜與化學特征分析數據,建立了油茶種仁含油率定標模型。金華麗等[14]結合近紅外光譜掃描和索氏抽提法建立了花生種質含油量的近紅外測定模型。林艷等[15]采用近紅外光譜技術建立了沉香含油量近紅外光譜預測模型。Novianty等[16]同樣采用近紅外光譜技術建立了油棕鮮果的含油量檢測模型,并比較了偏最小二乘法(PLS)和多元線性回歸(MLR)法預測含油量的準確性。由于近紅外光譜分析技術是一種間接測量手段,是依賴復雜的化學計量學校準算法的間接定性定量分析技術,因此分析過程受到許多因素的影響[17],主要包括樣品因素、儀器參數、實驗操作等。有關學者在此方面進行了大量研究,如李軍會等[18]研究發現,提高儀器信噪比、樣品重復測量取平均次數等方法可以提高測試精度。王斌等[19]分析了掃描次數對鮮棗近紅外光譜響應特性的影響;趙怡錕等[20]發現儲存時間對玉米單籽粒近紅外光譜檢測結果有著重要的影響。在椰子油研究方面,尚未見采用近紅外光譜技術的報道,也并未開展掃描條件對相關模型建立的影響研究。本研究以成熟椰肉為試驗材料,分析不同掃描次數對椰肉含油量建模的影響,擬篩選適合椰肉含油量近紅外定量模型建立的最佳掃描次數,為將來建立實際應用模型時選擇最佳的檢測條件提供參考。
1.1.1 儀器設備
S400型近紅外農產品品質測定儀(上海棱光技術有限公司),FA1204B電子天平(上海天美天平儀器有限公司),DHG-9140A電熱恒溫鼓風干燥箱(上海精宏實驗設備有限公司),JK-CFD-6粗脂肪測定儀(上海精學科學儀器有限公司)。
1.1.2 試驗材料
所有試驗樣品采自海南省文昌市中國熱帶農業科學院椰子研究所試驗基地。
1.2.1 樣品處理
選取已經響水、健康無損的椰子果樣本38個;剖開椰果,剝取新鮮椰肉并將椰肉切成6 mm×6 mm大小置于70℃鼓風干燥箱中烘干至恒重;烘干后的樣品用粉碎機粉碎成粉末狀備用。
1.2.2 光譜數據采集
用S400型近紅外農產品品質測定儀對38份椰肉粉末進行光譜采集,光譜采集的參數如下:數據模式為吸光度(A),采樣波段范圍為1 000~2 500 nm,光譜采樣間隔為1 nm,掃描次數分為3、8、16、32、64次。光源采用與光譜儀配套的歐司朗12 V、20 W鎢燈。為了減少樣品不均勻性帶來的誤差,試驗過程中每個樣品都重裝樣2次并分別采集光譜。
1.2.3 含油量測定
用索氏抽提法測定38份椰肉粉末含油量。
1.2.4 光譜數據預處理與建模分析
分別將每個掃描條件下采集到的76光譜數據導入CAUNIR分析軟件,并輸入每一條光譜所對應的含油量值,利用CAUNIR軟件所提供的定量偏最小二乘分析方法(Quantitative partial least squares,QPLS)建模。建模的波段1 000~2 000 nm,波長間隔1 nm,試驗樣本按光譜數量1∶1的比例分成建模集和檢驗集。數據處理過程中,為了消除光譜采集過程中來自隨機噪音、基線漂移、樣本不均勻等的影響,采用軟件提供的一階導數、二階導數、散射校正、矢量校正、極差歸一、中心化法等6種預處理方法對光譜進行預處理。根據預處理方法的不同,每個掃描條件下建立6個定量模型,從中篩選1個最佳模型,5個掃描條件共篩選5個最佳定量模型。
利用相關系數r、校正樣本均方根誤差(RMSEC)、預測樣本均方根誤差(RMSEP)來評價所建模型的精確性。相關系數越接近1和均方根誤差越接近于0,并且建模樣本均方根誤差和檢驗樣本均方根誤差越接近時,表明所建模型較優。
1.2.5 模型預測能力檢驗
利用1.2.4中篩選的5個模型對外部驗證集的樣品含油量進行預測,通過成對t檢驗,比較實際值與預測值的差異。
38份樣品含油量最小值為27.50%,最大值為60.00%,平均值為50.21%,符合建模要求。每個樣品重裝2次,因此3、8、16、32和64次每個掃描條件下均獲得76條光譜(圖1-a~e)。不同掃描次數下的近紅外光譜吸收峰基本一致。

圖1 椰肉近紅外掃描光譜
依次將3、8、16、32、64次掃描條件下采集的光譜及其對應的含油量數值添加入CAUNIR軟件,設置波長范圍(1 000~2 000 nm)和間隔(1 nm)后,選用經預處理的光譜進行模型建立,檢驗集的設置采用隨機選擇檢驗樣品的方法,以光譜數量1∶1的比例劃分建模集和檢驗集,模型采用的推薦主成分數由內部留一交叉確定。在上述參數條件下試建并保存模型。5種掃描條件下椰肉含油量QPLS定量模型的最優結果,見表1。

表1 椰肉含油量檢測QPLS模型結果
理論上檢測模型校正均方根誤差(RMSEC)和預測均方根誤差(RMSEP)越小越好,兩者的值應非常接近,且有較高的相關系數,這樣才能說明該模型穩定性較好。由表1可知,3次掃描條件下,采用中心化法預處理后的光譜建模效果最好;8次掃描條件下,采用極差歸一法預處理后的光譜建模效果最好;而16次掃描條件下采用二階導數預處理法,32次掃描條件下采用矢量校正預處理法,64次掃描條件下采用散射校正預處理法,建模效果最好。不同掃描次數相比,掃描3次的相關系數(0.838 3)最低,均方根誤差最大;掃描64次的相關系數(0.877 6)為最高,均方根誤差相對較小。

續圖1椰肉近紅外掃描光譜
應用2.2所建的5個預測模型,對其外部驗證集的38條光譜對應的樣品含油量進行預測,并對模型預測值與實際含油量值進行統計分析;將外部驗證集樣品所對應的椰肉含油量與模型的預測值進行配對t檢驗。結果證明,掃描3、8、16、32、64次所建立的預測模型的p值(Sig.)均大于0.05(表2),說明其含油量預測值與真實值間無顯著差異。

表2 椰肉含油量實際值與預測值t檢驗
綜合表1~2的結果,在掃描64次條件下,采用散射校正預處理光譜所建立的模型性能較好,其實際值與預測值的相關系數可達0.877 6。
文章探討了掃描次數對椰肉含油率定量模型構建的影響,并分析了不同掃描條件下所建立的模型對樣本含油量的預測能力。結果表明,從相關系數和均方根誤差的角度看,掃描64次所建立的模型性能比較穩定;所建的5個預測模型,其含油量真實值與預測值均無顯著差異。由上述結果可知,相比而言,64次掃描條件最優,但考慮到試驗效率,在后續的大規模樣本量建模時,建議采用掃描3次的參數條件,可以節省試驗時間,同時也可以保證較高的預測能力。本研究同時分析了不用預處理方法對模型構建的影響,結果表明,不同預處理方法對模型的性能影響存在一定差異,需要根據實際情況篩選最佳預處理方法。
對近紅外光譜定量模型構建有影響的因素包括很多,除了掃描次數和預處理方法,譜區范圍[21]、環境溫度[18]等都會對結果造成影響,在后續椰肉含油量的近紅外光譜建模研究中需要進一步分析,為建立穩定性好、實用性高的穩健性模型提供參考。