汪志強 李大鵬 劉 強 廖舒懷 易宗霈
(中南林業科技大學機電工程學院,湖南 長沙 410004)
油茶是一種營養價值豐富的油料作物[1],近年來其種植面積和規模不斷擴大[2]。水分對油茶籽干燥時和干燥后影響較大,是一個重要的評價參數[3]。研究[4]表明,干燥時,水分含量會影響油茶籽干燥品質和能耗。同時,在茶油加工步驟中,干燥是第一步工序,水分含量是干燥時要控制的參數;干燥后,水分含量仍會影響油茶籽的貯藏[5]。目前,常用的茶籽水分含量測定方法主要為烘干法,但該法效率低下、耗時耗力[6]。
近年來,利用光譜技術檢測農產品中含油率及含水率、鑒偽等具有快速分析、無損檢測,以及無需樣品準備等優點。周宏平等[7]利用高光譜技術實現了對油茶籽含油率的無損檢測,利用兩組采集到的漫反射高光譜圖像,結合化學方法成功建立了含油率的回歸預測模型。彭彥昆等[8]通過近紅外光譜法設計了豬肉水分在線檢測分級系統,能夠在線準確預測豬肉水分,判斷準確率達90%以上。郭文川等[9]利用近紅外光譜檢測油茶籽油的摻偽,對摻偽質量分數不低于3%的摻偽油茶籽油的識別準確率達100%。Melfsen等[10]用漫反射近紅外光譜法估測了牛奶中脂肪酸含量,最終預測準確率達92%以上。Elsohaby等[11]利用紅外光譜和偏最小二乘回歸預測了奶牛和肉牛初乳免疫球蛋白G濃度,平均相對誤差為5%。
然而,近紅外光譜檢測方法測得的光譜極易受溫度、樣品種類等因素影響,其中,溫度是最常見的影響因素[12]。分子間的內力受溫度影響產生變化,主要表現為光譜振動變化。油茶籽水分中含有O—H鍵,在干燥時,油茶籽表面溫度的不同會影響水分子的振動變化,導致O—H基團對可見/近紅外光譜的吸收波段以及強度發生變化[13],因此需要修正溫度變化對光譜檢測的影響。
目前,有關溫度影響可見/近紅外光譜檢測油茶籽含水率的相關研究尚未見報道。研究擬以不同溫度下干燥的油茶籽為研究對象,提出一種改進的溫度修正模型,解決可見/近紅外光譜檢測時結果受溫度影響的問題,為采用可見/近紅外光譜檢測干燥過程中油茶籽含水率時消除溫度的影響提供依據。
1.1.1 材料
油茶籽:選擇新鮮的油茶果360個(平均分為3部分,依次于50,60,70 ℃下進行試驗),去殼,隨機選取360粒顆粒飽滿、大小均勻、無缺陷、單粒均重4 g 的油茶籽樣品,收集其光譜數據,湖南雪峰山茶油專業合作社。
1.1.2 主要儀器設備
光源:HL-1000型,功率為5 W的鹵素光源,上海聞奕光電科技有限公司;
光譜儀:Maya2000 Pro型,波長范圍為199~1 113 nm,使用Y型光纖連接光源和光譜儀,美國Oceanoptics公司;
烘干箱:XGQ-2000型,浙江力辰儀器有限公司;
精密電子天平:JY/YP11003型,浙江力辰科技制造有限公司。
使用自行設計的光譜平臺采集光譜數據(圖1),該系統包括光源、光譜儀、Y型光纖、電腦、置物臺、支架、暗箱。每次采集前為了消除誤差,需進行光譜黑白校正,校正方法[14]:
(1)
式中:
R——油茶籽的反射率;
A——校正前樣本原始的反射數據;
C——標準白板的參考反射光譜數據;
D——標準黑板的參考反射光譜數據。
先將漫反射標準白板(反射率99%)放置在密閉暗箱中(黑暗環境),光纖探頭垂直于白板,在其正上方3 cm 處,收集校正的光譜信息;取出烘干箱中的油茶籽,置于光纖探頭正下方2~3 cm 處收集原始反射光譜數據。
對每一部分的120粒油茶籽隨機依次編號,分為10組。測量時,先將全部油茶籽放入烘干箱中,依次于50,60,70 ℃下烘干。烘干時,每隔1 h取出一組進行光譜測量,迅速采集光譜數據,以免溫度下降,模擬干燥時的溫度;為使光譜數據與含水率對應更準確,在采集光譜數據后,用天平稱重并記錄相應數據,完成一組數據收集。1 h后重復操作直至10 h后全部采集完畢,得到120個包含不同含水率的光譜數據。
光譜數據由其自帶的軟件讀取,用Microsoft Excel 2019記錄,采用MATLAB 2019 b、Python 3.9軟件處理數據。

1. 光譜儀 2. 電腦 3. 光源 4. Y型光纖 5. 暗箱 6. 置物臺 7. 油茶籽 8. 支架 9. 光纖探頭
按GB 5009.3—2016中的直接干燥法測量油茶籽含水率。
采用SPXY算法將每一溫度下的全部樣品劃分為校正集與預測集,比例為3∶1,用90份樣品建模,其余30份樣品以預測的方式來建立合適的模型。
為了減少誤差,剔除光譜數據中的無用信息,為了提高模型精度和預測效果,需對原始反射數據(RAW)進行預處理[15]。選取的預處理方法有多元散射校正(MSC)、標準正態變量變換(SNV)和標準化縮放(Au)。其中MSC可以消除散射影響,增強采集的光譜和數據之間的關聯;SNV可以消除因為顆粒大小、表面散射對光譜的影響;Au能夠消除因數據差異過大產生的誤差[16]。
采用競爭性自適應重加權算法(CARS)[17]來消除因為光譜數據量大導致運行速度慢、誤差大、建模效果不理想的缺點,從而選取合適的特征波長建模。
建模方法為偏最小二乘回歸法(PLSR)[18],該方法具有運行速度快,能夠同時考慮光譜信息和相應的理化性質,從而避免信息缺失的優點。

表1 RPD值范圍與其對應的含義
分別按式(2)~式(4)計算模型的R2、RMSE和RPD值。
(2)
(3)
(4)
式中:
yai——第i個樣本的預測值,g/g濕基;
yi——第i個樣本的真實值,g/g濕基;

n——樣本數。
采用斜率/偏差法(S/B)對溫度進行修正,以Ta溫度下建立的模型來預測Tb溫度下的含水率為例,說明溫度修正的方法。分別建立Ta溫度下的光譜矩陣Xa,Tb溫度下的光譜矩陣Xb,用Xa和其對應的含水率真實值矩陣Ma建立模型N,將Xb代入模型N中預測Tb溫度下的含水率矩陣Mb。假設Ta溫度下的含水率真實值矩陣Ma和Tb溫度下的含水率矩陣Mb存在如式(5)所示的關系式[20]。
Ma=B+S×Mb,
(5)
式中:
Mb——修正前Tb溫度下的含水率預測值,g/g濕基;
Ma——Ta溫度下樣品含水率的真實值,g/g濕基。

(6)
式中:


選用的光譜儀波長范圍為199~1 113 nm,其中199~780 nm屬于可見光范圍,780~1 113 nm屬于近紅外范圍。以60 ℃下采集的油茶籽原始反射光譜為例分析,全波段光譜如圖2所示,為了消除噪音和誤差,有效提取光譜信息,需去除光譜首尾兩端波段,選擇波長范圍為400~1 000 nm,總計1 366個波長點。
由圖2可知,波長為400~1 000 nm時,曲線逐漸上升,反射率逐漸變大,420 nm處出現一個吸收峰,與索雷特吸收有關[21];960~980 nm附近出現平臺區,形成一個弱吸收峰,是由油茶籽中O—H基團的第二泛頻所導致的[22]。

圖2 60 ℃下采集的油茶籽原始反射光譜圖
試驗發現,不同含水率下溫度對光譜曲線均會產生明顯影響。由于獲取的油茶籽含水率分布范圍較廣(1%~60%),為了更清晰地表明溫度對光譜曲線的影響,以最高含水率范圍(60±1)%內的光譜數據平均值為例來進行說明。
由圖3可知,同一含水率不同溫度下的光譜曲線雖然走勢一樣,但其高低不一致。其中70 ℃對應的光譜曲線最高,而60 ℃對應的光譜曲線開始時高于50 ℃的,在650 nm 處變為最低,之后又逐漸升高,并高于50 ℃的。

圖3 原始光譜曲線和曲線之差比較
為了更明確說明溫度對光譜曲線的影響,以60 ℃下的光譜數據建立基準模型,因此以60 ℃對應的光譜曲線為0基準,將50,70 ℃的光譜曲線與60 ℃的進行差值計算,獲得對比曲線。70 ℃對應的光譜曲線與60 ℃的光譜曲線反射率之差為正值,表明在該區域內溫度的升高使油茶籽對光譜的反射越來越強,使光譜接收到的信息變多。50 ℃對應的光譜曲線先為負后為正之后又為負,表明其反射強度先小于后大于之后又小于60 ℃對應的光譜曲線。
綜上,溫度對光譜曲線產生了明顯影響,是由于溫度變化會影響O—H鍵的振動頻率,進而改變反射率[13]。因此建立油茶籽含水率預測模型時需要考慮溫度的影響。
以60 ℃下90個校正集樣本作為建模集,其余30個樣本進行預測,采用MSC、SNV、Au對其原始光譜(RAW)進行預處理后再進行PLSR建模,結果見表2。

表2 60 ℃下反射率建模結果


將50,70 ℃的校正集樣本代入基準模型中建模,預測含水率值,結果如圖4所示。由圖4可知,當溫度低于60 ℃時,預測值偏高;當溫度高于60 ℃時,預測值偏低。
將50,70 ℃下的含水率預測值與真實值進行回歸分析,得到回歸方程:
M60=1.036M50-5.492,
(7)
M60=1.122M70+3.226。
(8)
由回歸方程可知,50,70 ℃下修正斜率分別為1.036和1.122;偏差分別為-5.492和3.226。
修正前,將50,70 ℃下的預測集代入基準模型中,結果見表3,其RPD值均<2.5,說明預測結果較差,精度較低。
用預測集的30個樣本來評價模型修正結果,用基準模型來預測各溫度下的含水率,將預測值矩陣、斜率和偏差代入式(6)中進行修正,得到各溫度下含水率的修正值,修正后的結果見表3。由表3可知,50,70 ℃下的RPD值均>2.5,優于修正前的結果,達到了良好的預測精度;而60 ℃下的RPD值雖有所降低,但仍>2.5,可以滿足預測需要,下降原因可能是預測時出現過擬合。

圖4 50 ℃和70 ℃樣本建模結果

表3 各溫度下修正前與修正后結果比較
觀察式(7)、式(8)和其余回歸方程可知,斜率接近于1,其對預測值的偏差近似為線性關系。試驗溫度以60 ℃ 為基準模型,10 ℃為梯度,每上升或下降一個梯度,計算出其偏差約等于4.359。因此,任意溫度下的修正方程擬合為
(9)
式中:


T——樣品溫度,50~70 ℃。
陸錫昆等[23]利用高光譜技術檢測油茶籽含水率,其經過MSC預處理建立的PLSR模型的Rp值達0.939,與試驗結果類似,但是其利用太陽進行自然烘干來獲取不同的含水率樣品,未研究溫度對光譜的影響,因此其模型可能不適用于干燥時的油茶籽含水率在線檢測。
為了解決干燥時溫度對可見/近紅外光譜技術檢測油茶籽含水率的影響,分別于50,60,70 ℃下進行相關干燥試驗。結果表明,以60 ℃下校正集建立基準偏最小二乘回歸法模型,對比3種預處理方式,得到其相對最佳的預處理方式為多元散射校正處理;同時為了進一步提高模型精度,經競爭性自適應重加權算法處理,其預測集決定系數、預測集均方根誤差以及相對分析誤差分別為0.909、3.102%和3.315。用60 ℃下的基準偏最小二乘回歸法模型來預測50,70 ℃下的含水率值,由預測值與真實值計算出斜率和偏差,采用斜率/偏差法計算出預測集修正后的預測值,精度明顯提高,相對分析誤差均>2.5,可用于一般性的預測。同時由單個溫度修正模型分析得到50~70 ℃范圍內,任意溫度下模型預測值的修正公式。綜上,斜率/偏差法能夠解決干燥時溫度對油茶籽含水率在線檢測的影響問題。后續可在多個溫度下進行試驗,以使模型精度更高,應用范圍更廣。