樊書祥, 王慶艷, 楊雨森, 李江波, 張 馳, 田 喜, 黃文倩*
1. 北京農業信息技術研究中心, 北京 100097 2. 西南交通大學利茲學院, 四川 成都 611731
可見-近紅外光譜分析為代表的無損檢測技術在水果糖度的快速、 無損檢測方面得到了廣泛應用[1]。 水果糖度的便攜式或手持式裝置, 可以實現水果糖度的快速、 現場檢測, 滿足水果樣品抽檢、 定級以至田間管理[2]。 目前, 如久保田株式會社, FELIX以及Atago等都推出了相關產品。 但上述國外公司的產品價格較高, 檢測樣品單一, 不易于后期模型和設備的維護, 使用成本較高。
在近幾年的研究中, 國內外研究人員借助小型商品化光譜儀器, 也開發了具有類似功能的樣機。 樣機的開發主要集中在用于水果光譜采集探頭的設計以及后續對光譜儀的控制。 Yang[3]、 Guo[4]等開發了用于獼猴桃、 油桃糖度檢測的便攜式裝置, 王凡[5]、 郭志明[6]等設計了用于番茄糖度、 番茄紅素等指標分析的檢測裝置。 除了利用商品化光譜儀外, Yu等[7]利用線性漸變濾光片自行開發了用于梨果糖度檢測的便攜式裝置。 趙娟等[8]基于所選10個特征波長的LED和硅光電二極管, 開發了用于蘋果糖度檢測的便攜式裝置, 雖然成本有所降低, 但精度有所下降。 借助便攜式光譜儀可以直接用于樹上柑橘[9]等水果品質的無損分析, 但大都沒有形成最終檢測裝置。 分析發現, 上述裝置成本較高, 大都針對同種水果進行評價, 且均針對開發的一臺裝置進行檢驗, 缺少模型在不同裝置間的傳遞等方面的探討。
在前期研究中, 本課題組以海洋光學USB2000+光譜儀和嵌入式操作系統為核心, 成功研制了用于多種水果糖度檢測的背帶式檢測裝置[10]。 雖然取得了較好的檢測結果, 但成本高, 攜帶不便。 本研究繼續以微型光譜儀為核心, 開發了成本更低, 更輕便的手持式水果糖度檢測裝置, 并在實驗室和果園環境對裝置的檢測精度進行檢驗, 同時探討了糖度模型在不同裝置間的傳遞。
水果糖度手持式可見-近紅外光譜檢測裝置硬件系統主要包括微型光譜儀、 鹵素燈、 單片機及外圍電路、 鋰電池、 OLED顯示屏等部分。 為了減小手持式裝置的體積、 節約成本, 該裝置不具備存儲光譜數據的功能, 因此在采集光譜數據時需要將裝置與計算機通過串口相連。 待模型構建并導入單片機后, 方可單獨使用。
光譜儀為微型光譜儀(C11708MA, 濱松, 日本), 波長范圍為640~1 050 nm, 該光譜儀體積小, 重量輕。 采用小型鹵素燈, 功率1.5 W。 檢測時采用漫透射方式[5], 將水果放置于探頭之上, 赤道部位緊貼中間接收孔, 鹵素燈發出的光, 經過與水果作用后, 被距鹵素燈16 mm接收孔下方的微型光譜儀接收。
單片機選用STM32單片機, 自行設計光譜儀驅動電路。 實現光譜按設定積分時間進行獲取。 為增加光譜穩定性, 獲取3次水果光譜的平均值作為最終光譜。 串口用于和上位機軟件通訊。 OLED顯示屏用于顯示水果糖度預測值。 電源容量6 000 mah鋰電池, 工作時間約為2.5~3 h。 在采集可見-近紅外光譜時常常進行白參考校正。 本研究針對開發的裝置結構, 設計了如圖1所示的白參考校正模塊。 另外, 該裝置配有遮光罩用于室外水果的光譜采集, 減少陽光等雜散光對光譜采集影響。 圖1為開發的手持式水果糖度可見-近紅外光譜檢測裝置實物圖以及配套的上位機光譜采集界面。

圖1 水果糖度手持式檢測裝置圖
檢測裝置的軟件系統基于Keil 5平臺開發, 采用C語言進行程序編寫。 實現水果漫透射可見-近紅外光譜信息的采集、 數據傳輸、 結果顯示等功能。 上位機配套LabView編寫的光譜采集軟件, 通過串口和手持式檢測裝置通訊, 通過上位機設定手持式裝置的積分時間, 完成水果光譜信息在指定積分時間下的獲取。
以大桃、 蘋果作為實驗對象。 樣機共開發兩臺, 分別編號為P-NIR-01和P-NIR-02。 2020年8月份在北京平谷大桃果園進行實驗。 借助筆記本電腦, 完成樹上水果光譜信息采集, 采集前獲取白參考光譜, 隨后將遮光罩套在探頭上方用于樹上水果光譜采集。 采集水果光譜后對樣品進行編號, 共采摘大桃150個, 積分時間設置為900 ms。 田間光譜信息采集只利用了P-NIR-01裝置。 采集完成后, 運回實驗室。 從中隨機選取110個大桃作為校正集, 剩余樣本作為預測集。 實驗室環境下的光譜采集, 同時采用上述2臺裝置獲取大桃光譜信息, 積分時間都設置為900 ms。
采取同樣方法, 采用編號為P-NIR-01裝置于2020年10月在北京昌平蘋果園獲取樹上蘋果光譜信息, 積分時間為600 ms, 共采集富士蘋果140個。 從中隨機選取100個蘋果作為校正集。 運回實驗室后采用2臺裝置進行光譜信息采集, 采集參數同樣設置為600 ms。
在實驗室采集條件下, 研究了模型在上述2臺裝置間的傳遞。 選擇P-NIR-01作為主機(也稱作源機), P-NIR-02作為從機(也稱作目標機)。 從校正集光譜中選取一定數量樣本作為標準樣品, 用于確定主機光譜與從機光譜的對應關系。 主機對應的校正集用于模型構建, 主機的預測集用于對模型的檢測精度進行評價, 從機的預測集用于模型傳遞的評價。
光譜采集完成后, 從光譜采集的赤道部位切取厚度為10 mm左右帶果皮果肉, 經紗布過濾擠汁后, 滴到折光儀(PAL-1, ATAGO, 日本)鏡面, 讀數并記錄。 結果如表1所示。

表1 水果糖度實測值
由于采集的光譜信息在波段首尾兩端均存在較大噪聲, 因此選擇600~950 nm范圍進行后續分析。 首先參照式(1)對原始光譜數據進行白校正得到透射率光譜(Transmittance)。
(1)
式(1)中, Sample為采集到的水果原始光譜, White為白板蓋放置在探頭上方時獲取的白參考光譜。 由于原始光譜數據中存在諸多噪聲、 毛刺等干擾信號, 采用包括5點平均平滑、 歸一化、 標準變量變換、 一階導數(窗口寬度21)、 二階導數(窗口寬度37)對光譜進行處理。
分段直接校正算法(piecewise direct standardization, PDS)是在直接校正算法基礎上開發的用于模型傳遞的算法[11]。 采用Kennard-Stone算法從主機校正集光譜中, 分別選擇5, 10, …, 75, 80個樣本作為標準樣進行比較。 同時考察窗口寬度(w)為3, 9, 15, 21, 31對傳遞結果的影響。 基于典型相關分析(canonical correlation analysis, CCA)的模型傳遞算法是依據CCA分析而提出的。 借助CCA可以提取兩組光譜之間的線性關系, 實現光譜在主機與從機間的傳遞, 并消除噪聲以及干擾信息的影響[12]。
本研究模型分析采用偏最小二乘算法, 并以校正集樣本10折交互驗證均方根誤差(RMSECV)最小值來確定最佳預處理方法和最佳建模主因子數[13]。 模型的評價采用校正集相關系數(Rc)和校正均方根誤差(RMSEC), 以及預測相關系數(Rp)和預測均方根誤差(RMSEP)。
2.1.1 主機校正集光譜分析
對主機采集到的蘋果、 大桃校正集光譜數據, 經過預處理算法后的PLS建模比較發現, 對于蘋果采用5點平滑結合最大值歸一化的預處理方式結果較好[圖2(a)], 交互驗證相關系數和RMSECV分別為0.885和0.628%, 最佳主因子數為9。 對于大桃采用37點的二階導數處理方式結果較好[圖2(b)], 交互驗證相關系數和RMSECV分別為0.813和0.590%, 最佳主因子數為11。 將模型系數及相應的預處理算法寫入檢測程序以對預測集樣本進行直接預測。

圖2 經過預處理后的蘋果及大桃的透射率光譜
2.1.2 裝置預測精度驗證
直接利用主機裝置對預測集的樣本進行預測, 采集前, 首先獲取白參考光譜。 然后將預測集樣本依次放置在探頭上方, 點擊觸發按鍵, 即可在顯示屏獲取水果糖度預測值, 讀數后記錄。 同時, 原始光譜數據通過串口傳輸到電腦端保存。 待所有水果預測完成后, 采用1.4節方法, 獲取預測集樣本檢測部位實際糖度值并記錄。 檢測結果如圖3(a,b)所示。

圖3 蘋果和大桃糖度真實值和預測值散點圖
對于蘋果糖度檢測,Rp和RMSEP分別為0.92和0.587%。 對比前期文獻檢測結果[12], 證明該裝置可滿足蘋果糖度的快速、 有效分析。 而對大桃糖度預測, 與前期近紅外光譜大桃糖度檢測結果相比略差, 可能是由于在該研究中, 大桃糖度主要集中在11%~15%這一較窄范圍造成預測相關系數偏低。 另外, 大桃品種的差異、 所用光譜儀的波段范圍也會對檢測精度產生影響。
2.1.3 主機模型到從機傳遞結果
圖4為PDS算法傳遞后, 不同標準樣本數量和不同窗口寬度對應的從機Rp值的變化。 從圖中可以看出, 不同參數組合對Rp值的影響較大。 對于蘋果糖度模型傳遞結果[圖4(a)], 當窗口寬度為21, 標準樣本數量為50時,Rp值最大為0.891, 此時對應的RMSEP為0.657%。 而對于大桃糖度模型的PDS傳遞結果[圖4(b)], 當窗口寬度為31, 標準樣本數量為65時, 此時Rp最高為0.778, RMSEP為0.725%。

圖4 PDS算法后從機Rp在不同窗口寬度和標準樣本數量下的變化
圖5為經過CCA算法傳遞后, 從機對預測集樣本的預測結果。 對于蘋果糖度模型的傳遞結果, 當標準樣本數量為50時, 此時對應最優結果,Rp和RMSEP分別為0.883和0.641%, 如圖5(a)所示, 與PDS傳遞結果相差不大。 而對于大桃糖度模型傳遞結果, 當選取45個樣本作為標準樣本用于傳遞時取得結果最好, 此時Rp和RMSEP分別為0.805和0.626%, 見圖5(b)。 與PDS傳遞結果相比有了較大提升。 經過模型傳遞算法, 將主機的模型用于從機糖度預測, 結果是可行的, 雖然檢測精度略有下降, 但從后續設備的批量開發, 減少建模工作量、 提升開發效率還是具有積極意義的。

圖5 采用CCA算法后從機Rp和RMSEP隨不同標準樣本數量的變化
將樹上采集到的水果光譜數據代入上述實驗室條件下建立的模型。 圖6(a,b)分別展示了使用實驗室環境下構建的蘋果、 大桃糖度預測模型對樹上140個水果糖度的檢測結果。 對大桃的檢測精度與實驗室條件檢測結果基本一致。 對于蘋果糖度的預測, 除去圖中一個異常樣本外,Rp提高到0.894, RMSEP下降到0.633%, 接近實驗室條件下預測精度。 上述結果證明, 利用開發的檢測裝置及配套的遮光罩, 以及相應的光譜預處理方法, 可以實現實驗室環境下構建的模型對樹上水果糖度的有效檢測。

圖6 蘋果和大桃糖度檢測真實值和預測值散點圖
基于微型光譜儀開發的手持式水果糖度便攜式檢測裝置, 可用于蘋果、 大桃糖度的無損、 快速分析, 在實驗室環境下對蘋果和大桃的預測集Rp和RMSEP分別為0.925, 0.587%和0.821, 0.613%。 相對于分段直接校正算法, 基于CCA模型傳遞方法, 在該樣機上取得了更好的模型傳遞結果。 針對主機建立的用于蘋果和大桃糖度預測的模型, 傳遞到從機后,Rp和RMSEP分別為0.883, 0.641%和0.805, 0.626%, 見圖5(b)。 可以滿足從機對蘋果、 大桃糖度的有效檢測, 實現了可見-近紅外光譜糖度模型在該裝置間進行共享和傳遞。 配合設計的遮光罩, 直接采用實驗室條件下的光譜數據構建的模型預測樹上水果糖度, 對蘋果、 大桃糖度預測的Rp和RMSEP分別為0.866, 0.741%和0.816, 0.627%, 可以實現實驗室條件下建立的模型對田間樹上水果糖度的檢測。