秦 楷,陳 剛,張劍一, ,傅霞萍*
1.浙江理工大學機械與自動控制學院,浙江 杭州 310018 2.德菲洛(杭州)科技有限公司,浙江 杭州 310014
蘋果富含礦物質、維生素、多酚及黃酮類等營養物質,營養價值高,口味酸甜,是很受消費者喜愛的一種水果。蘋果種植過程中會出現很多病癥,霉心病(又稱心腐病)就是其中一種,該病由多種病原菌引起,病菌主要通過花萼傳播危害果實健康,在發病初期會在蘋果心室附近出現褐色斑點,惡化后會變成白色或粉色霉狀物,較為嚴重的會導致心室腐爛并逐步向外擴散[1]。感染霉心病的蘋果一般是不能食用的,因此在銷售蘋果前需要剔除病果。傳統的霉心病判別方法往往結合經驗進行破壞性抽樣,費時費力且準確率低不適合當前水果生產銷售的實際。尋找一種水果內部病變的無損檢測方法以及建立水果內部品質快速、準確的智能分選線符合目前市場需求,近年來行業內越來越多的企業已經陸續開始做多品類、大規模、針對內在品質的水果分級。
可見近紅外光譜分析技術是一項高效、低成本、無污染的無損檢測技術,已經廣泛應用于農業、食品業、醫藥業及礦業等各行各業。近年來,國內外不少學者也利用可見近紅外光譜分析技術開展水果病害的快速無損檢測研究,其中涉及內部病變檢測的如:Khatiwada等[2]利用該技術對在大氣中儲藏的蘋果內部褐變病癥進行了預測,采用LDA,PLS-DA,SVM和邏輯回歸4種判別方法,結果顯示PLS-DA效果最佳;Shenderey等[3]在現有的微型光譜分析儀的基礎上,研制了一套適合于在線近紅外光譜測量的儀器,采用偏最小二乘回歸(PLSR)方法在線檢測蘋果霉心病;Sun等[4]利用可見近紅外光譜在600~904 nm范圍內,通過相關分析選取兩個特征波段用于判別褐心梨;Mogollonca等[5]采用偏最小二乘和支持向量機方法建立了定性和定量模型,預測“Cripps Pink”蘋果內部是否褐變及褐變面積;Zhou等[6]提出了一種基于透光光譜的蘋果霉變快速無損檢測方法, 采用人工神經網絡(ANN)和SVM兩種分類算法建立模型,利用遺傳算法(GA)對模型參數進行優化,判定蘋果核是否霉變;采用透射光譜區分霉心病健康果和病果時果徑會對預測結果產生影響,為解決這一問題,Tian等[7]提出了一種基于果實大小的光譜校正方法,通過計算透射光在蘋果內部的消光系數對透射譜進行了修正,從而得到更好的判別效果。Hu等[8]通過連續投影算法(SPA)選擇出區分健康蘋果和霉心病蘋果的最佳波長,將提取的波長作為反向傳播人工神經網絡(BP-ANN)的輸入建立判別模型。
在上述研究基礎上,本研究針對蘋果在線檢測中不同擺放姿態對光譜采集的影響,開展了果實姿態對霉心病檢測的影響分析,通過采用不同算法建立多種判別模型進行對比分析,實現蘋果霉心病光譜在線檢測的擺放姿態及建模方法優化。
樣品是產自中國陜西省洛川縣的紅富士蘋果,在洛川當地選購后快遞運往實驗室。剔除有明顯外部損傷的果實后,最終選出96個蘋果樣品用于本次檢測。測量所有樣品外觀參數后用標簽標注,放置在實驗室內等待第二天的檢測。
采用帶暗箱的傳送裝置,將蘋果樣本置于托盤上方,由傳送帶輸送至檢測位置,鹵素光源(12 V,100 W)布置在傳送帶兩側,透射光由下方的檢測探頭收集,與之連接的光纖將信號傳輸至微型可見近紅外光譜儀(QE65Pro,Ocean Insight,FL,USA),整個檢測單元置于暗箱中以避免環境光影響,暗箱兩側留有樣品進出口。光譜儀通過USB數據線連接電腦,使用SpectraSuite軟件(Ocean Insight,FL,USA)查看和存儲光譜。為考察蘋果樣品擺放姿態對檢測結果的影響,每個樣品采集4次光譜,分別對應4種擺放姿態:豎放柄朝上、豎放柄朝下、橫放柄朝輸送方向和橫放柄垂直輸送方向。96個樣品對應4種擺放姿態共獲得384條光譜。
光譜采集完成后,將蘋果沿果柄蒂軸對半切開觀察心室是否霉變(如圖1所示),將健康果歸于1類、霉心病果歸于2類。基于獲取的光譜及有損檢測獲得的霉心病果判據,開展蘋果霉心病的判別分析,取2/3樣本作為校正集、1/3樣本作為預測集。采用線性判別分析[9]、馬氏距離判別[10]、偏最小二乘判別[11-12]、K近鄰法[13]、極限學習機[14]和支持向量機[15]對4種擺放姿態分別建立判別模型并對比判別效果(以判別準確率為指標)。數據分析主要采用MATLAB(R2016a,The MathWorks,Natick,MA,USA)軟件開展。

圖1 健康果(左)和霉心病果(右)心室對比示意圖
經統計,96個樣品中包含78個健康果和18個霉心病果。樣品外部參數指標如表1所示。

表1 健康果和霉心病果的外觀參數統計
基于所采集的全部樣品4種擺放姿態的透射光譜,分別計算健康果和霉心病果4種擺放姿態的平均透射光譜,結果如圖2所示,可以發現在400~600 nm 間存在較高的噪聲,而900 nm之后樣品的透射率幾乎為零,因此選取600~900 nm的透射光譜進行分析。4種擺放姿態的健康果的平均透射光譜在600~900 nm波段內整體都高于病果的平均透射光譜,尤其是在710 nm附近健康果的透射光譜峰值明顯高于病果,可能是因為病果果實內部霉變組織的吸收較大所致。

圖2 健康果和病果4種擺放姿態下的平均透射光譜
基于600~900 nm的透射光譜信息,結合主成分分析提取的主成分(PCs)建立的LDA,MD和KNN三種判別模型,其中KNN算法中k=7,表示對于一個需要預測的輸入向量x,我們只需要在訓練數據集中尋找7個與x最近的向量的集合,然后把x的類別預測為這7個樣本中類別數最多的那一類。表2顯示三種判別模型提取的主成分數以及訓練集和預測集的判別效果,4種擺放姿態的LDA判別模型預測集的判別準確率最高的是豎放柄朝上擺放為90.63%,有3個健康果被誤判為病果,整體來看LDA模型豎放柄朝上擺放和豎放柄朝下擺放的判別效果明顯優于橫放柄朝輸送方向和橫放柄垂直輸送方向擺放時的效果;MD模型4種擺放姿態的判別效果差別不大,預測集判別準確率都達到87.50%,雖然MD模型對健康果沒有產生誤判但其對病果的識別效果較差;KNN模型中預測集的判別準確率最高的是豎放柄朝下的90.63%,相對判別效果較差的橫放柄朝輸送方向擺放和橫放柄垂直輸送方向擺放的預測集判別準確率也可達到80%以上。

表2 基于4種擺放姿態透射光譜(600~900 nm)提取主成分后的線性判別分析(LDA)、馬氏距離(MD)和K近鄰法(KNN)三種判別模型結果的比較
通過對LDA,MD和KNN三種判別模型的比較,從表2中各項數據可以看出LDA模型和KNN模型豎放柄朝上擺放和豎放柄朝下擺放的判別效果相比其他兩種擺放姿態都更好,在三種判別模型中效果最佳的是LDA模型的豎放柄朝上擺放。
對600~900 nm的透射光譜進行中心化預處理后建立的PLS-DA模型結果如表3所示,當蘋果豎放柄朝上擺放和豎放柄朝下擺放檢測時預測集的判別準確率最高為93.75%,蘋果橫放柄垂直輸送方向進行檢測所建立的判別模型效果相對其他三種擺放姿態較差。

表3 基于4種擺放姿態透射光譜(600~900 nm)的偏最小二乘判別分析(PLS-DA)結果
600~900 nm的透射光譜經歸一化處理后,使用ELM和SVM兩種機器學習算法建立的判別模型結果如表4所示,對于ELM模型選用sigmoid函數為極限學習機的激活函數并設置隱含層神經元個數為20,當蘋果豎放柄朝上、橫放柄朝輸送方向和橫放柄垂直輸送方向的預測集判別準確率都為90.63%,有2個病果和1個健康果被錯判,其余三種擺放姿態的預測集的判別準確率也都高于85%;建立SVM模型時利用交叉驗證的方法獲得最優的懲罰參數c和核函數的參數g,通過表4可知,果柄朝上擺放時預測集判別準確率最高為96.88%,預測集只有1個病果被錯判。

表4 基于4種擺放姿態透射光譜(600~900 nm)的極限學習機(ELM)和支持向量機(SVM)兩種判別模型的比較
通過對上述6種判別模型預測集判別效果的匯總結果如圖3所示,LDA和SVM模型的4種擺放姿態的預測集判別率最佳的是豎放柄朝上擺放,MD和ELM模型的4種擺放姿態的判別效果接近,KNN模型除了橫放柄朝輸送方向擺放時判別效果較差其余3種擺放姿態的預測集判別率都超過87%,PLS-DA模型的最佳擺放姿態為豎放柄朝上擺放和豎放柄朝下擺放,整體來看豎放柄朝上擺放在不同的判別模型中都有不錯的判別效果,這可能與在線檢測裝置中光源和檢測探頭的位置布置有關。

圖3 預測集的6種判別模型效果(a)及病果錯判為健康果個數(b)對比圖
從建模方法來看PLS-DA的判別效果優于其他方法,其中PLS-DA模型的豎放柄朝上和豎放柄朝下的判別準確率都為93.75%,通過6種判別模型預測集病果錯判為健康果個數結果對比,PLS-DA判別模型的豎放柄朝上的擺放姿態沒有誤判果,可以很好的識別出預測集中所有的病果。
蘋果霉心病PLS-DA判別模型的變量投影重要性指標(VIP)得分值分布如圖4所示,在710 nm附近得分值達到峰值,因此進一步選擇690~720 nm作為特征波段建立PLS-DA判別模型,由表5所示結果可知,豎放柄朝上和豎放柄朝下時預測集的判別準確率為93.75%。4種擺放姿態在690~720 nm波段范圍的預測集判別準確率均大于80%,這為采用LED燈代替鹵素燈檢測蘋果霉心病的可行性提供了依據。

圖4 PLS-DA判別模型不同波長的VIP得分值分布

表5 基于4種擺放姿態透射光譜(690~720 nm)的偏最小二乘判別分析(PLS-DA)結果
基于600~900 nm波段4種擺放姿態的透射光譜提取主成分后建立的LDA,MD和KNN判別模型都有著不錯的判別效果,其中LDA模型對應豎放柄朝上擺放姿態的預測集判別準確率最佳為90.63%,LDA和KNN模型豎放柄朝上和豎放柄朝下的判別效果都優于橫放柄朝輸送方向和橫放柄垂直輸送方向。基于600~900 nm建立的PLS-DA判別模型4種擺放姿態的預測集判別準確率都大于80%,并且豎放柄朝上和豎放柄朝下的判別準確率都是大于其余兩種擺放姿態。還建立了ELM和SVM兩種機器學習算法判別模型,從預測集判別準確率和病果錯判個數觀察效果最佳都是豎放柄朝上的姿態。
綜合以上建立的6種判別模型來看,豎放柄朝上擺放在不同的判別模型中都有不錯的判別效果,這可能與在線檢測裝置中光源和檢測探頭的位置有關。從建模方法來看,4種擺放姿態整體判別效果最好的PLS-DA模型,再通過其VIP得分值提取特征波段690~720 nm后重新建立PLS-DA判別模型,豎放柄朝上和豎放柄朝下的預測集判別準確率都達到93.75%,其中豎放柄朝上擺放檢測到的光譜建立的模型篩選病果的能力達到最佳,全部病果都能被判別出,因此豎放柄朝上擺放檢測是一種合理有效的蘋果霉心病在線檢測姿態。