馬文強 張漫 李源 李民贊 楊莉玲 朱占江 崔寬波



摘 要 采用光譜與圖像相結合,實現了核桃仁蛋白質和脂肪含量預測及基于完整度和色澤的核桃仁外觀品質分級。選用新疆“溫185”核桃仁,采集了862.9~1704.02 nm和382.19~1026.66 nm范圍高光譜圖像。采用多元散射校正(MSE)和標準正態化(SNV)方法進行預處理后,通過競爭性自適應重加權采樣算法與相關系數法,對核桃仁樣品的蛋白質含量、脂肪含量、總色差3個參數進行了特征波段篩選。通過偏最小二乘回歸(PLSR)算法建立了全光譜波段與特征光譜波段的蛋白質和脂肪含量預測模型,與全光譜波段相比,蛋白質含量特征波段預測模型的驗證集決定系數(R2)由0.66增長到0.91,均方根誤差(RMSEP)由1.37%下降到0.78%; 脂肪含量特征波段預測模型的驗證集R2由0.83增長到0.93, RMSEP由0.98%下降到0.47%。在外觀品質方面,采用全光譜波段、RGB光譜波段、總色差特征光譜波段為輸入,采用決策樹、K近鄰和支持向量機算法建立了核桃仁外觀品質分類模型。通過對比發現,采用總色差特征波段建模,可大幅減低冗余信息的干擾,同時分類準確率也高于RGB波段; 在光譜信息的基礎上加入圖像統計特征參數信息,能夠進一步提升分類的準確率,當采用決策數算法建立的色澤分類模型時,模型具有最高的分類準確率(98.6%); 分類算法方面,當輸入變量數目較少時,決策樹算法在分類準確率和速度方面都具有明顯的優勢。利用高光譜技術可以實現核桃仁內部品質檢測與外觀分級,為核桃仁品質無損檢測的提供了新的理論依據。
關鍵詞 核桃仁; 高光譜圖像; 無損檢測; 分類; 特征波段
1 引 言
核桃是一種老幼皆宜的堅果食品和重要的木本油料作物,我國核桃種植面積及產量均居世界首位[1]。核桃仁品質檢測與分級是核桃生產加工的重要環節。按照國家相關標準[2-3]的規定,核桃仁外觀品質指標包括完整度和表皮色澤,內部品質指標包含脂肪含量和蛋白質含量。實際生產中核桃仁分級主要依靠外形和色澤進行人工挑選,生產成本高,分級隨意性大,難以對內部品質進行分辨。傳統的化學檢測對樣品具有破環性,檢測時間也較長,難以適應現代化生產要求。
機器視覺和近紅外光譜是農產品品質研究中采用較多的技術手段。在采用機器視覺進行核桃仁分級方面,申愛敏等[4]以統計出的灰度圖像核桃仁的面積為依據,采用閾值法自動識別核桃仁等級,分級正確率大于90%。蔡建等[5]提取了核桃仁圖像在HSV顏色空間的顏色直方圖、飽和度與明度的一、二階距、最小外接矩形長寬比、輪廓面積與最小外接圓面積比等色澤與外觀參數,采用決策樹(Decision tree, DT)算法進行核桃仁分級預測建模,總體正確率達到92%。周軍等[6]在此基礎上進一步加入了顏色距、圖像幾何不變距等顏色和外觀特征,并采用最大相關最小冗余算法對特征變量進行篩選,通過樸素貝葉斯(Native Bayesian, NB)分類算法對核桃仁等級進行建模預測,分級正確率達到97.33%。在采用近紅外光譜進行核桃仁內部品質檢測方面,郝中誠等[7]采用了標準正態化預處理和偏最小二乘回歸(Partial least squares regression, PLSR)算法建立了核桃殼、仁近紅外光譜與含水率的預測模型,模型平均偏差達到了0.35%。本研究組前期采用近紅外光譜技術開展了核桃仁品種分類及蛋白質含量預測研究,采用主成分分析(Principal component analysis, PCA)與支持向量機(Support vector machine, SVM)相結合的方法對4個不同品種的核桃仁樣品近紅外光譜進行分類,總體正確識別率達到 96%; 進一步采用間隔偏最小二乘(Interval partial least squares, IPLS)算法對核桃仁蛋白質含量特征波段進行篩選,并建立了核桃仁蛋白質含量偏PLS預測模型, 針對驗證集的均方根誤差和相關系數分別為0.021和0.913[8,9]。核桃仁品質檢測中需要對核桃仁內外部品質做出整體評價,但兩種技術都無法同時反映被測樣品的外觀與內部品質信息。
高光譜成像同時包含了圖像和光譜兩種技術方法,其原理是采用高光譜成像設備對拍攝對象的反射光在光譜范圍內進行細分,然后采集每個對應光譜波段的圖像信息,最終獲得具有三維數據的高光譜圖像信息。高光譜圖像不僅可以獲得圖像中每個點的光譜信息,而且可以獲得任意光譜波段的圖像,可以直觀地顯示出被拍攝對象的外觀特征、光譜特征、顏色特征、紋理特征等豐富的信息,因此,在農產品品質檢測方面的研究日益廣泛[10~14],目前已應用于油料[15]、肉類[16]、水果[17]、種子[18]、飲料[19]等農產品的無損檢測及分類方面。但是,由于成分、形狀的不同,以上成果無法直接用于核桃仁內外部品質檢測及分類。目前,采用高光譜技術進行核桃品質檢測的研究主要集中于核桃殼仁分類[20],針對核桃仁品質的研究尚未見相關報道。
基于以上分析,為了探索同時實現核桃仁內部品質檢測和外觀等級分類的方法,本研究采用高光譜成像技術開展了核桃仁脂肪含量、蛋白質含量及色澤的特征光譜篩選,篩選出了品質指標的相關特征波段,進一步建立了核桃仁脂肪含量和蛋白質含量PLS預測模型,并采用DT算法建立了基于完整度和表皮色澤的核桃仁外觀等級分類模型,取得了較好的預測和分類效果,以期為核桃仁品質無損檢測的應用提供參考。
2 實驗部分
2.1 實驗樣本及其處理
實驗樣品選用新疆“溫185”核桃,含水量為7%,實驗前于4℃儲藏約5個月。手工破殼取仁,選取核桃仁樣品60枚,包含半仁、1/4仁和碎仁3個完整度等級和淺黃色、淺琥珀色、琥珀色3個色澤等級,核桃仁樣本不同外觀等級示例如圖1所示,樣品外觀等級分布情況如表1所示。通過高光譜成像設備采集高光譜圖像后,使用色差儀采集每個核桃仁樣品5個不同位置的總色差,計算其平均值ΔE,并將核桃仁樣品的色澤類型按照測量計算出的總色差ΔE進行劃分,其中: 淺黃色仁ΔE≥68,淺琥珀色仁60≤ΔE<68,琥珀色仁ΔE<60。按照食品安全國家標準GB5009.5-2016和GB 5009.6-2016要求,采用Foss全自動凱氏定氮儀測量每個樣品的蛋白質含量,采用索氏提取器測量脂肪含量。
2.2 高光譜圖像采集
高光譜圖像采集設備為北京卓立漢光公司生產的Gaia Sorter高光譜成像儀,儀器結構如圖2所示,主要由成像光譜儀(V10E)、鏡頭(OL23)、CCD(LT365)、均勻光源(2套溴鎢燈)、電控移動平臺、計算機及軟件控制系統組成。開機后首先進行預熱,以消除基線漂移造成的影響; 預熱后進行鏡頭調焦并調試平臺移動速度以避免圖像失真。采用圖像采集軟件Spectra View采集核桃仁成像信息,分別在863~1704 nm和382~1027 nm光譜范圍采集核桃仁樣品高光譜圖像,兩個光譜范圍內的光譜分辨率分別為3.2和0.84 nm。
為了消除光照不均勻、周圍環境以及儀器暗電流造成的噪聲影響,需要在采集樣本高光譜圖像前,分別利用標準白板和鏡頭蓋采集白背景信息(Iw)和黑背景信息(Ib),然后按照公式(1)對采集的樣本原始高光譜圖像(I0)進行黑白校正,得到校正后的圖像信息(I)。
其中,I為校正后的圖像信息; I0為原始高光譜圖像; Iw為白背景信息; Ib為黑背景信息。
2.3 光譜數據預處理與特征波段篩選
采用ENVI5.1軟件對核桃仁樣品高光譜圖像進行感興趣區域(Region of interesting, ROI)提取,計算出感興趣區域光譜平均值作為樣品光譜信息,然后使用Matlab R2015a軟件進行后續處理。原始光譜中含有較多的環境背景噪聲信息,因此進一步采用多元散射校正(Multivariate scatter correction, MSE)和標準正態化(Standard normalized variate, SNV)的組合方法對原始光譜信息進行預處理。
全光譜波段數據中包含較多與感興趣參數相關度較低的無關信息及冗余數據,因此需要進一步進行特征波段篩選,以提高光譜數據信噪比,降低計算數據量。競爭性自適應重加權算法(Competitive adaptive reweighted sampling, CARS)是近年應用較多的一種新型特征波段篩選算法,可以快速有效剔除全光譜波段內的無關數據,但CARS算法獲得的特征波段中仍存在冗余信息。本研究針對核桃仁蛋白質含量、脂肪含量和總色差3個參數,采用CARS算法與相關系數法(Correlation coefficient method, CCM)相結合的方法在對應的全光譜波段范圍內進行了特征波段篩選,步驟如下: (1)去除了前段和后段受系統噪聲影響較大個波段點后,采用CARS算法針對感興趣的預測參數進行特征波段篩選; (2)計算篩選出的特征波段中所有波段兩兩組合的相關系數絕對值; (3)設定相關系數絕對值閾值為0.9,統計任一波段與其它波段相關系數絕對值≥0.9的數目; (4)剔除與其它波段相關系數≥0.9數目最多的波段,并返回步驟(2)重新統計; (5)當所有波段兩兩組合的相關系數絕對值都小于0.9時, 結束優選。
2.4 核桃仁品質檢測方法
2.4.1 核桃仁內部品質檢測方法 為了減小光譜獲取及品質參數化學檢測中測量誤差的影響,采用馬氏距離((Mahalanobis distance, MD)法對測量值異常的樣品信息進行剔除。具體方法是: 分別計算每個樣本光譜信息和化學測量值到樣本集中心的MD,然后統計樣本集MD的均值μ和均方差σ,以μ+3σ為閾值,將MD大于閾值的樣本作為異常樣本剔除。剔除異常樣品信息后,通過隨機抽樣法按2∶1的比例將樣本劃分為校正集和驗證集。針對蛋白質含量和脂肪含量,分別建立全光譜波段和特征光譜波段的PLSR模型,采用決定系數R2和均方誤差(Root mean square error, RMSE) 對模型進行評估。
2.4.2 核桃仁外觀等級鑒別方法 核桃仁表皮色澤和完整度等級是進行核桃仁外觀等級鑒別的關鍵因素。首先,在核桃仁表皮色澤等級識別方面,由于總色差是反映核桃仁表皮色澤的直接參數,而總色差特征波段與總色差參數具有很高的相關性,因此提取了總色差特征波段的灰度圖像,用于進一步圖像處理。同時為了比較與RGB(475、550和650 nm)圖像在核桃仁色澤鑒別中的差異,也提取了RGB圖像用于對比處理。不同色澤等級的樣品在圖像灰度分布統計量和灰度共生矩陣統計量存在差異,也可以用于不同色澤等級樣品的分類。本研究通過計算總色差特征波段平均灰度圖像和RGB灰度圖像的灰度分布統計量(均值、標準差、平滑度、一致性、熵、三階矩)和灰度共生矩陣統計量(對比度、相關性、能量、熵)共10個作為圖像統計特征參數,用于核桃仁色澤等級分類。以全光譜波段信息、RGB光譜波段信息、總色差特征光譜波段信息以及光譜信息與圖像統計特征參數的組合為輸入變量,以樣品色澤等級標簽為輸出變量,建立了DT算法、K近鄰(k-Nearest neighbor, KNN)算法和SVM3種色澤分類模型,其中,KNN算法中K=4,SVM采用線性核函數。建立模型時,通過隨機抽樣法按2∶1的比例劃分訓練集和驗證集,以10次隨機抽樣劃分的驗證集分類準確率平均值作為模型分類平均準確率由于對分類模型進行評估。在核桃仁外觀完整度等級分類方面,本研究對總色差特征波段灰度圖像進行otsu閾值分割和先膨脹后腐蝕處理后,根據核桃仁的外形特點,選取高、寬、高寬比、面積、矩形度、圓形度6個外觀參數用于核桃仁完整度等級的分類。
以382~1027 nm范圍的全光譜信息、RGB波段光譜信息、特征波段光譜信息、圖像統計特征參數和圖像外形特征參數為輸入,以樣品完整度等級和色澤等級為輸出,采用DT、KNN和SVM進行外觀品質鑒別分類建模。采用10次抽樣的驗證集平均分類準確率對分類模型進行評估。最終按照相關行業標準[2]的規定, 將樣本外觀依據完整度與色澤分為7個等級。
3 結果與討論
3.1 基于光譜信息的核桃仁內部品質指標檢測
核桃仁樣品在近紅外區域(863~1704 nm)的平均光譜信息及預處理后的光譜信息如圖3所示.樣品原始光譜信息總體特征基本一致,除了水分的吸收峰外,其它成分的吸收峰并不明顯,需要對光譜進行進一步處理。通過MSE和SNV組合的預處理方法,去除了部分背景噪聲的影響,使樣品光譜信息更平滑。同時,進一步增強了光譜信息的一致性,突出了光譜峰谷,使光譜特征得到了強化。
采用CARS和CCM算法相結合對樣本蛋白質含量測量值和脂肪含量測量值進行特征波段篩選。圖3B中紅色虛線標記為與樣本蛋白質含量相關的特征波段,藍色虛線標記為與樣本脂肪含量相關的特征波段。最終篩選出與樣本蛋白質含量相關的6個特征波段,與樣本脂肪含量相關的7個特征波段,其中,1269 nm為與蛋白質和脂肪含量共同相關的特征波段,篩選出的特征波段共計12個,具體對應的波長見表2。
采用MD法進行異常樣品信息剔除。樣本光譜信息、蛋白質含量測量值和脂肪含量測量值的MD分布如圖4所示,紅色實線是閾值為μ+3σ的判別線,下方為正常樣本,紅線上方為測量信息異常的樣本。剔除了光譜信息測量異常樣品1例,蛋白質含量測量異常樣品2例,脂肪含量測量異常樣品2例,共計剔除異常樣品5例。
剔除異常樣本后,將剩余的樣本按2∶1的比例隨機抽樣劃分為校正集和驗證集。針對樣本蛋白質含量和脂肪含量分別建立全光譜波段和特征光譜波段的PLSR預測模型,其中模型主成分數為5,模型預測效果如表3所示,圖5為采用特征波段建立的蛋白質和脂肪含量預測模型的預測結果分布圖。由圖5和表3可見,與全光譜信息相比,采用特征波段建模,模型的決定系數(R2)和RMSE都有了明顯的改善,蛋白質含量預測模型的驗證集R2由0.66增長到0.91,RMSEP由1.37下降到0.78; 脂肪含量預測模型的驗證集R2由0.83增長到0.93,RMSEP由0.98下降到0.47。說明采用CARS算法與相關系數法結合,篩選出的特征波段有效的降低了全光譜信息的復雜度,提高了建模質量。
3.2 基于光譜信息與圖像特征的核桃仁外觀等級分類
圖6為3種色澤核桃仁樣品在可見光和短波近紅外區域(382~1027 nm)的平均光譜曲線,由于光譜前后段噪聲影響較大,因此去除了前段和后段各20個波段點。由圖6可見,在原始光譜中,3種色澤核桃仁樣品的光譜曲線在可見光范圍內光譜反射率隨著色澤由淺到深呈現明顯的下降趨勢,在近紅外范圍內光譜較雜亂。經過MSC和SNV組合方法預處理后的光譜信息,光譜反射率呈現出一定的規律性和一致性,有助于后續的光譜處理。
對樣本全光譜信息進行了特征波段篩選,篩選出的總色差特征波段為402.5和689.2 nm,位置分布如圖6B中虛線位置所示。提取的總色差特征波段圖像與RGB圖像的圖像統計特征參數后,以光譜信息與圖像統計特征參數的組合為輸入變量,采用決策樹算法、K近鄰算法和支持向量機3種分類算法建立色澤分類模型,模型分類平均準確率如表4所示。
由表4可知,當采用圖像統計特征參數與總色差特征波段光譜信息的組合為輸入變量時,采用DT算法建立的色澤分類模型具有最高的分類準確率(98.6%)。在輸入變量方面,由于全光譜波段中包含大量無關的冗余信息,參與建模時降低了模型準確率。采用總色差特征波段建模,大幅減低了冗余信息的干擾,提高了建模效率,同時,采用總色差特征波段建模的分類準確率也高于RGB波段。圖像統計特征參數反映了樣本圖像的色澤和紋理變化,屬于有效的分類信息,因此,在總色差特征波段光譜信息與RGB波段光譜信息的基礎上加入圖像統計特征參數,能夠進一步提升分類模型的準確率。在輸入變量方面,當采用全波段光譜信息為輸入時,輸入變量數目較多,采用SVM算法的分類模型準確率高于決策樹和KNN算法; 當輸入變量數目為總色差特征波段及總色差特征波段與圖像信息的組合時,輸入變量數目大幅減少,此時DT算法在模型分類準確率和分類計算速度方面都具有明顯的優勢。
對總色差特征波段平均灰度圖像進行otsu閾值分割二值化、先膨脹后腐蝕處理,以淺黃色、淺琥珀色和琥珀色3種核桃整仁圖像為例,處理結果如圖7所示,處理后的圖像可以完整地將核桃仁與背景完全分割,有利于進一步在此基礎上提取核桃仁圖像的外觀參數。提取核桃仁外觀參數后,以外觀參數為輸入,樣本完整度等級為輸出,采用DT算法建立核桃仁完整度分類模型。進一步按照文獻[2]規定,結合核桃仁樣本表皮色澤分類結果,將樣本外觀按完整度與色澤分為7個等級,分類結果見表5。由表5可知,建立的分類模型對核桃仁外觀等級分類效果較好,平均分類準確率達到了98.4%。
4 結 論
采用高光譜成像技術,開展了核桃仁內外部品質檢測方法研究,通過光譜與圖像信息相結合的方法實現了核桃仁蛋白質和脂肪含量預測以及基于完整度和色澤的核桃仁外觀品質分級。結果表明,采用CARS算法與相關系數法相結合的方式,有效的去除了全光譜波段中的無關信息和冗余信息。與全光譜波段相比,特征波段預測模型蛋白質含量的驗證集R2由0.66增長到0.91,RMSEP由1.37%下降到0.78%; 脂肪含量的驗證集R2由0.83增長到0.93,RMSEP由0.98%下降到0.47%,表明篩選出的特征波段有效降低了模型的復雜度,提高了模型預測能力。將色差特征光譜與圖像統計特征參數相結合,采用高光譜圖像提取了總色差特征波段光譜,能夠大幅降低冗余信息的干擾,提高建模效率。通過總色差特征波段光譜與圖像統計特征參數相結合的方法,與RGB波段相比進一步提升分類的準確率,當采用DT算法建立的色澤分類模型時,模型具有最高的分類準確率(98.6%)。采用高光譜圖像同時實現了核桃仁內部品質參數(蛋白質含量、脂肪含量)的檢測和外觀品質(完整度、色澤)的分類,為核桃仁品質無損檢測提供了新的解決方案。
References
1 CAO Ya-Long, JIE Bo, WANG Lei, MENG Hai-Jun, WU Guo-Liang. J. Fruit Sci.,? 2018, 35(9): 1128-1140
曹亞龍, 揭 波, 王 磊, 孟海軍, 吳國良. 果樹學報, 2018,? 35(9): 1128-1140
2 LYT 1922-2010, Walnut Kernel. Forestry Industry Standards of the People's Republic of China
核桃仁. 中華人民共和國林業行業標準. LYT 1922-2010
3 GB/T 20398-2006, Walnut Quality Grade. National Standards of the People's Republic of China
核桃堅果質量等級. 中華人民共和國國家標準. GB/T 20398-2006
4 SHEN Ai-Min, HUO Xiao-Jing, WANG Wen-Di, WANG Hong-Xia. Jiangsu Agric. Sci.,?? 2016,? 44(9): 383-385
申愛敏, 霍曉靜, 王文娣, 王紅霞. 江蘇農業科學, 2016,? 44(9): 383-385
5 CAI Jian, ZHOU Jun, SHI Jian-Xin, WANG Yong, GUO Zheng, LIU Hang. Jiangsu Agric. Sci.,?? 2018,? 46(5): 158-161
蔡 建, 周軍, 史建新, 王 勇, 郭 政, 劉 航. 江蘇農業科學, 2018,? 46(5): 158-161
6 ZHOU Jun, CAI Jian, GUO Jun-Xian, ZHANG Jing, SHI Jian-Xin, ALI Hasmu, JIANG Yan-Wu. Jiangsu Agric. Sci.,?? 2018,? 46(11): 175-179
周 軍, 蔡 建, 郭俊先, 張 靜, 史建新, 艾力·哈斯木, 姜彥武. 江蘇農業科學,? 2018,? 46(11): 175-179
7 HAO Zhong-Cheng, PENG Yun-Fa, ZHANG Hong, ZHANG Rui, ZHANG Rui-Li. J. Anhui Agric. Sci.,?? 2014,? 42(21): 7191-7193,7233
郝中誠, 彭云發, 張 宏, 張 銳, 張銳利. 安徽農業科學,? 2014,? 42(21): 7191-7193,7233
8 MA Wen-Qiang, ZHANG Man, LI Zhong-Xin. Transact. Chin. Soc. Agric. Machin.,?? 2015,? 46(S1): 128-133
馬文強, 張 漫, 李忠新. 農業機械學報,? 2015,? 46(S1): 128-133
9 MA Wen-Qiang, ZHANG Man, LI Zhong-Xin, YANG Li-Ling. Transacte. Chin. Soc. Agric. Machin.,?? 2017,? 48(S1): 407-411
馬文強, 張 漫, 李忠新, 楊莉玲. 農業機械學報 , 2017,? 48(S1): 407-411
10 Kandpal L M, Park E, Tewari J, Cho B. J. Biosyst. Engineer.,?? 2015,? 40(2): 124-136
11 Kandpal L M, Cho B. J. Biosyst. Engineer.,?? 2014,? 39(3): 215-226
12 Mishra P, Nordon A, Asaari M S M, Lian G P, Redfern S. J. Food Engineer.,? 2019,? 249(5): 40-47
13 Su W H, Bakalis S, Sun D W. Biosyst. Engineer.,?? 2019,? 180(4): 70-86
14 LI Xiao-Yu, XU Sen-Miao, FENG Yao-Ze, HUANG Tao, DING Chong-Yi. Transact. Chin. Soc. Agric. Machin.,? 2016,? 47(1): 221-226
李小昱, 徐森淼, 馮耀澤, 黃 濤, 丁崇毅. 農業機械學報, 2016,? 47(1): 221-226
15 Cheng J H, Jin H L, Xu Z Y, Zheng F P. Anal. Methods,?? 2017,? 43(9): 6148-6154
16 Wei Y Z, Wu F Y, Xu J,Sha J J, Zhao Z F, He Y, Li X L. J. Food Engineer.,? 2019,? 248: 98-96
17 Zhao H T, Feng Y Z, Chen W, Jia G F. Meat Sci.,?? 2019,? 151: 75-81
18 Fan S X, Li C Y, Huang W Q, Chen L P. Sensors,? 2018,? 18(12): 1-19
19 ZHANG Hang, YAO Chuan-An, JIANG Meng-Meng, JI Yu-Hang, LI Hua-Jie. J. Triticeae Crops,?? 2019,? 39(1): 96-104
張 航, 姚傳安, 蔣夢夢, 姬豫航, 李華杰. 麥類作物學報,? 2019,? 39(1): 96-104
20 CHEN Cai-Hong, ZHANG Shu-Juan, SUN Hai-Xia, LI Cheng-Ji, XING Shu-Hai. J. Shanxi Univ. (Nat. Sci. Edit.),?? 2018,? 38(11): 27-32
陳彩虹, 張淑娟, 孫海霞, 李成吉, 邢書海. 山西農業大學學報(自然科學版),? 2018,? 38(11): 27-32
Detection and Grading Method of Walnut Kernel Quality Based on
Hyperspectral Image
MA Wen-Qiang1,2, ZHANG Man*1, LI Yuan3, LI Min-Zan1,
YANG Li-Ling2, ZHU Zhan-Jiang2, CUI Kuan-Bo2
1(Key Laboratory of Modern Precision Agriculture System Integration Research, Ministry of Education,
College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China)
2(Agricultural Mechanization Institute, Xinjiang Academy of Agricultural Sciences, Urumqi 830091, China)
3(Soil Fertilizer and Agricultural Water Saving Research Institute,
Xinjiang Academy of Agricultural Sciences, Urumqi 830091, China)
Abstract Hyperspectral imaging technology enables rapid non-destructive inspection and grading of various agricultural products. In this work, the research on the quality detection method of walnut kernel based on hyperspectral image was carried out. The combination of spectrum and image information was used to realize the prediction of protein and fat content and the classification of the integrity and color of walnut kernel. The “Wen 185” walnuts, which were produced from Xinjiang, were shelled and prepared by different grades of integrity and color. Then the hyperspectral image of each sample was measured in the range of 862.9-1704.02 nm and 382.19-1026.66 nm by Gaia hyperspectral imager. After that, the color difference, fat content and protein content of samples were measured. Multivariate scatter correction and standard normalized variate were used to pre-processing the original spectral information. And the feature bands were screened by the method, which combined competitive adaptive re-weighting sampling (CARS) and correlation coefficient method (CCM ) algorithm, for the three parameters of protein content, fat content and total color difference of walnut kernel samples. Six feature bands related to protein content and 7 feature bands related to fat content were screened out. The internal quality parameter prediction model of the full spectrum band and the characteristic spectrum band were established by partial least squares regression (PLSR) algorithm. Compared with the full-spectrum band, the verification set coefficient (R2) of the feature band protein content prediction model increased from 0.66 to 0.91, and the mean square error (RMSEP) decreased from 1.37% to 0.78%. The verification set coefficient (R2) of the feature band fat content prediction model increased from 0.83 to 0.93, and the RMSEP decreased from 0.98% to 0.47%. It showed that the selected characteristic bands effectively reduced the complexity of the full spectrum information and improved the quality of modeling. In terms of appearance quality, the feature bands associating with the color difference were selected to be 402.5 and 689.2 nm. The full-spectral spectrum, RGB spectrum, characteristic spectrum and the combination of spectral and image information were used to establish the walnut appearance quality classification model by decision tree, K-nearest neighbor and support vector machine algorithm. It showed that the feature bands modeling greatly reduced the interference of redundant information, improved the modeling efficiency, and the classification accuracy were also significantly higher than the RGB bands by comparison. The adding image statistical feature parameter to the feature bands and RGB bands could further improve the accuracy of classification model which had the highest classification accuracy rate reached to 98.6% by decision tree algorithm. In terms of classification algorithm, the decision tree algorithm had obvious advantages in classification accuracy and calculation speed when the number of input variables was less. The used of hyperspectral technology could realize the internal quality detection and appearance classification of walnut kernels, which provided a new theoretical basis for the application of non-destructive testing of walnut kernel quality.
Keywords Walnut kernel; Hyperspectral image; Nondestructive testing; Classification; Feature band
(Received 16 August 2019; accepted 14 October 2020)
This work was supported by the Project of Renovation Capacity Building for the Young Sci-Tech Talents Sponsored by Xinjiang Academy of Agricultural Sciences (No. xjnkq-2019007), the National Natural Science Foundation of China (No.31701319) and the Science and Technology Innovation Key Cultivation Special Project of Xinjiang Academy of Agricultural Sciences (No.xjkcpy-004).
2019-08-16收稿; 2020-10-14接受
本文系新疆農業科學院青年科技骨干創新能力培養項目(No. xjnkq-2019007)、國家自然科學基金項目(No.31701319)和新疆農業科學院科技創新重點培育專項(No.xjkcpy-004)資助
* E-mail: cauzm@cau.edu.cn