范澤華, 張楠楠, 喻彩麗, 白鐵成
(1.塔里木大學信息工程學院,新疆阿拉爾 843300; 2.塔里木大學現代農業工程重點實驗室,新疆阿拉爾 843300; 3.新疆南疆農業信息化研究中心,新疆阿拉爾 843300)
駿棗是新疆大棗領域中一個極為重要的農產品,為新疆帶來了巨大的經濟效益[1]。新疆南疆地區的風沙較大,對農業種植具有巨大的影響,駿棗生長過程中也會受到風沙的影響,導致駿棗果實受到損傷[2]。
黑鐵頭病與潰瘍病是駿棗主要的2種病害[3],這2種病害會導致駿棗果皮上產生直徑2 mm左右的病斑,這種病害的病斑極小,通過人工檢測或者圖像識別技術難以保證較高的檢測準確率。桃小食心蟲是駿棗的一種蟲害[4],會導致駿棗表面產生1個直徑1~2 mm的重口,顏色為暗色,病蟲害具有極強的傳播性,所以必須盡早準確地檢測出蟲害,避免造成重大的蟲害災情與經濟損失,蟲害的蟲口極小,通過人工檢測或者圖像識別技術難以保證較高的檢測準確率。
隨著計算機技術的廣泛應用,許多研究人員將計算機技術引入農業工程技術中[5],其中在病蟲害檢測方面應用較為廣泛且有效的技術為圖像處理與機器視覺方案[6]。例如,結合原彩色圖像與補償模糊神經網絡的臍橙病蟲害識別技術[7],基于圖像規則推理的玉米病蟲草害診斷系統[8],基于圖像分析的玉米病蟲害智能化識別方法[9]。基于圖像處理的技術可以減少參與的人工,提高病蟲害檢測的效率,但是對于病蟲害癥狀不明顯的情況檢測準確率較差。駿棗的病蟲害癥狀一般僅有2 mm左右的病癥,南疆風沙對駿棗的損壞一般也是顆粒形的損傷,所以,使用圖像技術來檢測駿棗的病蟲害與風沙損傷難以獲得理想的效果。
此外,許多研究人員采用光譜技術檢測果實的病蟲害。例如,基于高光譜成像的蘋果蟲害檢測[10],基于太赫茲光譜技術的山核桃內部蟲害檢測[11]。受益于諸多研究人員的成果,光譜技術是果實無損病蟲害檢測問題的理想解決方案。病蟲害對駿棗種植的影響巨大,應當盡早地識別并摘除。本研究將近紅外光譜應用于南疆地區駿棗的病蟲害與風沙損傷檢測。首先,采集大量駿棗的近紅外光譜,采用遺傳算法從全部近紅外光譜中選擇一部分最優的光譜特征;然后,使用二次判別分析模型對選擇的光譜特征進行訓練;最終,通過支持向量機對駿棗進行病蟲害分析。
試驗地點為南疆第一師阿拉爾市十四團-數字棗園示范基地。駿棗生長過程中并未進行防蟲害處理,并且受到南疆地區的風沙影響,有些駿棗易被風沙損傷。從駿棗樹上采摘2 kg駿棗,人工挑選出病蟲害與風沙損壞的駿棗。
采摘的駿棗全部放置于實驗室的熱箱中,將駿棗保持在(25±0.5)℃,從而使得駿棗的溫度與濕度平衡,為近紅外光譜數據的采集做準備。
使用Luminar 5030型便攜式近紅外光譜儀采集駿棗的光譜,光譜儀裝備了反射后分光的光配置、1個預校準的雙光束燈與1個近紅外探測器(indium gallium arsenide,InGaAs)陣列,光譜采集的持續時間為60 ms。對每個駿棗樣本采集3次近紅外光譜數據,將平均值作為最終的試驗數據,進行進一步分析。通過文獻[12]所述的方法采用近紅外光譜儀自動測量參考光譜,使用SNAP!2.03光譜采集處理軟件采集漫反射光譜。在采集近紅外光譜之前,人工選出受損駿棗與完好的駿棗,最終將每個駿棗的光譜分類為有損光譜類與無損光譜類。
將每個駿棗的光譜數據建模為數據向量,近紅外光譜反射率作為數據向量的每個元素,即駿棗的特征值。隨機選擇50%樣本組成定標集,剩下的50%樣本分別組成預測集。從定標集的全部光譜提取光譜特征,作為分類處理階段的特征集合。圖1所示為本研究基于近紅外光譜分析的無損病蟲害與風沙損傷檢測技術的主要流程。

因為光譜數據之間存在高相關性,所以使用遺傳算法來選擇分類算法的輸入特征集,遺傳算法的優化目標是選擇描述預測器變量與響應變量關聯性的最優波段集合,即選出具有生物學意義的光譜波段。本研究使用遺傳算法獲得n個特征子集,根據文獻[13]n的范圍應為2~6,此時的特征子集是全部數據集的最優表征,為了最小化過度擬合問題,最終選擇6個特征。
本研究考慮了3個分類器,即線性判別分析(LDA)、二次判別分析(QDA)、k-近鄰算法。線性判別分析與二次判別分析分類器均基于貝葉斯規則,而k-近鄰算法使用歐氏距離作為相似性度量。將所有情況的臨界值設為標準值0.5,因此,將預測結果的概率高于0.5的輸出分類為一類,其他的輸出分為另一類。線性判別分析的線性判別函數數量應當等于類別的數量減1,因此對于2個類別的情況,應當生成1個線性判別函數。二次判別分析與線性判別分析的使用場景較為接近,一般用于類內協方差矩陣不理想的情況,對于大數據集,各類的協方差矩陣差異較大,二次判別分析的性能優于線性判別分析。線性判別分析與二次判別分析2個算法的時間復雜度與分類數量成比例關系,但是k-近鄰算法的時間復雜度對類別數量則不敏感。kNN分類器通過計算訓練集中每個樣本的距離,如果1個樣本在特征空間中的k個最近鄰樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。通過交叉檢驗方法選出最優的k個近鄰,選出的最小k個近鄰具有最小的平均誤差。本研究最終選擇二次判別分析分類器對遺傳算法選出的最優特征進行分類處理。
每個判別模型的分類結果定義為誤報率、漏報率與總誤差,使用接受者操作特征分析(receiver operating characteristics,簡稱ROC))對每個模型進行分析,繪制每個模型的ROC曲線。ROC曲線包含誤報率與漏報率:
誤報率=FP/(FP+TN);
(1)
漏報率=FN/(TP+FN);
(2)
總誤差率=(FP+FN)/(TP+FN);
(3)
敏感性=TP/(TP+FN)。
(4)
式中:FP表示被模型預測為正的負樣本;TN表示被模型預測為負的負樣本;FN表示被模型預測為負的正樣本;TP表示被模型預測為正的正樣本。
圖2-a所示是有損駿棗與完好駿棗的平均二階導數反射光譜,圖2-b、2-c、2-d是95%置信度定標集中2個類別的光譜變化曲線。光譜的變化情況說明,駿棗質量主要與 1 300~1 420 nm、1 650~2 300 nm波段區域的光譜特征有關,這2個光譜范圍內的光譜反射率一般與蛋白質、脂肪、水分相關,這些成分是駿棗的主要成分。
使用遺傳算法主要在1 320、1 460、1 650、1 920 nm與 2 000~2 220 nm附近選擇特征,1 150~1 750 nm范圍的特征代表O—H鍵對與—CH(CH3—、—CH2—等)鍵對的近紅外光譜泛頻。上述頻帶反射率的變化一般與酚(~1 320 nm)、過氧化氫化物(~1 460 nm)有關,而酚與過氧化氫化物2個化學成分與駿棗的破損、蟲害有關,一般認為駿棗具有愈傷作用,收到撞擊以及害蟲破壞等會使總氧化值提高,導致駿棗的酚含量下降。

水分、酚、蛋白質、氨基酸之間近紅外光譜反射率的差異則與水分流失、氧化反應、微生物腐蝕等有關。風沙與病蟲害對駿棗的內部組織產生損壞,影響了駿棗的水分、密度與硬度。而這些影響可以通過近紅外光譜觀察出來。
選擇2組特征(近紅外光譜的波長)進行2組獨立的試驗,結果見表1。試驗1的誤報率、漏報率、總誤差分別為 1.72%、5.97%、4.00%,試驗2的誤報率、漏報率、總誤差分別為5.17%、2.99%、4.00%。
圖3所示是二次判別分析模型的試驗1分類結果,其中僅有1個有損駿棗與4個完好駿棗的分類發生了錯誤,總的分類準確率為96%。
圖4所示是二次判別分析模型的試驗2分類結果,其中僅有3個有損駿棗與2個完好駿棗的分類發生了錯誤,總的分類準確率為96%。
光譜數據中一般包含一些干擾因素、室內噪聲以及化學物質的影響,從原數據集提取出最優的特征光譜可以降低分類模型的冗余信息,并提高分類的準確率。
本研究探討了近紅外光譜 (1 100~2 300 nm) 檢測病蟲害與風沙導致的損壞南疆駿棗,通過2組近紅外光譜特征子集的試驗結果可看出,本模型的檢測總誤差小于5%,具有較好的檢測準確率。


表1 二次判別分析模型對預定義光譜5個、 6個特征子集的判別性能

病蟲害與風沙受損駿棗檢測的最優近紅外光譜特征包含1 320、1 400~1 550、1 650、2 000~2 220 nm,這些光譜波段一般與酚、過氧化氫、烷基等關聯,實時的駿棗檢測系統應當從這些光譜波段選擇特征。

本技術是一種自動化、高準確率、無損的駿棗病蟲害損傷檢測系統。未來將引入大數據集處理技術,增加近紅外光譜光波特征的數量,從而提高檢測的準確率與處理速度。
[1]宋鋒惠,哈地爾·依沙克,史彥江,等. 新疆塔里木盆地駿棗果實營養與土壤養分相關性分析[J]. 果樹學報,2010,27(4):626-630.
[2]鄭素慧,葛清華,車鳳斌,等. 氣調貯藏不同溫度對新疆駿棗干棗貯期品質及生理活性的影響[J]. 新疆農業科學,2014,51(4):620-626.
[3]韓夫云,崔大鵬,黃喜宇. 朝陽地區大棗主要病蟲害的發生特點及防治技術[J]. 現代農業科技,2015(8):144.
[4]王燕平,王文平. 關于棗樹病蟲害防治技術的幾點思考[J]. 黑龍江科技信息,2016(34):254.
[5]汪京京,張 武,劉連忠,等. 農作物病蟲害圖像識別技術的研究綜述[J]. 計算機工程與科學,2014,36(7):1363-1370.
[6]姚 青,張 超,王 正,等. 分布式移動農業病蟲害圖像采集與診斷系統設計與試驗[J]. 農業工程學報,2017,33(增刊1):184-191.
[7]溫芝元,曹樂平. 基于補償模糊神經網絡的臍橙不同病蟲害圖像識別[J]. 農業工程學報,2012,28(11):152-157.
[8]劉同海,黃斌博,李少昆,等. 基于圖像規則推理的玉米病蟲草害診斷系統的設計[J]. 中國農業大學學報,2012,17(4):154-158.
[9]楊 青. 一種基于圖像分析的玉米病蟲害智能化識別方法[J]. 江蘇農業科學,2014,42(7):128-130.
[10]田有文,程 怡,王小奇,等. 基于高光譜成像的蘋果蟲害檢測特征向量的選取[J]. 農業工程學報,2014,30(12):132-139.
[11]李 斌,張偉立,趙春江,等. 基于太赫茲光譜技術的山核桃內部蟲害檢測初步研究[J]. 光譜學與光譜分析,2014,34(5):1196-1200.
[12]Cayuela J A,Weiland C. Intact orange quality prediction with two portable NIR spectrometers[J]. Postharvest Biology & Technology,2010,58(2):113-120.
[13]Brusco M J,Singh R,Steinley D. Variable neighborhood search heuristics for selecting a subset of variables in principal component analysis[J]. Psyhemetrika,2009,74(4):705-726.