王 慧, 季 雪
現階段,農業生產逐步走向現代化[1,2]。在果蔬農場中,使用了一定數量的采摘機器人,在實際工作過程中,機器人在單位時間內采摘的果實數量和質量,與人工相比有很大的差距。此外,在采摘過程中,機器人易損傷果實。因此,必須研發高精度的視覺系統,以快速準確地檢測到符合采摘要求的果實,準確測量其位置,實現精確采摘[3,4]。該過程中涉及到機器視覺技術,融合了多門學科專業知識,主要包括光學原理、計算機學、影像成型、生物學以及過程控制學等[5~7]。
本文對圖像識別技術在農業工程中的應用進行了研究,提出了一種蘋果圖像識別技術,為實現蘋果智能采摘提供了新方法。
蘋果與背景之間的色彩差距較大,可以使用圖像分割方法對果實和背景的顏色進行區分。在真實的果園背景中選取多張照片,重點突出果實和背景重合的區域,在該區域中選取并分析R,G,B 顏色因子的值。通過分析發現,R-G 和2R-G-B 可以明顯區分蘋果和背景的色彩。
由于固定閾值分割法無法較好地適應光線的變化,所以,使用的最大類間方差法(OTSU)法,該方法功能強大,可用于閾值分割,在進行求值時,使用的圖像目標和背景使類內方差最小、類間方差最大。
圖像分割后,圖像中往往存在獨立的點、小空洞、毛刺,為了降低這部分噪聲對辨識產生影響,使用了文獻[8]中所述的腐蝕—去除—膨脹的方法,即對分割后的圖像實施腐蝕計算,以消除目標界線的臨界點,促使邊界向內收縮;采用小區域消除運算對圖像法中依然存在的小區域實施消除;采用膨脹計算對目標臨界點實施擴展,將目標接觸的全部點整合到該目標中。最終圖像分割為背景和果實2部分內容[9]。
在圖像辨識體系中最關鍵的是準確地判別目標。但由于蘋果自然成長的無規則性,以及圖像收集過程中拍攝角度的差異,極易產生果實之間疊加、枝葉擋住果實等情況,對準確辨識目標物產生很大干擾,獲得的圖像存在很差異,并且變化非常大。為了獲得更加準確的神經網絡辨識模型,以及更加便捷地辨識結果,在神經網絡(neural network,NN)進行練習的過程中,將樹枝、樹葉、果實一起進行訓練。訓練樣本特征時,在分割圖像中選取對應的一段樹枝、一片樹葉,用于特征提取。在辨識樣本圖像的過程當中,僅需提取果實目標物的特性即可[10,11]。
根據文獻[12]中的方法對果實特征進行提取。在RGB顏色空間中,可以直接實施顏色對比。肉眼看到的顏色與HSI顏色具有一定的相似性,并且能夠適合全部的關聯環境,在顏色特性中提取H,S,I 3個分量十分關鍵。提取HIS,RGB顏色空間中的6個顏色分量特性,用于介紹目標物的整體特性。樹枝、樹葉、果實均具有其獨特的形態,并且其中存在很大的差異,提取對象的狀態非常切合實際。根據蘋果果實圖像的特征,選擇Hu不變矩和幾何圖像特點,其中Hu不變矩包括了7個特征向量,幾何特征選擇了周長平方面積、致密度、圓方差3種特征向量。提取10個不因對象物在圖像中的角度、大小、位置而產生改變的形狀特征,即特征滿足旋轉、縮放和平移(rotation scale translation, RST)不變性。
使用神經網絡算法對處理后的果實圖像進行分析,從而識別出圖像中的果實。將上述研究的蘋果果實(目標)和樹枝、樹葉(干擾)的顏色形狀特征共16種,作為NN識別模型的輸入量,建立基于NN的蘋果果實識別模型。
作為一種多層前饋型網絡,反向傳播神經網絡(back propagation NN,BPNN)能夠前向輸入信號,逆向反饋誤差信號。在進行前向運輸時,輸入信號的處理途徑為輸入層—隱含層—輸出層,采用逐層處理的方法。通過對比期望輸出以及輸出層輸出進行反饋,網絡結構中的權值可以通過兩者的差值進行調整。利用BPNN經過多次訓練后即可更加接近期望輸出,進而得到合適的閾值和權值。
NN函數實際上具有非線性的特點,其非線性函數的因變量為輸出層輸出的變量,自變量為輸入層輸入的變量,形成一個函數映射。本文根據NN所具有的特點,在充分分析影響識別質量影響因素的基礎上,采用NN訓練得到識別質量和影響因素間的關系,其具體的關系可以通過權值和閾值體現出來。
但在應用BPNN的過程中存在一定的問題:閾值和權值隨機生成,容易導致局部最優,降低了訓練效果;無法有效地確定學習率,當學習率過大時結果準確性無法保證,如果學習率太小會減緩訓練過程,無法保證快速的收斂。解決方法:在尋找權值和閾值時借助遺傳算法實現,能夠有效避免局部最優問題;改進原有的固定學習率,在對自適應學習率進行改進的過程中有效地提升學習效率。
使用文獻[13]改進算法對遺傳優化算法進行更進一步優化。通過改動常規的變異和交叉操作來提升進化速度:1)對免疫算法中所具有的免疫記憶機制進行應用,保護優秀個體,不進行交叉和變異操作,提升最優解的尋找速度;2)改變變異過程中的變異概率,先對適應度進行排序,并標記后30 %的個體,在變異操作的過程中采用更高的概率以保證最優個體的出現,加快進化速度;3)由于染色體具有較長的長度,為了保證優秀個體的產生采用多點交叉的方法。
本文主要考察蘋果、樹枝和樹葉的16種顏色形狀特征,通過識別模型分別識別出圖像中的果實、樹枝以及樹葉, 因此,可以確定NN模型的輸入節點數為16,輸出節點數為3。常規NN使用經驗試湊法確定隱含層節點數為35。
針對BPNN對于網絡初始閾值和權值比較依賴,采用隨機選取的方法容易出現局部最優現象,應用遺傳算法實現全局優化,得到全局最優解。在優化和尋優神經網絡初始閾值和權值時應用遺傳算法能夠達到自適應學習的目的,有效提升了訓練和學習效率。
選取1 000幅蘋果果實圖像,按照圖像分割與特征提取方法提取用于識別的特征。獲得完整果實和有樹葉遮擋果實的圖像處理過程如圖1所示。

圖1 蘋果果實圖像處理過程
使用200幅僅有一個蘋果果實的圖像對識別模型進行訓練,使用剩余600幅圖像對訓練后的識別模型進行測試,測試樣本隨機分為3組:圖像中大部分圖像為完整蘋果果實;部分圖像被樹葉遮擋;另一部分圖像存在蘋果果實重疊,各情況在樣本中的比例如表1所示。

表1 蘋果果實識別測試樣本
針對3組樣本,分別使用常規BPNN和本文研究的識別模型得到的識別準確率如圖2所示。

圖2 3組測試樣本的蘋果果實識別準確率
可以看出:針對完整的果實,本文模型和常規BP模型的識別準確率分別為95.8 %和86.6 %;針對有樹葉遮擋的果實,本文模型和常規BP模型的識別準確率分別為84.3 %和80.9 %;針對有重疊的果實,本文模型和常規BP模型的識別準確率分別為82.6 %和75.2 %。
樹葉遮擋和果實重疊會降低識別模型的識別準確率,經過實驗,不同遮擋率情況下,識別模型的識別準確率如圖3所示。

圖3 不同遮擋率情況下識別模型的識別準確率
不同遮擋率情況下,識別模型的識別準確率測試結果可以看出:當樹葉遮擋比例或果實重疊率大于70 %時,雖然本文模型較常規BP模型具有更好的識別準確率,但總體識別準確率極低,無法滿足識別與采摘的精度要求,當樹葉遮擋比例或果實重疊率在40 %~70 %之間時,總體識別準確率有所上升,只有當樹葉遮擋比例或果實重疊率在40 %以下時,總體識別準確率才能夠穩定,滿足識別與采摘的精度要求。
針對圖像識別技術在農業工程中的應用進行了研究,提出了一種蘋果圖像識別技術,為實現蘋果智能采摘提供了一種新方法。測試結果表明:1)相比常規BPNN模型,本文方法具有更高的識別準確率。2)當樹葉遮擋比例或果實重疊率大于70 %時,識別準確率極低,無法滿足識別與采摘的精度要求;當樹葉遮擋比例或果實重疊率在40 %以下時,總體識別準確率滿足識別與采摘的精度要求。
參考文獻:
[1] 王 瓊.基于優化理論的神經網絡研究及在抽油機故障診斷中的應用[D].大慶:東北石油大學,2011:11-14.
[2] 馮 娟,曾立華,劉 剛,等.融合多源圖像信息的果實識別方法[J].農業機械學報,2014,45(2):73-80.
[3] 馬曉丹.蘋果樹冠層光照分布計算方法研究[D].北京:中國農業大學,2015:14-16.
[4] 馮 娟,劉 剛,王圣偉,等.采摘機器人果實識別的多源圖像配準[J].農業機械學報,2013,44(3):197-203.
[5] 王 晉.自然環境下蘋果采摘機器人視覺系統的關鍵技術研究[D].秦皇島:燕山大學,2014:66-69.
[6] 呂小蓮,呂小榮,盧秉福.西紅柿采摘機器人視覺系統的設計與研究[J].傳感器與微系統,2010,29(6):21-24.
[7] 李 劍,李臻峰,宋飛虎,等.基于近紅外光譜的水蜜桃采摘期的鑒別方法[J].傳感器與微系統,2017,36(10):48-50.
[8] 呂繼東,趙德安,姬 偉.蘋果采摘機器人目標果實快速跟蹤識別方法[J].農業機械學報,2014,45(1):65-72.
[9] 呂繼東.蘋果采摘機器人視覺測量與避障控制研究[D].鎮江:江蘇大學,2012:13-16.
[10] 謝忠紅.采摘機器人圖像處理系統中的關鍵算法研究[D].南京:南京農業大學,2013:15-25.
[11] 王津京.基于支持向量機蘋果采摘機器人視覺系統的研究[D].鎮江:江蘇大學,2009:35-60.
[12] 賈偉寬,趙德安,劉曉洋,等.機器人采摘蘋果果實的K-means和GA-RBF-LMS神經網絡識別[J].農業工程學報,2015,31(18):175-183.
[13] 畢艷亮,寧 芊,雷印杰,等.基于改進的遺傳算法優化BP神經網絡并用于紅酒質量等級分類[J].計算機測量與控制,2016,24(1):226-228.