何洋洋 蔣正帥 商丘工學院
采摘機器人的視覺系統是重要環節,能否對果實快速準確的定位是機器人視覺系統中的關鍵技術,直接影響到機器人的工作效率和可靠性。在采摘機器人的相關研究中,識別準確率嚴重制約著機器人在自然條件下的工作效率,M.Z.Abdullah用線性判別分析識別楊桃正確率為95.3%,油椰子分類識別率為90%,該方法要求所用數據集是正態分布的,而事實上特征空間中的數據并不一定符合條件。本文以成熟番茄果實為研究對象,為消除光照影響,根據光照無關原理對自然環境中拍攝的番茄圖像進行關照無關化處理,獲得光照無關圖,通過不通核函數識別圖片信息,并采用交叉驗證和網格搜索的方法進行支持向量機最優模型參數優化。
試驗所用圖像為自然條件下拍攝的彩色番茄果實圖像。為減少噪聲干擾,采用矢量中值濾波進行圖像增強。由于番茄生長于自然環境中,光源的方向、拍攝距離和光照強度等均會對番茄果實圖像產生影響,環境的光照會改變圖像的真實信息,進而影響視覺系統的識別準確性。為消除光照強度的影響,本文采用圖像單個像素的顏色恒常性算法,對中值濾波后的番茄圖像進行光照無關處理,獲得番茄光照無關圖。
本文采用最大類間方差(OSTU)法對圖像進行成熟番茄和背景的分割,基于灰度直方圖的自動閾值分割方法,通過選取圖像的任意灰度級t為初始分割閾值計算目標與背景之間的方差,遍歷所有灰度級計算方差值,使方差最大的灰度級就是最佳分割閾值。
在番茄圖片中,成熟番茄果實、枝葉都有特定的形狀,并且差異大,因此番茄的形狀特征明顯,根據識別理論進行分類識別。物體的幾何形狀具有RST(旋轉、比例、平移)不變性的特點,即物體的幾何特征不會因在圖像中的位置、大小和圖像的旋轉角度的改變而變化。因此,根據上述特性,本文結合番茄圖像的特點,采用圓方差、離散度和伸長度作為形狀特征。
支持向量機(SVM)通過結構風險最小化準則(SRM)和核函數的方法,將待解決的模式識別轉化為二次規劃尋優問題。對于線性可分的訓練樣本集(xi,yi),可被分類面沒有錯誤地分開。類別間的間隔距離越大,推廣能力越強,使分類間隔距離最大的分類面為最優分類面。對于線性不可分問題,需要引入松弛項和錯誤懲罰參數C。應用二次規劃方法可以求出最優分類函數為:

其中,a*為拉格朗日乘子,b為分類閾值,K(*)為核函數。
在白天不同時間、光照條件下,順光逆光不同角度拍攝番茄圖片,實驗拍攝訓練照片240張,提取了853個訓練樣本,測試圖片110張,提取了477個測試樣本。首先提取目標,然后計算顏色特征、形狀特征和紋理特征。識別的準確率是模型識別效果好壞的重要指標,本文定義識別準確率為:,其中i為正確識別的番茄數量,N為區域內番茄的數目。
懲罰參數C和模型參數r是RBF核函數的兩個重要參數,對于給定的問題,需要對C和r進行參數優化,本文采用交叉驗證(CV)和網格搜索的方法獲取最優模型參數,以實現分類器對番茄較高的識別準確率。在交叉驗證中,現將訓練集分為n個子集,然后將n-1個子集用來訓練,剩下的一個用于測試。所有訓練集中的每個子集都進行一次測試,數據的正確分類百分比就是交叉驗證精度,交叉驗證可以避免過度擬合問題。在網格搜索中,參數C和r取不同值進行實驗,當識別準確率達到最高時,獲取最優參數值。
本文采用RBF核函數,對樣本數據進行交叉驗證和網格搜索如圖1所示,交叉驗證分類的子集數目n取不同值時,獲得的C和r也有差異,最終影響測試的準確率。由圖1知,番茄圖象樣本訓練得到模型的最優參數中,當子集數量分別是2個和10個時,最優參數C=1,r=16,最高識別準確率是96.7575%;當子集數量分別為5個和7個時,最優參數C=4,r=16,而最高識別率是96.8872%。實驗證明,支持向量機可通過交叉驗證和網格搜索的方法進行參數尋優,并且使用優化參數的支持向量機對番茄的識別正確率很高。

圖1 不同N值交叉驗證-網格搜索曲線
本文采用的基于光照無關圖與支持向量機識別方法,實現了支持向量機的分類識別。采用交叉驗證與網格搜索的方法對使用徑向基核函數的支持向量機進行參數優化,較好的解決了徑向基核函數參數選擇的難題,對于未被識別的番茄,主要原因是番茄與枝葉等其他物體之間的相互遮擋,對這種情況的番茄識別需要更多研究。