陳勇翔 高遵海
(武漢輕工大學數學與計算機學院,湖北 武漢 430023)
大米是人類最重要的食物之一,然而水稻病害會造成不同程度的減產,不同的水稻病害主要有葉黑粉病、褐斑病和葉枯病。目前在水稻葉部病害的圖像識別方法上一般進行預處理后就直接分割圖像,造成了一定程度上的圖像失真。本文以水稻葉黑粉病、褐斑病和葉枯病為研究對象,依據水稻葉部病害和健康部分在Lab模型中a*b上的差異表現,設計此模式下12種不同顏色分量組合特征,便于水稻葉部病害的圖像特征提取和k均值聚類,以此提高水稻葉部病害識別準確率。
國際水稻研究所(IRRI,International Rice Research Institute)提供了專門用于水稻疾病圖片的圖像數據庫[1]。數據集來源UCI機器學習庫中的水稻葉片疾病數據集[2-3],該數據集圖片采用尼康D80和佳能450D數碼相機進行拍攝采集,拍攝保證在自然條件下足夠的亮度和清晰度便于對圖片的處理,并且拍攝得3類病害圖片均設定和裁剪成740×290的尺寸。對采集的圖片用中值濾波[4]方式進行去噪預處理,其原因是能夠比較完整保留圖像邊緣信息。
根據圖像分割后病害顏色的差異,對L、a、b顏色分量進行組合,構造如表1所示的12個備選顏色參數。

表1 12個備選顏色參數
病斑分割圖像為Lab顏色空間,直接提取L,a,b的一階,二階以及三階矩陣共12個顏色矩陣參數。
在水稻葉部病害分割時將預處理的RGB圖片通過XYZ作為中間層進行Lab圖片轉換,選用Lab色彩模型[5]可以盡量保留寬闊的色域,使得色彩過渡均勻,避免由于直接分割對病害區域造成不同程度的失真。Lab中L表示亮度,a和b為2個顏色通道,水稻葉部病害和健康部分主要通過Lab模型中a×b上的差異表現,并以此為依據進行k均值聚類方法[6]對病害斑點區域進行合理分割。
針對3類水稻病害進行聚類,聚類中心點個數分別設置為變量i(i=2,3,…,9)。其目標收斂函數為平方誤差,具體的公式如下:
假設有M個數據源,C個聚類中心,x(i)由n個數據點組成的數據集,每個數據點x(i)是由d=12個表征數據組成的向量,μc為聚類中心。將每個類中的數據x(i)與每個聚類中心做差的平方和,J最小,意味著分割的效果最好。
水稻葉部病害圖像共計120張,葉黑粉病樣本和褐斑病樣本以及葉枯病樣本數量均為40張。經計算和驗證,采用基于Lab空間的k均值聚類方法,葉黑粉病和褐斑病以及葉枯病聚類中心點個數均為3。樣本中k=3黑粉病和褐斑病以及葉枯病葉部分割的效果如圖1~圖3所示。

圖1 葉黑粉病及k均值圖像分割效果

圖2 褐斑病及k均值圖像分割效果

圖3 葉枯病原圖和k均值圖像分割效果
從圖1~圖3中可以直觀看出,采用基于色彩模型Lab空間的k均值聚類方法能夠將病害斑點進行清晰和有效的分割,便于后續對不同類別病斑區域準確識別。