中南林業(yè)科技大學(xué)計算機與信息科學(xué)學(xué)院 余紹軍 李 虹 謝林波 胡 俊
基于油茶毛蟲圖像的特征提取
中南林業(yè)科技大學(xué)計算機與信息科學(xué)學(xué)院 余紹軍 李 虹 謝林波 胡 俊
油茶是我國華中地區(qū)重要的經(jīng)濟作物,果實產(chǎn)量受蟲害影響較嚴(yán)重,其中油茶毛蟲的危害最大。本文首先對基于圖像的昆蟲特征提取的主要方法進行綜述,然后將搜集到的油茶毛蟲生態(tài)學(xué)、形態(tài)學(xué)、生物學(xué)等特點作為理論依據(jù),最終提出具有針對性的特征提取方法。本文為解決油茶害蟲圖像區(qū)域分割以及模式分類等關(guān)鍵問題提供基礎(chǔ)數(shù)據(jù)。
圖像處理;油茶毛蟲;特征提取
油茶作為世界四大木本食用油料植物之一,具有很高的綜合利用價值,但產(chǎn)量卻不高。其中,由害蟲造成的落花落果是影響我國油茶產(chǎn)量的重要因素。在眾多種類的害蟲當(dāng)中,油茶毒蛾(Euproctis Pseudoconspersa Strand)是華中地區(qū)最為常見的油茶害蟲,其幼蟲被稱為油茶毛蟲、茶辣子、毛辣蟲,以油茶葉為食,群集為害。
近年來,現(xiàn)代農(nóng)業(yè)漸漸向著計算機化、數(shù)字化以及人工智能化的方向邁進,這就使實現(xiàn)油茶害蟲的自動識別和計數(shù)變成可能。圖像特征提取就是將圖像的視覺特征進行數(shù)字化,是實現(xiàn)昆蟲圖像自動識別和計數(shù)的基礎(chǔ)。本文將以油茶毛蟲作為研究對象,從生態(tài)學(xué)、形態(tài)學(xué)、生物學(xué)等角度出發(fā),分析國內(nèi)外針對類似昆蟲特征提取的現(xiàn)有方法,為提取油茶害蟲特征探索較為快捷、準(zhǔn)確的方法。
顏色特征是在圖像檢索中應(yīng)用最為廣泛的視覺特征,主要原因在于顏色往往和圖像中所包含的物體或場景十分相關(guān)。常用的顏色特征提取方法有顏色直方圖、顏色矩、顏色集、顏色聚合向量以及顏色相關(guān)圖等。利用顏色特征可以有效地識別顏色豐富、有明顯對比、生命周期內(nèi)顏色信息穩(wěn)定的昆蟲。
劉芳等利用R、G、B、L這4個顏色的一維直方圖,結(jié)合紅、綠兩種顏色和色度的二維直方圖來提取蝴蝶的顏色特征,通過對正反兩面的特征圖表數(shù)據(jù)的分析使用神經(jīng)網(wǎng)絡(luò)實現(xiàn)對蝴蝶的自動識別。準(zhǔn)確率可達95.2%。但缺點在于不同顏色的蝴蝶可能也有類似的特征統(tǒng)計數(shù)據(jù),因此有必要結(jié)合顏色特征的空間位置來提高識別率。
油茶毛蟲頭部呈黃褐色,背線呈暗褐色,亞背線、氣門上線棕褐色接近黑色,密生黃白色長毛。如圖1所示:

圖1 自然環(huán)境下油茶毛蟲圖像
對油茶毛蟲圖像顏色特征進行提取,首先需將RGB圖像轉(zhuǎn)化為與人眼視覺相近的HIS空間模型,I分量與顏色無關(guān),因此剔除I分量。根據(jù)觀察油茶毛蟲的顏色,本文提取出紅、白、黃、黑這4個顏色的H值,通過多次試驗得出每個顏色相應(yīng)的H值如表1所示。
選取這四種顏色之后,就對這四種顏色提取其5種形態(tài)特征,分別為面積、周長、寬度、高度。經(jīng)過試驗,各顏色的統(tǒng)計結(jié)果如表2所示。
其中,面積為顏色所對應(yīng)的像素點的個數(shù);周長為顏色對應(yīng)的邊緣的像素點的個數(shù);寬度為顏色水平方向上對應(yīng)的像素點的個數(shù);高度為顏色在垂直方向上對應(yīng)的像素點個數(shù)。
普遍來講顏色特征對于圖片視角、方向的、尺寸的依賴比較小,魯棒性比較高。但是單憑顏色特征是無法對油茶毛蟲進行識別的,首先油茶毛蟲的圖片識別在野外環(huán)境拍攝會受到光照影響,其次油茶毛蟲在不同的生長環(huán)境、不同生長期的顏色也會發(fā)生變化。因此,需要結(jié)合其他的特征來提高識別率。

表1 各種顏色對應(yīng)的H值范圍

表2 油茶毛蟲顏色提取統(tǒng)計結(jié)果

表3 油茶毛蟲顏色提取統(tǒng)計結(jié)果
紋理是指圖像中形狀較小、有規(guī)律排列的圖案,一幅圖像的紋理是在圖像計算中經(jīng)過量化的圖像特征。紋理特征描述圖像某一區(qū)域的表面性質(zhì),是一種統(tǒng)計特征。圖像的紋理特征具有豐富性、穩(wěn)定性和旋轉(zhuǎn)不變性,對噪聲有較強的抵抗能力,更加有助于昆蟲識別。
關(guān)于昆蟲的紋理特征提取,常見的方法為利用Gabor紋理特征描述子來進行紋理特征提取,但是該方法結(jié)果參數(shù)會隨著角度的改變而改變,進而影響最終識別效果。因此,有其他研究者提出一種與角度無關(guān)的AIGabor濾波器提取昆蟲圖像的紋理特征,再用SVM算法對5種蝶類進行識別。將Gabor與AIGabor紋理提取結(jié)果進行比較,結(jié)果表明AIGabor的昆蟲識別算法可以克服圖像分辨率、光照等因素的影響,識別率更高。
昆蟲紋理提取的常用方法是以灰度級空間相關(guān)矩陣作為基礎(chǔ)共生矩陣。圖像中連續(xù)、共線、具有相同灰值的像素點個數(shù)稱為圖像的游程長度。灰值游離矩陣是用來檢測圖像像素點在特定四個方向上灰值(1~8),游程長度(1~256)為像素點串出現(xiàn)的次數(shù),這里就使用灰值游離矩陣來對油茶毛蟲的紋理特征進行提取。
將油茶毛蟲圖像提取0o、45o、90o、135o四個方向的短游程長度L1、長游程長度L2、游程長度的百分率P和灰度值的不均勻度量D,這些值都是可以直接反映線性紋理的情況。經(jīng)過對油茶毛蟲三幅圖像進行試驗,結(jié)果如表3所示。
紋理只是物體的表面特性不能完全反映油茶毛蟲的本質(zhì)屬性,只利用紋理特征也是無法獲得高層次圖像內(nèi)容的。顏色特征不同是基于像素點的特征,而紋理特征是對多個像素點的進行統(tǒng)計計算,因此可證兩者具有離散性,在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會由于局部的偏差而無法匹配成功。因此,可以結(jié)合使用來作為油茶毛蟲圖像的識別基礎(chǔ)數(shù)據(jù)。
油茶毛蟲特征提取使用多特征綜合,這樣可以提高識別率,但是缺點在于簡單將多種特征綜合在一起,紋理特征與顏色特征之間具有相關(guān)性,會影響計算機的處理速率。因此,還是需要使用優(yōu)化算法來實現(xiàn)特征有機融合,進一步提高識別率和計算機處理速率。
[1]劉凌,澤桑梓,季梅.中國油茶林害蟲和螨類及其天敵研究綜述[J].西部林業(yè)科學(xué),2013,42(1):42-45.
[2]Liu F,Shen Z R,Zhang J W,Yang H Z.Automatic insects identification based on color characters.Chinese Bulletin Entomology,2008,45(1):150-153.(in Chinese)
[3]Qiu D Y,Zhang F Q,Zhang H T.Study on extracting agricultural pests’color features.Journal of North China Institute of Water Conservancy and Hydroelectric Power,2004,25(1):30-32.(in Chinese).
[4]Christophe Biernacki.Initializing EM using the properties of its trajectories in Gaussian mixtures[J].Statistics and Computing.2004(3).
[5]JUN T.A Color Image Segmentation algorithm Based on Region Growing.2010 2nd International Conference on Computer Engineering and Technology.2010.
[6]蔡清,何東健.基于圖像分析的蔬菜食葉害蟲識別技術(shù)[J].計算機應(yīng)用,2010,30(7):1870-1872.
[7]Verma O P,Hanmandlu M,Susan S,et al.A simple single seededregion growing algorithm for color image segmentation using adap-tive thresholding.Proceedings of 2011 International Con-ference on Communication Systems and Network Technologies andComputer.2011.
[8]崔永杰,蘇帥,王霞霞.基于機器視覺的自然環(huán)境中獼猴桃識別與特征提取[J].農(nóng)業(yè)機械學(xué)報,2013,44(5):247-252.