顧佳敏,王佩玲,劉陽天,高攀,郭文超
(1.石河子大學農學院,新疆石河子 832000;2.石河子大學信息科學與技術學院,新疆石河子 832000)
【研究意義】棉蚜的種群密度和危害程度是棉蚜防治決策的重要根據,更是精準噴藥的關鍵信息。傳統上對棉蚜密度的監測主要采用樣本抽查和人為估算,在棉蚜爆發高峰期,百株蚜量可達數萬頭,不僅工作繁重而且估算誤差很大。與傳統棉蚜測報方法相比,采用圖像處理技術可以大幅降低工作強度,提高蚜蟲計數效率和準確率。【前人研究進展】近年來,學者也對小蟲體計數方法進行了相關研究。沈佐銳等[1]進行了溫室白粉虱計數技術研究;張建偉等[2]實現麥田蚜蟲計數;趙慧燕等[3]實現蚜蟲目標識別;邱白晶等[4]提出了黃瓜蚜蟲圖像識別與計數方法;以及其他學者提出小型昆蟲、微生物圖像識別與計數方法[5-10]。【本研究切入點】目前研究大都針對較為理想的圖像提出計數的算法,促進基于數字圖像的小型昆蟲計數的發展。但這些算法主要是基于灰度圖像,且對閾值依賴性高,不太適用于棉田復雜背景下棉蚜計數。除此之外,在彩色圖像轉換成灰度圖像時損失了2/3的圖像數據,數據的丟失伴隨而來的是特征信息的損失,不利于數學建模[11-12]。當前基于數字圖像的棉蚜預測預報技術的難點是標準化的算法與多樣化的棉田復雜背景之間的矛盾。【擬解決的關鍵問題】提出一種新的棉蚜計數方法,直接以大量RGB彩色圖像為對象,對區域數據進行分析建模,實現對彩色圖像分割去噪、二值圖像自主選擇結構元素完成腐蝕去噪、黏連區域像素個數求模運算的三位一體算法,在圖像處理過程中極大降低算法對閾值的依賴性,完成基于數字圖像的復雜背景下棉蚜計數,為棉蚜蟲情準確測報提供重要基礎。
一臺圖像圖形工作站(設備型號WiseteamFL1A3708-12K移動便攜工作站)和自主研發的一種棉田復雜背景下手持式可調控棉蚜拍攝裝置(專利號:201720493225.4)。圖1

圖1 實驗裝置
Fig.1 instrument
1.2.1 棉蚜圖像獲取
1.2.1.1 棉蚜圖像特點
棉蚜體型小,繁殖力極強,孤雌生殖,4~5 d可繁殖一代,一生之中體色多變,主要棲息在葉片背部,具有群居性。
1.2.1.2 棉蚜圖像采集
棉花葉片背面朝上,使用自主研發的棉蚜拍攝裝置將棉葉水平夾住,手機攝像頭垂直拍攝棉蚜圖像,通過自主開發的終端軟件,實現拍照存儲或實時發送至圖形工作站進行處理。圖像分辨率為:2 588×3 264像素,圖像格式為jpg,24位RGB顏色空間模式。
1.2.2 算法流程
配置VISUALSTUDIO2015環境下的OPENCV3.0。基于圖像RGB數據。根據數據特點歸類,分析每類數據規律并建立模型。將已分割的彩色圖像轉換成二值圖像進行圖像腐蝕去噪,實現棉蚜的計數。圖2

圖2 算法流程
Fig.2 Flowchart of proposal algorithm
1.2.3 算法設計
1.2.3.1 噪音及棉蚜
通過對大量棉蚜圖像分析,研究將常見噪音分為13類,如棉蚜蛻的皮,葉柄,主脈基部,主脈中部,主脈尖部,側脈基部,側脈中部,側脈尖部,葉脈上的黑點、病斑、機械損傷、葉片、葉片折疊區;將常見棉蚜分為7類,如僵蚜、綠色伏蚜、淡黃色伏蚜、黃色伏蚜、深褐色伏蚜、棉黑蚜,有翅蚜等。使用OpenCV3.0結合MATLAB2014a從圖像中提取出所有ROI,即所有噪音和蟲態,并將其轉換成數據。圖3

注:a中的蚜蟲根據顏色初步分為4類蚜蟲:青色棉蚜、淡黃色棉蚜、黃色棉蚜、深褐色棉蚜;e中噪音為:葉柄,葉脈中部,葉脈尖部,葉脈上黑點、病斑、葉脈基部葉片、機械損傷,蚜蟲皮等
Note:According to the color of aphis,we divided them of image a into five kinds of aphids;all noises in image e are petiole、veins、black spots on veins、 speckle of disease、leaf between veins、mechanical damage、skin of aphids
圖3 噪音和蟲體
Fig.3 noises and aphids
1.2.3.2 彩色分割
研究基于大量的棉蚜圖像RGB色彩空間數據,采用K-means聚類算法對復雜背景下棉蚜圖像進行彩色分割,經分析數據可從兩方面建模。第一類模型由關系表達式組成,例如:黃色伏蚜滿足數據規律:R>=G>B,部分噪音和蚜蟲滿足數據規律:G>B&&G>R;第二類算數表達式,例如:應用RGB顏色空間模式的R,G,B分量進行函數變換,利用函數值作為K-means聚類點坐標將無法用關系表達式分割的蚜蟲從噪音中分割出來。例如,使用f(X)=X2;對G分量進行變換就可以突出G分量與其他分量的差值,使用f(R,G,B) =a*R-b*G+c*B;對R,G,B三個分量進行函數變換就可以建立關系表達式f(蚜蟲皮) 根據大量圖像數據的規律構造函數表達式,將變換后的函數值作為顏色空間的描述。使用歐式距離作為相似度的距離,研究中根據算法設計需求使用不同維度下的歐氏距離公式,其二維、三維公式如公式(1)、(2)所示。 (1) D(A,B)= (2) 其中,A(x,y,z)是任意數據對象的坐標;B(x,y,z)是聚類中心點的坐標。研究采用誤差平方和準則將同一類的數據聚集成一簇,其公式定義如公式(3)所示。 (3) 上式中,E為誤差平方和準則函數值:wj是每一簇中給定的數據對象,ci是每一簇的平均值。如果E值越小,那么誤差就越小,聚類的質量也就越好。 1.2.4 腐蝕去噪 圖像腐蝕是形態學中去除圖像某一些部分的常規圖像算法[13-17]。棉蚜圖像彩色分割后轉換成二值圖像,從二值圖像中選取40(蚜蟲一生四個齡期,取10個重復)個樣本蚜蟲,從中找到最小蚜蟲所占像素個數T1;其次遍歷彩色分割后的二值圖像找到所有比T1小的連通分量中最大的連通分量所占像素個數T0。建立腐蝕結構元素大小與T0/2的關聯關系為:在滿足結構元素對稱的情況下,選取上線和下線中最接近T0/2的兩個整數。不同的圖像會根據自己的復雜度從關聯關系中自主選擇最優腐蝕結構元素,從而擺脫人為選擇腐蝕閾值去噪的素1、結構元素2和結構元素3和結構元素4。圖4 圖4 蚜蟲樣本數據 圖5 結構元素 若T0是奇數每一個結構元素對圖像腐蝕一次并計數為Ni,最終的蚜蟲數量為Ni的加和平均數N,其計算公式如公式(4)所示。 (4) 1.2.5 蚜蟲計數 1.2.5.1 黏連區域計數 采用優化的分水嶺算法對黏連區域蚜蟲進行分割,都取得了較好的分割效果,但其對閾值依賴性較高,例如基于距離變換標記前景與背景的分水嶺分割[18-20],基于梯度圖像的擴展極小值分水嶺分割,其閾值選取都間接取決于圖像復雜度,不同圖像的最佳閾值有所不同。所以具有閾值依賴性的分水嶺分割算法不適用于解決棉田復雜背景下黏連區域棉蚜分割。本研究利用離散型隨機變量樣本蚜蟲所占像素個數X與其對應樣本數量xi和其概率p(xi)得到單頭蚜蟲所占像素個數的期望大小E(x)如公式5所示,從而提出一種基于二值圖像腐蝕后的黏連區域所占像素個數T2與單頭蚜蟲所占像素個數期望大小E(x)求模運算,從而實現黏連區域棉蚜分割計數。 E(x)=x1×p(x1)+x2×p(x2)+…+xi-1×p(xi-1)+xi×p(xi). (5) 1.2.5.2 蚜蟲計數標記 采用連通區域標記算法對最終的二值圖像進行標記和計數。從中選取400個蚜蟲樣本,100個蚜蟲黏連區域樣本。計算單頭蚜蟲連通分量所占像素個數的期望大小E(x),最小蚜蟲連通分量所占像素個數T1,黏連區域所占像素個數的平均大小T2。遍歷腐蝕以后的圖像凡是連通分量像素個數X小于等于E(x)則計為單頭蚜蟲Ni,凡是連通分量像素個數大于E(x)且小于等于T2則為黏連區域,其蚜蟲數量N2為X除以E(x)的模,凡是連通分量像素個數大于T2的則不計數。最終蚜蟲數量N為單個蚜蟲數量N1與粘連區域蚜蟲數量N2之和,如公式(7)所示。 f(X)= (6) N2=X/E(x). N=N1+N2. (7) 研究自主研發一款便攜式棉蚜拍攝裝置(設備型號:ZL201720493225.4),基于該裝置拍攝棉蚜圖像不僅可以過濾掉棉田復雜背景,而且圖像數據不會受到拍攝角度、光線、高度等的影響。基于這樣的圖像數據設計的棉蚜計數算法不僅魯棒性好而且更能適應一線生產的棉蚜計數。圖6 圖6 棉田復雜背景下蚜蟲彩色分割Fig.6Colorimagesegmentationeffectofaphids b和d的圖像復雜度各有不同,變換成二值圖像以后b中T0=46,所以腐蝕結構元素為圖5中的a和b。圖a中T0=31,腐蝕結構元素為圖5中的c和d。 由于腐蝕算子結構元素的大小直接關系到蚜蟲計數的精度,如果結構元素太大,在腐蝕去噪的同時去掉了低齡若蚜,導致計數結果偏小;如果結構元素過小則無法完全去噪,導致計數結果偏大。然而腐蝕對結構元素的類型和大小有很強的依賴性,而復雜背景下的圖像千差萬別,其最理想的腐蝕去噪結構元素大小往往不同。所以本研究采用多尺度結構元素對圖像進行腐蝕去噪并記錄蚜蟲數量Ni,最終求其平均值N。圖7 圖7 二值圖像的腐蝕操作Fig7Thecorrosionoperatoronbinaryimage 對10幅蚜蟲圖像進行傳統估算計數,直接計數和實驗算法計數。表1 表1 蚜蟲數量Table1Resultsofautomaticandtraditionalaccountingofaphids 圖像Image直接計數數量(只)Directly counting number 傳統大田估算(只)Traditional counting估算準確率(%)The accuracy rate of traditional method機器計數(只)Machine counting機器準確率(%)The accuracy rate of computer algorithem提高精度(%)Improved precision136925067.831284.616.8255636064.849889.624.8363742065.954986.220.3471040056.362588.031.7588535040.078889.049.0691840043.583691.047.5795646048.183387.139.08116555047.2101286.939.79126860047.3106884.236.910155675048.2121579.130.9 提出一種基于自動結構元素的新的棉蚜計數方法,與前人研究方法和結果相比較,前人算法多基于灰度圖像,其圖像數據量只有彩色圖像的1/3,此外前人也多采用某個統計閾值來適用于所有情況,造成算法穩定性不佳。算法能夠因地制宜的根據每張棉蚜圖像自身的數據情況找到最佳的算法閾值,這提高了在不同復雜背景下算法精確度的穩定性,降低了算法對閾值的依賴性,并有效解決棉蚜圖像黏連分割的問題,最終完成基于數字圖像的復雜背景下較為精確的棉蚜計數。但在實驗過程中發現,在RGB數據走勢和噪音會有很大的重疊,以及局部反光等產生噪音,這都導致計數精確度會有所下降,HSB、LAB、HSI等色彩模式下的數據分析是本文彩色分割算法優化的方向。 提出一種基于數字圖像的棉田復雜背景下棉蚜統計方法。該方法設計的自動結構元素腐蝕算法實現了圖像自動地從結構元素中選擇最優結構元素對二值圖像進行腐蝕去噪,擺脫了傳統算法在腐蝕去噪時對閾值的依賴,該算法有助于提升蚜蟲計數精度。自主研發的“棉田棉蚜拍攝裝置”采集的對10幅蚜蟲圖像分別進行傳統估算計數、直接計數和實驗算法計數,基于自動結構元素的棉蚜計數方法計數平均精度為86.47%,平均提高計數精度達33.66%。

Fig.4 The data of aphids samples
Fig.5 Structural Elements
2 結果與分析
2.1 彩色分割

2.2 腐蝕去噪

2.3 計數標記

3 討 論
4 結 論