趙子皓,楊再強
(南京信息工程大學氣象災害預報預警與評估協同創新中心,江蘇 南京 210044)
番茄是一種常見的蔬果,在全國各地普遍種植,其品質與產量是人們最關心的問題。在番茄生長過程中,受到環境、氣候等因素影響,會出現不同病癥,降低產量,造成經濟損失。所以,番茄病害防治尤為重要。以往的防治工作通常憑借菜農經驗進行判斷,主觀性強且精度高,能起到病蟲害防治效果,但人工能力有限,檢測效率完全不能滿足實際需求,普適性較差,難以在短時間內制定針對性強的防治措施,容易耽誤最佳防治時間。
為解決上述問題,有關學者紛紛將現代化技術應用到番茄病害防治中。例如,胡志偉[1]等人研究一種注意力機制番茄病害識別算法。利用多層注意力模塊,分層提取病害分類信息;建立殘差模塊融合特征模型,引入數據擴充技術完成番茄病害圖像識別。柴帥[2]等人利用遷移學習機制對番茄病蟲害進行檢測。通過圖像預處理,增強圖像質量,使用訓練成熟的多結構卷積神經網絡模型提取病害特征,采用支持向量機分類病害特征,達到病害識別目的。
由于番茄不同病害類型表現出的特征具有相似性,導致以上方法識別精度較低。因此,本文利用構造性核函數算法識別番茄病害圖像。該方法是神經網絡[3]與支持向量機[4]的融合,可有效處理高維數據,最大特點是將數據映射到核空間內,并在該空間使用覆蓋算法求解。因結合了全局最優思想,使覆蓋鄰域減少,不但識別過程簡單,得出的結果也更為精準。
圖像預處理要求保證原有信息不發生改變,僅在視覺上改善畫質,提高可識別性。圖像去噪是預處理的主要內容,指將圖像干擾噪聲去除,增強信噪比。
均值濾波[5]是在像素空間域基礎上完成的,通過獲取像素點加權平均值來抑制圖像噪聲。將像素大小設置為M×N,圖像中心點表示為(x,y),該點的周圍點叫做鄰域,計算(x,y)鄰域中全部點灰度值的平均值,并替換(x,y)點的初始像素值,表達式為

(1)
式中,x=0,1,…,M,y=0,1,…,N-1,S表示圖像內全部點坐標集合,M為全部坐標點,f(x,y)描述初始圖像噪聲點,經過平滑處理的噪聲點g(x,y)由式(1)得出。
開、閉運算是由腐蝕、膨脹運算發展而來的,主要作用是去除孤立點,減少毛刺,抑制邊界模糊[6]。其中,開運算過程為先腐蝕、后膨脹,表達式如下
X°B=(XΘB)⊕B
(2)
上述公式代表元素B對圖像X進行計算,經過計算后,結構集合中的元素必須大于計算前。閉運算表達式為
X·B=(X⊕B)ΘB
(3)
式(3)與式(2)具有對偶關系。
本文使用最大類間方差法分割圖像,該方法結合圖像灰度值,將圖像分割成背景、目標兩個區域,更有利于圖像識別[7]。背景與目標之間的灰度值類間方差決定二者誤判率,方差越大,二者差距越顯著。分割過程如下
設置目標圖像灰度值,通常為0~(L-1),假設圖像某點坐標為(x,y),其鄰域平均灰度值H(x,y)的計算公式如下

(4)
式中,B代表鄰域寬度,F(x,y)為圖像出現幾率。如果圖像像素表示為(M×N),點(x,y)的概率密度[8]表示為
L(x,y)=F(x,y)/(M×N),0 (5) (6) 為方便理解,使用二維直方圖描述目標與背景之間的關系,假設(S′,T)是直方圖中的閾值,A′與B′分別代表背景與噪聲,C與D分別表示邊緣部分與目標,背景與目標出現的幾率分別記作b0和m1[9]。 (7) (8) 如果不考慮噪聲影響,b0+m1=1,目標與背景的整體均值表達式為 (9) 因此,獲得目標、背景之間的閾值表達式 Q=b0[(R0x-Zx)2+(R0y-Zy)2] +m1[(R1x-Zy)2+(R1j-Zy)2] =[b0(S′,T)Zx-Rx(S′,T)2+(b0(S′,T)Zy)- Ry(S′,T)2]/[b0(S′,T)(1-b0)(S′,T)] (10) 利用上述公式計算圖像中的全部像素點,即可實現目標與背景分離。 經過圖像預處理后,畫質得到增強,通過特征提取能獲得更多的病害特征。本文通過對番茄葉片顏色、形狀特征的提取,將其作為識別依據,提高識別精度。 3.1.1 顏色特征 與其它特征相比,顏色特征更加直觀,且對方向、形狀具有不敏感特點,僅需要將圖像顏色特征轉換為數值形式即可,本文利用直方圖完成顏色特征提取。通過直方圖形式描述不同顏色像素數量占整體圖像像素總量大小。其中,直方圖橫軸表示顏色等級,縱軸則是顏色比例[10]。直方圖不但可以體現出顏色大小,還能表現出顏色種類等信息。 直方圖的構建需選取恰當的顏色空間,保證信息表達的完整性,RGB(紅、綠、藍)為一種常用的描述方式,利用RGB空間提取顏色特征的模型可表示為 (11) (12) (13) 3.1.2 形狀特征 利用相關經驗,結合病斑形狀特征區分病害種類,再將先驗知識變換為計算機可識別的語言,通過計算機給出病害判斷結果,這是現階段農業領域發展的主要趨勢。番茄病害區和正常區域相比,病斑形狀較為明顯,針對圖像而言,形狀特點屬于物體本質特征,不會受到旋轉、平移等操作影響。但是在檢測形狀特征時,由于形狀的局限性與相似性,會干擾視覺判斷結果。 本文將形狀特征分為輪廓特征與紋理特征兩種。前者是對目標邊界進行分析,后者則需仔細探究病斑區域紋理細節。 1)邊界特征提取 此方法描述目標邊界特征,將獲得的結果當作形狀特征參數。經過Hough變換[11],連接全局特征與目標部分特征的邊界像素,構成封閉區域;構建邊界部分大小和方向的直方圖,根據該圖即可獲取邊界特征。 2)紋理特征提取 與邊界特征不同的是,紋理特征能反映目標形狀以及更加深層的信息[12]。如果只依靠視覺,一些紋理特征無法提取。因此,需要通過計算機技術,處理圖像內部灰度,再將處理后的信息變換為語言。紋理與色彩特征不同,它并不是在某個像素點的基礎上完成計算,而是針對多個像素點。即使紋理特征在旋轉等作用下不會發生改變,但易受光照等條件影響,改變分辨率,降低特征提取準確性。 為避免上述現象發生,使用灰度級共生矩陣提取紋理特征。此矩陣表示一種概率,即灰度值為v的像素點在長度是d′、方向是θ上生成灰度值是j的幾率,也可以當作對圖像灰度值概率密度的預測,共生矩陣能夠最大程度體現像素點的紋理特征。本文結合矩陣對比度、相關性、能量等變量完成紋理特征提取。 已知某圖像X的像素為M×N,灰度級設置為G′級,則圖像共生矩陣表示為 P(x,y,d′,θ)=P(I(l,w)) =(l+d′cos(θ),w+d′sin(θ)=y) (14) 式中,I(l,w)表示像素點(l,w)的灰度,d′為點(x,y)存在的距離,θ屬于兩點之間夾角。如果P為G′×G′結構的矩陣,此時d′與角度θ一經確定,不同角度下的共生矩陣,即可結合兩點之間的距離和夾角計算得出。為方便矩陣計算,一般選取的夾角度數為θ={0°,45°,90°,135°},因此有 (15) 最后,歸一化處理不同灰度共生矩陣即可實現紋理特征提取。 經過圖像預處理和特征提取后,以提取的病害特征為依據,引入核函數,建立覆蓋領域,實現病害圖像識別。 若已知某圖像的輸入集合表示為K={(x1,y1),(x2,y2),…,(xp,yp)},其中K代表n維空間中像素點集合,集合中樣本數量為p。將K分割成ζ個子集合,構建三層網絡N*,令其符合如下要求:經過該網絡后,屬于Ki′的點輸出值均為yi′,且yi′=(0,…,1,0,…,0),即第i′個分量等于1,其它分量等于0。則利用構造性核覆蓋算法識別病害圖像的過程如下: 任意選擇某核函數K(x,y),做如下變換 T′:O→Z,x∈O,〈T′(x),T′(y)〉=K(x,y) (16) 整個轉換過程可描述為:在n維超平面O中,變換T′將O平面上的點映射在p核空間中,則核空間輸入集合表示為pT′,此種變換具有一一對應特征。 在核空間中,設定輸出集合Y的前a個值都不同,經過上述變換后,能夠計算出核空間內的覆蓋Ci′,計算過程如下 步驟一:在樣本集合內任意挑選一個xi′,確保xi′∈pT′,且同時滿足如下條件 (17) (18) (19) (20) 結合xi′與di′建立覆蓋Ci′,此覆蓋中心是xi′,覆蓋半徑為di′。 步驟二:建立覆蓋后,刪除pT′中已經被Ci′覆蓋的點,再從pT′內選出一個覆蓋中心,經過多次操作后,直到所有點均被刪除后,整個覆蓋領域建立,也就完成了對所有病害圖像的識別。該方法增加了求優過程,且先從局部區域考慮覆蓋問題,由局部向整體延伸,保障了識別的全面性,提高了識別精度。 仿真中,選取下述三種典型的番茄病害類型為識別目標,病害特征描述如下。 1)白粉病:雖然危害不高,但分布范圍廣。一般表現為在番茄葉片上生成細小粉斑,到后期會擴展成白粉斑,且粉狀越來越密集,逐漸遍布整個葉片。 2)番茄疫病:病害初期在葉片上形成圓斑,逐漸發展為不規則病斑,由中心向外擴散,當空氣潮濕時還會出現黑霉。 3)黃化曲葉病:前期癥狀為葉片皺縮并伴有發黃現象,使植株發育矮小。該病害通常在開花結果時間段發病,到后期整個葉片都會發黃,且葉片卷曲,嚴重時還會出現腐爛癥狀。 本次實驗共采集番茄病害葉片圖像700幅,其中,健康圖像100幅,白粉病、番茄疫病、黃化曲葉病各200幅。首先對本文方法、注意力機制算法、遷移學習機制三種算法的圖像預處理效果進行對比。選取四幅不同類型番茄葉片圖像,預處理結果分別如圖1-4所示。 圖1 初始圖像效果 圖2 本文方法圖像預處理效果 圖3 注意力機制預處理效果 圖4 遷移學習機制算法處理效果 由圖1-4能夠看出,本文方法圖像預處理效果最好,圖像畫質得到明顯改善。注意力機制算法雖然也得到了清晰的番茄葉片圖像,但葉片細節特征無法顯現;遷移學習機制對圖像邊緣部分處理不夠完善,且在部分圖像中還會遮擋葉片主要特征。本文之所以得到質量較高的圖像是因為,均值濾波算法能夠有效去除圖像噪聲,再通過最大類間方差法實現背景分離,進一步提高畫質。 經過圖像處理后,對這些圖像進行病害識別,引入平均識別率指標來驗證三種算法識別性能,該指標值越高,表明識別效果越好。計算公式如下 (21) 圖5 不同方法識別效果對比圖 分析識別結果可以發現,本文方法無論對于哪種病害圖片,識別率都在95%以上。而其它兩種對于白粉病的識別率較低,這是因為白粉病在初期癥狀較輕,白點較小,如果圖像清晰度不夠難以識別出來。 本文方法預處理后的圖像信噪比高,從多方面完成特征提取,再加上構造性核覆蓋算法添加了合適的核函數,實質就是增加一次尋優操作,使識別劃分邊界更加清晰,進而提高識別效果。 為提高番茄病害識別效果,構建一種基于構造性核函數的病害圖像識別方法。在識別開始之前,對圖像進行去噪處理,提高信噪比,再通過多方位特征提取,獲取各類病害特征,最后在核空間內完成圖像識別。仿真結果證明了該方法可以準確識別出番茄各類病害,為病害治理提供依據。但本次實驗樣本容量范圍小,獲取的結果還有待提升。在今后研究中挖掘更多病害樣本,針對大容量樣本開展實驗,進一步證明該方法在病害識別中的實用性。



3 基于構造性核函數的病害圖像識別
3.1 病害特征提取




3.2 核空間內番茄病害圖像識別實現




4 仿真數據分析與研究







5 結論