李 敏,鄧繼忠,袁之報,黃華盛,王 張
(1.華南農業(yè)大學工程學院,廣東廣州 510642;2.海南出入境檢驗檢疫局熱帶植物隔離檢疫中心,海南海口 570311)
小麥腥黑穗病是毀滅性的檢疫對象,一般發(fā)病田塊的小麥將減產10% ~20%,嚴重的減產50%以上,甚至絕收[1]。小麥的網腥、印度腥和矮腥等3種黑穗病常混入進口小麥原糧中,而且它們的冬孢子形態(tài)特征比較相似[2],采用顯微鏡人工觀察方式進行檢疫是較為繁瑣且困難的。針對小麥腥黑穗病害的顯微圖像,結合圖像分析與模式識別技術對其進行分類診斷,不但能夠實現(xiàn)檢驗檢疫的自動化,也將有助于提高病害檢測的客觀性與穩(wěn)定性。文中設計了一個BP神經網絡分類器,將其用于3種小麥病害的分類。
BP神經網絡是一種分層型網絡,其結構如圖1所示。從左至右的圓圈分別代表輸入層、隱含層和輸出層的神經元,相同層次間的神經元之間沒有連接,不同層次之間的神經元形成全互連連接。輸入單元的狀態(tài)代表輸入到此網絡中的原始信息,隱含單元的狀態(tài)取決于輸入單元的狀態(tài)及該輸入單元與隱含單元之間連接的權值。輸出單元的狀態(tài)取決于隱含單元的狀態(tài)及隱含單元和輸出單元之間連接的權值[3]。

圖1 含有1個隱含層的BP網絡模型
小麥的網腥黑穗、印度腥黑穗及矮腥黑穗等3類病害都有自己獨特的圖像特征。圖2所示為通過圖像處理技術分離出的小麥病害孢子圖像。孢子圖像的特征,可以通過提取圖像的形狀與紋理特征加以定量描述。經過分析,選擇了描述孢子圖像的長軸、短軸、等價橢圓短軸、面積、周長及慣性矩[4]等6個參數(shù)作為描述3類病害的典型特征參數(shù)。由此,BP網絡分類器的輸入層由6個進行了歸一化處理的特征向量構成,即輸入層的神經元數(shù)為6維;輸出層根據(jù)應用BP神經網絡的目的而定,文中的目的是為了能區(qū)分出病害類別,所以可以將輸出層設定為一維,即只有一個輸出,但為了更好地實現(xiàn)病害的分類,文中對目標期望輸出進行編碼。其中,“1”代表網腥,“2”代表印度腥,“3”代表矮腥。對于輸出“1”,用目標輸出向量(0,0,0,1)來表示;對于“2”,用(0,0,1,0)表示;同理,對于“3”,用(0,1,0,0)表示。由此可以確定輸出層的神經元數(shù)目為4,即輸出層的向量維數(shù)為4。

圖2 提取的小麥病害孢子圖像
但通過后續(xù)實驗發(fā)現(xiàn),當采用目標輸出向量(0,0,0,0)的時候,BP網絡無法收斂,因為采用的傳遞函數(shù)的輸出永遠不能達到0或者1,而只能接近。所以,需要糾正目標輸出向量。對其重新編碼后,最終編碼方案如下:
1 的編碼:0.1,0.1,0.1,0.9
2 的編碼:0.1,0.1,0.9,0.1
3 的編碼:0.1,0.9,0.1,0.1
由于系統(tǒng)是非線性的,初始權值與學習是否達到局部最小、是否能夠收斂以及訓練時間的長短關系很大。如果初始權值太大,則使得加權后的輸入落在激活函數(shù)的飽和區(qū),從而使調節(jié)過程幾乎停滯。所以,一般總是希望經過初始加權后的每個神經元的輸出值都接近于零,這樣可以保證每個神經元的權值都能夠在它們的激活函數(shù)變化最大處進行調節(jié)。因此,選取初始權值在(-0.5,0.5)之間的隨機浮點數(shù)。
網絡訓練精度的提高,可以通過采用不增加隱含層,而增加其神經元個數(shù)的方法獲得。這在實現(xiàn)上,要比增加隱含層簡單得多。在具體設計時,通過對不同隱含層神經元數(shù)個數(shù)的網絡進行訓練比較、對比,然后加上適當余量。研究采用一個隱含層,隱含層的神經元數(shù)通過式(1)計算得到。

其中,N為輸入層神經元數(shù);M為輸出層神經元數(shù)[5]。文中選取隱含層為10層。
傳遞函數(shù)也叫激活函數(shù),傳遞函數(shù)必須可導。本研究的傳遞函數(shù)選定為S形的Sigmoid函數(shù),表達式如下

學習速率決定每一次循環(huán)訓練中所產生的權值變化量。過大的學習速率可能導致系統(tǒng)不穩(wěn)定,但過小的學習速率將導致訓練時間較長,收斂速度很慢。所以,一般情況下,傾向于選取適中的學習速率以保證系統(tǒng)的穩(wěn)定性。學習速率的選取范圍0.01~0.8。經過比較試驗,該分類器的學習速率最終設定為0.1。
圖3所示為設計的用于小麥腥黑穗病診斷的BP神經網絡分類器模型圖。

圖3 用于小麥腥黑穗病診斷的BP網絡分類器模型
利用BP網絡對小麥腥黑穗病害分類的算法步驟[6]如下:
Step1:把訓練樣本的特征向量歸一化到(0,1)范圍內。
Step2:設置輸入向量 Xk=[xk1,xk2,xk3,xk4,xk5,xk6],k=1,2,…,N,N為訓練樣本的個數(shù)。
權值向量Wij(n)、Wjp(n),i代表輸入層,j代表隱含層,p表示輸出層。
輸出向量 Yk(n)=[yk1(n),yk2(n),yk3(n),yk4(n)],k=1,2,…,N;表示第n次迭代時網絡的實際輸出;令學習速率η=0.1,最大迭代次數(shù)n=200 000,動量項α=0.9,期望誤差=0.01。
Step3:隨機初始化權值,為(-0.5,0.5)之間的隨機浮點數(shù);迭代次數(shù)n=0。
Step4:輸入訓練樣本,計算BP網絡每層神經元的輸入信號u和輸出信號v。
Step5:由期望輸出和Step4求出的實際輸出計算誤差Err,判斷其是否滿足最小平均誤差要求,若滿足轉至第8步,不滿足轉至Step6。
Step6:判斷是否達到最大迭代次數(shù),若大于轉至Step8,否則對輸入樣本反向計算每層神經元的局部梯度δ;

Step7:按式(5)計算權值修正量Δω,并按式(6)修正權值;n=n+1,轉至Step4。

Step8:判斷訓練樣本是否學習完畢,是則結束,否則轉至Step4。
由于BP網絡的輸出為四維,文中用向量的相似度表示分類結果。即將BP網絡的4個輸出層看作一個4維向量。相似性函數(shù)是用函數(shù)的方法來表征兩向量相似的程度。文中采用夾角余弦法計算待測病害樣本和3類標準樣本輸出向量的相似度,用其表示輸出結果。其計算公式為

其中,x,y是用于度量的向量;n表示向量的維數(shù);i=1,2,…,n。sim(x,y)取值越大表明兩向量夾角越小,兩者越相近。
試驗用原始顯微圖像均由海南省出入境檢驗檢疫局提供,分辨率為2 048×1 536 pixel、jpg格式。從顯微圖像中提取包括小麥矮腥黑穗病、小麥網腥黑穗病及小麥印度腥黑穗病共48個病害孢子樣本圖像進行了分類診斷的初步試驗,其中15個作為訓練樣本集,另外33個樣本作為測試集輸入BP網絡,測試結果如表1所示。可以看出,對這3類病害的平均識別率可以達到81.8%,且有一定的準確性;對印度腥、矮腥分別有1個和3個樣本不能正確識別,原因在于:訓練樣本太少,由此提取的各類特征數(shù)據(jù)典型性不足;不能識別的測試樣本圖像不夠清晰,因而提取的特征數(shù)據(jù)被削弱。

表1 3類病害分類診斷測試結果
將圖像分析技術與模式識別技術應用于小麥腥黑穗病害的分類診斷,對于提高出入境植物病害檢驗檢疫工作的自動化程度具有實際意義的。通過分析與比較,選擇小麥矮腥、印度腥及網腥病害圖像的長軸、短軸、等價橢圓短軸、面積、周長及慣性矩等6個形狀和紋理特征作為分類的典型特征,構成BP網絡的輸入向量,按照分類目標,選擇輸出向量的維數(shù)為4,由此構建了含一個隱含層的BP網絡分類器。通過對15個樣本進行訓練,對33個樣本進行了分類測試,平均正確識別率達到81.8%,結果表明,采用BP網絡作為分類器對小麥腥黑穗病進行診斷具有一定的準確性,今后可通過分析各類病害樣本,提取更加典型的特征,并增加BP網絡的訓練樣本量,能夠進一步提高識別的準確性。此外,獲取更為清晰的顯微圖像,更準確地提取其中的孢子區(qū)域都有助于提高后續(xù)分類診斷的準確性。
[1]中國農業(yè)網.小麥腥黑穗病防治技巧.[EB/OL][2010-04-10](2011 -05 -11)http://www.zgny.com.cn/ifm/tech/2010 -4 -10/101504.shtml.
[2]梁再群,郭翼奮,朱穎初,等.根據(jù)統(tǒng)計分析冬孢子形態(tài)特性區(qū)分小麥矮腥黑穗病和網腥黑穗病的方法[J].植物保護學報,1982,9(4):243 -250.
[3]BURKS T F,SHEARER S A,GATES R S.Backpropagation neural network design and evaluation for classifying weed species using color image texture[J].Transactions of the A-merican Society of Agricultural Engineers,2000,43(4):1029-1037.
[4]賀夫昌.基于圖像分析的出入境小麥病害診斷方法研究[D].廣州:華南農業(yè)大學,2010.
[5]常俊.基于特征提取及神經網絡的圖像分類識別與目標跟蹤[D].西安:西安電子科技大學,2008.
[6]高雋.人工神經網絡原理及仿真實例[M].北京:機械工業(yè)出版社,2007.
[7]彭淑敏,王軍寧.基于神經網絡的圖像識別方法[J].電子科技,2005,18(1):39 -42.
[8]姚慧娟,欒曉明.改進的BP網絡算法在圖像識別中的應用[J].電子科技,2010,23(9):90 -92.