王威松 周慧玲 秦 戈 成思揚 汪中明 崔 淼
(北京郵電大學自動化學院1,北京 100876) (國家糧食和物資儲備局科學研究院2,北京 100037)
在長時間、大容量的原糧存儲過程中,及時準確地監測糧倉內早期害蟲的發生情況,是對儲糧蟲害進行綜合治理、控制其發生和發展的主要依據。在糧倉內,蛀蝕性害蟲主要有象甲科(米象、玉米象)和長蠹科(谷蠹),粉食性害蟲主要有扁谷盜科(長角扁谷盜、土耳其扁谷盜、銹赤扁谷盜)、擬步甲科(赤擬谷盜、雜擬谷盜)和鋸谷盜科(鋸谷盜)。這兩大類害蟲一般在糧堆中同時存在,它們數量的快速增長對糧食的數量和質量會造成很大的危害。
近年來,對糧堆內部害蟲發生的監測已經逐漸引入了電子化的手段,例如利用介質電導率、氣味、聲音和紅外光信號等信息作為判別害蟲的測量手段。其中電子探管,是基于探管式誘捕器[3]和紅外光電傳感器設計的一種監測裝置,因其價格經濟,既能夠監測糧堆內部不同深度的害蟲發生情況,又能夠估計害蟲密度[1, 2],具有廣泛的應用前景。最先提出且具有代表性意義的電子探管是Litzkow等[4]的電子糧食探管害蟲計數器 (Electronic Grain Probe Insect Counter, EGPIC),它通過一對紅外光電發射和接受二極管監測通過其中的害蟲。當害蟲穿過時會對光束產生遮擋,電路將遮擋程度轉換成對應的電信號,以遮擋程度是否超過預設閾值為特征來實現對害蟲的計數。Shuman等[5]對EGPIC進行了改進,用同一層面相互垂直的兩對二極管最大遮擋程度的和方根為特征,一定程度上降低了害蟲下落姿態對計數準確率的影響,并實現了對米象和銹赤扁谷盜做二分類的功能[6],加拿大OPI Systems公司于2003年將其注冊為了商業化產品Insector[7],但目前未在我國看到有銷售和應用。Toews等[8]將探管式誘捕器對銹赤扁谷盜的捕獲進行了詳細的對比實驗,驗證了探管直徑在26~60 mm范圍內不影響害蟲的捕獲效果,15 cm長的捕蟲段內的孔密度在40~120個范圍內對害蟲的捕獲效果是一樣的。國內熊鶴鳴等[9]將探管式陷阱誘捕法同扦插取樣法進行了對比,發現探管式誘捕器比取樣器更能準確地監測害蟲種群的數量變化。上述研究為本研究裝置的設計和實現提供了可靠的經驗。但是對Insector相關的公開文獻[10]進行分析,電子探管雖然對捕獲的害蟲實現了較高準確率的計數,但對害蟲的分類識別僅關注了對害蟲體長信息的粗糙提取[11],并沒有充分利用害蟲下落時整個遮擋過程對應的電信號,即整個紅外光電序列,且對電子探管獲得的紅外光電序列數據的分布穩定性沒有公開的論述。我們認為只有在確定了數據分布的穩定性后,后續的分類算法工作才有意義。

圖1 儲糧害蟲誘捕在線監測裝置
本研究基于探管式誘捕器,結合紅外光電傳感技術,主要做了以下工作:
a)研發了儲糧害蟲誘捕在線監測裝置(下文簡稱裝置),可采集完整的紅外光電序列,并基于該裝置建立了蛀蝕性害蟲(米象、玉米象、谷蠹)和粉食性害蟲(長角扁谷盜、土耳其扁谷盜、銹赤扁谷盜、赤擬谷盜、雜擬谷盜、鋸谷盜)的紅外光電序列數據集;
b)基于數據統計和數據可視化的方法驗證了害蟲進入誘捕段的位置(下文簡稱初始高度)不影響紅外光電序列數據分布的穩定性,不同害蟲樣本之間的多樣性也不會破壞紅外光電序列數據分布的穩定性;
c)利用整個紅外光電序列,基于高斯核支持向量機模型,給出了蛀蝕性害蟲和粉食性害蟲的二分類結果,以及這兩大類害蟲中不同種害蟲的細分結果。
本研究設計的裝置原型及其示意圖如圖1a和圖1b所示。它主要由5部分組成:誘捕模塊、收集漏斗、監測及釋放模塊、數據采集電路板和數據傳輸電路板。監測電路的關鍵部件參數如表1所示。
1)誘捕模塊:基于探管式誘捕器設計,用于對儲糧害蟲的誘捕。探管的高度可以通過增減該模塊的個數而改變。本研究用可改變高度的紙盒替代誘捕模塊,以模擬儲糧害蟲從不同初始高度進入裝置的情況。
2)收集漏斗:儲糧害蟲從誘捕模塊進入后往下掉落,收集漏斗約束掉落過程中害蟲的運動軌跡,使得害蟲能夠進入紅外光電傳感器的監測范圍。
3)監測及釋放模塊:由紅外光電傳感器和害蟲釋放出口組成。紅外光電傳感器采用對射型紅外光電二極管。釋放孔用于將采集完數據的害蟲釋放,在一定程度上保證了糧堆內部害蟲的分布不被破壞。
4)數據采集板:用于對紅外光電傳感器數據的采集控制,主要由運算放大器、微控制器片上定時器和片上模數轉換器完成。
5)數據傳輸板:用于將數據采集板采集到的數據通過串口傳輸至PC端并保存,以進行數據分析和建模。
一個完整的數據采集過程描述如下:儲糧害蟲從誘捕模塊進入裝置,跌落至收集漏斗后沿收集漏斗往下滑落,在下落至監測及釋放模塊處開始遮擋傳感器的光束,傳感器在不同面積的遮擋下將產生不同的光電流信號,數據采集板將光電流信號轉化為離散的電壓信號并放大,最后數據傳輸板將數據采集期間的所有電壓信號上傳至PC端,儲糧害蟲從釋放孔逃走。

表1 監測電路的關鍵部件參數
2.1.1 紅外光電序列
為模擬害蟲進入誘捕段的自然掉落,將儲糧害蟲無初始速度地釋放進裝置中。將裝置做遮光處理,以模擬糧堆內部的黑暗環境,完成數據采集過程,數據采集示意圖如圖2所示。當沒有害蟲掉落時,電路采集到的電壓值在基準電壓0.94 V上下波動,且不超過閾值1.03 V。原型裝置采用了互相垂直的兩組傳感器,如圖2a中的傳感器1和傳感器2,當有害蟲掉落時,電壓值將發生突變,產生一個凸起的波形,所以一個害蟲樣本對應兩個波形,分別對應圖2b中的藍色波形和紅色波形。將一個害蟲樣本對應的兩個波形記為一個紅外光電序列,將任意一組傳感器的波形記為該紅外光電序列的一個通道,即裝置采集到的紅外光電序列有兩個通道。

圖2 數據采集示意圖
為深入理解紅外光電序列,將一個害蟲樣本的數據采集過程分為兩步進行描述:第一步從害蟲剛進入紅外光電傳感器的光束范圍開始到害蟲在光束內的遮擋程度最大為止,對應波形的上升部分,即t0到t1時刻,如圖2c所示;第二步從害蟲在光束內的遮擋程度最大開始到害蟲完全離開光束范圍為止,對應波形的下降部分,即t1到t2時刻。記t2-t0為該害蟲樣本的采樣時長,若裝置的采樣頻率為fsample,則該害蟲樣本的紅外光電序列數據的長度(采樣點數)為(t2-t0)×fsample。其中t0時刻為紅外光電序列任一通道最先超過閾值1.03 V的時刻,t2時刻為紅外光電序列任一通道最晚低于該閾值的時刻。
2.1.2 數據集的建立
本研究的試蟲來源于國家糧食和物資儲備局科學研究院儲藏所,均為成蟲活蟲,在實驗期間養于實驗室室溫條件(溫度22~25 ℃、相對濕度40%~50%),培養飼料均為小麥。設置10 kHz的采樣頻率,對9種害蟲在不同初始高度下進行紅外光電序列數據的采集。建立的儲糧害蟲的訓練集和測試集的紅外光電序列數量如表2所示。為避免分類器過擬合,均分不同種別的數據數量以保證不同小類的數據數量相同。其中:*3是指在三種不同的初始高度(50、100、150 mm)下進行的數據采集,被乘因子108為在各初始高度下采集的樣本數量,訓練集與測試集為三種初始高度下數據的均勻混合。

表2 訓練集和測試集的紅外光電序列數量

注:圖a檢測到兩條數據90次(未發生抱團);圖b檢測到一條數據10次(發生抱團)。圖3 兩頭長角扁谷盜害蟲在同一高度同時進入裝置的實驗測試結果圖
本研究提出的方法是用于對害蟲的早期發生進行監測,蟲口密度較低。但我們對兩頭害蟲同時進入裝置的低概率情況也做了模擬測試。將兩頭長角扁谷盜在同一高度無初始速度地同時釋放進裝置,在100次實驗中,兩頭害蟲抱團進入傳感器監測范圍而得到一條數據的情況只出現了10次,圖3展示了模擬測試結果。所以本研究只對單頭害蟲逐一進入裝置的情況進行了研究。
只有在確定了紅外光電序列數據對初始高度的魯棒性,以及對樣本多樣性的魯棒性,才能進行后續的分類工作。
害蟲種別是害蟲采樣時長的影響因子,體積越小采樣時長越短。若不同的初始高度能導致害蟲樣本的采樣時長具有很大的差異,即害蟲樣本的采樣時長是初始高度的函數(如初始高度越高采樣時長越短),那么低初始高度的小體積害蟲和高初始高度的大體積害蟲將可能具有相同的采樣時長,而在不同初始高度的同體積害蟲卻可能具有不同的采樣時長,這將會導致數據分布的不穩定。另外,若紅外光電序列的分布不受初始高度影響,但受同種害蟲不同樣本多樣性(下落姿態、個體差異等)的影響,那么數據分布依然會是不穩定的。
2.2.1 對初始高度的魯棒性分析
害蟲的下落過程大致包括自由落體、與收集漏斗的碰撞、在收集漏斗上的滑落和在監測及釋放模塊中的自由落體,整個運動過程十分復雜,所以本研究通過數據統計的方法進行了分析,而不對整個運動過程進行建模。考慮到任意一種害蟲在紅外光電序列數據對初始高度的魯棒性的問題上均具有代表性,本研究以谷蠹為例進行了分析。基于谷蠹的紅外光電序列數據,通過數據統計的方法得到谷蠹在不同初始高度下的采樣時長的箱線圖,如圖4所示。通過分析發現,谷蠹在50、100、150、200 mm的初始高度下,箱線圖的中心和散布均沒有明顯差異。將不同初始高度谷蠹的紅外光電序列數據數量、采樣時長與初始高度的方差分析結果列于表3,計算方法如式(1)~式(5)所示。不同初始高度下各樣本采樣時長的均值為
(1)
式中:i代表不同初始高度,j代表不同樣本,xij為不同初始高度下不同樣本的采樣時長,Mi為各初始高度下的樣本數量,式(2)、式(3)中符號含義均同式(1)。所有初始高度下各樣本采樣時長的均值為
(2)
式中:n為全部樣本數量,k為初始高度種類,式(3)、式(4)中符號含義均同式(2)。處理均方為
(3)
誤差均方為
(4)
F檢驗統計量為
(5)
查F檢驗臨界值表,N1=k-1=3,N2=n-k=428時,F0.05=2.626,F0.01=3.828,而谷蠹在4種不同初始高度之間F值為1.204 9,F 圖4 谷蠹在不同初始高度下的采樣時長的箱線圖 表3 谷蠹的紅外光電序列數據數量、及采樣時長與初始高度的方差分析結果 2.2.2 對樣本多樣性的魯棒性分析 基于紅外光電序列訓練和測試數據集,對每一種別害蟲均隨機采樣108個樣本,將紅外光電序列不同通道的離散數據的和方根連接成線條,進行數據可視化,如圖5所示。線條重疊次數越多的地方顏色越深,而只有一根線條的地方顏色最淺,我們通過顏色的深淺分布來判斷紅外光電序列數據分布的穩定性。每種害蟲都有且只有一個顏色最深的區域帶,即同一種害蟲的樣本數據均集中在同一個分布內,說明紅外光電序列數據的分布對樣本多樣性具有魯棒性。 圖5 紅外光電序列數據集可視化 害蟲進入裝置的初始高度和樣本多樣性均不影響裝置采集到的數據的分布,即紅外光電序列數據的分布具有一定的穩定性,可以利用整個紅外光電序列做分類研究。 本研究采用將各通道同一時刻的電壓值做和方根的方式進行數據預處理,采用高斯核的支持向量機[12]對經過預處理后的紅外光電序列訓練數據集進行建模,通過基于10折交叉驗證的網格搜索的方式進行參數尋優,待求解到最優參數后,用該參數和訓練數據集全體重新求解得到最優分類器,最后用該分類器在測試數據集上進行性能評估,其中準確率、召回率、F1值及其加權平均分別為 (6) (7) (8) (9) 式中:wi為類別i的樣本數在測試集中占的比例。蛀蝕性害蟲與粉食性害蟲的分類結果如表4所示,兩類的平均準確率達87.7%。召回率、F1值與準確率相近,說明該分類結果沒有受到樣本均衡問題的影響。 表4 蛀蝕性害蟲與粉食性害蟲分類結果 本研究還進一步對蛀蝕性害蟲和粉食性害蟲內的小類進行了細分識別,其結果如表5和表6所示。對于蛀蝕性害蟲,因為長蠹科(谷蠹)和象甲科(米象、玉米象)的體長、體積相近,同時紅外光電序列數據攜帶的形狀信息太過粗糙,無法精準區分兩者的形狀差異。在粉食性害蟲中,扁谷盜科(長角扁谷盜、土耳其扁谷盜、銹赤扁谷盜)、擬步甲科(赤擬谷盜、雜擬谷盜)和鋸谷盜科(鋸谷盜)這三類的紅外光電序列的形狀差異比較明顯,三類的平均準確率為87.7%,對于數據差異最為明顯的擬步甲科(赤擬谷盜、雜擬谷盜)的分類準確率可達95.3%,這與擬步甲科同另兩類害蟲的體長、體積差異最大這一事實相符。 表5 蛀蝕性害蟲細分結果 表6 粉食性害蟲細分結果 本研究提出了一種用于糧堆內部的儲糧害蟲誘捕在線監測裝置,通過建立紅外光電序列數據集和分析實驗數據,驗證了該裝置具有在線監測害蟲的可靠性。同時提出了充分利用害蟲在下落時對紅外光電傳感器遮擋的整個過程的光電信號的方法,并基于高斯核支持向量機模型在測試集上達到了87.7%的加權平均分類準確率。此外,本研究還探索了更精細化分類的可能性,對于開發實際可應用的探管式儲糧害蟲發生監測設備具有指導意義。


3 實驗





4 結論