李 揚, 腰彩紅, 蘭 璞, 田 濤, 孫海波, 王建春
(天津市農業科學院,天津 300112)
草莓是天津市冬春季節設施農業高價值作物之一,普遍采用設施栽培,易出現濕度大、光照不足和通風不良等問題,為草莓病害的發生提供了有利條件。白粉病是由專性寄生菌引發的,是近年來危害草莓產量及品質的主要病害之一,發生頻率高,損失嚴重。只要條件合適,病原菌20 h即可侵入葉片表皮,4 d后可形成白色菌絲,7 d后成熟可形成新的分生孢子,進而在幾天內迅速感染整個溫室。統計表明草莓感染白粉病后一般減產20%~50%,嚴重影響草莓的產量和品質[1]。因此對草莓白粉病的發生進行預測,并盡早采取措施予以治療,將有效減少白粉病對作物的影響,降低農民損失。
目前白粉病預測技術使用的方法主要包括基于孢子捕捉技術預測和基于環境氣候預測2種[2]。基于孢子捕捉技術的預測是通過在載體上涂抹黏性物質來黏附空氣中的孢子,并定期帶回實驗室通過顯微鏡對孢子數量進行檢測,再結合環境、作物抗病性等因素進行病害的預警。李磊福等以累積濕度和孢子量為變量構建了溫室甜瓜白粉病流行預測模型,對溫室瓜菜白粉病發病進行了預測,取得了較好的效果[3]。高士剛等使用了一體化智能孢子捕捉儀證實黃瓜霜霉病和黃瓜白粉病病情指數與連續7 d孢子捕捉總量具有強正相關性[4]。Cao等通過對空氣中小麥白粉病菌分生孢子動態監測,建立了基于氣象因子和孢子濃度的小麥白粉病預測模型[5]。Carisse等利用孢子量、作物抗病性和氣象信息對草莓白粉病的發生風險進行預測,構建了基于采樣當天的孢子量、平均相對濕度、適宜溫度下的平均小時數等參數的決策樹模型,并驗證了模型的有效性[6]。這些研究都證實了使用孢子量進行白粉病預測的效果。近年來孢子捕捉技術的發展,特別是圖像處理技術的發展促進了使用孢子捕捉技術進行作物病害監測預警的研究和技術的迭代更新,進一步提高了病害監測預警的質量和水平,但由于孢子捕捉儀的專業性強,實際生產中還是存在難以推廣的問題。因此,現階段基于環境氣候預測仍是作物病害預測使用的主要方法,即通過歷史氣象數據模擬病害傳播路徑,并結合病害發生時序等實際情況構建預測模型,對病害進行預警。尚志云等利用1990—2010年河北省冬小麥白粉病和國家氣候中心大氣環流特征量指數資料,建立了冬小麥白粉病預測模型,年前和春季病害發生程度預測模型的準確率分別為81.0%和90.5%[7]。吳燕君等通過監測2007—2019年設施黃瓜白粉病的田間流行動態,建立了基于逐步回歸分析法的春黃瓜、秋黃瓜白粉病發生預測模型,經擬合率檢驗,各模型均達75分以上的準確度[8]。魏少偉等使用2020年9—11月在北京4個溫室的空氣溫度、相對濕度、光照強度構建了貝葉斯網絡模型,對日光溫室黃瓜白粉病進行了預測,準確度達到了87%以上,具有良好的普適性[9]。
目前基于環境氣候的白粉病預測大多采用回歸分析等方法,這些方法需要大量歷史年份數據,且不考慮各個變量之間的內在聯系,導致模型適應性不強。近年來,人工神經網絡算法由于其強大的非線性逼近能力和自適應能力,逐漸被引入到病害預測、環境預測等領域[10],在水稻[11]、黃瓜[12]、臍橙[13]等作物和水產領域[14]已經取得了較好的效果。但鮮有針對設施草莓白粉病預測的研究,本研究主要以日光溫室草莓種植期間的環境和病害發生情況作為樣本,采用長短時記憶網絡(long-short term memory,簡稱LSTM)對其發病情況進行預測,為病害防治奠定基礎。
草莓品種選擇紅顏和章姬,二者均是天津越冬草莓主栽品種,適合日光溫室促成栽培。其中紅顏對白粉病抵抗能力弱,章姬較耐白粉病。試驗于2020年9月至2021年4月在天津市鼎牛農業園區1號溫室和2號溫室中進行,溫室由聚乙烯薄膜覆蓋,溫室面積約667 m2,草莓于9月初定植,并建立生產檔案,對灌溉、施肥等栽培管理措施進行記錄。
室內環境數據測量使用建大仁科溫濕度及光照度三合一傳感器、土壤溫濕度二合一傳感器。監測數據采集使用自主研發的數據采集設備完成,并上傳至服務器,數據采集頻率為15 min/次。室內傳感器按照5×5的位置布放,即將棚室劃分為25塊區域,橫向按照1~5劃分,縱向按照A~E劃分,傳感器布放在相應區域中心。溫室劃分情況如圖 1所示,布放現場及采集設備如圖 2所示。
調查根據選定的25個采樣點,每個采樣點對角線五點采樣,每點隨機選定3株,每株調查全部葉片,發病前每隔2 d觀察1次,待發現白粉病后每隔7 d觀察1次,統計發病情況,共調查18次,并根據GB/T 17980.119—2004[15]對病害程度進行分級。分級標準如表1所示,病情指數計算公式如下:


表1 病害程度分級標準
根據發病調查獲取了自第一次發現病害前7 d至種植期結束的全部環境數據,包括空氣溫度、空氣相對濕度、光照度、土壤溫度、土壤相對濕度5組。期間由于園區停電,傳感器故障等原因丟失部分數據,按照同一時段其他傳感器均值或鄰近日期同一位置數據測算,最終獲取213 000條環境數據。
為了分析環境因子在調查期間對于白粉病發生的影響,結合已有數據,設計了可能影響白粉病發生的因素共計25項,具體如表2所示。
LTSM是一種特殊的神經網絡(RNN)模型,是為了解決RNN模型梯度爆炸和梯度消失問題而提出的,適合處理和預測時間序列中間間隔和延遲相對較長的問題。使用記憶單元代替神經網絡中的神經元,LSTM記憶單元示意圖如圖3所示。

表2 預測指標
對比試驗中,首先將“1.4”節中獲取的環境數據按照“1.5”節中列出的25個指標項, 通過計算得到觀察期間每天的指標值共計400組指標記錄,按照80%和20%的比例分為訓練集和測試集。再根據觀測日期,將該日期前的nd的指標值作為輸入值,預測是否發病。開展3組試驗,對比預測效果。試驗1使用檢查日前4 d的數據,預測檢查日是否發病;試驗2使用檢查日前7 d至4 d的氣象數據,預測檢查日是否發病;試驗3使用檢查日前7 d的數據,預測檢查日是否發病(圖4)。
本研究中LSTM網絡使用PyCharm環境Python 3.9版本開發,用MySql數據庫及Excel進行數據整理分析。
混淆矩陣是用來評價模型時使用的主要工具,其定義如表3所示。

表3 混淆矩陣定義
在混淆矩陣基礎上,國際上廣泛采用的評價指標包括精確度(precision)、召回率(recall)和F1指數,相應公式如下:
precision=TP/(TP+FP);
recall=TP/(TP+FN);
F1=2×precision×recall/(precision+recall)。
精確度體現的是模型預測結果的正確程度,召回率體現的是是否所有結果都被正確地預測出來了,F1指數是準確度和召回率的綜合體現。本研究采用以上3項指標評價模型效果。
對比分析發現,同一溫室內不同區域由于小氣候仍然存在較大差異,導致發病程度不一。通過匯總調查的病情指數,繪制溫室劃分的25個區域的平均病情指數熱力圖(圖5)。從圖5可以看出,2、3、4區域感染白粉病病情指數要高于1、5區域,這主要是由于區域1更靠近出口溫度偏低,區域5更靠近側墻,人員流動小。2、3、4區域中3C區域感染白粉病病情指數最高,主要是由于此區域為溫室中心,空氣流動及環境情況都更適宜白粉病發展。其中標紅色框的區域發病病情指數也要高于周邊,主要是由于處于風口位置,空氣流動更大,更利于孢子的擴散。因此這些區域是未來監測白粉病發生的重點區域。
根據“1.7”試驗方法使用LSTM模型評估檢查日是否發病,測試集數據共計80條,試驗效果如表4所示。
從表4可以看出,試驗1中有大量預測發病但實際未發病情況,精確度僅為67%,雖然召回率達到了100%,整體F1指數僅為0.8,大量誤判在使用中極易造成人工的浪費。試驗3結果最好,精確度、召回率均達到了94%,F1指數達到0.94。試驗2精確度達到了93%,召回率達到了94%,F1指數為0.93,結果與試驗3結果相比僅多了1次誤判,沒有明顯差別,但可以比試驗3使用更少的數據,達到了幾乎相當的預測結果,在實際應用中將更有價值,即按照試驗2的模式,可以提前4 d預測草莓白粉病的發生,便于農戶提前做好預防。測試數據病情指數預測結果如圖6所示。

表4 試驗結果
本試驗選擇天津本地越冬茬高價值作物草莓開展研究,針對其易發病害白粉病進行觀測,總結了日光溫室內白粉病發病的高風險區域,作為病情監測重點區域,用于在模型預測發病時指導人工重點觀測。使用LSTM方法構建了草莓白粉病預測模型,選取了25項環境相關指標,使用發病前7 d至發病前4 d、發病前4 d和發病前7 d的環境數據作為輸入訓練模型,并比較預測效果。證實了使用發病前7 d至發病前4 d的環境數據可以準確地預測出草莓白粉病發病,精度達到了93%,與以發病前 7 d 的環境數據作為輸入的模型相比,預測準確度相當,但使用輸入數據更少,可以提前3 d預判出白粉病發病,取得了較好的試驗效果,可以在實際生產中用于白粉病發病預測。