









摘 要:小站稻是天津津南區的特產。小站稻病害的發生會嚴重影響其產量和品質,為防治病害,種植者常常會增加農藥使用量,從而導致環境污染。所以,需要及時準確地預測小站稻病害發生情況,以便有針對性地開展小站稻田間病蟲害防治工作,提高小站稻產量和品質,減少用藥,保護環境。傳統的病蟲害預警主要依靠田間樣本采集等方法,但這種方法無法及時掌握病害的發生和發展情況。針對上述問題,對小站稻氣象數據進行了采集和預處理,運用LSTM模型建立了小站稻病害預測模型,以預測小站稻病害發生情況。對比了支持向量機、決策樹、隨機森林、長短時記憶網絡、BP網絡等方法。結果顯示,采用LSTM模型對水稻病害預測的效果最佳,在預測惡苗病、細菌性褐斑病、稻瘟病、干尖線蟲病這四種病害時平均準確率高達87.06%,優于其他對比模型。
關鍵詞:LSTM;深度學習;病害預測;智慧農業;云平臺;小站稻
中圖分類號:TP391 文獻標識碼:A 文章編號:2095-1302(2025)07-0-05
0 引 言
水稻病害嚴重影響了水稻的生長和產量。在全球范圍內,每年因病害和蟲害所造成的額外成本幾乎占整個糧食生產總成本的四分之一[1]。此外,全球氣溫逐年上升,為病蟲害的發生提供了極為有利的條件,使得病害程度逐年加重,所以,加強病蟲害的預防和監控至關重要[2-3]。傳統種植業防治病蟲害的有效方法有噴灑殺蟲劑和培育具有耐病蟲害基因的新品種。但隨著抗病品種的增加,稻米品質難以得到保證。另外,農藥的大量使用有可能引發食物的安全問題,且過量使用農藥還會對環境造成一定程度的損害[1,4]。更重要的是,環境和食品中的有毒化學殘留會影響非目標生物生存,還可能會導致人類患癌[5]。
目前,在我國農業病蟲害預警監控工作中,主要依靠田間樣本采集來獲取病蟲害信息。這種方法雖然準確性較為可靠,但存在不少問題,例如,它不能反映病蟲害的全貌、不夠及時且過于主觀[6],并且需要投入大量的時間和資源。所以,傳統的田間樣本采集方法無法及時掌握病害的發生和發展情況。
綜上所述,在精準農業中,病害預測有著重要意義。它能夠助力農民及時察覺病害并加以應對,從而最大程度保障作物產量與質量,達成農業的可持續發展[7]。本研究把小站稻常見的四種病害,即惡苗病、細菌性褐斑病、稻瘟病、干尖線蟲病作為研究對象,依據病害的適宜氣象來預測病害理論上發生的概率。
1 材料與方法
1.1 數據采集和預處理
本文主要研究基于天津地區氣象參數進行病害預測的方法[8],所涉及的病害有惡苗病、細菌性褐斑病、稻瘟病、干尖線蟲病。氣象數據主要采集自天津及附近地區的三個站點:54511、54527、54534,數據來源于“https://rp5.ru/”網站,包含2020—2022年每年4月1日—11月30日的數據。文獻[9]曾利用貝葉斯模型,通過10年的長期數據構建了中國臺灣試驗稻田的天氣波動(溫度、相對濕度、風和降雨)、耕作系統(常規和低外部投入耕作)與作物病害之間的關系,研究表明天氣波動對稻田真菌病害發病率的影響會超過耕作制度的影響。因此,本文主要采集的氣象因子包括濕度、風速、最低氣溫、最高氣溫、降水量,采集數據見表1。
由于訓練氣象數據存在缺失值,故對連續缺失值予以清除,對不連續的缺失值采用插值法添加數據。經過處理后,總共得到14 191條有效數據。然后,在不同氣象條件下,對最有可能出現的病害進行標注,依據此操作將氣象數據整理成數據集,最終得到的結果見表2。最后,按照9∶1的比例劃分為訓練集和測試集,數據劃分情況見表3。
預測部分數據采集自中國天津市優質農產品示范基地,由圖1所示設備實時采集濕度、風速、最高氣溫、最低氣溫、降水量五種參數。采集設備由深圳矽遞科技股份有限公司提供。
1.2 模型算法選擇
支持向量機(Support Vector Machine, SVM)是一種在分類與回歸分析中分析數據的監督式學習模型和相關的學習算法。
K最鄰近法(K-Nearest Neighbor, KNN)是一種理論上比較成熟的方法,也是最簡單的機器學習算法之一。
決策樹(Decision Tree, DT)是一種常用的分類算法,它通過構建樹狀預測模型,對未知類別的數據進行分類。
隨機森林(Random Forest, RF)是一種用于分類和回歸的集成學習方法,由一組決策樹組成。每棵樹都是在隨機抽取的特征上構建的,然后對所有的樹進行匯總,以得到最終的預測結果。
長短時記憶網絡(LSTM)是一種時間遞歸神經網絡,適合于處理和預測時間序列中間隔和延遲相對較長的重要事件[10]。LSTM是一種強大的神經網絡模型,可以有效地處理和預測時間序列數據,并已在多種任務中得到廣泛應用[10]。本文針對氣象數據使用SVM、KNN、決策樹、隨機森林、LSTM、BP等算法進行實驗。
式中:U和W是權重矩陣;b是偏差;Ot()是sigmoid函數。
1.3 病害預測方法
本研究采用同一地區連續三年的數據,提前一年預估下一年四種病害的發病率。通過利用前三年的氣象數據建立一個次年病害發病率預測模型,把這個多元時間序列問題分為四類。基于該模型,預測接下來的時間內理論上最易發生的病害。由于該地主要種植小站稻,且曾發生過惡苗病、細菌性褐斑病、稻瘟病、干尖線蟲病,所以該地殘留病菌孢子。
氣象數據預測流程如圖2所示。首先,需對采集的氣象數據進行標注。經查閱資料得知,四種病害在不同氣象條件下的生存概率各異。例如,稻瘟病在25~28 ℃、相對濕度90%以上時最適宜發生;干尖線蟲病在20~25 ℃時最適宜發生。將不同氣象條件下最可能出現的病害進行標注,并整理成數據集。然后,按照9∶1的比例,把氣象數據集劃分為訓練集和測試集。另外,稻瘟病的潛育期為4.5天,干尖線蟲病的潛育期為3天,細菌性褐斑病的潛育期為6天,惡苗病的潛育期為14天。由于干尖線蟲病潛育期最短,所以采用氣象站實時采集的前3天的數據來預測未來3天最有可能發生該病害的概率。
1.4 模型預測精度評價指標
分類器的預測結果以混淆矩陣表示,在二分類任務中,該矩陣定義了四個類別的評價指標:真陽性(TP),即正確預測的1類數據;假陽性(FP),即錯誤預測的1類數據;真陰性(TN),即正確預測的0類數據;還有假陰性(FN),即錯誤預測的0類數據。
1.5 實驗平臺
本節通過實驗對所提出方法的性能進行了評估、比較和討論。本文中所有的訓練和評估試驗都是在同一臺測試電腦上實現的。系統為Windows11,英特爾i9-13900HX處理器,擁有16 GB運行內存和8 GB英偉達GeForce RTX 4060 GPU。該網絡在PyTorch深度學習框架中進行訓練。
2 結果分析
2.1 四種病害預測模型比較
為預測小站稻病害情況,需選擇合適的算法。為此,在四種病害的數據集中進行了比較,結果見表4。整體對干尖線蟲病的預測效果較差,這是由于干尖線蟲病的數據量較少。未來工作的一項內容是加入干尖線蟲病的數據,實現數據均衡,以確保干尖線蟲病預測的精確度。
由表4可知,整體而言,LSTM算法與BP、DT、KNN、SVM、RF算法相比,Accuracy 提高了2.35~7.42個百分點。
從單個病害角度來看,LSTM對干尖線蟲病的預測效果較差;在稻瘟病方面,其Precision相比于其他模型提高了8.72~
26.12個百分點,Recall提高了0.89~9.57個百分點,F1增長了5.95~19.27個百分點;對于細菌性褐斑病,其Precision相比于其他模型提高了13.83~42.37個百分點;在惡苗病方面,其Precision相比于其他模型提高了3.53~19.18個百分點,Recall提高了0.01~8.92個百分點,F1提高了1.36~13.11個百分點。綜上,LSTM與其他模型相比效果較好。
2.2 三種病害數據集模型比較
由于干尖線蟲病害數量較少,所以在刪除干尖線蟲病害分類之后,采用三種病害數據對LSTM、BP、DT、KNN、SVM、RF算法進行比較,結果見表5。整體而言,LSTM算法的Accuracy最高可達93%,比其他算法高出5.57~14.34個百分點。從單個病害角度出發,將LSTM與其他模型進行比較,在預測稻瘟病時LSTM的Precision比其他模型提高了13.38~29.54個百分點,Recall提高了8~13.6個百分點,F1提高了11.17~21.86個百分點;在預測細菌性褐斑病時,LSTM的Precision提高了28.37~45.04個百分點,Recall 提高了48.5~76.7個百分點,F1提高了39.84~64.77個百分點;在預測惡苗病時,LSTM的Precision提高了18.53~38.05 個
百分點,Recall提高了3.86~51.07個百分點,F1提高了9.86~56.86個百分點。綜上,LSTM在三種病害的預測比較上優于其他模型。
3 基于LSTM的小站稻病害預測系統實現
在完成基于LSTM的小站稻病害預測算法研究后,為了將本研究應用于實際的小站稻種植過程,實現小站稻預測檢測智能化,開發了在線小站稻病害識別預測系統。該系統能夠實現小站稻病害識別預測的數字化管理,為小站稻病害的早期及時檢測提供支撐。
3.1 系統登錄模塊
系統用戶登錄時,需輸入網絡地址與登錄所需信息,再點擊登錄按鈕。后臺驗證信息通過后,即可成功登錄,如圖3所示。該系統通過在后端生成驗證碼,并將其存儲于session中。用戶輸入賬戶、密碼和驗證碼后,系統利用session驗證用戶身份信息。若驗證未通過或失敗,界面會提示錯誤,3 s后直接跳轉至登錄界面;若驗證通過則成功登錄。成功登錄后,系統會根據后臺獲取到的用戶角色權限來設定界面,限制用戶操作內容。其中,系統管理模塊僅管理員可見。
3.2 病害預測管理模塊
病害預測模塊涵蓋病害預測與歷史管理識別功能。該模塊對病害預測模型進行封裝,其運作流程為:前端調用后端接口,后端調用氣象站采集的數據并保存,之后在模型中進行預測,預測完成后將結果傳輸到前端。氣象預測模塊如圖4所示,點擊“氣象預測”后,即可開始調用后端氣象站數據,調用模型進行病害預測,再將預測結果傳輸至前端。點擊圖片,即可查看病害詳細信息,如圖5所示。
4 結 語
針對小站稻病害預測問題,構建了基于長短時記憶網絡(LSTM)的預測模型。模型構建與數據利用方面,首先從氣象站獲取氣象數據,隨后運用LSTM模型對氣象數據進行訓練以實現對小站稻病害的預測。在預測結果上,當預測惡苗病、細菌性褐斑病、稻瘟病、干尖線蟲病這四種病害時,LSTM的平均準確率為87.06%,其中稻瘟病精確率為92.56%、細菌性褐斑病精確率為88.37%、惡苗病精確率為80.71%、干尖線蟲病精確率為0%;而當預測惡苗病、細菌性褐斑病、稻瘟病這三種病害時,平均準確率可達93.00%,其中稻瘟病精確率為96.83%、惡苗病精確率為92.81%、細菌性褐斑病精確率為98.10%。由此可見,該方法在預測惡苗病、細菌性褐斑病、稻瘟病時效果較好。未來,將主要收集干尖線蟲氣象數據并納入模型當中。
注:本文通訊作者為劉同海。
參考文獻
[1] GANGOLA S, BHATT P, KUMAR A J, et al. Biotechnological tools to elucidate the mechanism of pesticide degradation in the environment [J]. Chemosphere, 2022, 296: 133916.
[2]王翔宇,溫皓杰,李鑫星,等.農業主要病害檢測與預警技術研究進展分析[J]. 農業機械學報,2016,47(9):266-277.
[3]袁培森,歐陽柳江,翟肇裕,等.基于MobileNetV3Small-ECA的水稻病害輕量級識別研究[J]. 農業機械學報,2024,55(1):253-262.
[4] WANG D, SALEH N B, BYRO A, et al. Nano-enabled pesticides for sustainable agriculture and global food security [J]. Nature nanotechnology, 2022, 17(4): 347-360.
[5] HOUGH R L. A world view of pesticides [J]. Nature geoscience, 2021, 14(4): 183-184.
[6]王洪健,于海業,高山云,等. 基于熒光光譜分析的玉米早期斑病害預測模型[J]. 光譜學與光譜分析,2023,43(12):3710-3718.
[7]張靜文. 基于多源時空信息的水稻病害區域流行預測研究[D]. 杭州:杭州電子科技大學,2022.
[8]張善文,黃文準,張傳雷. 基于環境信息和深度自編碼網絡的農作物病害預測模型[J]. 江蘇農業學報,2018,34(2):288-292.
[9] CHIU M C, CHEN C L, CHEN C W, et al. Weather fluctuation can override the effects of integrated nutrient management on fungal disease incidence in the rice fields [J]. Scientific reports, 2022, 12(1): 4273.
[10] SHERSTINSKY A. Fundamentals of recurrent neural network (RNN) and long short-term memory (LSTM) network [J]. Physica D: nonlinear phenomena, 2020, 404: 132306.
收稿日期:2024-05-07 修回日期:2024-05-31
基金項目:天津市科技計劃項目(21YFSNSN00040);中央財政引導地方科技發展項目(21ZYCGSN00590)
作者簡介:張 蕊(1999—),女,河北泊頭人,碩士,研究方向為深度學習。
蔡景瀚(2000—),男,浙江臺州人,碩士,研究方向為多模態算法。
劉文正(1999—),男,山東鄒平人,碩士,研究方向為深度學習。
劉同海(1977—),男,山東鄄城人,博士,研究方向為農業與人工智能。