戶雪敏,李 輝,伏松平,陸可心,李宇翔,胡小平
(1.西北農林科技大學 植物保護學院/農業農村部黃土高原作物有害生物綜合治理重點實驗室,陜西楊凌 712100;2.甘肅省植保植檢站,蘭州 730020;3.甘肅省天水市植保植檢站,甘肅天水 741020)
小麥條銹病是由條形柄銹菌(Pucciniastriiformisf.sp.tritici)引起的重要的世界流行性氣傳病害(Moshou等,2004;Zheng等,2018),嚴重威脅小麥安全生產。2020年,中國農業農村部頒布的《一類農作物病蟲害名錄》中把小麥條銹病列為一類病害[1]。中國是世界上小麥條銹病流行面積最大的國家,曾于1950年、1964年、1990年、2002年和2017年5次大流行,發生面積均超過556萬hm2,共造成小麥減產138億kg[2-5]。
甘肅是中國小麥條銹菌最重要的周年循環區之一,也是中國小麥條銹菌新小種的策源地[6]。小麥條銹菌除了在區內往返傳播循環外,還能通過孢子的遠程傳播影響到中國廣大東部麥區條銹病的發生和為害[7]。小麥條銹病的流行程度取決于寄主感病性、菌源數量和氣象條件等因素,寄主的感病性是小麥條銹病發生和流行最關鍵的因素,但在生產實際中,寄主的感病性的變化幅度較小[8],而菌源數量和氣候條件的影響往往起到關鍵作用。因此,建立基于菌源數量和關鍵氣象因子的預測模型對小麥條銹病精準預測和有效防控至關重要。
近年來,許多學者建立了小麥條銹病發生程度預測模型,如蒲崇建等[9]建立了基于溫度、降水量、感病品種種植面積、上一年秋苗病葉數等因子的甘肅省天水市小麥條銹病流行程度多元線性回歸模型,準確率達82%~91%;胡小平等[10-11]建立了基于菌源量、感病品種面積比例和關鍵氣象因子的漢中市小麥條銹病流行程度的多元線性回歸和BP神經網絡模型,預測結果和實際發生情況高度符合;蒲崇建等[8]建立了基于越夏菌源量和秋苗發生面積的甘肅省小麥條銹病預測模型,預測準確率為88%;王鵬偉等[12]建立了隴東、隴南和關中地區小麥條銹病遠程預警系統,該系統的長、中、短期預測準確率分別為85.7%、92.6%和92.6%,可實現小麥條銹病準確遠程預測和數據管理;鄒一萍等[13]建立了基于越冬活體菌源量、品種抗凍性和溫度的返青期小麥條銹病發病株率預測模型,預測準確度可達85%以上;姚曉紅等[14]建立了基于甘肅河東地區氣象因子的小麥條銹病發生程度預測模型,其中秋季預測準確率為89%,春季預測準確率為91%;Hu等[15]預測了中國中部和西北部的小麥條銹病越冬的概率,結果表明,在春季所有觀察到條銹病的地區都位于越冬潛力預測值較高的區域(預測成功越冬的概率>0.50),在春季沒有觀察到條銹病的田塊中,預測的條銹病越冬潛力接近于零(預測成功越冬的概率<0.25)。迄今為止,基于條銹病秋苗發生面積和氣象因子的甘肅省小麥條銹病發生面積的預測研究尚未見報道。本研究綜合分析甘肅省小麥條銹病秋苗發生面積、氣象條件等因素,構建甘肅省小麥條銹病發生面積預測模型,以期為小麥條銹病的準確預測提供依據。
收集整理了甘肅省2001-2021年調查的秋苗期小麥條銹病發生面積(x1)(表1),以及 2001-2021年7月至翌年4月的月平均氣溫(Ta2~Ta11)、月最高氣溫(Tmax12~Tmax21)、月最低氣溫(Tmin22~Tmin31)、月平均相對濕度(RHa32~RHa41)、月最低相對濕度(RHmin42~RHmin51)、月平均降雨量(Ra52~Ra61)和月平均日照時數 (Sa62~Sa71),氣象數據來自中國氣象數據網(http://data.cma.cn/)。
基于2001-2019年甘肅省小麥條銹病發生面積和氣象數據,采用SPSS中的Pearson分析篩選關鍵因子。利用全子集回歸和BP神經網絡算法建立甘肅省小麥條銹病發生面積的預測模型。其中全子集回歸采用RStudio version 4.0.5軟件中leaps包運算,BP神經網絡算法運用Matlab編程語言編寫,選用3層BP神經網絡,即輸入層、隱藏層和輸出層,采用Pearson相關法對2001年-2019年歷史數據進行主導因素分析,利用決定系數R2、赤池信息量準則(Akaike information criterion,AIC)和均方根誤差(Root Mean Squared Error,RMSE)作為全子集回歸分析的評價指標(Atkinson和Jeganathan,2012)。決定系數R2越高,預測模型擬合程度越好。AIC以熵概念為基礎,考慮了模型的統計擬合度和擬合的變量數目,AIC值越小,表明該模型能夠以最少參數預測因變量,有助于降低過擬合現象[16]。RMSE通過實際值與預測值的偏差來判斷預測模型的準確性,計算公式為:


表1 2001-2021年甘肅省小麥條銹病發生面積Table 1 Area of occurrence of wheat stripe rust in Gansu province from 2001 to 2021

對2001-2019年調查的秋苗發病面積數據與翌年條銹病最終發生面積進行Pearson相關性分析,結果表明,甘肅省小麥條銹病最終發生面積(y)與上年甘肅秋苗條銹病發生面積(x1)相關系數為0.792,呈極顯著正相關關系(P=0.0001)(表2);與上年9月平均相對濕度(RHa34)、1月平均相對濕度(RHa38)、3月平均相對濕度(RHa40)、4月平均相對濕度(RHa41)、3月最低相對濕度(RHmin50)、4月最低相對濕度(RHmin51)和上年9月平均降雨量(Ra54)呈正相關關系,其中與3月平均相對濕度(RHa40)和3月最低相對濕度(RHmin50)的相關系數分別為0.537和0.504,呈顯著正相關關系(P<0.05);與上年8月最低氣溫(Tmin23)、上年9月平均日照時數(Sa64)、上年12月平均日照時數(Sa67)和3月平均日照時數(Sa70)呈負相關關系,其中與上年8月最低氣溫(Tmin23)呈顯著負相關(P=0.011),相關系數為0.585(表2)。

表2 各因子與當年最終發生面積的相關系數及P值Table 2 Correlation coefficient and P value between each factor and final area of occurrence
2.2.1 全子集回歸分析 基于2001-2019年甘肅省小麥條銹病發生面積和相關氣象數據,通過Pearson相關性分析并結合生物學特性,選取上年秋苗發病面積(x1)、8月最低空氣溫度(Tmin23)、9月平均相對濕度(RHa34)、1月平均相對濕度(RHa38)、3月平均相對濕度(RHa40)和3月平均日照時數(Sa70)作為自變量因子構建預測模型。當預測模型分別選用因子集1(x1、Tmin23、Sa70)和因子集2(x1、Tmin23、RHa38、Sa70)時,調整R2值均大于70%(圖1)。構建的預測模型1和預測模型2分別為:
y1=1.482x1-4.593Tmin23-9.535Sa70+131.514
y2=1.5290x1-4.7881Tmin23-0.1591RHa38-9.523 7Sa70+141.632 4
式中,x1為4.99~39 hm2;Tmin23為11.69~16.22 ℃;RHa38取值范圍為32.10~71.23%;Sa70為5.48~7.94 h。

圖1 全子集回歸分析結果Fig.1 Results of full subsets regression analysis
模型1和模型2的AIC值分別為140.737 8和142.487 2,RMSE分別為9.140 1和9.076 7(表3)。

表3 全子集回歸預測模型評價指標計算結果Table 3 Calculation results of evaluation index of full subsets regression prediction models
利用2001-2019年歷史數據對全子集回歸預測模型進行回測(圖2),結果表明模型1和模型2的擬合符合率分別為88.65%和88.19%。利用2020-2021年的田間調查數據對預測模型預測結果進行檢驗,結果表明模型1預測2020年和2021年甘肅省小麥條銹病發生面積與實際發生面積的偏差為0.18萬hm2和0.86萬hm2,模型2預測2020年和2021年甘肅省小麥條銹病發生面積與實際發生面積的偏差為1.17 萬hm2和0 hm2(表4),模型1和模型2的RMSE分別為9.1401和9.0767(表3)。模型1和模型2的平均預測準確度分別為94.63%和88.81%。因此,選擇AIC最低、預測準確度較高的模型1作為甘肅省小麥條銹病發生面積的預測模型。

圖2 全子集回歸分析預測模型2002-2019年甘肅省小麥條銹病發生面積實際值與預測值擬合圖Fig.2 Actualarea of occurrence of wheat stripe rust and prediction value by full subsets regression analysis in Gansu from 2002 to 2019
2.2.2 BP神經網絡算法預測 利用全子集回歸模型1(x1、Tmin23、Sa70)和全子集回歸模型2(x1、Tmin23、RHa38、Sa70)中的自變量因子分別作為神經網絡算法的輸入層,當年條銹病最終發生面積作為輸出層。以2002-2019年的數據作為訓練集,以2020-2021年的數據作為測試集,計算預測模型的預測準確度。設置BP神經網絡算法的學習率為0.05,迭代次數為150次時,預測值和實際值之間的誤差最小。通過不斷訓練選擇合適的權重與偏差,模型1最終訓練集輸出2002-2019年甘肅省小麥條銹病發生面積依次為71.40、 59.32、57.28、65.72、51.56、54.48、26.25、53.72、45.15、21.87、46.58、15.84、35.63、38.90、26.64、22.52、25.66和7.22萬hm2,模型2最終訓練集輸出2002-2019年甘肅省小麥條銹病發生面積依次為57.81、59.36、53.20、57.26、46.23、 53.48、28.36、54.07、50.88、25.72、53.71、12.29、 38.03、45.80、29.25、24.47、29.16和4.28萬hm2(圖3),模型1和模型2訓練集預測擬合符合率分別為88.65%和86.81。模型1輸出的2020年和2021年甘肅省小麥條銹病發生面積分別為21.37和29.91萬hm2,預測準確度為98.25%;模型2輸出的2020年和2021年甘肅省小麥條銹病發生面積分別為23.36和34.01萬hm2,預測準確度為94.03%。

表4 甘肅省小麥條銹病發生面積實際值與預測值關系的模型分析Table 4 Analysis of relationship models between actual and predicted values in area of occurrence of wheat stripe rust in Gansu
利用全子集回歸和BP神經網絡算法對甘肅小麥條銹病發生面積進行預測,結果表明全子集回歸模型1和2對2020-2021年的平均預測準確度分別為94.63%和88.81%,BP神經網絡模型1和模型2對2020-2021年的平均預測準確度分別為98.25%和94.03%。由以上結果可知,BP神經網絡模型1為最佳預測模型,預測2022年甘肅省小麥條銹病發生面積為10.03萬hm2。

圖3 BP神經網絡算法預測2002-2019年甘肅省小麥條銹病發生面積實際值與預測值擬合圖Fig.3 Final area of occurrence of wheat stripe rustl and prediction value from 2002 to 2019 by BP neural network in Gansu
中國西北地區尤其是甘肅隴南和隴東是小麥條銹菌重要越夏區之一,是陜西關中、華北平原冬麥區菌源主要來源[4,19-20]。準確預測小麥條銹病發生面積對條銹病的防控至關重要。本研究以甘肅省小麥條銹病為研究對象,以甘肅省2001-2021年小麥條銹病最終發生面積、小麥條銹病秋苗發生面積和關鍵氣象因子數據為基礎,使用全子集回歸和BP神經網絡2種方法,建立甘肅省小麥條銹病發生面積預測模型。BP神經網絡算法模型1和模型2的預測準確度分別為 98.25%和94.63%。由于多元線性回歸模型自身具有一定的局限性,小麥條銹病的發生和流行受多種因素影響,呈現的并非是線性關系,而傳統的線性回歸計算過于簡單又需要大量數據,無法真實反映各因素間潛在的關系,預測的精度低;人工神經網絡因其強大的映射能力和自學習能力等優勢,可以對大量復雜性強、非結構及非精確性的規律進行自適應,同時具有非線性逼近能力等優點使其在預測方面的優勢極為顯著,近年來在數據預測領域得到廣泛應用[21],這可能是兩種模型對2022年甘肅省發病面積預測結果差距較大的原因。除此之外,小麥條銹病的流行程度與寄主感病性、菌源數量和氣象條件等因素均密切相關。本研究僅分析了秋季菌源量和氣象條件對小麥條銹病發生面積的影響,并未將感病品種面積納入模型。未來的研究中,會全面分析感病品種面積、菌源、氣象條件、小麥播種時期及拌種等因素對小麥條銹病發生面積的影響,進一步提高預測模型的穩定性和準確率。
目前,基于全子集回歸和BP神經網絡的預測模型應用較為廣泛且預測準確度較高。譚丞軒等[22]利用全子集篩選和機器學習相結合的方法提高了土壤含水率的反演精度,為準確監測農田土壤墑情、實施精準灌溉提供了一種新的途徑。韓佳[23]建立基于全子集篩選的分位數回歸模型、支持向量機模型和人工神經網絡模型,最終發現全子集篩選的分位數回歸模型對土壤含鹽量預測的效果優于其他兩種模型。Lankin Vega等[24]開發了基于人工神經網絡的新西蘭Lincoln地區秋季捕蚜蟲量預測模型,從而預測大麥黃萎病的發生程度。王園媛等[25]建立了基于BP神經網絡的云南省勐海縣和石屏縣的水稻白葉枯病預測模型,預測準確度達到80%以上。本研究建立了基于全子集回歸和BP神經網絡的甘肅省小麥條銹病發生面積的預測模型,結果表明,全子集回歸模型和BP神經網絡模型的預測準確度均在85%以上,其中BP神經網絡模型的預測準確度高于全子集回歸模型。
作物病害的精準預測是實現科學精準防控的關鍵技術之一,對于減少農藥使用量、降低環境污染等都具有重要的意義。然而,目前多數病害的預測模型是基于田間數據的回歸模型,缺乏基于病害流行學的預測模型,加之基層植保技術人員少且隊伍不穩定,專業化水平不高,采集的田間數據存在不及時、不準確、不完善、不系統等問題,導致使用這些數據建立的預測模型對于作物病害預測的準確度偏低且不穩定[26]。在未來預測模型的研究中,應該形成穩定的、系統的作物病蟲害監測站點,加強病害流行學研究隊伍建設、監測預警研究經費的投入、基層植保技術隊伍建設和培訓等,不斷提高對作物病蟲害監測預警的準確度,為保證國家糧食生產安全奠定基礎。