景 輝,楊 華,趙惠瑾,孟 瑤
(山西農業大學信息科學與工程學院,山西太谷030801)
運城市蘋果種植面積16.6萬hm2,總產量28億kg,產值達43億元,農民依靠蘋果種植所得收入占其總收入的30%以上。蘋果產量在全國地級市中名列前茅,是運城市農業增效、農民增收的重要渠道之一[1]。蘋果產量與氣象因素密切相關,運用氣象因子建立產量預測模型實現蘋果產量早期預測對運城市政府規劃經濟發展具有決定性作用,并且能夠合理統籌種植策略以及減少水肥的浪費。
從20世紀80年代至今,國內外諸多學者對農作物產量預測進行了大量研究。國內學者基于農作物各個生長時期數據建立產量預測模型。申順吏[2]運用灰色關聯分析法對1981—2013年山西蘋果不同物候期(芽期、花期、初果期、果實膨大期和成熟期)主要氣候因子(降水量、平均氣溫、最高氣溫、最低氣溫、日照時數和平均相對濕度)與蘋果產量的關系進行研究,確定不同物候期影響蘋果產量的關鍵氣候因子,并使用GM(1,1)模型和多元回歸方法相結合預測年蘋果產量[3-7];李修華等[8]基于甘蔗整個生長期的田間環境和氣象數據對某一塊農田建立BP模型[9-12]和GA-BP模型進行甘蔗產量預測;趙汝男等[13]運用灰色關聯分析法選取影響高粱產量的主要影響因子,將其作為輸入變量對高粱產量進行多元回歸預測。國外學者基于大量數據實現農作物產量早期預測。Damerow等[14]提出了一種將圖像處理與支持向量機技術相結合的方法,以建立早期蘋果樹產量估算的預測模型,模型隨機選擇60棵蘋果樹自然光下捕獲的樹冠圖像,分析冠層圖像并從中提取了5個特征:果實總面積、果實總數、果實總面積與葉面面積的比例、葉片遮蓋的總果實面積占果實總面積的比例以及葉片遮蓋的總果實數占果實總面積的比例、水果總數,并采用支持向量機方法建立了以這5個特征為輸入參數,以實際產量為輸出的產量估算模型。Rozman rtomir等[15]提出基于圖像分析和神經網絡的混合模型,模型通過圖像分析算法對采集的疏果期圖像進行處理,分別接收每個采樣周期的水果數量數據,以此作為使用人工神經網絡建模預測[16-19]蘋果產量的輸入信息。綜上所述,基于農作物全生長期數據建立的產量預測模型可以較為準確的預測農作物產量,但難以實現早期預測。另一方面,部分學者提出了農作物產量早期預測方法,但所需數據量大,采集難度較高。基于此,本研究提出了一種僅使用幼果期氣象數據便可實現蘋果產量早期預測的方法。該方法難度較高但具有重大的實踐意義。
本研究以運城市蘋果產量為研究對象,旨在實現蘋果產量早期預測。試驗通過HP濾波法將蘋果產量分為趨勢產量和氣象產量,分別對蘋果不同物候期建立多元回歸模型從而比較不同物候期對蘋果氣象產量的影響強弱,最終選取影響蘋果氣象產量最強的幼果期進行BP神經網絡建模,實現蘋果產量早期預測。
本研究以山西省運城市為研究地域。運城氣候地理獨特,屬暖溫帶大陸性半濕潤氣候,年平均氣溫13.8℃;地處35°N,屬黃土高原區,土層深厚,并且種植區域水資源比較豐富[20]。
運城市2005—2018年逐日氣象數據來源于中國氣象局,蘋果年產量來源于《山西省統計年鑒》。運城蘋果的物候期大致可分為:3月發芽期、4月花期、5月幼果期、6—8月膨果期、9—10月成熟期。
本研究旨在對運城市蘋果產量進行預測研究,建立蘋果產量早期預測模型。首先,考慮到蘋果生長周期較長、對氣象條件依賴較高,氣候變化很大程度上影響了蘋果產量,所以采用HP濾波法將運城市蘋果年產量分為趨勢產量和氣象產量。在此基礎上基于SPSS軟件分別對蘋果物候期:發芽期、花期、幼果期、膨果期、成熟期建立多元線性回歸模型,研究每個物候期對蘋果氣象產量的影響程度并進行比較。最后,選取對蘋果氣象產量影響最強的幼果期運用MATLAB軟件建立BP神經網絡產量早期預測模型,并對其驗證。
1.3.1 HP濾波法 HP濾波法的理論基礎是時間序列的譜分析方法。譜分析方法將時間序列看成是不同頻率的成分的疊加,時間序列的High-Pass濾波就是要在所有不同頻率的成分中,分離出頻率較高的成分,去除掉頻率較低的成分,即去除掉長期的趨勢項,而對短期的隨機波動進行度量[21-25]。
設有蘋果產量序列Y={y1,y2,...,yT},其分離出的趨勢產量記為G={g1,g2,...,gT},氣象產量記為C={c1,c2,...,cT},Y=G+C。HP濾波使得單產序列在長時間尺度上的趨勢產量與實際單產序列間偏差的平方和達到最小,即G為函數(1)最小化問題的解。

其中,λ為HP濾波參數,當λ=0時,函數最小化的解為Y序列等于G序列;隨著λ值增加,最小化解估計的趨勢越來越光滑。因本研究中的數據為年度數據,根據相關研究經驗,參數λ的參照值選取100。本研究采用Eviews7.2中的HP濾波法對運城市蘋果趨勢產量進行擬合分析。
1.3.2 多元線性回歸 在回歸分析中,如果有2個或2個以上的自變量,就稱為多元回歸。事實上,一種現象常常是與多個因素相聯系的,由多個自變量的最優組合共同來預測或估計因變量比只用一個自變量進行預測或估計更有效,更符合實際。本研究采用影響運城市蘋果氣象產量的11個氣象因子(最高氣壓、最低氣壓、最高溫度、最低溫度、平均濕度、最小濕度、降雨量、平均風速、最大風速、日照時長、平均地溫)作為自變量,將蘋果氣象產量作為因變量分別對應蘋果的5個物候期建立多元回歸模型。檢驗5個多元線性回歸模型的有效性,有效性最強的多元線性回歸模型所對應的蘋果物候期對蘋果的產量影響最大。令C代表蘋果氣象產量,與其相關的11個氣象因子為自變量Xi(i=1,2,…,11),因變量C與自變量Xi建立的多元線性回歸模型如式(2)所示。

其中,αk(k=1,2,…,11)為回歸系數;Xi為氣象因子;θ為隨機誤差。
1.3.3 BP神經網絡 人工神經網絡無需事先確定輸入輸出之間映射關系的數學方程,僅通過自身的訓練,學習某種規則,在給定輸入值時得到最接近期望輸出值的結果。作為一種智能信息處理系統,人工神經網絡實現其功能的核心是算法。BP神經網絡是一種按誤差反向傳播(簡稱誤差反傳)訓練的多層前饋網絡,其算法稱為BP算法,它的基本思想是梯度下降法,利用梯度搜索技術,使網絡的實際輸出值和期望輸出值的誤差均方差為最小。BP算法學習過程流程如圖1所示。

圖1 BP算法學習流程圖
基于Eviews7.2使用HP濾波法將運城市2005—2018年蘋果產量分離成趨勢產量和氣象產量結果如表1所示。

表1 HP濾波法蘋果產量分離結果 t
通過建立多元線性回歸模型,并對其進行檢驗與評價,檢驗模型的有效性。本研究采取擬合優度(R2)進行檢驗,檢驗回歸方程對樣本觀測值的擬合程度,即所有解釋變量與被解釋變量之間的相關程度,R2越大,回歸方程對樣本數據點擬合的程度越強,自變量與因變量的關系越密切。在限制因變量均為相同的氣象因子和自變量為蘋果氣象產量的條件下,比較蘋果花期、發芽期、幼果期、膨果期、成熟期所建立多元回歸線性模型的R2。5個時期建立的多元線性回歸模型R2如表2所示。
由表2可知,蘋果幼果期所建立多元回歸線性模型的R2最大,表明該物候期對蘋果的氣象產量影響最大,選取蘋果幼果期的氣象數據和蘋果實際年產量構建BP網絡模型預測蘋果產量。

表2 多元線性回歸模型R2
由上述可知蘋果幼果期對蘋果的氣象產量影響最大,故選取蘋果幼果期,即每年5月份的氣象數據和蘋果年產量作為數據來源。本研究將最高氣壓、最低氣壓、最高溫度、最低溫度、平均濕度、最小濕度、降雨量、平均風速、最大風速、日照時長、平均地溫等11個氣象因子作為模型輸入變量,蘋果實際年產量作為輸出變量建立BP神經網絡模型并采用留一驗證法進行交叉驗證,將運城市2005—2018年數據分為14個樣本,隨機使用13個樣本當作訓練集,而剩余的1個樣本留下來當作測試集,這個步驟一直持續到每個樣本都僅被當作一次測試集后結束。根據以上數據,設定網絡輸入層節點數為11,輸出層節點數為1。隱含層節點數根據試湊法,按照預測誤差最小的原則定為300。設置網絡學習的收斂誤差為0.001,學習速度為0.05,最大訓練次數為100。當收斂誤差達到要求后,訓練結束。蘋果產量預測結果如表3所示,實際產量和預測產量趨勢變化如圖2所示。
由圖2可知,實際產量和預測產量趨勢變化基本吻合。由表3可知,BP神經網絡蘋果產量早期預測模型驗證集的平均相對誤差為7.08%。將2019年相關數據代入模型驗證后,驗證模型精度為89.6%,表明該模型能夠較為準確的預測蘋果產量。

圖2 實際產量和預測產量趨勢變化對比

表3 BP神經網絡蘋果產量預測結果
HP濾波法蘋果產量分離結果表明,氣象因素與蘋果產量相關性密切,基于氣象數據構建蘋果產量早期預測模型是可行的。通過對蘋果5個物候期分別建立的多元線性回歸模型結果分析可知,蘋果幼果期對蘋果氣象產量影響最大。基于幼果期建立的BP神經網絡蘋果產量早期預測模型通過了模型檢驗,并用2019年相關數據驗證后表明模型精度良好,能夠較為準確的預測蘋果產量,為農作物產量早期預測提供了理論支持。
通過本文研究可知,注重蘋果幼果期的管理可以提高蘋果產量。果農要在幼果期多做增產措施,注意追施速效肥,以提供充足的營養提高座果率和充盈果實。并且,果農要時刻警惕幼果期是病蟲害高發的時期,做到定時觀察檢測,定時噴藥預防。