朱愛華, 戴光鑫
(山東省海河淮河小清河流域水利管理服務中心,山東 濟南 250100)
通常情況下,作物類型、土壤類型與周邊環(huán)境等因素,具有顯著的不確定性,成為影響農田分區(qū)灌溉需水量較為顯著的因素[1-3]。由此,在分析農田分區(qū)灌溉需水量的過程中,需以環(huán)境因素為核心進行分析。
當前關于農田分區(qū)灌溉需水量的研究方法主要集中于人工神經網絡算法和農業(yè)技術轉移決策支持系統(tǒng)模型兩方面。張曉斌等[4]應用BP 神經網絡計算土壤蓄水量,但BP 神經網絡訓練過程中,有較大概率陷入局部最小化問題,收斂速度無法保障。郭兵托等[5]應用小波神經網絡分析灌溉需水量,較為準確地描述灌溉需水量的波動情況,但該方法實際應用過程中,對非線性數據預測的精度較差,導致部分日期的分析結果存在顯著誤差。劉影等[6]利用農業(yè)技術轉移決策支持系統(tǒng)(DSSAT)模型研究農田灌溉需水量,但此類方法極度依賴歷史用水數據,而且忽略了不同影響因素間的相關性。
針對上述問題,本研究將貝葉斯神經網絡引入農田分區(qū)灌溉需水量模擬中,研究基于貝葉斯神經網絡的農田分區(qū)灌溉需水量模擬分析方法,獲取準確的農田分區(qū)灌溉需水量模擬結果。
1.1.1 農田分區(qū)灌溉用水樣本數據聚類分析
對農田分區(qū)灌溉歷史用水的樣本數據進行聚類分析,獲取若干個有所差異的相似狀態(tài)數據。
以X(t)和X(t′)表示農田分區(qū)灌溉用水歷史樣本中隨機兩個日用水量數據,兩者間的距離D(t,t′)可用式(1)表示。

若X(t)和X(t′)之間的 距 離D(t,t′)滿足 式(2)所 描述的相關性,即可確定X(t)和X(t′)為一類,也就是X(t)和X(t′)的狀態(tài)一致。

式中 δ—預先設定的農田分區(qū)灌溉用水歷史樣本數據間的分類距離閾值
以提升農田分區(qū)灌溉用水歷史樣本數據分類精度為目的,確定同類內數據X0與Xi之間的關聯度ri,ri值同農田分區(qū)灌溉用水歷史樣本數據分類精度之間呈正比例相關,其關系如式(3)所示[7]。

式中d—數據總量
ξi(k)——X0與Xi在k點的關聯系數
1.1.2 輸入向量的確定
農田分區(qū)灌溉需水量在一定程度上受季節(jié)、溫度和降雨量等環(huán)境因素影響。不同的季節(jié),晝夜長度與市場需求量均存在差異性,由此造成農田分區(qū)灌溉需水量也存在一定差異性,這種差異性可將一年(12 個月)作為變化的周期性[8]。溫度的差異會導致農田灌溉需水量的差異,當環(huán)境溫度較高時,農田土壤水分蒸發(fā)量較大,為確保土壤濕度,農田土壤分區(qū)灌溉需水量也顯著提升,同時,日灌溉需水量的提升與溫度的變化率存在緊密相關性。通過降雨量彌補部分農田分區(qū)灌溉需水量,如降雨量的大小對農田土壤內的含水量產生直接影響,在分區(qū)灌溉農田過程中,如果降雨量較大,則灌溉的需水量較小;相反,農田分區(qū)灌溉的需水量提升[9]。
基于以上分析,農田分區(qū)灌溉需水量有一定概率存在以日為單位的短周期性和以季度為單位的長周期性變化;而溫度與降雨量又在一定程度上提升農田分區(qū)灌溉需水量的隨機性[10]。結合農田分區(qū)灌溉需水量有可能存在的變化趨勢,以指標構建的完整性、獨立性、合理性及可操作性為標準,考慮農田分區(qū)灌溉需水量的周期性、隨機性與趨勢性,以前一周需水量、年內月需水量占比、日內溫度上限值及日降雨量均值等10個指標作為農田分區(qū)灌溉需水量模擬的輸入。

式中Xn-k——第n-k天的需水量
Tn——第n天的溫度上限
Rn——依照天氣預報確定的第n天的降雨量估計值
Sn——第n天所在月占全年需求量的百分比
對上述10 個指標的相關歷史數據進行聚類,得到指標均值,指標均值輸入貝葉斯神經網絡模型內進行訓練,當天的農田分區(qū)灌溉需水量作為農田分區(qū)灌溉需水量模擬的輸出,由此獲取農田分區(qū)灌溉需水量模擬結果。
標準的神經網絡模型在實際使用過程中均存在模型復雜度無法控制及數據擬合過度的問題,由此導致標準神經網絡在實際使用過程中的泛化能力較差[11]。針對這些問題,研究貝葉斯神經網絡,即利用貝葉斯推理優(yōu)化神經網絡。貝葉斯神經網絡的結構在整體上與深度神經網絡一致,但有所差別的是,貝葉斯神經網絡的隱藏層內包含概率層,其中的權重值符合概率分布需求[12-13]。貝葉斯神經網絡隱藏層結構如圖1 所示,其中wi和bi分別表示第i個單元的權重與偏置,符合形式為p(wi|X,Y)的分布。

圖1 貝葉斯神經網絡隱藏層結構Fig. 1 Hidden layer structure of Bayesian neural network
增加概率層后,貝葉斯神經網絡具有分析不確定性的能力。在確定輸入向量的條件下,可以通過概率層單元以不同的輸出可能性確定輸出。貝葉斯神經網絡可以定義為一個包含多個子網絡的集成網絡,其中不同子網絡之間存在一定的相關性,所有子網絡可以通過不同的訓練過程同時優(yōu)化。在利用貝葉斯神經網絡模擬農田分區(qū)灌溉需水量時,利用若干次前向傳播過程確保模擬結果取自有所差異的子網絡,說明貝葉斯神經網絡能夠獲取較為顯著的正則化效果,可防止標準神經網絡內有可能產生的擬合過度問題出現[14]。
貝葉斯神經網絡訓練流程如圖2 所示,依照BP 神經網絡原理與貝葉斯規(guī)則得到,貝葉斯神經網絡訓練過程需通過3 個推理環(huán)節(jié)。

圖2 貝葉斯神經網絡訓練流程Fig. 2 Training process of Bayesian neural network
(1)環(huán)節(jié)1。以H和X分別表示貝葉斯神經網絡模型與農田分區(qū)灌溉需水量歷史樣本數據,以α和β分別表示貝葉斯神經網絡超參數,利用式(5)計算權值w的后驗概率,由此獲取符合后驗概率上限的權值wup。

(2)環(huán)節(jié)2。結合農田分區(qū)灌溉需水量歷史樣本數據X,確定超參數的后驗概率,更新α和β。

(3)環(huán)節(jié)3。通過對比不同模型的顯著度,確定存在最大后概率的模型,由此獲取最優(yōu)貝葉斯神經網絡

基于上述推理,在設定先驗概率與似然都滿足指數分布的條件下,獲取貝葉斯神經網絡權值的后驗分布,如式(8)所示。

為得到最優(yōu)權值wup,需獲取后延概率上限值,即總誤差的下限值M(w)。當前主要使用的更新權值的方法包括擬牛頓法、蒙特卡羅數值積分法等[15]。
為更新超參數,貝葉斯神經網絡在訓練過程中需持續(xù)迭代訓練農田分區(qū)灌溉需水量歷史樣本數據,由此優(yōu)化權值,確定最優(yōu)的貝葉斯神經網絡模型。訓練過程中,通過更新超參數降低貝葉斯神經網絡模型結構的復雜度,避免出現擬合過度的問題。
為驗證基于貝葉斯神經網絡的農田分區(qū)灌溉需水量模擬分析在實際農田分區(qū)灌溉需水量模擬中的應用效果,以我國某省為試驗對象,農田分區(qū)以A~H 表示。收集試驗對象內不同區(qū)域歷史灌溉用水量數據,采用本文方法模擬其農田分區(qū)灌溉需水量。
以試驗對象內B 區(qū)域為例,將該區(qū)域2020 年7 月16—30 日內的灌溉用水量數據輸入貝葉斯神經網絡模型,驗證數據的擬合度,所得結果如圖3 所示。同時,為進一步驗證數據擬合方面的性能,以文獻[4]中基于BP 神經網絡的方法和文獻[6]中基于DSSAT 模型的方法為對比方法,利用兩種方法對數據進行擬合,所得結果如圖4 所示。

圖3 基于貝葉斯神經網絡的數據擬合結果Fig. 3 Data fitting results based on Bayesian neural network

圖4 對比方法數據擬合結果Fig. 4 Data fitting results of comparison methods
本文方法與兩種對比方法對于需水量的模擬結果與實際監(jiān)測結果的對比情況如表1 所示。
由圖3 和圖4 可知,本文方法與基于BP 神經網絡的方法對于數據的擬合效果較好,擬合度分別達到0.996 87與0.997 43,顯著高于基于DSSAT 模型的擬合結果(0.994 79)。由此得到,基于BP 神經網絡的方法數據擬合結果稍高于本文方法。由表1 可知,基于BP 神經網絡的方法模擬需水量時相對誤差上限達到6.59%,相對誤差下限為0.14%,誤差波動較為顯著;本文方法模擬需水量時相對誤差上限與下限分別為1.70%與0.02%,誤差波動較為微弱;基于DSSAT 模型的方法模擬需水量時相對誤差上限與下限分別為6.73%和0.13%,誤差波動更大。由此說明與兩種對比方法相比,利用本文方法模擬需水量時具有更高的精度與穩(wěn)定性。

表1 需水量模擬結果與實際監(jiān)測結果對比Tab. 1 Comparison of water demand simulation results and actual monitoring results
采用本文方法和兩種對比方法對試驗對象內全部農田分區(qū)在2020 年7 月31 日的灌溉需水量進行模擬,對比不同方法模擬需水量時相對誤差,所得結果如圖5 所示。針對試驗對象內各農田區(qū)域,本文方法模擬所得需水量的相對誤差與兩種對比方法相比均顯著降低。結合圖3、圖4 和表1 的試驗結果能夠得到本文方法的模擬性能優(yōu)于兩種對比方法。

圖5 不同農田區(qū)域灌溉需水量模擬對比Fig. 5 Simulation comparison of irrigation water demand in different farmland areas
以A、B、C、D 區(qū)域為例,對比本文方法中貝葉斯神經網絡內隱含層節(jié)點數量差異條件下,各區(qū)域灌溉需水量模擬的相對誤差,結果如圖6 所示。本文方法中采用貝葉斯神經網絡進行需水量模擬時,隨著隱含層節(jié)點數量的提升,各區(qū)域灌溉需水量模擬的相對誤差均呈現逐漸下降的趨勢,在隱含層節(jié)點數量達到7 個后,各區(qū)域需水量模擬相對誤差進入穩(wěn)態(tài)階段,基本控制在2%以下,由此說明采用本文方法模擬灌溉需水量時貝葉斯神經網絡隱含層節(jié)點設定為7 即可獲取較好的模擬結果。

圖6 隱含層節(jié)點數量對于模擬結果的影響Fig. 6 Influence on simulation results of hidden layer nodes number
本文方法中數據聚類結果對于最終需水量模擬結果產生直接影響。以A、B、C、D 區(qū)域為例,對比本文方法中貝葉斯神經網絡輸入的10 個指標數據聚類所得結果中各數據間關聯度的均值,所得結果如表2 所示。采用本文方法對指標數據進行聚類,各區(qū)域聚類結果中數據間的關聯度均高于95%,說明采用本文方法能夠獲取較好的聚類結果,有助于提升最終的模擬精度。

表2 數據聚類結果關聯度Tab. 2 Correlation degree of data clustering results單位:%
根據農田分區(qū)灌溉歷史用水數據,采用貝葉斯神經網絡模型對農田分區(qū)灌溉需水量進行模擬分析,通過訓練獲取最終模擬結果。以我國某省為試驗對象,采用本文方法,以及基于BP 神經網絡的方法和基于DSSAT 模型的方法為對比方法,模擬分析農田分區(qū)灌溉需水量。試驗結果顯示,基于貝葉斯神經網絡的方法數據聚類結果中數據間關聯度高于95%,數據擬合效果較好,模擬需水量時具有更高的精度與穩(wěn)定性。該方法的研究為農田分區(qū)灌溉需水量模擬提供參考,推動農田分區(qū)灌溉水資源的科學有效利用。