焦鵬,姚文藝,嚴軍,肖培青,申震洲,楊春霞
(1.華北水利水電學院,450011,鄭州;2.黃河水利科學研究院,450003,鄭州)
土壤侵蝕預報模型對于定量評價水土保持效果,合理制訂水土保持措施等具有重要意義。坡面徑流輸沙能力是建立土壤侵蝕過程模型的重要水力學參數,對模型的模擬預報精度有著重要影響。20世紀40 年代以來,眾多學者通過試驗研究、野外觀測等手段對坡面徑流輸沙能力進行了大量研究,并采用力學機制研究、統計分析等方法,建立了一系列半理論、半經驗和經驗公式,如Govers 公式[1]、Everaert 公式[2]、Brahams 公式[3]等。由于研究對象的差異和率定資料的不同,坡面徑流輸沙能力公式在形式和適用范圍上存在較大差異,同時一些參數難以準確獲取和率定,使得公式不便于推廣應用。
由于坡面水蝕的多種侵蝕形式和復雜侵蝕過程,坡面徑流輸沙能力的定量計算較為困難。研究[4-5]表明,神經網絡可以逼近任意的非線性函數,能夠模擬復雜的非線性系統。近年來,國內外一些學者[6-9]將神經網絡理論用于河流的輸沙能力研究,取得了較好的模擬預測結果;但該理論在坡面徑流輸沙能力方面的研究較少。筆者將神經網絡理論用于坡面徑流輸沙能力研究,根據坡面徑流輸沙能力試驗資料,使用平均影響值(mean impact value,MIV)方法分析、評價各因素對神經網絡模型的影響,據此建立廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)模型,使用交叉驗證優選模型參數,并結合Adaboost(Adaptive Boosting)算法對模型進行優化。
試驗在黃河水利科學研究院“模型黃河”試驗基地進行。試驗土槽為長5 m、寬3 m、深0.6 m 的可調角度鋼制土槽,使用PVC 板材將其分隔為3 個長5 m、寬1 m 的試驗小區。土槽底部鋼板上鉆有直徑5 mm 左右的透水孔,PVC 板材邊壁粘有不同粒徑的沙粒以消除不同介質間的邊界影響。土槽上端連接水平穩流池,為整個坡面均勻地提供平穩水流;在土槽末端連接集流槽,用來集中和收集坡面徑流。試驗土槽見圖1。

圖1 試驗土槽Fig.1 Experimental earth trough
試驗用土采用鄭州邙山坡面表層黃土,顆粒組成見表1。將黃土過10 mm 篩后,采用分層填沖、壓實的方法填土至50 cm 厚,控制土壤含水率在15%左右,土壤干密度在1.23 g/cm3左右。填土完成后,在坡段的上中下部分別使用環刀取樣,計算土壤的平均密度,烘干后測定土壤干密度。試驗前在坡面上灑水至表層土壤飽和,以保證每次試驗的土壤前期含水量基本一致。本次試驗采用坡度和流量2 個可控因素,坡度分別為10°、20°和30°,流量分別為1.0、2.0、3.0、4.0、5.0、7.5 和10.0 L/min,共有不同坡度和流量組合的21 個組次,每組進行2 次重復試驗。試驗開始前先對水平穩流池的來水流量按照試驗所需進行率定,在坡面上標記5 個固定的觀測斷面后,開始進行坡面沖刷試驗。在坡面產流以后開始計時,以2 min 為時間間隔使用水桶在集流槽處收集坡面徑流,其間在觀測斷面使用染色劑法測量坡面徑流流速,并取徑流樣以觀察坡面徑流含沙量的沿程變化,同時觀測、記錄坡面侵蝕形態的變化過程,每次試驗進行30 min。

表1 供試土樣粒徑組成Tab.1 Particle distribution of the experimental soil
水流輸沙能力的概念是針對河道中的泥沙輸移趨于平衡時的不沖不淤狀態而言,其表達形式與泥沙運動狀況有關。根據河流動力學理論,徑流輸沙能力主要由水力條件和泥沙條件共同決定,可表示為如下函數形式[8-9]:

式中:GS*為徑流輸沙能力;v 為斷面平均流速;R 為水力半徑;J 為能坡;ωs為泥沙沉速;γs為泥沙密度。
在試驗條件下,泥沙沉速ωs、密度γs為定值,故選擇流速v、水力半徑R 和能坡J 作為坡面徑流輸沙能力的影響因子。坡面徑流輸沙能力是由坡段的進出口邊界條件和坡段內周界條件共同決定的。試驗研究表明,流量是影響坡面徑流輸沙能力的重要參數[12],針對坡面徑流侵蝕和泥沙輸移特征,考慮土壤干密度C、進口流量Qu、出口流量Qd對坡面徑流輸沙能力的影響。最終選擇土壤干密度C、能坡J、進口流量Qu、出口流量Qd、水力半徑R、流速v 等6 個影響因子作為模型的輸入參量。
研究[13]表明,神經網絡模型的模擬預測精度與訓練樣本數目和分布有關,大量分布均勻的訓練樣本能夠有效降低模型的預測誤差。本研究以試驗場次是否最終達到輸沙平衡為判別標準,在不同坡度和流量的21 組試驗中,選取每組試驗達到輸沙平衡的場次作為訓練樣本,將所有剩余場次中達到輸沙平衡的6 場試驗作為測試樣本。使用試驗后段坡面徑流含沙量達到基本穩定時的實測平均值計算各影響因子和坡面徑流輸沙能力。
為消除模型輸入輸出中各參量數據量級差別對神經網絡的影響,需要對輸入輸出矩陣進行歸一化處理,使用極差歸一化公式將所有數據變換至區間[0,1]。
G.W.Dombi 等[12]提出用神經網絡的平均影響值(MIV)來反映神經網絡中權重矩陣的變化情況。MIV 是神經網絡中分析變量相關性最好的指標之一,能夠評價各自變量對因變量的影響大小,對輸入網絡的各影響因子進行分析、篩選,提高神經網絡的模擬精度和收斂速度。
MIV 方法是將輸入矩陣X 和輸出矩陣Y 作為標準矩陣代入神經網絡進行訓練,分別對矩陣X 中的每一輸入參量按比例增減形成比較矩陣X1和X2,將X1和X2代入訓練好的神經網絡計算得到相應的輸出矩陣Y1和Y2,Y1與Y2差值的平均數即為平均影響值。MIV 值的符號表示該因子對神經網絡輸出的相關方向,絕對值大小表示其影響的相對重要性。使用包含6 個影響因子的訓練樣本數據,對每一輸入參量進行基于GRNN 的MIV 分析,結果見表2。

表2 影響因子的MIV 值Tab.2 Mean Impact Value of the impact factors
結果表明,對于以上述各影響因子為輸入參量、坡面徑流輸沙能力為輸出參量建立的GRNN 模型,能坡、進口流量、出口流量、水力半徑與模型輸出呈正相關關系,干密度、流速與模型輸出呈負相關關系,各因子對輸出結果的影響大小依次為J >v >C >Qd>Qu>R。所選影響因子對模型輸出的影響基本屬于同一量級,因此,可以作為GRNN 坡面徑流輸沙能力模型的輸入參量。
廣義回歸神經網絡(GRNN)是美國學者D.F.Specht[13]提出的一種徑向基神經網絡,具有柔性網絡結構和很強的非線性映射能力,適于解決非線性問題。GRNN 由輸入層、模式層、求和層、輸出層構成。
輸入層由m 個神經元組成,其數目為輸入向量X=[x1,x2,…,xm]T的維數,作用是直接傳遞變量至模式層。
模式層由n 個神經元組成,對應n 個訓練樣本X1,X2,…,Xn,神經元轉移函數為

式中:X 為輸入向量,Xi為第i 個神經元對應的訓練樣本,i=1,2,…,n;σ 為高斯函數的寬度系數。
求和層由2 類神經元構成,SD對所有模式層神經元的輸出進行算術求和,其與模式層各神經元的連接權值為1;S1,S2…,Sk對所有模式層神經元的輸出進行加權求和,模式層第i 個神經元與求和層第j個神經元的連接權值yij為第i 個輸出樣本Yi的第j個元素。SD與Sj的計算公式分別為

式中yij為模式層第i 個神經元與求和層第j 個神經元的連接權值,i=1,2,…,n,j=1,2,…,k。
輸出層由k 個神經元組成,其數目為樣本輸出向量Y=[y1,y2,…,yk]T的維數,輸出層神經元j 的輸出即為預測結果的第j 個元素yj,其計算公式為

將包含6 個影響因子的向量X 作為輸入,坡面徑流輸沙能力Y 作為輸出,構建GRNN 模型。
設隨機變量x 和y 的聯合概率密度函數為f(x,y),已知x 的觀測值為X,則y 相對于X 的回歸,即條件均值為
應用Parzen 非參數估計,由樣本x 和y 的觀測值估算概率密度函數

式中:Xi和Yi分別為隨機變量x 和y 的樣本觀測值,作為第i 個訓練樣本的輸入和輸出向量,i=1,2,…,n;n 為樣本容量;m 為隨機變量x 的維數;σ為高斯函數的寬度系數,即平滑參數。
將式(7)代入式(6),化簡得

平滑參數σ 對GRNN 的預測性能影響較大,σ較大時估計值^Y(X)逼近所有訓練樣本因變量的均值,網絡的泛化能力較強;σ 較小時估計值^Y(X)逼近與輸入變量Euclid 距離最近的訓練樣本因變量,網絡對訓練數據的逼近效果較好。適中的平滑參數σ能夠使GRNN 將所有訓練樣本因變量計算在內,且給予與輸入變量Euclid 距離較近的樣本因變量較大權重,綜合考慮訓練樣本逼近與網絡泛化能力的要求。
本文使用K 折交叉驗證(K-fold cross-validation)對網絡的平滑參數σ 進行優選,使GRNN 獲得較好的逼近效果和泛化能力。研究[16]表明,K 取10是獲得最好誤差估計的恰當選擇,故使用10 折交叉驗證(10-fold cross-validation)測試所建GRNN,將10次測試中最小預測誤差所對應的GRNN 作為該次交叉驗證條件下的最優GRNN 模型,其平滑參數作為最佳平滑參數。
Adaboost 是Y.Freund 等[17]提出的一種集成學習算法,可以有效提高單一學習器的泛化能力和模擬預測精度。本文采用連續型Adaboost 算法[18],將10 折交叉驗證中最佳平滑參數所對應的GRNN 模型作為該樣本分類條件下的最佳弱預測器,并按照一定的權值集成10 個最佳弱預測器作為強預測器,即GRNN_Adaboost。對于n 個訓練樣本T 次訓練過程的Adaboost 算法優化,其流程見表3。

表3 Adaboost 算法流程Tab.3 Algorithmic process of Adaboost
以土壤干密度C、能坡J、進口流量Qu、出口流量Qd、水力半徑R、流速v 作為輸入參量,實測坡面徑流輸沙能力GS*作為輸出結果,將訓練樣本數據代入GRNN_Adaboost 模型進行訓練,模型擬合結果見表4。

表4 GRNN_Adaboost 模型訓練結果Tab.4 Training results of GRNN_Adaboost model
由訓練結果知,模型對所有訓練樣本的擬合誤差平均值為13.88%。其中:坡度為10°的1 ~7 組訓練樣本的平均擬合誤差為25.21%,最大擬合誤差為第3 組的69.33%;坡度為20°的8 ~14 組樣本的平均擬合誤差為8.81%,最大擬合誤差為第8 組的21.94%;坡度為30°的15 ~21 組樣本的平均擬合誤差為7.60%,最大擬合誤差為第19 組的16.95%。研究[19]表明,坡面侵蝕方式對坡面徑流輸沙能力影響較大。坡度為10°時,坡面徑流能坡較小,坡面未形成細溝或細溝未貫通試驗觀測斷面,使得訓練樣本包含了面蝕和溝蝕等不同侵蝕形式的信息,從而導致坡面徑流輸沙特性發生異變,模型對訓練樣本的擬合誤差較大。坡度為20°、30°時,坡面徑流能坡較大,各觀測斷面的侵蝕形式主要為細溝侵蝕,模型對訓練樣本擬合較好。
使用訓練所得GRNN_Adaboost 模型對測試樣本的坡面徑流輸沙能力進行預測,結果見表5。
將GRNN_Adaboost 模型計算所得預測值與實測值進行對比分析,由圖2 知:相關系數為0.983,表明預測值與實測值有較好的相關關系;決定系數R2為0.729,表明預測值與實測值之間存在很好的一一對應關系。
為檢驗GRNN 模型對坡面徑流輸沙能力的預測效果,使用廣泛運用的BP(Back Propagation)神經網絡進行對比驗證,建立以6 個影響因子為輸入、以坡面徑流輸沙能力為輸出的3 層BP 神經網絡模型,其隱含層神經元轉移函數為

表5 GRNN_Adaboost 模型預測結果Tab.5 Predicted results of GRNN_Adaboost model

圖2 坡面徑流輸沙能力預測值與實測值擬合關系圖Fig.2 Fitting of measured values to predicted values of sediment transport capacity

將訓練樣本代入BP 神經網絡模型進行訓練,使用訓練后的模型對測試樣本的坡面徑流輸沙能力進行預測,并計算10 次預測結果與實測值的誤差平均值。BP 神經網絡、弱預測器GRNN、強預測器GRNN_Adaboost 在測試樣本處的預測誤差見圖3。

圖3 模型預測誤差Fig.3 Prediction error of the models
由測試樣本的模擬預測結果知:BP 神經網絡模型的平均預測誤差為18.40%。在坡度為10°的測試樣本1 處取得最大預測誤差30.05%,10 個GRNN 弱預測器的平均預測誤差為13.20%;在坡度為10°的測試樣本1 處取得最大預測誤差22.49%,強預測器GRNN_Adaboost 的平均預測誤差為6.91%;在坡度為10°的測試樣本1 處取得最大預測誤差15.13%。BP 神經網絡、GRNN、GRNN_Adaboost 模型的測試樣本平均預測誤差依次較少,且均在坡度為10°的測試樣本1 處取得最大預測誤差,與模型的擬合情況一致。
由于網絡拓撲結構、轉移函數、學習速率和迭代次數等限制,BP 神經網絡模型往往需要經大量訓練樣本多次迭代訓練后才能較好地逼近測試樣本。GRNN 的理論基礎是非線性核回歸分析,以樣本數據為后驗條件,執行Parzen 非參數估計,并依據概率最大原則計算網絡輸出。GRNN 最后收斂于樣本量積聚較多的優化回歸面,在訓練樣本較少時也能具有很好的網絡泛化能力,取得較好的模擬預測結果。由于試驗場次所限,可用訓練樣本數量較少,故選擇GRNN 建立坡面徑流輸沙能力模型能夠提高模擬預測的精度。Adaboost 算法根據訓練所得弱預測器的預測誤差不斷調整樣本權值,并將所有弱預測器按一定權重集成為強預測器,以提高模型的模擬預測精度。相對于弱預測器GRNN,強預測器GRNN_Adaboost 對測試樣本的坡面徑流輸沙能力預測精度顯著提高。
1)根據試驗資料的驗證,GRNN 能夠用于坡面徑流輸沙能力的預測。
2)使用MIV 方法分析了坡面徑流輸沙能力影響因子對GRNN 的影響,初步確定了建立GRNN 坡面徑流輸沙能力模型所需輸入參量,即坡面土壤干密度、能坡,坡面流水力半徑、流速,以及坡段的進口流量和出口流量。
3)Adaboost 算法能夠有效提高GRNN 的預測精度,經該算法優化的GRNN_Adaboost 坡面徑流輸沙能力模型對測試樣本的平均預測誤差為6.91%,比GRNN 模型的平均預測誤差減少了47.65%。
4)在試驗訓練樣本條件下,BP 神經網絡模型、GRNN 模型、GRNN_Adaboost 模型的模擬預測誤差依次降低。
由于試驗條件限制,本文未考慮不同粒徑組成和坡長對坡面徑流輸沙能力的影響,不同試驗條件下神經網絡模型的類型選擇問題也有待進一步研究。坡面徑流輸沙規律復雜,其預測難度較大,神經網絡方法適用于此類復雜非線性問題的模擬預測,且無須對特定參數進行率定,具有使用簡便、易于推廣等特點。本文僅利用實體模型的試驗資料對GRNN 預測方法進行了初步探討。
[1] Govers G,Rauws G.Transporting capacity of overland flow on plane and on irregular beds[J].Earth Surface Processes and Landforms,1986,11:515-524
[2] Everaert W.Empirical relations for the sediment transport capacity of interrill flow[J].Earth Surface Processes and Landforms,1991,16:513-532
[3] Abrahams A D,Li G,Krishnan C,et al.A sediment transpo rt equation for interrill overland flow on rough surfaces[J].Earth Surface Processes and Landforms,2001,26:1443-1459
[4] Cybenko G.Approximation by superpositions of sigmoidal function[J].Mathematics of Control,Signals and Systems,1989,2(4):303-314
[5] Hornik K,Stinchombe M,White H.Multilayer feedforward networks are universal approximators[J].Neural Networks,1989,2(2):359-366
[6] 陳雄波,唐洪武.用BP 神經網絡原理對水流挾沙力的研究[J].泥沙研究,2004(1):29-34
[7] 熊建秋,李祚泳.基于支持向量機的水流挾沙力預測研究[J].水利學報,2005,36(10):1171-1175
[8] Chih T Y,Reza M,Mohammad T A.Evaluation of total load sediment transport formulas using ANN[J].International Journal of Sediment Research,2009,24(3):274-286
[9] Melesse A M,Ahmad S,McClain M E,et al.Suspended sediment load prediction of river systems: An artficial neural network approach[J].Agricultural Water Management,2011,98(5):855-866
[10]張瑞瑾,謝鑒衡,王明甫,等.河流泥沙動力學[M].北京:水利電力出版社,1989:204-230
[11]竇國仁,王國兵.黃河小浪底樞紐泥沙研究:報告匯編[R].南京:南京水利科學研究院,1993:91-133
[12]張晴雯,雷廷武,高佩玲,等.黃土區細溝侵蝕過程中輸沙能力確定的解析法[J].中國農業科學,2004,37(5):699-703
[13]王少波,柴艷麗,梁醒培.神經網絡學習樣本點的選取方法比較[J].鄭州大學學報:工學版,2003,24(1):63-65
[14]Dombi G W,Nandi P,Saxe J M,et al.Prediction of rib fracture injury outcome by an artificial neural network[J].The Journal of Trauma,1995,39(5):915-921
[15]Specht D F.A general regression neural network[J].IEEE Transactions on Neural Network,1991,2(6):568-576
[16]Borra S,Ciaccio A D.Measuring the prediction error.A comparison of cross-validation,bootstrap and covariance penalty methods[J].Computational Statistics&Data Analysis,2010,54(12):2976-2989
[17]Freund Y,Schapire R E.A decision-theoretic generalization of on-Line Learning and an Application to Boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139
[18]Schapire R E,Singer Y.Improved boosting algorithms using confidence-rated predictions[J].Machine Learning,1999,37(3):297-336
[19]肖培青,鄭粉莉,汪曉勇,等.黃土坡面侵蝕方式演變與侵蝕產沙過程試驗研究[J].水土保持學報,2008,22(1):24-27