高 巖
(貴州大學資源與環境工程學院,貴州 貴陽550003)
喀斯特流域具有與非喀斯特流域不同的產流方式,預報徑流難度大,精度低。目前喀斯特流域降雨徑流關系研究多以將流域產流方式概化為蓄滿產流模式為主,但將喀斯特流域產流方式概化為蓄滿產流以及對新安江模型結構進行改進等方法模型參數物理意義不明確。人工神經網絡是一個可自動提取一組預報變量和另一組自變量之間非線性關系的數據處理系統,是黑箱模型。前人的研究結果表明,神經網絡模型可以較好的表征非線性,復雜的水文過程。本文試在喀斯特流域建立BP神經網絡逐日徑流預報模型,為喀斯特山區徑流預報提供新方法。
貴州省是喀斯特發育的高原山區,多峰叢、峰林地貌中、小喀斯特流域。喀斯特流域具有二元流場特征,地表與地下分水嶺不重合。對比非喀斯特流域,喀斯特流域產流形式及運動形式更加多樣,除非喀什特地區所具有的產流形式外,還包括皮下徑流、裂隙管道流、滲透流及豎井流。[1]流域內水文動態變化劇烈,地下水滲漏嚴重,地下持水能力差,與濕潤地區流域相比,其流域空間結構、水系發育、地貌景觀、水文動態規律都有明顯的差異。[3]喀斯特流域的特性,決定其洪水過程具有與非喀斯特流域不同的特性。
人工神經網絡采用物理上可以實現的器件或采用計算機來模擬生物體中神經網絡的某些結構和功能。它不在于利用物理器件完整地復制生物體中的神經網絡細胞,而是抽取其中可利用的部分克服目前計算機或其他系統不能解決的問題。
神經網絡的神經元之間的連接有前向網絡、有反饋的前向網絡、層內有相互結合的前向網絡、相互結合型網絡。回歸BP網絡屬于有反饋的前向網絡,
BP神經網絡是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。BP網絡能學習和存貯大量的輸入-輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。它通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。神經網絡主要特點是自學習性,通過訓練得到輸入數據和輸出數據之間的聯系。
BP網絡一般為多層神經網絡。圖1為常用的三層BP神經網絡結構圖。

圖1 BP神經網絡結構圖
本文BP神經網絡模型采用常用的三層結構:輸入層、隱含層和輸出層。降雨產生的徑流量與降雨過程、前期降雨量及流域地質、地形、地貌、植被、氣象等因素有關,流量時間序列也同時包含了諸多影響因子的信息,所以本文采用的降雨量、蒸發量、作為輸入數據。另外,由于BP神經網絡是有前饋的前向網絡,不能實現同一層內神經元之間的橫向抑制或興奮,不能實現任意兩個神經元之間的連接,所以,將前一天的流量時間序列作為輸入數據,可以有效提高網絡仿真的精度。倒天河流域由于缺少蒸發資料,所以未將蒸發量作為輸入數據。
神經網絡在實際應用中,由于數據跨度大,而根據神經元傳遞函數的不同,許多神經網絡模型只接受[0,1]和[-1,1]范圍的數值數據,為了便于網絡訓練,需先將數據按比例縮小到這個區間內。本文在歸一化時對所有數據的最大值和最小值分別加、減一個常數,這樣做可以避免輸入數據中有0,1出現,同時為了保證建立的模型具有一定的外推能力,所以將數據歸一化在0.2~0.8之間。
即,歸一化公式為:

標準的BP算法存在以下缺點:收斂速度緩慢;容易陷入局部極小值;難以確定隱層數和隱層節點個數,因此出現了很多改進算法,如動量改進的BP算法、自適應調整學習速率、動量-自適應學習速率調整算法。本文試采用目前應用比較多的兩種算法:L-M(Levenbrg-Marquardt)算法和學習率可變的BP算法,即TRAINLM算法和TRAINDX算法。TRAINLM算法的特點在于比使用梯度下降法的BP算法快的多,但對于復雜問題則需要相當大的存儲空間。TRAINDX算法的特點在于在訓練過程中力圖使算法穩定,同時使學習步長盡量大。學習函數采用常用的梯度下降法學習函數,即LEARNGDM函數。性能函數采用均方誤差函數,即MSE函數。
六沖河位于烏江上游西南方向。干流全長268 km,流域面積10665 km2,其中省內流域面積9988 km2。流域內地勢西高東低,具有山高坡陡、河谷深切的特點。現以六沖河七星關站作為預報的出口斷面。該站屬于基本水文站,控制的流域面積為2970 km2。七星關站上游還有兩個雨量站,分別為水營站和六曲溝站。用1974~1978年降雨徑流資料建立神經網絡模型,用1979~1983年降雨徑流資料進行模型檢驗。圖2、圖3、圖4、圖5、圖6 分別為七星關站1979、1980、1981、1982、1983 年日徑流預報結果。表1為預報結果的DC值。

圖2 六沖河七星關站1979年實測流量與仿真流量比較圖

圖3 六沖河七星關站1980年實測流量與仿真流量比較圖

圖4 六沖河七星關站1981年實測流量與仿真流量比較圖

表1 六沖河1979~1983年日徑流預報結果DC值
從計算結果來看,六沖河流域所作預報精度DC值為0.538,達到丙級標準。

圖5 六沖河七星關站1982年實測流量與仿真流量比較圖

圖6 六沖河七星關站1983年實測流量與仿真流量比較圖
倒天河地處烏江上游,屬長江流域烏江水系,六沖河一級支流。發源于畢節市野角鄉黃泥沖。本文采用倒天河徐家屯站1975年~1982年的降水、流量資料,其中以1975年~1979年資料建立神經網絡,用1980年、1981年降雨流量資料檢驗。
圖7、圖8為1980年、1981年實測流量與預報流量的比較圖。表2為1975年~1981年仿真結果的DC值。

圖7 倒天河徐家屯站1980年實測流量與仿真流量比較圖

圖8 倒天河徐家屯站1981年實測流量與仿真流量比較圖

表2 倒天河1975~1981年日徑流預報結果DC值
從預報結果來看,徑流的實測流量和預報流量雖然基本趨勢一致,但確定性系數低,雖然1981年的確定性系數達到0.999,但明顯高于1980年及1980年以前,而1975~1980年的評價確定性系數為0.420,所以模型的確定性系數應為0.420。
由于建立模型樣本含量較少,包含信息不全面,所以模型的精度較低,六沖河豐水期模型的DC值平均為0.538,倒天河豐水期模型的DC為0.420,模型精度明顯低于六沖河。另外,在建立兩個模型過程中,六沖河流域采用了蒸發因子作為其中一個影響因子。而倒天河未將蒸發因子作為輸入。從計算結果來看,雖然流量過程包含天氣、蒸發等信息,但要取得較大的精度,必須將其作為輸入因子。另外倒天河屬六沖河一級支流,流域面積小于六沖河,流量也比六沖河小的多,六沖河流量流域面積較大,降雨徑流關系更為穩定,所以預報精度較高。
雖然本文所建立的神經網絡模型預報精度較低,特別是存在洪峰流量誤差較大,洪峰延后等問題。但是目前已有較多的改進方法來提高神經網絡模型的精度,例如戴會超等提出對洪峰流量誤差修正法。采用改進方法后,神經網絡模型在喀斯特山區應用的精度會得到很大提高。神經網絡模型適用于喀斯特山區降雨徑流預報。
(1)用BP神經網絡建立六沖河流域、倒天河流域徑流預報模型精度分別為0.538和0.420。從計算結果來看,用本文方法建立巖溶流域神經網絡模型精度較低。
(2)雖然作為輸出因子的流量序列包含了流域包括水文、地質地貌、氣象等信息,但計算結果表明,加入蒸發因子,精度會得到提高。另外,流域面積較大則模型的精度較高。
(3)本文未采用進一步的數據處理技術,但經前人研究結果證明,對數據進一步進行處理,會有效提高神經網絡模型精度,神經網絡模型在改進以后可以應用于喀斯特山區。
[1]鄭長統,梁虹.喀斯特流域產流特征分析[J].水科學與工程技術.2009,4,33 -34.
[3]賀中華,梁虹.喀斯特流域枯水資源遙感反演[J].水土保持通報.2008,4,135 -139.
[4]飛思科技產品研發中心.神經網絡理論與MATLAB 7實現[M].電子工業出版社.2005.