王增學,周志華,鄒曉天,楊笑冰
(1.吉林省水文水資源局吉林分局,吉林 吉林 132013;2.吉林省蛟河市水資源管理辦公室,吉林 蛟河 132500)
中長期水文預報是指根據前期水文氣象要素,用成因分析與數理統計的方法,對未來較長時間的水文要素進行科學的預測。中長期水文預報的預報對象主要是徑流、江河湖海的水位、旱澇趨勢、冰清及泥沙等。隨著我國現代化建設的不斷發展,國民經濟各部門對水文預報提出的要求越來越高,不僅要求有較高精度的短期預報,而且要求預見期更長的中長期預報[1~3]。
經過前人的不斷努力和探索,目前中長期水文預報方法已日趨成熟。中長期水文預報方法大體可分為傳統方法和新方法兩大類[4]。前者是大多數生產部門采用的方法,主要包括逐步回歸、多元回歸、線性回歸、自回歸等,后者主要包括模糊分析、人工神經網絡、灰色系統分析、投影尋蹤技術等。
在水文中長期預報中,由于影響因素的復雜性,需要考慮多個預報因子對預報對象的影響,并建立預報對象與預報因子間的線性方程,這就是多元線性回歸。多元線性回歸是假定在各預報因子和預報量之間呈線性關系的情況下,使預報值和實測值之間誤差達到最小,并認為未來是按這種關系發展,從而進行預報。它是中長期預報的一個重要手段。
模型的基本方程式:

這里 b0,b1,…,bp,σ2都是與 x0,x1,…,xp無關的未知數,稱為回歸系數,ε是隨機誤差(或隨機干擾),這就是P元線性回歸模型。
人工神經網絡(Artificial Neural Networks,縮寫ANN)是對人腦若干基本特性通過數學方法進行的抽象和模擬,是一種模仿人腦結構及其功能的非線性信息處理系統。人工神經網絡按拓撲結構分為前饋網絡、反饋網絡和混合網絡。BP網絡是由Rumelhart和Mccullane針對含有隱層的、具有非線性連續函數的多層前饋網絡權值調整問題而提出的誤差反向傳播算法(Back-Progagation Network,簡稱BP網絡)。它是人工神經網絡中最為重要的網絡之一,也是迄今為止應用最為廣泛的網絡算法。
BP人工神經網絡在實際應用中,就是通過對不同神經元的訓練和對比,本著盡可能地減小系統規模、縮短系統學習時間以及降低系統復雜性的原則,確定的一個具有恰當規模的網絡模型[5]。BP神經網絡本質上是一種誤差函數的梯度下降算法,它的學習原則是通過方向傳播來調整網絡的權值和閾值使誤差平方和最小。實踐證明,這種模型具有很強的映射能力,有關水文專家研究發現,三層結構的BP網絡就能滿足水文預報的一般要求。三層BP網絡拓撲結構如圖1所示。

圖1 BP神經網絡的拓撲結構
BP人工神經網絡的特點是具有大規模并行處理信息的能力,分布式的信息存貯,自組織、自學習和自適應能力,泛化能力,非線性映射能力,聯想功能和容錯性等,而且善于聯想、概括、類比和推理,能從大量的分析資料中分析提煉實用的統計規律。根據建立指標體系和從環境檢測中心獲得的系列資料,對系列資料進行學習,來識別水資源承載能力的因子與其他變量之間的復雜關系,從而實現水資源承載能力的預測。
投影尋蹤 (Projection Pursuit,PP)是國際統計屆于20世紀70年代中期發展起來的一種新的、有價值的高新技術,是統計學、應用數學和計算機技術的交叉學科,是用來分析和處理高維觀測數據,尤其是非線性、非正態高維數據的統計方法,屬當今前沿領域[6~8]。它的原理是把高維數據按照一定的方向投影到低維子空間上,以投影指標函數來分析原始數據結構特征,并尋找使投影指標函數達到最優的投影值,以達到分析研究高維數據的目的。它具有穩健性、抗干擾性和準確度高等優點,因而在諸多領域得到了廣泛的應用。在水文水資源的應用中,災情評估、水資源評價、水質評價、水資源規劃、水文預報等方面的研究都取得了可喜的成果。
投影尋蹤預測技術建模的基本步驟:1)對數據進行歸一化處理(即原數據減去樣本均值再除以樣本標準差);2)選擇一個初始投影方向;3)將預報因子在選擇方向上投影;4)進行R階Hermite嶺函數擬合;5)用最小二乘法求R階Hermite多項式權重系數;6)計算出預報對象的擬合值;7)重復步驟2)~6),共隨機生成種群為NN的投影方向;8)采用遺傳算法選擇最佳投影方向,并檢驗模型精度是否達到要求;9)利用最佳投影方向進行預報擬合。
該文以長江宜昌站1956—1990年的流量資料作為研究對象。以12月平均流量為預報對象,8—11月4個月的平均流量為預報因子,利用1956—1984年共29年資料作為樣本建立模型,預留1985—1990年6年資料進行預報檢驗。采用多元逐步回歸、人工神經網絡預測技術和投影尋蹤預測技術分別建立水文預報模型。擬合結果相對誤差對比見表1。

表1 3種預報模型擬合結果相對誤差對比
3種中長期水文預報模型擬合結果和實測流量對比見圖2。
經統計,多元線性回歸預測模型的擬合結果在5%以內的占46.7%,在10%以內的占70%,最大相對誤差為19.15%,平均相對誤差為6.88%;神經網絡預測模型的擬合結果均在1%以內,最大相對誤差為0.16%,平均相對誤差為0.12%;投影尋蹤預測模型的擬合結果在5%以內的占40%,在10%以內的占70%,最大相對誤差為18.53%,平均相對誤差為7.71%。從擬合結果可以看出:3種中長期水文預報模型都是可行的,且相對誤差小,精度均比較高,其中神經網絡預測模型的模擬結果最好。

圖2 3種預報模型擬合結果和實測流量值對比圖
利用各預測模型,分別對1985—1990年12月流量進行預報,各模型預報結果相對誤差見表2。

表2 各預報模型預測結果相對誤差對比
由預報模型的預測結果可以看出,3個預報模型預測的精度均在20%以內,其中多元回歸預測模型和神經網絡預測模型的預報結果均在10%以內,預報效果很好、精度較高。
水文過程是個很復雜的動態過程,水文序列既有確定性成分,也有隨機成分,對應地,各預測模型也均有其各自的優缺點和不確定性,使得這些方法難以對整個水文過程進行有效地擬合和預測,因此,可以考慮將各種預測方法進行組合,建立水文中長期耦合預,來提高水文過程的預測精度。
[1]范鐘秀.中長期水文預報[M].南京:河海大學出版社,1999.
[2]王欽釗,向奇志.中長期水文預報方法的探討[J].江西水利科技,2006(02).
[3]楊旭,欒繼虹,馮國章.中長期水文預報研究評述與展望[J].西北農業大學學報,2000(06).
[4]湯成友,官學文,張世明.現代中長期水文預報方法及其應用[M].北京:中國水利水電出版社,2008.
[5]許莉,趙嵩正,楊海光.水資源承載力的BP神經網絡評價模型研究[J].計算機工程與應用,2008,44(8).
[6]于國榮,葉輝,夏自強,趙小勇.投影尋蹤自回歸模型在長江徑流量預測中的應用[J].河海大學學報(自然科學版),2009(03).
[7]高玲,王淑英,林雪飛.投影尋蹤回歸模型在水文預報中的應用[J].黑龍江水專學報,2000(02).
[8]張欣莉,丁晶.參數投影尋蹤回歸及其在年徑流預測中的應用[J].四川大學學報(工程科學版),2000(03).