趙思遠,郝振純,劉文斌(.河海大學水文水資源與水利工程科學國家重點實驗室,南京 0098;.黑龍江省水文局,哈爾濱 5000)
水位和流量是指示河流汛情的兩個最基本水文要素。流量是洪水波運動的本質,水位則是洪水波形狀的表現。水位必然與流量有關,但還要受到河道斷面幾何形狀、水面比降、沖淤變化、回水頂托、人工控制的影響,因此,水位預報比流量預報更復雜[1]。
國內在水位預報方面,多年來一直主要沿用古老的相應水位法和流量演算-水位流量關系轉換法,又稱為經驗分析法。采用該法建立的預報模型,用于有回水頂托、沖淤變化和人工控制河道,預報精度不高,一般僅用于預報洪峰水位,不宜用于預報水位過程。自20世紀70年代計算水力學問世以來,國內外提出了一系列基于水力學理論的水位計算模型,但大多只適用于穩定河床。實際應用中需較詳細的河道斷面和糙率資料,且河床特征常受沖淤影響隨時間變化,故預報精度不高。系統理論和方法向洪水預報技術的滲透是從50年代開始的。它經歷了一個從個別方法的借用逐步到系統理論引入的過程[1,2]。水文統計方法就是基于系統論的觀點和思維方式,針對水位、流量等預報對象,根據流域實際情況和物理成因,尋找主要的相關因子,建立預報對象和主要相關因子之間的相關關系,利用相關因子的實際取值來預測預報對象的取值。這種方法簡單實用,但模型參數沒有明確的物理意義,屬于黑箱模型。采用不同系統計算方法結果差異較大,所以預報精度很大程度上依賴于水文資料及模型的求解。
當影響水位變化的組成條件復雜、資料條件不完善時,采用統計類模型方法進行水位要素的預報具有較好的適用性。此外水位系列在時序上具有相依性、突變性和隨機性等復雜非線性特征,而從數學模型來看,任何一個具有高階微商的非線性的多元函數都可用線性函數逼近,即又歸結為線性模型[2]。黑龍江是以雨水補給為主、積雪融水補給為輔的河流,全部徑流中雨水補給約占75%~80%,融雪水補給約占15%~20%[3],干流周圍缺乏雨量站和溫度觀測點,且缺少詳細的河道工情信息,針對黑龍江干流的水文特性和資料情況,本文以黑龍江干流中游河段長發屯水位站點為研究對象,選取了5種水文統計方法,通過兩種途徑進行水位過程預報,一種是上下游水位相關,另一種是考慮預報因子和對象的多階歷史水位來預報站點當前水位。
本文討論的水文統計方法主要為回歸分析方法,包括多元線性回歸、多元門限回歸、混合線性回歸以及基于混合線性回歸方法的逐步回歸和門限回歸(以下簡稱混合逐步回歸和混合門限回歸)。前面兩種回歸分析方法較為簡單,水文預報領域應用較多,后面三種方法是建立在多元回歸的基礎上,加以拓展延伸。
多元線性回歸分析建模的步驟一般為:選取預報因子,參數估計,模型檢驗。實際應用時預報因子一般選用上游入流站點水文要素,參數采用最小二乘法估計,最后通過F檢驗來判斷模型是否線性回歸顯著。設建立的數學模型為:
(1)
對實測水文資料建模的時候,整體呈一條線性往往是不現實的,實際情況中,常常是分成幾段。基于此類問題,建立了多元門限回歸模型。它的總體思路為:先將研究空間分割為N個子空間,然后在每一個子空間上建立多元回歸模型。實際中L常取為2或3。形成的數學模型如下:

(2)
設有mv個變量X1,X2,…,Xmv,其中X1是因變量。X1,X2,…,Xmv的觀察值序列為Xij,i=1,2,…,mv,j=1,2,…,nt。定義混合線性回歸模型為:
X1t=b0+b11X1,t-p10+…+b1p1X1,t-p10-p1+…+
bmv,1Xmv,t-pmv0-1+…+bmv,pmvXmv,t-pmv0-pmv
(3)
式中,pi0+pi,i=1,2,…,mv為各變量的時間滯后。
式(3)中,因變量X1t不僅可以依賴于其自身歷史值X1j,j=t-p10-1,…,t-p10-p1,而且還依賴于自變元的某些歷史值Xij,j=t-pi0-1,…,t-pi0-pi,i=2,…,mv。模型的預見期為τ=1+min(p10,p20,…,pmv0)。可以用最小二乘估計法進行模型的參數估計。混合線性回歸模型與經典的線性回歸模型不同,經典的線性回歸模型沒有體現出因變量自身前后及因變量與各自變量“過去”的依賴關系;混合線性回歸模型又與自回歸模型不同,自回歸模型沒有考慮其他變量對因變量的影響。
實際應用中需要從p=p1+…+pmv個備選變量中挑選出對因變量影響最大的一些因子建立模型。通常采用近似最小信息準則即AIC或BIC準則來挑選回歸因子[5,6]。用近似最小信息準則挑選回歸因子的思想是:從高階模型到低階模型逐步剔除不重要變元,使準則函數為最小的模型便是近似最佳模型。設p階模型的擬合殘差方差為[σ(n)ε]2,則相應的AIC值和BIC值為:
AICn=ln[σ(n)ε]2+2n/p
BICn=ln[σ(n)ε]2+n(lnp)/p
混合逐步回歸模型的基本框架及方程形式與混合線性回歸模型相似,不同點在于選取自變元時是聯合采用AIC準則和逐步回歸篩選法來確定模型中應包括的自變元個數及階數。
逐步回歸篩選法是一種雙重檢驗的方法。對于未選入方程的因子,只要它還可以提供顯著的解釋信息,能使殘差平方和下降最多,就可以進入方程;而對于已進入方程的因子,只要在這已建立的過渡方程中不顯著,就要從方程中剔除。這是利用求解線性方程中求逆同時并行的方法,使得在計算因子方差貢獻和求解回歸系數同時進行,計算簡便,并且每步都做了檢驗。通過逐步回歸模型引入方程的因子,一定是對預報對象影響顯著的因子,此外,它還可以避免因子對預報對象的重復影響。
混合門限回歸模型就是將門限回歸的思想應用到混合線性回歸中去,建模的步驟一般為選取預報因子種類,確定門限變量、門限數及門限值,通過AIC準則確定各自變元的階數,估計各子空間回歸系數。此時預報模型為:
(4)
長發屯水位站位于黑龍江干流中游河段與俄羅斯境內結雅河交匯處,其水位因上游河流來水影響,地形復雜,缺少詳細的河道工情信息,難以采用水力學模型預報,所以本次采用黑箱模型方法進行長發屯水位過程預報。此外長發屯站距離上游干流黑河水位站較近,預見期較短,而由于本文所采用水文資料時間步長為24 h,因此上游干流入流選用三道卡水位站,支流選用俄羅斯管轄水文站小沙贊卡作為上邊界入流站點。圖1為長發屯站附近水系概化圖。

圖1 黑龍江中上游水系概化Fig.1 Water generalization for the upper and middle reaches of the Heilongjiang River
由于該站點位于黑龍江干流中游河段,該區6-9月降水占全年降水量的70%~80%左右,且全年徑流量的70%也在這一期間,因此本文中采用的資料數據為三道卡、小沙贊卡(俄羅斯境內站點)、長發屯站2006-2011年的6月1日-9月30日的8∶00水位時間序列,黑河站2006-2011年6月1日-9月30日的8∶00雨量時間序列。
設三道卡、小沙贊卡、長發屯站水位時間序列分別為Z1t,Z2t,Z3t,表示第t日8時水位,m;對各站點水位作相應的一階差分記為X1t=Z1t-Z1t-1,X2t,X3t同前,稱為各站點第t日8時水位漲差,m;P1t代表黑河站分區第t-1日8時至第t日8時雨量,mm。
2.1.1上下游水位相關
通常上游洪水過程與下游洪水過程具有很好的相關性,因此在做下游洪水水位預報時,上游過去洪水水位過程應該是重要的影響因子。以三道卡、小沙贊卡站的洪水水位Z1t-1、Z2t-1為模型輸入,預報長發屯站洪水水位Z3t。
長發屯站水位過程多元線性回歸模型為:
Z3t=b0+b1Z1t-1+b2Z2t-1
(5)
長發屯站水位過程多元門限回歸模型為:
(6)
2.1.2考慮多階自變元歷史值
為了盡可能準確地預報站點水位,消除水位的非平穩性影響,因此對水位時間序列作一階差分變換(即水位漲差),同時考慮了區間雨量因素對水位漲差的影響。長發屯站混合回歸模型水位過程預報計算步驟為:將該站點上邊界入流t日8時以前水位漲差及匯流區間黑河站t-1日8時以前雨量作為模型的輸入,計算得該站點t日8時水位漲差預報值,再加上該站點t-1日8時水位,可得該站點t日8時水位預報值。
混合線性回歸模型的數學公式為:
X3t=b0+b11X3t-1+b21X1t-1+b22X1t-2+
b31X2t-1+b32X2t-2+b33X2t-3+b41Pat-1
(7)
式中:Pat-1為黑河站第t-1日8時至第t日8時雨量,mm。
混合逐步回歸模型的數學公式為:
X3t=b0+b11X3t-1+b21X1t-1+b22X1t-2+
b31X2t-1+b32X2t-2+b41Pat-1
(8)
逐步篩選分析中認為小沙贊卡第t-3日8時水位漲差對預報對象貢獻偏小,在顯著性水平0.1下,剔除該因子;此外,引進因子的順序即因子對預報對象的方差貢獻從大到小為:X3t-1,X1t-1,X1t-2,X2t-1,X2t-2,Pat-1。
混合門限回歸模型的數學公式為:
(9)
在混合門限回歸方程中,門限變量Z3t-1是根據預報對象與各預報因子之間的互相關系數取最大選取出來的。而在率定階段不斷對門限變量研究空間進行分割擬合方程,當模型總殘差平方和最小時,即確定門限數為2,門限值為8.54。
長發屯水位站點采用2006-2010年汛期(6-9月)的水文觀測資料率定相應的水位過程預報模型,采用2011年汛期的水位觀測資料驗證該站的水位過程預報模型,該站點的有效預見期為24 h。根據《SL250-2000水文情報預報規范》,可以采用許可誤差和確定性系數作為方案精度評定標準,變幅均方差σΔ和確定性系數DC按下式計算:
(11)

按上述評定準則,取預見期內的變幅均方差作為許可誤差,長發屯站通過上下游水位相關進行水位過程預報的兩個預報方案中,多元線性回歸模型預報合格率在率定期內為62.0%,驗證期內為60%以下,不可用于作業預報;多元門限回歸模型預報合格率在率定期內為62.5%,驗證期內為68.9%,評定為丙等預報方案,可用于參考性預報。這兩種多元回歸模型預報結果較差,是因為通過簡單的上邊界站點入流而建立的線性一階回歸方程并不能有效逼近具有非線性變化規律的水位,且模型沒有考慮因變元自身歷史值。而通過考慮多階自變元歷史值進行水位過程預報的三個混合回歸模型預報方案中,率定期和驗證期內預報合格率均達到85%以上,確定性系數也都為0.98以上,因此各混合回歸模型預報方案均評定為甲等預報方案,可以用于作業預報。長發屯站的驗證結果見表1,汛期(6-9月)水位過程洪峰水位預報結果見表2,預報模型的擬合效果見圖2-5。

表1 長發屯站2011年汛期水位過程預報精度統計Tab.1 Precision of water-level forcasting of the Changfatun station for flood season of 2011

表2 長發屯站2011年汛期洪峰水位預報結果 mTab.2 Forecasting results of water-level of flood peak of the Changfatun station for flood season of 2011

圖2 長發屯站多元回歸模型2011年汛期(6-9月)水位過程預報檢驗Fig.2 Verifying the validity of water-level forecasting for flood season of 2011(June to September) by using multiple regression models

圖3 長發屯站混合線性回歸模型2011年汛期(6-9月)水位過程預報檢驗Fig.3 Verifying the validity of water-level forecasting for flood season of 2011(June to September) by using multivariate hybrid linear regression method

圖4 長發屯站混合逐步回歸模型2011年汛期(6-9月)水位過程預報檢驗Fig.4 Verifying the validity of water-level forecasting for flood season of 2011(June to September) by using multivariate hybrid stepwise regression method

圖5 長發屯站混合門限回歸模型2011年汛期(6-9月)水位過程預報檢驗Fig.5 Verifying the validity of water-level forecasting for flood season of 2011(June to September) by using multivariate hybrid threshold regression method
由表1可以看出,根據上下游水位相關預報,多元門限回歸比多元線性回歸模型的結果好;而考慮多階自變元歷史值預報,3個模型的預報效果相差不大,其中混合門限回歸當屬最優,該模型的各項預報指標均優于其他模型。
由表2可以看出,預報非線性的水位過程洪峰,3種混合回歸模型明顯優于通過上下游水位相關的兩種模型,其中混合門限回歸模型預報洪峰水位與實測洪峰水位誤差最小,最為穩定。
除了長發屯站點以外,本文還將5種水位過程預報方法應用于黑龍江其他水位站點上,其中3種混合回歸模型均表現良好,在預報精度上均能達到甲等;當上邊界入流僅有一個水位站點時,另外兩種多元回歸模型在預報精度上也能普遍能達到乙等以上。在本實例研究中還需要說明的是,混合逐步回歸模型較于混合線性回歸模型篩選剔除了一個預報因子(小沙贊卡第t-3日8時水位漲差),且最后預報精度能夠不差于混合線性回歸模型,但用逐步回歸方法挑選回歸因子,使用F檢驗方法進行檢驗時,如果置信水平選取不當,可能導致誤判,使得預報精度變差,這種情況應當盡量避免;此外,相對于混合線性回歸模型,雖然混合門限回歸模型預報效果較之都要高一點,但是該模型結構較為復雜,在混合線性回歸模型程序基礎之上又多了自變元與因變元互相關系數計算模塊、門限元分段模塊、F檢驗計算模塊,且在率定過程中需要對門段數進行試算,不如混合線性回歸模型方便,穩定,在對預報精度要求不高的情況下,簡單的方法要優于復雜的。
針對黑龍江干流汛期洪水的特點和防洪減災決策的需求,本文采用多元回歸模型和基于混合線性回歸模型的各種統計相關方法,建立了黑龍江干流中游長發屯站點的水位預報模型,模型有效預見期為24 h。率定和驗證結果表明,通過簡單的多元回歸關系來建立上下游水位相關關系,預報效果并不理想,而其他三種混合回歸模型預報方案的預報精度均能達到甲等。因此,所提出的混合回歸模型方法具有一定的精度和較好的適用性,可以用于作業預報。
上述研究表明,對于水位過程預報,簡單的水文統計方法是行之有效的,且模擬精度較高,適用于那些受上游干流及眾多支流來水影響,地形復雜,缺少詳細的河道工情信息的河流站點作水位預報。應當指出的是,由于大部分的水文統計方法是輸入、輸出的黑箱模型,其結構和參數全由水文資料率定,倘若流域或河道情況發生變化,對今后每年開展的預報工作,增加新的水文資料的同時,需采用延長后的資料進行實時率定和驗證,優化模型參數,提高預報方案精度。
□
[1] 黃國如,朱慶平,馬 駿,等.水位演算模型及其在水位預報中的應用[J].水文,1999,(2):1-6.
[2] 葛守西.現代洪水預報技術[M].北京:中國水利水電出版社,1999:1-23.
[3] 牟金玲,狄 娟.黑龍江干流中上游段水文特性[J].黑龍江水利科技,2007,35(2):101-102.
[4] 李致家,孔祥光.非線性水文系統的實時預報方法比較研究[J].水文,1997,(1):24-28.
[5] 張顯揚,董增川,王建群,等.雅魯藏布江尼洋河流域洪水預報方法研究[J].河海大學學報(自然科學版), 2005,33(5):530-533.
[6] 胡 煒,董增川.統計相關分析在太湖流域水位預報中的應用[J].水利經濟,2008,26(3):55-58.
[7] Phien H N, Kha N D A. Flood forecasting for the upper reach of the Red River Basin, North Vietnam[J]. Water S A,2003,29(3):267-272.
[8] SL250-2000,水文情報預報規范[S].