王 凱 蔣曉蕾
(淮河水利委員會水文局(信息中心) 蚌埠 233001 河海大學 南京 210098)
水文預報是一種重要的防洪非工程措施,直接為防汛抗旱和水資源管理服務。目前廣泛使用的水文預報模型大多是確定性的,模型以確定預報值的形式輸出給用戶。實際上,由于水文過程的影響因素復雜多變,加之人類認識水平的有限,使得水文預報過程中不可避免地存在著諸多的不確定性。目前,水文預報不確定性量化已逐漸成為了研究熱點,概率預報作為其重要的表現形式,已成為了水文預報的發展趨勢。
當前國內外關于洪水概率預報的研究主要包括兩類途徑:第一類是全要素耦合途徑,分別量化降雨—徑流過程各個環節的主要不確定性,如降雨輸入不確定性、模型結構不確定性、模型參數不確定性等,并進行耦合,實現概率預報。如Kavetski等采用“潛在變量”雨深乘子(stormdepthmultiplier)反映降雨輸入的不確定性,并將模型的敏感性參數隨機化,應用馬爾可夫鏈蒙特卡洛(Markov Chain Monte Carlo,MCMC)采樣方法求解流量后驗分布,提出貝葉斯總誤差分析(Bayesian total error analysis,BATEA)方法。在國內,李明亮等基于層次貝葉斯模型(Bayesian hierarchical model),構建聯合概率密度函數以考慮模型參數和降雨輸入不確定性,并采用MCMC方法進行求解。梁忠民等借用抽站法原理推求降雨量的條件概率分布,進而實現考慮輸入不確定性的洪水概率預報。全要素耦合途徑能夠溯源預報不確定性,但計算相對耗時,無法滿足實時預報的需要。
第二類是總誤差分析途徑,即從確定性預報結果入手,直接對預報不確定性進行量化分析,推求預報量的分布函數,實現概率預報。Krzysztofowicz等提出的貝葉斯預報系統(Bayesian forecastingsystem,BFS)最具代表性,其中水文不確定性處理器(hydrologic uncertainty processor,HUP)在正態空間中對似然函數進行了線性假定,為推求預報量后驗分布的解析表達提供了可能。王善序詳細介紹了BFS的理論,并指出它可以綜合考慮預報過程的不確定性,不限定預報模型的內部結構。近年來,很多研究表明,不同流量量級的預報不確定性存在差異。王晶晶等在原始空間中開展預報誤差規律研究,發現不同流量量級的誤差服從不同的分布函數,為此采用極小熵確定各分布線型,采用極大熵進行參數估計,進而降低了福建池潭水庫管理的風險。Van Steenbergen等針對不同預見期、不同流量量級預報誤差統計規律的差異,采用頻率學方法,構建了三維誤差矩陣,量化預報不確定性。
本文在第二類研究途徑框架下,結合研究區域(淮河王家壩斷面)預報誤差的統計特征,假定誤差均值隨流量量級呈分段線性變化,在貝葉斯預報系統(BFS)的基礎上,對其水文不確定性處理器(HUP)進行改進,提出改進的貝葉斯概率預報系統(PCA-HUP),定量評估單個水文模型預報結果的可靠度,實現概率預報。
考慮誤差異分布的洪水概率預報方法不涉及預報的中間環節,只對預報結果進行分析,定量評估預報結果的不確定性,并在此基礎上實現洪水概率預報。在貝葉斯預報系統(BFS)的基礎上,對其水文不確定性處理器(HUP)進行改進,提出改進的貝葉斯概率預報系統(PCA-HUP),定量評估單個水文模型預報結果的可靠度,實現概率預報。
水文不確定性處理器(Hydrologic UncertaintyProcessor,HUP)是貝葉斯概率預報系統(BFS)的主要組成部分,用以分析除降雨之外的其他所有不確定性。其特點是,不需要直接處理預報模型的結構與參數,而是從預報結果入手,分析其與實測水文過程的誤差,再利用貝葉斯公式估計預報變量的概率分布,從而實現水文模型預報結果的不確定性分析及概率預報。其工作流程如圖1所示。
為推求預報量后驗分布的解析解,傳統HUP模型結合亞高斯模型,在正態空間中對先驗分布式和似然函數式進行線性假設,并采用最小二乘法對相關參數進行估計。
然而,由于似然函數式的自變量之間存在明確的線性關系,必然導致回歸方程的多重共線性問題。若采用傳統最小二乘法進行參數估計,會使得估計的回歸系數不唯一,也使得回歸方程不穩定(原始數據的極小變化可造成參數估計值和標準差的明顯變化)。因此,項目研究結合主成分分析技術(Principal components analysis,PCA),對傳統 HUP模型進行改進,提出PCA-HUP模型。
主成分回歸的基本思想:對原始回歸變量進行主成分分析,將線性相關的自變量,轉化為線性無關的新的綜合變量,采用新的綜合變量建立模型回歸方程。
(1)主成分分析
設 X=(X1,…Xp)T是 P 維隨機向量,均值 E(X)=μ,協方差陣 D(X)=Σ。
考慮它的線性變換:

用矩陣表示為:


圖1 水文不確定性處理器工作流程示意圖
由式(2)可以將 P 個 X1,X2,…Xp轉化為 P 個新變量,Z1,Z2,…Zp若新變量 Z1,Z2,…Zp滿足下列條件:
1)Zi和 Zj相互獨立,i≠j,i,j=1,2,…,p;
2)Var(Z1)≥Var(Z2)≥…≥Var(Zp);

則新變量 Z1,Z2,…Zp為 X1,X2,…Xp的 P 個主成分,且Z1,Z2,…Zp線性無關。
(2)主成分回歸
實際問題中不同的變量經常具有不同的量綱,變量的量綱不同會使分析結果不合理,將變量進行標準化處理可避免這種不合理的影響。
對數據進行標準化首先要得出樣本標準差和樣本均值,記sj為xj樣本標準差,即是 xj的樣本均值,即原始數據的標準化變換為:

標準化后的數據矩陣為:

標準化后,X的相關系數陣也就是X的協方差陣(半正定矩陣):

其中:

采用Lagrange乘子法求解,可以求得:

其中:λ1≥λ2≥…≥λp≥0 為 R 的特征值,a1,a2,…ap是相對應的單位正交特征向量,ap=(a1pa2p,…app)T。
主成分回歸可以得到p個主成分,這p個主成分之間互相獨立,且方差呈遞減趨勢,所包含的自變量的信息也是遞減的。即主成分對因變量的貢獻率是遞減的,第i個主成分Zi的貢獻率可以用來表示。
在實際問題的分析時,由于主成分的貢獻率是遞減的,后面的主成分貢獻率有時會非常小,所以一般不選取P個主成分,而是根據累計貢獻率來確定主成分個數,即:前m個主成分的累計貢獻率達到0.85時,選取前m個主成分進行回歸。則原始回歸問題轉化為以下回歸問題:

其中:E(εt)=0,Var(εt)=σ2,Cov(εi,εi)=0,(i≠j)
回歸模型的矩陣形式為:

采用最小二乘法估計參數矩陣B,根據式(1)和式(3)可以估計因變量矩陣Y與自變量矩陣之間X的回歸系數矩陣。
由此可見,主成分回歸模型是對普通的最小二乘估計的改進,首先選取主成分,克服自變量間的多重共線性,然后對所選的主成分進行線性回歸,進而得到主成分回歸方程。
王家壩站系淮河上游總控制站,集水面積30630km2。上游干流河長360km,河道比降0.5‰,年平均降水量800~1200mm,且降水年際變化大,時空分布不均勻。年降水量的60%集中在5~8月,以6、7兩月暴雨次數較多。產生暴雨的主要天氣系統是西南低渦、切變線、低壓槽和臺風等?;锤缮嫌渭盎茨仙絽^一般是王家壩洪水的主要來源區。本項目主要針對息縣、潢川、班臺至王家壩區間(面積為7110km2)開展研究,見圖 2。
本研究以新安江模型為確定性預報模型,在此基礎上,采用PCA-HUP模型分別對上述模型預報的可靠度進行定量,并在淮河干流主要控制斷面王家壩進行了實際應用,采取滾動預報方式實現了洪水概率預報。
將新安江模型的預報結果與實測資料輸入PCA-HUP模型中,其中20場洪水用于相關參數的率定,8場洪水用于模型驗證。模型相關參數見表1。以置信度為90%(亦可采用其他置信度值)的預報區間為例,對概率預報結果進行評估,同時,對流量分布函數的中位數Q50進行分位數評價,率定期模型的模擬精度見表2。
由表2可知,PCA-HUP模型率定期模擬結果:預報區間(置信度為90%)覆蓋率較高,且離散度在0.2以內。此外,將每一時刻預報量概率分布的中位數預報與實測流量進行比較,確定性系數接近于1,洪峰誤差在1%以內,說明中位數預報的精度非常高,且從不同預見期的模擬過程線中可以看出,隨著預見期的逐漸增大,區間離散度呈現出遞增的趨勢。
采用驗證期8場洪水對概率預報模型進行檢驗,推求預報流量的概率分布,實現王家壩斷面的洪水概率預報。預報精度統計見表3,預報流量過程線以其中兩場為例,預報流量過程線如圖3~圖4所示。
由表3和2場洪水概率預報過程線可知,PCA-HUP模型(以新安江模型為確定性預報模型)提供的概率預報結果:預報區間(置信度為90%)覆蓋率在87%以上,且離散度在0.2以內,說明在相對較小的區間寬度內,預報區間仍然能夠覆蓋絕大多數實測數據,說明概率預報精度較高。此外,將每一時刻預報量概率分布的中位數預報與實測流量進行比較,確定性系數接近于1,洪峰誤差在1%以內,說明中位數預報的精度非常高,明顯高于新安江模型預報結果,充分體現了貝葉斯修正原理。從不同預見期的預報過程線中可以看出,隨著預見期的逐漸增大,區間寬度呈現出遞增的趨勢。

表2 PCA-HUP模型率定期模擬精度統計表(王家壩,Δt=2h)

圖2 王家壩斷面控制區域圖

表1 PCA-HUP模型參數表(王家壩)

圖3 a 19920505號洪水預報過程線圖(王家壩,Δt=2h)

圖3 b 19920505號洪水預報過程線圖(王家壩,Δt=6h)

圖3 c 19920505號洪水預報過程線圖(王家壩,Δt=12h)

圖4 a 19950707號洪水預報過程線圖(王家壩,Δt=2h)

圖4 b 19950707號洪水預報過程線圖(王家壩,Δt=6h)

圖4 c 19950707號洪水預報過程線圖(王家壩,Δt=12h)

表3 PCA-HUP模型驗證期概率預報精度統計表(王家壩,Δt=2h)
本文在貝葉斯預報系統(BFS)的基礎上,對其水文不確定性處理器(HUP)進行改進,提出改進的貝葉斯概率預報系統(PCA-HUP),PCA-HUP模型是在正態空間中對預報誤差進行分析,構造線性似然函數,推求預報流量的后驗分布,實現洪水概率預報。以淮河王家壩斷面的洪水預報為示例進行了應用研究,表明該方法不僅可以提供不同置信度的區間預報結果,還可以獲得精度更高的定值預報結果。
該方法可以與任何確定性的水文預報模型相耦合。作為示例,文中對相對誤差進行了正態假設,但研究方法不局限于此,同樣適用于誤差服從其他分布的情況。限于研究區的預報誤差特征,本文僅考慮了誤差均值隨流量量級的變化規律,相同思路亦適用于誤差方差等分布參數隨流量變化的情況■