石慶安,李 意,羅天文,王茂洋,趙朝彬,張健源
(1.黔東南水利投資(集團)有限責(zé)任公司,貴州 凱里 522601;2.貴州省水利水電勘測設(shè)計研究院有限公司,貴州 貴陽 550002)
洪水預(yù)報是保障水庫安全運行的重要非工程措施。洪水具有洪峰、洪量、洪水過程線三要素,洪峰在預(yù)報中是十分重要的組成部分。科學(xué)合理的年最大洪峰流量預(yù)測對指導(dǎo)水庫安全運行有一定的參考意義。黃金鳳等[1]將可公度和灰關(guān)聯(lián)模式識別法應(yīng)用在淮河流域魯臺子站和蚌埠站,表明2種方法在預(yù)報年最大洪峰有一定的參考價值。王占明[2]運用灰色模型分析海城水文站的大洪峰流量,指出GM(1,1)模型適用性好,結(jié)果較為可靠。唐英敏等[3]將小波-ANFIS模型應(yīng)用于張家莊水庫的年最大洪峰流量預(yù)測中,得出收斂速度較快,且精度較高的模型。宋潤虎[4]基于27項氣象因子數(shù)據(jù),運用多元線性回歸和逐步回歸方法,對年內(nèi)最大流量和出現(xiàn)時間進(jìn)行擬合。王文川等[5]基于水文序列數(shù)據(jù),運用投影回歸模型,預(yù)測年內(nèi)最大洪峰。另有采用周期分析法、均生函數(shù)等方法[6-7]。
在預(yù)測年最大洪峰方面都有所研究,模型也具有一定的適用性。年最大洪峰受自然地理、水文氣象、人類活動等諸多因素的綜合影響,有較大的不確定性。因此,為探究一種新的思路預(yù)報年最大洪峰流量,本文選擇平寨水庫為研究對象,基于目前國家氣候中心提供的130項氣象因子(88項大氣環(huán)流指數(shù)、26項海溫指數(shù)和16項遙相關(guān)指數(shù))和1952年~2019年年最大洪峰流量數(shù)據(jù),采用逐步多元回歸、支持向量機、BP神經(jīng)網(wǎng)絡(luò)、決策樹等方法研究平寨水庫年最大洪峰預(yù)報模型。
平寨水庫位于貴州省畢節(jié)市,在烏江最大支流三岔河的流域范圍內(nèi),是黔中水利樞紐工程的水源地,屬于水源地一級保護(hù)區(qū)。正常蓄水位為1 331 m,總庫容為10.89億m3,壩址以上集水面積3 492 km2。流域內(nèi)地形復(fù)雜、地勢高低懸殊,也是典型的喀斯特地貌,屬于亞熱帶季風(fēng)氣候區(qū),年平均氣溫為12.6~16.4 ℃,年平均降水量為946.8~1 655.0 mm。
分析顯示,平寨水庫年最大洪峰流量都在4月以后發(fā)生。本文選擇所有因子在預(yù)報年份1月~4月和上1年1月~12月的序列與實測歷年最大洪峰進(jìn)行相關(guān)性分析和逐步回歸分析。例如,歐亞緯向環(huán)流指數(shù)與年最大洪峰序列(1952年~2019年)計算相關(guān)系數(shù)時,則應(yīng)選擇1952年至2019年1月~4月的4個序列和1951年至2018年1月~12月的12個序列,共16個序列,分別與年最大洪峰流量序列計算相關(guān)系數(shù)。其余指數(shù)同理。
通過相關(guān)系數(shù)法選擇與實測洪峰序列相關(guān)系數(shù)絕對值大于0.25的全部因子,確保初選的因子和洪峰序列具有一定的相關(guān)性。然后,利用逐步回歸方法,以均方根誤差最小為目標(biāo),在F檢驗中達(dá)到0.05顯著性作為因子入選閾值,逐步加入方差貢獻(xiàn)大的因子,和剔除方差貢獻(xiàn)小的因子。
本文選擇逐步多元回歸、BP神經(jīng)網(wǎng)絡(luò)、支持向量機、決策樹4種方法作為平寨水庫年最大洪峰流量預(yù)報模型。逐步多元回歸與多元線性回歸最大的不同在于對于多個自變量x,并不全部納入方程,而是通過定義衡量自變量對因變量y重要性的指標(biāo),選出對y影響顯著的因子。逐步多元回歸[8-10]在挑選因子和水文預(yù)報方面有較多應(yīng)用,方法簡單實用。支持向量機是一種基于VC維和結(jié)構(gòu)化風(fēng)險最小理論的機器學(xué)習(xí)方法,在預(yù)測復(fù)雜性與非線性并存的水文系統(tǒng)中,預(yù)測精度高,模型泛化能力強[11-14]。決策樹的基本算法是貪心算法,從一個根節(jié)點開始,自上而下生成子集,構(gòu)造決策樹。決策樹可以有效將與預(yù)測目標(biāo)有效的價值信息提取出來,對預(yù)測目標(biāo)進(jìn)行分類和預(yù)測[15-16]。BP神經(jīng)網(wǎng)絡(luò)一般分為輸入層、隱含層、輸出層,基本元素是用感知機模擬神經(jīng)元,在模擬水文現(xiàn)象的非線性問題中應(yīng)用廣泛[17-18]。
為評價和對比各個模型的準(zhǔn)確性,根據(jù)GB/T 22482—2008《水文情報預(yù)報規(guī)范》[19],洪峰流量預(yù)報以實測值的20%作為許可誤差。當(dāng)預(yù)報值與實測值的差值絕對值小于許可誤差時,則該預(yù)報為合格預(yù)報。合格預(yù)報次數(shù)與預(yù)報總次數(shù)相比的百分?jǐn)?shù)為合格率。合格率大于85%,精度評定為甲級。合格率介于85%和70%之間,精度評定為乙級。合格率介于70%和60%之間時為丙級。計算公式為
(1)
(2)
REt=[|Yf(t)-Y0(t)|/Y0(t)]×100%
(3)
式中,Yf和Y0(t)分別為t時刻的實測值與預(yù)測值;mt為合格預(yù)報次數(shù);N為預(yù)報總時段數(shù);REt為t時刻的相對預(yù)報誤差。
通過采用2.1中所述預(yù)報因子挑選方法,共挑選出滿足條件的預(yù)報因子13個(見表1)。所選因子計算得到的相關(guān)系數(shù)中,上年5月的東亞槽位置指數(shù)的相關(guān)系數(shù)最高,為0.45,最低是本年2月的親漕區(qū)海溫指數(shù)為0.25。相關(guān)系數(shù)絕對值的平均數(shù)為0.31。各指數(shù)的相關(guān)性都不是很強,這也反映了年最大洪峰流量所受到氣候系統(tǒng)的影響十分復(fù)雜,是許多因素綜合影響的結(jié)果。

表1 平寨水庫預(yù)報因子篩選信息
從所挑選指數(shù)的時間分布來看,本年度有2個,上一年度共有11個,說明上一年度的氣候變化對本年的年最大洪峰流量影響較大。值得一提的是,汛期內(nèi)的指標(biāo)只有2個,且大部分指標(biāo)集中在秋冬季節(jié),可以推測平寨水庫的年最大洪峰流量受上一年度秋冬季節(jié)的大氣變化影響更多。
本文選擇逐步多元回歸、支持向量機、神經(jīng)網(wǎng)咯、決策樹4種方法作為模擬和預(yù)報平寨水庫年最大洪峰流量模型。在預(yù)報模型率定期和驗證期分段中,以率定期和檢驗期時段長度之比約為3∶1分割。因此以1958年~2004年為率定期,共47 a;2005年~2019年為檢驗期,共15 a。如表2所示,為各模型在率定期和驗證期預(yù)報合格率統(tǒng)計信息。圖1為各模型在率定期和驗證期模擬預(yù)報結(jié)果對比圖。

表2 各模型在率定期和驗證期預(yù)報合格率對比 %

圖1 各模型在率定期和驗證期模擬預(yù)報結(jié)果對比
從表2可以看出,在率定期各個模型的模擬能力都較好,率定期的合格率平均值為93.62%。所有模型的精度都達(dá)到了甲級(合格率大于85.00%)。決策樹合格率最高為100.00%,神經(jīng)網(wǎng)絡(luò)次之,合格率為95.74%;逐步多元回歸為91.50%;最差為支持向量機,合格率為87.23%。
在驗證期,整體的預(yù)報效果也較好,平均合格率達(dá)到73.33%,精度評定為乙級。神經(jīng)網(wǎng)絡(luò)在驗證期的預(yù)報效果最好,合格率達(dá)86.67%,精度評定為甲級。其次為逐步多元回歸,合格率為80.00%,精度評定為乙級。支持向量機的合格率為66.67%,精度評定為丙級。雖然決策樹模型在率定期合格率最高,但在驗證期是最低,為60.00%。
綜合率定期和驗證期的模擬效果來看,神經(jīng)網(wǎng)絡(luò)在率定期和驗證期的精度評定都達(dá)到了甲級,是4個模型中的最佳方案。其次較優(yōu)方案為逐步多元回歸,在率定期為甲級,驗證期為乙級。神經(jīng)網(wǎng)絡(luò)和逐步多元回歸可推薦作為平寨水庫年最大洪峰流量的預(yù)報模型。其余兩種模型僅作為一般參考。
本文基于130項氣象因子,構(gòu)建了神經(jīng)網(wǎng)絡(luò)、逐步多元回歸、決策樹、支持向量機這4種預(yù)報模型,結(jié)果表明,4種模型在驗證期和模擬期都有較好的效果,特別是神經(jīng)網(wǎng)絡(luò)和逐步多元回歸可以應(yīng)用于平寨水庫的年最大洪峰流量預(yù)報。這說明基于氣象因子做年最大洪峰流量預(yù)報是可行的,在科研中有一定的探索意義;同時,預(yù)報模型可以為水庫的安全運行、科學(xué)調(diào)度提供決策參考。
眾所周知,年最大洪峰流量的影響因素復(fù)雜多樣;而研究區(qū)域?qū)儆诘湫偷目λ固氐孛玻釉龃竽曜畲蠛榉辶髁康牟淮_定性。本文僅基于氣候系統(tǒng)的130項因子作為考慮因素,是不足以全面客觀地描述影響平寨水庫的年最大洪峰的諸多因素的,后期可繼續(xù)從考慮喀斯特區(qū)域特征等角度進(jìn)行深入研究。