DOI:10.16232/j.cnki.1001-4179.2025.06.009
0 引言
長江流域上中游已建調節能力強的大型水庫較多,其中長江上游(宜昌以上河段)已有大型水庫117座[1]。受水工程運行影響,進人長江中游的沙量大幅減少,受清水下泄和洞庭湖出流的共同影響,長江中游干流河段發生了顯著的形態動力學演變[2-3],對中游各主要控制站的水位流量關系產生了一定影響。
螺山站是長江中游的主要控制站,是中下游防洪規劃、河道泄洪能力研究以及洪水預報和防洪調度的重要依據[4-5],該站水位流量關系復雜且影響因素較多。目前針對螺山站的研究大多集中在水位流量關系的變化規律上[6],部分研究成果表明螺山站水位流量關系的影響因素包括下游變動引起的回水頂托[7-8]起漲水位[9]、洪水漲落率[0]、河段沖淤[]及江湖關系[12]等,均是提出一種校正公式對流量進行單值化處理,但公式難以表征各種因素對水位流量關系的復雜影響。
螺山站主要應用大湖演算模型[13]和一維水動力模型開展洪水預報,但二者均無法準確考慮湖區無控區間降雨產流規律和洞庭湖湖區對洪水的調蓄作用,且由于中下游水位流量關系為復雜的繩套曲線,難以賦予水動力模型準確的下邊界,在洞庭湖湖區來水較強時,模型預報精度均較低。隨著計算機技術的發展和算法的進步,基于數據驅動的機器學習方法逐漸應用到洪水預報中[14-15]。有學者研究采用神經網絡模型構建螺山站水位預報模型[16],但選用的影響因子是經過洞庭湖調蓄后的城陵磯(七)水文站(洞庭湖出湖水道七里山斷面)的流量,城陵磯(七)站與螺山站距離較近,模型預見期不足,難以模擬整場洪水過程。因此,分析螺山站水位流量關系的關鍵因子,并基于分析結果構建預報模型具有非常重要的研究意義。
支持向量回歸是較為成熟的機器學習算法,可將數據映射到高維線性空間解決非線性問題,已在徑流預報[17]、河道洪水預報[18]、水庫防洪承載力預報[19]等方面廣泛應用。2024年入梅后,受強降雨影響,洞庭湖水系多條支流發生超警洪水,螺山站水位快速上漲,7月3日出現洪峰水位 33.13m (超警戒 1.13m ),本文根據洪水期間螺山站及上下游代表站實際水位流量變化過程,分析螺山站水位流量關系的影響因子,再以2010年至2024年8月螺山站水位、流量實測點據支持向量回歸分析的結果為基礎,逐步增加因子并篩選關鍵影響因子,然后根據上游來水、區間降雨等因子利用支持向量回歸構建螺山站水位預報模型
1 研究區域概況和數據資料
螺山水文站位于湖北省洪湖市螺山鎮,上距洞庭湖出口 30.5km ,下距右岸入匯的陸水河 47.0km ,距左岸入匯的漢江 208.0km ,螺山站上下游水系及重要水文站點概化圖見圖1。

本文采用2010年至2024年8月螺山站下游干流漢口站、支流陸水水庫數據及螺山站實測水位、流量分析水位流量關系,再選取上游干流宜昌站、清江、洞庭“四水”代表站流量數據、洞庭湖區面平均雨量數據,構建螺山站水位預報模型,數據來自長江水利委員會水文局和相關省市水文部門等,數據清單詳見表1。
2 研究方法
(1)Spearman相關系數,即秩相關系數,反映兩個隨機變量之間變化趨勢的相關程度,計算公式為

式中: ρ 表示Spearman相關系數; d 表示兩個變量的秩差; N 表示序列長度。
(2)支持向量回歸(SVR)通過非線性變換將輸入樣本空間變換到高維線性空間,再進行回歸預測分析,能較好地分析變量間相關性,擬合方程見公式(2)。
f(x)=ωTφ(x)+b
式中: φ(x) 表示樣本空間到高維線性空間的非線性映射; ωT 為 n 維行向量; b 為常系數。
表1數據資料

注: ① 洞庭湖區面平均雨量根據區間代表雨量站通過泰森多邊形加權平均得到; ② 報汛流量是根據實測水位等利用關系曲線查算得到,實測流量是采用儀器測量等測流方式觀測得到,對于水位流量關系復雜的中下游地區,二者并不完全相同。
Vapnik等[20]引人不靈敏損失函數 ε ,忽略小于 ε 的擬合誤差。Amari等[21]為了處理函數 f 無法在精度ε 進行估計的數據,引人松弛變量 ξi 和 ξi* ,將公式(2)轉換為公式(3)的最優化問題,式中 Cgt;0 ,用于平衡函數復雜度和損失誤差。


利用拉格朗日乘子法求解公式(3),得到公式(4),式中 K(xi,xj) 為支持向量回歸核函數,常選用的核函數包括線性核、多項式核、高斯徑向基核函數。

式中: αi 和 αi* 為拉格朗日乘子,采用SMO算法[22]求解公式(4),得到的回歸函數為公式(5)。

式中: SV 表示拉格朗日乘子不為0的解; NNSV 為標準支持向量的個數。
(3)模型評價指標。采用決定系數 R2 評估模擬值與實測值的一致性,采用均方根誤差RMSE評估模擬誤差離散程度,采用平均絕對誤差 MAE 評估模擬值與實測值之間的平均偏差程度,計算公式如下。

式中: ymodel,i 為模型模擬值; yi 為實測值;
為實測平均值。
3螺山站水位流量關系關鍵影響因子分析
以漢口站水位代表下游干流河段頂托影響,陸水水庫出庫流量代表下游支流來水頂托影響,點繪2024年1~8月水位流量過程線和螺山站水位流量關系,見圖2\~3。

根據圖 2~3 可知:2024年1\~4月水情平穩,水位流量關系近似為單值線,漲水段水位流量關系相比退水段略偏右;5月,受兩湖來水增加影響,漢口站水位漲幅大于螺山站,兩站落差減少,螺山站水位流量關系左偏;6月 1~27 日,兩站落差增加,螺山站水位流量關系右偏回到1~4月關系線上;6月底至7月中旬,兩湖來水較大,螺山站與漢口站水位落差減少,水位流量關系左偏,另外,6月底至7月初陸水發生明顯洪水過程,也可能是導致螺山站水位流量關系左偏的原因;7月下旬后,下游水位消退,螺山站與漢口站水位落差增加,螺山站水位流量關系開始右偏,逐漸向5~6月關系線靠近。

綜合上述分析,考慮傳播時間,初步分析影響螺山站水位流量關系且非單值線的影響因子包括:螺山站水勢(用當前水位與前 6h 水位差表示)、螺山站與漢口站水位落差(同時水位落差、與漢口站前1d水位落差)、陸水水庫出庫流量(當前出庫流量、前1d出庫流量),即公式(9)。

其中,

式中: ZLS,t 為螺山站 χt 時刻水位, m;ΔZLS-HK,t 為螺山站與漢口站水位同時水位落差,
為螺山站與漢口站前1d水位落差, m;QLS,ι 為螺山站 χt 時刻流量, m3/s;ZHK,t 為漢口站 χt 時刻水位, m;QoutLU,t 為陸水水庫 χt 時刻出庫流量, m3/s 。
統計2010年1月至2024年8月螺山站實測水位流量、漢口站水位、陸水水庫出庫流量,如圖4所示。根據螺山站實測流量點據的時間抽取對應漢口站水位、陸水水庫出庫流量,得到公式(9)中影響因子序列。由于公式(9)中各因子與螺山站流量并非呈簡單線性關系,因此首先統計各因子與螺山站流量的Spearman相關系數 ρ ,分析各因子與螺山站流量變化趨勢的相關程度,結果見表2,根據分析結果,螺山站流量的最關鍵影響因子為螺山站水位,其余因子單獨與螺山站流量的相關程度不強。

表2螺山站流量單因素影響因子分析

雖然其余因子與螺山站流量變化趨勢的相關程度不強,但在與螺山站水位組合之后,可能會造成一定影響,由于組合后的影響并非呈簡單線性關系,因此采用支持向量回歸(SVR)構建響應函數。以螺山站流量與水位相關分析結果為基礎,逐個增加影響因子,根據 R2 、RMSE評價回歸分析結果,篩選其余關鍵影響因子。統計考慮不同影響因子進行支持向量回歸分析的結果見表3。根據表3可知,增加考慮漢口站同時水位落差再開展回歸分析時,回歸結果與僅考慮螺山站水位相比, R2 變大,RMSE變??;增加考慮前1d陸水水庫出庫流量時,回歸效果無明顯差別;增加考慮其他影響因子時,回歸效果變差。為直觀分析各組回歸模型對實測點據的擬合效果,統計各組模擬相對誤差,繪制回歸分析相對誤差箱線圖見圖5。根據圖5可知,增加考慮影響因子為前1d陸水水庫出庫流量時,異常點變少,因此,確定螺山站流量關鍵影響因子為螺山站水位、漢口站同時水位落差與前1d陸水水庫出庫流量,后兩者即為螺山站水位流量關系關鍵影響因子,且落差對水位流量關系的影響大于陸水來水影響。
4螺山站水位預報模型
4.1 影響因子分析
螺山站位于長江中游,河道比降小,且上游洞庭湖具有調蓄影響,來水經過調蓄后才會進入螺山斷面,參考大湖演算模型[1],將宜昌至螺山河段概化為大湖系統,入流包括干流宜昌站,清江高壩洲站,洞庭湖水系湘江湘潭站、資水桃江站、沅水桃源站、澧水石門站及湖區來水,出流為螺山站流量,考慮各站進入大湖系統的傳播時間,螺山站水位與各因子之間的響應函數為



QTJ,t-36,QTY,t-48,QSM,t-48,Qq,t)
式中: l 為計算時段長; Qvc 為宜昌站流量, m3/s QGBZ 為高壩洲站流量, m3/s;Qxr 為湘潭站流量, m3/s QTJ 為桃江站流量, m3/s : Qry 為桃源站流量, m3/s : Qsu 為石門站流量, m3/s;Qq,t 為區間流量, m3/s 。
根據螺山站水位流量關鍵影響因子篩選分析結果,螺山站流量影響因子為螺山站水位、漢口站同時水位落差與前1d陸水水庫出庫流量,另外,考慮區間降雨徑流平均響應時間約1d,公式(11)可轉換為



Iq,t×F×U,…,Iq,t-nl×F×U)
(n=24/l)
式中: Iq,t 為區間 ?t-l~?t 時段累計降雨量, mm;F 為區間面積, km2 : U 為單位轉換系數, 1/(l×3.6) 0
4.2 模型構建與驗證
4.2.1 模型構建
考慮數據報送情況,設置計算時段為 6h ,采用2010~2023 年實測數據,根據第2節分析的影響因子,提取輸入變量和響應變量,構建基于支持向量回歸的螺山站水位預報模型,模型訓練得到的參數 C= 100.02,ε=0.10 (線性核)。為驗證模型訓練效果,將前一時刻預報的螺山站水位作為下一時段初始條件,開展長系列預報,預報與實測的對比見圖6,整體預報的 R2 為 0.91,RMSE 為 1.1m ,基本可以準確預報水位的走向和洪峰水位的量級。但隨著預見期的延長,低水位預報與實況的偏差明顯增加,統計不同量級洪峰水位(局部水位極大值)預報誤差 eq 及峰現時差Δt ,繪制箱線圖見圖7。據圖7可知, eq 有 75% 以上的概率在 -1.00~0.75m 之間, Δt 的中位數和平均數近似為-1,有 75% 以上的概率小于5個計算時段(即30h),說明模型結構合理,在來水確定的前提下,長系列的預報結果具有一定參考意義。

考慮實際降雨預報及各支流來水預報的有效預見期,每7d進行1次水位預報,預測-模擬過程線及響應圖見圖8。以 0.2m 作為水位預報的允許誤差,根據實測水位和預報水位計算1~7d預見期及總體的合格率 ,MAE,R2,RMSE ,見表4。據圖8和表4可知,隨著預見期的延長,預報精度有所下降,但1~7d的R2 均在0.97以上,說明模型可以較好預報水位的變化趨勢,預見期 1~2d 預報合格率在 71% 以上,預見期1\~4d的 MAE 在 0.3m 以內,具有較高的參考價值。統計預見期1~7d不同量級洪峰水位預報誤差eq 及峰現時差 Δt ,繪制箱線圖見圖9。據圖9可知, eq 有 75% 以上的概率在 -0.2~0.3m 之間, Δt 的中位數和平均數近似為0,有 75% 以上的概率小于5個計算時段(即 30h ),計算洪峰水位預報的MAE約0.35m ,說明模型結構合理,對洪峰具有較高的預報精度。


表4訓練期(2010\~2023年)螺山站預見期1\~7d水位預報評價結果


綜合上述分析,認為模型結構及參數設置合理,可用2024年實測數據進行模型驗證。
4.2.2 模型驗證
利用2024年1~8月實測數據驗證模型可推廣性,同樣將前一時刻預報的螺山站水位作為下一時段初始條件,以7d為預見期,每7d進行1次預報,預測-模擬過程線及響應圖見圖10。根據2024年1~8月預報水位和實測水位,計算1~7d預見期及總體的合格率 、MAE、R2、RMSE ,見表5。從圖10中可直觀看出,過程預報整體精度較高,據表4~5可知,檢驗期不同預見期預報精度優于訓練期。統計檢驗期預見期1\~7d不同量級洪峰水位預報誤差 eq 及峰現時差 Δt

表5檢驗期(2024年1\~8月)螺山站預見期1\~7d水位預報評價結果

繪制箱線圖見圖11。據圖11可知, eq 有 75% 以上的概率在 -0.20~0.25m 之間, Δt 的中位數和平均數近似為0,有 75% 以上的概率小于3個計算時段(即18h ),計算洪峰水位預報的 MAE 約 0.29m ,上述分析說明模型具有較強的可推廣性,穩定性強,在1~7d預見期內具有較高的參考價值。

4.3 模型預報誤差分析
據圖12可知,檢驗期發生于2024年7月底的洪水過程預報結果明顯偏大,預報洪峰偏大約 0.8m ,針對該次洪水,從降雨和來水兩方面分析誤差較大的原因。受臺風“格美”影響,7月27~28日洞庭湖水系發生強降雨,降雨量實況圖見圖12。據圖12可知,7月27日降雨集中在洞庭湖和干流交界處及湘江,日雨量達 100mm 以上,模型計算時將洞庭湖水系支流、宜昌、高壩洲到螺山概化為一個大區,未能考慮降雨空間分布,無法反映湖區與干流交界處降雨引起的水位快速起漲和消落的影響,是導致模型出現偏差的原因之一[23]。另外,洪水期間,湖區水位較高(在警戒水位附近),支流來水較大,因此各支流來水到湖區的傳播時間變小,構建模型時未考慮傳播時間會動態改變,會導致預報洪峰偏后,在起漲段預報還會導致預報結果偏大,也是導致出現偏差的重要原因。實際開展預報作業時及時滾動,結合人工校正,可減小預報誤差。

5結論
本文基于Spearman相關分析、支持向量回歸篩選得到螺山站水位流量關系的關鍵影響因子為漢口站同時水位落差、下游支流陸水水庫前1d出庫流量。通過將宜昌、清江高壩洲、洞庭湖水系支流至螺山區間概化為一個系統,根據水量平衡初步分析螺山站水位的影響因子,結合水位流量關系關鍵影響因子,最終確定螺山站水位的影響因子為螺山站水位、漢口站同時水位落差、前1d陸水水庫出庫流量、干流宜昌站前1d流量、清江高壩洲站前 36h 流量、湘江湘潭站前1d流量、資水桃江站前 36h 流量、沅水桃源站前2d流量、澧水石門站前 2d 流量、區間前1d分段累計降雨。利用支持向量回歸,采用 2010~2023 年實測數據,構建螺山站水位預報模型。該模型預見期 1~7d 的 R2 均在0.97以上, 1~2d 預報合格率在 71% 以上, 1~4d 的 MAE 在 0.3m 以內, 1~7d 洪峰預報的MAE約0.35m,Δt 的中位數和平均數近似為0,模型結構合理,在7d預見期內具有較高的參考價值;檢驗期(2024年1\~8月)預報精度與訓練期類似,說明模型具有可推廣性。
總體來說,模型預報結果可為實際調度過程提供參考,但對于降雨集中在湖區與干流交界處的洪水過程可能會存在較大預報偏差,需滾動分析,結合人工經驗校正使用,以提高預報精度。
參考文獻:
[1]長江水利委員會.2024年長江流域水工程聯合調度運用計劃[R].武漢:長江水利委員會,2024.
[2]ZHOUM,XIAJ,LUJ,etal.Morphological adjustmentsinameander-ingreach of the middle Yangtze River causedby severe humanactivi-ties[J].Geomorphology,2017,285:325-332.
[3]LINF,XIA J,ZHOU M,et al.Morphodynamic evolution ina meander-ingreach of themiddle Yangtze River under upstream and downstreamcontrols[J].ProgressinPhysical Geography,2019,43(4):030913331984388.
[4] 李世強,鄒紅梅.長江中游螺山站水位流量關系分析[J].人民長江,2011,42(6):87-89.
[5] 柴元方,李義天,許煒陽,等.螺山站水位變化特征及其影響因素貢獻率分析[J].水電能源科學,2017,35(7):43-46,29.
[6] 吳瓊,張莉,曾雅立,等.長江中下游河段低枯水水位流量關系變化規律分析[J].人民長江,2023,54(2):55-62.
[7] 郭希望,陳劍池,鄒寧,等.長江中下游主要水文站水位流量關系研究[J].人民長江,2006,37(9):68-71.
[8] 曾明,穆青青,童冰星,等.長江來水對漢江中下游水位影響的量化分析[J].人民長江,2023,54(增1):45-49,67.
[9] 戴明龍,王立海,李立平,等.2020年長江螺山站水位流量關系分析[J].人民長江,2022,53(5):118-122,142.
[10]高兵役,李正最.洪水期水位流量關系繩套曲線的直接擬合[J].水文,1998(5):27-30.
[11]王超,王福良,李浩,等.涉河工程影響下長江中游河道演變及水力特性變化研究[J].水利水電快報,2023,44(2):48-54.
[12]李厚永,張潮,吳瓊.水位流量關系單值化分析綜合模型研究及應用[J].水文,2011,31(增1):152-153,157.
[13]鄒冰玉,李世強.大湖演算模型在螺山站單值化后的適應性分析[J].水文,2011,31(增1):140-142,147.
[14]李建柱,李磊菁,馮平,等.基于深度學習的雷達降雨臨近預報及洪水預報[J].水科學進展,2023,34(5):673-684.
[15]孫亞婷,楊陽,羅倩,等.基于LSTM模型的漢口水文站流量預測研究[J].水利水電快報,2025,46(2):26-30.
[16]謝作濤,張小峰,談廣鳴.長江螺山站水位預報研究[J].水電能源科學,2003,21(3):7-9.
[17]馮仲愷,付新月,紀國良,等.基于混合孿生支持向量機的徑流區間預測[J].人民長江,2024,55(4):95-102,117.
[18]黃華平,侯博,梁忠民,等.黃河中游吳堡一龍門段河道洪水概化預報研究[J].人民黃河,2018,40(6):34-37.
[19]王正華,包為民,孫逸群,等.基于回歸支持向量機的水庫防洪承載力預測模型研究[J].水文,2022,42(2):30-35.
[20]VAPNIKV,GOLOWICH SE,SMOLA A J. Support vector method forfunction approximation,regression estimation and signal processing[C]//Advances in Neural Information Processing Systems,1997:281-287.
[21]AMARI S,WU S.Improving support vector machine classifiers bymodifyingkernel functions[J].Neural Networks,1999,12(6) :783-789.
[22]PLATT J. Sequential minimal optimization :a fast algorithm for trainingsupport vectormachines[J].MicrosoftResearch,1998:4558132A.
[23]李潔,徐強強,王正華.考慮降雨空間異質性的洪水預報模型研究[J].人民長江,2023,54(增1):11-15.
(編輯:謝玲嫻)
Abstract:Thewaterlevel-dischargerelationshipatLuoshan Hydrological Stationiscomplex,whichposeschalengesfoaccuratewaterlevelforecasting.Enhancingforecastaccuracyandextendingthefectiveforecastperiodarepressngisuesthatnedto be addressed.Basedonthemeasured water leveland dischargedataandtheupstreamanddownstreamcontrolnodedata from 2010 to August2O24,Spearmancorrelationanalysis,support vectorregresionand waterbalanceanalysis methodwereusedtosystematicallyanalyzethekeyifluencingfactorsforthewaterlevel-dischargerelationshipatLuoshanStation.Basedontheanalysis results,a waterlevelforecasting modelwasconstructed.Resultsindicatethatthekeyinfluencing factorsof the waterlevel-dischargerelationshipatLuoshan Stationincludesimultaneous waterlevelchanges between HankouStationandLuoshan Station,and thedischargefromLushuiReservoirinthepreviousdayAditionalyfactorsafectingwaterlevelforecastsalsoinvolveinflows fromupstream tributariesandrainfallinDongtingLakearea inthepreviousday.Theforecasting modeldemonstrateshighaccuracy duringboththetrainingperiodandthetestperiodinthe1to7dayforecastperiod,andtheR-squaredisallaboveO97idicating thatthemodelcanbeappliedintheactualforecastingatLuoshan Station.Theresearchoutcomesproviderobusttechnical supportforfloodcontroloperationsintheChenglingjiarea,hilealsoofferingamethodologicalapproachforhydrologicalforecasting in complex river network areas.
Keywords:waterlevel-dischargerelationship;waterlevelforecasting;influencing factors;supportvectorregression;Luos han Station;Changjiang River Basin