關鍵詞:RF 模型;LSTM 模型;SWMM 模型;洪水模擬;市中圖分類號:P333.2;TV213.9 文獻標志碼:A doi:10.3969 / j.issn.1000-1379.2025.06.008引用格式:.基于 RF-LSTM 模型的城市洪澇積水模擬研究[J].人民黃河,2025,47(6):50-56.
Study on Urban Flood Simulation Based on RF?LSTM Model
HUANG Chuwen, GUAN Yongle,WANG Hongfa(School of Water Conservancy and Transportation, Zhengzhou University, Zhengzhou , China)
Abstract: As a result of the heavy rainfall, flooding remains in the later stages of the rainfall and may continue to cause harm and impact. In order to accurately predict the depth and duration of urban flooding and waterlogging, the RF?LSTM model was proposed to address the diffi? culty of simulating floods in the later stages of the heavy rainfall. Based on the SWMM model?simulated flood data in Zhengzhou City, China, the flood depths at three representative flooded points were simulated by using the proposed model, and the flooding process caused by rainfall under different recurrence periods was predicted. The results show that compared to the single LSTM model, the simulation accuracy of the RF?LSTM model has been improved, verifying the applicability of the model in flood simulation. The growth rates of flood duration and the maximum flood depth at flooded points are the highest under the 1-2 a return period, therefore the existing drainage system should be renova? ted or redesigned.
Key words: RF model; LSTM model; SWMM model; flood simulation; Zhengzhou City
0 引言
近些年來,隨著全球氣候變暖以及城市化進程加快,我國城市遭受洪澇災害的頻率和強度都呈現提高的趨勢[1]。 據估計,在21 世紀的前 20a ,全球洪水事件造成了超過 5 370 億美元的經濟損失,并影響全球近16 億人的正常生活[2]。 作為應對城市內澇問題的非結構措施的代表,洪水模擬在近幾十年來受到了較多的關注[3-4]。 許多基于水文學和水動力學原理的模型被提出并應用于城市洪水的預測,例如雨水管理模型(SWMM)、Info Works 綜合流域管理和 MIKE 軟件都是各具特色的經典模型[5-6]。 這些模型需要詳細的地理、水文和水力數據模擬洪水的物理過程,一旦不滿足要求,模型的性能就會受到影響。 同時,隨著計算機技術的進步和大量數據的積累,基于人工智能算法的機器學習模型被大量提出。 機器學習模型通過分析數據之間的相關性來捕獲數據變化的模式,而無須考慮具體水文過程,因此在洪澇積水預報的精度和速度上均具有優勢[7-8]。 機器學習模型的優勢還在于能夠避免主觀傾向對模型預測精度的影響,使得結果更加客觀,因此機器學習模型逐漸成為研究的熱點[9-10]。 例如,支持向量機、隨機森林和梯度提升決策樹等廣泛應用于非時間序列預測。 此外,具有外生輸入的非線性自回歸模型和長短期記憶模型是時間序列預測中廣泛使用的模型。 與非時間序列模型相比,時間序列模型可基于單獨變量實現對變量未來數據的預測,但是存在誤差累積的現象,因此預測精度會隨著預測時間的增加而降低。
城市洪澇主要是短歷時的強降雨造成的,因此使用降雨數據作為預測要素實現對洪水的預測是可行的。 短暫的強降雨之后洪水將持續存在一段時間,因此該方案面臨雨后期洪水預報的難題。 在雨后期,降雨要素不再影響洪澇退去過程,這意味著洪水深度由高位到干涸的過程是一個受洪澇地區地理結構影響的完整時間序列數據。 基于上述對洪澇積水深度數據特征的分析,若僅構建單一的時間序列或非時間序列模型,存在預測誤差積累和精度不佳的問題。 鑒于此,本研究基于洪水數據變化的特點,提出結合時間序列和非時間序列模型優點的隨機森林-長短期記憶(RF-LSTM)耦合模型,并通過對市部分內澇點洪水深度的預測,來驗證該模擬方法的可靠性。 具體步驟為:1)將洪水深度數據分為兩個階段,即降雨期和雨后期;2)使用 RF 算法和降雨數據構建非時間序列回歸模型來預測降雨期的洪水深度;3)基于 RF 回歸模型預測的數據,使用 LSTM 時間序列模型預測雨后期的洪水深度;4)使用 RF-LSTM 耦合模型預測不同重現期的洪水深度。 本研究提出一套有效的洪水深度預測方法以期解決雨后洪水預測困難的問題 為城市洪澇災害管理工作提供幫助。
1 研究區域概況與數據來源
1.1 研究區域概況
市坐落在華北平原南部,作為河南省的省會城市,2020 年常住人口已經超過1 260.1 萬人,建成區面積約為 1 010.3km2 。 市地勢由西南向東北逐漸降低(見圖1),呈現由山地到平原的過渡特征,因此中部及東部地區極易出現內澇積水事件。 市屬溫帶大陸性季風氣候區,四季分明,雨熱同期,雖然年平均降水量只有 632.4mm ,但是 60% 的降水集中在夏季的7—8月,并以短歷時強降雨為主,這使得市面臨較大的城市洪澇災害風險。 例如,2021 年 7 月,一場千年一遇的暴雨突襲,形成了嚴重的城市內澇,嚴重破壞了市的基建設施,直接經濟損失達409 億元。
圖 1 研究區域高程及內澇點分布
Fig.1 Study Area Elevation and Waterlogging Point Distribution

1.2 數據類型及來源
氣象降雨事件是城市洪澇積水形成的主要驅動因素,因此本研究采用的數據主要分為降雨數據和積水數據。
1)降雨數據:采用市 16 個雨量站觀測到的降雨時間序列數據,由雨量計在歷史降雨事件中測得。8 場歷史降雨數據均來自河南省氣象局,時間分辨率為 10min 。
2)積水數據:采用本研究團隊構建的 SWMM 模型根據歷史降雨數據模擬得到的洪水數據[11-12]。 構建的 SWMM 模型如圖2 所示,模型內置的各項參數已經得到一定的修正。
圖 2 研究區 SWMM 模型Fig.2 SWMM Model of Study Area

1.3 數據的處理
本研究將 SWMM 模型模擬的研究區洪水數據作為實例數據,并選取在歷史降雨背景下出現次數較多、積水數據過程完整、積水數據量充沛的 3 個積水點進行研究,3 個積水點分別被命名為內澇點 1、內澇點 2和內澇點3(即圖1 中紅圈標記的3 個內澇點)。
基于研究區的降雨和洪水數據,構建的數據向量為
(X,y)=(Ip,pt-n,…,pt-1,pt,qt,yt+l)
n=max(∣ΔTm∣)
式中: Ip 為 3 個內澇點的獨熱編碼, ΨtΨt 為時間變量, yt+l 為 ?t+l 時刻的洪水深度, l 為提前期, pt 和 qt 分別為降雨強度和累計降雨量, n 為數據變量, ΔTm 為第 m 場次雨洪數據中雨峰與洪峰之間的最大時間差。
qt 由下式計算得到:

2 研究方法
2.1 RF 模型
RF 模型是一種可用于分類或回歸任務的集成機器學習模型[13]。 RF 模型采用樹類結構算法,根據“集思廣益” 的思想將多個基礎決策樹的輸出進行整合(見圖3)。 與其他機器學習模型相比,RF 算法具有明顯優勢:1)RF 可以處理高維度自變量問題;2)能夠擬合和預測非線性問題;3)學習過程快,可以高效處理大量數據。 實現 RF 回歸模型的主要步驟如下:
1)基于 Boostrap 采樣的方式從輸入數據集中隨機提取 K 個數據集,這 K 個數據集的數據量與原始數據集的數據量是相等的。
2)假定隨機提取的每個數據集中的變量數為 M ,則從每個回歸樹的每個節點中隨機選擇 Mtry 變量作為替代分支變量,然后根據分支變量構建最佳的分支節點。
3)使用步驟 1)中的數據,基于步驟 2)的方式來訓練并生成多個基礎的決策樹模型。 最終,RF 模型的回歸輸出可由下式表示:

式中: Ktree 為基礎決策樹模型的總量, fi(x) 為決策樹模型基于輸入變量 x 的輸出結果。
圖 3 RF 模型結構Fig.3 RF Model Structure

2.2 LSTM 模型
LSTM 模型是循環神經網絡(Recurrent Neural Net?work,RNN)模型的一個重要分支,有效避免了 RNN 模型在梯度消失問題上的缺點[14]。 LSTM 的模型結構與大多數神經網絡相同,由輸入層、隱藏層和輸出層組成。 LSTM 模型中隱藏層的單元是一個線性自環存儲塊,包含自連接存儲單元的存儲塊,可以記憶時間狀態(見圖4)。 依賴3 種數據(傳輸門 it 、輸出門 ot 和遺忘門 ft )控制信息在記憶模塊內流入和流出,并允許長序列梯度的存在。 因此,LSTM 模型具有很強的適應時間序列長(靜態)項和短(循環)項動態特性的能力。
傳輸門 it 、輸出門 ot 和遺忘門 ft 都是 sigmoid 函數,可將每個輸入數據轉化到區間[0, 1]。 Φt 時刻的輸入特征數據由 χt 時刻的輸入數據 xt 和先前隱含層的輸入數據 ht-1 組成,可由下式表示:

最終,LSTM 模型的輸出可由下式表示:
ct=ftct-1+itgt
ht=ottanh(ct)
yt=σ(whyht+by)
式中: wxc?whc 和 why 為對應門的權重矩陣, bc 和 by 為相應的指數偏置向量。
圖 4 LSTM 模型結構Fig.4 LSTM Model Structure

2.3 RF-LSTM 耦合模型
洪澇積水事件是多因素共同導致的結果,而降雨事件是洪澇積水形成的主要驅動要素。 基于成因分析,降雨期間洪澇積水深度受降雨數據的影響較大,而降雨停止后,洪澇積水深度的變化則受內澇點下墊面結構的影響較大。 因此,綜合以上分析,可將洪澇積水數據分為降雨期的非時間序列數據和雨后期的時間序列數據。
基于洪澇積水深度的變化特性,采用不同的機器學習模型進行模擬(見圖 5),具體為:首先,使用 RF模型在輸入降雨數據的基礎上,實現對降雨期間洪澇積水深度的模擬;其次,使用 LSTM 模型在 RF 模型提供的降雨期洪澇積水深度數據的前提下,實現對雨后期的洪澇積水深度數據進行模擬。
圖 5 RF-LSTM 耦合模型結構Fig.5 RF?LSTM Coupling Model Structure

2.4 模型評估指標
模型評估是模擬預測過程中的重要步驟,為分析和評價模型預測結果的準確性提供重要的量化依據。為準確評估洪澇積水深度預測結果的合理性,平均相對誤差、Nash-Sutcliffe 效率系數和合格率(MRE、NSE和 QR)被選為模型的定量評價指標。 指標 MRE 的值越小,指標NSE 和QR 的值越大,則說明模型的性能優勢越大。 3 種評估指標的計算公式如下:



式中: dci 和 doi 分別為洪水深度數據的預測值和測量值,
為洪水深度數據測量值的平均值, c 和 n 分別為合格樣本數和總樣本數。
3 結果分析
3.1 基于 RF 模型的洪水深度模擬結果
通過時滯分析, n 被確定為 8,提前期 ξl 被確定為2,則式(1)被確定為
(X,y)=(Ip,pt-8,pt-7,…,pt-1,pt,qt,yt+2)
數據被加載到由 Python 編碼的 RF 回歸模型中。前5 場降雨、洪水數據作為訓練數據,剩余3 場數據作為測試數據,并命名為事件1、事件2 和事件 3。 RF 模型的主要參數為基礎樹的數量和樹的最大深度,由網格搜索算法來確定,兩個參數的取值分別為 50 和 10。基于 RF 模型模擬得到的降雨期洪水深度數據見表 1。例如,內澇點1 在時間編號為 2 時的洪水深度的實測值和模擬值均為 0m ,內澇點 2 在時間編號為 40 時洪水深度的實測值和模擬值分別為 0.68、0.66m 。
表 1 RF 模型的模擬結果
Tab.1 Simulation Results of RF Model

3.2 基于 LSTM 模型的洪水深度模擬結果
使用 LSTM 算法構建時間序列預測模型,并對降雨后的洪水進行預測。 LSTM 模型的參數決定著模型的預測性能。 本研究選擇關鍵參數(輸入窗口的大小和隱藏層的數量)進行人為調整及確定,而其他參數采用默認選項。 輸入窗口為 a×b 的形式,只考慮洪水深度的一維數據,因此 b 被定義為常數值 1。 為了達到最佳預測效果,同樣采用網格搜索算法對參數進行優化,確定輸入窗口的大小為 13×1 ,隱藏層的數量為8。 前5 次降雨事件的洪水深度數據作為訓練數據,剩余的 洪 水 深 度 數 據 作 為 測 試 數 據。 本 文 利 用TensorFlow 深度學習框架構建 LSTM 模型,通過使用具備最優參數且訓練良好的 LSTM 模型模擬雨后期的洪水深度數據(見表2)。
表 2 LSTM 模型的模擬結果

為了驗證上述方法的有效性,將 LSTM 模型與 RF模型進行比較。 將相同的數據應用于 RF 模型和LSTM 模型,LSTM 模型預測結果的 MRE 值較小,NSE更大(見表 3),表明 LSTM 模型對雨后期城市洪水深度的預測精度更高。
表 3 雨后期洪水深度數據模擬結果
Tab.3 Simulation Results of Flood Depth Data in

此外,還考慮了訓練數據對 LSTM 預測模型精度的影響。 在使用歷史數據進行訓練和預測后,使用 RF模型預測的洪水深度數據替代實測數據訓練 LSTM 模型。 利用不同訓練數據(分別來自 RF 模型和歷史數據)訓練的 LSTM 模型模擬了雨后期洪水深度的變化情況。 由兩種數據源訓練的 LSTM 回歸模型預測結果的 MRE 有所差異,前者的較小,但數值接近,說明LSTM 模型對時間序列的預測性能良好,可用于雨后期洪澇積水深度的模擬預測。
3.3 RF、LSTM 和 RF-LSTM 模型的模擬結果
降雨期 RF 模型、雨后期 LSTM 模型以及 RF-LSTM 耦合模型模擬的洪水深度的平均誤差分別為8.87% 、 9.77% 和 9.13% (見圖 6)。 同時,使用 NSE 和QR 來評估模型的效率和精度(見圖 7),RF-LSTM 模型的平均 NSE 為 0.96,RF-LSTM 模型的平均預測合格率為 90.3% 。 結果表明,本研究提出的方法在洪水預報中是有效且可行的。
圖 6 RF、LSTM 和 RF-LSTM 模型的 MREFig.6 MRE of RF, LSTM and RF?LSTM Models

為了更加直觀地展示洪澇積水深度模擬值和測量值之間的差異,通過間隔 10min 的系統采樣生成擬合曲線(見圖8)。 結果表明,RF-LSTM 耦合模型預測的洪澇積水數據與實測值具有很強的一致性。
圖 7 RF、LSTM 和 RF-LSTM 模型的 NSE 和 QRFig.7 NSE and QR of RF, LSTM and RF?LSTM Models

圖 8 積水深度模擬值與實測值的擬合曲線
Fig.8 Fitting Curve of Simulated and Measured Flood Depth

3.4 不同重現期下的洪水深度的預測
通過芝加哥暴雨方法和暴雨強度公式[見式(13)]設計了6 種不同重現期 (0.5,1,2,5,10,20a) 降雨過程線(見圖9)。 根據市的歷史數據確定降雨持續時間為 2h 。

式中: i 為降雨強度, χt 為降雨時間間隔, P 為降雨重現期。
圖 9 不同重現期降雨過程線Fig.9 Rainfall Process Curves of Different Return Periods

基于不同重現期的降雨數據,采用 RF-LSTM 耦合模型預測3 個內澇點的積水深度。 3 個點的積水深度和持續時間都隨著降雨重現期的增大而增加(見圖10)。 在20 a 重現期降雨下,3 個點的洪水最大深度分別達到 1.35,1.30,1.03m,3 個點的洪水持續時間分別為 138,132,134min 。
響,以0.5 a 重現期下的積水過程為基礎,分析各重現期降雨下洪水最大深度和洪水持續時間的增長率(見圖 11)。 20a 降雨重現期下,3 個內澇點的洪水最大深度分別增加了 98.5% 、 85% 和 114.5% ,洪水持續時間分別增加了 84% 、 76% 和 97.1% 。 無論是洪水最大深度還是持續時間,在 1~2 a 重現期內的增長率都是最高的。 尤其是內澇點2,在1~2 a 重現期內,洪水最大深度和持續時間增長率分別為 44.8% 和 38.2% 。 因此,改善或重新設計排水設施以減少洪水災害帶來的影響是必要的。
圖 10 不同重現期降雨下內澇點積水過程Fig.10 Water Accumulation Process of Waterlogging Point Under Rainfall with Different Recurrence Periods

為了進一步探討不同重現期降雨對各點洪水的影
圖 11 內澇點洪水最大深度和洪水持續時間的增長率
Fig.11 Growth Rate of Maximum Flood Depth and Flood Duration at Waterlogging Point

4 結論
本研究提出了一種 RF-LSTM 耦合模型用于城市內澇點的洪水深度模擬,重點解決雨后洪水深度模擬困難的問題。 與相關研究相比,所提出的方法具有 3個特點:1)考慮到雨后洪水的存在,洪水過程被分為兩個階段,即降雨期和雨后期;2)通過 RF-LSTM 模型分階段完整地預測洪水漲落的整個過程;3)同時利用非時間序列和時間序列模型的優勢,避免了使用單個模型的缺點,并提高了結果的準確性。 從理論上講,本研究提出的模型能夠適用于世界上任何洪水泛濫的城市,研究成果可為未來城市減災工作提供科學的數據支持和技術參考。
在研究區特定內澇點的應用表明,洪水深度數據的模擬結果與實際洪水過程非常一致,證實本研究所提出的方法是可行的。 對不同重現期降雨下3 個內澇點的洪水深度進行預測的結果表明,在相同降雨量下,不同內澇點的洪水深度和持續時間有所差異。 3 個內澇點的排水系統對 1~2 a 重現期降雨最為敏感,洪水深度最大值和洪水持續時間在1~2 a 重現期的增長率是最高的,尤其是內澇點2,這意味著排水系統需要翻新或重新設計。
本研究還存在一些需要改進的地方。 例如,存在實際洪水數據不足的問題,本研究使用的洪澇積水數據為 SWMM 模型模擬得到的數據,在后續的研究中應當加強數據的收集和管理工作,以驗證所提出模型對真實積水數據的應用效果。 此外,受模型參數設置和數據量的限制,所構建的洪水預測模型可能面臨過擬合問題。
參考文獻:
[1] 徐宗學,盧興超,施奇妙.城市暴雨洪澇災害特征與風險評估研究進展[ J].水利水電科技進展,2025,45( 1):1-9,46.
[2] WANG H F,GUAN X J,MENG Y,et al.Coupling Time andNon?Time Series Models to Simulate the Flood Depth atUrban Flooded Area [ J ]. Water Resources Management,2023,37(3):1275-1295.
[3] 程香菊,章宇達,田甜,等.山區縣域洪水預測研究:以陽朔縣為例[J].水文,2024,44(4):52-61.
[4] 嚴春麗.基于氣象的預測降雨數據在中短期洪水預報中的應用[J].云南水力發電,2023,39(3):55-58.
[5] 查斌,劉成帥,楊帆,等.基于 MIKE FLOOD 模型的城市洪澇災害場景推演研究[ J]. 人民黃河,2022,44( 11):53-58,65.
[6] 李智,張倩,蘭雙雙.基于 SWMM 和 LISFLOOD-FP 的城市內澇耦合模型研究[ J]. 水電能源科學,2024,42( 2):202-206.
[7] 代鑫,黃弘,汲欣愉,等.基于機器學習的城市暴雨內澇時空快速預測模型[J].清華大學學報(自然科學版),2023,63(6):865-873.
[8] 辛艷杰.基于機器學習的城市內澇模擬研究[D].大連:大連理工大學,2022:14-29.
[9] 劉揚,王立虎.基于改進 EMD-LSTM 的洪水預測方法研究[J].水利水電技術(中英文),2022,53(1):35-44.
[10] 崔雅博,羅清元,劉麗娜.基于改進非線性自回歸網絡的洪水預測算法[J].沈陽工業大學學報,2023,45(1):84-89.
[11] 王慧亮,吳澤寧,胡彩虹.基于GIS 與SWMM 耦合的城市暴雨洪 水 淹 沒 分 析 [ J]. 人 民 黃 河,2017,39 ( 8): 31 -35,43.
[12] 劉成帥,鄔強,胡彩虹,等.基于 SWMM 模型的海綿城市水文過程模擬及優化研究[J].氣象與環境科學,2022,45(6):59-66.
[13] PATEL V K, KUTTIPPURATH J, KASHYAP R. Rise inWater Vapour Driven by Moisture Transport FacilitatesWater Availability for the Greening of Global Deserts[ J].Science of the Total Environment,2024,946:174111.
[14] 畢成琳,劉匡,向征,等.洪水預報區域化 LSTM 模型研究[J].水電能源科學,2023,41(12):63-67.
【責任編輯 許立新】