999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LSTM的水文站流量短期預測建模差異性研究

2024-01-01 00:00:00喬長建劉震邰建豪
人民黃河 2024年6期

關鍵詞:LSTM;離散小波;水文預測;時頻分析;黃河流域

中圖分類號: TV11;TP181 文獻標志碼:A doi:10.3969/j.issn.1000-1379.2024.06.020

引用格式:喬長建,劉震,邰建豪.基于LSTM 的水文站流量短期預測建模差異性研究[J].人民黃河,2024,46(6):119-125.

水文預測對水資源規劃管理具有重要作用,尤其是流量短期預測對防災減災具有重大意義[1-3] 。然而,影響流量的參數在時間尺度和空間尺度上存在復雜的非線性特性,使流量短期預測存在較大困難[4] 。

當前對水文模擬預測的方法主要包括過程驅動法和數據驅動法[5] 。過程驅動法是以概化經驗模型或具有物理機制的水文模型為主,模型率定對各種水文數據的依賴性較強[6-8] ,需要考慮不同時空尺度的水文參數不確定性。數據驅動法主要以歷史水文數據為基礎,擬合出一個預測模型,無須考慮水文過程的物理機制。隨著機器學習技術的發展,數據驅動模型更加廣泛地運用于徑流研究中,如一些學者假設自變量與因變量間為線性關系,利用傳統時序建模方法(ARI?MA)[9] 、自回歸模型(AR)[10] 以及自回歸滑動平均模型(ARMA)[11] 進行建模;還有一些學者利用徑流序列的非線性特征進行建模, 如人工神經網絡模型(ANN)、支持向量機(SVM)等[12] 。

當前,深度學習是機器學習中的熱點[1] 。深度神經網絡最顯著的特征是多元神經網絡架構中的層,它提供了比非深度神經網絡更復雜的函數。針對序列數據的學習訓練,研究人員開始關注循環神經網絡(RNN)及其變體,并發現其具有較好的徑流時間序列預測性能。例如:Wang等[13] 使用RNN 進行氣象統計降尺度和氣象評估,證明其相對于傳統的ANN 模型有更高的擬合精度;蔡文靜等[14] 構建了基于經驗模態分解( EMD)、變分模態分解(VMD)、離散小波變換(DWT)的LSTM 子序列組合預測模型,其預測精度比單一序列預測模型的高。然而,圍繞機器學習的水文站流量預測研究主要集中在模型構建和參數選擇上,不同流域的氣候、海拔、地下水、降雨等因素各異,水文站流量的影響因子也不同,缺乏參數選擇對不同流域的神經網絡訓練模型預測結果影響的研究,導致基于機器學習的水文預測模型的適應性和推廣運用程度較低。因此,本文選用LSTM 模型,針對不同特征流域的水文站,研究預測模型在不同參數輸入時的預測精度,進而分析不同流域的建模差異性,以期提高水文預測模型的適應性。

1研究區概況

黃河發源于青藏高原巴顏喀拉山北麓約古宗列盆地,干流全長5464km,流域總面積79.5 萬km(含內流區面積4.2 萬km)。為驗證預測模型的可用性和精度,選取黃河流域3 個子流域(唐乃亥上游流域、汾河流域、花園口下游流域)作為研究對象(見圖1)。

唐乃亥上游流域屬于黃河源區,位于青藏高原東北部,其水資源與生態環境關乎整個黃河流域的水安全和區域發展。流域內大型水利設施較少,水文站測得的流量數據主要與氣候(雪山融化和降雨)有關,因此對該流域建模時可以忽略非氣候因素影響,圍繞水文站流量、氣溫和降水因子建立預測模型。汾河流域發源于山西省寧武縣管涔山,縱貫山西省中部,流經太原和臨汾兩大盆地,于萬榮縣匯入黃河,流域面積3.9471 萬km,河長693.8 km,年降水量變化大,沿岸地區每年從汾河取水24.3 億m,取水量占全省水資源利用總量的46%,下游河津水文站監測汾河流域入黃河的流量。花園口下游流域(花園口至利津)河段長期淤積,形成舉世聞名的地上“懸河”,黃河約束在大堤內,成為海河流域與淮河流域的分水嶺。除大汶河由東平湖匯入外,該河段無較大支流匯入。流域狹長,面積僅2.3 萬km,占黃河全流域面積的3%,因此可以忽略流域降雨產流因素,考慮上游流量建立流量預測模型。

2數據來源與研究方法

2.1數據來源

流量數據(各水文站2006年5月1日至2020 年11月25日流量)源自黃河水利委員會黃河水情網站。唐乃亥上游流域使用唐乃亥水文站監測數據,汾河流域使用河津水文站監測數據,花園口下游流域使用花園口、夾河灘、高村、孫口、艾山、濼口、利津7 個水文站監測數據。

降水量、氣溫數據源自NOAA Climate PredictionCenter發布的2006—2020年全球降水量、氣溫數據集,基于經緯度提取流域內各氣象站的數據,最終得到唐乃亥上游流域14個氣象站的降水量、氣溫數據,汾河流域35 個氣象站的降水量、氣溫數據,花園口下游流域14 個氣象站的降水量、氣溫數據。

2.2研究方法

3結果與分析

3.1各水文站流量時頻分析

2006年5 月1 日—2020年11 月25日唐乃亥、河津、利津水文站流量、氣溫、降水量數據統計結果見表1。唐乃亥、利津水文站為黃河干流水文站,日均流量較大;河津水文站為汾河支流水文站,日均流量較小。

對唐乃亥、河津、利津水文站日均流量的時序數據進行離散小波變換,分解為1 個逼近信號(A5)和5 個細節信號(D1、D2、D3、D4、D5),見圖3(上方第一行圖為原始日均流量—時間關系圖,第二行至第七行圖均為信號幅值—時間關系圖)。逼近信號保留原始流量的周期性特征,細節信號顯示出細節變化和噪聲等信息。如果一個信號分解出來的逼近信號周期性特征明顯,細節信號幅度越小,則信號的預測性越高。

分析圖3 可知,A5信號周期性特征的顯著性由高到低為唐乃亥>利津>河津,D1~D5 信號幅度由小到大為河津<唐乃亥<利津。D1~D5信號波動主要出現在原始流量序列波峰,波峰(汛期)預測受氣溫、降雨等因素影響較大。結合水文站地理環境、流域特點、日均流量時頻分析,初步推測:1)唐乃亥水文站在黃河上游,人類活動較少,主要受冰山融雪影響,因此流量變化更能表現出季節性(周期性)特征,預測模型僅依據歷史流量序列即可有較高的預測精度,若結合氣溫、降水量,則預測精度會更高。2)利津水文站在黃河下游,花園口至利津段流域狹長,受降水影響有限,受上游流量的影響較大,預測模型僅依據歷史流量序列的預測性較低,若結合上游流量,則預測精度會更高。3)汾河流域產流主要受地下水、降水的影響,河道流量小且受人類活動(灌溉、引水等)影響較大,因此其表現出弱周期性、較強隨機性,預測模型僅依據歷史流量序列時的預測性較低,結合降水、人類活動因素時應有較高預測精度。

3.2影響因子相關性分析

唐乃亥水文站處于黃河上游,流量的影響因子單一,因此選擇流域日均降水量、日均氣溫作為預測模型備選因子;河津水文站作為汾河流域出口,流量受流域產流影響較大,同樣選擇流域日均降水量、日均氣溫作為預測模型備選因子;利津水文站受上游流量影響較大,因此選擇上游水文站流量以及流域日均降水量、日均氣溫作為預測模型備選因子。利用Spearman 模型計算各水文站預測模型備選因子與流量的相關系數,唐乃亥水文站降水量、氣溫與流量的相關系數分別為0.52、0.69,河津水文站降水量、氣溫與流量的相關系數分別為0.60、0.03,利津降水量、利津氣溫、花園口流量、夾河灘流量、高村流量、孫口流量、艾山流量、濼口流量與利津流量的相關系數分別為0.17、0.41、0.68、0.70、0.74、0.79、0.84、0.92。最終,選用相關系數大于0.40 的備選因子作為預測模型的輸入因子進行訓練和預測。

3.3基于LSTM 的流量預測分析

3.3.1LSTM 模型建模

模型使用兩層LSTM 和一層全連接神經網絡,第一層LSTM 有100 個神經元,第二層LSTM 有50 個神經元。為避免過擬合,dropout 設置為0.2,訓練epochs為100,批大小為16,最終輸出水文站未來5 d 的日均流量。預測模型神經網絡結構見表2,表中參數個數為神經網絡層中權重矩陣和偏置向量的總和,輸出維度為神經網絡層提取特征的結構。

模型基于15 d 歷史數據預測未來5 d 的流量。根據3.2 節影響因子相關性分析,對于唐乃亥上游流域,設置兩種LSTM 輸入方案,方案一是輸入唐乃亥水文站15 d 歷史流量,方案二是輸入唐乃亥水文站15 d 歷史流量、流域日均氣溫、流域日均降水量;對于汾河流域,設置兩種LSTM 輸入方案,方案一是輸入河津水文站15 d 歷史流量,方案二是輸入河津水文站15 d 歷史流量、流域日均降水量;對于花園口下游流域,設置四種LSTM 輸入方案,方案一是輸入利津水文站15 d 歷史流量,方案二是輸入花園口、濼口、艾山、孫口、高村和利津共6 個水文站15 d 歷史流量、日均氣溫,方案三是輸入利津、濼口水文站15 d 歷史流量,方案四是輸入利津、花園口水文站15 d 歷史流量。LSTM 輸出為唐乃亥、河津、利津水文站未來5 d 的流量。

3.3.2預測結果分析

唐乃亥、河津、利津水文站未來5 d 流量預測結果分別見圖4、圖5 和圖6,預測精度見表3。對比不同方案的預測結果,方案一(均是單因子輸入)的預測值曲線在實測值曲線偏右,而其他多因子輸入方案的預測結果沒有出現波峰后移現象,說明輸入多因子可以提高模型綜合預測能力。方案一預測第5 d 的流量值總體明顯低于實測值,尤其是波峰位置,說明預測時間越長,預測精度越低;而其他多因子輸入方案預測第5 d的流量值比方案一的值高,精度明顯提升,說明引入外在影響因子能完善預測模型。

對比不同水文站的模型預測結果,唐乃亥水文站方案一第5 d 預測結果的NSE 達0.90,說明該水文站上游地區水文過程時序性較穩定,模型僅依據歷史流量序列就具有較高的預測性能,方案二進一步提高了預測精度。河津水文站方案一前2 d 預測結果的精度較高,第5 d 雖能預測出流量走勢,但對流量波動性擬合不足,這與汾河流量小、易受隨機因素影響相關,波峰位置預測值普遍低于實測值;方案二對波峰位置的流量預測精度明顯提升,但對波動小的流量擬合仍然不足,且第3 ~ 5d 訓練期預測結果的NSE 分別為0.82、0.79、0.73,對照驗證期預測結果的NSE 分別為0.63、0.52、0.39,說明模型出現過擬合現象,對模型輸入因子的考慮還不夠全面。利津水文站方案一第1 d的預測精度較高,第5 d 偏離較大;方案二考慮上游水文站的流量后,預測精度明顯提升,第5 d 預測結果的NSE 達到0.85;方案四第5 d 預測精度比方案三的高,說明上游水文站與利津站的距離影響預測精度,如花園口水文站距離利津水文站約570 km,若流速以2 m/ s計算,花園口的水將在3 d 左右流到利津,根據花園口水文站流量可預測利津水文站未來3 d 的流量,即距利津水文站越遠,未來能預測更長時間的流量。

4結論

本文基于黃河不同子流域特點選擇3 個水文站進行流量預測對比,用離散小波變換對波形差異進行時頻分析,基于LSTM 進行短期流量預測建模。通過對比分析,得出以下結論:

1)僅利用自身流量因子訓練得出的水文站預測模型易出現平移預測,即預測值曲線在實測值曲線偏右,且流量穩定時期預測精度高、波峰時期預測精度低。

2)唐乃亥水文站的上游流域受人類活動影響小,其流量的時序數據周期性好,波形穩定,預測模型可以基于自身歷史流量序列進行建模,具有較高的預測精度。

3)受上游影響較大的干流水文站,模型僅依據水文站歷史流量的預測性較低,輸入上游多因子進行建模后,模型精度有所提高。采用距預測水文站較遠的上游水文站流量數據進行建模時,可預測更長時間的流量。

主站蜘蛛池模板: 99视频精品在线观看| 亚洲国产欧美自拍| 亚洲成年人片| 国产偷国产偷在线高清| 四虎国产精品永久一区| 国产XXXX做受性欧美88| 国产超碰在线观看| 亚洲高清无在码在线无弹窗| 亚洲色大成网站www国产| 伊人激情综合| 国产精品妖精视频| 暴力调教一区二区三区| 日韩在线欧美在线| 欧美一级黄片一区2区| 欧美日韩激情在线| 国产91色在线| 国产成人亚洲欧美激情| 国产又色又爽又黄| 国产精品亚洲αv天堂无码| 国产美女精品在线| 亚洲综合国产一区二区三区| 91口爆吞精国产对白第三集| 欧美另类图片视频无弹跳第一页| 中文字幕资源站| 日韩毛片免费| 一本大道AV人久久综合| 国产网站免费观看| 91在线精品麻豆欧美在线| 青青草国产在线视频| 中文精品久久久久国产网址 | 国产无人区一区二区三区| a天堂视频| 精品综合久久久久久97超人该| 人妻91无码色偷偷色噜噜噜| 无码日韩视频| 国禁国产you女视频网站| 免费可以看的无遮挡av无码| 91久久偷偷做嫩草影院| 精品国产美女福到在线不卡f| 亚洲AV无码乱码在线观看代蜜桃| 国产在线欧美| 国产人成午夜免费看| 久久国产拍爱| jizz国产视频| 国产Av无码精品色午夜| 992tv国产人成在线观看| 欧美在线一二区| 波多野结衣一区二区三区88| 国产91在线免费视频| 凹凸精品免费精品视频| 真实国产精品vr专区| 欧美色视频日本| 欧美另类第一页| 精品视频一区在线观看| 91无码人妻精品一区二区蜜桃| 91小视频版在线观看www| 91美女视频在线观看| 天堂va亚洲va欧美va国产| 国产亚洲精品91| 日韩av手机在线| 国产91透明丝袜美腿在线| 亚洲中文字幕精品| 国产精品部在线观看| 欧美色丁香| 久久综合九九亚洲一区| 免费A级毛片无码无遮挡| 欧美高清三区| 亚洲综合精品香蕉久久网| 五月婷婷综合在线视频| 日韩视频精品在线| 欧美成人精品一级在线观看| 一本色道久久88综合日韩精品| 亚洲高清日韩heyzo| 国产成人精品综合| 久久香蕉国产线看观看式| 视频一本大道香蕉久在线播放 | 日本伊人色综合网| 国产h视频免费观看| 99re在线免费视频| 国产精品久久久久久久久久久久| 久久香蕉国产线看观| 国产高清在线丝袜精品一区|