999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多模型集成的和田河流域中長(zhǎng)期融雪徑流預(yù)測(cè)

2025-07-08 00:00:00劉東琪何厚軍邱禹王蕊李勝陽(yáng)王文
人民長(zhǎng)江 2025年5期
關(guān)鍵詞:融合模型

0 引言

融雪徑流是西北干旱區(qū)水資源的重要組成部分,中長(zhǎng)期融雪徑流預(yù)測(cè)在西北地區(qū)水資源分配與調(diào)度、洪澇災(zāi)害防御、灌溉以及發(fā)電等方面起著重要作用。目前在寒區(qū),融雪徑流中長(zhǎng)期預(yù)測(cè)的方法種類繁多,根據(jù)是否考慮物理因素,預(yù)報(bào)方法可大致分為基于數(shù)據(jù)驅(qū)動(dòng)的方法和基于物理成因的方法兩大類。基于物理成因的方法又可分為基于度日因子的經(jīng)驗(yàn)?zāi)P秃突谖镔|(zhì)與能量平衡的物理模型。目前對(duì)于寒區(qū)的融雪徑流預(yù)報(bào)研究主要集中于基于物理成因的預(yù)測(cè)方法上,采用的模型包括 SRM模型[]、HBV 模型[2]及SWAT模型[3]等。而數(shù)據(jù)驅(qū)動(dòng)模型在融雪徑流穩(wěn)定的地區(qū)往往具有較好的適應(yīng)性,在融雪徑流的中長(zhǎng)期徑流預(yù)測(cè)中被廣泛應(yīng)用。Wang等4基于遙感數(shù)據(jù)和大氣再分析資料,建立了隨機(jī)森林模型(RF)和人工神經(jīng)網(wǎng)絡(luò)模型(ANN)對(duì)西祁連西營(yíng)河流域的徑流進(jìn)行模擬,且通過(guò)引人積雪遙感數(shù)據(jù),有效提高了融雪徑流機(jī)器學(xué)習(xí)模擬的精度。Chen等[5]建立了一種名為外生正則化網(wǎng)絡(luò)的深度學(xué)習(xí)模型(ERNet),并將其應(yīng)用于烏魯木齊1號(hào)冰川的融雪徑流模擬,而后將ERNet模型與基本DL模型(LSTMS)和基于過(guò)程的水文模型(FLEXG)進(jìn)行了比較,結(jié)果表明ERNet模型不僅在徑流和峰值流量模擬中表現(xiàn)良好,而且具有更好的可轉(zhuǎn)移性。Pham等[展示了隨機(jī)森林模型在西北太平洋86個(gè)有融雪流域提前1d預(yù)測(cè)徑流的潛力。

由于每個(gè)模型的特點(diǎn)不同且各有優(yōu)勢(shì),許多研究者發(fā)現(xiàn)通過(guò)合適方式將多個(gè)模型結(jié)合,能夠有效克服單個(gè)模型的缺點(diǎn),使徑流預(yù)報(bào)的準(zhǔn)確性與時(shí)效性得到有效提高[7]。融合算法作為一種集成學(xué)習(xí)技術(shù),可以將多個(gè)不同的預(yù)測(cè)模型組合成一個(gè)更強(qiáng)大的模型。Tiwari等8借助自舉和小波人工神經(jīng)網(wǎng)絡(luò)(ANN)來(lái)預(yù)測(cè)每日河流流量,結(jié)果表明,混合小波自舉ANN模型比單個(gè)ML模型提供了更好的預(yù)測(cè)效果。Li等[9]使用支持向量機(jī)(SVM)和 MLR作為弱學(xué)習(xí)器,基于Bag-ging方法構(gòu)建融合模型,結(jié)果表明,包括袋裝SVM和袋裝MLR在內(nèi)的集合方法均優(yōu)于單個(gè)模型。周研來(lái)等[10]借助GammaTest數(shù)據(jù)挖掘方法,通過(guò)整合3種神經(jīng)網(wǎng)絡(luò)模型構(gòu)建的集成模型,應(yīng)用于長(zhǎng)江上游流域的洪水預(yù)測(cè),顯著增強(qiáng)了入庫(kù)洪水預(yù)測(cè)的準(zhǔn)確性,防止了模型的過(guò)擬合。

然而,在集成預(yù)報(bào)模型領(lǐng)域,融合算法通常采用加權(quán)平均或投票法結(jié)合相同的學(xué)習(xí)器,未能充分考慮到模型結(jié)構(gòu)差異性和單樣本誤差對(duì)整體權(quán)重的影響,導(dǎo)致模型易出現(xiàn)過(guò)擬合現(xiàn)象[1-13]。針對(duì)這一問(wèn)題,本文采用集成多種不同基學(xué)習(xí)器的Stacking融合算法,它最早由Wolpert于1992年提出,強(qiáng)調(diào)了模型多樣性對(duì)于提高預(yù)測(cè)性能的重要性。近年來(lái),堆疊方法不斷發(fā)展,并與特征選擇、超參數(shù)優(yōu)化等技術(shù)相結(jié)合,形成了多種變體,顯著提高了模型的準(zhǔn)確性和魯棒性。因此,本文首先采用支持向量回歸模型、隨機(jī)森林模型、多元回歸模型的統(tǒng)計(jì)相關(guān)方法,建立單一徑流預(yù)報(bào)模型,再基于Stacking融合算法對(duì)上述模型進(jìn)行集成,建立多模型集成的融雪徑流預(yù)報(bào)模型,進(jìn)行和田河流域典型斷面月徑流預(yù)測(cè)

1 研究區(qū)概況與數(shù)據(jù)

和田河流域位于新疆西南部、塔克拉瑪干沙漠南緣,由分別發(fā)源于昆侖山北坡和喀喇昆侖山北坡的喀拉喀什河和玉龍喀什河兩條支流匯合而成,并最終匯入塔里木河。和田河流域面積約 48 870km2 ,兩條支流喀拉喀什河和玉龍喀什河徑流補(bǔ)給均以冰雪融水、降水為主,地下水補(bǔ)給為輔,水量集中分布在汛期。夏季6\~8月水量占全年的 70% 以上,1\~2月份水量最枯。喀拉喀什河中游河段有一座具有灌溉、防洪、發(fā)電、改善生態(tài)等綜合效益的大(2)型水利工程烏魯瓦提水庫(kù)。同古孜洛克水文站位于玉龍喀什河出山口處,距離上游水文站約 80km ,是玉龍喀什河水量控制站。流域地理位置與水系分布如圖1所示。

圖1和田河流域地理位置及水系分布Fig.1Geographic location and distribution ofwatersystemsofHetian RiverBasin

流域融雪徑流預(yù)報(bào)使用了以下數(shù)據(jù): ① 徑流數(shù)據(jù)。烏魯瓦提水庫(kù)徑流數(shù)據(jù)( 1957~2023 年)同古孜洛克水文站( 1962~2023 年)徑流數(shù)據(jù)。 ② 積雪數(shù)據(jù)。研究中所用到的積雪8d合成數(shù)據(jù)(MOD10A2)來(lái)源于美國(guó)EOS/MODIS數(shù)據(jù)中心[14(http: 11 nsidc.org/data/modis/data_summaries/index.html),選取時(shí)間序列為 2001~2020 年,空間分辨率為 500m×500m :DEM高程數(shù)據(jù)源于日本METI和美國(guó)NASA聯(lián)合研制的 ASTER DEMV3 數(shù)據(jù)產(chǎn)品[15](https://gdemdl.as-ter.jspacesystems.or.jp/index_en.html),空間分辨率為30m×30m ,經(jīng)過(guò)鑲嵌拼接和裁剪等處理得到流域的高程數(shù)據(jù)。 ③ 氣象數(shù)據(jù)。采用全球集合預(yù)報(bào)數(shù)據(jù)TIGGE 數(shù)據(jù)[16](https : 11 www. ecmwf. int/en/research/projects/tigge),并下載處理中國(guó)氣象局國(guó)家氣候中心發(fā)布的130項(xiàng)大尺度氣象-氣候指數(shù)數(shù)據(jù)集[17],選取時(shí)間序列為 2000~2023 年(http: // cmdp. ncc - cma.net/Monitoring/cn_index_130.php)。

2 研究方法

在塔里木河流域(和田河是該流域的一條主要支流),冰川融水與積雪融水均是主要的徑流來(lái)源,冰川融水對(duì)年徑流的貢獻(xiàn)率為 40% 左右,積雪融水對(duì)年徑流的貢獻(xiàn)率為 25% 左右[18-19]。在采用積雪數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)徑流模擬的過(guò)程中,將冰川徑流與積雪徑流等多種徑流成分均考慮為融雪徑流的組成成分,作為整體進(jìn)行模擬預(yù)測(cè),并未區(qū)分每個(gè)部分徑流成分與徑流量[20-21]。故在本研究中對(duì)冰川融水和積雪融水不做劃分,將所有徑流成分均視為融雪徑流量進(jìn)行模擬并作為最終輸出。

融雪徑流的中長(zhǎng)期徑流預(yù)報(bào)包括3部分:主要影響因子篩選、預(yù)報(bào)模型構(gòu)建與來(lái)水預(yù)報(bào)。流域的融雪徑流受到多方面因素的影響,這些因素之間又具有復(fù)雜的相互關(guān)系。中長(zhǎng)期預(yù)報(bào)需要全面考慮各方面因素影響,根據(jù)流域的自然地理、氣候氣象、水利工程等各方面實(shí)際情況,合理篩選預(yù)報(bào)因子。王迎春等[22基于MODIS積雪數(shù)據(jù)和實(shí)測(cè)流量數(shù)據(jù),探究西天山某流域的年際和年內(nèi)積雪覆蓋率、雪線高度的變化規(guī)律,以及這些參數(shù)與徑流量之間的相關(guān)性。結(jié)果表明,不同高程分帶積雪覆蓋率、雪線高度與次年徑流量線性相關(guān)。EINino和LaNina事件、西太平洋副熱帶高壓等氣候因子與中國(guó)江河水文過(guò)程之間關(guān)系較為密切,其異常現(xiàn)象將會(huì)對(duì)境內(nèi)的水文循環(huán)產(chǎn)生不同程度的影響[23]故在本文中同樣將基于積雪期各分帶積雪覆蓋率與雪線高度等數(shù)據(jù),連同獲取的實(shí)測(cè)數(shù)據(jù)(前期徑流量、前期百項(xiàng)氣候指數(shù)等),構(gòu)建從起始預(yù)報(bào)年/月份對(duì)應(yīng)的前一年各月降水、氣溫、積雪、徑流、百項(xiàng)氣候指數(shù)預(yù)報(bào)因子池,采用相關(guān)性分析和主成因分析(PCA)等方法,篩選出 10~15 項(xiàng)主要預(yù)報(bào)因子集,作為多元回歸分析、支持向量回歸分析和隨機(jī)森林方法的輸入因子,構(gòu)建單一模型各月預(yù)報(bào)方案,而后通過(guò)Stacking融合算法將3種模型進(jìn)行集成,進(jìn)而得出可靠準(zhǔn)確的徑流預(yù)報(bào)方法。

通過(guò)主成分分析(PCA)可識(shí)別出關(guān)鍵預(yù)測(cè)因子。多元回歸分析則揭示了因變量與多個(gè)自變量間的關(guān)系,提供了對(duì)數(shù)據(jù)變化的深人理解。同時(shí),支持向量機(jī)(SVM)分析的應(yīng)用增強(qiáng)了模型處理高維數(shù)據(jù)和捕捉非線性關(guān)系的能力。另外,隨機(jī)森林分析的加入加強(qiáng)了模型抗噪聲能力,并避免了模型出現(xiàn)過(guò)擬合的現(xiàn)象。最終,融合算法成功發(fā)揮了各單個(gè)模型的特長(zhǎng),從而顯著提升了整體模型的預(yù)測(cè)精度并減少了預(yù)測(cè)誤差。這種綜合方法不僅提高了預(yù)報(bào)的準(zhǔn)確性,還增強(qiáng)了模型的泛化能力和對(duì)未知數(shù)據(jù)的預(yù)測(cè)性,使得徑流來(lái)水量預(yù)測(cè)更為科學(xué)和可靠。

2.1 主成分分析

由于寒區(qū)冰川融水的徑流量受到眾多氣象因子影響,故在構(gòu)建預(yù)測(cè)模型之前,預(yù)測(cè)因子的篩選顯得尤為重要。在眾多篩選方法之中,主成分分析法能夠有效處理因子冗余和信息重疊,故本研究采用主成分分析法來(lái)確定預(yù)測(cè)因子。

主成分分析(PCA)是一種被廣泛應(yīng)用的數(shù)據(jù)降維技術(shù)和統(tǒng)計(jì)分析方法[24]。該方法的主要功能是將復(fù)雜的高維數(shù)據(jù)簡(jiǎn)化為更緊湊的低維表示,同時(shí)維持原始數(shù)據(jù)的關(guān)鍵信息不丟失。設(shè)初始變量集為 X(X 由p 維變量 x1,x2,…,xp 組成),新的變量集為Y(Y由 ?m 維變量 y1,y2,…,ym 組成),且 m 小于 p 。則主成分分析原理可表示為

Y=AX

式中: A 為系數(shù)矩陣。

2.2 單一數(shù)據(jù)驅(qū)動(dòng)預(yù)報(bào)模型

2.2.1 多元回歸模型

多元回歸分析是一種統(tǒng)計(jì)方法,用于探究多個(gè)自變量與一個(gè)因變量之間的關(guān)系。當(dāng)回歸模型中僅包含一個(gè)自變量時(shí),稱之為簡(jiǎn)單回歸模型;若包含兩個(gè)或更多自變量,則稱之為多元回歸模型[25]。假設(shè)因變量用y 表示,自變量集合為 x1,x2,…,xk ,表達(dá) y 如何受這些自變量及一個(gè)隨機(jī)誤差項(xiàng) ε 影響的關(guān)系式即為多元回歸模型。該模型的普遍表達(dá)式為

y=B0+B1x1+B2x2+…+Bkxk

式中: B0,B1,B2,…,Bk 是模型的參數(shù); ε 為誤差項(xiàng)。

2.2.2 支持向量回歸模型

支持向量回歸模型是一種用于回歸分析的機(jī)器學(xué)習(xí)模型,其原理為支持向量機(jī),是試圖找到一條曲線,使得盡可能多的數(shù)據(jù)點(diǎn)落在曲線的某個(gè)特定范圍內(nèi)[26]。其旨在尋找一個(gè)能夠較好地預(yù)測(cè)數(shù)據(jù)的函數(shù),同時(shí)盡量減少模型的復(fù)雜度,以避免過(guò)擬合。該模型能夠使結(jié)構(gòu)風(fēng)險(xiǎn)最小并提高模型的泛化能力[27]。該模型的目標(biāo)函數(shù)為

式中: 為超平面的權(quán)重向量; x 為輸人特征向量; y 為實(shí)際值 ?f(?x) 為預(yù)測(cè)值; ε 為控制模型容忍誤差的參數(shù); C 為正則化參數(shù)。

2.2.3 隨機(jī)森林模型

隨機(jī)森林是 Breiman[28]于2001 年提出的一種袋裝法與分類回歸樹(CART)相結(jié)合的并行增強(qiáng)機(jī)器學(xué)習(xí)算法。該算法的核心由兩部分構(gòu)成: ① 通過(guò)對(duì)原始數(shù)據(jù)集進(jìn)行Bootstrap抽樣形成多個(gè)訓(xùn)練樣本子集; ② 基于這些子集構(gòu)建多個(gè)子回歸模型,通常采用的是決策樹。這些子模型獨(dú)立地進(jìn)行預(yù)測(cè),并通過(guò)計(jì)算所有子模型預(yù)測(cè)結(jié)果的平均數(shù)來(lái)綜合得出最終的預(yù)測(cè)輸出結(jié)果[23,29] 。基于Bootstrap抽樣和特征隨機(jī)選擇的原則,隨機(jī)森林模型試圖構(gòu)建一個(gè)由多個(gè)決策樹模型組成的復(fù)雜系統(tǒng),每個(gè)樹模型都在數(shù)據(jù)的隨機(jī)子集上獨(dú)立訓(xùn)練。

2.3 基于Stacking算法的集成模型

Stacking算法于1992年由Wolpert[30]提出,被廣泛應(yīng)用于多種學(xué)習(xí)器的融合。算法的主要原理可簡(jiǎn)要概述為:將第一層學(xué)習(xí)器的輸出結(jié)果當(dāng)作新特征,輸入給第二層學(xué)習(xí)器,而后以此類推,最終得到輸出結(jié)果,實(shí)現(xiàn)模型的堆疊[31]。在兩層Stacking算法中,第一層學(xué)習(xí)器被稱為基學(xué)習(xí)器,第二層學(xué)習(xí)器被稱為元學(xué)習(xí)器,即將基學(xué)習(xí)器的輸出結(jié)果作為元學(xué)習(xí)器的輸入特征[32]。為了從不同方面來(lái)對(duì)數(shù)據(jù)進(jìn)行分析,基學(xué)習(xí)器的選擇可以考慮性能優(yōu)異的算法,元學(xué)習(xí)器的選擇可以考慮結(jié)構(gòu)較為簡(jiǎn)單且泛化能力較強(qiáng)的算法,來(lái)對(duì)基學(xué)習(xí)器的輸出誤差進(jìn)行修正[11]。本文選取的基學(xué)習(xí)器為多元回歸算法、支持向量回歸算法和隨機(jī)森林算法,元學(xué)習(xí)器選取Ridge回歸算法。算法原理如圖2所示。

Fig.2Schematic diagram of the principle of Stacking algorithm

本研究考慮到數(shù)據(jù)集的長(zhǎng)度,將采用三折交叉檢驗(yàn)[]來(lái)對(duì)單一模型進(jìn)行檢驗(yàn)。首先將數(shù)據(jù)集劃分為訓(xùn)練集與測(cè)試集,對(duì)于訓(xùn)練集劃分為三折,選擇其中一折作為驗(yàn)證集,使用剩下兩折對(duì)模型進(jìn)行訓(xùn)練,基于訓(xùn)練后生成的模型來(lái)對(duì)訓(xùn)練集中的驗(yàn)證集進(jìn)行預(yù)測(cè),每次交叉檢驗(yàn)后對(duì)于驗(yàn)證集的預(yù)測(cè)值采取直接合并的方法,構(gòu)成第二層學(xué)習(xí)器訓(xùn)練集的輸人特征。同時(shí)基于訓(xùn)練后生成的模型來(lái)對(duì)測(cè)試集進(jìn)行預(yù)測(cè),多次交叉檢驗(yàn)后將測(cè)試集的預(yù)測(cè)值采取平均的方法進(jìn)行合并,構(gòu)成第二層學(xué)習(xí)器測(cè)試集的輸入特征。每一個(gè)模型都按照上面的方法運(yùn)行一遍,最終將多個(gè)模型輸出的驗(yàn)證集預(yù)測(cè)值合并作為第二層學(xué)習(xí)器的訓(xùn)練集,對(duì)第二層學(xué)習(xí)器進(jìn)行訓(xùn)練,將多個(gè)模型輸出的測(cè)試集預(yù)測(cè)值合并作為第二層學(xué)習(xí)器的測(cè)試集,并將此測(cè)試集作為第二層學(xué)習(xí)器訓(xùn)練后生成的模型輸入,最終的輸出結(jié)果即為Stac-king算法的輸出結(jié)果。算法示意圖如圖3所示。

2.4 模型評(píng)價(jià)指標(biāo)

本文選取3種評(píng)價(jià)指標(biāo)來(lái)對(duì)各個(gè)模型的預(yù)測(cè)精度進(jìn)行評(píng)估,分別為均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)[33] 和確定性系數(shù) (R2) ,計(jì)算公式如下:

式中: n 為預(yù)報(bào)總次數(shù); Xi 為實(shí)測(cè)值; Yi 為模擬值; 分別為模擬值和實(shí)測(cè)值的平均值。

3 應(yīng)用結(jié)果分析

3.1 預(yù)報(bào)因子篩選

采取主成分分析的方法來(lái)進(jìn)行預(yù)報(bào)因子篩選時(shí),將積雪覆蓋率、雪線高度連同百項(xiàng)氣候指數(shù)等數(shù)據(jù)放入同一個(gè)特征數(shù)組中,將需要預(yù)測(cè)的時(shí)間序列數(shù)據(jù)放入另一個(gè)數(shù)組中,作為目標(biāo)數(shù)組,計(jì)算特征數(shù)組與目標(biāo)數(shù)組的相關(guān)性系數(shù),將計(jì)算得到的相關(guān)性系數(shù)的絕對(duì)值進(jìn)行排序,并選取排名前10的特征(這些特征被認(rèn)為與目標(biāo)最相關(guān)),對(duì)這些特征進(jìn)行標(biāo)準(zhǔn)化處理。應(yīng)用主成分分析(PCA)來(lái)降低數(shù)據(jù)的維度,最終降維后的特征數(shù)據(jù)便為主要預(yù)報(bào)因子集。由于降雨與氣溫是形成徑流的主要因素,故最終的主要預(yù)報(bào)因子集為包含降雨與氣溫在內(nèi)的12項(xiàng)預(yù)報(bào)因子,表1為部分月份篩選出的主要預(yù)報(bào)因子集及其相關(guān)性值統(tǒng)計(jì)表。

3.2 預(yù)報(bào)結(jié)果分析

烏魯瓦提水庫(kù)斷面與同古孜洛克水文站斷面的月徑流數(shù)據(jù)為2001年1月至2022年12月,預(yù)報(bào)年份為次年2023年一整年12個(gè)月份的月徑流。

從表2中烏魯瓦提水庫(kù)斷面各月徑流預(yù)報(bào)模型評(píng)價(jià)指標(biāo)統(tǒng)計(jì)結(jié)果可以看出: ① 以均方根誤差為控制時(shí),多元回歸模型(MRM)在非汛期月份(1\~5月, 10~12 月)的均方根誤差均在 0.196m3/s 以下,12個(gè)月的平均均方根誤差為 0.436m3/s ;支持向量機(jī)模型(SVR)在非汛期月份的均方根誤差均在 0.207m3/s 以下,12個(gè)月的平均均方根誤差為 0.371m3/s ;隨機(jī)森林模型(RF)在非汛期月份的均方根誤差均在 0.206m3/s 以下,12個(gè)月的平均均方根誤差為 0.334m3/s 。最終,基于Stacking融合算法的集成模型在非汛期月份的均方根誤差均在 0.214m3/s 以下,12個(gè)月均方根誤差的平均值為 0.300m3/s 。 ② 以平均絕對(duì)誤差為控制時(shí),多元回歸模型在非汛期月份的平均絕對(duì)誤差均在0.130m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為0.472m3/s ;支持向量機(jī)模型在非汛期月份的平均絕對(duì)誤差均在 0.148m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為 0.270m3/s ;隨機(jī)森林模型在非汛期月份的平均絕對(duì)誤差均在 0.166m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為 0.234m3/s ;最終,基于 Stacking 融合算法的集成模型在非汛期月份的平均絕對(duì)誤差在0.159m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為0.204m3/s 。 ③ 以確定性系數(shù)為控制時(shí),多元回歸模型各月的確定性系數(shù)起伏較大,最低確定性系數(shù)僅為0.502,12個(gè)月的確定性系數(shù)平均值為0.695;支持向量機(jī)模型各月的確定性系數(shù)均在0.65以上,12個(gè)月的確定性系數(shù)平均值為0.744;隨機(jī)森林模型各月的確定性系數(shù)均在0.65以上,12個(gè)月的確定性系數(shù)平均值為0.818;最終,基于Stacking融合算法的集成模型各月的確定性系數(shù)均在0.745以上,12個(gè)月的確定性系數(shù)平均值為0.841。綜合評(píng)估,4種模型均展現(xiàn)出了較高的預(yù)測(cè)性能。在單一模型對(duì)比中,隨機(jī)森林模型的預(yù)測(cè)模擬表現(xiàn)尤為突出;而集成模型的各項(xiàng)指標(biāo)均優(yōu)于單一模型的預(yù)報(bào)精度,表現(xiàn)更好。3種單一預(yù)報(bào)模型與基于Stacking融合算法的集成模型在烏魯瓦提水庫(kù)斷面各月徑流預(yù)報(bào)過(guò)程與實(shí)際過(guò)程對(duì)比如圖4所示。總體上,集成模型的預(yù)測(cè)模擬效果更好。

圖2Stacking算法原理示意"
表1研究斷面部分月份主要預(yù)報(bào)因子集及其相關(guān)性值統(tǒng)計(jì)Tab.1Statistics of the main sets of forecast factors and theircorrelation values for the cross-sections in some months

表3為同古孜洛克水文站斷面各月徑流預(yù)報(bào)模型評(píng)價(jià)指標(biāo)統(tǒng)計(jì)結(jié)果。由表3可以看出: ① 以均方根誤差為控制時(shí),多元回歸模型在非汛期月份的均方根誤差均在 0.119m3/s 以下,12個(gè)月的平均均方根誤差為0.395m3/s ;支持向量機(jī)模型在非汛期月份的均方根誤差均在 0.110m3/s 以下,12個(gè)月的平均均方根誤差為 0.369m3/s ;隨機(jī)森林模型在非汛期月份的均方根誤差均在 0.102m3/s 以下,12個(gè)月的平均均方根誤差為 0.308m3/s ;最終,基于Stacking融合算法的集成模型在非汛期月份的均方根誤差均在 0.173m3/s 以下,12個(gè)月均方根誤差的平均值為 0.240m3/s 。 ② 以平均絕對(duì)誤差為控制時(shí),多元回歸模型在非汛期月份的平均絕對(duì)誤差均在 0.096m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為 0.231m3/s ;支持向量機(jī)模型在非汛期月份的平均絕對(duì)誤差均在 0.089m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為 0.272m3/s ;隨機(jī)森林模型在非汛期月份的平均絕對(duì)誤差均在 0.081m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為 0.227m3/s ;最終,基于Stacking融合算法的集成模型在非汛期月份的平均絕對(duì)誤差在 0.148m3/s 以下,12個(gè)月平均絕對(duì)誤差的平均值為 0.188m3/s 。 ③ 以確定性系數(shù)為控制時(shí),多元回歸模型各月的確定性系數(shù)均在0.634以上,12個(gè)月的確定性系數(shù)平均值為0.739;支持向量機(jī)模型各月的確定性系數(shù)均在0.614以上,12個(gè)月的確定性系數(shù)平均值為0.747;隨機(jī)森林模型各月的確定性系數(shù)均在0.759以上,12個(gè)月的確定性系數(shù)平均值為0.863;最終,基于Stacking融合算法的集成模型各月的確定性系數(shù)均在0.713以上,12個(gè)月的確定性系數(shù)平均值為0.874。綜合評(píng)估,在此斷面中4種模型同樣展現(xiàn)出了較高的預(yù)測(cè)性能。在單一模型對(duì)比中,隨機(jī)森林模型的預(yù)測(cè)依舊表現(xiàn)突出,且集成模型的各項(xiàng)指標(biāo)同樣優(yōu)于單一模型的預(yù)報(bào)效果,精度更高。對(duì)于同古孜洛克水文站斷面,3種單一預(yù)報(bào)模型與基于Stacking融合算法的集成模型各月徑流預(yù)報(bào)過(guò)程與實(shí)際過(guò)程對(duì)比如圖5所示。總體上,同樣是集成模型的預(yù)測(cè)精度更高。

表2烏魯瓦提水庫(kù)斷面各徑流預(yù)報(bào)模型評(píng)價(jià)指標(biāo)統(tǒng)計(jì)結(jié)果Tab.2Statistical results of evaluation indexes of runoff forecasting models in Uluwati Reservoir secti
圖4烏魯瓦提水庫(kù)斷面4種模型預(yù)報(bào)模擬對(duì)比Fig.4Comparison of four types of model forecasting simulations for the Uluwati Reservoir section
表3同古孜洛克水文站斷面各徑流預(yù)報(bào)模型評(píng)價(jià)指標(biāo)統(tǒng)計(jì)結(jié)果:ults of evaluation indicators of runoff forecasting models at Tonguzilok Hydrological Station section

在比較單一模型的預(yù)測(cè)性能時(shí),隨機(jī)森林模型相較于支持向量機(jī)模型展現(xiàn)了更佳的預(yù)測(cè)能力,這一優(yōu)勢(shì)主要源于算法的固有特性,如在特征選擇上,支持向量機(jī)依賴于選擇正確的核函數(shù)和參數(shù)來(lái)捕捉數(shù)據(jù)特征的非線性關(guān)系,而隨機(jī)森林通過(guò)隨機(jī)選擇特征子集來(lái)構(gòu)建每棵樹,這種方法不僅減少了過(guò)擬合的風(fēng)險(xiǎn),還能夠處理高維數(shù)據(jù)并自動(dòng)進(jìn)行特征選擇。在樣本權(quán)重的處理上,支持向量機(jī)通常對(duì)所有樣本進(jìn)行統(tǒng)一處理,而在隨機(jī)森林中,每個(gè)樣本在每棵樹的訓(xùn)練中都有機(jī)會(huì)被選中,這種自助采樣方法使得模型能夠更好地處理樣本不平衡問(wèn)題

圖5同古孜洛克水文站斷面4種模型預(yù)報(bào)模擬對(duì)比Fig.5Comparison of four types of model forecasting simulations for the Tonguzilok Hydrological Station section

從表4中可知,基于Stacking融合算法的集成模型的 RMSE,MAE 均最小, R2 最接近1,表明模型的擬合效果最好,相較于單一模型而言,多模型融合后的集成模型預(yù)測(cè)精度有所提升。

表4集成模型與單一模型的預(yù)測(cè)精度對(duì)比

4結(jié)論

本文基于130項(xiàng)氣象-氣候因子集及前期降雨和流量組成的數(shù)個(gè)因子變量,并將積雪覆蓋率、雪線高度等積雪因子加入預(yù)報(bào)因子池,在主成分分析的基礎(chǔ)上,篩選出主要預(yù)報(bào)因子,構(gòu)建了各月徑流預(yù)報(bào)對(duì)應(yīng)的預(yù)報(bào)因子集。以徑流因子為數(shù)據(jù)驅(qū)動(dòng),首先采用多元回歸分析、支持向量機(jī)和隨機(jī)森林3種方法建立和田河流域兩斷面融雪徑流的數(shù)據(jù)驅(qū)動(dòng)預(yù)報(bào)模型,再基于Stacking融合算法對(duì)上述模型的結(jié)果進(jìn)行融合,建立融雪徑流的集成預(yù)報(bào)模型,并在和田河流域進(jìn)行應(yīng)用。結(jié)果表明:3種模型在烏魯瓦提水庫(kù)斷面和同古孜洛克水文站斷面的月徑流預(yù)測(cè)上均表現(xiàn)出了較高的準(zhǔn)確度。具體到單一模型的比較,隨機(jī)森林模型在整體性能上超過(guò)了其余兩個(gè)模型。基于Stacking融合算法,將多元回歸模型、支持向量機(jī)模型和隨機(jī)森林模型融合后的集成模型性能優(yōu)于單一模型,確定性系數(shù)得以提升。

本研究通過(guò)Stacking融合算法,將3種基學(xué)習(xí)器進(jìn)行集成并應(yīng)用于預(yù)測(cè),克服了單一預(yù)測(cè)模型可能出現(xiàn)的過(guò)擬合現(xiàn)象,并綜合了多個(gè)模型的優(yōu)點(diǎn),準(zhǔn)確率表現(xiàn)更佳。本研究?jī)H選取了3種較為常用的預(yù)測(cè)模型作為基學(xué)習(xí)器進(jìn)行融合,基學(xué)習(xí)器數(shù)量較少,未能更多地囊括具有不同優(yōu)勢(shì)的基學(xué)習(xí)器。此外,本文僅使用一種元學(xué)習(xí)器進(jìn)行融合,未能嘗試使用多種元學(xué)習(xí)器。后續(xù)的研究可以從以下兩個(gè)方面進(jìn)行開展: ① 考慮將更多具有不同特質(zhì)不同優(yōu)勢(shì)的預(yù)測(cè)模型作為基學(xué)習(xí)器,并采用多種不同的元學(xué)習(xí)器進(jìn)行融合對(duì)比,探索更優(yōu)的融合方案。 ② 隨著基學(xué)習(xí)器數(shù)量的增加,模型的復(fù)雜性也隨之提升,如何有效管理和優(yōu)化這些復(fù)雜模型是一個(gè)重要的研究方向。

參考文獻(xiàn):

[1]懷保娟,李忠勤,孫美平,等.SRM融雪徑流模型在烏魯木齊河源區(qū)的應(yīng)用研究[J].干旱區(qū)地理,2013,36(1):41-48.

[2]OUATIKI H,BOUDHAR A,OUHINOU A,et al. Sensitivity and inter-dependency analysis of the HBV conceptual model parameters in aSemi-Arid MountainousWatershed[J].Water,2020,12(9):2440.

[3]孟現(xiàn)勇,吉曉楠,劉志輝,等.SWAT模型融雪模塊的改進(jìn)與應(yīng)用研究[J].自然資源學(xué)報(bào),2014,29(3):528-539.

[4]WANG G,HAO X,YAO X,et al. Simulations of snowmelt runoff in ahigh-altitude mountainous area based on big data and machine learn-ing models:taking the Xiying River Basin as an example[J]. RemoteSensing,2023,15(4) :1118.

[5]CHEN X,WANG S,GAO H,et al. Comparison of deep learning mod-elsand a typical process-based model in glacio-hydrology simula-tion[J]. Journal of Hydrology,2022,615 :128562.

[6]PHAM L T,LUO L,F(xiàn)INLEY A.Evaluation of random forests for short- term daily streamflow forecasting in rainfall-and snowmelt-drivenwatersheds[J]. Hydrology and Earth System Sciences,2021,25(6):2997 -3015.

[7]楊文發(fā),王樂(lè),張俊.流域多尺度水文預(yù)報(bào)應(yīng)用進(jìn)展及適用性探討[J].人民長(zhǎng)江,2021,52(10):84-94.

[8]TIWARI M K,CHATTERJEE C.A new wavelet - bootstrap - ANNhybrid model for daily discharge forecasting[J]. Journal of Hydroinfor-matics,2011,13(3) :500-519.

[9]LI P,KWON H,SUN L,et al. A modified support vector machinebased prediction model on streamflow at the Shihmen Reservoir,Tai-wan[J]. International Journal of Climatology,201O,30(8): 1256 -1268.

[10]周研來(lái),郭生練,張斐章,等.人工智能在水文預(yù)報(bào)中的應(yīng)用研究[J].水資源研究,2019,8(1):1-12.

[11]洪敏,艾萍,岳兆新.基于FPA-ELM模型的中長(zhǎng)期徑流預(yù)測(cè):以雅襲江流域?yàn)槔齕J].人民長(zhǎng)江,2022,53(6):119-125.

[12]游文霞,李清清,楊楠,等.基于多異學(xué)習(xí)器融合Stacking集成學(xué)習(xí)的竊電檢測(cè)[J].電力系統(tǒng)自動(dòng)化,2022,46(24):178-186.

[13]李永剛,王月,劉豐瑞,等.基于Stacking融合的短期風(fēng)速預(yù)測(cè)組合模型[J].電網(wǎng)技術(shù),2020,44(8):2875-2882.

[14]張博,李雪梅,秦啟勇,等.中國(guó)天山積雪垂直分布異質(zhì)性研究[J].干旱區(qū)地理,2022,45(3):754-762.

[15]王一澤,王利,何飛.NASADEM和ASTERGDEMV3數(shù)據(jù)精度比較:以大連市市內(nèi)區(qū)域?yàn)槔齕J].科技創(chuàng)新與應(yīng)用,2021,11(14):1 -7,13.

[16]PATEL A,YADAV S M. Stream flow prediction using TIGGE ensem-ble precipitation forecast data for Sabarmati river basin[J].WaterSupply,2022,22(11) :8317-8336.

[17] HAN H,KIM D,WANG W,et al. Dam inflow prediction using large -scale climate variability and deep learning approach:a case study inSouth Korea[J].Water Supply,2023,23(2):934 -947.

[18] SADYROV S,TANAKA K,SATYLKANOV R,et al. Modelling runoffcomponents and hydrological processes in glaciated catchments of theinner Tien-Shan,Kyrgyzstan[J].Frontiersin EarthScience,2024,11 :1306476.

[19]HE Q,KUANG X,MA E,et al. Reconstructing runoff components andglacier mass balance with climate change:Niyang River Basin,south-eastern Tibetan Plateau[J].Frontiersin Earth Science,2O23,11:1165390.

[20] THAPA S,ZHAO Z,LI B,et al. Snowmelt - driven streamflow predic-tion using machine learning techniques (LSTM,NARX,GPR,andSVR)[J]. Water,2020,12(6):1734.

[21]THAPA U,PATI B M,THAPA S,et al. Comparative analysis onsnowmelt-driven streamflow forecasting using machine learning tech-niques[J]. Water,2024,16(15) :2095.

[22]王迎春,王蕊,李勝陽(yáng),等.西天山某流域積雪變化及其與徑流量相關(guān)性分析[J].人民黃河,2023,45(4):40-46,91.

[23]王棟,賈建偉,劉昕.基于物理成因的隨機(jī)森林模型在丹江口水庫(kù)中長(zhǎng)期來(lái)水預(yù)測(cè)研究中應(yīng)用[C]//中國(guó)水利學(xué)會(huì)2021學(xué)術(shù)年會(huì)論文集第一分期,2021.

[24]李薇,周建中,葉磊,等.基于主成分分析的三種中長(zhǎng)期預(yù)報(bào)模型在柘溪水庫(kù)的應(yīng)用[J].水力發(fā)電,2016,42(9):17-21.

[25]項(xiàng)靜恬,郭世琪.多元回歸模型在實(shí)際應(yīng)用中的幾種推廣[J].數(shù)理統(tǒng)計(jì)與管理,1994(4):48-53.

[26]馮仲愷,付新月,紀(jì)國(guó)良,等.基于混合孿生支持向量機(jī)的徑流區(qū)間預(yù)測(cè)[J].人民長(zhǎng)江,2024,55(4):95-102,117.

[27]符洪恩,高藝桔,馮瑩瑩,等.基于GA-SVR-C的城市暴雨洪澇災(zāi)害危險(xiǎn)性預(yù)測(cè):以深圳市為例[J].人民長(zhǎng)江,2021,52(8):16-21.

[28]BREIMAN L.Random forests[J]. Machine Learning,2001,45(1):5-32.

[29]柴穎.基于隨機(jī)森林回歸分析的徑流預(yù)報(bào)模型[J].水利水電快報(bào),2018,39(9):36-38.

[30]WOLPERTDH.Stacked generalization[J].Neural Networks,1992,5(2) :241 -259.

[31]李強(qiáng),翟亮.基于Stacking算法的員工離職預(yù)測(cè)分析與研究[J].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,36(1):117-123.

[32]張聰,周為峰,樊偉.基于ADASYN和 Stacking 集成的南太平洋黃鰭金槍魚漁場(chǎng)預(yù)報(bào)模型研究[J].海洋漁業(yè),2023,45(5):544-558.

[33]邱緒迪,王坤,陳飛,等.基于最優(yōu)變分模態(tài)分解的渭河流域多步徑流預(yù)報(bào)[J].人民長(zhǎng)江,2024,55(8):79-86,95.

(編輯:謝玲姻)

猜你喜歡
融合模型
一半模型
一次函數(shù)“四融合”
村企黨建聯(lián)建融合共贏
融合菜
從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
重要模型『一線三等角』
寬窄融合便攜箱IPFS500
《融合》
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲成人精品| 国产菊爆视频在线观看| 亚洲aaa视频| 天堂成人在线视频| 一本色道久久88亚洲综合| 国产黄色视频综合| 亚洲无码91视频| 国产麻豆另类AV| 91福利在线看| 国产青青草视频| 大乳丰满人妻中文字幕日本| 国产91精选在线观看| 亚洲永久免费网站| 亚洲精品大秀视频| 国产精品xxx| 巨熟乳波霸若妻中文观看免费| 自拍亚洲欧美精品| 亚洲区一区| 一级成人a毛片免费播放| 久久久久国色AV免费观看性色| 99国产在线视频| 91尤物国产尤物福利在线| 成人免费一区二区三区| 久久77777| 夜夜操国产| 99久久精彩视频| 精品无码专区亚洲| 91精品啪在线观看国产91| 国产亚洲视频免费播放| 成人亚洲视频| 亚洲欧美精品日韩欧美| 91精品福利自产拍在线观看| 国产成人无码AV在线播放动漫 | 日本高清免费不卡视频| 青青热久麻豆精品视频在线观看| 九九热精品视频在线| 亚洲最新地址| 久久中文电影| 99精品国产自在现线观看| 无码免费视频| 在线免费看黄的网站| 一级在线毛片| 日本欧美午夜| 91在线视频福利| 91精品人妻互换| 国产特级毛片| 五月天综合婷婷| 乱码国产乱码精品精在线播放| 91成人免费观看| 91色在线观看| 狠狠色丁香婷婷| 亚洲第七页| 自拍偷拍欧美日韩| 99在线视频免费| 亚洲一区二区在线无码| 亚洲精品动漫| 欧美福利在线播放| 欧美日韩久久综合| 萌白酱国产一区二区| 园内精品自拍视频在线播放| 国产www网站| 国产成人夜色91| 中国国产一级毛片| 香蕉久久永久视频| 尤物亚洲最大AV无码网站| 亚洲av综合网| 国产av剧情无码精品色午夜| 国精品91人妻无码一区二区三区| 一本色道久久88综合日韩精品| 99久久无色码中文字幕| 亚洲国产精品VA在线看黑人| 成人午夜免费观看| 亚洲日本www| 啪啪免费视频一区二区| jijzzizz老师出水喷水喷出| 一本一本大道香蕉久在线播放| 日韩a级毛片| 国产美女精品在线| 日韩在线2020专区| 国产又色又爽又黄| 欧美国产另类| 免费观看无遮挡www的小视频|