999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林的大壩滲流監測研究

2021-06-29 10:46:08辛晟銘
水利科技與經濟 2021年6期
關鍵詞:模型

辛晟銘

(新疆頭屯河流域管理局 水利管理中心,新疆 昌吉 831100)

0 引 言

大壩的滲流情況監測[1-2]一直以來都是大壩安全監測的重點項目,由于水庫大壩在運行中受到很多因素的影響,通過觀測滲流情況最能直觀地反映它的穩定狀況。如果能夠根據監測數據創建精度準確的預測模型,對一定時期內的滲流進行準確預測,便能跟蹤大壩的安全變化狀態,必要時采取適當措施杜絕安全隱患。因此,眾多學者一直致力于研究精度更高的大壩滲流監測模型。這種由實際數據形成預測模型的過程,傳統上都是通過數學模型來構建的。在實際應用中,主要有統計模型[2-3]、確定性模型[4-5]和混合型模型[5-6]3種數學模型,通過統計學的原理展現監測值和影響量之間的相互關系。然而,由于滲流的成因較復雜,這些傳統的建模方法受變量多重共線性的影響或模型參數的選取不恰當,導致精確度往往不高。

隨著機器學習算法的發展,學者們利用諸如人工神經網絡[7-8]、遺傳算法[9]、蟻群算法[10-11]、支持向量機[12-13]等算法來創建大壩監控模型,取得了一定成果。但這些模型尚未成熟,計算量較大,且不穩定,無法徹底解決多變量共線性的影響。

隨機森林算法也是機器學習的一種,它能夠解決多變量之間的交互作用和非線性關系,在無大幅增加計算量的情況下提高了分類、回歸問題的準確率。通過隨機森林創建的模型能夠有效地分析非線性及共線性存在某種關聯的數據[14],且無須事先假定數據的分布,這些特點使得其在生物學[15-16]、土壤學[17-18]、醫學[19]等專業方向得到較大程度的應用,但在水庫大壩滲流監測方面應用較少。此外,隨機森林算法能夠有效處理噪音和異常數據,不易出現其他機器學習算法的過擬合問題。為此,本文基于隨機森林算法構建大壩滲流監測模型,對以往的監測資料進行訓練、學習及分析,并與BP神經網絡進行對比,驗證該模型的可行性和有效性。

1 隨機森林回歸算法模型

決策樹又稱為分類回歸樹,是隨機森林的基礎組成部分。決策樹是一種預測模型,它所表現的是統計對象的值與屬性之間的映射關聯。決策樹中的節點表示某個對象,每個分叉就表達該對象的某種屬性,葉節點則表示對象的值。決策樹只有單一的輸出,類別較多時,準確度會下降。而隨機森林可以將許多決策樹通過Bagging方法結合[20]起來,以提升分類回歸的正確率。

隨機森林的本質是一種集成學習的方法,從分類功能來看,多棵樹會有多個分類結果。而隨機森林集成了所有的分類投票結果,將得票最多的分類結果作為模型的輸出。隨機森林還可以用于回歸,用于回歸分析的隨機森林可通過訓練得到隨機向量參數,采用簡單平均法,對多個分類回歸樹得到的回歸結果進行算術平均得到最終的模型輸出。

回歸算法實現:隨機森林回歸(Random Forest for Regression,RFR)模型是由多顆回歸樹組成。在實際運用中,每棵決策樹的特征選擇不一樣,所以它們擁有各自對應的隨機向量,那么T棵樹就是一組隨機向量序列fi(i的值為大于0的整數)。同分類模型不同的是,回歸模型的因變量是連續的數值。假設訓練集是從隨機向量X、Y中獨立抽取出來,那么任意數值的預測值H(X)是對T棵回歸樹{h(f,XT)}的取算數平均數得到的。

隨機森林回歸算法的構建流程如下:

步驟1:利用bagging思想,從訓練集中進行有放回的抽樣,產生訓練子集。

步驟3:重復以上步驟,構建N棵回歸決策子樹,形成不剪枝的森林{h(f,XT)}。

步驟4:將森林中每棵樹的預測值進行算術平均,輸出最終結果。

步驟5:模型的效果采用袋外數據來評價(袋外數據可以用來估計回歸樹的泛化誤差,而不用交叉驗證)。

回歸分析會出現多重共線性的現象,影響回歸模型的準確性。多重共線性是指回歸模型中的解釋變量之間由于存在一定程度的相關關系,如果存在比較嚴重的共線性問題時要用特定算法或者降維處理。如果模型僅用于預測,則只要擬合程度好,可不處理多重共線性問題。隨機森林因其不用選擇變量,而且擬合程度良好,所以由其創建的回歸模型不受多重共線性的影響。

2 基于隨機森林算法的大壩滲流預測模型構建

2.1 模型輸入變量

大壩滲流的影響因子較多且復雜,由于滲流測壓管水位變化趨勢基本符合土壩滲流特性[21],所以根據滲流測壓管的水位來反映滲流量。此次研究對象為土石壩,水庫中的水從上游向下游滲透時,因為土壤阻力的作用,需要一定時間才能流到測壓管內,該時間同上游水位相關聯,所以將一定時間段的上游水位判定為影響因子。降雨時會產生地表徑流,該徑流通過壩體入滲,所以降雨量也是影響因子。隨著大壩的正常運行時間累積,土石壩逐漸堅固穩定,土壤入滲的可能也就越來越小,同時水流夾雜的泥沙導致淤泥積累也在一定程度上影響了滲流的狀態,這些因素都會造成到測壓管的水位變化。綜上,測壓管水位的重要影響因子分別包括一定時間段的上游水位、一定時間段的降雨、下游水位和時效因子[22]。用公式表達如下:

h=hu+hd+hp+hσ

(1)

式中:h為測壓管的水位,它由4個分量組成;hu為上游水位;hp為降雨量;hd為下游水位;hσ為失效因子。

2.1.1 上游水位值

水流經過上游壩面、經過土壤滲透到達測壓管需要一段時間,測壓管的水位是滯后于水庫水位的,所以用這段時間的平均水位來表達。

(2)

2.1.2 下游水位值

下游水位的變動是不大的,所以直接用水位值的回歸形式來表達,即:

hd=αdhd

(3)

式中:αd為回歸系數;hd為下游水位值。

2.1.3 降雨量

(4)

2.1.4 時效因子

大壩在運行一段時間后,內部的土壤逐漸趨于穩定和固化,它的滲透性能也會發生改變,水庫上游壩面的表面也因時間推移形成越來越厚的淤泥,影響到入滲情況。這些情況都受到時間遷移的影響,所以引入時效因子,其表達式如下:

hθ=C1θ+C2lnθ

(5)

其中:C1、C2為回歸系數;θ為蓄水初期開始的天數除以100。

2.2 建模工具

為了建立隨機森林回歸模型,使用R語言的Random forest包來進行。R作為一種統計分析軟件,它可以運行于Unix和Windows的操作系統上,因其開源和免費,目前在統計領域得到廣泛的應用。在運用R語言創建預測模型時,主要運用predict和mean這兩個函數來實現隨機森林的回歸。

2.3 模型參數

在使用Random forest建立隨機森林時,回歸決策樹的數量ntree和每個節點的特征數量mtry這兩個參數是最重要的。mtry由總輸入變量開平方求得,它能夠決定樹與樹之間的相關性和算法的強度。在本案例里,輸入變量的個數為4,所以mtry取值為2。為了提高模型的運行效率和降低復雜程度,需要等到袋外數據錯誤率趨于穩定時才能確定ntree的值。一般地,用MMSEOOB(袋外誤差平方和)來體現袋外誤差的錯誤率。通常情況下,需要利用它和ntree的關聯圖來確定ntree。

2.4 建模流程

基于隨機森林回歸算法的土石壩滲流預測模型的創立步驟如下,建模流程見圖1。

圖1 滲流預測模型流程圖Fig.1 Dam seepage prediction model flow chart

步驟1 在R語言環境下,調出Random forest程序包,讀取滲流監測數據。

步驟2 將特征數量mtry的值設定為2。從100棵回歸決策樹逐漸遞增,觀察每次建模得到的MMSEOOB值,當袋外誤差率趨于穩定時,選定ntree值。

步驟3 使用mtry和ntree兩個參數建模,對原始監測數據進行訓練,并對測試集進行預測。

3 案例分析

本文主要選取新疆某水庫大壩滲流監測資料,該水庫大壩為碾壓式黏土心墻砂殼壩。陡山水庫坐落在沭河一級支流潯河中下游,控制流域面積431 km2,對其滲流情況的監測尤為重要。

該水庫大壩的滲流監測設有3個斷面,有24個測壓管,選取管口位于壩頂的AP204壩基測壓管,資料記錄時間為2015年1月至2017年12月。測壓管水位的觀測周期為:汛期7天一次,非汛期10天一次。將2016年3月至2017年8月這18個月的65組數據作為訓練樣本,通過組合學習,對2017年9月的6組數據進行預測。

3.1 重要參數的選定

在實際建模過程中,通過觀察ntree與MMSEOOB的關聯變化情況來確定森林的棵數,當MMSEOOB趨于穩定時,選定合適的棵數。圖 2是ntree與MMSEOOB的關聯變化圖。從圖2中可以看到,當森林的棵數達到500時,趨于穩定;達到1 000時,袋外數據誤差最小。為了保證模型的準確度,選擇1 000作為隨機森林回歸算法模型的棵數。

圖2 ntree與MMSEOOB關聯變化圖Fig.2 Association change diagram of ntree and MMSEOOB

3.2 模型應用及結果分析

為了便于對比研究,通過建立隨機森林回歸模型及BP神經網絡模型[23]對測壓管的水位進行擬合與預測,其中隨機森林回歸模型是利用Random forest函數對訓練期建模,predict函數對預測期的數據進行擬合。圖3和圖4分別為AP204測壓點在兩種模型下的擬合及預測結果。

圖3 隨機森林及BP神經網絡回歸模型擬合曲線Fig.3 Fitting curves of random forest and BP neural network model

圖4 隨機森林及BP神經網絡模型的預測曲線Fig.4 Prediction curve of random forest and BP neural network model

由圖3可以看出,兩種模型與實測值的擬合趨勢是一致的,樣本訓練水位處于39~47 m之間,8月份汛期出現峰值拐點,兩種模型都能夠體現該拐點趨勢,但隨機森林較為準確。由圖4可以看出,預測期測壓管實測水位在45.5~46.5 m之間波動,隨機森林模型處于相對平滑穩定的狀態,而BP神經網絡存在波動性。從而可以看出,該土石壩滲流預測模型能夠有效地擬合和預測水位值。

本文研究的預測期時間軸較短,在此期間水位的變化也較小,更適合用隨機森林算法來建模。BP神經網絡需要初始化權值,且需要經過數次測算,才能達到良好的預測效果,消耗過多的計算時間,同時占用大量的內存。隨機森林模型可以直接使用樣本數據,無需前期處理,且測算數據的過程簡便快捷。

一般地,評價一個統計模型的優劣程度,需要判定其精確度和穩定性。本文的模型精度指標選用實測值與預測值之間的平均相對誤差、均方根誤差這兩個指標,穩定性則使用確定性系數R2與計算時間兩個指標,通過這4個指標來評價隨機森林回歸模型和BP神經網絡模型的優劣程度。數據對比見表1。

表1 隨機森林和BP神經網絡模型對比Tab.1 Comparison of random forest and BP neural network model

從表1可看出,隨機森林回歸模型的確定性系數為0.96,大于BP神經網絡,表面其因變量可靠程度高,加之其運算時間比BP神經網絡少,所以其穩定性較高。另外,隨機森林回歸模型的相對誤差值和均方根誤差值兩項指標都小于BP神經網絡。綜上所述,充分證明其在預測精度和模型穩定方面的優越性。

4 結 論

本文充分利用隨機森林回歸模型具有的特性,對目前國內水庫應用較多的土石壩類建立了滲流監測模型。通過陡山水庫多年的監測資料建立訓練樣本,模型輸出的擬合結果和預測結果同實際監測資料的變化趨勢相一致。通過對比隨機森林回歸模型、BP神經網絡模型的預測精度與穩定性,確定了隨機森林模型的整體優勢性,該模型的建立為大壩滲流的精準預測提供了一種新途徑。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲欧美精品日韩欧美| 无码网站免费观看| 99热这里只有精品久久免费| 人人看人人鲁狠狠高清| 日韩无码一二三区| 97se综合| 亚洲AV一二三区无码AV蜜桃| 夜夜高潮夜夜爽国产伦精品| 操美女免费网站| 亚洲天堂精品视频| 欧美精品v| 手机看片1024久久精品你懂的| 日韩欧美成人高清在线观看| 久热这里只有精品6| 黄色国产在线| 欧美a级在线| 久久性视频| 免费亚洲成人| 欧美伦理一区| 专干老肥熟女视频网站| 国产精品天干天干在线观看| 国产成人91精品免费网址在线| 国产性猛交XXXX免费看| 国产精品第三页在线看| 国产91九色在线播放| 国产乱子精品一区二区在线观看| 97国产在线观看| 这里只有精品在线播放| 国产欧美另类| 国产www网站| 国产av无码日韩av无码网站| 日本高清免费一本在线观看| 国产亚洲成AⅤ人片在线观看| 99视频在线观看免费| 在线观看无码a∨| 成·人免费午夜无码视频在线观看 | 在线观看无码a∨| 尤物在线观看乱码| 5555国产在线观看| 中文字幕在线视频免费| 国产成人一二三| 国产成人区在线观看视频| 国产中文在线亚洲精品官网| 久久中文电影| 亚洲日本在线免费观看| 亚洲男人天堂2018| 国产精品播放| 国内精自视频品线一二区| 国产福利在线观看精品| 久久精品免费国产大片| 欧美日本视频在线观看| 国产91高清视频| 国产美女91视频| 一本大道香蕉中文日本不卡高清二区 | 成人午夜亚洲影视在线观看| 天天综合网站| 成人国产精品2021| 久久影院一区二区h| 国产成人高清亚洲一区久久| 毛片久久网站小视频| 人人爱天天做夜夜爽| 精品一区二区无码av| 澳门av无码| 亚洲v日韩v欧美在线观看| 中文字幕无线码一区| 色综合热无码热国产| 国产理论最新国产精品视频| 色偷偷一区| 亚洲婷婷在线视频| 亚洲av无码片一区二区三区| 综合色在线| 97在线免费| 2021精品国产自在现线看| 国产亚洲美日韩AV中文字幕无码成人| 无码高潮喷水专区久久| 国产69精品久久久久妇女| 国产青青草视频| 国产v欧美v日韩v综合精品| 国产精品999在线| 国内老司机精品视频在线播出| 亚洲日韩精品无码专区| jizz在线观看|