999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林回歸分析的徑流預報模型

2018-10-15 08:53:48
水利水電快報 2018年9期
關鍵詞:重要性特征評價

(河南省南陽水文水資源勘測局,河南 南陽 473000)

徑流預報是水利水電工程設計、施工和運行管理的重要依據,在防洪減災、水資源優化配置等方面發揮著顯著的作用[1]。因此準確有效地延長徑流預見期、提高徑流預報精度有著至關重要的意義[2-3]。目前,水文學者對徑流及其影響因子的關系進行了大量的研究[4-6],常用的有多元回歸模型、逐步回歸模型、最小二乘法等,但是受天文、氣候、植被、地質地貌等因素的影響,水文預報呈現出隨機性、高維性、模糊性等特點[7]。隨機森林回歸(Random Forest Regression,RFR)算法是由L. Breiman等[8]于2001年共同提出的一種基于決策樹的集成學習算法,可以同時處理連續、離散屬性,具有運行效率高、防止過擬合、強穩健性和抗噪性等優點,但是該方法在水文領域應用較少。因此,本文選取1970~2010年西峽水文站年降水量、年蒸發量、年平均流量、年均氣溫、年均相對濕度和年均氣壓作為預報因子,基于R語言構建隨機森林回歸算法,建立徑流預測模型,為實際工程中徑流預測問題的研究提供技術支撐。

1 數據和方法

1.1 數據來源

本文的分析數據主要來源于西峽水文站1970~2010年的水文及氣象數據,主要包括流量、徑流量、降水量、蒸發量、氣溫、相對濕度和氣壓等資料。西峽水文站系長江流域丹江水系老灌河干流上的主要控制站,為國家級一類站,控制流域面積3 418 km2,區間干流長度165 km,多年來平均降水量846 mm。

1.2 隨機森林回歸

(2)隨機子空間。在構建回歸決策樹的過程中,每個分裂節點在特征空間中隨機選擇若干特征構建特征子空間,并選出最優特征子空間進行分裂,保證樹的獨立性和隨機性。在RFR中,樹的個數(ntree)和隨機特征數(mtry)決定著模型的最終預測能力。

1.2.1 預報模型構建

(1)樣本劃分。以選取的6個預報因子作為解釋變量,以西峽水文站年徑流作為目標變量,劃分1970~2000年數據為訓練樣本,2000~2010年數據為驗證樣本,采用訓練樣本構建預報模型,利用檢驗樣本對模型預報精度進行評價。

(2)預報模型構建。基于R語言的randomForest函數構建隨機森林模型[9],其中mtry默認為輸入變量的1/3,本文選取變量有6個,則mtry值取2。通過實驗得到不同決策樹個數的模型誤差與ntree的關系(如圖1所示),模型錯誤率隨著ntree的增加逐漸降低,錯誤率在ntree為300時達到最低(2.92%),之后隨著ntree值的增加,模型的錯誤率仍保持較低且穩定的狀態。該特征充分證明了RFR算法具有防止過擬合的能力。

圖1 不同ntree對應的模型錯誤率

考慮到模型的精度和運算效率問題,實驗最終選擇mtry=2,ntree=300進行建模。

1.2.2 模型變量重要性評價

RFR通過計算解釋方差百分比(variance explained)來評價模型的預測能力。用方差增量(increase in mean squared error,IncMSE)以及節點純度增量(increase in node purity, IncNodePurity)兩個指標來定性衡量特征變量對目標變量的重要性。IncMSE為采用隨機變量替換某一變量對模型預測結果的影響,若該隨機變量使方差顯著改變,則表示原變量相當重要;IncNodePurity則利用同質性增加原理來衡量變量的重要性[9]。

1.2.3 模型評價與檢驗

本文通過評價模型的擬合效果和檢驗模型預測結果來評價模型的預測能力。通過計算RFR模型的決定系數(R2)和均方根誤差(RMSE)來評價模型的擬合效果[10]。

(1)

(2)

分別對RFR模型預測結果進行檢驗,通過計算總體相對誤差(Rs)、平均相對誤差(E)、平均相對誤差絕對值(E′)3個統計量指標以及精度P來評價模型的預測能力[10]。

(3)

(4)

(5)

(6)

2 結果分析

2.1 特征變量重要性評價

隨機森林算法可以用來評估所選特征變量的重要性,有效避免了一般回歸問題面臨的多元共線性問題[11]。本文特征變量的重要性評價如表1所示。可以看出年平均流量、年蒸發量、年降水量、年平均相對濕度對于徑流模型的預報有較大的貢獻。

表1 RFR模型變量重要性評價 %

2.2 精度評價分析

2.2.1 模型評價

通過實驗得到預測模型的均方根誤差(RMSE)為 0.0382,決定系數(R2)為0.89,可知模型預測精度較好。

2.2.2 模型檢驗

RFR模型預測結果如表2所示,檢驗數據的平均相對誤差在16%以內,精度較高。

表2 徑流量模型預測檢驗結果

通過計算模型偏差統計量評價模型的預測能力,結果如表3所示,可以看出模型預報能力較好。

表3 模型總體預測結果檢驗

3 結 論

(1)本文建立的RFR徑流預報模型R2為 0.89,RMSE為 0.038 2,模型的擬合效果較好;模型預測結果的總相對誤差為0.034,預測精度P為91.52%。綜上表明本文構建的RFR徑流預報模型預報能力較好。

(2)在多樣本、多指標、復雜的水文預報問題處理中,RFR算法可以評估各個特征變量的重要性,對離群值不敏感,在隨機干擾較多的情況下表現穩健,且不易產生過度擬合。而且RFR算法包含估計缺失值的算法,在水文資料存在缺失的情況下(1971~1975年有資料缺失)能夠彌補缺失值,使預測結果仍可維持較高的精度。

猜你喜歡
重要性特征評價
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
“0”的重要性
論七分飽之重要性
幼兒教育中閱讀的重要性
甘肅教育(2020年21期)2020-04-13 08:09:24
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
讀《邊疆的重要性》有感
唐山文學(2016年11期)2016-03-20 15:26:04
基于Moodle的學習評價
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 国产女人水多毛片18| 国产91九色在线播放| 亚洲成人网在线观看| 人人爽人人爽人人片| 四虎影视国产精品| av在线5g无码天天| 国产精品久久久久久久久| 午夜欧美在线| 国产亚洲现在一区二区中文| 日韩无码一二三区| 精品国产欧美精品v| 国产女同自拍视频| 美女扒开下面流白浆在线试听| 成年人福利视频| 日韩精品少妇无码受不了| av在线手机播放| 3D动漫精品啪啪一区二区下载| 老司机久久99久久精品播放| 1024你懂的国产精品| 欧美福利在线| 97国产在线视频| 色婷婷丁香| 亚洲自拍另类| a级毛片毛片免费观看久潮| 久久96热在精品国产高清| 国产午夜精品鲁丝片| 日韩精品久久无码中文字幕色欲| 91视频日本| 久久亚洲AⅤ无码精品午夜麻豆| 国产成人8x视频一区二区| 日韩欧美国产另类| 久久国产精品夜色| 久久精品免费看一| 强乱中文字幕在线播放不卡| 欧美成人午夜影院| 中文字幕有乳无码| 18禁高潮出水呻吟娇喘蜜芽| 伊人精品视频免费在线| 四虎永久在线精品影院| 国产丝袜第一页| 美臀人妻中出中文字幕在线| 亚洲欧美日韩中文字幕在线| 免费一级毛片在线观看| 日韩AV无码免费一二三区| 亚洲无码熟妇人妻AV在线| 日韩午夜伦| 99色亚洲国产精品11p| 国产a在视频线精品视频下载| 一本色道久久88| 日本成人一区| 久久天天躁狠狠躁夜夜2020一| 国产极品美女在线播放| 操美女免费网站| 欧美日韩另类国产| 91久久国产综合精品女同我| 草草影院国产第一页| 日韩在线观看网站| 日韩中文精品亚洲第三区| 91色爱欧美精品www| 亚洲 成人国产| 国产主播一区二区三区| 中文国产成人精品久久| a级毛片网| 成人字幕网视频在线观看| 精品人妻一区无码视频| 免费国产小视频在线观看| 国产SUV精品一区二区| 日韩第一页在线| 亚洲欧美成人在线视频| 亚洲精品图区| 久久青草视频| 国产专区综合另类日韩一区| 亚洲福利片无码最新在线播放| 午夜电影在线观看国产1区| 狠狠做深爱婷婷综合一区| 国产99视频精品免费观看9e| 国产精品香蕉| 99热这里只有成人精品国产| 日本午夜视频在线观看| 欧美视频二区| 无码网站免费观看| 激情六月丁香婷婷四房播|