999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分類梯度提升算法(CatBoost)與蝙蝠算法(Bat)耦合建模預測中國西北部地區水面蒸發量

2021-02-25 08:36:28董力銘曾文治雷國慶
節水灌溉 2021年2期
關鍵詞:能力模型

董力銘,曾文治,雷國慶

(武漢大學水資源與水電工程科學國家重點實驗室,武漢430072)

0 引 言

蒸發是氣象科學、水資源評價和水循環的重要內容[1,2]。精準的預測水面蒸發對于干旱、半干旱地區的水資源合理規劃、農業節水灌溉及水資源評價具有重要意義和價值[3,4]。預測水面蒸發量的方法大致分為2 類:實地測量法及模型估計法。其中,實地測量法如蒸發皿測量法,雖然可以得到較為精確的結果,但十分容易受到田間狀況、人工成本、極端天氣情況等因素的限制,制約了其應用的范圍[5,6]。同時,由于蒸發過程具有高度非線性、復雜性和不穩定性等特點,較難建立包含所有相關因素的,具有較強普適性的經驗數學模型[7?9]。

近年來,隨著機器學習及啟發式搜索算法的快速發展及其在解決非線性復雜問題上的巨大優勢,已有許多學者將機器學習如人工神經網絡(ANN)[10,11]、多元自適應回歸曲線(MARS)[6,12]、 隨 機 森 林(RF)[13]、 分 類 梯 度 提 升(CatBoost)[14]等算法應用于蒸散發、水面蒸發等方面的模擬并得到較為準確的水面蒸發預測精度。其中,CatBoost模型以其強大的特征分類能力及高準確度,受到學者們的廣泛關注。Huang[14]將CatBoost模型與SVM模型和RF模型在估算中國濕潤地區ET0時進行了對比,發現CatBoost模型不僅在精度和穩定性方面具有顯著優勢,在計算時間和內存使用方面也同樣更為優越。然而CatBoost模型需要設置的參數較多,增加了陷入局部最優解的可能性。為此,利用具有強大搜索功能的蝙蝠算法進行耦合,提升CatBoost模型處理參數的能力,進而增強模型預測準確度及魯棒性是一種可行且有效的辦法[15]。

本文針對我國西北部干旱地區的水面蒸發量預測,建立耦合蝙蝠算法的改進CatBoost模型(Bat?CB),測試其預測能力,并與原CatBoost模型及較為常用的隨機森林模型(RF)進行對比,進而提出適用于干旱、半干旱地區的水面蒸發模型。

1 材料與方法

1.1 隨機森林法(RF)

隨機森林法是基于分類和回歸樹,利用自動聚集(bootstrapping)及“bagging”方法等集成策略來處理高維回歸問題的算法[16]。隨機森林通過bootstrap 重抽樣方法從原始數據集中隨機抽取子訓練集,并在采集后將其放回,直到達到指定的節點數。沒有被采集的數據稱為“箱外數據”,用來計算泛化無偏誤差并提高精度。最后,通過對決策樹投票或取平均值的方式做綜合評價,生成最終結果[17]。目前,隨機森林算法已廣泛應用于模型預測的領域,本文也因此選擇隨機森林作為對比的對象,探究水面蒸發模型的預測能力。

1.2 分類梯度提升算法(CatBoost)

CatBoost 是一種基于梯度增強決策樹(gradient boosting decision tree,GBDT)算法的新型機器學習算法。相對于其他的早期GBDT 算法如XGBoost 和LightGBM,CatBoost 在很多方面都有較大提升,特別是在處理大量數據和特征的時候。CatBoost 功能的增強主要體現在3個方面。首先,CatBoost 采用“有序原則”的方式避免了GBDT算法的迭代過程中固有存在的條件位移問題,并使其可以利用整個數據集進行訓練和學習。其次,CatBoost 將傳統的梯度增強算法轉化為有序增強(Ordered Boosting)算法,解決了迭代過程中梯度偏移這一不可避免的問題,提高了泛化能力,降低了模型過擬合的可能,增強了模型的魯棒性[18]。最后,CatBoost 通過貪婪策略(Greedy Strategy)構造分類特征的組合,并將這些組合作為附加特征,這有助于模型更容易地捕獲高階依賴關系,進一步提高預測精度。此外,CatBoost 選擇健忘決策樹(Oblivious Decision Trees)作為基礎預測期,降低了過擬合的可能并加快了模型的執行速度。

1.3 耦合蝙蝠算法的CatBoost模型(Bat-CB)

蝙蝠算法是由Yang[19]提出,仿生蝙蝠覓食行為,利用每只微型蝙蝠發出高頻脈沖來搜索目標,并分析其獨特的回聲信息特征來定位目標的元啟發式算法。在數學上,它的實現方法如下面步驟所示。

第1步:創建蝙蝠數量,賦予每只蝙蝠初始速度vi、頻率fi和位置xi。

第2步:在每一次迭代過程中,在t時刻將3個特征按下面公式更新:

式中:β∈(0,1)為正態分布的一個隨機向量;和為蝙蝠在時刻t更新的位置和速度;x*是當前最佳位置(解決方案)。

第3步:生成一個隨機數rand用以判斷當前位置是否需要改進,若rand>At,則蝙蝠通過rand步長來更新自己的最佳位置:

式中:rand∈[?1,1];At為t時刻所有蝙蝠的平均響度。

第4步:生成另一個隨機數,如果rand

式中:α和c均為常量,0<α<1且c>0。

第2步至第4步的迭代過程將一直持續到達到最大迭代次數或要求的精度為止。最后,對所有蝙蝠的適應度進行排序,得到最佳位置(最優解)

在本文中,使用蝙蝠算法優化了CatBoost模型的3個最為關鍵的參數,分別為決策樹的數量(nrounds)、學習速率(eta)和樹的最大深度(depth)。理論上可以強化梯度增強功能,顯著提高預測能力。

1.3 試驗區概況

試驗區為中國的西北部干旱及半干旱地區的45個氣象站所形成的區域,約占中國總面積的1/6(見圖1)。該地區屬于典型的溫帶大陸性氣候,酷熱、干燥、日照充足、降水稀少,并且蒸發量隨季節變化較大,夏季的蒸發量是春季和冬季的10~30倍。水面蒸發實測值作為校核模型預測能力的基準,由西北45個氣象站以蒸發皿測量得到。而數據集則由西北45個氣象站2006?2017年間包括最低氣溫、最高氣溫、相對濕度、風速及太陽輻射5個因素的逐日長系列數據構成。另外,由于研究區內可直接測量輻射參數的氣象站有限,太陽輻射的數據不足,因此,根據Fan[20]采用經驗Angstrom?Prescott模型(A?P模型),利用日照天數(R0)和日照時間(N,h)來計算全球太陽輻射這一參數。此外,數據分為2 組,一組(2006?2013)用于開發和訓練3個模型,另一組(2014?2017)用于模型測試。氣象數據見表1。

圖1 45個研究站點分布圖

1.4 統計指標

本文采用均方根誤差(RMSE)、平均絕對誤差(MAE)、納什系數(NSE)和平均絕對誤差百分比(MAPE)評價模型的訓練與測試精度。4種統計學評價指標的具體計算方法如下:

式中:YEST,i和YOBS,i分別表示水面蒸發的預測值和觀測值;YOBS,i,MEAN表示水面蒸發觀測值的平均值。

2 結果與分析

為檢驗上述3種模型對于試驗區域水面蒸發的預測能力,本文采用4個常用的統計指標,分別為均方根誤差(RMSE)、平均絕對誤差(MAE)、納什系數(NSE)及平均絕對百分比誤差(MAPE)。模型在訓練階段及測試階段的統計指標見表2。

在模型的訓練階段,3種模型在不同的各項統計指標中表現出結果的高度一致性。RF模型(RMSE: 0.127~0.528 mm/d;MAE: 0.077~0.353 mm/d;NSE: 0.981~0.995;MAPE:0.042~0.081)的各項指標均優于CB模型及Bat?CB模型。而Bat?CB(RMSE:0.288~1.125 mm/d;MAE:0.166~0.846 mm/d;NSE: 0.908~0.952;MAPE: 0.115~0.167)模型略優于CB 模 型(RMSE: 0.300~1.322 mm/d;MAE: 0.180~0.851 mm/d;NSE: 0.894?0.950;MAPE: 0.131~0.181)。但在模型的測試階段,RF模型的預測能力顯著弱于Bat?CB模型及CB模型,這說明RF模型在3個模型中存在著最嚴重的過擬合問題,這與Zhang[21]在探究CatBoost、RF 和GRNN 3種模型在ET0預測上的研究結果一致。而Bat?CB模型在測試階段依舊強于CB模型,并且在最大值(Max)及標準差(SD)這2個指標上提升最為明顯。這說明改進的Bat?CB模型在總體上降低了CB模型存在的過擬合問題的影響,并提升了模型的整體性能和預測能力。胡夢月等[22]利用改進的蝙蝠算法優化KELM模型的2個參數,證明了利用蝙蝠算法的搜索功能可有效提升KELM模型預測能力。綜上所述,改進的Bat?CB模型的預測能力優于CB模型及RF模型。

此外,由于難以將45個站點中每一個站點的模擬情況全部展示出來,故本文隨機從45個站點中隨機選取6個分散的站點進行散點圖的繪制,進一步檢驗模型的預測能力,結果見圖2。

圖2表明,當蒸發量較小時3個模型均有較好的預測結果。但當蒸發量大于4 mm/d時,RF模型的預測值與實測值的偏離明顯變大,逐漸偏離1∶1 線。考慮到試驗區域每年大部分時間蒸發量較大,RF模型在干旱、半干旱地區的實用性和準確度總體上明顯弱于Bat?CB模型及CB模型。而相對于CB模型,改進的Bat?CB模型在全部6個點的精度更高,尤其是在51567 站點及51704 站點上。因此,在蒸發量較大的情況下,Bat?CB模型相對于RF模型和CB模型具有更高的準確度和穩定性。

在評估模型整體預測能力時,使用預測值與實測值之間絕對誤差的頻率分布圖是一種常用且有說服力的方法之一。本文繪制了以上6個站點的絕對誤差分布直方圖,見圖3。

在以上6個站點中,3種不同的模型在預測水面蒸發量時,都有大約50%的站點的絕對誤差低于0.4 mm/d,并且絕對誤差從0 到2 mm/d 增加過程中對應站點的所占比例逐漸降低。在3個模型中,Bat?CB模型在全部站點的絕對誤差值中,都有著最高比例小于0.4 mm/d 的分布及最低比例大于2 mm/d的分布。但RF模型在大多數站點中的表現劣于Bat?CB模型及CB模型。同時,從總體上看,改進的Bat?CB模型相對于CB模型,各個站點的預測能力均有所提升,在蒸發量較大的情況下,提升更為明顯。因此,Bat?CB模型的整體性能和預測能力強于CB模型和RF模型。

最后,針對我國西北部干旱、半干旱地區較大蒸發量的氣候狀況,本文分析了水面蒸發的季節性變化對于模型預測能力及穩定性的影響。3種模型預測指標的月平均值見表3。

目前,大多數機器學習模型在預測非平衡或有極大數值的數據集時經常表現出脆弱性和不穩定性[23]。由表3可知,在11月至3月,試驗區域的蒸發量較小,3種模型的性能相差不大,但在每年的4月至10月,Bat?CB模型相對于CB模型及RF模型的優勢逐漸顯露出來。RF模型在處理不平衡數據集時適應性較差的特點,在蒸發量季節性變化的預測之中體現得較為明顯。而從平均絕對百分比誤差(MAPE)指標上來看,Bat?CB模型在不同月份間沒有明顯差異,體現出較強的均衡性及穩定性。

表1 本文所選45個氣象站點的地理及氣象信息Tab.1 Geographical and meteorological information of the 45 stations selected for this study

表2 3種模型在中國西北部水面蒸發預測中的統計指標表現Tab.2 Statistical indicators of three machine learning models for predicting the pan evaporation in northwest China

圖2 隨機6個站點中水面蒸發量的實測值(OBS)及3個模型的預測值(FOR)繪制的散點圖

因此,綜合上述全部方面,Bat?CB模型整體上表現顯著優于CB模型及RF模型,并且在有較大變化的數據集中學習和訓練的過程中更為精確和穩定,適用于類似于干旱、半干旱地區水面蒸發量等有較大變化或季節性改變的預測領域。

3 結 論

本研究建立了一種新型的耦合了蝙蝠算法的CatBoost機器學習模型(Bat?CB),并評價了該模型在西北干旱、半干旱地區水面蒸發量預測中的應用。結果表明,Bat?CB模型在干旱和半干旱地區具有較好的準確性和穩定性,總體上明顯優于CatBoost模型和RF模型。CatBoost模型與RF模型相比具有非常小的優勢,并且RF模型對干旱地區的水面蒸發等不穩定變化的數據集的處理能力較差。與原CatBoost模型相比,耦合蝙蝠算法顯著提升了模擬精度。在季節性分析中,Bat?CB模型在不同月份中具有較好的均衡性,在4月至10月期間較RF模型和CatBoost模型表現出更強的準確度和穩定性。然而,本研究沒有考慮氣象輸入和更多氣候類型的參數組合,此外在極端氣候條件以及氣象資料缺失條件下的模型應用扔有待于進一步研究。

圖3 3種模型絕對誤差頻率分布直方圖

表3 測試階段3個模型統計指標的月平均值匯總Tab.3 Monthly average values of statistical indicators generated from the three machine learning models during the testing period

猜你喜歡
能力模型
一半模型
消防安全四個能力
幽默是一種能力
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
你的換位思考能力如何
努力拓展無人機飛行能力
無人機(2017年10期)2017-07-06 03:04:36
3D打印中的模型分割與打包
抄能力
主站蜘蛛池模板: 中文字幕第4页| 亚洲人成成无码网WWW| 麻豆国产在线不卡一区二区| www.99精品视频在线播放| 欧美69视频在线| 日韩av无码DVD| 久热这里只有精品6| 91精品国产91久久久久久三级| 99久久性生片| 在线看片中文字幕| 国产午夜精品一区二区三区软件| 久久女人网| 久久公开视频| 一区二区偷拍美女撒尿视频| 四虎永久免费网站| 日韩麻豆小视频| 成人午夜视频网站| 91一级片| 中文字幕在线日韩91| 亚洲天堂视频网站| 久久精品国产精品国产一区| 在线毛片网站| 狠狠操夜夜爽| 热re99久久精品国99热| 亚洲免费人成影院| 丝袜久久剧情精品国产| 怡红院美国分院一区二区| 好紧太爽了视频免费无码| 久久综合丝袜长腿丝袜| 狠狠色狠狠综合久久| 永久免费AⅤ无码网站在线观看| 99国产精品国产| 十八禁美女裸体网站| 国产地址二永久伊甸园| 国产视频大全| 国产美女视频黄a视频全免费网站| 亚洲成人一区二区| 2020最新国产精品视频| 91精品专区| 国产靠逼视频| 国产麻豆永久视频| 日韩123欧美字幕| 亚洲永久精品ww47国产| 无码精油按摩潮喷在线播放| 亚洲水蜜桃久久综合网站| 99在线视频免费| 三上悠亚一区二区| 亚洲嫩模喷白浆| 91香蕉国产亚洲一二三区| 亚洲三级片在线看| 天天摸天天操免费播放小视频| 国产在线观看99| 国产精品久久久久久搜索| 91在线激情在线观看| 又爽又大又黄a级毛片在线视频| 国产经典三级在线| 久久99久久无码毛片一区二区| 国产激情无码一区二区APP| 国产精品无码AⅤ在线观看播放| 久久这里只精品热免费99| 香蕉精品在线| 亚洲人成网站在线播放2019| 久久国产亚洲欧美日韩精品| 亚洲男人在线天堂| 日本一区高清| 71pao成人国产永久免费视频| 91久久夜色精品国产网站| 自偷自拍三级全三级视频| 欧美精品v欧洲精品| 国产在线观看第二页| 99热国产这里只有精品9九| 国产激情国语对白普通话| 亚洲综合婷婷激情| 18禁色诱爆乳网站| 日韩a级毛片| 亚洲AV永久无码精品古装片| 国产精品久线在线观看| 色妺妺在线视频喷水| 91小视频版在线观看www| 蜜芽国产尤物av尤物在线看| 不卡视频国产| 亚洲精品桃花岛av在线|