999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

極限梯度提升和長短期記憶網(wǎng)絡(luò)相融合的土壤溫度預(yù)測(cè)

2020-11-24 01:43:44李清亮蔡凱旋耿慶田劉光潔孫明玉于繁華
光學(xué)精密工程 2020年10期
關(guān)鍵詞:影響模型

李清亮,蔡凱旋,耿慶田,劉光潔,孫明玉,張 崳,于繁華

(長春師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,吉林 長春 130032)

1 引 言

土壤溫度作為大氣和陸地表面水熱循環(huán)共同作用的結(jié)果,是地球科學(xué)多個(gè)領(lǐng)域的重要變量,如氣象學(xué)[1-2],農(nóng)業(yè)[3-4]和環(huán)境科學(xué)[5]等。目前土壤溫度的測(cè)量過程過于復(fù)雜[6-7],無法在大部分區(qū)域提供監(jiān)測(cè)點(diǎn)。因此,準(zhǔn)確地土壤溫度預(yù)測(cè)具有顯著應(yīng)用價(jià)值。然而土壤溫度的時(shí)空變化受多種環(huán)境因素影響[8],給土壤溫度的準(zhǔn)確預(yù)測(cè)帶來巨大挑戰(zhàn),同時(shí)也使其成為具有深遠(yuǎn)意義的科學(xué)問題。目前基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)經(jīng)驗(yàn)?zāi)P褪峭寥罍囟阮A(yù)測(cè)一個(gè)重要的研究領(lǐng)域[2]。

近年來,隨著機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展,已在多種領(lǐng)域成功應(yīng)用[9-11]。其中基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)模型在土壤溫度預(yù)測(cè)中也取得了一定成果,最常見的有:人工智能神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)[12-14]、支持向量回歸(Support Vector Regression, SVR)[15-16]、極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)[1-2]。ANN由于可以模擬人腦組織結(jié)構(gòu)進(jìn)行推理的特點(diǎn),已被廣泛應(yīng)用于多種預(yù)測(cè)領(lǐng)域。在土壤溫度預(yù)測(cè)中,Mihalakakou等人[12]基于ANN模型取得了較好的預(yù)測(cè)性能。Kisi等人[13]指出土壤淺層預(yù)測(cè)時(shí)徑向基神經(jīng)網(wǎng)絡(luò)(Radial Basis Neural Network, RBNN)相比廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network, GRNN)、多層感知機(jī)(Multilayer Perceptron, MLP)和線性回歸(Linear Regression, LR)預(yù)測(cè)模型展示了更優(yōu)的預(yù)測(cè)性能。支持向量回歸(SVR)預(yù)測(cè)模型是由支持向量分類器(Support Vector Machines, SVM)發(fā)展而來,在土壤溫度預(yù)測(cè)中發(fā)揮了重要作用。Delbari等人[16]在伊朗地區(qū)的測(cè)試中,證明了SVR預(yù)測(cè)模型可以成功應(yīng)用在土壤溫度的預(yù)測(cè)。Feng等人[1]在中國陜西省的測(cè)試中,通過比較GRNN、反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)、隨機(jī)森林(Random Forests, RF) 和ELM的預(yù)測(cè)模型,發(fā)現(xiàn)ELM預(yù)測(cè)模型的預(yù)測(cè)能力最高。

然而,在前人研究主要基于ANN,SVR和ELM等方法實(shí)現(xiàn)土壤溫度預(yù)測(cè)。缺少其他機(jī)器學(xué)習(xí)算法如極限梯度提升(XGBoost)和長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)等研究。XGBoost是基于梯度下降方法,將多個(gè)弱分類器融合成一種強(qiáng)分類器,這種加強(qiáng)學(xué)習(xí)能力的模式,使XGBoost在多種領(lǐng)域的預(yù)測(cè)研究得到廣泛應(yīng)用[17-19]。同時(shí),具有記憶細(xì)胞的LSTM模型既可以學(xué)習(xí)其短期行為,也可以學(xué)習(xí)其長期行為。這種模式使LSTM在模擬自然系統(tǒng)時(shí)非常有用[20-22]。同時(shí)土壤溫度的影響因素很多,如太陽輻射、大氣溫度等,同時(shí)基于機(jī)器學(xué)習(xí)針對(duì)影響因素重要性的量化評(píng)價(jià)并結(jié)合預(yù)測(cè)模型的方式并未展開研究。事實(shí)上預(yù)測(cè)模型中不同影響因素的組合對(duì)預(yù)測(cè)能力有很大影響。

本文將在中國長白山和海北區(qū)域進(jìn)行測(cè)試,首先基于XGBoost計(jì)算土壤溫度預(yù)測(cè)中每個(gè)影響因素的重要性,然后將影響因素依據(jù)重要性大小依次進(jìn)行組合并作為預(yù)測(cè)模型的輸入,其中本文嘗試基于LSTM作為預(yù)測(cè)模型。最后根據(jù)不同組合的預(yù)測(cè)性能選擇最優(yōu)的影響因素。

2 數(shù)據(jù)與方法

2.1 研究區(qū)域概況

本文在中國東北部吉林省長白山地區(qū)(41°41′N,127°42′E至42°51′N,128°16′E)和中國西北部青海省海北地區(qū)(31°36′N,86°35′E至39°19′N,103°104′E)進(jìn)行了測(cè)試。 在FLUXNET(https://FLUXNET.fluxdata.org/)上下載了半小時(shí)尺度的三年數(shù)據(jù)(2003年1月1日至2005年12月31日),其影響因素分別為大氣溫度、相對(duì)濕度、太陽輻射、蒸汽壓、風(fēng)速、降水量和風(fēng)速,其中土壤溫度是在土壤深度為5 cm時(shí)觀測(cè)得到。長白山和海北都是我國重要的生態(tài)自然保護(hù)區(qū)。長白山地區(qū)以是種植業(yè)為主的農(nóng)業(yè)地域類型,發(fā)展商品谷物農(nóng)業(yè),主要種植大豆、玉米、冬小麥及谷子(小米)等。海北屬高原大陸性氣候,太陽輻射強(qiáng)度大,日照時(shí)間長,日夜溫差大,有利于油菜、青稞、馬鈴薯及蔬菜等種植業(yè)的發(fā)展。并且土壤溫度對(duì)這些資源的生長有很大影響,因此,土壤溫度預(yù)測(cè)對(duì)這些生態(tài)資源的保護(hù)和管理具有重要意義。

2.2 土壤溫度預(yù)測(cè)框架

本研究主要考慮兩個(gè)問題:(1)對(duì)于土壤溫度預(yù)測(cè)時(shí),不同影響因素起到不同作用,這些影響因素或其組合與土壤溫度間的關(guān)系如何?(2)土壤溫度預(yù)測(cè)是一種時(shí)間序列預(yù)測(cè)問題,哪一種機(jī)器學(xué)習(xí)算法最符合土壤溫度時(shí)間序列的機(jī)制?為了解決上述問題,本文提出XGBoost-LSTM融合模型, 如圖1所示。對(duì)于多個(gè)氣象數(shù)據(jù)來說,不同因素與土壤溫度之間的相關(guān)性不同。首先基于XGBoost對(duì)各個(gè)影響因素進(jìn)行排序。對(duì)排序后的影響因素,本文按其重要性依次進(jìn)行組合作為LSTM模型的輸入,找到效果最佳的輸入組合,進(jìn)而基于LSTM模型挖掘土壤溫度與其影響因素間的關(guān)聯(lián),并實(shí)現(xiàn)預(yù)測(cè)。

圖1 XGBoost-LSTM模型的土壤溫度預(yù)測(cè)流程圖Fig.1 Framework of XGBoost-LSTM

2.3 XGBoost模型

XGBoost是一種新的梯度提升機(jī)器Boosting算法。Boosting分類器作為集成學(xué)習(xí)模型,具有將弱分類器轉(zhuǎn)化為強(qiáng)分類器的能力。其核心是將多個(gè)準(zhǔn)確率較低的決策樹模型組合成一個(gè)準(zhǔn)確率較高的模型,通過不斷迭代生成決策樹,擬合殘差優(yōu)化目標(biāo)函數(shù),從而優(yōu)化預(yù)測(cè)效果。當(dāng)XGBoost 模型完成訓(xùn)練,本文針對(duì)影響因素在該模型的貢獻(xiàn)程度計(jì)算其重要性。具體方法如下:先計(jì)算特征j在單棵樹中的重要程度,即找到與特征j有關(guān)的結(jié)點(diǎn),計(jì)算該結(jié)點(diǎn)分裂前后的平方損失值,損失值越大說明該特征越重要。單個(gè)樹中特征j的計(jì)算方法如下:

(1)

(2)

通過式(1)和式(2)量化每個(gè)特征的重要程度后,即可實(shí)現(xiàn)特征排序。

2.4 LSTM模型

LSTM是一種重要的遞歸神經(jīng)網(wǎng)絡(luò)模型,具有記憶細(xì)胞的LSTM既可以學(xué)習(xí)土壤溫度與其環(huán)境因子之間的短期行為,也可以學(xué)習(xí)其長期行為。

圖2說明了LSTM的結(jié)構(gòu),其工作流程如下式所述:

圖2 LSTM流程圖Fig.2 Structure of LSTM

i(t)=σ(Wihh(t-1)+

Wixx(t)+Wicc(t-1)+bi),

(3)

f(t)=σ(Wfhh(t-1)+

Wfxx(t)+Wfcc(t-1)+bf),

(4)

c(t)=f(t)?c(t-1)+

i(t)?tanh(Wchh(t-1)+Wcxx(t)+bc,

(5)

o(t)=σ(Wohh(t-1)+

Woxx(t)+Wocc(t)+bo),

(6)

h(t)=o(t)?tanh(c(t)),

(7)

(8)

2.5 實(shí)驗(yàn)設(shè)置

本文在Intel Core(TM)i7-5820K,3.30 GHz CPU和64 Gb內(nèi)存的服務(wù)器上進(jìn)行實(shí)驗(yàn)。在Pycharm 2018.2.8,tensorflow作為工具實(shí)現(xiàn)所有預(yù)測(cè)模型。整個(gè)數(shù)據(jù)集的前四分之三部分(長白山和海北區(qū)域,2003年1月1日 00:00至2005年12月31日23:30階段的數(shù)據(jù),共計(jì)52 608個(gè))用于訓(xùn)練(2003年1月1日00:00至2005年4月1日12:30階段的數(shù)據(jù),共計(jì)39 456個(gè)),其余四分之一部分用于測(cè)試(2005年4月1日12:30至2005年12月31日23:30階段的數(shù)據(jù),總共13 152個(gè))。為了驗(yàn)證本文方法的有效性,通過與五種數(shù)據(jù)驅(qū)動(dòng)預(yù)測(cè)模型(LR,SVR,XGBoost,BPNN,ELM)作對(duì)比,并采用不同的統(tǒng)計(jì)評(píng)價(jià)標(biāo)準(zhǔn)評(píng)估模型性能,如均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、納什效率系數(shù)(NS)、LMI系數(shù)和威爾莫特一致性指數(shù)(WI),定義如下:

(9)

(10)

(11)

(12)

(13)

3 分析與討論

本章節(jié)主要對(duì)比了LR, SVR, XGBoost, BPNN, ELM 5種預(yù)測(cè)模型,并基于scikit-learn工具實(shí)現(xiàn)所有方法。XGBoost預(yù)測(cè)模型模型中,通過scikit-learn工具中提供的selection.GridSearchCV函數(shù)調(diào)整參數(shù),并優(yōu)化XGBoost模型。其以CART回歸樹作為XGBoost模型模型的二叉樹進(jìn)行構(gòu)建、學(xué)習(xí)率為0.005,葉子上的最小樣本數(shù)為1,樹的個(gè)數(shù)為800,最大深度為5。BPNN預(yù)測(cè)模型模型中,定義三層結(jié)構(gòu)(輸入層、隱藏層、輸出層),以平方誤差作為損失函數(shù),采用Adam進(jìn)行優(yōu)化,批處理數(shù)據(jù)量為200,迭代次數(shù)為300,學(xué)習(xí)率為1×10-5。ELM預(yù)測(cè)模型模型中,利用hpelm工具提供的elm函數(shù)對(duì)ELM進(jìn)行建模,初始化三層神經(jīng)元網(wǎng)絡(luò)(輸入層、隱藏層、輸出層),定義隱藏層的sigmoid激活函數(shù),設(shè)置節(jié)點(diǎn)數(shù)為128。通過實(shí)驗(yàn)對(duì)比,發(fā)現(xiàn)上述設(shè)置預(yù)測(cè)結(jié)果最好。

3.1 XGBoost-LSTM模型中LSTM結(jié)構(gòu)超參數(shù)的測(cè)試

本文方法中,影響預(yù)測(cè)性能的主要超參數(shù)有:LSTM神經(jīng)單元個(gè)數(shù)、批量數(shù)據(jù)大小、迭代次數(shù)、學(xué)習(xí)率、影響因素的選取。因此,下面本文將通過預(yù)測(cè)性能定義最優(yōu)的超參數(shù)。本文方法中,影響預(yù)測(cè)性能的主要超參數(shù)有:LSTM神經(jīng)單元個(gè)數(shù)、批量數(shù)據(jù)大小、迭代次數(shù)、學(xué)習(xí)率、影響因素的選取。

在測(cè)試LSTM神經(jīng)單元個(gè)數(shù)時(shí),首先定義迭代次數(shù)為200次,批量數(shù)據(jù)大小為200次,學(xué)習(xí)率為1×10-4,選取大氣溫度、相對(duì)濕度和蒸氣壓。在(30,50,100和150)中分別測(cè)試LSTM神經(jīng)單元個(gè)數(shù);同時(shí)選擇最優(yōu)的LSTM神經(jīng)單元個(gè)數(shù)后,再從(50,100,150,250,300,350,400,450,500)中選擇批量數(shù)據(jù)大小;其次從(100,200,300,400,500,600,800,1 000,1 100,1 200)中選擇迭代次數(shù);再從(1×10-3, 1×10-4, 1×10-5)中選擇學(xué)習(xí)率。最后等上述參數(shù)均選取最優(yōu)之后,本文LSTM預(yù)測(cè)模型的最優(yōu)結(jié)構(gòu)隨之確定。進(jìn)而針對(duì)影響因素的選取進(jìn)行測(cè)試,首先基于XGBoost算法計(jì)算所有影響因素(大氣溫度、相對(duì)濕度、太陽輻射、蒸汽壓、風(fēng)速、降水量和風(fēng)速)的特征重要性,并依據(jù)重要程度從高到低進(jìn)行組合,依次輸入LSTM預(yù)測(cè)模型中,并測(cè)試哪些組合對(duì)土壤溫度的預(yù)測(cè)更有幫助。其中LSTM預(yù)測(cè)模型輸入特征中的輸入維度(input_size)為影響因素的個(gè)數(shù);歷史數(shù)據(jù)序列的長度(time_step)定義為7。本文首先以長白山區(qū)域進(jìn)行實(shí)驗(yàn),不同LSTM神經(jīng)單元個(gè)數(shù)(LSTM_size)、批量數(shù)據(jù)大小(batch_size)、迭代次數(shù)(train_epoch)和學(xué)習(xí)率(e)的預(yù)測(cè)結(jié)果分別如表1~表5所示(表中加粗?jǐn)?shù)值為最優(yōu)結(jié)果)。從表1可知,參數(shù)取值不同,預(yù)測(cè)模型的預(yù)測(cè)能力也不一樣。首先LSTM神經(jīng)單元個(gè)數(shù)過多,預(yù)測(cè)模型將過擬合,降低預(yù)測(cè)模型學(xué)習(xí)氣象數(shù)據(jù)的泛化能力,同時(shí)個(gè)數(shù)太少,預(yù)測(cè)模型將遺失重要信息并無法有效挖掘土壤溫度與其影響因素間的關(guān)聯(lián),因此LSTM_size=50時(shí),預(yù)測(cè)性能最好(RMSE=2.413,MAE=1.893,NS=0.921,WI=0.980,LMI=0.740);從表2可知,若迭代次數(shù)太小,預(yù)測(cè)模型無法收斂于最優(yōu)值,而迭代次數(shù)太大,將明顯出現(xiàn)過擬合現(xiàn)象,預(yù)測(cè)性能將不會(huì)提升, 因此train_epoch=1 100時(shí),預(yù)測(cè)性能最好(RMSE=2.234,MAE=1.756,NS=0.932,WI=0.983,LMI=0.759);同理,從表3可知批量數(shù)據(jù)主要控制著訓(xùn)練過程一次處理樣本的信息,過小將導(dǎo)致預(yù)測(cè)模型難于收斂,過大將導(dǎo)致預(yù)測(cè)模型性能無法達(dá)到最優(yōu), 因此batch_size=400時(shí),預(yù)測(cè)性能最好(RMSE=2.392,MAE=1.875,NS=0.922,WI=0.981,LMI=0.743);最后從表4可知學(xué)習(xí)率是控制訓(xùn)練過程中每一次逼近最優(yōu)值的步長,過小容易選入局部最優(yōu),而過大將無法逼近最優(yōu)值并在最優(yōu)值附近不斷徘徊。因此當(dāng)LSTM_size=50,batch_size=400,train_epoch=1 100,e=1×10-4時(shí)性能最佳,進(jìn)而通過確定上述參數(shù),本文得到了最優(yōu)的LSTM預(yù)測(cè)模型結(jié)構(gòu)。

表1 不同LSTM神經(jīng)單元個(gè)數(shù)在長白山氣象站的預(yù)測(cè)結(jié)果

表2 不同批量數(shù)據(jù)大小在長白山氣象站的預(yù)測(cè)結(jié)果

表3 不同迭代次數(shù)在長白山氣象站的預(yù)測(cè)結(jié)果

表4 不同學(xué)習(xí)率在長白山氣象站的預(yù)測(cè)結(jié)果

3.2 XGBoost-LSTM選取影響因素

得到最優(yōu)LSTM預(yù)測(cè)模型結(jié)構(gòu)后,然后分析影響因素的組合對(duì)預(yù)測(cè)能力的影響,XGBoost-LSTM預(yù)測(cè)模型的整體的數(shù)據(jù)處理流程如圖3所示。首先根據(jù)2.3節(jié)XGBoost部分計(jì)算所有影響因素的重要性,如圖4所示。同時(shí)在XGBoost模型計(jì)算影響因素重要性的過程中,分別對(duì)XGBoost模型訓(xùn)練中學(xué)習(xí)率、樹的個(gè)數(shù)為800和樹的最大深度所對(duì)應(yīng)的平方損失減少值進(jìn)行分析,以選取最優(yōu)參數(shù),對(duì)比結(jié)果如表5所示。 當(dāng)學(xué)習(xí)率為0.005,樹的個(gè)數(shù)為800,最大深度為5時(shí),平方損失減少值最優(yōu)(-0.078 481)。

表5 不同參數(shù)的XGBoost模型性能對(duì)比

圖3 XGBoost-LSTM整體流程Fig.3 Framework of XGBoost-LSTM model

圖4 影響因素重要性得分Fig.4 Weight of the meteorological inputs

最終通過實(shí)驗(yàn)可知,影響因素重要性由高低排序如下:大氣溫度、蒸汽壓、太陽輻射、相對(duì)濕度、風(fēng)速、大氣壓和降水量。然后根據(jù)影響因素重要性,通過逐步組合生成7種預(yù)測(cè)模型輸入:大氣溫度(輸入1),大氣溫度+太陽輻射(輸入2),大氣溫度+太陽輻射+蒸汽壓(輸入3),大氣溫度+太陽輻射+蒸汽壓+相對(duì)濕度(輸入4),大氣溫度+太陽輻射+蒸汽壓+相對(duì)濕度+風(fēng)速(輸入5),大氣溫度+太陽輻射+蒸汽壓+相對(duì)濕度+風(fēng)速+大氣壓(輸入6),大氣溫度+太陽輻射+蒸汽壓+相對(duì)濕度+風(fēng)速+大氣壓+降水量(輸入7)。

最后基于LSTM預(yù)測(cè)模型對(duì)對(duì)上述7組合進(jìn)行測(cè)試,以找到最優(yōu)的影響因素組合,如表6所示。根據(jù)實(shí)驗(yàn)可知,以大氣溫度、太陽輻射和蒸汽壓3種組合作為輸入,可以得到更好的預(yù)測(cè)結(jié)果。

表6 不同輸入組合的預(yù)測(cè)結(jié)果

3.3 不同數(shù)據(jù)驅(qū)動(dòng)模型的對(duì)比

圖5展示了在長白山區(qū)域,本文方法與目前常用的5種數(shù)據(jù)驅(qū)動(dòng)模型的散點(diǎn)圖對(duì)比。從圖5可知,本文方法得到的土壤溫度預(yù)測(cè)值(y)和觀測(cè)值(x)之間的線性關(guān)系(y=0.980 6x+0.210 7)更接近理想線(y=x),同時(shí)相比其它數(shù)據(jù)驅(qū)動(dòng)模型也得到了最高的R2(R2=0.934 2)。需要注意的是LR模型雖然具有最高R2,但其線性關(guān)系相較于其他數(shù)據(jù)驅(qū)動(dòng)模型具有較大差距。因此表明本文方法在長白山區(qū)域預(yù)測(cè)效果最好。圖6展示了海北區(qū)域散點(diǎn)圖對(duì)比結(jié)果。其中,ELM預(yù)測(cè)模型預(yù)測(cè)結(jié)果相比本文模型更接近于線性關(guān)系,但由于其在長白山的表現(xiàn)一般,表現(xiàn)出其不穩(wěn)定性。綜合兩區(qū)域散點(diǎn)圖的線性關(guān)系可知,本文方法效果最佳。

圖5 長白山區(qū)域溫度預(yù)測(cè)值與真實(shí)值的數(shù)據(jù)驅(qū)動(dòng)散點(diǎn)圖Fig.5 Scatterplots of the estimated and observed values of temperature(℃) using the data-driven models for Changbai Mountain metrological station

圖6 海北區(qū)域溫度預(yù)測(cè)值與真實(shí)值的數(shù)據(jù)驅(qū)動(dòng)散點(diǎn)圖Fig.6 Scatterplots of the estimated and observed values of temperature (°C) using the data-driven models for Haibei Mountain metrological station

表7和表8指出了不同數(shù)據(jù)驅(qū)動(dòng)模型在長白山和海北區(qū)域性能數(shù)據(jù)統(tǒng)計(jì)對(duì)比。可知,本文方法在長白山站點(diǎn)得到的RMSE,MAE,RAME都比其他數(shù)據(jù)驅(qū)動(dòng)模型的值小,同時(shí)WI,LMI的值最高。在海北站區(qū)域中,ELM預(yù)測(cè)模型的RMSE值優(yōu)于本文方法,但NS,LMI出現(xiàn)異常結(jié)果。其原因可能是ELM是一種隨機(jī)選擇隱層權(quán)值的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這種隨機(jī)性使預(yù)測(cè)模型訓(xùn)練時(shí)產(chǎn)生非最優(yōu)解,從而影響預(yù)測(cè)結(jié)構(gòu)[1]。綜上所述,本文方法在不同站點(diǎn)的土壤溫度預(yù)測(cè)中都優(yōu)于其他數(shù)據(jù)驅(qū)動(dòng)模型。

表7 長白山地區(qū)不同數(shù)據(jù)驅(qū)動(dòng)模型的性能對(duì)

表8 海北地區(qū)不同數(shù)據(jù)驅(qū)動(dòng)模型的性能對(duì)

4 結(jié) 論

然而,在前人研究主要基于ANN、SVR和ELM等方法實(shí)現(xiàn)土壤溫度預(yù)測(cè)。缺少其它機(jī)器學(xué)習(xí)算法如極限梯度提升(XGBoost)和長短期記憶網(wǎng)絡(luò)(LSTM)等研究。XGBoost是基于梯度下降方法,融合多個(gè)弱分類器成為一種強(qiáng)分類器,這種加強(qiáng)學(xué)習(xí)能力的模式,使XGBoost在多種領(lǐng)域的預(yù)測(cè)研究得到廣泛應(yīng)用。同時(shí),具有記憶細(xì)胞的LSTM模型既可以學(xué)習(xí)其短期行為,也可以學(xué)習(xí)其長期行為。這種模式使LSTM在模擬自然系統(tǒng)時(shí)非常有用。同時(shí)土壤溫度的影響因素很多,如太陽輻射、大氣溫度等。但基于機(jī)器學(xué)習(xí)針對(duì)影響因素重要性的量化評(píng)價(jià),并結(jié)合預(yù)測(cè)模型的方式并未展開研究。事實(shí)上,預(yù)測(cè)模型中不同影響因素的組合對(duì)預(yù)測(cè)能力有很大影響。

本文將在中國長白山和海北區(qū)域進(jìn)行測(cè)試,首先基于XGBoost計(jì)算土壤溫度預(yù)測(cè)中每個(gè)影響因素的重要性,然后將影響因素依據(jù)重要性大小依次進(jìn)行組合并作為預(yù)測(cè)模型的輸入,其中本文將嘗試基于LSTM作為預(yù)測(cè)模型。最后根據(jù)不同組合的預(yù)測(cè)性能選擇最優(yōu)的影響因素。通過實(shí)驗(yàn)結(jié)果表明本文提出的預(yù)測(cè)模型與目前土壤溫度中常用的數(shù)據(jù)驅(qū)動(dòng)模型,在預(yù)測(cè)結(jié)果散點(diǎn)圖和準(zhǔn)確度統(tǒng)計(jì)結(jié)果的對(duì)比中,均表現(xiàn)出更高的精確度。

然而由于FLUXNE采集數(shù)據(jù)限制,本文主要針對(duì)白山和海北區(qū)域中5 cm土壤深度進(jìn)行實(shí)驗(yàn)。不同的土壤深度和更多的觀測(cè)站點(diǎn)對(duì)預(yù)測(cè)模型性能的影響需要進(jìn)一步研究。同時(shí)在實(shí)驗(yàn)過程中發(fā)現(xiàn),不同損失函數(shù)的使用導(dǎo)致預(yù)測(cè)結(jié)果不同,因此針對(duì)損失函數(shù)改進(jìn)對(duì)預(yù)測(cè)能力的影響是必要的。

猜你喜歡
影響模型
一半模型
是什么影響了滑動(dòng)摩擦力的大小
哪些顧慮影響擔(dān)當(dāng)?
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
沒錯(cuò),痛經(jīng)有時(shí)也會(huì)影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴(kuò)鏈劑聯(lián)用對(duì)PETG擴(kuò)鏈反應(yīng)與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對(duì)跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 欧美综合在线观看| 亚国产欧美在线人成| 欧美成人亚洲综合精品欧美激情| 亚洲视频二| 亚洲欧美日韩天堂| 高清欧美性猛交XXXX黑人猛交| 久久久久久国产精品mv| 99人妻碰碰碰久久久久禁片| 18禁影院亚洲专区| 亚洲无码高清视频在线观看| 亚洲女同欧美在线| 成人精品午夜福利在线播放| 国产一区二区丝袜高跟鞋| 一区二区午夜| 亚洲六月丁香六月婷婷蜜芽| 欧美怡红院视频一区二区三区| 91色国产在线| 亚洲国产欧美国产综合久久| 欧美亚洲国产精品第一页| 午夜视频日本| 国产午夜一级毛片| 人人91人人澡人人妻人人爽| 亚洲V日韩V无码一区二区| 日韩福利在线观看| 亚洲国产精品无码久久一线| 26uuu国产精品视频| 成人国产精品网站在线看| 高清无码不卡视频| 久久国产精品电影| 天堂成人在线| 58av国产精品| 亚洲成人黄色在线| 97青草最新免费精品视频| 亚洲精品无码专区在线观看| 制服丝袜 91视频| 欧美日韩北条麻妃一区二区| 91视频首页| 九九热精品免费视频| 91娇喘视频| 青青草国产免费国产| 中文字幕乱码二三区免费| 国产尤物jk自慰制服喷水| 国产91小视频| 久久香蕉国产线看观看亚洲片| 欧美亚洲第一页| 毛片久久久| 欧美成人看片一区二区三区| 999国内精品久久免费视频| 国产欧美另类| 国产白浆一区二区三区视频在线| 在线免费不卡视频| 九色在线观看视频| 欧美在线综合视频| 女同国产精品一区二区| 99久久国产精品无码| 亚洲日韩精品无码专区97| 欧美日韩亚洲国产| 精品国产网| 99久久国产综合精品2020| 国产精品永久不卡免费视频| 亚洲性视频网站| 亚洲综合色吧| 一级全黄毛片| 91综合色区亚洲熟妇p| 久久久久人妻一区精品色奶水| 国产无码性爱一区二区三区| 一级毛片免费播放视频| 久久精品中文字幕免费| 久久综合伊人 六十路| 亚洲国产欧洲精品路线久久| 波多野结衣久久精品| 亚洲色图欧美| 亚洲av成人无码网站在线观看| 国产美女在线观看| 毛片在线播放网址| 欧美激情伊人| 日本91视频| 国产高清在线丝袜精品一区| 精品色综合| 十八禁美女裸体网站| 精品无码一区二区三区电影| 四虎成人在线视频|