999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

BP神經網絡和隨機森林預測土壤有機質模型研究

2023-07-29 01:04:51陳道坤周海華紅梅孫遠何濤胡翩
安徽農學通報 2023年10期

陳道坤 周海 華紅梅 孫遠 何濤 胡翩

摘要 為提高土壤有機質(SOM)含量預測精度和模型的適用性,提出了1種隨機森林回歸(RFR)和BP神經網絡結果加權融合模型(BP-RFR),對土壤有機質含量進行預測。選取陜西安康盆地研究區40個樣點數據,對比分析RFR、BP神經網絡和BP-RFR模型預測效果,使用決定系數([R2])、平均絕對百分比誤差(MAPE)和均方誤差(MSE)來評估模型性能。結果表明,BP-RFR、BP和RFR 模型三者預測值與實測值的決定系數([R2])分別為0.954 5、0.951 4、0.933 5,MAPE分別為0.037 7、0.045 1、0.091 8,MSE分別為1.837 7、1.961 1、2.686 8。綜合分析可知,BP-RFR模型預測精度效果優于BP神經網絡、隨機森林回歸(RFR)模型,因此結果加權融合模型(BP-RFR)能夠用于土壤有機質含量的預測。

關鍵詞 土壤有機質;隨機森林;BP神經網絡;結果加權融合

中圖分類號 S156.8? ?文獻標識碼 A

文章編號 1007-7731(2023)10-0124-05

BP neural network and random forest to predict the accuracy of soil organic matter

CHEN Daokun ZHOU Hai HUA Hongmei? ?SUN Yuan1? ?HE Tao HU Pian

(1School of Earth and Environment, Anhui University of Science & Technology,Huainan Anhui 232001;

2Xi'an Center of Mineral Resources Survey, China Geological Survery, Xi'an Shaanxi 710100;

3Civil-military Integration Center of Geological Survey, China Geological Survey, Chengdu Sichuan 610036)

Abstract To improve the accuracy of soil organic matter content (SOM) prediction and the applicability of the model in improving the accuracy of prediction, a multiple regression model was established to analyze soil organic matter to obtain better prediction accuracy. Data from 40 sample sites in the study area of the Ankang Basin were selected for comparative analysis of random forest regression (RFR), BP neural network and weighted fusion model (BP-RFR), and the performance of the model was evaluated using the coefficient of determination ([R2] mean absolute percentage error (MAPE) and mean square error (MSE). The results showed that the determination coefficients [R2]) of the predicted and measured values of BP-RFR, BP and RFR models were 0.954 5, 0.951 4 and 0.933 5, respectively, MAPE was 0.037 7, 0.045 1 and 0.091 8, MSE was 1.837 7, 1.961 1 and 2.686 8. Comprehensive analysis showed that the prediction accuracy of BP-RFR model was higher than that of BP neural network, followed by random forest regression (RFR) model. Therefore, the weighted fusion of results can improve the overall prediction accuracy of the model.

Keywords soil organic matter; random forest; BP neural network; results weighted fusion

近年來,隨著人工智能技術的快速發展,國內外眾多學者廣泛使用機器學習方法與SOM含量預測相結合,如隨機森林(RF)、BP神經網絡、支持向量機(SVM)等方法來進行預測研究[1-2]。機器學習原理是對象及其相互關系的數學表示,其中隨機森林(RF)是由決策樹發展而來的一種自然的非線性建模工具,計算效率高具有對多元共線性不敏感易克服過度擬合等特點,能夠準確刻畫變量間的非線性關系[3]。楊煜岑等[4]運用RF對陜西省周至縣農耕區進行土壤SOM進行預測,其預測結果相關系數為0.782。BP神經網絡作為成熟有監督的機器學習算法具有操作簡單、可塑性好的優點,但是BP神經網絡是基于最速下降法或者擬牛頓法,因而會不可避免會導致陷入全局最優或者過度擬合等缺點[5]。楊文靜等[6]使用BP神經網絡對青藏高原土壤養進行評價得出模型R2效果較好。單一模型存在不同的缺陷,但也具有各自的優勢,模型間不是相互間對立排斥,而是相互聯系和補充的。因此,有學者通過適當的方式將單一的模型進行融合,充分利用各模型的優勢來提高模型的預測精度和可靠性,如國佳欣等[7]采用PLSR-BP復合模型對紅壤有機質含量進行反演,其結果表現優于單一模型精度。

本研究以陜西安康盆地土壤SOM含量為研究對象,基于實測樣品化驗數據,運用BP神經網絡和隨機森林并將其結果加權進行模型融合方法來對土壤有機質含量預測,根據模型預測結果對融合模型預測效果進行評價,為模型的可行性提供參考。

1 材料與方法

1.1 數據來源與預處理

樣點布設依據DZ/T 0295—2016《土地質量地球化學評價規范》,按照1∶50 000布設采樣點,共設計采樣點位40個,采樣深度為0~20 cm。并在每個采樣點20~50 m附近進行“X”型多點等量混合采樣組合成一件樣品,樣品采集后自然晾干,剔除樹枝、根系、石塊、蟲體等雜質,過10~60目鋼篩后采用四分法混合留取做好標記保存裝入樣品瓶。土壤pH值采用上海雷磁儀器廠PHS-3C酸度計測定;全氮和銨態氮、硝態氮測定分別使用凱氏定氮法和比色法;采用日本島津制造ICPS-7500型電感耦合等離子體發射光譜儀測定土壤全磷、全鉀;使用日本島津制造UV-2600紫外可見分光光度計測定土壤全硫、硫化物;采用日本島津制造AA-7000型原子吸收分光光度計測定土壤有機質和腐殖質。土壤各參數測定結果均符合相關標準方法的質量控制與要求。

為預防化驗結果原始數據集具有一定的分布規律,將數據集隨機打亂,使得訓練集和測試集的每一部分數據比較有代表性,模型學習曲線平滑,數據集隨機打亂可防止模型過擬合,提高模型的泛化能力。40個樣品數據以8∶2的比例劃分訓練集和測試集,將pH、全氮、全磷、全鉀、全硫、硫化物、銨態氮、硝態氮、腐殖質共9個參數作為模型的輸入參數,有機質作為模型的輸出參數。

歸一化方法泛指把數據特征轉換為相同尺度的方法,是一種無量綱處理手段,簡化計算,縮小量值的有效辦法。能夠使訓練誤差達到最小,提高計算過程的收斂速度。對訓練數據進行最大最小值歸一化處理,處理后的變量取值范圍為[0,1]之間,其計算公式如下:

1.2 模型建立

1.2.1 BP神經網絡。BP神經網絡是1種按照誤差逆向傳播算法訓練的多層前饋神經網絡,具有任意復雜的模式分類能力和優良的多維函數映射能力而被廣泛運用。本研究以Python為編程軟件,BP神經網絡隱藏層過多會導致模型復雜化,出現過擬合問題。3層網絡結構能很好地滿足研究需求,所以本研究建立由輸入層、隱藏層和輸出層構成的3層BP神經網絡結構。輸入層節點數為9個,輸出層系節點數為1。隱藏層節點數的過多或過少都會影響模型的預測效果,當神經網絡選擇合適的節點,可獲得更優的預測效果。最佳隱藏層節點數計算公式如下:

1.2.2 機器學習模型構建。基于預處理的數據集通過構建支持向量回歸機(SVR)、K近鄰(KNN)、決策樹(DT)、隨機森林回歸(RFR)、Lasso回歸模型。運用訓練數據集訓練機器學習模型從中選擇最優模型。

1.2.2.1 支持向量回歸機(SVR)。支持向量回歸機(SVR)是支持向量機(SVM)的重要應用分支,是一種在高維特征空間中構建線性決策函數的新型學習方法[8]。SVR回歸是找到一個回歸平面,讓一個集合的所有數據到該平面的距離最近。該模型是基于結構風險最小化的原理,能夠快速處理小樣本問題和非線性問題,能夠使建立的模型與實際情況間的偏差和錯誤概率最小。

1.2.2.2 K近鄰(KNN)。K近鄰(KNN)核心算法思想為如果一個樣本在特征空間中的K個最相似(即特征空間中最鄰近)的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別[9]。該方法在定類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。使用KNN計算某個數據點的預測值時,模型會從訓練數據集中選擇離該數據點最近的k個數據點,并且把他們的y值取均值,把該均值作為新數據點的預測值。

1.2.2.3 決策樹(DT)。決策樹(DT)算法是使用逼近離散函數值的思想,決策樹回歸就是根據特征向量來決定對應的輸出值[10]。該模型簡單直觀,生成的決策樹很直觀, 對于異常值的容錯能力好,健壯性高等特點。

1.2.2.4 隨機森林回歸(RFR)。隨機森林回歸(RFR)是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數而定。它通過對原始數據的隨機抽取多個樣本形成子數據,每個子數據集進行決策樹建模組合成多個決策樹的預測模型,最后根據各個決策數模型的平均值來獲得最終預測結果[11]。

1.2.2.5 Lasso回歸。Lasso通過構造一個懲罰函數得到一個較為精煉的模型,使得它壓縮一些系數,同時設定一些系數為0[12],因此保留了子集收縮的優點,是一種處理具有復共線性數據的有偏估計。Lasso對于數據的要求是極其低的,具有很強的解釋力。

1.2.3 模型融合。模型融合是將多個訓練模型按照一定的方法進行集成,這種方式具有構成簡單,易于理解,增強模型效果等特點。模型融合的集成方法分為平均法、投票法、學習法。本研究使用平均法進行融合,根據各個模型的結果表現分配不同的權重,來改變其對最終結果的影響大小。結果加權融合具有容易理解、簡單高效和效果突出的特點,結果加權融合模型的預測能力強于單個模型。其計算公式如下:

1.3 模型效果評價指標

為了評估BP神經網絡、隨機森林(RF)以及結果加權融合模型(BP-RFR)的預測效果,本研究采用決定系數([R2]),平均絕對百分比誤差(MAPE)和均方誤差(MSE)來衡量實測值與預測的一致性[13]。

2 結果與分析

2.1 機器學習模型選擇

通過樣本數據集來構建5種機器學習算法,來測試機器學習模型效果。這5種機器學習模型如下:支持向量機(SVR)、K近鄰(KNN)、決策樹(DT)、隨機森林回歸(RFR)、Lasso回歸。每個模型得到均方差結果如圖2所示。

通過對比各模型均方誤差,發現隨機森林回歸(RFR)模型表現出最佳MSE,這樣有利于和BP神經網絡進行模型融合,提高模型的預測性能。

2.2 模型效果對比

使用公式(3)將BP神經網絡和隨機森林(RFR)進行預測結果直接加權組成BP-RFR模型。通過對比BP、RFR和BP-RFR模型對土壤有機質進行預測,3種模型土壤有機質預測值與實際值的決定系數(R2)、平均絕對百分比誤差(MAPE)和均方誤差(MSE)進行誤差分析判斷模型預測能力如表2所示。

通過模型對比分析,BP-RFR模型要明顯優于BP神經網絡和隨機森林回歸(RFR)對土壤有機質預測。BP神經網絡預測SOM結果與RFR模型相比的MAPE和MSE分別下降了0.046 7、0.725 7,決定系數(R2)提升了0.017 9。BP-RFR模型預測SOM結果與BP神經網絡模型相比的MAPE和MSE分別下降了0.007 4、0.123 4,決定系數(R2)提升了0.003 1。3種模型預測結果表明,BP-RFR模型在預測誤差、模型擬合度均優于BP神經網絡和隨機森林回歸(RFR)模型,能夠更好地捕捉自變量與SOM含量復雜的非線性關系。將各模型的預測結果進行反歸一化處理,將預測值映射回原來的量綱中。從圖3可以看出,BP神經網絡模型個別點預測值能夠較好接近實測值,但BP-RFR模型整體上的預測值更加接近實測值,強于BP神經網絡提高了模型的整體預測性能。

3 結論

本文構建單一模型(RFR、BP)和結果加權融合模型(BP-RFR)預測SOM含量,比較分析各模型的預測精度,得出如下結論:BP-RFR模型預測精度最高,表現為決定系數([R2])為0.954 5,平均絕對百分比誤差(MAPE)和均方誤差(MSE)分別為0.037 7、1.837 7,均優于單一模型。因此,可采用結果加權融合模型(BP-RFR)來預測土壤有機質的含量。

4 致謝

感謝中國地質調查局西安礦產資源調查中心田輝對本研究的樣品數據支撐,在此對“南水北調漢中流域陜西段水生態修復支撐調查”項目組成員一并致謝。

參考文獻

[1] HUANG D Y,LIU H T,ZHU L,et al. Soil organic matter determination based on artificial olfactory system and PLSR-BPNN[J]. Measurement Science and Technology,2021,32(3):035801.

[2] 張鑫,楊超,劉洪斌,等. 基于機器學習的植煙區土壤有機質和全氮含量預測[J]. 煙草科技,2022,55(8):20-27.

[3] ZHANG H,WU P B,YIN A J,et al. Prediction of soil organic carbon in an intensively managed reclamation zone of eastern China:A comparison of multiple linear regressions and the random forest model[J]. Science of The Total Environment,2017,592:704-713.

[4] 楊煜岑,楊聯安,任麗,等. 基于隨機森林的農耕區土壤有機質空間分布預測[J]. 浙江農業學報,2018,30(7):1211-1217.

[5] 韓磊,李銳,朱會利. 基于BP神經網絡的土壤養分綜合評價模型[J]. 農業機械學報,2011,42(7):109-115.

[6] 楊文靜,王一博,劉鑫,等. 基于BP神經網絡的青藏高原土壤養分評價[J]. 冰川凍土,2019,41(1):215-226.

[7] 國佳欣,趙小敏,郭熙,等. 基于PLSR-BP復合模型的紅壤有機質含量反演研究[J]. 土壤學報,2020,57(3):636-645.

[8] 陳思明,王寧,秦艷芳,等. 基于特征變量與支持向量機回歸克里格(SVRK)法的濕地土壤有機質空間變異特征分析[J]. 土壤,2020,52(6):1298-1305.

[9] 毋雪雁,王水花,張煜東. K最近鄰算法理論與應用綜述[J]. 計算機工程與應用,2017,53(21):1-7.

[10] 楊學兵,張俊. 決策樹算法及其核心技術[J]. 計算機技術與發展,2007,17(1):43-45.

[11] 方匡南,吳見彬,朱建平,等. 隨機森林方法研究綜述[J]. 統計與信息論壇,2011,26(3):32-38.

[12] RANSTAM J,COOK J A. LASSO regression[J]. British Journal of Surgery,2018,105(10):1348.

[13] CHICCO D,WARRENS M J,JURMAN G. The coefficient of determination R-squared is more informative than SMAPE,MAE,MAPE,MSE and RMSE in regression analysis evaluation[J]. PeerJ. Computer Science,2021,7:e623.

(責編:張宏民)

主站蜘蛛池模板: 情侣午夜国产在线一区无码| 国产理论一区| 欧美在线视频不卡第一页| 在线观看国产黄色| 亚洲欧美天堂网| 呦女精品网站| 亚洲天堂色色人体| 国产成人av大片在线播放| 亚洲成aⅴ人片在线影院八| 在线色综合| 亚洲AV电影不卡在线观看| 亚洲欧洲一区二区三区| 免费无码AV片在线观看中文| 婷婷综合缴情亚洲五月伊| 一本色道久久88| 色婷婷综合在线| 玖玖精品在线| 国内熟女少妇一线天| 秘书高跟黑色丝袜国产91在线| 免费观看无遮挡www的小视频| 国产成人1024精品下载| 五月婷婷亚洲综合| 欧美激情成人网| 国产成人精品2021欧美日韩| 一区二区影院| 97一区二区在线播放| 在线中文字幕网| 日本成人福利视频| 五月综合色婷婷| 亚洲人视频在线观看| 综合人妻久久一区二区精品 | 欧美高清视频一区二区三区| 精品国产成人a在线观看| 高潮爽到爆的喷水女主播视频 | 黄色在线网| 欧美一区二区三区欧美日韩亚洲 | 亚洲天天更新| 国产人成乱码视频免费观看| 国产香蕉在线视频| 国模粉嫩小泬视频在线观看| 999国产精品永久免费视频精品久久| 亚洲综合婷婷激情| 91精品情国产情侣高潮对白蜜| 国产成人h在线观看网站站| 国产又粗又猛又爽| 中文无码精品A∨在线观看不卡 | 丁香婷婷在线视频| 国产乱子精品一区二区在线观看| 免费毛片a| 亚洲综合欧美在线一区在线播放| 国产在线精彩视频二区| 国产69囗曝护士吞精在线视频| 日韩无码视频网站| 国禁国产you女视频网站| 亚洲成人免费看| 欧美一级高清视频在线播放| 在线观看免费国产| 97成人在线观看| 热久久这里是精品6免费观看| 露脸真实国语乱在线观看| 久久免费精品琪琪| 欧洲亚洲一区| 欧美日韩国产综合视频在线观看| 日本不卡在线播放| 亚洲黄色激情网站| 五月六月伊人狠狠丁香网| 国产久操视频| 在线精品欧美日韩| 99精品国产自在现线观看| 日本精品一在线观看视频| 久久99国产综合精品女同| 亚洲午夜福利精品无码| 真人免费一级毛片一区二区| 亚洲最大福利视频网| 亚洲一区第一页| 亚洲第一成年免费网站| 99久久精品免费观看国产| 欧美日韩一区二区在线播放| 无码专区在线观看| 在线观看免费AV网| 91久久精品国产| 老司机午夜精品视频你懂的|