999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的污染土壤修復變量分類與評價

2021-04-29 03:13:26曹書苗柯希彪湯引生李軍富
環(huán)境科技 2021年2期
關鍵詞:分類實驗評價

郭 琳,曹書苗,柯希彪,劉 俊,湯引生,李軍富

(1.商洛學院 電子信息與電氣工程學院,陜西 商洛 726000;2.西安建筑科技大學 陜西省環(huán)境工程重點實驗室,陜西 西安 710055;3.商洛學院 化學工程與現(xiàn)代材料學院,陜西 商洛 726000)

0 引言

污染土壤修復研究具有保障耕地安全、修復生態(tài)環(huán)境和土地資源再利用等方面的重要意義,是當前技術研究和應用的熱點。通常,檢驗一種修復方法的優(yōu)劣主要看是否達到土壤環(huán)境質量、肥力質量和健康質量等目標參數(shù)[1],內容涉及污染物降低程度、生態(tài)功能恢復程度和農產品安全性等方面。但是對于尾礦庫、垃圾填埋場等污染程度高、修復難度大的復雜污染場地[2],不僅需要成熟的技術,還要考慮修復周期、成本投入和資源綜合利用等因素。傳統(tǒng)的土壤修復效率評估采用權重法,累計每個變量指標所占百分比,再結合土壤重金屬消解率計算修復效率。但固定的變量指標及權重無法適應動態(tài)修復過程,容易導致結果出現(xiàn)較大誤差。隨著人工智能技術的發(fā)展應用,研究者開始關注效率高、成本低的智能精細修復技術,利用算法或者模型來完成修復變量特征的表征[3],再通過規(guī)則構造評價權重集,最后用匹配模型實現(xiàn)結果評價和分析。鄭燊燊等[4]模擬電動修復Cd 污染土壤,利用不同位置下pH 值與Cd 濃度關系為基礎,首次建立DBLM 模型預測修復效果;金晶煒等[5]提出以生菜砷吸收量等為指標,利用灰色關聯(lián)和聚類分析法定量聚類評價修復貢獻值;郝安峰等[6]在PLC 控制的工控機上安裝修復軟件,模擬測控污染土壤修復過程,實時確定土壤物理參數(shù)和控制參數(shù);王兵等[7]采用層次分析與優(yōu)劣解距離法建立評價體系,解決指標權重和排序問題,并實施了室內試驗校核;馬科峰等[8]和魏樹和等[9]幾乎同時總結了電動-植物修復重金屬污染土壤的最新研究數(shù)據(jù),為定量評價奠定了基礎。以上研究是基于實驗室盆栽富集植物,開展強化修復重金屬污染土壤,解決單一或主要因素下電動修復與富集植物吸收的自適應問題,而通用型的定量評價與主動干預方法有待繼續(xù)研究。本文提出一種融合策略,利用隨機森林算法中的集成學習策略和灰色關聯(lián)度法中相似行為映射結果的客觀科學性,充分發(fā)揮快速主動干預優(yōu)勢,建立土壤修復變量分類評價模型,并通過重金屬污染土壤修復測試加以驗證。

1 修復變量分類方法

1.1 分類與評價整體流程

尾礦庫或礦場礦渣主要包含金屬氧化物的殘渣態(tài)和結合態(tài),土壤在修復過程中由于電流密度增大、土壤濕度下降,使得滲流作用減弱、金屬離子遷移困難[10],所以需要采用綜合的強化修復技術提高重金屬去除效率。在研究“電動法+植物萃取”修復法機理的基礎上,對快速智能修復中固有或潛在的影響因素進行分析,從而制定出變量分類與評價指標體系和應用模型,其流程見圖1。由圖1可以看出,先采集修復樣本數(shù)據(jù),對數(shù)據(jù)進行預處理,通過評價指標體系得到文本變量特征;訓練樣本由軟件變量抽樣后送到隨機森林RF 分類器,通過決策樹進行性能評估得到分類結果和評價錯誤率;同時,把分類結果送到GRA 灰色關聯(lián)算法模塊中計算分類評價結果。

圖1 分類與評價流程

1.2 修復變量的分類評價指標體系

提出的修復變量分類評價指標體系是建立在電動修復重金屬污染土壤的基礎上,進行定量評價土壤修復質量。此方法既考慮了農田土壤的一般性,也考慮了污染場地的特殊性,兼顧土壤復耕標準和二次開發(fā)利用的社會、經(jīng)濟價值。比如使用閉庫之后的重金屬尾礦庫,綜合修復治理難度和費用很大,但具有生態(tài)環(huán)保、安全監(jiān)控和資源再利用等方面的重大意義,需要研究者系統(tǒng)考慮修復方案。重金屬尾礦庫的污染體存量大、壩體結構復雜,適用于原位修復和治理,其中添加試劑法易造成下游水體二次污染,而“電動法+植物萃取” 技術在尾礦庫土壤修復及資源再利用等方面具有顯著優(yōu)勢。本文以尾礦庫土壤修復為例,通過對尾礦庫實地調研和重金屬成分檢測,分析污染物的組成和遷移規(guī)律,同時研究了庫區(qū)富集植物的優(yōu)勢度和轉運系數(shù),設計影響土壤修復質量的變量評價指標體系見表1。由表1可以看出,修復變量包括土壤因素變量群、電極因素變量群、電場因素變量群和輔助因素變量群4 類一級指標,以及它們所屬的20 個二級變量指標。通過分析污染土壤自身影響變量,土壤因素包括土壤原始pH值、動態(tài)pH 值、濕度、溫度、緊實度、電導率和重金屬質量濃度等變量;電極因素包括電極布置方式、材料、間距和正負極交替周期等變量;電場因素包括通電時間、電場強度、電流大小、交流/直流交替周期等變量;輔助因素包括添加劑的種類、濃度、富集植物種類等變量。

表1 土壤修復變量分類評價指標體系

1.3 變量特征度的提取

土壤修復變量分類評價指標體系建立之后,用于過濾提取修復樣本變量,機器系統(tǒng)一般用特征來識別或區(qū)分變量,這里采用向量空間模型VSM[11]定義的)S1,x1;S2,x2;…;Sj,xj)來描述特征,其中Sj為特征項,xj為特征項對應的等級賦值,用以描述變量特征項的變化程度。為提高特征度獲取精度,研究利用Doc2Vec 方法[12](一種隨機文本獲得固定長度特征的無監(jiān)督算法工具,具備計數(shù)、平均、加權、百分率、最大值及最小值等功能),對變量特征項進行預處理,獲得特征度的編碼和等級賦值。實驗樣本數(shù)據(jù)較多時,為獲得更好區(qū)分效果,可利用類似短時傅里葉分析工具[13],再次處理變量特征,通過公式(1)得到j 變量處第i 個節(jié)點的特征度方均根值Xj,i(S),xj,n為變量j 處的第n 個等級賦值;N 為j 變量全部賦值個數(shù)。

2 修復變量分類評價模型

2.1 隨機森林分類算法

隨機森林算法是一種基于集成學習Bagging 的算法,建立包含多個決策樹的隨機分類器,準確度高、處理能力強,適合于分類和變數(shù)評估等問題[14-15]。原始Original-RF 森林算法,是一種基于Boosting 算法的依賴串行生成序列化方法,首先初始訓練得到基學習器,然后調整樣本訓練下一個基訓練器,如此重復達到基訓練器預期數(shù)目,最后將所有基訓練器加權結合得到分類結果;隨機抽樣Random-RF 森林算法是基于Bagging 算法的改進版,產生相對獨立和差異化的基訓練器集合,通過Bootstrap 自助采樣,隨機森林分類算法示意見圖2。由圖2可以看出,引入決策樹結構,從根節(jié)點開始將數(shù)據(jù)樣本根據(jù)特征進行分類,每個類別決策樹通過Bootstrap 抽樣產生一個訓練集,重復隨機抽取m 次的M 個樣本數(shù)據(jù)。決策樹數(shù)量根據(jù)所選取的變量數(shù)目及組合確定,隨后在生長過程中以指數(shù)最小原則選出符合評價指標體系中若干特征變量的最優(yōu)集合,通過構建的M個決策樹形成隨機森林。將土壤修復樣本集輸入到隨機森林,由最大投票數(shù)結果作為分類結果。

圖2 隨機森林分類算法示意

2.2 GRA 評價算法

GRA 灰色關聯(lián)度算法[16]是一種無監(jiān)督學習模型。隨機森林法將半定性、半定量問題轉化為定量問題,對模型訓練的依賴性強,而灰色關聯(lián)度算法是根據(jù)序列幾何形狀的相似性來確定序列重要關系,強調行為結果的客觀性,所以需要兼顧二者的優(yōu)點。通過隨機森林分類算法得出的分類結果和變量權重值,用于構建評價指標重要性判斷矩陣φ,先確定比較集列和最優(yōu)指標集,再對指標進行離散性的規(guī)范量化,再通過公式(2)計算修復評價指標的關聯(lián)系數(shù),經(jīng)過加權求和,得到土壤修復變量的加權關聯(lián)度值。式(2)中λ 為修復分辨系數(shù),本文取0.4(一般取0~0.5);λj為修復質量關聯(lián)系數(shù)。然后通過公式(3)得到灰色關聯(lián)系數(shù)矩陣R,再結合判斷矩陣φ,由公式(4)計算出灰色關聯(lián)度值θj,S 為修復變量特征。

根據(jù)灰色關聯(lián)度值對土壤變量分類修復效率進行分級評價,當樣本的修復評價效率為0.8~1 時為修復水平優(yōu)秀,0.7~0.8 時為優(yōu)良,0.5~0.7 時為一般,0~0.5 時為修復水平較差。

2.3 分類與評價模型RF-GRA

通過比較融合隨機森林算法和GRA 算法的功能,建立RF-GRA 土壤修復變量分類評價模型見圖3。由圖3可以看出,由隨機森林算法得到分類結果和分類錯誤率,再由GRA 算法得到修復變量分類準確度的評價值。土壤修復實驗的訓練樣本通過工具包預處理后,得到的變量特征數(shù)據(jù)S1~S20,通過Bootstrap 再從對應訓練集中抽取M 個樣本構成M個決策樹,不剪枝完全自然生長得到隨機森林分類器,通過多數(shù)投票表決得到分類結果和分類錯誤率;最后將測試樣本輸入到模型GRA 評價算法中,經(jīng)過分層加權關聯(lián)度計算,得到修復變量分類評價值。

圖3 RF-GRA 土壤修復變量分類評價模型

通過Bootstrap 從表1中20 個二級變量中抽取20 組變量特征度數(shù)據(jù),帶入RF 隨機森林算法中得到20 個變量分類結果見圖4。

圖4 RF 隨機森林變量分類結果

由圖4可以看出,修復變量的權重值,其中最重要的修復變量是電壓梯度(0.093),第2 層次是電流大小(0.077)、電極材料(0.073)和土壤濕度(0.070),第3 層次是富集植物種類(0.067)、通電時間(0.063)和電極間距(0.06),第4 層次是添加劑種類(0.057)和電極布置方式(0.053),之后的變量指標權重均小于平均值,說明以上變量是影響土壤修復水平的重要指標;其中最后層次是土壤緊實度(0.028)、土壤原始pH 值(0.022)和水循環(huán)條件(0.018),此類變量在修復評價體系中的影響最小。

3 實驗與結果分析

本文以地處秦嶺山區(qū)的一個閉庫6 a 的金礦的尾礦庫為例,采集地表下20~50 cm 處的土壤作為實驗測試樣本,利用自制的電動修復箱開展修復實驗,測試土壤中Cd,Cu,Zn 的消解效率。在室內修復實驗時,土壤原始pH 值、土壤溫度、電極間距、自然水循環(huán)條件等11 項變量設定不變,選擇上述分類結果中的前9 項變量,分別設計A 類變量實驗環(huán)境(電壓梯度為1 V/cm、電流為200 mA、電極高純石墨、土壤濕度為60%、富集植物:A1 東南景天/A2 黑麥草/A3 東南景天、通電時間為6 h/d、電極間距為10 cm、添加劑EDTA 二鈉鹽、陽極/陰極上下垂直布置)和B 類變量實驗環(huán)境(電壓梯度為1.5 V/cm、電流為500 mA、電極為不銹鋼網(wǎng)、土壤濕度為70%、富集植物:B1 東南景天/B2 黑麥草/B3 白茅、通電時間為12 h/d、電極間距為20 cm、添加劑為檸檬酸+氯化鈣、陽極/陰極為上下平行布置),分別將土壤測試樣本A1(Cd),A2(Cu),A3(Zn)和樣本B1(Cd),B2(Cu),B3(Zn)6 個修復樣本加入電動修復箱進行實驗;同時,測試樣本通過RF-GRA 模型進行分級評價,得到20×M 個灰色關聯(lián)度,再分級評價得到離散化數(shù)據(jù)文本,通過計算得到樣本的修復評價效率。6 個修復樣本的實驗與仿真結果見圖5。由圖5可以看出,仿真評價效率高于實驗效率,A1~A3 的相對誤差分別為3.35%,4.12%和6.54%,B1~B3 的相對誤差分別為11.19%,9.48%和8.66%,實驗環(huán)境A 的相對誤差低于環(huán)境B,分類評價模型真實反映了實際修復過程,誤差在可接受范圍內。實驗環(huán)境A1 和A2中Cd 和Cu 的修復效果優(yōu)于B1 和B2,但是環(huán)境A3中Zn 的修復效果低于B3。

圖5 修復樣本的實驗效率與評價效率

智能分類評價過程與人工修復實驗類似,需要對修復變量進行編碼、組合和優(yōu)化,對眾多變量特征進行融合和訓練找到最佳變量組合。在模型計算過程中,樹節(jié)點變量數(shù)目和決策樹數(shù)目非常關鍵,決定了分類評價模型的錯誤率。不同測試樣本或者不同的決策樹初始抽樣值,模型變量分類的誤判率均值不同,選擇誤判率均值最低時的變量及數(shù)目作為最佳修復變量集,當錯誤率趨于穩(wěn)定時決策樹數(shù)目設定不變,分類訓練過程結束。通過隨機抽樣森林RFRandom 算法和RF-GRA 算法,分別計算輸出分類結果性能指標的錯誤率,RF-Random 算法的錯誤率見圖6。RF-GRA 算法的錯誤率見圖7。

圖6 RF-Random 算法的錯誤率

圖7 RF-GRA 算法的錯誤率

對比分析圖6、圖7,隨著決策樹數(shù)目增加,分類錯誤率明顯下降,并且當決策樹數(shù)目從20 增至約300 時,分類錯誤率趨于穩(wěn)定,所以針對選取的6 個測試樣本,確定300 為最優(yōu)分類決策樹數(shù)量。在相同決策樹數(shù)量均為300 條件下修復樣本的2 種算法分類錯誤率對比見圖8。由圖8可以看出,RF-GRA 算法的分類錯誤率低于RF-Random 算法,說明文本提出的修復變量分類評價方法是可行的。

圖8 不同隨機森林算法的錯誤率對比

4 結論

在土壤電動強化修復技術的基礎上,建立修復變量的分類評價指標體系和模型,根據(jù)修復實驗樣本數(shù)據(jù)進行分類效果評價,得到如下結論。

(1)融合隨機森林算法和灰色關聯(lián)法建立RFGRA 模型,輸入分類評價指標完成修復變量分類,為修復方案的質量評價和改進奠定了基礎。變量分類排名結果前9 的依次是電壓梯度、電流大小、電極材料、土壤濕度、富集植物種類、通電時間、電極間距、添加劑種類和電極布置方式,處于最低層的依次是土壤緊實度、土壤原始pH 值和水循環(huán)條件。

(2)6 個測試樣本的模型評價效率均高于實驗效率,分類評價結果真實反映了實驗修復過程。實驗環(huán)境A 的相對誤差低于環(huán)境B,實驗環(huán)境A1 和A2 中Cd 和Cu 的修復效果優(yōu)于B1 和B2,但是環(huán)境A3中Zn 的修復效果低于B3。如果相對誤差超過可接受范圍,可通過改變修復變量的特征度等級,重新分類和評價。

(3)RF-GRA 算法的分類效果優(yōu)于RF-Random,并且當決策樹數(shù)目由0 增至300 時,測試樣本的分類錯誤率下降趨于平衡狀態(tài)。

猜你喜歡
分類實驗評價
記一次有趣的實驗
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
分類算一算
做個怪怪長實驗
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
基于Moodle的學習評價
主站蜘蛛池模板: 久久99国产综合精品女同| 国产香蕉在线| 亚洲人视频在线观看| 自慰高潮喷白浆在线观看| 国产在线专区| 午夜三级在线| 亚洲国产精品一区二区第一页免 | 免费观看成人久久网免费观看| 国产av色站网站| 操国产美女| 国模沟沟一区二区三区| 人人看人人鲁狠狠高清| 国产精品美乳| 一本大道无码高清| 欧美国产在线一区| 天堂成人在线| 国产视频一区二区在线观看| 一级看片免费视频| 亚洲第一区在线| 青青草a国产免费观看| 国产日韩欧美在线视频免费观看| 日韩精品中文字幕一区三区| 99福利视频导航| 国产精品亚洲一区二区在线观看| 人妻丰满熟妇av五码区| 国产草草影院18成年视频| 日韩经典精品无码一区二区| 亚洲国产成熟视频在线多多| 综合亚洲色图| 亚洲欧洲综合| 伊人久久婷婷| 亚洲日韩欧美在线观看| 91丨九色丨首页在线播放| 日韩在线视频网站| 日本欧美中文字幕精品亚洲| 欧美精品在线观看视频| 曰AV在线无码| 欧美啪啪一区| 欧美国产日韩另类| 亚洲h视频在线| 亚洲天堂成人| 亚洲精品中文字幕午夜| 中文字幕精品一区二区三区视频| 国产亚洲现在一区二区中文| 国产精品香蕉| 国产主播福利在线观看| 99re精彩视频| 好紧好深好大乳无码中文字幕| 五月婷婷丁香综合| 国产精品视频免费网站| 久久鸭综合久久国产| 秋霞午夜国产精品成人片| 少妇精品在线| 国产精品护士| 欧洲日本亚洲中文字幕| 91精品综合| 91亚洲精选| 亚洲激情99| 日韩欧美中文字幕一本| 情侣午夜国产在线一区无码| 国内精品免费| 在线观看亚洲精品福利片| 国产丝袜精品| 制服丝袜 91视频| 久久久久中文字幕精品视频| 青青草91视频| 国产日韩欧美中文| 久操中文在线| 久久久久国产一级毛片高清板| 日本精品一在线观看视频| 亚洲天堂在线视频| 无码福利视频| 久久青草免费91线频观看不卡| 91福利片| 污污网站在线观看| 麻豆国产精品视频| 丰满的熟女一区二区三区l| 亚洲Va中文字幕久久一区| 免费高清a毛片| 色噜噜狠狠色综合网图区| 国产超薄肉色丝袜网站| 天天操天天噜|