999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習MLR模型的地下水循環井優化設計

2023-02-12 00:59:40趙思遠劉治國丁小凡馬彥玲
安全與環境工程 2023年1期
關鍵詞:優化模型

趙思遠,方 樟,周 睿,劉治國,丁小凡,馬彥玲

(吉林大學新能源與環境學院,吉林 長春 130021)

隨著經濟的不斷發展,地下水污染問題日益加劇,地下水污染修復工作成為當今環境領域的熱點問題。地下水循環井(groundwater circulating well,GCW)技術自20世紀80年代開始受到廣泛關注[1-2]。該技術具有修復效果好、對場地擾動小等優點[3-4],并可以將吹脫、空氣注入、氣相抽提、強化生物修復和化學氧化等多種技術結合應用在井中,實現非水相液體及部分無機物的同步去除[5]。GCW運行時能夠形成水平和垂直兩個方向的地下水流場,穿透低滲透地層[6],去除地下水和飽和土壤中的污染物,對于處理揮發性有機化合物(VOCs)、半揮發性有機化合物(SVOCs)、石油產品以及無機物均有良好的效果[7-8]。

GCW技術的大量研發和使用始于德國IEG公司。1980年GCW技術在歐洲首次進行了商業污染場地修復應用。20世紀90年代,該技術在歐美進行了大量的中試研究[9-10],對地下水循環原理、GCW的性能、污染物去除機理等有了深入的認識,獲得了系統設計、工藝參數等實踐經驗[11]。20世紀90年代后期,GCW技術已經相對成熟。目前GCW技術已有很多專利,并已市場化,且已經有很多成功的現場工程經驗[3]。但目前對于GCW的研究主要集中在對污染物修復的有效性方面,而對GCW水力環流特征及結構優化設計的研究還稍顯不足。

水力循環帶的范圍是GCW設計必不可少的考慮因素。GCW水力環流運行效果受水文地質參數、循環井結構參數和運行參數等多個因素的綜合影響[12],且在不同條件下其運行效果差異明顯。GCW的運行效果往往采用影響半徑(R)、捕獲區范圍(ZOI)等指標進行刻畫[7]。目前對GCW中地下水運動特征及優化設計的研究方法主要包括室內試驗、數值法和解析法。如白靜等[13]通過室內試驗,分析地下水初始水位、曝氣量、循環井結構等參數對GCW影響半徑的作用,并在二維模擬槽中進行了運行參數優化及修復試驗;Elmore等[14]利用數值模擬方法預測了GCW的水力性能,分析了循環井結構參數、水文地質參數對GCW運行效果的影響,并將數值模擬的結果應用于污染場地,根據水文地質條件設置篩管位置,通過現場觀測數據驗證了模型預測的可行性;Philip等[15]運用解析方法預測了承壓含水層中GCW運行的三維流場,分析了GCW的水力性能。

隨著GCW研究的進一步深入和污染場地等數據的大量累積,可以采用機器學習(machine learning)的方法,從已有數據中學習總結,形成GCW運行效果刻畫指標與各影響因素之間的函數關系,用于指導污染場地GCW的優化設計,能夠在一定程度上彌補以往研究手段的局限性。機器學習是人工智能的一個分支,通過輸入數據,能夠自行學習,并解決具體問題[16]。利用機器學習可以通過計算機在海量數據中學習數據的規律和模式,從中挖掘出潛在的信息,廣泛用于解決分類、回歸、聚類等問題[17]。線性回歸算法是機器學習算法的一種,是解決回歸問題常用的工具,在處理大量數據和較少數據的特征時,多元線性回歸(multiple linear regression,MLR)模型是尋找輸出參數與輸入參數之間關系最常用的模型,模型解釋性強,在各領域具有廣泛的適用性[18-19]。

為了確定GCW運行效果與各影響因素之間的關系,本文提出一種基于機器學習MLR模型的GCW優化設計方法。該方法首先利用有限差分法構建數值模型,并在GCW適用參數范圍內,通過給定不同的數值對典型條件下GCW運行情況進行了數值模擬,從而構建數據集;然后運用MLR模型得出GCW影響半徑與各影響因素表征參數之間的關系;最后以某典型試驗場地為例,對循環井結構、運行參數進行了優化設計,以驗證方法的有效性。

1 研究方法

本文的研究方法是:首先采用數值模擬的方法建立數值模型,構建單個GCW運行時各表征參數的數據集;然后通過機器學習線性回歸算法進行訓練,得出GCW各運行效果刻畫指標與水文地質參數、循環井結構、運行參數之間的函數關系;最后將某試驗場地的水文地質參數代入該函數關系,得出可應用于該試驗場地的數學模型,從而求得GCW最優參數組合。

1. 1 地下水循環井及場地概化

典型的GCW由一個不透水的實段分隔兩個篩段(抽水篩段、注水篩段)[20]。其中,抽水篩段部分從地下系統中抽取受污染的地下水,經過處理后通過同一口井的注水篩段注入含水層,從而在抽水篩段和注水篩段之間形成垂向循環流,見圖1。

圖1 典型的地下水循環井(GCW)運行方式示意圖

1. 2 數值模型的建立

本文利用GMS軟件的MODFLOW模塊對GCW水力驅動下地下水流運動進行了數值模擬計算[21-22],并在地下水流模型的基礎上,利用MODPATH模塊,建立GCW水力驅動下的粒子示蹤模型[23-24],分析粒子運動軌跡,刻畫GCW驅動地下水環流的運行效果。在抽水篩段所在剖分單元格的4個面上各設置25個粒子作為粒子遷移的終點(見圖2),反向追蹤至粒子起點,分析其在水力驅動下的運動軌跡,并通過在模型中輸入不同的參數觀察粒子運動軌跡,進而確定不同參數條件下GCW的運行效果變化情況。

圖2 地下水循環井(GCW)粒子投放位置示意圖

1. 3 地下水循環井適用條件和數據集形式

1.3.1 地下水循環井適用條件分析

GCW技術適用于飽和帶為1.5~35 m、非飽和帶為1.5~3 m、各向異性為3~10、滲透系數為3.0×10-4~0.30 m/d、地下水流速低(<3.0×10-4m/d)的多孔介質中,該條件下更易形成三維橢圓形流場[25-26]。

1.3.2 數據集形式

根據GCW的適用條件,通過在數值模型中給定不同的參數值并運行模型,來模擬各種條件下GCW的運行情況,并記錄給定的參數及運行效果刻畫指標數據,從而構建數據集。數據集包含的變量眾多,本文將水文地質參數和循環井結構、運行參數作為自變量。其中,水文地質參數包括含水層厚度(M)、含水層水平滲透系數/垂向滲透系數(KH/KV)、含水層水力梯度(I)、含水層孔隙度(n)、含水層給水度(μ);GCW結構參數包括抽注篩段總長度/含水層厚度(a/M);GCW運行參數為抽注水量(Q)。GCW運行時周圍的含水層受其影響可劃分為上游捕獲帶、下游釋放帶和循環帶,本次研究在充分總結了國內外已有研究成果的基礎上[14],提出了用捕集效率(Ec)、橫向影響半徑(RT)、縱向影響半徑(RL)、捕獲帶上部寬度(Bt)、捕獲帶下部寬度(Bb)5個指標來刻畫GCW的運行效果(見圖3),并將這些變量作為因變量。數據集所涵蓋的介質從粉砂到粗砂,含水層厚度(M)為1~35 m不等,含水層水平滲透系數/垂直滲透系數(KH/KV)為1~15不等,抽注水量(Q)為1~300 m3/d不等,變量數值分布均勻、廣泛,所涵蓋的情形眾多(共717套),具有一定的代表性(見圖4)。

圖3 地下水循環井(GCW)運行效果刻畫指標示意圖

1. 4 回歸模型的構建與評估

1.4.1 回歸模型構建

本次回歸模型的構建采用Python語言中的Scikit-learn程序包利用線性回歸算法訓練模型。Python語言是一種解釋性、交互式、面向對象的跨平臺語言,語法簡潔清晰,代碼開發效率高[27],Scikit-learn是Python語言中的一個程序包,集成了各種最先進的機器學習算法,可用于解決中等規模的監督和無監督問題[28-29]。通過已有數據集訓練獲取各個因變量與自變量之間的關系,這屬于典型的回歸問題[30]。

圖4 數據集各參數的分布統計

本文將數據集劃分為20%的測試集和80%訓練集,訓練集用于模型訓練,測試集用于模型評估。采用機器學習線性回歸算法進行模型訓練,假設線性回歸模型試圖學得[31]:

f(x)=wTxi

(1)

可用最小二乘法對w進行估計,損失函數J(w)為

J(w)=[f(x1)-y1]2+[f(x2)-y2]2+…+[f(xm)-ym]2

(2)

式中:x,y,w可以理解為矩陣;m為訓練集數據個數。

若要求出最佳的擬合方程,則要求出使J(w)達到最小時的w,即:

w=(xTx)-1xTy

(3)

通過對數據集采用Python語言中Scikit-learn程序包的Linear regression算法進行訓練,可得到表示各因變量與自變量關系的5個數學模型。

1.4.2 回歸模型評估

本文采用決定系數R2對建立的線性回歸模型進行評估。R2表示自變量對因變量的解釋程度,R2值越接近于1,表示線性回歸模型的擬合程度越好。R2的計算公式如下:

(4)

2 試驗場地地下水循環井參數優化設計

本次GCW結構優化設計的試驗場地為陜西省某場地。該地區屬暖溫帶大陸性季風氣候,年平均氣溫為13℃,多年平均降水量為701 mm,降雨主要集中在每年的7—9月份。根據地下水水位監測及抽水試驗結果,該場地地下水流向大致由西北向東南,淺層地下水受季節變化而升降,場地附近地下水水力梯度為0.9‰。本次研究的目標層位為第四系孔隙潛水含水層,巖性主要為粗砂、中細砂混卵石填充,其上為粉質黏土,下部為致密的粉質黏土隔水層。該潛水含水層垂向滲透系數(KV)為6.67 m/d,含水層水平滲透系數/垂直滲透系數(KH/KV)為3,含水層孔隙度(n)為0.30,含水層給水度(μ)為0.20,含水層厚度(M)為7.5 m,抽注水量(Q)為150~300 m3/d,富水性良好。

根據上述資料,該場地水文地質參數即含水層厚度(M)、含水層水平滲透系數/垂向滲透系數(KH/KV)、含水層垂向滲透系數(KV)、含水層水力梯度(I)、含水層孔隙度(n)、含水層給水度(μ)為已知,優化設計變量為GCW運行參數即抽注水量(Q)和GCW結構參數即抽注篩段總長度/含水層厚度(a/M),將試驗場地的水文地質參數代入通過機器學習訓練后的各數學模型,得到適用于該試驗場地的數學模型,再根據多元函數微分學,求得各數學模型的最值點,即為針對各種GCW運行效果刻畫指標的優化方案。

3 研究結果與討論

本文利用20%測試集對機器學習訓練后得到的試驗場地各模型進行測試,各模型的預測結果如圖5所示,利用決定系數R2對各模型的擬合程度進行評估,其評估結果見表1。

本文利用訓練后的模型構建的試驗場地數學模型如下:

圖5 試驗場地各數學模型預測值與實際值對比

表1 試驗場地各數學模型的評估結果

RL=0.145 5Q-3.29×10-4Q2+34.729(a/M)-26.029(a/M)2-15.732

(5)

RT=0.151Q-0.000 34Q2+36.049(a/M)-27.018 1(a/M)2-14.51

(6)

Bb=0.632Q-0.001 445Q2+68.876(a/M)-83.488(a/M)2-39.624

(7)

Bt=0.227Q-0.000 512Q2+54.067(a/M)-40.522(a/M)2-9.316

(8)

Ec=-3.6×10-4Q+8.3×10-7Q2-0.04(a/M)+0.048(a/M)2+0.36

(9)

試驗場地各數學模型圖像,見圖6。以RL模型為例求其偏導數,其計算公式如下:

(10)

當RL對Q和a/M的一階偏導數等于0,即Q=221.125 m3/d、a/M=0.667時模型可能取極值,又A<0、AC-B2>0,故Q=221.125 m3/d、a/M=0.667即為該模型的最優解。同理,可求得其余各模型的最優解,即為針對各種GCW運行效果刻畫指標的優化方案和預期可以達到的最佳效果,見表2。對于通過機器學習線性回歸算法訓練獲得的多個模型,圖5展示出了各模型對于縱向影響半徑RL、橫向影響半徑RT、捕獲帶下部寬度Bb、捕獲帶上部寬度Bt、捕集效率Ec的預測結果,可見RL、RT模型的散點在y=x目標線附近的分布較為密集,說明對于RL、RT兩項指標模型預測的整體精度更高,其余模型的預測精度較低。此外,由表1可知,RL、RT模型的決定系數R2為0.82和0.90,相對于Bb、Bt、Ec模型R2值更接近于1,說明RL、RT模型的擬合程度、泛化能力較好,而Bb、Bt、Ec模型的擬合程度、泛化能力相對較差,其主要原因分析如下:

圖6 試驗場地各數學模型的圖像

表2 試驗場地各數學模型的最優解

(1) 因變量RL、RT與自變量之間可能存在某種程度的線性關系,線性回歸算法對于擬合此類數據更加適用。

(2)RL、RT模型的復雜程度適中,未出現欠擬合和過擬合的現象,在測試集中有相對良好的表現。

(3) 通過線性回歸算法訓練得到的Bb、Bt、Ec模型結構較為簡單,而因變量Bb、Bt、Ec與自變量之間的關系較為復雜,線性回歸算法對于復雜映射關系的擬合能力有限,故出現欠擬合的情況。

(4) 由于數據集樣本數量有限,不足以體現因變量與自變量之間的復雜關系;同時,通過數值模擬構建的數據集存在一定的測量誤差,對于小樣本數據的影響較大,導致訓練得到的模型擬合精度較低,而用有限的測試集對模型進行測試,測試結果具有不穩定性。

根據以上情況,通過MLR模型訓練得到的RL、RT預測模型更為可靠,根據RL、RT模型求得的最優解為Q=221.125 m3/d、a/M=0.667(見表2),可作為試驗場地優化GCW影響半徑的優化設計方案。

在此次優化設計之前,根據試驗場地的水文地質條件建立了地下水流模型、溶質運移模型并進行了若干次數值模擬,觀察在不同井流量和篩管長度下GCW影響半徑的變化情況,初步得出Q=150 m3/d、a/M=0.40的GCW設計方案,對比優化前后的參數并運行數值模型,可以發現井流量和篩管長度以及GCW影響半徑發生了一定的變化(見表3),可見經過優化后縱向影響半徑RL從15.77 m提升到16.9 m,提升率為7.2%,橫向影響半徑RT從18.02 m提升到19.65 m,提升率為9%,優化后RL、RT指標值均大于優化前的數值,體現了基于機器學習MLR模型對試驗場地GCW進行優化設計的有效性。

表3 試驗場地地下水循環井(GCW)優化前后參數值的對比

4 結 論

地下水循環井(GCW)運行效果對污染場地修復至關重要。本文以數值模擬獲取結果為數據集,利用機器學習多元線性回歸(MLR)模型得出GCW影響半徑與各參數之間的數學模型,并根據特定試驗場地,初步確定了對于GCW影響半徑的優化設計方案,可以為GCW的優化設計提供參考,能夠在一定程度上減少GCW布設后的調試時間,并降低運行成本,具有實際意義。

本文針對陜西省某試驗場地提出了一套GCW優化設計方案,該方案由試驗場地數學模型得出,若改變為其他場地,其數學模型與此模型只有常數項不同,最值點相同,所以其他場地在流量可以達到優化方案的條件下,也可使用此優化方案。

將機器學習的方法運用到GCW優化設計是一種新的嘗試,同時數值模擬作為一種新的獲取數據的方法,與傳統的場地試驗不同,有著易操作、周期短、成本低等特點,可獲取大量數據,可為機器學習創造大量數據集,將數值模擬與機器學習結合也展現出了一定的優勢。本次研究的數據集根據現有全國各典型水文地質條件創建,對于特殊水文地質條件下的數據創建略顯不足,若后期有更多的試驗場地,可根據這些試驗場地的水文地質條件模擬數據,并加入到數據集當中,使機器學習結果具有更高的可靠性。

猜你喜歡
優化模型
一半模型
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产高清不卡视频| 久操线在视频在线观看| 无遮挡国产高潮视频免费观看| 91精品视频播放| 伊人色婷婷| 国产成人8x视频一区二区| 亚洲国产精品一区二区第一页免| 精品免费在线视频| 国产美女在线免费观看| 中文字幕欧美日韩| 亚洲成人精品在线| 亚洲AV人人澡人人双人| 亚洲综合狠狠| 精品国产黑色丝袜高跟鞋| 中文字幕免费播放| 欧美天堂在线| 欧美激情一区二区三区成人| 日韩黄色精品| 日本人妻一区二区三区不卡影院| 亚洲性视频网站| 福利在线一区| 91久久偷偷做嫩草影院精品| 中文字幕在线播放不卡| 国产综合在线观看视频| 中文字幕人妻av一区二区| 免费人成黄页在线观看国产| 99久久亚洲综合精品TS| 91青青视频| 亚洲一级毛片免费观看| 日韩在线第三页| 538精品在线观看| 欧美日韩国产精品va| 亚欧成人无码AV在线播放| 亚洲乱亚洲乱妇24p| 无码免费视频| 老司机久久99久久精品播放| 99热这里只有免费国产精品| 尤物国产在线| 国产国产人成免费视频77777| 国产在线视频福利资源站| 少妇人妻无码首页| 亚洲成人在线免费| 不卡视频国产| 福利一区在线| 亚洲国产天堂久久综合| 91色在线视频| 99在线视频免费| 久久青草视频| 亚洲va欧美va国产综合下载| 日韩免费中文字幕| 欧美精品在线免费| 久久伊人色| 亚洲午夜久久久精品电影院| 亚洲精品国产精品乱码不卞 | 中文字幕免费在线视频| 乱系列中文字幕在线视频| 精久久久久无码区中文字幕| 亚洲一区色| 国产高潮流白浆视频| 黄色污网站在线观看| 五月婷婷丁香色| 亚洲 欧美 日韩综合一区| 成年免费在线观看| 国产黄在线免费观看| 亚洲日本中文字幕乱码中文| 日韩一级二级三级| 伊人无码视屏| 国产成人久视频免费| 亚洲精品卡2卡3卡4卡5卡区| 97青青青国产在线播放| 在线观看精品国产入口| 91在线精品免费免费播放| 欧美一区精品| 激情影院内射美女| 亚洲视频二| 国产网站免费观看| 伊人AV天堂| 欧美精品1区| 国产小视频在线高清播放| 韩日无码在线不卡| 成人福利视频网| 国产精品第一区在线观看|