999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于遺傳算法優(yōu)化的隨機森林鉆井機械鉆速預測模型研究

2023-04-19 06:38:44徐英卓王若禹王六鵬
智能計算機與應用 2023年3期
關鍵詞:卡爾曼濾波模型

徐英卓, 王若禹, 王六鵬

(1 西安石油大學 計算機學院, 西安 710065; 2 西安石油大學 石油工程學院, 西安 710065)

0 引 言

隨著經(jīng)濟的快速發(fā)展,石油天然氣等自然資源的消耗量也在不斷增加。 機械鉆速(ROP)是影響鉆井效率的關鍵因素之一,是石油工程鉆井作業(yè)的重要經(jīng)濟指標。 傳統(tǒng)工藝技術實現(xiàn)“硬”提速,但由于各井之間地質條件不同導致提速效果差異大,從而陷入提速瓶頸。 所以快速、準確地提高機械鉆速,得到主要影響因素,進而優(yōu)化鉆井參數(shù),該課題已成為鉆井工程領域亟需解決的研究熱點。

2007 年,范翔宇等學者[1]利用地震資料提出以數(shù)理統(tǒng)計方法對鉆速進行預測,符合率達到70%,然而由于地震資料的精度導致準確率難以進一步提升。 2019 年,劉勝娃等學者[2]建立基于誤差反向傳播神經(jīng)網(wǎng)絡設計的機械鉆速預測模型,但因為數(shù)據(jù)有限、特征較少導致對機械鉆速影響規(guī)律未能進行有效探索。 2021 年,許明澤等學者[3]研究多模型集成學習應用于機械鉆速預測中,預測效果優(yōu)于單一模型。 但并未對單一模型進行調(diào)參,并不能解釋集成模型優(yōu)劣。

綜上所述,目前學界對機械鉆速影響因素的研究并不全面,導致機械鉆速模型的精確度也不高。本文提出遺傳算法-隨機森林(GA-RandomForest)機械鉆速預測模型,仿真實驗結果表明所建預測模型具有更高精度。

1 GA-Random Forest 算法模型

(1)隨機森林算法。 該方法是一種通過集成學習思想將多個決策樹集成在一起的算法。 隨機地從數(shù)據(jù)集中抽取數(shù)據(jù)用作決策樹[4]的訓練集,并隨機地從特征數(shù)據(jù)中選取特征節(jié)點建立決策樹,重復操作后形成森林。 在此基礎上,對所有樹得出的值進行選擇,被選擇最多的即是最終的輸出結果。

(2)遺傳算法。 該方法是解決復雜優(yōu)化問題最常用的方法[5]。 遺傳算法模擬生物遺傳進化的過程。首先,初始化總體,每個染色體代表一個解決方案。其次,適應度函數(shù)決定了種群進化的方向,適應度函數(shù)的值決定了解的質量。 適應度函數(shù)定義為:

然后,按照適者生存的自然選擇原則,優(yōu)秀的個體更有可能保留自己的基因,因此具有高適應值的個體更有可能被選為下一代的父母。 本研究用輪盤賭法進行選擇操作,使個體被選擇概率與其適應度值成正比,個體α被選擇的概率pα可表示為:

其中,F(xiàn)α為個體α的適應度值,F(xiàn)α′為個體α′的適應度值。

最后,通過交叉和變異生成下一代種群,當?shù)玫綕M意解或達到定義代數(shù)時,則結束進化過程。

(3) GA-Random Forest 算 法[6]。 GA-Random Forest 機械鉆速預測模型的建模過程如圖1 所示。由圖1 可看到,首先,將隨機森林中的每一個決策樹作為染色體對其進行編碼,規(guī)定決策樹的數(shù)量就是染色體的長度。 然后,設置條件函數(shù)來計算該樹的準確率,用來評價決策樹組合的優(yōu)缺點。 每個決策樹組合的分類正確率作為對應染色體的適應度。 其次,用輪盤賭法進行選擇操作,規(guī)定其中每一代優(yōu)秀率高的組合具有更高的被選擇遺傳下來的概率。 最后,通過交叉產(chǎn)生子代,變異可為決策樹的組合提高隨機性,從而避免陷入局部最優(yōu)。 通過上述步驟,得到了更加優(yōu)秀的個體,如此即可以加快進化速度。

圖1 模型框架結構圖Fig. 1 Model frame structure

2 基于GA-Random Forest 的機械鉆速預測建模

2.1 機械鉆速影響因素分析

本次實例數(shù)據(jù)選用某油田特定區(qū)塊下的井史數(shù)據(jù)。 表1 列舉了部分數(shù)據(jù)。 文中對此進行初步篩選后,擬以表1 中的特征參數(shù)作為影響因素。

表1 機械鉆速預測模型輸入數(shù)據(jù)表Tab. 1 Partial data of ROP prediction

2.2 輸入?yún)?shù)預處理

2.2.1 CatBoost 對類別變量的處理

CatBoost 編碼器可以避免均值編碼對y變量敏感的弊端,并減少過擬合且不改變數(shù)據(jù)集的大小。其基本思想也是計算某一行數(shù)據(jù)的特征編碼時,避免使用到該行的目標值(Target)。 首先,將相同類別的元素分組,求出每一組target的平均值作為其對應的編碼。 然后,引入“前綴和”的思想,即對于某一類別的某一個值,其對應的編碼值等于其之前行的所有該類別值的對應target的平均值。 前綴和定義如下:

本文中,巖性作為有11 種類別的變量,將采用CatBoost編碼器對類別特征無序且對類別數(shù)量較多的目標變量編碼方式進行處理。 編碼結果見表2。

表2 類別變量編碼結果表Tab. 2 Category variable coding results

2.2.2 卡爾曼濾波數(shù)據(jù)降噪處理

卡爾曼濾波是一種借助線性算法的方程,通過系統(tǒng)輸入輸出觀測數(shù)據(jù),對系統(tǒng)狀態(tài)進行最優(yōu)估計的算法。

卡爾曼濾波分為2 個步驟。 第一步,基于上一時刻狀態(tài)數(shù)據(jù)預測當前時刻狀態(tài)。 第二步,是綜合第一步預測出的當前時刻狀態(tài)和實際觀測狀態(tài),估計出最優(yōu)的狀態(tài)作為濾波的結果。 對此數(shù)學方法,可用如下公式進行描述:

這里,式(4)是狀態(tài)預測;式(5)是誤差矩陣預測;式(6)是卡爾曼增益計算;式(7)是狀態(tài)校正,運算輸出的就是最終的卡爾曼濾波結果;式(8)是誤差矩陣更新。

卡爾曼濾波對其中機械鉆速數(shù)據(jù)的降噪前后對比如圖2 所示。 分析圖2 可知,經(jīng)過卡爾曼濾波處理,本來包含許多尖峰和突變的原始數(shù)據(jù)相較于之前變得輪廓更加清晰,峰值不再尖銳。 所以卡爾曼濾波有效去除了原始數(shù)據(jù)中明顯的信號干擾,在處理過后并未改變原數(shù)據(jù)的變化特性。

圖2 卡爾曼濾波降噪處理對比圖Fig. 2 Comparison of Kalman filter denoising

2.3 特征選擇

在工程實踐中獲得的鉆井數(shù)據(jù)類別繁多,將收集到的所有特征參數(shù)輸入機器學習模型進行訓練,會導致模型維度過多,也就無法有效提升擬合程度。為此,利用最大互信息系數(shù)(MIC), 最大程度地根據(jù)信息尋找參數(shù)之間線性或者非線性的關系。

最大互信息系數(shù)計算公式如下:

其中,a、b分別表示在x,y方向上的區(qū)域分割個數(shù);B表示可設置參數(shù);I(x;y)表示MIC值。 式(9)為在不同規(guī)定范圍下得到各自的MIC值,并在歸一化處理后來求得最大值。

鉆井特征參數(shù)最大互信息相關分析圖如圖3 所示。 由圖3 可見,立壓與泵壓、相關性極強(0.98),排量和入口流量、相關性極強(0.98)。 因此,通過MIC計算值與實際工程原理結合篩選井深、巖性、鉆壓、轉盤轉速、鉆井液密度、入口流量、立壓、扭矩等8 項參數(shù)篩選作為機械鉆速預測模型的輸入變量。

圖3 鉆井特征參數(shù)最大互信息相關分析圖Fig. 3 MIC of drilling characteristic parameters

2.4 機械鉆速預測模型的建立與實驗驗證

這里,研發(fā)建立了GA-Random Forest 機械鉆速預測模型。 隨機森林模型中涉及到的2 個主要參數(shù)是樹的深度和決策樹的數(shù)量,所以利用遺傳算法對其進行優(yōu)化。 首先,根據(jù)經(jīng)驗設定樹的深度和決策樹的數(shù)量,并在遺傳算法中設定繁殖的代數(shù)為100,種群的數(shù)量為500,同時設定交配的概率為0.6,變異概率為0.01。 當代數(shù)達到設定的100 代時算法停止,給出最優(yōu)的一代和其中解碼后的參數(shù)。 研究中得到的繁殖迭代過程參數(shù)見表3。

表3 每一代繁殖參數(shù)表Tab. 3 Parameters value of each generation

最終,確定最優(yōu)代為第76 代,n_estimators為120,max_depth為16,R2_score為0.937 4。

為了證明GA-Random Forest 機械鉆速預測模型在本次實驗中與其他模型相比具有更高精度,故選取決策樹回歸模型、KNN 回歸模型、SVR 回歸模型進行對比分析,實驗結果如圖4 所示。

圖4 多模型預測結果對比圖Fig. 4 Prediction results of multiple models

為比較模型的優(yōu)劣,用擬合優(yōu)度R2作為區(qū)別的標準。R2越大,模型的解釋程度越高,預測點在回歸直線附近越密集。 由圖4 可見,GA-Random Forest 模型的預測值與實測數(shù)據(jù)曲線變化一致、對應數(shù)值點相近,并且該模型的R2值優(yōu)于其他3 種算法模型。 因而可知,本文研究的機械鉆速預測模型精度更高。

3 結束語

(1)使用CatBoost encoder 得到更直接表示分類變量和目標變量之間的關系的目標編碼,并且有效降低模型過擬合。

(2)去除多余的干擾獲得真實有用的數(shù)據(jù),使用卡爾曼濾波降噪處理后達到信噪分離的效果,進一步提高算法模型的擬合程度。

(3)本次研究提出的方法在隨機森林的基礎上又提高了計算準確度和適應能力,并通過簡化模型的結構,有效提高了計算速度。

猜你喜歡
卡爾曼濾波模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
改進的擴展卡爾曼濾波算法研究
測控技術(2018年12期)2018-11-25 09:37:34
基于遞推更新卡爾曼濾波的磁偶極子目標跟蹤
3D打印中的模型分割與打包
基于模糊卡爾曼濾波算法的動力電池SOC估計
電源技術(2016年9期)2016-02-27 09:05:39
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
基于擴展卡爾曼濾波的PMSM無位置傳感器控制
電源技術(2015年1期)2015-08-22 11:16:28
基于EMD和卡爾曼濾波的振蕩信號檢測
主站蜘蛛池模板: 国产交换配偶在线视频| 在线观看国产精品第一区免费 | 亚洲无码四虎黄色网站| 欧类av怡春院| 精品一区二区三区四区五区| 精品福利国产| 九九热这里只有国产精品| 亚洲一区网站| 欧美视频在线播放观看免费福利资源| 免费看av在线网站网址| 亚洲日韩久久综合中文字幕| 91欧美亚洲国产五月天| 国产精品99在线观看| 日韩一区二区三免费高清 | 国产精品综合色区在线观看| 国产网友愉拍精品视频| 色窝窝免费一区二区三区| h视频在线观看网站| AV片亚洲国产男人的天堂| 亚州AV秘 一区二区三区| 国产成人精品一区二区三在线观看| 永久天堂网Av| 亚洲天堂.com| 久久人午夜亚洲精品无码区| 亚洲精品视频在线观看视频| 麻豆精品国产自产在线| 日韩东京热无码人妻| 91久久偷偷做嫩草影院| 亚洲一区二区三区国产精华液| 国产白丝av| 国产第一页亚洲| 国产综合在线观看视频| 99色亚洲国产精品11p| 日本午夜三级| 538精品在线观看| 思思热在线视频精品| 国产亚洲视频中文字幕视频| 欧美亚洲激情| 亚洲成人网在线播放| 伊人久久久久久久久久| 日韩在线中文| 十八禁美女裸体网站| 精品1区2区3区| 亚洲成年人网| 久久人妻xunleige无码| 亚洲国产系列| 啪啪国产视频| 色一情一乱一伦一区二区三区小说| 国产区人妖精品人妖精品视频| 精品国产福利在线| 国产香蕉在线| 日本高清有码人妻| 99在线免费播放| 亚洲精品国产日韩无码AV永久免费网| 国产一级毛片yw| 亚洲精品国产日韩无码AV永久免费网| 在线免费亚洲无码视频| 亚洲国产精品不卡在线| 91人妻日韩人妻无码专区精品| 中文字幕在线免费看| 欧美国产日韩在线观看| 亚洲成人一区二区三区| 91区国产福利在线观看午夜| 在线观看91精品国产剧情免费| 国国产a国产片免费麻豆| 色噜噜久久| 亚洲欧洲AV一区二区三区| 91破解版在线亚洲| 青青草国产一区二区三区| 国产一二视频| 久久网欧美| 国产一区自拍视频| 99视频全部免费| 在线精品自拍| 欧美成一级| 亚洲成网777777国产精品| 精品视频在线一区| 高清无码一本到东京热| 亚洲中文无码av永久伊人| 欧美日韩精品一区二区视频| 欧美色伊人| 在线视频亚洲色图|