999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)算法的石油鉆速研究

2021-01-09 06:36:38張維罡東北石油大學(xué)計算機(jī)與信息技術(shù)學(xué)院黑龍江大慶163318
化工管理 2021年20期
關(guān)鍵詞:特征實驗模型

張維罡(東北石油大學(xué)計算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)

0 引言

石油行業(yè)是一個涉及了多個學(xué)科的綜合性工業(yè)領(lǐng)域,而在石油鉆井領(lǐng)域中,減少成本,提高效率是所有人長期研究的課題。在如今信息化的時代,如何將傳統(tǒng)的石油鉆井項目與機(jī)器學(xué)習(xí)等創(chuàng)新型技術(shù)結(jié)合,建立數(shù)字化油田,是石油工作者目前工作的重點之一。本項目計劃通過對鉆井過程中的數(shù)據(jù)進(jìn)行分析,使得機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等創(chuàng)新型項目在鉆井領(lǐng)域獲得初步應(yīng)用,對鉆井速度進(jìn)行優(yōu)化。

1 系統(tǒng)總體架構(gòu)設(shè)計

數(shù)據(jù)選擇模塊是對鉆井過程中獲得的參數(shù)進(jìn)行篩選,該模塊主要內(nèi)容包括以下兩點:第一是對比不同井的鉆井?dāng)?shù)據(jù),選擇出數(shù)據(jù)量最大,參數(shù)最多,時間最長的一組鉆井?dāng)?shù)據(jù)。第二是對鉆井的參數(shù)進(jìn)行對比,刪除在整個鉆井期間都維持不變的靜態(tài)參數(shù),并且把鉆速為空的時間段刪除。最終,數(shù)據(jù)選用2021年美國開源鉆井?dāng)?shù)據(jù),井號為16a_32,數(shù)據(jù)是2020年10月25日到11月4日每隔10秒收集一次的鉆井?dāng)?shù)據(jù),有32個參數(shù),大約56萬條數(shù)據(jù)。

2 數(shù)據(jù)清洗模塊設(shè)計

數(shù)據(jù)清洗模塊的目的為解決數(shù)據(jù)的質(zhì)量問題。例如比如數(shù)據(jù)部分缺失、特征無效等。該模塊主要工作為以下兩點:第一,刪除無關(guān)的數(shù)據(jù),即剔除掉那些對于模型的實驗結(jié)果無關(guān)的數(shù)據(jù),例如鉆頭直徑這樣的數(shù)據(jù);第二,刪除特征值全為空或為0的數(shù)據(jù)。在鉆井過程中,可能存在記錄時出現(xiàn)錯誤導(dǎo)致沒有記錄的情況,這些參數(shù)就會為空,可以認(rèn)為其是無效參數(shù),可以在數(shù)據(jù)中刪除。通過數(shù)據(jù)選擇模塊,可以保證實驗時的鉆井?dāng)?shù)據(jù)的數(shù)據(jù)質(zhì)量,為接下來的實驗做鋪墊。

3 離群點模塊設(shè)計

離群點指的是那些間隔較遠(yuǎn)、明顯偏離其他數(shù)據(jù)點的樣本點。其作用為檢測并處理數(shù)據(jù)中存在的離群點。在數(shù)據(jù)分布上,普通樣本平時聚集在一小塊區(qū)域,而離群點的分布則比較稀疏,并且與其他樣本點相距比較遠(yuǎn)。所以需要對離群點進(jìn)行檢測與刪除的工作。

于是得出結(jié)論,即該模塊中主要進(jìn)行三部分工作:(1)通過運用單元的3&離群點算法與MAD離群點算法進(jìn)行模型運算,通過rmse的得分進(jìn)行對比,從單元離群點算法中選擇出實驗效果較好的算法。(2)通過運用多元離群點檢測算法,例如:Isoliation Forest、Local outlier Factory、Elliptyc envelop等 算 法進(jìn)行比較與選取,選出多元離群點檢測算法中實驗效果較好的一個算法。(3)將多元離群點檢測算法中實驗效果較好的那一個與單元離群點檢測算法中實驗效果較好的那一個進(jìn)行融合,變成既能照顧到單元離群點檢測算法,又能照顧到多元離群點檢測算法的數(shù)據(jù),將其刪除。這樣一來,就可以得到更加適用與石油鉆井領(lǐng)域的離群點去除算法。

4 數(shù)據(jù)分割與歸一化模塊

對數(shù)據(jù)進(jìn)行歸一化與標(biāo)準(zhǔn)化的原因是運用機(jī)器學(xué)習(xí)解決石油領(lǐng)域或其他領(lǐng)域的實際問題時,數(shù)據(jù)中有可能出現(xiàn)由于特征之間相互有不同的衡量標(biāo)準(zhǔn),導(dǎo)致即使使用同一類型的度量,各個特征之間的差異性也會非常大。例如特征A與特征B都是關(guān)于路程的特征,特征A一般使用千米單位進(jìn)行測量,而特征B一般運用米來進(jìn)行度量。這種情況下,如果不引入數(shù)據(jù)的標(biāo)準(zhǔn)化的方法,則會使得特征A的影響要遠(yuǎn)遠(yuǎn)比特征B的影響要大。因此,為了對這種情況進(jìn)行排除,需要將數(shù)據(jù)進(jìn)行歸一化或標(biāo)準(zhǔn)化。通過離群點去除算法將離群點去除后,需要進(jìn)行數(shù)據(jù)集的歸一化與標(biāo)準(zhǔn)化處理,以及對數(shù)據(jù)的清洗。首先,運用sklearn中的算法將數(shù)據(jù)集分割成media和valid兩個數(shù)據(jù)集,testsize設(shè)置為0.2,然后將midia再次通過sklearn中的數(shù)據(jù)集分割算法,testsize再次設(shè)置為0.2,最后得到訓(xùn)練集,測試集以及驗證集。

5 鉆速預(yù)測方案設(shè)計

針對一般的優(yōu)化問題,首先要對相關(guān)輸入與輸出的關(guān)系建立映射,為了達(dá)到最優(yōu)化的目的,應(yīng)基于這種映射來找到全局最優(yōu)解。要想將這種方法應(yīng)用到實際的項目中去,應(yīng)該做到以下兩點:第一是建立目標(biāo)特征與其他特征建立對應(yīng)關(guān)系,在本項目中對應(yīng)的是將鉆速與其他特征例如鉆壓,大勾高度等參數(shù)建立映射關(guān)系;第二則是在模型訓(xùn)練后尋找函數(shù)本身的最優(yōu)點。

在本項目中,重點與難點是進(jìn)行數(shù)據(jù)的分析,即對于石油鉆井的各項參數(shù)的可視化,圖表分析。通過對石油鉆井?dāng)?shù)據(jù)的分析,我們才能進(jìn)一步得出結(jié)論。所以,該模塊分為以下兩個部分:(1)通過對數(shù)據(jù)的分析,合理的使用數(shù)據(jù)預(yù)處理的各個模型,使得模型擬合效果達(dá)到不錯的效果,并在這個過程中,通過查看各個 參數(shù)對rop鉆速的影響,來對這些參數(shù)的重要性有一個大概的了解。(2)通過使用lightgmb算法,對訓(xùn)練集中的鉆速進(jìn)行擬合,通過調(diào)整模型參數(shù),以及刪除離群點等操作,使得該模型的rmse評分達(dá)到最優(yōu),通過其算法的特點,找出最能影響鉆速的10個參數(shù)與數(shù)據(jù)分析時所找的參數(shù)進(jìn)行分析對比。最終找出最能影響鉆速的參數(shù)。(3)使用全連接神經(jīng)網(wǎng)絡(luò)對同樣的數(shù)據(jù)集進(jìn)行擬合,觀察擬合效果。(4)根據(jù)(1)(2)(3)中模型預(yù)測效果的對比以及相關(guān)分析,選擇合適的模型,確定最終模型的結(jié)構(gòu)。(5)根據(jù)訓(xùn)練好的模型結(jié)構(gòu),尋找模型局部較優(yōu)點。

6 實驗結(jié)果分析

6.1 Lightgbm模型

運用上述去除離群點的方法去除離群點之后,對Lightgbm模型進(jìn)行訓(xùn)練,得到相應(yīng)的rmse的值。通過實驗結(jié)果可以推出:Lightgbm模型訓(xùn)練時間段,訓(xùn)練效果好,比較適合用于鉆速預(yù)測的工作。在Lightgbm模型中,數(shù)據(jù)各個特征對于目標(biāo)特征的重要程度可以進(jìn)行從小到大的排序,而且通過生成回歸樹進(jìn)行分割的次數(shù)也能被記錄下來。雖然通過調(diào)整模型中的各個參數(shù)來對模型本身進(jìn)行優(yōu)化,但是各個特征之間的關(guān)系,即對目標(biāo)特征的重要程度不會發(fā)生相應(yīng)的變化。通過對結(jié)果數(shù)據(jù)進(jìn)行分析可以看出鉆時對最終預(yù)測結(jié)果的影響最大,遠(yuǎn)高于其他特征,這與在數(shù)據(jù)分析時所畫的圖相同,說明該參數(shù)對于鉆速的影響確實非常大。對鉆速影響第二大的是大勾高度,在歷史擬合的實驗中,該特征往往被忽略,而該實驗則可以對傳統(tǒng)歷史擬合作出一定程度的補(bǔ)充。另外,還有很多參數(shù)也能對模型的結(jié)果產(chǎn)生影響,例如活動池體積、鉆壓等。在歷史擬合的實驗中,這些參數(shù)都是鉆井過程中會直接影響鉆進(jìn)速度的因素,理應(yīng)對鉆進(jìn)速度的預(yù)測有較大的影響。而那些靜態(tài)變量,例如測量井深、垂直井深等,在一開始的數(shù)據(jù)分析中就發(fā)現(xiàn)對實驗結(jié)果影響不大,這也是合情合理的。

6.2 神經(jīng)網(wǎng)絡(luò)模型

在該實驗中,我們運用 pytorch對模型進(jìn)行建模,進(jìn)行數(shù)據(jù)訓(xùn)練時,采用4層網(wǎng)絡(luò)架構(gòu),包括輸入層,dropout層,隱藏層以及輸出層。通過數(shù)據(jù)預(yù)處理將靜態(tài)變量刪除后,剩下的數(shù)據(jù)中一共包含有25個特征參數(shù),因此輸入層包含25個輸入節(jié)點;在選取激活函數(shù)時,使用Relu函數(shù),在輸出層不使用激活函數(shù),將最后一層隱層的輸出經(jīng)過加權(quán)后直接作為輸出的預(yù)測結(jié)果。在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,通過選取合適的batch與epoch來控制模型的訓(xùn)練過程。通過設(shè)置dropout為0.2來保證數(shù)據(jù)的隨機(jī)性。通過pytorch中的優(yōu)化器進(jìn)行設(shè)置使得學(xué)習(xí)率為0.000 1,優(yōu)化器選用adam。在實驗中,迭代次數(shù)為第930次迭代時目標(biāo)特征的擬合程度達(dá)到最優(yōu),共耗時為892秒。通過實驗數(shù)據(jù)的分析可以看出神經(jīng)網(wǎng)絡(luò)對于相同的數(shù)據(jù)同樣展現(xiàn)出了良好的擬合能力,并且沒有異常情況出現(xiàn),如欠擬合或過擬合等。通過與Lightgmb模型進(jìn)行對比,發(fā)現(xiàn)該模型訓(xùn)練出的效果比lightgmb模型的效果要好。但是訓(xùn)練的時長是lightgmb模型的很多倍。經(jīng)過上述模型訓(xùn)練以及分析過程可以看出,即使運用最簡單的深度學(xué)習(xí)框架,也和如今流行的機(jī)器學(xué)習(xí)算法的訓(xùn)練效果差不多。而普通的算法模型的訓(xùn)練效果就要比深度學(xué)習(xí)的訓(xùn)練效果差上不少。

7 鉆速優(yōu)化

本項目分別在不同的模型中對鉆速進(jìn)行了預(yù)測,運用的模型有Lightgbm模型、全連接神經(jīng)網(wǎng)絡(luò)模型以及普通算法模型。根據(jù)模型得出的rmse分?jǐn)?shù)以及測試集上的表現(xiàn)可以推出以下結(jié)論:(1)普通的算法模型的rmse得分較差,Lightgbm模型的rmse得分基本與全連接神經(jīng)網(wǎng)絡(luò)模型相同,比其他算法模型效果都要好。(2)全鏈接神經(jīng)網(wǎng)絡(luò)模型得出結(jié)果的時間最長,Lightgbm模型得出結(jié)果的時間是最短的。這說明在實踐過程中運用lightgbm模型的效果能達(dá)到最優(yōu)。

8 結(jié)語

本項目主要完成了以下三部分工作內(nèi)容:(1)通過對鉆井過程中存在的問題與機(jī)器學(xué)習(xí)算法結(jié)合起來進(jìn)行研究,使得機(jī)器學(xué)習(xí)算法能與實際問題結(jié)合,并提供優(yōu)化思路。為后續(xù)研究提供理論基礎(chǔ)。(2)鉆井?dāng)?shù)據(jù)處理方案的設(shè)計。本文通過對鉆井?dāng)?shù)據(jù)特征進(jìn)行研究,將不必要的特征刪除,并且結(jié)合系統(tǒng)論的思想,實現(xiàn)了對于鉆井?dāng)?shù)據(jù)的處理,其中,數(shù)據(jù)清洗最為重要,是機(jī)器學(xué)習(xí)項目中的基石。通過分析數(shù)據(jù),可以得出到底運用哪個鉆井參數(shù)的結(jié)論。(3)本文通過機(jī)器學(xué)習(xí)的常用優(yōu)化策略,實現(xiàn)對鉆速的優(yōu)化,通過常用的回歸模型來對對應(yīng)鉆速的各個參數(shù)實現(xiàn)優(yōu)化與處理。

猜你喜歡
特征實驗模型
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達(dá)“特征”
做個怪怪長實驗
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
NO與NO2相互轉(zhuǎn)化實驗的改進(jìn)
主站蜘蛛池模板: 97国产在线播放| 国产大片黄在线观看| 国产在线第二页| 国产福利拍拍拍| a天堂视频| 欧美啪啪一区| 夜夜操天天摸| 国产极品嫩模在线观看91| 亚洲女人在线| 白丝美女办公室高潮喷水视频| 99热在线只有精品| 色亚洲成人| 国产丰满成熟女性性满足视频| 婷婷综合色| 成人午夜免费观看| 亚洲另类国产欧美一区二区| 国产福利小视频在线播放观看| 国产96在线 | 99国产精品国产| 天天综合网色中文字幕| 午夜无码一区二区三区在线app| 日本不卡在线| 欧美日韩第二页| 狠狠综合久久久久综| 日本欧美成人免费| 超清无码熟妇人妻AV在线绿巨人| 看国产毛片| 国产综合无码一区二区色蜜蜜| 亚洲精品国产日韩无码AV永久免费网| 国产手机在线观看| 一区二区三区国产| 无码人中文字幕| 欧美亚洲欧美| 亚洲系列无码专区偷窥无码| 污网站免费在线观看| 国产永久在线视频| 欧美精品v欧洲精品| 精品第一国产综合精品Aⅴ| 美女无遮挡被啪啪到高潮免费| 免费三A级毛片视频| 国产成人亚洲欧美激情| 91精品情国产情侣高潮对白蜜| 久久不卡国产精品无码| 素人激情视频福利| 亚洲熟女中文字幕男人总站| 欧美一区国产| 欧美另类图片视频无弹跳第一页| 福利一区在线| 色噜噜在线观看| 国产69精品久久久久孕妇大杂乱| 久久青草精品一区二区三区 | a亚洲天堂| 国产乱子伦一区二区=| 亚洲精品中文字幕午夜| 2021最新国产精品网站| 国产在线精彩视频论坛| 极品国产在线| 欧美日韩国产成人高清视频| 老司国产精品视频91| 六月婷婷精品视频在线观看| 欧美精品v欧洲精品| 国产精品页| 日韩一级二级三级| 自偷自拍三级全三级视频| 久久久精品久久久久三级| 精品少妇人妻无码久久| 日韩精品中文字幕一区三区| 国产精品无码久久久久久| 国产对白刺激真实精品91| 91精品人妻互换| 99尹人香蕉国产免费天天拍| 国产真实自在自线免费精品| 久久亚洲国产最新网站| 免费va国产在线观看| 国产在线精彩视频二区| 国产粉嫩粉嫩的18在线播放91| a毛片在线播放| 欧美中文字幕在线视频| 毛片大全免费观看| 欧洲一区二区三区无码| 国产无码高清视频不卡| a在线亚洲男人的天堂试看|