999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多因子長時序信息聯合建模的深度卷積卡鉆事故預測①

2022-09-20 04:12:00張萬棟郭威龍李炎軍李盛陽2
計算機系統應用 2022年9期
關鍵詞:方法

張萬棟, 郭威龍, 李炎軍, 李盛陽2,3,, 彭 巍

1(中海石油(中國)有限公司 湛江分公司, 湛江 524057)

2(中國科學院 空間應用工程與技術中心, 北京 100094)

3(中國科學院 太空應用重點實驗室, 北京 100094)

4(中國科學院大學, 北京 100049)

海上石油鉆井是一個涉及多領域的復雜系統工程,受地質環境等多種不可控因素的影響, 鉆井過程中往往伴隨著事故的發生, 如卡鉆、井涌、井漏等, 嚴重影響了鉆井作業的效率, 并且容易造成巨大的經濟損失[1,2].其中卡鉆是在鉆井過程中最常見的事故之一, 卡鉆是指在鉆井進程中, 由于鉆柱在起下鉆的過程中失去自由活動, 即鉆井管柱不能上下活動也不能轉動, 在井眼的某一井段遇到阻礙的鉆井事故[3]. 相關鉆井資料數據統計顯示, 卡鉆及卡鉆事故的處理占整個鉆井作業的40%-50%[4], 研究卡鉆事故的預測方法對保障實際鉆井作業的安全進行、降低施工成本具有十分重要的意義.

1 卡鉆事故預測

目前常用的卡鉆事故預測方法大致可分為兩類:(1)基于分類的方法; (2)基于時間序列信息的異常檢測方法. 兩類方法各有其優缺點.

1.1 基于分類的方法

基于分類的卡鉆事故預測方法通過對當前單個時間點各個鉆井平臺監測因子的值進行正常/將發生事故的分類來預測卡鉆事故, 如圖1(a)所示. 劉建明等[4]通過主成分分析法(PCA)對井下測量工程參數進行降維處理, 利用隨機森林(RF)模型對降維后的數據進行訓練和測試, 判斷是否發生卡鉆事故. 蘇曉眉等[5]利用PCA算法對冀東油田某井卡鉆前的井下鉆頭實測工程參數進行降維處理, 再利用K-means聚類模型對降維后的數據進行訓練測試, 該方法通過數據中心之間的距離判定卡鉆事故是否發生. 劉光星等[6]分別利用單個/多個ARMA模型[7]對各個參數的監測數據進行分析, 預測卡鉆事故的發生. BP神經網絡[8]以及改進的BP神經網絡[2]在卡鉆事故預測中也被證明具有良好的效果.

圖1 基于單時間點和提出的多因子長時序信息聯合建模方法的對比示意圖

1.2 基于時間序列信息的異常檢測方法

基于時間序列信息的異常檢測方法的核心思想是對鉆井平臺各監測因子時序數據的異常變化進行捕捉并預警, 此類方法認為鉆井事故發生前數據的異常變化可作為事故發生的征兆. Ben等[9]利用深度神經網絡進行實時在線鉆井狀態的分類, 并使用一個離線的語義分割網絡U-Net監測在線模型的表現, 當出現錯分時, 對在線網絡進行更新和訓練, 最后使用專家經驗在后處理過程對結果進行微調, 提出的方法在40口井,3 000萬條數據中, 取得了99%的分類精度. Zha等[10]僅利用井表面數據借助深度學習技術進行井下異常的判定與預測. Kaneko等[11]利用RNN構建網絡用于捕捉時序上的數據關系, 在線性、非線性模擬仿真的數據中均表現較好, 其中與線性模擬數據上的測試結果相比, 非線性模擬數據上的測試結果稍差. 此外, 基于時間序列建模的異常檢測方法在其他鉆井事故如井噴、井漏等也有廣泛的應用. Xie等[12]第一次結合大數據分析對井噴事故進行早期監測, 所研制的監測系統能夠捕獲和表示不同指標之間復雜的關系, 對捕捉到的異常進行預警, 現場工程師對這些消息做進一步的確認, 有效避免了事故的發生. Asarogiagbon等[13]設計了一個人工神經網絡預測孔隙壓力(pore pressure prediction)以提前預警鉆井事故的發生.

上述方法在卡鉆事故預測中開展實驗并取得了一定的效果, 但該類方法仍然存在兩方面的局限性:(1)基于分類的方法大多數依賴于當前單個時間點鉆井平臺各個監測因子的值, 忽略了對監測參數長時序信息的利用, 鉆井事故的發生不僅依賴于單個時間點上各監測參數的異常, 還依賴于一段時間內多個參數的變化趨勢, 比如根據扭矩增加、轉速降低可以有效預測卡鉆事故的發生; (2)基于時間序列建模的異常檢測方法將數據的異常變化視為鉆井事故將要發生的征兆, 但由于地質等外在因素的不確定性, 數據的異常變化存在于整個鉆井作業, 要從其中選擇高置信度的異常, 需要專家人為進行篩選, 人工成本較高.

鑒于現有方法的缺點和不足, 本文擬設計一種綜合考慮多因子長時序信息并且具有較高置信度預警的方法.

以卷積網絡為代表的深度學習方法具有強大的空間信息建模能力, 在狀態預測、故障診斷等領域中已取得了良好的效果[14-16]. 如呂召陽等[17]為克服流體力學領域中傳統數學擬合方法不能很好地呈現系統非線性的問題, 基于卷積神經網絡, 考慮機翼變攻角和浮沉建立了一種多變量多輸出的模型, 實現了機翼氣動系數的快速預測, 穩定性實驗結果表明其建立的模型穩定性較好. 趙小強等[18]針對滾動軸承在強噪聲環境和變工況下故障診斷效果不佳、泛化能力差的問題, 提出一種基于改進CNN的滾動軸承變工況故障診斷方法, 在凱斯西儲大學軸承數據集上的變噪聲實驗表明其具有較好的抗噪性和更好的泛化能力. 韋延方等[19]針對直流電網故障檢測正確率低、魯棒性弱的問題,提出了一種基于卷積神經網絡(CNN)與深度卷積對抗生成網絡(DCGAN)的柔性直流配電網故障檢測方法,試驗結果表明其在不同工況下具有較高的監測精度.

基于上述觀察與思考, 本文提出了一種多因子長時序信息聯合建模的深度卷積卡鉆預測方法(CNNMFT), 本文的主要貢獻如下: (1)利用卷積的平面空間信息建模能力, 同時對多個鉆井監測因子及其時序信息進行聯合建模; (2)為了適應性地捕捉復雜環境下不同因子對卡鉆事故預測起到的關鍵作用, 提出的方法使用自注意力機制對長時序信息進行建模; (3)學習卡鉆事故發生前的征兆信息, 能夠進行高置信度的預警,有效降低了對專家人工篩選預警點提高預警置信度后處理手段的依賴; (4)在2021年4-5月某海上鉆井平臺20萬組實際監測數據上的測試表明了本文提出方法的有效性, 提出的方法取得了93%以上的卡鉆事故預測精度.

2 CNN-MFT方法

深度卷積網絡具有關聯多維空間數據的特性, 自注意力機制能夠建模長序列的信息, 將二者結合起來應用于卡鉆事故預測能夠將多個鉆井平臺監測因子的長時序信息進行聯合建模, 進行準確的卡鉆事故預測.

CNN-MFT模型的整體結構如圖2所示, 主要包括: (1)訓練樣本構建; (2)自注意力模塊; (3)卷積網絡構建; (4)分類器構建; (5)損失函數構造.

圖2 CNN-MFT網絡結構示意圖

2.1 訓練樣本構建

用tar(b)和tar(e)表示卡鉆事故φ發生的開始時間點和結束時間點, 該區間內的數據特征為網絡學習的目標特征, A={a1, a2, …, an}表示鉆井平臺作業中監測的n個因子, 對于當前時間點Tk, 提出的方法對多個因子的長時序信息進行聯合建模, 時序長度為l的輸入樣本可用矩陣Hk表示:

則該樣本對應標注向量為:

本文提出的CNN-MFT模型的主要目的是利用多因子的長時序歷史信息提高模型對當前時刻預測的準確性, 因此在本文中:

即選用數據集對當前時刻Tk的標注作為訓練樣本Hk的標注信息.

2.2 自注意力模塊

自注意力機制目前在計算機視覺領域、自然語言處理領域內被廣泛應用, 其最大的優點是可以對長序列信息進行建模, 并且比RNN、LSTM能記憶更長序列的信息, 且較容易訓練.

CNN-MFT中使用的自注意力結構為單層的自注意力, 其主要目的是對鉆井平臺每個監測因子的長時序信息進行建模. 對每個訓練樣本Hk, 第i個因子的時序信息Xi為:

使用3個可學習的權重矩陣獲取查詢向量Q, 鍵向量K和值向量V:

其中, Wq, Wk, Wv是權重矩陣, 然后利用查詢向量Q和鍵向量K進行注意力矩陣A的計算:

其中, KT是鍵向量K的轉置, 獲得注意力矩陣之后與值向量V結合可以獲得加入注意力之后的新特征.

利用自注意力機制對鉆井監測因子數據的時序信息建模有兩個優點: 一方面其可以對長時序的信息進行建模, 同時考慮全時序的信息, 能夠獲得較為全局的視野; 另一方面是其在考慮時序信息的同時也能夠關注每個時間點的值的信息.

2.3 卷積網絡

本文提出的CNN-MFT方法中, 構建卷積網絡的主要目的是利用卷積可以對二維空間信息進行建模的特性對多個鉆井因子的時序信息進行聯合建模, 其網絡結構如圖2所示. 對輸入的任意特征矩陣O, 網絡的學習目標可以表示為:

其中, Ψ為網絡學習的目標函數, P為網絡的預測輸出,包括預警的置信度confidence, 預警的事故類型type以及預警的時間點Tp.

網絡主要由多個卷積層、池化層及激活函數ReLU組成. 卷積層的輸入輸出都是一個多維的矩陣, 其根據輸入的多維空間的特征矩陣中局部的數據來決定輸出空間中對應位置的值, 該特性賦予了卷積同時對多維空間數據進行聯合建模的能力, 其可變的參數為卷積核大小、步長、是否padding等, 在此用?i表示第i層的卷積, 則其輸入輸出可表示為:

其中, Oi, Oi-1為該層卷積的輸入和輸出矩陣.

對于m層的卷積網絡的輸入和輸出可表示為:

其中, O為多層卷積網絡的輸入矩陣, 即注意力模塊的輸出, Om為經多層卷積提取后輸出的特征矩陣, 其中包含了網絡學習到的與事故強相關的異常數據的特征信息, 利用此信息可對事故是否將要發生進行有效的預測.

為了增加特征的學習速度, 保持輸入輸出空間數據分布的一致性, 在每層卷積之后會增加一個單獨的激活函數層ReLU及batch normalization (BN)層, 此時?i層卷積的輸入和輸出可表示為:

對應m層卷積網絡的輸入輸出可表示為:

2.4 分類器

分類器根據卷積網絡輸出的特征進行分類, 它由多層的全連接層構成, 是一個神經網絡分類器, 其根據卷積層網絡的輸出特征Om′ 對可能發生的鉆井事故進行預測, 包括卡鉆事故發生的置信度及是否會發生卡鉆事故.卷積層網絡輸出的特征的形狀為C×H×W, 其中, C為特征矩陣的通道數, H和W分別為特征矩陣的高和寬, 由于全連接層的輸入是一維的向量, 在此網絡中對卷積層輸出的特征Om′ 進行如下操作:

其中, Ave_Pool為平均池化, 即對特征矩陣Om′ 的每個通道的所有值取平均, 將特征矩陣轉換為C×1的一維向量M, 輸入到全連接層中進行預測:

轉換之后的特征向量輸入分類器, 輸出預測結果p, 其中confidence和type表示預測的概率分布, f表示分類器學習到的擬合函數.

2.5 損失函數

CNN-MFT網絡的損失函數采用交叉熵函數, 其主要作用是衡量模型的預測與真實標注之間的距離或者模型預測的概率分布與真實的概率分布之間的差距,在此采用Pi=(pi0, pi1, …, pik)表示模型對第i個樣本預測的概率分布, 其中k表示預測事故類型數量, 在本文中k的值為1. Yi=(yi0, yi1, … , yik)表示第i個樣本真實的概率分布, 此處的概率分布表示當前樣本預測為正常、發生卡鉆的概率. 則網絡的損失函數可表示為:

其中, N表示樣本的總數量, 利用此損失函數可以衡量在每次訓練過程中模型的預測與學習目標之間的差距,根據此種差距更新網絡的參數逼近學習目標, 最終獲得能夠有效預測鉆井事故的模型.

CNN-MFT模型不同層網絡的具體參數配置如表1所示.卷積層的卷積核大小為3×3, 池化層的卷積核大小為2×2, 即輸入到輸出降采樣兩倍, 兩層全連接層的神經元個數分別為96和64, 正則化層的主要作用是通過在學習時以一定的概率隨機丟棄神經元使得網絡在學習時不依賴于某個或某幾個神經元的權重信息, 從而避免過擬合, 本文中神經元的丟棄率為0.5, 在卷積層和第一層全連接層之后, 連接激活函數ReLU, 用于學習當前信息是否向下流通.

表1 不同網絡層具體參數配置

3 實驗

3.1 實驗數據

本文選用的為某海上鉆井平臺某區域近20天的實際監測數據, 開始時間為2021年4月18號6點47分18秒, 結束時間為2021年5月8日17點40分22秒, 包括泥漿池體積、泥漿平均流入流量、返出、泵壓、大勾高度、入口泥漿平均溫度、泥漿池體積變化、大勾懸重、扭矩、轉盤轉速、返出深度、鉆頭測量深度、鉆壓等13個監測因子, 各因子的統計信息如表2所示, 主要包括最大值、最小值、平均值和標準差. 其中值域范圍最大的為泥漿平均流入流量, 最大值為5 024.07, 最小值為0; 值域范圍最小的為鉆壓, 最大值為15.1, 最小值為0; 平均值最大的3個因子為返出深度、鉆頭測量深度和泥漿池體積變化, 標準差最大的3個因子為鉆頭測量深度、返出深度和泥漿平均流入流量, 其主要原因可能由于卡鉆事故在某一段深度內頻繁發生, 現場施工進行頻繁起下鉆, 造成該因子數據波動較大. 部分監測因子的時序變化如圖3所示, 數據整體呈現出高動態、非周期性等特點.

圖3 數據集部分因子時序數據可視化

表2 鉆井監測數據各因子統計信息

數據集任意時刻Tk對應一個標注, 其根據該鉆井平臺實際工作日志對卡鉆事故的記錄生成, 分別為正常數據(用0表示, 為負樣本), 和將要發生卡鉆事故的數據(用1表示, 為正樣本), 其中日志記錄包含每次事故發生的開始時間和結束時間, 圖4、圖5分別展示了日志記錄的某次卡鉆事故(2021年4月21日4點0分0秒)前扭矩和鉆壓的數據變化, 從圖中可以看出,事故發生前扭矩和鉆壓整體逐漸升高, 其中扭矩最高為14左右, 鉆壓最高為6左右.

圖4 卡鉆事故發生前扭矩數據的變化

圖5 卡鉆事故發生前鉆壓數據的變化

數據集共包含208 504組數據, 每組數據包含13個特征, 整體正負樣本分布呈不均衡狀態, 其中正樣本為19 300, 負樣本為18 920, 在整個數據區間多數為正常數據, 少數為將要發生卡鉆事故的數據.

3.2 對比方法與實驗配置

為充分驗證本文提出算法的效果, 本節實驗在相同條件下分別使用50%和70%的數據集訓練不同方法, 并對比其實驗結果. 本文主要選用了SVM-rbf、SVM-linear、SVM-poly、RF (隨機森林)、PCA-SVMrbf、PCA-SVM-linear、PCA-SVM-poly、PCA-RF等8種方法作為本節實驗的對比方法, 它們是目前鉆井事故預測中使用最多的幾種方法.其中PCA為主成分分析方法, 是一種數據降維方法, 其在事故預測方法中常被用于剔除原始數據的冗余信息, 提高算法的學習效率, 在本節實驗中所有使用PCA的對比方法中均取降維后的第一個主成分用于預測卡鉆事故. -rbf、-linear、-poly分別代表SVM中使用的高斯核, 線性核和多項式核.

模型訓練的初始學習率為0.000 5, 每次訓練加載的樣本數量為1 024, 訓練的迭代次數為500, 網絡的預測結果經過Softmax函數之后輸出的預測向量中, 取概率最高的位置對應的類別作為預測類型(正常/卡鉆). PCA、SVM-rbf、SVM-linear、SVM-poly、RF方法基于Python擴展包Sklearn實現, CNN-MFT基于PyTorch框架實現, 方法的訓練和測試在1塊Tesla V100上進行, 顯存為32 GB, CPU的型號為Intel?Xeon? Gold 5 118 CPU@2.3 GHz, 內存總量為187 GB.

3.3 評價指標

本文以通用的準確率(ACC)和ROC曲線[3]作為卡鉆事故預測效果的評價指標, 準確率指的是所有測試樣本中被正確分類樣本的比例; ROC曲線的橫軸為假陽率(FPR), 含義為錯誤分類的正樣本數量與總負樣本數量的比值, 縱軸為真陽率(TPR), 含義為正確分類的正樣本數量與總正樣本數量的比值, ROC曲線與坐標軸圍成的面積(AUC)能夠反映模型在不同閾值下的卡鉆事故預測性能, 此外本文還使用不同方法在訓練數據集上訓練一次耗費的時間來評價不同方法的時間成本.

3.4 實驗結果及分析

3.4.1 50%數據訓練實驗結果分析

不同方法使用50%的數據集數據訓練, 在剩余50%數據上測試結果的準確率(ACC)、ROC曲線及AUC分別如表3, 圖6所示.

表3 50%數據訓練不同方法卡鉆事故預測結果對比

圖6 50%數據訓練不同方法的ROC曲線

根據準確率評價指標, 本文提出的方法CNNMFT取得了最高的準確率為0.934 0, 分別比SVMrbf、SVM-linear、SVM-poly、RF、PCA-SVM-rbf、PCA-SVM-linear、PCA-SVM-poly、PCA-RF方法的準確率高出了77.72%、8.39%、19.64%、2.61%、2.50%、70.96%、20.29%、2.20%, 說明了本文提出的方法的有效性, 能夠很好地預測卡鉆事故的發生. 此外在SVM系列方法中采用線性核和多項式核要比采用高斯核的效果好, 這說明了在實際鉆井作業中, 監測數據的分布并非是類似高斯分布等相對較均勻的分布,也說明了鉆井事故預測的復雜性. 對比不同方法使用PCA主成分分析方法降維數據前后準確率的變化可知, SVM-rbf方法在使用了PCA降維方法前后準確率變化最明顯, 準確率由0.156 8增加到了0.909 0, 這說明了PCA方法對數據降維能夠有效剔除數據中的冗余信息和干擾信息, 證明了PCA方法對鉆井事故預測的有效性. 而SVM-linear和SVM-poly方法在使用PCA方法后, 準確率有所下降, 這主要是由于線性核和多項式核擬合的是相對較為復雜的函數, 將數據維度降為1會對此類方法的性能有所損害.

根據AUC評價指標, 在所有方法中隨機森林RF方法取得了最高的AUC為0.592 0, 不同方法之間的AUC差別較小, 其中AUC指標最低的是SVMrbf方法為0.423 2. 本文提出的CNN-MFT方法的AUC指標為0.576 8, 次于隨機森林RF方法和PCASVM-linear方法.在使用PCA降維之后, SVM-rbf方法和SVM-linear方法的AUC指標增高, 分別由0.423 2增加至0.478 7, 由0.474 9增加至0.591 9; 然后SVM-poly方法和隨機森林RF方法在使用PCA降維之后, AUC指標均降低, 分別由0.538 1降低至0.449 8, 由0.592 0降低至0.5626. 此外, 由圖6所示的ROC曲線可以看出,多數方法的曲線在不同節點的波動性較大, 說明其在某些情況下效果較好, 某些數據情況下效果較差, 而本文提出的CNN-MFT方法的ROC曲線整體呈現較為穩定的趨勢, 說明其在不同數據情況下算法的穩定性好.

不同方法使用50%的訓練集訓練一次耗費的時間如表3所示, 不同方法訓練一次方法耗費的時間較短, 其中隨機森林RF方法訓練一次的時間最短為0.03 s,本文提出的CNN-MFT方法在數據集上訓練一次耗費的時間最長為3.8 s, 按照訓練一次耗費時間長短由小到大排序為RF、PCA-RF、PCA-SVM-linear、PCASVM-poly、SVM-linear、PCA-SVM-rbf、SVM-poly、SVM-rbf、CNN-MFT. 本文提出的CNN-MFT方法訓練時間較長的主要原因是每次預警時即要輸入當前時刻數據又要輸入其歷史時序的數據, 輸入的數據量相對其他方法要大的多. 此外使用PCA方法降維后不同方法的訓練時長均減少, 主要是由于降維后整體用于訓練的數據量大幅減少, 數據維度由13降為1.

3.4.2 70%數據訓練實驗結果分析

不同方法使用70%的數據集數據訓練, 在剩余30%數據上測試結果的準確率(ACC)、ROC曲線及AUC分別如表4, 圖7所示.

圖7 70%數據訓練不同方法的ROC曲線

表4 70%數據訓練不同方法卡鉆事故預測結果對比

根據ACC評價指標, 本文提出的方法CNN-MFT模型的準確率最高為0.932 0, 分別比SVM-rbf、SVMlinear、SVM-poly、RF、PCA-SVM-rbf、PCA-SVMlinear、PCA-SVM-poly、PCA-RF的準確率高出了77.44%、23.08%、14.51%、2.28%、2.26%、19.3%、23.29%、2.09%, 說明了本文提出的方法的有效性, 能夠很好地預測卡鉆事故的發生. 對比不同方法使用PCA主成分分析方法降維數據前后準確率的變化可知, 多數方法在使用PCA降維后, 準確率提高, 其中SVM-rbf方法的準確率增加最明顯, 由0.157 6增加到了0.909 4, 而SVM-poly方法的準確率在使用PCA降維之后降低, 由0.786 9降低為0.699 1.

根據AUC評價指標, 在所有方法中PCA-SVMlinear和PCA-SVM-poly方法的該指標值最高均為0.593 1, SVM-linear最低為0.406 3, 本文提出的CNNMFT方法的AUC指標為0.552 8, 次于PCA-SVMlinear、PCA-SVM-poly、PCA-RF. 但根據圖7不同方法的ROC曲線可以看出, CNN-MFT方法的曲線整體呈較為穩定的上升趨勢, 這說明在不同情況下該算法的穩定較好.

不同方法使用70%數據集數據訓練一次耗費的時間如表4所示, 其中, 隨機森林RF算法耗費的時間最短, 為0.044 s, CNN-MFT方法耗費的時間最長, 為5.038 s. SVM-rbf、SVM-linear、SVM-poly方法在使用PCA方法降維后, 整體訓練一次耗費的時間降低,而隨機森林RF方法, 在使用PCA方法降維后時間變長, 主要是由于PCA對數據降維時耗費的時間較長.

3.4.3 50%和70%數據訓練不同方法結果對比

根據ACC評價指標, 對比不同方法使用50%和70%數據訓練的測試結果, 多數方法卡鉆事故預測的準確率下降, 包含SVM-linear、SVM-poly、PCA-SVMpoly、PCA-RF、CNN-MFT, 這說明當不改變模型的參數配置, 僅增加訓練數據的規模時, 學習正常數據和卡鉆事故發生前的異常數據之間邊界變得困難.

根據AUC評價指標, 大部分方法的指標值降低, 包括SVM-rbf、SVM-linear、SVM-poly、RF、PCA-SVMrb、PCA-RF、CNN-MFT, 但整體AUC指標的變化不大.

與使用50%數據集數據訓練不同方法, 在使用70%數據集數據訓練耗費的時間更長, 主要是由于整體訓練的數據增多, 造成訓練時間增長.

3.4.4 消融實驗

為了充分理解本文提出的方法中自注意力模塊和CNN模塊對卡鉆事故預測的作用, 在使用50%數據訓練的情況下進行了消融實驗, 實驗結果如表5所示.在僅使用CNN模塊時, 提出的CNN-MFT網絡的分類準確率為0.902 8, AUC指標為0.533 6, 結合表3結果可知, 其卡鉆事故預測性能仍高于大部分對比方法, 說明了CNN模塊對卡鉆事故的準確預測有著重要的作用;當自注意力模塊和CNN模塊同時使用時, CNN-MFT網絡的分類準確率為0.934 0, AUC指標為0.576 8, 相較于僅使用CNN模塊的預測結果, 分類準確率提升了0.031 2, AUC指標提升了0.043 2, 分析其原因主要在于自注意力模塊不可替代的長時序信息建模能力,雖然多層的CNN也可以對長時序的信息進行建模, 但是在層與層之間存在一定的信息損失, 使用自注意力模塊能更好地提升網絡對于不同因子長時序信息的利用, 有效提升網絡的卡鉆事故預測效果.

表5 使用50%數據訓練消融實驗結果對比

4 結論與展望

為了解決海上石油卡鉆事故預測精度低、穩定性差、現有卡鉆事故預測方法多依賴于單時間點不同監測因子的值進行預測, 未充分利用鉆井監測數據長時序信息的問題, 本文提出一種多因子長時序信息聯合建模的深度卷積卡鉆預測方法(CNN-MFT), 通過充分利用鉆井監測數據的長時序信息, 克服現有的依賴于單個時間點各因子值進行事故預測方法中事故特征缺失問題; 以多層卷積網絡提取錄井監測數據的多維空間信息, 結合自注意力模塊進行多因子長時間序列的聯合建模, 實現卡鉆事故的高置信度預測, 并得出如下結論:

(1) CNN-MFT模型在使用50%和70%數據訓練的情況下均取得了最高的預測準確率, 分別為0.934 0和0.932 0, 能有效地預測卡鉆事故的發生;

(2) CNN-MFT方法在不使用降維方法的情況下獲得了最高的準確率, 說明了其在復雜的鉆井平臺監測數據中具有良好的多因子長時序信息建模能力及學習能力, 證明了該方法的有效性;

(3) 綜合實驗結果, 本文提出的CNN-MFT方法在預測準確率上優于目前常用的SVM-rbf、SVM-linear、SVM-poly、RF、PCA-SVM-rbf、PCA-SVM-linear、PCASVM-poly、PCA-RF卡鉆預測方法, 且方法的穩定性較強, 能夠為實際鉆井平臺的卡鉆事故預測提供技術支撐.

本文的研究尚存在一定的局限性, 雖然本文提出的方法具有較高的準確率, 但是其ROC曲線圍成的面積AUC仍有一定的提升空間, 此外由于真實鉆井平臺卡鉆事故監測數據是一個正負樣本不平衡的數據, 從此角度出發研究平衡樣本的算法, 進一步提升卡鉆事故預測模型的性能也是一個有價值的研究方向.

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 成人午夜精品一级毛片| 亚洲国产无码有码| 热久久综合这里只有精品电影| 午夜毛片免费观看视频 | 欧美一级高清视频在线播放| 久久网综合| 亚洲国产成人自拍| 亚洲成人www| 国产高颜值露脸在线观看| 国产真实乱人视频| 国产视频大全| 日日拍夜夜嗷嗷叫国产| 制服丝袜一区| 婷婷综合亚洲| 97成人在线视频| 久久久久免费看成人影片| 亚洲第一区在线| 亚洲国产天堂久久综合| 中文无码伦av中文字幕| 一级香蕉视频在线观看| 午夜少妇精品视频小电影| 国产亚洲精品无码专| 国产国拍精品视频免费看| 三区在线视频| 亚洲午夜片| 波多野结衣视频一区二区 | 亚洲无码日韩一区| 亚洲制服中文字幕一区二区| 色综合久久无码网| 亚洲第七页| 国产无套粉嫩白浆| 国产成人免费观看在线视频| 亚洲福利片无码最新在线播放| 国产91熟女高潮一区二区| 福利一区三区| 国产成人无码Av在线播放无广告| 久久国产精品娇妻素人| 午夜不卡视频| 一本大道无码高清| 色偷偷一区二区三区| 免费观看精品视频999| 一级毛片免费播放视频| 天堂亚洲网| 久久五月视频| 最新国产高清在线| 欧美一区二区精品久久久| 色婷婷综合激情视频免费看| 亚洲另类国产欧美一区二区| 久久黄色一级视频| 伊在人亞洲香蕉精品區| 素人激情视频福利| 国产亚洲精品自在久久不卡 | 欧美日韩福利| 91精品免费高清在线| 九九热视频在线免费观看| 欧美色图久久| 99无码中文字幕视频| 国产色伊人| 国产女人爽到高潮的免费视频 | 国产福利免费观看| 日韩国产精品无码一区二区三区 | 欧美A级V片在线观看| 啪啪啪亚洲无码| 欧美专区在线观看| 色成人亚洲| 男人天堂亚洲天堂| 操国产美女| 91视频99| 三上悠亚精品二区在线观看| 久草中文网| 5555国产在线观看| 欧美亚洲欧美区| 中文无码日韩精品| 亚洲无码37.| 色视频国产| 亚洲精品麻豆| 欧美日韩国产系列在线观看| 天天躁夜夜躁狠狠躁图片| 亚洲精品视频免费观看| 日本高清在线看免费观看| 精品乱码久久久久久久| 日韩欧美中文亚洲高清在线|