李輝,劉凱,李威樺,孫偉峰,戴永壽
(1.中海油田服務股份有限公司油田技術(shù)研究院,河北廊坊 065201;2.中國石油大學(華東)控制科學與工程學院,山東青島 266580;3.中國石油大學(華東)海洋與空間信息學院,山東青島 266580)
井漏是鉆井過程中常見的風險,其發(fā)生會增加非生產(chǎn)時間,降低鉆井效率。若井漏得不到及時控制,可能會造成井噴等嚴重事故,威脅現(xiàn)場人員的生命安全[1-2]。因此,準確監(jiān)測井漏風險是實現(xiàn)安全鉆井的重要保障。
目前,鉆井現(xiàn)場的井漏監(jiān)測以基于綜合錄井技術(shù)的監(jiān)測方法[3]為主,現(xiàn)場人員通過分析泥漿池體積[4]、出口流量[5]等參數(shù)的變化特征[6-7]識別井漏。然而該方法存在特征提取不準確、井漏監(jiān)測準確率低等問題。李雪松[8]、涂思羽[9]等人開展了基于深度學習的井漏智能監(jiān)測方法研究,提高了風險識別的準確性。其中,長短期記憶網(wǎng)絡(luò)[10(]Long Short-Term Memory,LSTM)具有提取時序特征的優(yōu)點,實現(xiàn)了鉆井風險的準確監(jiān)測[11-14]。但LSTM 網(wǎng)絡(luò)需要較多訓練參數(shù),且模型收斂速度較慢。
為此,提出了一種基于門控循環(huán)單元(GRU)網(wǎng)絡(luò)的井漏監(jiān)測方法。GRU 網(wǎng)絡(luò)具有長期記憶功能,有助于提高井漏風險識別的準確率。利用LSTM 與GRU 網(wǎng)絡(luò)進行了井漏監(jiān)測實驗,結(jié)果表明,基于GRU 網(wǎng)絡(luò)的井漏監(jiān)測模型具有更優(yōu)的識別性能。
目前,用于井漏監(jiān)測的神經(jīng)網(wǎng)絡(luò)類型主要包括傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和長短期記憶網(wǎng)絡(luò)。
人工神經(jīng)網(wǎng)絡(luò)是一種可廣泛并行互聯(lián)的網(wǎng)絡(luò),由自適應性的簡單單元構(gòu)成,能夠模擬生物神經(jīng)系統(tǒng)對外部世界的感知[15]。人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
人工神經(jīng)網(wǎng)絡(luò)一般由輸入層、隱藏層和輸出層組成。輸入層的作用是接收數(shù)據(jù),輸入層與輸出層之間的隱藏層的作用是處理數(shù)據(jù),輸出層則作為網(wǎng)絡(luò)的輸出。
人工神經(jīng)網(wǎng)絡(luò)具有很強的學習能力,能夠通過網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)提取蘊含在數(shù)據(jù)集中的抽象特征,然后在特征之間用不同的網(wǎng)絡(luò)節(jié)點連接,通過訓練得到連接網(wǎng)絡(luò)的權(quán)重。
在普通的人工神經(jīng)網(wǎng)絡(luò)中,信息是單向傳遞的,很難處理時序數(shù)據(jù)。在處理時序數(shù)據(jù)時,網(wǎng)絡(luò)的輸出不應只考慮與當前時刻輸入的關(guān)系,也應當考慮與過去一段時間內(nèi)的輸入之間的關(guān)聯(lián)。時序數(shù)據(jù)的長度一般是不固定的,而普通人工神經(jīng)網(wǎng)絡(luò)的輸入與輸出的維數(shù)是固定的。因此,為了解決時序任務,需要利用一種更復雜的循環(huán)神經(jīng)網(wǎng)絡(luò)。
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有短期記憶功能的神經(jīng)網(wǎng)絡(luò),它在人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上增加了循環(huán)結(jié)構(gòu),將隱藏層的節(jié)點狀態(tài)傳遞給下一時刻。在該網(wǎng)絡(luò)中,神經(jīng)元不僅可以處理其他神經(jīng)元的信息,還可以處理自身的信息,形成循環(huán)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[14],如圖2 所示。

圖2 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
為了解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)處理時序數(shù)據(jù)時存在的長期依賴、梯度消失和梯度爆炸問題,研究人員提出了LSTM 網(wǎng)絡(luò)。LSTM 獨有的“門”結(jié)構(gòu)能夠?qū)v史數(shù)據(jù)進行選擇性的存儲或者遺忘,從而實現(xiàn)信息的長期記憶[16]。圖3 所示為LSTM 網(wǎng)絡(luò)結(jié)構(gòu)圖。

圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖
LSTM 網(wǎng)絡(luò)通過遺忘門、輸入門和輸出門來控制細胞狀態(tài),實現(xiàn)信息的添加或刪除。遺忘門fi主要對上一個節(jié)點輸入的信息進行選擇性遺忘,決定了從細胞狀態(tài)中遺忘的信息。輸入門it決定了當前時刻輸入的內(nèi)容,計算信息候選單元狀態(tài)? 并更新細胞狀態(tài)Ct,最終由輸出門ot根據(jù)細胞狀態(tài)Ct對信息進行選擇性輸出。
式中,ft為遺忘門的輸出,σ為Sigmoid 函數(shù),xt為當前時刻的輸入,ht-1為上一時刻隱藏層的輸出,Wf和bf分別代表遺忘門的權(quán)重矩陣和偏置矩陣。Wi和bi分別代表輸入門的權(quán)重矩陣和偏置矩陣。ot和ht分別代表輸出門的輸出和當前時刻的隱藏層輸出。
基于GRU 網(wǎng)絡(luò)的井漏風險監(jiān)測方法主要包括數(shù)據(jù)預處理和井漏智能監(jiān)測兩部分。首先對綜合錄井數(shù)據(jù)進行歸一化處理并剔除數(shù)據(jù)中的異常值,之后以泥漿池體積、出口流量和立管壓力為輸入構(gòu)建了GRU 網(wǎng)絡(luò),綜合三個參數(shù)的變化趨勢實現(xiàn)對井漏的智能監(jiān)測。
2.1.1 歸一化處理
由于出口流量、池體積和立管壓力的量綱及取值范圍不同,為提高模型的收斂速度,提高識別準確率,在模型訓練前需要對輸入?yún)?shù)進行歸一化處理。采用min-max 方法將出口流量、池體積和立管壓力數(shù)據(jù)映射到[0,1]之間,如式(7)所示:
式中,xmax和xmin分別代表一組數(shù)據(jù)中的最大值和最小值;x表示原始數(shù)據(jù);xnorm表示歸一化處理后的數(shù)據(jù)。
2.1.2 異常值剔除
異常值是指在綜合錄井數(shù)據(jù)中存在的偏離參數(shù)正常取值范圍的數(shù)據(jù)值。常用的異常值剔除方法包括3σ準則、箱形圖等??紤]到算法的計算效率,采用3σ準則進行異常值剔除。
3σ準則又稱萊特準則,利用其進行異常值剔除的基本思想:假設(shè)數(shù)據(jù)中的隨機誤差服從正態(tài)分布,則誤差的絕對值主要集中在其均值附近。
對于服從正態(tài)分布的數(shù)據(jù),首先計算該組數(shù)據(jù)的均值μ和標準差σ;然后計算每個測量值的誤差d,將誤差絕對值大于3σ的測量值替換為該組數(shù)據(jù)的平均值,從而達到去除異常值的目的。
與LSTM 網(wǎng)絡(luò)相比,GRU 網(wǎng)絡(luò)將遺忘門和輸入門合并為更新門,同時混合了神經(jīng)元狀態(tài)和隱藏狀態(tài),使得網(wǎng)絡(luò)的結(jié)構(gòu)更加簡單,訓練效率更高。圖4所示為GRU 網(wǎng)絡(luò)結(jié)構(gòu)圖。

圖4 GRU網(wǎng)絡(luò)結(jié)構(gòu)圖
圖4 中,ht-1為t-1時刻的輸出;zt為更新門,rt為重置門;為t時刻隱藏層的激活狀態(tài);ht為t時刻的輸出。信息在GRU 中前向傳播分為兩個階段:
1)重置階段。為了挖掘數(shù)據(jù)在短期內(nèi)的時間依賴關(guān)系,根據(jù)上一時刻的隱藏層狀態(tài)與當前時刻輸入之間的相關(guān)性,計算重置門的門控信號:
式中,rt為重置門的輸出,σ為Sigmoid 函數(shù),xt為當前時刻的輸入,ht-1為上一時刻隱含層的輸出,Ur、Vr和br分別代表重置門的輸入權(quán)重矩陣、隱藏層節(jié)點的權(quán)重矩陣以及偏置矩陣。
重置門的門控信號決定了上一時刻隱藏層節(jié)點狀態(tài)能夠保留下來的信息,然后與當前的輸入相結(jié)合,并通過tanh 激活函數(shù)轉(zhuǎn)變?yōu)樾碌碾[藏層節(jié)點狀態(tài)(取值范圍為-1~1)。
式中,為當前時刻輸入的隱藏層節(jié)點狀態(tài),tanh 為雙曲正切函數(shù),Uc為當前時刻的輸入權(quán)重,Vc為上一時刻隱含層節(jié)點權(quán)重,bh代表重置門的偏置矩陣。
2)更新階段。該階段進行信息的篩選與傳遞,解決RNN 的長期記憶問題。根據(jù)上一時刻的隱藏層狀態(tài)及當前時刻輸入之間的相關(guān)性,計算更新門的門控信號,其表達式為:
更新門zt主要對上一個節(jié)點輸出的信息進行選擇性遺忘,決定了從上一時刻隱藏層狀態(tài)中遺忘的信息和需要更新的信息。最終,將該時刻有用的信息傳遞到輸出層或傳遞到下一時刻。
基于GRU 的井漏監(jiān)測模型包括輸入層、GRU層、Softmax 層、與輸出層,模型結(jié)構(gòu)如圖5 所示。

圖5 基于GRU的井漏監(jiān)測模型結(jié)構(gòu)
1)輸入層:將池體積、出口流量和立管壓力三個數(shù)據(jù)序列進行預處理后,作為模型的輸入。
2)GRU 層:由兩層GRU 結(jié)構(gòu)組成,能夠充分地學習時間序列的長期依賴關(guān)系,并從數(shù)據(jù)中自動獲取全面、準確的特征。
3)Softmax 層:Softmax 是一種激活函數(shù),可將一個數(shù)值向量歸一化為一個概率分布向量,且各個概率之和為1。
4)輸出層:以GRU 層的輸出作為輸入,采用Softmax 函數(shù)作為全連接層的激活函數(shù),利用全連接層對提取的特征進行分類,得到識別結(jié)果。
利用從東部某探區(qū)收集的10 口井的錄井數(shù)據(jù)構(gòu)建了井漏風險數(shù)據(jù)集,數(shù)據(jù)集中包括立管壓力、出口流量和池體積三個參數(shù)。數(shù)據(jù)集中包含800 組正常樣本和800 組風險樣本,每一組樣本都是長度為20 的時間序列。對數(shù)據(jù)集按照7:3 進行劃分,得到訓練集和驗證集。
網(wǎng)絡(luò)在訓練過程中需要給每一個樣本添加標簽,根據(jù)風險監(jiān)測對網(wǎng)絡(luò)的輸出需求,輸出結(jié)果采用獨熱編碼方式進行標注。獨熱編碼是人工智能分類模型訓練過程中常用的打標簽方式,n位的獨熱編碼可以標注n個狀態(tài),而且每個狀態(tài)相互獨立,每次只輸出一個狀態(tài)。井漏智能識別模型只有兩個輸出:井漏和無井漏,因此采用兩位獨熱編碼器,如表1 所示。

表1 獨熱編碼形式的樣本標簽
為了將兩個類型的輸出轉(zhuǎn)換為0-1 的概率形式,在輸出層中加入Softmax 函數(shù),讓兩種輸出類型的概率總和為1。
利用3.1 中的數(shù)據(jù)集對GRU 網(wǎng)絡(luò)進行訓練。該網(wǎng)絡(luò)的隱含層由兩層GRU 層構(gòu)成,為防止訓練過程中出現(xiàn)過擬合,在每層GRU 后加入0.15Dropout,防止出現(xiàn)過擬合。訓練過程中,時間步長為20,批尺寸為32,迭代次數(shù)為100 次。
由于井漏智能監(jiān)測屬于二分類問題,因此選擇分類交叉熵binary cross entropy 作為損失函數(shù),其計算公式如下:
式中,F(xiàn)Loss表示損失值,N表示樣本數(shù)量,yi表示第i個類別對應的真實標簽,y?i表示對應的模型輸出值。
為了驗證GRU 模型的井漏識別性能,分別采用GRU 模型與LSTM 模型進行井漏識別,并對識別結(jié)果進行了對比分析。兩種模型使用相同的訓練集和驗證集,模型構(gòu)建時采用相同的參數(shù)設(shè)置,保證模型構(gòu)建過程中僅網(wǎng)絡(luò)類別不同,以兩種模型對井漏風險的識別準確率為評價準則。
圖6所示為LSTM 模型在訓練集和驗證集上的識別性能。可見,LSTM模型在驗證集上的識別準確率為95.82%。LSTM 能夠?qū)v史信息進行學習,在學習遠距離信息時表現(xiàn)更好,因此具有較高的識別準確率。

圖6 LSTM模型在訓練集和驗證集上的性能對比
圖7 給出了GRU 模型在訓練集和驗證集上的識別結(jié)果。該模型在驗證集上的識別準確率達到了96.17%。與LSTM模型相比,GRU模型在驗證集上的識別準確率高于LSTM 模型,且GRU 模型在迭代20 次左右時損失值達到了0.1,而LSTM 需要迭代至40 次左右。由此證明,GRU 模型在訓練時的收斂速度更快。

圖7 GRU模型在訓練集和驗證集的性能對比
利用測試集對模型進行測試,測試結(jié)果如表2所示。

表2 測試集上的模型性能對比
基于上述實驗可知,GRU 模型在測試集上取得了良好的識別性能,比LSTM 模型具有更強的泛化能力和識別精度。
文中建立了基于GRU 網(wǎng)絡(luò)的井漏識別模型,利用GRU 網(wǎng)絡(luò)的時間特征提取能力和對信息的長期記憶能力,準確監(jiān)測到池體積、出口流量和立管壓力的異常變化趨勢,實現(xiàn)了對井漏的及時、準確識別,解決了傳統(tǒng)井漏識別方法存在的時間特征提取困難、識別準確率低的問題,具有良好的現(xiàn)場應用前景。