馮寧,張乃祿
1.西安石油大學 電子工程學院(陜西 西安 710065)2.陜西省油氣井測控技術重點實驗室(陜西 西安 710065)
油井動液面監測系統為獲得實時數據,長期運行,會導致元器件故障,采集的動液面波形圖出現異常。因此,對油井動液面監測系統的故障診斷是必不可少的一項工作。王麗華等[1]采集電機故障信號作為卷積神經網絡的輸入,進行電機的故障診斷,杜小磊等[2]應用卷積神經網絡對軸承進行故障診斷,但油井動液面監測系統故障診斷報道較少。
針對油井動液面監測系統的故障特點,分析系統運行過程中的動液面波形圖,提出基于改進卷積神經網絡的故障診斷模型。采用全局平均池化技術代替全連接層對傳統卷積神經網絡進行改進,采集系統運行過程中不同故障下的動液面波形圖作為模型輸入進行仿真訓練,實現對油井動液面監測系統的故障診斷,保證系統安全可靠運行。
油井動液面監測系統由數據采集層、數據傳輸層及動液面監測中心構成。數據采集層包括井口監測裝置和控制柜,井口監測裝置由12V/24V電磁閥、微音器、壓力傳感器、儲氣罐組成,控制柜由氣泵、開關電源等組成;數據傳輸層采用GPRS/WIFI無線傳輸;動液面監測中心包括服務器、監控主機及遠程客戶端。系統構成如圖1所示。

圖1 油井動液面監測系統構成
油井動液面監測系統常見的故障有24V電磁閥故障、12V電磁閥故障、微音器故障、球閥故障、加藥閥故障、氣泵故障、氣管故障、井況異常、液面太淺以及傳輸故障。不同故障下的動液面波形圖差異明顯,見表1。

表1 不同故障下的動液面波形
油井動液面監測系統在不同故障下,測量的動液面波形特征差異明顯,因此選擇卷積神經網絡建立模型進行故障診斷。傳統的卷積神經網絡由輸入層、隱藏層、全連接層以及輸出層組成。但全連接層會使訓練參數增多,導致模型過擬合[3-4];太多的計算資源會使測試時間太長,不適用于快速診斷和實時在線監測;并且全連接層在測試過程大大減少了特征位置對分類帶來的影響,導致輸入的特征參數位置發生改變,診斷結果未發生改變。因此提出改進卷積神經網路,采用全局平均池化技術代替全連接層。改進卷積神經網絡模型如圖2所示。

圖2 改進卷積神經網絡模型
改進卷積神經網絡的輸入是系統正常運行以及不同故障下的動液面波形圖,故障類型包括24V電磁閥故障、球閥故障、12V電磁閥故障、氣泵故障、加藥閥故障、微音器故障、氣管損壞、液面太淺、井況異常、傳輸故障等。隱藏層經過2次卷積2次最大池化,提取動液面波形圖的波形特征。全局平均池化以隱藏層輸出的每個動液面波形特征圖為單位,累加特征圖上的特征值再進行平均,直接得到輸出節點。輸出層再采用Softmax進行邏輯回歸分類,輸出系統故障類型。
改進卷積神經網絡模型在故障診斷過程中無需手動提取特征,將動液面波形圖可直接作為模型輸入,且全局平均池化技術使得訓練參數大大減少,提高了模型訓練效率[5]。改進卷積神經網絡模型基本流程如圖3所示。

圖3 改進卷積神經網絡模型基本流程
對輸入模型的動液面波形圖進行預處理,再分割為訓練集、驗證集以及測試集。訓練集及驗證集進行模型訓練,得到改進卷積神經網絡模型,測試集輸入訓練好的模型,得到系統故障診斷的結果。
改進卷積神經網絡模型參數設置要保證較高的分類率以及模型訓練速率,影響模型訓練速率的是卷積層參數和激活函數。
2.2.1 卷積層參數
卷積層參數包括卷積層數、卷積核的數目及大小。在卷積過程中,為了避免位置信息發生偏移,卷積核大小設置為奇數,根據經驗,卷積核數目設置為16的倍數,將卷積層C1和C2的卷積核數目及大小作為變量,取值范圍如下所示:
{‘C1卷積核數目’:16,32,64,128;‘C2卷積核數目’:16,32,64,128;‘卷積核大小’:3×3,5×5,7×7}
將以上參數以遍歷的方式進行組合,分別對模型進行訓練,得到訓練結果,使用Socre=Accuary/(Loss×Time)對模型進行評估。其中Accuary為識別模型輸入的動液面波形圖的準確率;Loss為損失函數值,反應了模型輸出的預測值與真實值之間的差別程度;Time為模型訓練及識別時間[6]。模型訓練過程中損失函數值與訓練時間越小,準確率越大,Score值越大,模型越優,因此選擇Score最大的值作為卷積層參數。經過測試,卷積核數目分別為16、32,大小分別為3×3、5×5時Score值最大,模型最優。
2.2.2 激活函數選擇
模型訓練中,常用的激活函數有Sigmoid函數、tanh函數、ReLU函數。Sigmoid函數和tanh函數由于軟飽和性,易出現梯度消失和梯度爆炸問題[7]。ReLU函數有很好的擬合能力和稀疏性,能夠有效地緩解梯度消失和過擬合問題,因此激勵函數選擇為ReLU函數,ReLU函數圖像如圖4所示。

圖4 ReLU函數圖像
根據以上卷積層參數以及激活函數的選擇,改進卷積神經網絡模型參數設置見表2。

表2 改進卷積神經網絡模型參數值設置
油井動液面監測系統采用改進卷積神經網絡模型進行故障診斷,系統不同故障下的動液面波形圖差異明顯,以不同故障下的動液面波形圖作為改進卷積神經網路的輸入,輸出為系統的故障類型[8]。分別采集24V電磁閥故障、12V電磁閥故障、微音器故障、球閥故障、加藥閥故障、氣泵故障、氣管故障、井況異常、液面太淺、傳輸故障等10種故障以及系統正常運行下得到的動液面波形圖20組作為實驗用數據集輸入模型,見表3。隨機選取數據集的80%進行模型訓練,20%進行模型測試。

表3 實驗用數據集
不同故障下的動液面波形圖在輸入改進卷積神經網絡之前,要進行統一預處理,主要分為以下幾步:
1)圖片大小處理。應用MATLAB的imresize函數將模型輸入的動液面波形圖像素面積統一處理為256×256×3。
2)灰度化處理。圖片像素點的顏色變化是由紅(R)、綠(G)、藍(B)3個通道相互疊加決定的,圖片灰度化將每一個像素點都滿足R=G=B的關系,采用MATLAB的rgb2gray函數對動模型輸入的液面波形圖進行灰度化處理。
3)二值化處理。將圖片的每個像素點的灰度值設為0(黑色)或者225(白色),讓整個圖片只呈現黑白效果。采用MATLAB的imbinarize函數對模型輸入的動液面波形圖進行二值化處理。
因此,不同故障下的動液面波形圖預處理后大小均為256×256×1,作為改進卷積神經網絡的輸入。
油井動液面監測系統故障診斷的改進卷積神經網絡模型使用matlab的deep learning toolbox進行訓練,將采集的故障數據集輸入到模型中,設置訓練迭代周期為30次。訓練結果準確率變化曲線及loss函數變化曲線如圖5所示。

圖5 準確率變化曲線及loss函數變化曲線
準確率函數反應的是模型訓練過程中對動液面波形圖識別的準確率,loss函數是度量模型輸出的預測值與實際值之間的差距,差距越大,模型對油井動液面監測系統的故障分類性能越差。圖5中隨著訓練次數的增加,準確率曲線逐漸上升,損失函數曲線逐漸下降,迭代到第6個周期時,準確率為100%,損失函數為0,說明該模型有快速的學習能力。
為了進一步驗證改進卷積神經網絡的優越性,將采集的實驗用數據集輸入傳統卷積神經網絡模型進行訓練,將訓練結果與改進卷積神經網絡模型訓練結果進行對比見表4。
從表4可知,模型訓練過程中,改進卷積神經網絡訓練時間快于傳統卷積神經網絡訓練時間11.1075 s,傳統卷積神經網絡訓練集準確度為93.45%,改進卷積神經網絡訓練集準確度為100%,遠高于傳統卷積神經網絡,因此,改進卷積神經網絡模型更加優化。

表4 改進型與傳統型卷積神經網絡訓練結果對比
油井動液面監測系統運行時,改進卷積神經網絡故障診斷模型調用系統上傳至后臺的動液面波形圖作為模型輸入。
選取5組長慶油田現場動液面監測系統的故障診斷結果,見表5。夠可靠的實現對油井動液面監測系統的故障診斷。

表5 系統故障診斷結果
1)針對油井動液面監測系統的構成及故障特點,提出了基于改進卷積神經網絡的故障診斷模型。輸入不同故障下動液面波形圖進行模型訓練與仿真,與傳統卷積神經網絡進行對比,改進卷積神經網絡模型相對于傳統卷積神經網絡模型訓練集準確率提高6.55 %,訓練時間增快11.1075 s。
2)應用結果表明,該模型實現了對油井動液面監測系統的故障診斷,對系統安全可靠的運行具有典型的應用價值。