馮中申(遼河油田興隆臺采油廠,遼寧 盤錦 124010)
基于kNN分類算法的有桿泵抽油井井下工況故障診斷方法
馮中申(遼河油田興隆臺采油廠,遼寧 盤錦 124010)
油田生產中,采用人工分析示功圖判斷井下故障存在效率低的問題。對此,本文展開基于計算機診斷方法的研究。首先,采用8方向鏈碼提取示功圖的7個特征向量;然后,根據kNN分類算法進行故障的分類。由國內某作業區一口抽油井的實際示功圖驗證了本文所提出方法的有效性。
kNN分類算法;有桿泵抽油井;工況故障;診斷方法
有桿泵抽油井是國內外油田生產中的主要生產方式,由井上和井下兩部分組成,其中,井上部分主要包括:電控柜、抽油機、齒輪箱、皮帶輪、四連桿機構等,井下部分主要包括:抽油桿、抽油泵等。由于抽油井井下部分工作在數千米的地下,環境惡劣,極易發生各種故障。如果不能及時有效的發現井下工況的異常,會影響抽油井的正常生產,嚴重時會造成停井、關井的后果。
示功圖是油田生產中判斷井下工作狀況的主要方法,由安裝在井口懸點處的相關設備進行采集。示功圖是由若干位移-載荷數據所構成的二維閉合曲線,可以準確反映抽油井抽油的連續物理過程。目前,油田生產中主要依靠人工分析示功圖來判斷井下的工作狀況,首先由現場施工人員采集每口油井的示功圖,然后將數據報送到技術管理部門,由技術人員對示功圖進行人工分析,再根據結果調整生產措施。這種落后的管理方式,使得無法實時掌握抽油井的工作狀態,造成生產效率低和生產成本高。
采用計算機診斷方法實現有桿泵抽油井井下工況的故障診斷是目前的研究熱點[1],本文首先采用8方向鏈碼提取示功圖特征,然后根據K最近鄰(kNN,k-NearestNeighbor)分類算法進行故障的分類。
1.1 示功圖
示功圖是由若干離散數據點組成的二維曲線,橫坐標軸為位移,縱坐標軸為載荷,如圖1所示。
1.2 基于8方向鏈碼的特征提取
鏈碼,又稱為freeman碼,采用曲線起始點的坐標和邊界方向來表示曲線或區域邊界,采用邊界方向作為編碼依據,能夠較大程度提高編碼效率,已在圖像處理、模式識別等領域得到廣泛應用。本文所采用的8方向鏈碼如圖2所示,其中:數字0-7分別代表0°、45°、90°、135°、180°、225°、270°和315°。
采用8方向鏈碼對圖1所示的示功圖進行重新描述,如圖3所示。

圖1 示功圖曲線
1.3 示功圖特征提取
借鑒實際生產中對示功圖形狀分析的人工經驗,分別提取示功圖的特征如下:右上角向上凸出程度、扁平程度、左上角缺失程度、右下角缺失程度、右下角急劇卸載程度、右上角快速卸載程度和“肥胖”程度,提取方法參考文獻[2]。

圖2 8方向鏈碼

圖3 8方向鏈碼重畫
kNN分類算法[3]的基本原理是:如果一個樣本在特征空間中有k個最鄰近的樣本(已得到正確分類),而這些樣本大多數都屬于同一個類別,那么該樣本也屬于這個類別。實現kNN算法的主要步驟如下:
步驟1數據預處理;
步驟2選用合適的方法訓練數據和訓練元組;
步驟3設定參數k;
步驟4由大到小計算距離,構造最近鄰訓練元組,隨機選取k個元組作為初始最近鄰元組,分別計算測試樣本與k個元組的距離;
步驟5計算測試樣本與當前訓練元組的距離L,記錄所有訓練元組中的最大距離Lmax;
步驟6若L的值大于Lmax,放棄該元組,若L的值小于Lmax,將當前訓練元組存入隊列;
步驟7計算k個元組中占多數的樣本的類別,將其作為測試樣本的類別。
采集國內某作業區一口抽油井的36幅示功圖進行驗證,分別由序號樣本1-樣本36表示,其中:樣本1-6為“正常”類型(類別0表示),樣本7-11為“油井出砂”類型(類別1表示),樣本12-16為“泵下碰”類型(類別2表示),樣本17-21為“泵上碰”類型(類別3表示),樣本22-26為“抽油桿斷落”類型(類別4表示),樣本27-31為“固定閥漏失”類型(類別5表示),樣本32-36為“游動閥漏失”類型(類別6表示)。本文所采用方法的分類結果如圖4所示。

圖4 分類結果
根據圖4,樣本16被分類到“游動閥漏失”類型,樣本33被分類到“正常”類型,為誤診斷,診斷正確率為94.4%,基本達到生產要求。
針對油田生產中人工分析井下工況的不足,本文采用8方向鏈碼提取7個示功圖特征向量,然后根據kNN算法進行分類,能夠達到計算機診斷的準確率要求。
[1]王凱.基于產生式規則系統的抽油泵故障診斷[J].石油勘探與開發,2010,37(1):116-120.
[2]李琨.基于示功圖的游梁式抽油機井下故障診斷方法研究[D].東北大學,2013.
[3]牟曉偉,劉寒梅.基于KNN的Deep Web數據源分類研究[J].信息通信,2015(1):19-21.