范振鐸

摘 要:在了解油水井生產狀況的基礎上,以集中式和數據流挖掘體系結構為依據,采用趨勢分析技術對油水井工況數據進行實時分析預測,實現分割點和異常點的檢驗。利用油田采集的數據模擬形成數據流,通過實驗驗證,基于數據流的油水井工況分析系統總體框架可通用,VSW-PAA算法和趨勢分析方法很實用,進行模式異常檢測,檢測效果良好,能發現設備異常情況,為設備管理者提供決策依據。
關鍵詞:數據流;數據流聚類;模式異常;油水井工況
1 引言
油水井監測系統在運行的過程中會產生大量的實時監測數據,如何高效準確的處理和利用這些數據完成油水井工況分析是油田的一大難題。示功圖可對油水井工況進行分析,從而診斷設備是否正常運行和分析故障產生的因素,為油水井正常生產提供技術保障。隨著通訊技術和檢測技術的發展,數據采集手段不斷豐富,數據流技術[1]已大范圍的推廣使用。在了解油水井工況分析技術的基礎上,利用相應算法和數據流技術,設計基于數據流技術的油水井工況分析系統,實現油水井設備的實時監測、異常診斷和故障診斷,同時,為管理者提供決策依據,為油水井管理提供了巨大的幫助。
2 油水工況分析系統的設計
數據挖掘[2]是從大量的數據中發現和搜尋有價值、可靠性和實用性的規律,這些規律是隱藏在數據中,充分的利用這些規律有利于生產分析。數據流現在沒有明確的定義,數據流的特性包括有序性、實時性、無限性、概要性和及時性,這些特性決定了數據處理的特點,數據流結構如圖1所示。數據流挖掘體系的對象是數據流,針對油水井工況分析的特殊情況,安裝相應組件實現數據挖掘。油水井監測系統在運行的過程中會產生大量的實時監測數據,如何高效準確的處理和利用這些數據完成油水井工況分析是油田的一大難題。現在的數據處理模式不適用于動態高速的數據處理,在分析現有技術弊端的基礎上,設計一種滿足油田需求的數據挖掘系統。針對動態變化流速的數據流,我們提出可變滑動窗口的數據流聚類算法[3],分為在線階段和離線階段,可進行不同階段的數據流處理。數據挖掘常用技術有人工神經網絡、決策樹、遺傳算法、近鄰算法和規則推導技術。數據挖掘是一種決策支持過程,關聯規則挖掘[4]必須先從資料集合中找出所有的高頻項目組,再由這些高頻項目組中產生關聯規則。數據流趨勢分析是建立在時間序列[5]的基礎上,研究現有數據流的規律,預測未來數據流的變化趨勢。數據流存在實時提取的困難,引入可變滑動窗口調整現行回歸模型,實現基于分割點的最小二乘多元回歸趨勢分析方法[6]。采用趨勢分析技術對油水井工況數據進行實時分析預測,實現分割點和異常點的檢驗。
3 油水工況分析系統的應用
采用數據趨勢分析手段檢測數據流是否異常,設計數據流挖掘總體框架。采用時間序列數據流,提出分段聚類算法進行去噪和壓縮處理,為數據趨勢分析打下良好基礎。在分析SW算法和OSD算法[7]優缺點的基礎上,有針對性的結合并改進相關算法,優選最小二乘多元回歸趨勢分析算法,準確提取數據流的相關趨勢特征和合理定位分割點,實現趨勢準確分析。在確定趨勢之后,進行預測結果分析和異常檢測。由于很難做到數據流的實時提取,在分析數據分割算法和滑動窗口算法優缺點的基礎上,提出利用可變滑動窗口調整線性回歸模型。數據流趨勢分析是根據數據流的特點進行選擇模型,例如,周期性的動態數據選擇線性回歸模型。故障趨勢分析技術主要是針對靜態數據進行分析,對于實時動態數據,已不適用,需要設計新的數據建模方法和數據處理技術。油水井工況分析系統主要有數據采集與傳輸、數據流監測與表示和趨勢分析預測三大模塊。在設計完該系統之后,進行系統調試和實驗驗證,效果良好。以油田采集到的數據為基礎,模擬形成載荷數據流,利用該系統進行數據流趨勢分析和異常檢測,監測效果良好,可提前發現油水井設備故障異常,為油田管理者提供決策依據,可在其他油田進行大范圍的推廣應用。
4 結論
為實現油水井工況的實時監測和故障診斷,結合數據流挖掘和集中式體系結構,搭建基于數據流技術的油水井工況分析框架。在分析數據流模式表示方法和趨勢分析方法優缺點的基礎上,優選能進行去噪和壓縮的模式表示方法和趨勢分析方法。采集相關工況數據模擬形成數據流,了解數據流的挖掘方法,利用數據流分段聚類算法表示數據流模式。結合SW算法和OSD算法,采用最小二乘數據流趨勢分析方法,實現異常點與分割點的檢測。通過實驗驗證,不斷進行算法修改,總體框架可通用,趨勢分析方法實用性好,異常檢測效果良好,達到工況分析和節能減耗的目的。在某油田的應用可知,油水井工況監測效果良好,可提前發現油水井設備故障異常,為油田管理者提供決策依據,可在其他油田進行大范圍的推廣應用。
參考文獻:
[1]周曉云,張凈,孫志揮.高Turnstile型數據流聚類算法[J].計算機科學,2006.
[2]張忠平,王浩,薛偉.動態滑動窗口的數據流聚類方法[J].計算機工程與應用,2011.
[3]朱蔚恒,印鑒,謝益煌.基于數據流的任意形狀聚類算法[J].軟件學報,2006.
[4]常建龍,曹鋒,周傲英.基于滑動窗口的進化數據流聚類[J].軟件學報,2007.
[5]宋寶燕.基于滑動窗口的支持泛在應用的流聚類挖掘算法[J].小型微型計算機系統,2008.
[6]李國徽,向軍,陳剛.基于概率模型的數據流預測查詢算法[J].計算機科學,2008.
[7]汪成亮,陸志堅.一種數據流趨勢分析方法的研究與應用[J].計算機系統應用,2010.