




摘" 要:隨著川慶公司數字化轉型的推進,諸如川慶公司一體化平臺的業務數據集成系統大量涌現,并形成大量鉆井作業類數據的沉淀,這為大數據技術在油氣井鉆探業務中的應用提供可行性。目前油氣井高壓管匯管理大數據利用率并不高,但由于缺乏對數據處理及分析手段的研究,這部分數據難以進行二次利用與深層次挖掘。在此背景下,以高壓管匯全生命周期管理大數據為例,探索數據可視化與數據挖掘技術的應用,為實現大數據技術在油氣井鉆探領域中的輔助支撐作用提供新思路。
關鍵詞:高壓管匯;全生命周期管理;數據可視化;數據挖掘;油氣鉆井
中圖分類號:TE328" " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2023)10-0185-05
Abstract: As digital transformation advances in CNPC Chuanqing Drilling Engineering Company Limited, a great quantity of business data integration systems like Chuanqing's Engineering Operation smart Support System have emerged. And in the meanwhile, the accumulation of drilling operation big data has formed, which enables the application of big data technologies in oil and gas drilling business. The utility of big data in the area of high-pressure manifold management is low currently, and it is difficult to conduct deep mining in the lack of researches of appropriate data processing and analyzing approaches. Under such circumstance, the article explores the application of data visualization and data mining in high-pressure manifold lifecycle management, which intends to start a further research on the supporting role of big data technologies in oil and gas drilling industry.
Keywords: high pressure manifold; life cycle management; data visualization; data mining; oil and gas drilling
隨著“數字化建設,智能化發展”理念的提出,中國石油天然氣集團開展了數據治理,并開始建立基于勘探、開發和生產等領域的數據湖,打造各領域數據高度共享的生態環境,推動業務數字化、智能化發展。隨著企業數字化轉型進程的推動,越來越多油氣田企業也在大力建設數字化應用平臺,如中油技服川慶鉆探工程有限公司工程作業智能支持系統[1]、中國石化勝利油田分公司油氣勘探開發綜合研究數字平臺[2]等。
數字化應用平臺的建成為數據可視化、數據挖掘等大數據技術在油氣勘探開發領域的應用提供可行性。已有部分學者對大數據在油氣勘探開發行業的應用進行了嘗試,如三維斷層自動檢測[3]、三維層位自動提取[4]、油氣井產量預測[5-6]和油田剩余油預測[7]等。這些成果的成功應用說明油氣勘探開發大數據有極大的可塑性,也說明大數據技術在生產實際中能有效地為企業決策者提供生產優化、投資分析等方面的幫助。
在油氣井鉆探工程中,井下作業是油氣勘探開發的重要環節,包含壓裂酸化、連續油管修井和固井工程等技術服務。由高壓彎頭、高壓直管、旋塞閥、單流閥及三通等組成的高壓管匯是井下作業的重要部件。由于作業環境復雜,井下的高溫、高壓和腐蝕性介質等因素對高壓管匯健康狀況和壽命都有較大影響。在長期的使用過程中,高壓管匯受到高速運動的固相粒子沖蝕、酸性介質的腐蝕和內部流體的強大沖擊,極易引發管匯件的刺漏、滲漏,甚至導致爆裂、刺穿等情況的發生。因此,為了保障井下壓裂作業的安全和正常生產秩序,應在使用過程中及時對高壓管匯健康狀況進行檢測,對管匯件壽命進行分析,并形成檢測預警。
目前已有多種手段可實現對高壓管匯損傷失效的分析[8],提出了高壓管匯沖蝕磨損的多相流仿真方法[9],進行了高壓管匯受力有限元分析,并采用計算流體動力學方法對彎頭部位沖蝕進行預測[10],基于DPM(Deformable Part Model)和DDPM(Denoising Diffusion Probabilistic Model)模型對高壓管匯沖蝕速率進行了數值模擬。
為了進一步提高高壓管匯管理大數據的利用率,下面以修保管理、報廢管理、壽命分析、壁厚值預測為例,探索數據可視化和數據挖掘技術在高壓管匯全生命周期管理中的應用。
1" 數據可視化在高壓管匯管理中的應用
1.1" 數據預處理
高壓管匯全生命周期管理包括運行管理、檢測管理、維修管理、保養管理和報廢管理等,其中運行管理記錄了施工用途、平均壓力、最大壓力、總酸量及總砂量等運行實況數據,檢測管理記錄了管匯件壁厚檢測結果、磁粉檢測結果等數據,維修保養記錄了管匯件修保時間、運行時間、修保類型和修保原因等數據,報廢管理記錄了報廢管匯件投產天數、運行時間和報廢原因等數據,這4類數據隱藏了大量管匯件質量、壽命和性能變化等信息。
由于在作業現場采集或填報的原始數據質量普遍較低,這些數據總是存在缺失值、無效值和非法值等,通常將這樣的數據稱為“臟數據”。為了確保數據質量,為后續數據可視化、數據挖掘的應用奠定基礎,在進行數據分析之前需要對“臟數據”進行數據清洗。數據清洗方法包含缺失值填充、無效值處理、非法值處理、異常值修正、數據歸一化和數據標準化等,其中數據歸一化和數據標準化的目的是消除數據量綱或變量單位對數據分析的影響。
1.2" 高壓管匯修保管理數據可視化
在進行深層次數據挖掘之前,利用多維度的數據可視化技術探究高壓管匯數據分布和基本統計特征,從而更好地了解數據全貌。首先利用python中seaborn庫的繪圖工具對高壓管匯修保管理數據進行可視化分析。對某一管匯使用單位收集維修保養數據4 835條,數據包含缺失值1項,異常值287項,其中缺失值采用眾數填充,異常值采用均值替換。
在維修保養過程中存在判廢的高壓管匯,這部分設備包含了不同類型的高壓管匯,從其數量占比可分析出使用頻率高且更容易判廢的管匯類型。針對最容易判廢的高壓管匯,應當加強對其壽命及健康狀況的分析。
修保結果為報廢的設備數量占比情況如圖1所示,其中旋塞閥、高壓彎頭的數量占比最大,分別為54.84%、42.58%。修保數量占比最大的2種管匯為旋塞閥和高壓彎頭,其運行時間分布的密度如圖2所示。從圖中可知兩者運行時間的分布存在顯著差異,其中旋塞閥運行時間集中在1 000 h以下,而高壓彎頭的運行時間分布不如旋塞閥集中且大多數分布在1 000 h以上。經過計算,75%的旋塞閥運行時長為508.74~697 h,而75%的高壓彎頭運行時長為832.68~1 501.45 h,兩者的時間分布存在明顯差異。因此在高壓管匯的修保管理中,針對不同管匯類型,應在不同運行時長分布區間內嚴格審核修保參數、修保結果,避免將即將報廢的高壓管匯投入使用。
按照高壓管匯修保的復雜程度,修保類型分為小修、中修、大修。不同修保類型的高壓管匯數量占比如圖3所示,按照占比從大到小排序依次是小修(65.95%)、中修(19.16%)、大修(14.89%)。從排序可見該使用單位對高壓管匯的維修保養工作是及時的,若占比存在其他的順序,則說明維修保養管理中存在修保不及時或嚴重滯后的情況。
所有修保高壓管匯中,旋塞閥數量占比最大,因此對修保的旋塞閥運行時間做進一步可視化分析。
基于修保旋塞閥頻數畫出的不同修保類型旋塞閥運行時間分布如圖4所示,其運行時間的密度曲線如圖5所示。由圖4、圖5可知小修、中修的旋塞閥運行時間集中在約750 h以下,而運行時間大于750 h的大修旋塞閥比例還較高。當運行時長小于約350 h時,小修旋塞閥比例大于中修、大修;反之,小修旋塞閥比例小于中修、大修。可見,旋塞閥運行時長對其修保類型有顯著影響。
1.3" 高壓管匯報廢管理數據可視化
對某一管匯使用單位收集報廢管理數據共3 842條,數據包含異常值290項,異常值采用均值替換。
不同類型的高壓管匯報廢原因差異較大,報廢原因多,包含探傷報廢、密封失效、腐蝕嚴重、試壓報廢、外觀損壞嚴重和檢測報廢等。下面對不同高壓管匯的報廢原因做可視化分析。
不同報廢原因的高壓管匯數量占比情況如圖6所示,其中探傷報廢的高壓管匯數量占比最高為62.3%,可見探傷檢測技術在高壓管匯報廢判斷中具有重要的角色。在管理過程中應當加強對使用頻率較高、歷史報廢率較高的高壓管匯進行及時的探傷檢測,從而確保及時發現不適合繼續使用的管匯。
報廢的高壓管匯中數量占比最大的3類為高壓彎頭、旋塞閥、高壓直管,因此下面對這3類管匯的運行時間做進一步的可視化分析。
不同報廢設備的運行時間分布如圖7所示,其運行時間的密度曲線如圖8所示。根據密度曲線可知報廢旋塞閥和報廢高壓彎頭運行時間的分布范圍及各時長大致類似,其峰值大約集中在500 h,而報廢高壓直管運行時間的分布位置相對偏右,其峰值大約集中在670 h,因此在同等作業條件下,高壓直管的使用壽命相對而言更長。3類報廢管匯的運行時間密度曲線均出現較明顯的尖峰,因此應增加對運行時間分別在500 h和670 h左右的旋塞閥、高壓管匯和高壓直管的探傷等檢測頻率。
借助于python軟件中數據可視化技術將高壓管匯修保管理、報廢管理等數據以圖像的形式展現出來,突破了傳統的數據列表形式,呈現數據的具體分布。其中,高壓管匯的運行時間密度曲線從概率統計的角度出發挖掘出數據背后的規律。通過數據分布的可視化發現高壓管匯管理過程中的問題,并為維修保養、報廢管理等過程的優化提供有效數據的支撐和輔助。
2" 探索數據挖掘技術在高壓管匯管理中的應用
2.1" 高壓管匯壽命分析
影響高壓管匯壽命的因素眾多,如管匯件產品質量、施工工藝、施工壓力、維修保養歷史和壁厚值等,為了分析出這些因素如何影響高壓管匯壽命,可采用合適的數據挖掘方法對高壓管匯運行數據、維修保養數據等進行深層次挖掘。
基于施工工藝、生產廠家和維修保養歷史等離散型變量的高壓管匯壽命預測,可用回歸決策樹算法(如CART、GBDT等)進行分析,以報廢高壓管匯運行數據為訓練集,通過設定合適的決策樹個數、決策樹深度和收斂容差等參數,提高高壓管匯壽命預測的精確度。為了避免高壓管匯自身健康狀況與實際生產要求不匹配而產生的安全隱患,一般對回歸模型精度要求較高,訓練集與測試集的R2均不小于0.9甚至0.95。
通過最終訓練結果中的變量重要性這一指標,可分析對高壓管匯壽命影響最大的因素。同時篩選出影響程度最高的若干因素,再利用關聯分析算法挖掘出每種因素與管匯件壽命的關聯規則。
2.2" 高壓管匯壁厚值預測及檢測預警
由于管匯件內部受到的壓力沖擊及酸性介質腐蝕,隨著累計運行時間的增加,其壁厚值將減少。使用壁厚不達標的高壓管匯將造成嚴重的安全隱患。因此高壓管匯壁厚值檢測是判斷其健康狀況的重要手段之一,也是保障生產作業安全的必要措施。管匯件歷史壁厚值檢測數據構成了一組存在時序先后關系的數列,同一設備的壁厚值與前若干次壁厚值必然存在自相關關系,因此可考慮采用時間序列算法挖掘出這一函數關系。
一般選取自回歸滑動平均模型(Autoregressive moving average model, ARMA)或差分整合移動平均自回歸模型(Autoregressive Integrated Moving Average model,ARIMA)對同一高壓管匯歷史壁厚值數據進行訓練,并根據ACF、PACF等參數,或最小化信息量準則(Akaike Information Criterion,AIC)、貝葉斯信息準則(Bayesian Information Criterion,BIC)等準則確定模型中時間序列和白噪聲序列階數。當訓練出模型中所有參數后,即可對管匯壁厚值進行實時預測。壁厚值的預測在高壓管匯的檢測預警管理中有重要作用,若管匯件壁厚預測值低于使用標準,則應立即在系統中設置檢測預警,增加設備檢測頻率,縮短每次檢測間隔時間,確保及時發現管匯壁厚異常。
3" 結束語
目前大數據技術在油氣勘探開發領域的應用有大量應用成果,在層位檢測、提取及油氣產量和剩余量預測等方面都有成功應用的實例,且應用成果表明大數據技術在實際生產中能提供高質量且有效的輔助支撐作用,大數據技術在石油天然氣工業中的應用具有巨大潛力。而大數據及人工智能技術的應用實例還較少,因此有必要在這一領域開展更多大數據應用的探索與研究。
隨著川慶公司高壓管匯運行、修保和檢測等大數據的積累,利用成熟的大數據技術輔助設備全生命周期管理成為可能。在此背景下嘗試了以數據可視化技術為工具分析不同類型維保高壓管匯的運行時長分布差異、不同修保類型高壓管匯的運行時長分布差異以及不同類型報廢高壓管匯的運行時長分布差異。同時,還探索了分類決策樹、時間序列2類機器學習算法在高壓管匯壽命預測、高壓管匯壁厚預測及檢測預警中的應用,為數據挖掘技術在設備全生命周期管理中的應用提供思路。
參考文獻:
[1] 陳竹.借力大數據建頁巖氣無人值守站節約投1 300萬[EB/OL].https://e.chinacqsb.com/html/201807/11/content_16644.html.
[2] 楊耀忠,譚紹泉,孫業恒,等.油氣勘探開發綜合研究數字平臺建設及應用[J].油氣藏評價與開發,2021,11(4):628-634.
[3] WU X, LIANG L, SHI Y, et al. FaultSeg3D: Using synthetic data sets to train an end-to-end convolutional neural network for 3D seismic fault segmentation[J].Geophysics,2019,84(3):IM35-IM45.
[4] GENG Z, WU X, SHI Y, et al. Deep learning for relative geologic time and seismic horizons[J].Geophysics, 2020,85(4):1-47.
[5] 谷建偉,周梅,李志濤,等.基于數據挖掘的長短期記憶網絡模型油井產量預測方法[J].特種油氣藏,2019,26(2):77-81.
[6] 祝元寵,咸玉席,李青宇,等.基于大數據的頁巖氣產能預測[J].油氣井測試,2019,28(1):1-6.
[7] 吳樹鵬,熊華平.油田開發數據挖掘技術的實現與應用[J].大慶石油地質與開發,2002,21(3):49-51.
[8] 周兆明,練章華,萬夫.高壓管匯沖蝕磨損的多相流仿真[J].計算機輔助工程,2013,22(5):101-104.
[9] 金雪梅,張祥來,廖浩,等.加砂壓裂過程中高壓管匯失效爆裂分析[J].安全,2017,38(1):17-18.
[10] 李建亭,曾云,李寧.高壓管匯沖蝕速率數值模擬新方法研究[J].石油機械,2021,49(7):138-146.