劉 歡
中國石油天然氣股份有限公司華北油田分公司,河北任丘 062550
隨著機器學習算法的快速發展[1-7],現已開發出具有強大自學能力的人工神經網絡[8]、支持向量機[9]、相關向量機[10]等模型,其可在復雜的非線性數據中挖掘自變量與因變量的關系,被廣泛用于多輪內檢測數據對齊、腐蝕評價、焊縫缺陷識別等方面。但以上模型涉及較多的初始參數設定,如連接權值和閾值、懲罰因子、核函數寬度等,模型訓練和預測的時間較長。基于此,將內檢測的特征要素信息與外檢測的里程信息相結合,采用極限梯度提升(XGBoost)算法建立兩者之間的聯系,預測每個內檢測點所對應的外檢測里程,并針對對齊結果進行分析,研究環境對管道運行的影響,為管道完整性管理提供理論依據。
管道內外檢測對齊的目標為預測內檢測點在外檢測點的位置,并將外檢測點映射至內檢測中心線上,以糾正內外檢測在一維里程上的差異,目標函數應保證糾正位置與真實位置的偏差(F)最小,公式如下:

式中:minL為映射函數g的最小化;H為外檢測點的真實位置;Z為外檢測點在內檢測中心線上的對應位置;g為H和Z兩點位置的映射關系。
雖然內外檢測數據中均記錄了檢測點的位置信息,如里程、經度、緯度等,但仍存在部分信息缺失,且不同檢測手段的精確度有所差別,導致可用于數據對齊的映射關系較少。采用XGBoost算法建立兩者之間的聯系,再預測每個內檢測點對應的外檢測里程,其可分為數據收集、模型訓練、模型預測和數據對齊等步驟。
內外檢測數據來源于管道的定期檢測,通常根據閥門、三通、彎管、穿跨越、定標點等顯著特征進行分段檢測,并將檢測結果分別儲存在不同的管理文件中。在數據采集和存儲的過程中,因檢測器分辨率較低、人為操作不當、管道路由選擇錯誤等原因,會造成檢測數據的空白、缺失、重復和異常,故需對數據進行清洗。首先,對同一管段對應的多個重復數據進行刪除合并,最終一個檢測點只對應一個里程;其次,將字符串形式的異常數據轉化為浮點型,并對空白數據進行線性插值處理;最后,將檢測報告進行數據解析,以表格的形式顯示檢測數據,并初步將內、外檢測中心線上的數據進行分區間對齊,記錄每個特征里程的位置。
將內、外檢測中心兩個內檢測點和兩個外檢測點之間的映射,采用XGboost算法進行數據增強和預測。XGboost是T Chen在2016年提出的以決策樹為學習基礎的集成學習模型,該算法對損失函數進行了二階泰勒展開,并在目標函數中加入正則化項以獲得整體最優解,有效避免了預測數據過擬合和欠擬合,其目標函數J為:

式中:yi為模型真實值;為模型預測值;L為真實值與預測值之間的差異;Ω(fk)為正則項,表示樹的復雜程度;n為樣本個數;K為決策樹的個數。
提取兩個內檢測點之間的里程差、經緯度信息、三通個數、閥門位置、焊接支管位置、熱煨彎頭位置等要素信息作為模型輸入變量,提取兩個外檢測點之間的里程差作為模型輸出變量。將數據分為訓練樣本和測試樣本,訓練樣本代入XGBoost算法進行訓練,采用網格搜索和交叉驗證對其進行參數優化,形成最優預測模型。流程見圖1。

圖1 數據訓練及預測流程
數據預測的目的是使用訓練好的XGBoost算法實現內檢測點與外檢測里程的一一對應,建立地面標識點與里程樁之間的關系,當一個內檢測點對應多個外檢測里程時,取外檢測里程的算術平均。
完成以上映射關系后,內、外檢測數據在里程上仍存在一定的偏差,見圖2,A、B為外檢測對應的特征點,A′、B′為內檢測對應的特征點,C為外檢測中心線上任意一點,C′為外檢測點對應到內檢測中心線上的點,可見三對點并不垂直對應。一般內檢測的位置信息或經緯度坐標精度均高于外檢測,故以內檢測信息為基準,采用逐步平移將外檢測點對齊至內檢測中心線上(以圖2為例,即C點向左平移,最終和C′點垂直即可),公式如下:

圖2 數據對齊示意

式中:SC′為外檢測C點對應在內檢測線C′點的里程,m;SC為外檢測C點的里程,m;SA、SB為外檢測中心線對應的里程,m;SA′、SB′為內檢測中心線對應的里程,m。
某輸氣管道投產于2018年,管道全長145 km,外徑1 219 mm,壁厚18.4~25.4 mm,管材采用X80管線鋼,最小屈服強度550 MPa,管道設計壓力12 MPa,運行壓力6 MPa。2019年2月進行了漏磁內檢測,終點里程為149.3 km,2020年3月至5月進行了GPS-RTK的外檢測,終點里程為164.5 km,測量起點為首站縱向埋弧焊縫,終點為末站球閥后的一個環焊縫。兩次檢測采用不同手段從不同角度記錄了檢測點在管道中的位置,但外檢測里程明顯大于內檢測里程,采用XGboost和逐步平移算法進行數據預測和對齊,見表1、圖3。對齊后所有站場和閥室的里程誤差均在5 m以內,經緯度分布變化高度一致,對齊結果點滿足精度要求,說明本文方法的準確性和科學性。

表1 數據對齊后站場和閥室誤差對比

圖3 部分數據對齊結果
對數據對齊后的各類內外檢測數據進行統計,將管道缺陷分為5類(見圖4),其中外部金屬損失的比例較大,還存在少量的內部金屬損失、凹陷、環焊縫異常和補口帶下陰影,內部金屬損失較少,可能與管道位于平原地帶、地勢平緩、高差較小有關,且管道在投產初期進行了多次清管吹掃,管內存留的積液較少,在運行期間介質的水露點和烴露點控制的較好。綜上所述,只分析外部環境與外壁金屬損失的關系。

圖4 缺陷統計
根據數據對齊后的各項指標分布圖,見圖5~圖11,并參照GB∕T 19285—2014《埋地鋼制管道腐蝕防護工程檢驗》和SY∕T 5919—2009《埋地鋼制管道陰極保護技術管理規程》進行評價。其中,外部金屬損失深度大部分小于壁厚的20%,部分深度較大,但始終未超過壁厚的30%;缺陷軸向長度較小,且集中在100 mm以下,說明外部缺陷主要向徑向發展;防腐層破損點的等級多為3、4級,破損點集中在20 km以后;沿線陰極保護斷電電位大部分滿足規范要求,在-1 200~-850 mV之間,只有83 km處存在欠保護,但偏移程度不大,可能與恒電位儀未按正常周期校準有關,不存在過保護區域;直流干擾采用兩個指標評價,分別為埋地管道附近的土壤表面電位梯度和未施加陰極保護時管地電位較自然電位的偏移程度,電位梯度均小于0.5 mV∕m,管地電位正向偏移均小于20 mV,說明管道受高壓直流接地極、直流牽引運輸系統、直流電焊系統等方面的干擾較小;根據測試樁的交流電壓數據得到交流電壓變化情況,干擾電壓的平均值均小于4 V,最大值中只有141 km和148 km處的干擾電壓大于4 V,說明管道受交流干擾的程度較小;對比管道埋地處土壤的腐蝕性,共有29處弱腐蝕、135處中腐蝕和75處強腐蝕。

圖5 數據對齊后外部金屬損失深度沿里程分布

圖6 數據對齊后外部金屬損失軸向長度沿里程分布

圖7 數據對齊后外防腐層電阻率沿里程分布

圖8 數據對齊后陰極保護電位沿里程分布

圖9 數據對齊后直流干擾沿里程分布

圖10 數據對齊后交流干擾沿里程分布

圖11 數據對齊后土壤腐蝕性沿里程分布
由于管道受交流干擾和直流干擾的程度較小,故只需考慮外部金屬損失與陰極保護有效性、防腐層破損之間的關系。第一,當存在金屬損失、防腐層破損且陰極保護狀態較差時,此金屬損失點有發展為呈腐蝕活性點的風險。第二,當存在金屬損失,但防腐層未破損且陰極保護狀態較好時,此金屬損失點可能是在制管成管過程中造成的缺陷,從母材分析,缺陷為分層、夾渣或軋制過程中混入異物導致;從焊縫分析,缺陷為未焊透、氣孔、咬邊、熱處理不當等原因造成。第三,當防腐層破損且陰極保護狀態較好時,此金屬損失點可能為運輸或施工投產過程中造成的缺陷。當檢測結果顯示金屬損失點為腐蝕活性點時,需進行開挖驗證,還需關注腐蝕深度和長度是否增長。
該管道全線的土壤電阻率較低,土壤腐蝕性較強,但陰極保護狀態良好,說明即使防腐層存在破損,陰極保護也會抑制腐蝕電流,阻止金屬損失點形成小陽極、大陰極的腐蝕環境。綜合對比圖5~圖7,金屬損失點與防腐層破損點之間的關系存在三種情況,一是存在金屬損失且防腐層破損,二是不存在金屬損失但防腐層破損,三是存在金屬損失但防腐層未破損,每種情況取3個開挖點進行驗證,同時開挖點應盡量避開穿跨越或其他不具備開挖條件的地段,見表2。

表2 開挖驗證結果
開挖結果表明,情況一和情況二防腐層破損類型均為輕微機械損傷,損傷原因為磕碰、劃傷,損傷較淺的未傷及基材,損傷較深的基材表面出現壓坑和劃痕,劃痕0.15~0.4 mm,破損處無明顯的腐蝕坑和腐蝕產物,見圖12;情況三的基材表面光滑,同樣未見浮銹、腐蝕坑和腐蝕產物。綜上所述,說明該管道的運行狀態良好,無需采取換管或降壓運行等措施,只需進行常規定期檢測即可。

圖12 部分開挖點防腐層破損情況
(1)利用機器學習算法實現了內外檢測數據的增強映射,采用逐步平移法實現了外檢測點在內檢測中心線上的對齊,對齊后所有站場和閥室的里程誤差均在5 m以內,經緯度分布變化高度一致,說明了本文的算法是科學的和可靠的。
(2)對某管道對齊后的檢測結果進行分析表明,管道受交流干擾和直流干擾的程度較小,陰極保護狀態良好;通過開挖進行驗證表明,存在金屬損失且防腐層破損的開挖點未見腐蝕坑和腐蝕產物,說明管道運行狀態良好。