魏晨亮 王丹丹 陳秋華 陳思佳 廖柯熹 袁東野 張金龍
1中海石油技術檢測有限公司
2西南石油大學石油與天然氣工程學院
隨著中海油海底管道完整性管理進程的推進,管道智能內檢測作為海底管道完整性管理的一種有效手段,正在被大力推廣和應用。海底管道內檢測風險高、成本高,且還有一部分管道不適合進行內檢測,需要采取其他有效的手段對管道的完整性進行分析。
目前,國內外學者就數據挖掘方法在管道中的應用進行了大量的研究實踐。李炳文和楊晶[1]提出使用ABC-SVM 算法對海底管道腐蝕速率進行預測。陳毓飛等[2]基于大數據,使用LSTM 建立了燃氣管道施工破壞可能性的預測模型。韓志全等[3]基于加速的Wiener 退化模型原理,構建了管道裂縫評價模型。汪瑛[4]采用關聯規則Apriori 算法對燃氣系統管道維修方面的數據進行了挖掘分析,為企業決策提供依據。王宏安和陳國明[5]提出了一種基于K均值聚類的管道漏磁缺陷信號標記方法來識別漏磁數據中的缺陷區域。PRIYANKA 等[6]提出了一種基于K均值聚類和時間序列預測的故障識別與預測方法,用于評估和預測現有石油管道的狀況。SANTOSH 等[7]提出了一種基于粗糙集理論和支持向量機的泄漏檢測方案以檢測管道泄漏情況。
因此,為了體現出海底管道內檢測數據的價值,本文基于支持向量機(SVM)算法建立了腐蝕缺陷的類型識別模型。利用Apriori 算法挖掘了海底管道腐蝕點的腐蝕缺陷類型、環向位置時鐘方向、軸向位置區域等級等數據之間的強關聯規則。將挖掘結果進行了可視化處理,給出了海底管道沿線腐蝕的分布規律和尺寸特征。
Apriori 算法用于挖掘蘊含在大數據中的有關聯性的因素之間的隱藏關系。關聯規則反應了一個因素與其他因素之間的相互依賴關系[8]。如果多因素之間存在一定的強關聯關系,那么一個因素就可以通過其他幾個因素來進行預測分析。Apriori 算法的運算邏輯如下:
定義基本數據集合D={t1,t2,t3,…,tk,…,tq},其中tk稱為事務,角標k=1,2,3,…,q。定義事務集合tk={i1,i2,i3,…,in,…,ip},其中in稱為項,角標n=1,2,3,…,p。事務是由若干個項組成的。D的任意子集I={i1,i2,i3,…,im}稱為D的項集。出現次數較多的項集則稱為頻繁項集。若X、Y均為項集,且滿足X?I、Y?I、X∩Y=?,則蘊含式X?Y表示一個關聯規則。X為關聯前提,Y為關聯規則的結果。
某數據項在事務中出現的頻度稱為支持度。支持度函數S(x)定義為D中包含了“數據項x”的“事務數”與“總事務數”的比值函數,如公式(1)所示,其中c(x)為計數函數。

關聯規則X?Y的支持度等于項集X∪Y的支持度,如公式(2)所示。

若S(X)大于等于指定的最小支持度,則X為頻繁項集,反之則為非頻繁項集。關聯規則X?Y的可能性定義為D中包含X的事務中有多大可能性同時包含Y,記作Fconf(X?Y),如公式(3)所示。

指定的最小可能性閾值記為MinCon。若數據集X滿足S(X)≥MinCon,則X為頻繁數據項集;若與此同時,關聯規則X?Y滿足Fconf(X?Y)≥MinCon,則規則X?Y是強關聯規則,反之則為弱關聯規則。

收集的海底管道腐蝕缺陷內檢測數據可劃分為管道基本屬性數據、腐蝕缺陷尺寸數據和腐蝕缺陷分布數據。其中腐蝕缺陷尺寸數據中的字段主要包括腐蝕缺陷類型、長度、寬度、深度,腐蝕缺陷分布數據字段主要包括腐蝕缺陷環向時鐘方位和軸向位置區域等級。
腐蝕缺陷類型共7 種,包括軸向溝槽、軸向凹槽、環向溝槽、環向凹槽、常規腐蝕、點蝕和針孔腐蝕。腐蝕缺陷環向時鐘方位共12 種,從1 點鐘方向到12 點鐘方向。腐蝕缺陷的軸向位置區域等級共3 種,包括靠近焊縫處(W)、焊縫(C)、管身(J)。軸向位置區域等級劃分示意圖如圖1 所示,圖中A用于界定焊縫處的長度范圍。當管道壁厚≤10 mm 時,A取值10 mm。當管道壁厚>10 mm時,A取壁厚值。

圖1 腐蝕缺陷軸向位置區域等級劃分Fig.1 Classification of the axial position area of corrosion defect
以海底管道的缺陷尺寸規律為研究目標,使用支持向量機對腐蝕缺陷類型定義值、長度值、寬度值、深度值進行擬合,得出腐蝕缺陷尺寸特征的預測模型。以輸油管道的116 066 個腐蝕缺陷點的尺寸數據為例進行分析。將60%的數據用于訓練集,40%的數據用于測試集,分別用來構建模型和評估模型的預測能力。本文選擇的核函數為徑向基函數,得到的混輸管道、輸油管道、輸氣管道、輸水管道的SVM 預測模型的預測準確率大于78%(表1)。混輸、輸油、輸氣、輸水管道數據的訓練集中模型的預測準確率分別為92%、99%、85%、91%,而測試集中模型的預測準確率分別為90%、99%、78%、86%。由于輸氣管道的數據量相對于其他三類管道的數據量偏少,所以輸氣管道測試集中模型的預測準確率最低。

表1 SVM 預測模型用于四類管道時的準確率Tab.1 Accuracy of SVM prediction model when applied to the four types of pipelines
以海底管道的腐蝕缺陷分布規律為研究目標,對腐蝕缺陷類型、時鐘方位、區域等級進行關聯規則挖掘,以期得出某類腐蝕缺陷分布在不同軸向位置區域和不同環向時鐘方位的可能性大小。管道的腐蝕缺陷分布規律的含義如表2 所示,腐蝕缺陷分布規律包含了腐蝕缺陷分布規律本身及其可能性兩層含義。通過整理分布規律,可得到管道上腐蝕缺陷發生在不同軸向位置區域且落在某一時鐘方位內的概率(可能性)。第1 條分布規律“靠近焊縫,且處于10:00~11:00 范圍?環向溝槽”表達的意思是“靠近焊縫,且處于10:00~11:00 范圍”的腐蝕缺陷的缺陷類型是環向溝槽,其可能性為100%,即第1 條分布規律一定成立。第5 條分布規律“管身,且處于3:00~4:00 范圍?環向凹槽”表達的意思是“管身,且處于3:00~4:00 范圍”的腐蝕缺陷的缺陷類型是環向溝槽,其可能性為1%,即第5條分布規律基本可以肯定不成立。以此類推,可挖掘出全部的腐蝕缺陷分布規律,并給出相應的可能性。最終選擇可能性很大的分布規律為相應管道的腐蝕缺陷分布規律。
分布規律1 表明,靠近焊縫10:00~11:00 處若發生腐蝕,則腐蝕缺陷類型為環向溝槽的可能性為100%。分布規律4 表明,管身2:00~3:00 處若發生腐蝕,則腐蝕缺陷類型為環向溝槽的可能性為94%。分布規律6 表明,焊縫處4:00~5:00 處若發生腐蝕,則腐蝕缺陷類型為點蝕的可能性為100%。

表2 不同的腐蝕缺陷分布規律及其可能性Tab.2 Different corrosion defect distribution rules and their possibilities
以下針對輸油管道開展腐蝕缺陷分布規律的詳細分析。首先通過整理分布規律,得到輸油管道上腐蝕缺陷發生在不同軸向位置區域內的可能性,結果如表3 所示。輸油管道在三個軸向位置區域處主要發生的腐蝕均為點蝕和環向溝槽。在管身處、靠近焊縫處和焊縫處發生點蝕和環向溝槽的可能性分別為99%(88%加11%)、95%和100%。

表3 輸油管道不同軸向位置區域發生不同類型腐蝕缺陷的可能性Tab.3 Probability of different types of corrosion defects occurring in different axial locations of oil pipelines
按照輸油管道軸向位置區域的不同,分別整理出管身處、靠近焊縫處和焊縫處,不同類型腐蝕在時鐘方位上發生的分布規律及其可能性(表4、表5、表6),并做可視化處理給出雷達圖(圖2、圖3、圖4)。
分布概率雷達圖中每個區間長度為1 h。由表4和圖2 可知,管身處腐蝕主要分布在3:00~10:00 時鐘方位上,其中點蝕主要分布在3:00~7:00 時鐘方位,并且6:00~7:00 處腐蝕缺陷數量最多(可能性為23%)。管身處環向凹槽在3:00~4:00、7:00~10:00時鐘方位上均勻分布(可能性均為25%)。管身處環向溝槽主要分布在3:00~9:00 時鐘方位上,且6:00~7:00處腐蝕缺陷數量最多(可能性為17%)。
由表5 和圖3 可知,靠近焊縫處腐蝕缺陷主要集中在3:00~9:00 時鐘方位。其中點蝕主要分布在5:00~7:00 和8:00~9:00 時鐘方位處,且8:00~9:00 處腐蝕缺陷數量最多(可能性為33%)。靠近焊縫處的環向凹槽主要分布在7:00~8:00 時鐘方位處,可能性為80%。靠近焊縫處的環向溝槽在每個時鐘方位區間上都有發生,其中5:00~6:00 處腐蝕缺陷數量最多(可能性為16%)。

表4 管身處腐蝕缺陷的時鐘方位分布Tab.4 Clock orientation distribution of corrosion defects at the pipe body

圖2 管身處腐蝕缺陷在不同時鐘方位分布概率雷達圖Fig.2 Radar map of the probability distribution at different clock orientations of corrosion defects at the pipe body

圖3 靠近焊縫處的腐蝕缺陷在不同時鐘方位分布概率的雷達圖Fig.3 Radar map of the probability distribution at different clock orientations of corrosion defects near the weld

圖4 焊縫處的腐蝕缺陷在不同時鐘方位分布概率的雷達圖Fig.4 Radar map of the probability distribution at different clock orientations of corrosion defects at the weld

表5 靠近焊縫處的腐蝕缺陷的時鐘方位分布情況Tab.5 Clock orientation distribution of corrosion defects near the weld

表6 焊縫處的腐蝕缺陷的時鐘方位分布Tab.6 Clock orientation distribution of corrosion defects at the weld
由表6 和圖4 可知,輸油管道焊縫處只發生了點蝕和環向溝槽。其中點蝕僅發生在4:00~5:00 時鐘方位處,發生的可能性為100%。環向溝槽在1:00~2:00 和8:00~9:00 時鐘方位處發生的可能性均為50%。
基于海底管道內檢測大數據,使用支持向量機和關聯算法進行數據挖掘,得到了海底管道腐蝕缺陷的尺寸特征和分布規律。
(1)收集的海底管道腐蝕缺陷內檢測數據可劃分為管道基本屬性數據、腐蝕缺陷尺寸數據和腐蝕缺陷分布數據。其中腐蝕缺陷尺寸數據中的字段主要包括腐蝕缺陷類型、長度、寬度、深度,腐蝕缺陷分布數據字段主要包括腐蝕缺陷環向時鐘方位和軸向位置區域等級。
(2)得到的混輸管道、輸油管道、輸氣管道、輸水管道的SVM 預測模型的預測準確率大于78%。混輸、輸油、輸氣、輸水管道數據的訓練集中模型的預測準確率分別為92%、99%、85%、91%,而測試集中模型的預測準確率分別為90%、99%、78%、86%。準確率可隨數據量的增多而提高。
(3)得到了不同管道上某類腐蝕缺陷分布在不同軸向位置區域和不同環向時鐘方位的可能性大小。輸油管道在三個軸向位置區域處主要發生的腐蝕均為點蝕和環向溝槽。在管身處、靠近焊縫處和焊縫處發生點蝕和環向溝槽的可能性分別為99%、95%和100%。
本文的研究方法和結論可用于海底管道腐蝕缺陷尺寸特征和腐蝕缺陷分布規律的研究及預測,為監測海底管道腐蝕情況提供參考,體現了內檢測大數據的價值,對海底管道完整性管理具有重要意義。