王宏安,陳國明
(1.中國石油大學(華東)海洋油氣裝備與安全技術(shù)研究中心,青島 266580;2.中石化勝利石油工程有限公司鉆井工藝研究院,東營 257017)
油氣輸送管道作為石油、天然氣和成品油最主要、安全有效的運輸方式,在服役過程中受到介質(zhì)腐蝕、地質(zhì)環(huán)境、人為破壞等因素影響產(chǎn)生各種各樣缺陷,嚴重時可能發(fā)生管道泄漏,造成經(jīng)濟損失和環(huán)境破壞。目前常用的管道檢測方法包括漏磁[1-2]、超聲[3]、渦流[4]等,漏磁檢測由于具有自動化程度高、不需要耦合劑、管道適應能力強等特點,成為油氣管道檢測最常用的方法之一,得到廣泛應用[5-6]。
漏磁內(nèi)檢測完成后,數(shù)據(jù)判讀流程主要包括數(shù)據(jù)預處理、管段劃分、缺陷區(qū)域標記、缺陷重構(gòu)和缺陷評估等部分[7]。工程管道漏磁檢測數(shù)據(jù)量巨大,需研究快速從漏磁數(shù)據(jù)中實現(xiàn)缺陷標記,尋找出感興趣的區(qū)域,為缺陷重構(gòu)與評估提供基礎(chǔ)數(shù)據(jù)。目前缺陷區(qū)域標記方法主要有閾值法、平均值幅值法、分段識別法、多尺度窗缺陷檢測法等[8-11]。
目前的方法都需要根據(jù)檢測器、待檢測管道和管道磁化情況設(shè)置不同的閾值,算法根據(jù)閾值對缺陷區(qū)域進行判定。閾值選擇往往需要較多工程經(jīng)驗,而且對于多種壁厚的工程管道,需要多次設(shè)置閾值,總起來說合理選擇閾值對缺陷區(qū)域標記效果影響較大。
針對漏磁數(shù)據(jù)缺陷區(qū)域標記的問題,提出了一種基于聚類法的油氣管道缺陷區(qū)域標記方法,由于該方法不需要閾值選擇,可以對不同檢測器和不同壁厚數(shù)據(jù)進行適應,具有較廣泛的適應性。
聚類是將數(shù)據(jù)集中的樣本劃分為若干個通常是不相交的子集,每個子集稱之為簇,通過這樣的劃分,每一個簇內(nèi)數(shù)據(jù)十分相似,不同簇內(nèi)的數(shù)據(jù)又非常不同,每個簇可能對應于一些潛在的概念[12]。
K均值聚類是一種基于距離的聚類算法,是最常用的聚類算法之一,具有簡單、快速的特點,被廣泛使用。對于給定樣本集X={x1,x2,…,xn},其中n為樣本個數(shù)。根據(jù)樣本的某種屬性特征將樣本集劃分為k個簇,然后隨機選擇k個數(shù)據(jù)點作為的初始聚類中心,計算樣本到初始聚類中心的距離將其分配給最近的類別,重新劃分k個聚類中心,不斷迭代分配整個過程,直到聚類中心基本不變。K均值聚類方法的目標是簇間樣本距離最大化,簇內(nèi)樣本距離最小化,最終以簇內(nèi)方差作為聚類準則函數(shù),方差越小,聚類效果越好[13]。
油氣管道漏磁內(nèi)檢測的數(shù)據(jù)通常不能直接進行缺陷區(qū)域標記,一般需要進行數(shù)據(jù)預處理、管段劃分后才進行缺陷區(qū)域的標記。
本文方法主要針對管段劃分完成后,將數(shù)據(jù)分塊,分別提取數(shù)據(jù)塊的特征,根據(jù)這些特征采用K均值聚類的方法,將數(shù)據(jù)塊分類為正常數(shù)據(jù)塊和缺陷數(shù)據(jù)塊兩個類別,對缺陷數(shù)據(jù)塊進行標記,實現(xiàn)管段內(nèi)缺陷區(qū)域標記。
基于K均值聚類的缺陷區(qū)域標記方法主要步驟如下。
步驟1 讀取原始管段數(shù)據(jù),如圖1(a)所示。
步驟2 按照一定長寬將原始數(shù)據(jù)分塊。
漏磁檢測的原理決定了對于小缺陷檢測能力有限,以長、寬、深為5 mm×5 mm×1 mm缺陷為檢測最小缺陷。根據(jù)漏磁檢測原理,5 mm×5 mm×1 mm缺陷產(chǎn)生的漏磁信號在長度和寬度信號影響范圍大于10 mm。因此,將數(shù)據(jù)塊大小設(shè)置為10 mm×10 mm,分塊后的結(jié)果如圖1(b)所示。
步驟3 計算數(shù)據(jù)塊特征,并采用K均值聚類將數(shù)據(jù)分成2個類別。
對于缺陷區(qū)域在邊界處漏磁信號會出現(xiàn)較大的變化,最終反映在數(shù)據(jù)梯度上發(fā)生波動,因此分別提取每個數(shù)據(jù)塊的軸向(檢測器前進方向)梯度最大值、周向(傳感器分布方向)梯度的最大值、軸向梯度最大值與最小值的差值、周向梯度的最大值與最小值的差值4個值作為特征,并將結(jié)果賦值到數(shù)據(jù)塊矩陣中。
對所有數(shù)據(jù)塊設(shè)置兩個聚類中心,分別計算不同數(shù)據(jù)塊特征的歐式距離,迭代計算直到聚類中心不再發(fā)生變化,將所有數(shù)據(jù)塊分成了兩個類別,輸出數(shù)據(jù)塊的分類結(jié)果,如圖1(c)所示。
步驟4 根據(jù)所占比例判斷數(shù)據(jù)塊的是否是缺陷數(shù)據(jù)。
對于一個存在缺陷的管段,缺陷漏磁數(shù)據(jù)在整體數(shù)據(jù)中所占比例是較小的,通過對大量已有檢測器檢測數(shù)據(jù)分析發(fā)現(xiàn),整體比例都低于10%。因此在這里假定屬于缺陷類別的數(shù)據(jù)塊不超過總數(shù)據(jù)塊的10%。于是,根據(jù)步驟3得到分類結(jié)果,判斷數(shù)據(jù)塊數(shù)量較少的類別是否超過了總數(shù)據(jù)塊的10%,如果超過了則判斷兩個類別均為無缺陷區(qū)域,如果未超過,則判斷數(shù)據(jù)塊數(shù)量小的類別為缺陷類別,并在數(shù)據(jù)塊矩陣中進行標記。
步驟5 對矩陣中缺陷區(qū)域擴展和合并,如圖1(d)所示。
步驟6 提取缺陷區(qū)域的邊界值,形成矩形框,如圖1(e)所示,記錄矩形框位置信息,為后續(xù)缺陷重構(gòu)提供基礎(chǔ)數(shù)據(jù)。最終的缺陷框在原始的數(shù)據(jù)中的標記結(jié)果如圖1(f)所示。

圖1 算法示例
在試驗管段設(shè)置人工缺陷,采用管道內(nèi)漏磁檢測器牽拉試驗和水驅(qū)試驗得到實驗數(shù)據(jù),牽拉試驗如圖2所示。

圖2 牽拉試驗
試驗管段包括Φ273 mm×12.7 mm、Φ273 mm×7.1 mm、Φ457 mm×14.3 mm、Φ457 mm×7.1 mm,共4種規(guī)格。所有數(shù)據(jù)已完成數(shù)據(jù)的預處理、管段劃分,采用的數(shù)據(jù)為軸向分量數(shù)據(jù)。
2.2.1Φ273 mm牽拉管道實驗結(jié)果
利用管道漏磁檢測器在Φ273 mm管道上進行試驗,提取數(shù)據(jù)并進行預處理和管段劃分。在12.7、7.1 mm壁厚的管道識別結(jié)果如圖3所示??梢钥闯鲈摲椒ㄔ趦煞N不同壁厚的管道所有缺陷均完全識別出。

圖3 Φ273 mm牽拉管道缺陷識別結(jié)果
2.2.2Φ457 mm牽拉管道實驗結(jié)果
為了進一步驗證該方法在不同口徑檢測器的效果,在Φ457 mm管道上進行試驗。14.3、7.1 mm壁厚的管道識別結(jié)果如圖4所示。從圖4可以看出,所有缺陷均完全識別出。

圖4 Φ457 mm牽拉管道缺陷識別結(jié)果
2.2.3Φ273 mm水驅(qū)管道實驗結(jié)果
通常在牽拉管道中管道運行較為平穩(wěn),數(shù)據(jù)質(zhì)量較高。為更真實的模擬實際的檢測工況,選取Φ273 mm水驅(qū)管道,壁厚12.7 mm,并設(shè)置了208個人工缺陷進行測試,正確識別缺陷合計205個,檢出率98.6%,如圖5所示。

圖5 Φ273 mm水驅(qū)管道缺陷識別結(jié)果
在牽拉管道和水驅(qū)管道的實驗結(jié)果發(fā)現(xiàn),該方法在Φ273 mm和Φ457 mm的牽拉管道缺陷檢出率達到了100%,在Φ273 mm水驅(qū)管道檢出率為98.6%,達到了工程檢測要求。
水驅(qū)管道人工缺陷識別率低于牽拉管道主要原因是:牽拉管道試驗過程中檢測器運行速度穩(wěn)定,波動小,管道壁厚較為均勻,檢測過程中引起的噪聲和干擾較少,數(shù)據(jù)質(zhì)量較高。但在水驅(qū)管道檢測過程中受介質(zhì)、管道彎頭等因素影響,運行速度不穩(wěn)定,同時由于采用水作為驅(qū)動介質(zhì),在管道內(nèi)壁會出現(xiàn)不同程度的輕微腐蝕,整體的數(shù)據(jù)質(zhì)量相對于牽拉數(shù)據(jù)較低。在進行聚類的過程中,易產(chǎn)生干擾,出現(xiàn)識別錯誤。
整體來說,本文方法在牽拉管道和水驅(qū)管道識別結(jié)果均符合管道內(nèi)檢測檢出率的要求,達到了漏磁檢測缺陷量化與重構(gòu)的要求。
針對漏磁數(shù)據(jù)缺陷區(qū)域標記的問題,提出了一種基于K均值聚類的油氣管道缺陷區(qū)域標記方法,并通過管道內(nèi)檢測數(shù)據(jù)進行了驗證及分析。結(jié)果表明,該方法可有效識別出漏磁數(shù)據(jù)中的缺陷區(qū)域,識別準確度滿足工程要求。該方法由于不需要根據(jù)檢測器和管道情況單獨設(shè)置閾值,通過在不同管徑、不同壁厚的檢測數(shù)據(jù)試驗表明,該方法具有較廣泛的適應性。