基于計算機視覺的油氣管道失效識別技術

2023-06-29 14:13:17周權宮彥雙吳超安超劉杰

四川建筑 2023年1期

關鍵詞：模型

周權宮彥雙吳超安超劉杰

目前，傳統的油氣管道失效識別技術依然采用人工檢測分析的方法為主，耗時較長且智能化程度低。提出了一種基于殘差網絡與遷移學習的管道失效圖像識別算法，通過深度卷積網絡建立了管道失效識別模型，然后利用大型ImageNet 數據集中訓練好的Resnet152模型參數，在包含1萬余張的管道失效圖像數據集上進行微調與模型優化，最終實現對細菌腐蝕、土壤腐蝕、環境敏感開裂等15種失效類型的準確識別。實驗結果表明，算法的準確率達到95%以上，并具有較強的泛化能力，能夠實現對油氣管道失效類型的快速準確識別。所提算法可以為油氣管道失效的統計與分析提供簡單快捷的方法，提高信息化管理水平。

油氣管道失效；圖像識別；殘差網絡；遷移學習

TP391.413 A

［定稿日期］2021-12-27

［基金項目］四川省科技計劃項目（項目編號：2020YFG0303、2020YFH0111）；成都市科技項目（項目編號：2019-YF05-02657-SN）

［作者簡介］周權（1999—），男，在讀碩士，研究方向為機器學習、計算機視覺。

1 油氣管道失效識別

隨著天然氣及石油工業快速發展，我國的油氣管道運輸建設已相對完整，在2020年期間，新建成油氣管道里程高達5 081 km，管道總里程累計達到14.4萬km［1］。相比于油氣管道的飛速建設，管道的日常維護卻相對薄弱，相關部門對其投入的人力物力不足。管道的管理和檢測體系不完善，給管道的安全運行造成一定的威脅。

目前，我國每年新增被石油污染的土壤約為10萬t，部分重油田污染區的土壤原油含量遠遠超過國家標準臨界值。另外，水資源石油污染現狀也不容樂觀，如2006年發生的長達一個多月的渤海石油污染事件和2009年陜西發生的地下輸油管道泄漏事件等，給我國海洋環境和地下水資源造成了嚴重污染［2］。

開展油氣管道失效的識別與統計，可以明確不同類型風險權重，對提高風險概率計算精度和提高風險評價工作科學性具有重要作用，有助于采取有針對性的維修維護方法，進而提升管理對象本質安全，防范失效泄漏的發生。由于油氣田管線的失效問題涉及材料本身、服役環境、工藝流程等多個方面，給失效識別工作帶來較大的困難。目前，管道一線巡檢人員在缺乏專業知識的情況下，難以在現場對失效類型進行準確判斷，失效類型往往不能被有效識別。專業實驗室識別在時間和費用上較高，不適用于油氣田管道失效多發的現狀。因此急需建立一種能夠為現場工作人員所掌握的，較為便捷的失效類型識別方法，低成本快速有效識別一些失效類型。

隨著人工智能的快速發展，計算機視覺技術已經廣泛應用于日常生活的各個領域，出現了一系列高效準確的圖像識別算法，如基于卷積神經網絡的水稻病害圖像識別、垃圾圖像分類、手寫數字識別等［3-4］。因此，本文提出了一種基于深度學習的油氣管道失效類型識別算法，使用殘差結構搭建了圖像分類神經網絡，并采用遷移學習的方法，對油氣管道圖像數據集進行識別和分類。最終的模型能夠實現對油氣管道典型失效類型的快速準確識別，有助于完善油氣管道腐蝕管理檢測系統，提高信息化管理水平，為油氣管道工程管理提供簡單快捷的方法和科學的指導意見。

2 生成數據集

根據所采集到的數據，制作了相應的腐蝕分類圖表，一共分了15個類型，如表1所示。

由于原始采集到的數據集較小，約為1 000張圖片，遠遠不夠實驗要求，所以先對數據集進行增強處理以得到更多的數據，處理方法有放大縮小、旋轉、改變明亮度、平移、添加噪聲等。部分圖片處理后的效果如圖1所示，各類型的原始數據量與增強后的數據量如表2所示。

增強后一共得到了約10 000張圖片，共15個類型，每個類型約700張，最后按照7∶2∶1的比例劃分訓練集、驗證集和測試集，訓練集數量約為7 000張，驗證集約為2 000張，測試集約為1 000張，滿足后續模型訓練要求。

3 算法設計

3.1 遷移學習

對比傳統機器學習，遷移學習在微調之前，模型的初始性能更高；在訓練過程中，模型提升的速率更快；在訓練結束后，得到的模型收斂效果更好，解決了小數據樣本在訓練時容易出現的過擬合問題，提高了小數據樣本分類問題的準確性和效率性。

本實驗將先凍結前面卷積層參數，只訓練最后新建立的全連接層，保存下該次訓練的最優模型；然后在前面保存的最優模型基礎上，解凍前面的所有的卷積層，進行第二次全局訓練。

3.2 Resnet152

傳統的卷積神經網絡當堆疊到一定網絡深度時，會出現梯度爆炸和退化問題。2015年提出的Resnet網絡解決了以上問題，它提出殘差結構，建立了輸入與輸出之間的有效連接，使神經網絡在深度拓寬的同時還能保持其特征表達的能力，成功解決了退化問題，可以搭建超深的網絡結構，超過了1 000層［5］。殘差塊的基本結構如圖2所示。

Resnet中提出了2種映射：

（1）恒等映射（Identity Mapping），指的是圖2中數字2所標示的部分。

（2）殘差映射（Residual Mapping），指的是圖2中減去恒等映射剩下的部分。

殘差塊的最后的輸出如式（1）所示。

y=F（x）+x（1）

其中殘差指的就是F（x）部分。

在圖2的殘差塊中有2層結構，第一層結構的表達式如式（2）所示。

F=W2σ（W1x）（2）

其中σ代表非線性激活函數ReLU函數。

然后通過一個恒等映射和第二個ReLU函數，得到輸出y ，第二層表達式如式（3）所示。

y=F（x，{Wi}）+x（3）

Resnet152的網絡結構多達152層，可以更加充分提取提取圖像特征，其網絡結構如圖3所示。從第 1 組卷積塊起到第 5 組均為殘差模塊，將大小為 224×224 的圖像數據輸送后，經殘差網絡提取特征進行學習訓練。經過訓練后，將圖像輸入平均池化層取平均，最終由全連接層的 LogSoftmax 函數進行圖像類別的劃分。

4 實驗流程

運行環境為Windows10 64bit系統，CPU為AMD Ryzen 9 5900HX，GPU為NVIDIA Geforce RTX 3070。實驗基于Facebook開源的Pytorch框架運行，采用Python3語言編寫。

具體流程：

（1）數據預處理：加載訓練集和驗證集，通過torch中的transforms函數，對每個epoch數據圖像進行處理。

（2）模型初始化：加載在ImageNet上預訓練的Resnet152模型參數，凍住前面所有的卷積層參數。

（3）修改全連接層：重新定義最后的全連接層參數，將其改為15分類問題，采用LogSoftmax。

（4）設置優化器和損失函數：采用NLLLoss損失函數和Adam優化器，學習率為 0.000 1。

（5）全連接層訓練：總共訓練25個epoch，畫出模型的性能曲線，保存驗證集準確率最高的模型。

（6）全局訓練：先加載（5）中保存的模型，解凍前面的卷積層，使所有參數可以參與訓練，學習率為0.000 1，訓練30個epoch，最后保存驗證集準確率最高的那次模型作為最優實驗模型。

（7）模型測試：加載測試集數據與最優模型，對測試集進行驗證。

5 實驗結果與分析

對2次訓練和一次測試過程進行性能分析，以迭代過程中損失函數值和預測精度為性能評估標準，分析模型的收斂性能及預測準確率。

5.1 全連接層訓練

圖4為模型準確率曲線，圖5為模型的損失函數曲線。從圖4可以看出，隨著迭代次數的增加，準確率一直處于上升狀態。當迭代次數到達第20次時，驗證集準確率超過95%，訓練集準確率接近90%，曲線趨于穩定，基本達到收斂狀態。

從圖5可以看出，訓練過程中，訓練集和驗證集的損失函數值一直呈平穩下降趨勢，并沒有出現過擬合情況。

實驗結果可知，全連接層訓練的驗證集最高準確率出現在第23個epoch時，其數值為0.964 3，保存下該次訓練的模型。

5.2 全局訓練

加載全連接層訓練保存的模型，解凍前面的卷積層，訓練所有網絡參數，圖6、圖7分別為訓練過程中模型準確率曲線與損失函數值曲線。

從圖6可知，模型的準確率在小范圍內發生波動，總體呈上升趨勢，epoch為29時，準確率達到98%。從圖7可知，訓練集和驗證集的損失函數值整體處于下降狀態，并未出現過擬合現象。

全局訓練的驗證集最高準確率出現在第29個epoch時，其數值為0.980 3，保存下該模型，作為訓練的最優模型。

5.3 模型測試

測試集數量為1 000張左右，加載前面訓練保存的最優模型，在測試集上進行實驗。圖8是部分圖片預測結果，圖9是所有圖片預測結果的混淆矩陣。

從圖8的預測結果和圖9的混淆矩陣可以看出，模型識別的準確率較高。從混淆矩陣可以看到，1 000余張測試圖片，僅有35張圖片預測錯誤，預測準確率達到了95%以上。

6 結論

本文將深度學習應用于油氣管道失效類型的識別中，建立了一種基于遷移學習和殘差網絡的管道失效分類模型。實驗結果表明，Resnet152模型能夠做到在較少的Epoch次數中獲得高準確度。實驗過程包括兩次訓練，在第一次全連接層訓練中，僅經過20次Epoch，其識別準確率能達到95%；在第二次全局訓練中，經過30次Epoch，模型達到98%的準確率，并且最后的測試集準確率達到了95%以上。因此，該模型具有泛化能力較強、準確率較高、魯棒性較好等特點，可以為油氣管道失效類型的識別提供科學參考意見，提高信息化管理水平，有利于減少因管道失效泄露導致的環境污染。

參考文獻

［1］關鵬.論我國石油管道建設的特點和發展趨勢［J］.中國石油和化工標準與質量，2019，39（18）：103-104.

［2］郭峰.石油污染治理技術綜述［J］.化工管理，2021（19）：51-53.

［3］邱靖，劉繼榮，曹志勇，等.基于卷積神經網絡的水稻病害圖像識別研究［J］.云南農業大學學報（自然科學），2019，34（5）：884-888.

［4］李優，穆林平.基于遷移學習的垃圾圖像分類模型研究［J］.電腦與信息技術，2021，29（4）：17-21.

［5］郭玥秀，楊偉，劉琦，等.殘差網絡研究綜述［J］.計算機應用研究，2020，37（5）：1292-1297.