吳澤民,周臨風,冷建成
(東北石油大學,黑龍江大慶 163318)
管道是油氣資源的主要運輸方式,在長期服役過程中由于受到環境載荷以及材料本身性能退化等因素影響,會產生結構損傷、變形甚至斷裂失效[1],因此,非常有必要對這些高后果區管段以及超期服役管道實施在線監測,并利用監測數據預測管道的發展趨勢以實現異常預警,確保在役管道的安全。
國內外學者在油氣管道安全監測方面開展了大量研究,胡瑾秋等[2]通過引入數據自組織挖掘思想對設備退化狀態進行預警,采用隱馬爾科夫模型對設備狀態進行評估,再進一步通過建立自組織預測模型進行退化過程預測;El-ABBASY等[3]采用人工神經網絡(ANN)模型對管道狀態進行預測,給出了油氣管道的衰退曲線;謝麗婉[4]基于埋地聚乙烯管道,建立了模糊綜合評價數學模型,通過將安全預警理論與風險矩陣相結合來確定管道的安全預警等級;溫江濤等[5]引入深度遷移學習,實現了復雜環境下油氣管道周邊入侵事件的準確識別。
綜上所述,目前應用傳統預測方法對管道進行安全評價的研究較多,筆者基于地基沉降下的室內管道模型試驗,曾提出利用BP神經網絡和GM(1,1)組合模型進行管道監測部位的應力預測,但預測結果偏保守[6]。本文將深度學習中的長短期記憶網絡(LSTM)引入到管道應力發展的趨勢預測,為后續的在線安全預警提供指導。
循環神經網絡(Recycle Neural Network,RNN)是ANN的一種改進,與傳統的BP神經網絡相比[7-8],RNN網絡具有記憶功能,即考慮時間相關性的影響,通過收集數據序列的歷史信息來計算當前輸出,能夠更深地挖掘數據的潛在規律,從而實現更準確的預測;但由于自身特殊的結構而會出現梯度爆炸或梯度消失問題,為此通過引入長短期記憶單元代替原來的隱含層單元就得到LSTM網絡模型,其原理如圖1[9]所示。

圖1 長短期記憶網絡原理示意Fig.1 Schematic diagram of LSTM network
圖1中,長短期記憶單元包含記憶單元和3個門,分別為輸入門、遺忘門和輸出門,這些門控制著信息流入和流出記憶單元。
基于有限元分析結果[6],兼顧室內試驗和現場安裝需要,在管道關鍵部位表面安裝4個振弦傳感器和5個直角電阻應變片,具體布置見圖2。其中,振弦傳感器可以測量管道表面的軸向應變和溫度,應變片同時測量軸向和周向應變。

圖2 振弦傳感器和應變片布置Fig.2 Arrangement of vibrating wire sensors and strain gauges
通過調節管道底部的升降支架進行不同基礎沉降下的在線監測試驗,具體試驗過程見文獻[6]。
2.2.1 基于LSTM模型的管道應力趨勢預測
振弦傳感器在現場施工中具有便于安裝和適于長期監測等優勢,但僅能測量軸向應變。由于薄壁管道可考慮為平面應力狀態,因此,本文主要對室內直角應變片的監測數據進行應力分析。
對管道應力變化進行趨勢預測需要基于前期監測的歷史數據,利用LSTM模型可以考慮過去的監測數據和未來數據之間的時間相關性,進而實現管道的應力預測。其主要過程如下:首先,依據與等效應力相關的監測參數的個數來確定輸入層節點數,根據輸入層和輸出層確定隱含層數目;然后,將應力監測數據分為訓練集和預測集,并對數據作歸一化處理,以消除量綱影響;最后,建立LSTM模型,選取激活函數進行訓練,得到擬合結果。
具體來說,選擇軸向應變、周向應變作為輸入變量,輸入節點數設為2;輸出變量為等效應力,輸出節點數設為1;基于輸入層和輸出層節點數,需要確定隱含層數目,即LSTM單元數目,通過經驗公式[10]可進行初步估算:
(1)
式中,N為隱含層節點數;m,n分別為輸入和輸出層節點數;a為1~10之間的常數。
考慮到LSTM單元數目越多,神經網絡的擬合能力越強,但計算時間也會增加;如果隱含層數目過少,長短期記憶網絡的學習能力不強,基于式(1)代入不同的隱含層節點數,通過不斷調整嘗試使模型訓練的均方根誤差(RMSE)(見式(2))結果最小,進而確定最優隱含層節點數為5。
(2)

RMSE計算結果越小,說明預測值和實際值偏差程度越小,預測效果越好。
選取2019年4月25日~4月27日應變片3的應力監測數據作為基礎數據建立LSTM模型,對2019年4月28 日~4月29日的應力進行預測。輸入數據前需要對訓練數據和測試數據進行歸一化處理,目的在于消除量綱不同和數值差異的影響,其計算公式為:
xk=(x-xmean)/xvar
(3)
式中,xk為歸一化之后的數據;xmean,xvar分別為數據的均值和方差。
將歸一化處理之后的訓練數據和測試數據輸入LSTM模型進行訓練,確定每次訓練的輪次為500,初始學習率為0.01,求解器應用Adam優化算法,激活函數選擇sigmoid,最后進行反歸一化得到預測結果如圖3所示。

圖3 LSTM模型預測結果Fig.3 Prediction results of LSTM model
由圖3可以看出,基于LSTM模型進行應力擬合和預測取得了較好效果,經均方根誤差計算,其值為0.35 MPa,表明具有較高的預測精度。
2.2.2 基于粒子群算法優化的LSTM模型應力預測
在實際應用中,長短期記憶網絡中的迭代次數、學習率等參數通常都是依靠人為經驗來確定,具有隨機性,進而會影響模型的擬合和訓練效果。為此,本文提出應用粒子群算法(PSO)[11]對長短期記憶網絡進行優化。
粒子群思想源于鳥類社會行為研究,即在距離食物最近的鳥所在區域,通過最簡單的方法搜索食物,并通過個體間的協助和信息共享實現群體進化。一個粒子可以看作一個可能解,用位置、速度和適應度值進行描述,通過不斷迭代尋找最優區域,從而在搜索空間中完成尋優過程,最終得到滿足終止條件的最優解。
在搜索空間中,多個粒子構成一個群體,在第t次迭代后形成粒子的速度和位置,分別用Vi,t和Xi,t表示,在尋優過程中不斷更新位置和速度,并形成兩個最優解:一個是個體極值pbesti;另一個是全局最優解gbesti。在尋找最優解的過程中,粒子分別按照式(4)和式(5)[12]更新速度和位置。
Vi,t+1=ωVi,t+c1rand(pbest-Xi,t)
+c2rand(gbest-Xi,t)
(4)
Xi,t+1=Xi,t+λVi,t+1
(5)
式中,ω為慣性因子;c1,c2分別為個體和群體學習因子;rand為[0,1]間的隨機數;λ為速度系數,一般取1。
取同樣的監測數據,構建PSO-LSTM模型進行優化預測,首先仍然是將數據劃分為訓練集和測試集;其次,將LSTM模型中的學習率、迭代次數做為優化目標,設置最大迭代次數為10,個體和群體學習因子分別設為0.5和1,慣性因子設為0.6,粒子群規模設為5,定義適應度函數f[12]為:
(6)
式中,K為種群規模;yi為預測數據;y0為實際數據。
依據式(6)計算每個粒子的適應度值,根據初始適應度值確定個體極值和全局最優解;根據式(4)(5)對粒子的速度和位置進行更新;判斷全局最優解是否滿足最大迭代次數,若滿足則輸出最優結果,若不滿足,重新計算適應度值,重復上述迭代過程。PSO-LSTM模型的適應度曲線見圖4。

圖4 PSO-LSTM模型適應度曲線Fig.4 PSO-LSTM model fitness curve
由圖4可以看出,隨著迭代次數的增加,適應度值趨于穩定,當迭代4次后達到最佳適應度值。優化后的LSTM模型迭代次數和學習率分別為272和0.003 9,將優化參數和測試數據輸入到構建的訓練模型中,反標準化得到優化后的預測結果見圖5。可以看出,優化后的長短期記憶網絡預測效果更接近于實際值。

圖5 PSO-LSTM優化預測結果Fig.5 Prediction results optimized by PSO-LSTM
將基于同一監測數據的BP神經網絡、長短期記憶網絡以及優化后的LSTM預測結果應用均方根誤差作為指標進行定量評價,計算結果列于表1中。

表1 三種模型應力預測結果對比Tab.1 Comparison of stress prediction results by three models
由表1可以看出,基于BP神經網絡進行預測的均方根誤差為0.81 MPa,而LSTM模型和PSO-LSTM模型進行趨勢預測的均方根誤差分別為0.35 MPa和0.29 MPa,說明優化后的LSTM模型能夠很好地反映數據變化趨勢,而且PSO-LSTM模型的預測曲線更接近真實應力變化,預測結果也比LSTM模型更精確。
需要說明的是,不同樣本的選擇有可能會對模型的預測結果及預測能力產生影響,下一步將討論其相關性及樣本-樣本誤差,并研究新的樣本選擇算法以確保所提模型的準確性和穩健性[13]。
(1)基于循環神經網絡能夠更深層次地挖掘監測數據特征和規律,與BP神經網絡相比,所提出的LSTM模型預測應力趨勢效果更好。
(2)提出了基于粒子群算法對LSTM模型進行優化的PSO-LSTM模型,結果表明,PSO-LSTM模型預測精度明顯優于LSTM模型和BP神經網絡結果,有望用于長期監測數據的趨勢分析和安全預警中。
(3)在管道應力預測的基礎上,下一步將通過指數加權移動平均控制圖實現對管道應力預測數據的異常預警,并結合管道有限元模型開展異常數據的損傷程度評估及剩余壽命預測研究。