蓋小剛,許佳偉,楊 亮,張 馳,郝思佳
(中海石油氣電集團有限責任公司,北京 100028)
隨著我國能源需求的不斷增長,液化天然氣(LNG)作為一種清潔、高效的能源供應方式,其在能源領域的應用日益廣泛。然而,由于LNG接收站均在沿海地區,所以管道的腐蝕問題已成為影響其安全運行的關鍵因素。LNG接收站腐蝕管道剩余壽命的預測對于管道運行安全、經濟性和維護決策具有重要意義。LNG接收站腐蝕管道剩余壽命精度預測的研究,首先需要對管道的腐蝕機理進行深入探討。LNG接收站管道腐蝕主要受環境、管道材料、施工質量等多種因素影響。此外,還需關注LNG接收站管道腐蝕控制技術以及剩余壽命評價方法等方面的發展。
在檢測技術方面,國外研究提出了一種綜合運用多種方法綜合檢測的技術方案,極大改善了缺陷檢出率。此外,針對管道的腐蝕狀況,提出了外防腐層安全狀況等級評定標準,為管道剩余壽命預測提供了理論依據。在腐蝕控制技術方面,管道腐蝕控制技術規程宣貫教材總結了燃氣輸配管道腐蝕控制的實踐經驗,為管道剩余壽命預測提供了技術支持。在剩余壽命預測方法方面,近年來,許多學者致力于探索適用于LNG接收站管道的剩余壽命預測方法。這些方法包括基于數值模擬、灰色關聯分析、神經網絡、支持向量機等方法。這些研究成果為提高LNG接收站管道剩余壽命預測的精度提供了理論依據。總之,LNG接收站腐蝕管道剩余壽命精度預測研究需綜合考慮管道腐蝕機理、腐蝕控制技術及剩余壽命評價方法等多方面因素。通過深入研究這些因素,有望為我國LNG接收站的安全運行和管道剩余壽命預測提供有力支持
隨機森林(Random Forest,簡稱RF)是一種集成學習(Ensemble Learning)算法,它主要由多個決策樹(Decision Tree)組成。每個決策樹都是獨立的,并且每個決策樹的訓練數據集都是通過隨機采樣得到的[1]。這種方法可以避免決策樹過擬合現象,從而提高整體模型的泛化能力。
由于多種因素都會對管道的腐蝕壽命產生一定的影響,所以需要研究各種因素對其影響的程度。采用隨機森林方法評估各影響因子對管道剩余壽命的影響,克服了傳統方法推廣性能差的缺點。隨機森林是一個由多個決策樹組成的分類器,它的基本思想就是用再抽樣的方式從訓練集中隨機選擇一個樣本,然后對每一個樣本構建一個二元遞推分類樹。每一個自助抽樣只有37%的原始資料,被稱作袋外數據,用來作為隨機森林的試驗樣本;最后,將K個訓練樣本作為分類器,構建隨機森林,通過對聚類結果的表決來判斷試驗樣本的分類效果,并用離包數據的錯誤率對分類準確率進行度量。利用MDG(均值基尼指數降值法),計算各變量對基尼指數各點的異質性的影響,用較高的均值表示該變量的重要性。
這里,MDA表示平均準確率下降;n表示樹的個數;err00B表示超出袋外數據誤差;t表示結點數;其中,p(k/t)為目標變量在節點t內為第k個變量的可能性。按(2)式求出每種樹木的GI值,求出各樹種的平均MDG值。
管道腐蝕問題在我國的工業領域中十分常見,它不僅會對管道系統的正常運行造成影響,而且還會帶來安全隱患。針對這一問題,研究人員嘗試采用各種方法進行預測,其中多變量線性回歸方法是一種常見的手段。不過因為管道腐蝕是非線性的,因此不能用線性回歸方法對其進行預測分析。
Elman神經網絡作為一種具有非線性、高維等特性的神經網絡模型,它在非線性系統建模和預測方面具有顯著優勢。與傳統的多變量線性回歸方法相比,Elman神經網絡具有以下特點:①非線性能力。Elman神經網絡能夠學習和表示非線性關系,這使得它在處理具有非線性特性的問題時具有優越性[2]。通過學習非線性關系,Elman神經網絡可以更好地捕捉管道腐蝕與發展趨勢之間的復雜聯系,從而提高預測的準確性;②高維處理。Elman神經網絡能夠處理高維數據,這使得它在處理包含多個影響因素的復雜問題時具有優勢。在管道腐蝕問題中,可能存在多個因素共同影響腐蝕的發展,Elman神經網絡能夠同時考慮這些因素,從而提高預測的準確性;③自適應學習。Elman神經網絡具有自適應學習的能力,能夠根據輸入數據自動調整網絡參數,從而使其更適合解決特定問題。這使得Elman神經網絡具有較強的泛化能力,可以在不同領域和場景中應用。綜上,Elman神經網絡在非線性系統建模和預測方面具有顯著優勢,將其應用于管道腐蝕問題的預測具有較高的準確性和可靠性。通過構建Elman神經網絡模型,可以有效地預測管道腐蝕的發展趨勢,從而為工業領域提供有力支持,提高管道系統的安全運行水平[3]。本項目擬采用非線性活化函數表征管道剩余壽命的隱含層,采用非線性活化函數表征管道的動態信息處理,并以此為輸入,通過四層神經網絡對各因子進行量化計算,得到管道剩余使用壽命的預測結果。

圖1 Elman 神經網絡模型結構
在Elman 神經網絡模型中,U(k)為網絡的隱含層,q(k)、qc(k)、h(k)為輸出層;ωi為承接層與隱含層、輸入層與隱含層、隱含層與輸出層的連接權;bi分別為隱式層與輸出級的門限;其中,g是隱式層與輸出層網絡輸出的線性權重之和,即隱式層神經元的輸出與隱含層的輸出之間的線性權重之和;f表示隱含層神經元的傳輸函數。Elman 局部遞歸神經網絡的數學模型如式(1)—(3)所示:
式中:g(*)-隱含層神經元傳遞函數,常采用Sigmoid 函數;f(*)-輸出神經元的激勵函數Elman神經網絡采用梯度下降算法對權重和偏置進行調整,以使誤差平方和最小。梯度下降算法的核心思想是不斷調整權重和偏置,使得誤差函數的梯度(即偏導數)趨近于0,表達式如式(4)所示:
式中:hc(k)-目標輸出值。在實際應用中,為了提高Elman神經網絡的性能,通常需要對學習過程進行多次迭代。通過不斷調整權重和偏置,使誤差平方和逐漸減小,直至達到預設的學習目標。通過調整權重、偏置以及激勵函數和隱含層神經元傳遞函數,Elman神經網絡能夠學習到管道腐蝕與發展趨勢之間的非線性關系,從而實現對腐蝕速度的準確預測。在實際應用中,可以根據實際情況選擇不同的參數和算法,以提高Elman神經網絡的性能。
采用隨機森林方法對 Elman參數進行選取[4],從而改善了神經網絡的學習能力和推廣能力。針對人工神經網絡對權值、門限等因素的敏感性,提出了一種基于啟發式演化算法的優化參數選取方法。
思維進化算法(MEA)是一種新的演化算法,它利用相位收斂性與異化作用,有效地克服了遺傳算法中雜交與變異操作存在的雙重性問題。該方法的基本思路是:在求解空間中隨機產生多個個體,獲得分數最大的勝者和暫時的勝者;以產生的個體為中心,產生一系列新的優勢子群及暫態子群;在此基礎上,本項目擬采用收斂操作優化子群內的個體,并利用異化操作實現子群間的競爭,實現勝者子群與暫態子群中個體的替代、拋棄與釋放,進而獲得全局競爭程度,進而計算全局競爭程度。在此基礎上,實現了群體中個體的替代、丟棄、釋放等操作,以求獲得全局最優個體的得分。其系統結構如圖2所示。

圖2 思維進化算法系統結構圖
經過實驗和對比,最后得出了在13個隱層節點數的情況下,訓練錯誤率最小的結論。Elman神經網絡權值參數修正采取基于梯度下降的改進算法,該算法在優化過程中引入了一個新的權值,該方法不僅對算法的收斂能力有很大的影響,而且在求解過程中易出現局部極值。具體過程描述如下:
首先,將樣本集合歸一化,設定初始參數,采用演化思想的方法,使用群體母函數產生原始群體和子代群體,并將其劃分為兩個集合。在此基礎上,提出了一種新的改進算法,該算法將所有的連通權集成到同一矢量上,以求出最佳的定位矢量。其中,用遺傳算法求出每個個體的極值點,以此作為神經網絡對性能指數函數的近似值,并用啟發式的演化算法進行反復求解,直至達到全局最優;在此基礎上,設計一種基于遺傳算法的遺傳算法,并對其進行局部最優編碼,當誤差大于給定值時,將其反饋給出最優個體,進而獲得對應的神經網絡權重及閾值。最后,利用該方法對該模型進行了改進,并對其進行了驗證,流程圖如圖 3所示。
為了驗證 MEA-Elma n模型的預測效果,選取均方誤差(mean squareerror,MSE)和決定系數(Coeff icient of determination,R2)進行分析。即:
式中:y-實際值;預測值;n-為樣本總數;f-為預測值;實際值的平均值。決定系數R2介于0~1之間,且越接近1,模型擬合度愈高,性能愈優良。
以某LNG接收站管段為例,對管段的腐蝕狀況進行全面檢測,本次采用了掛片實驗方法。掛片實驗是一種常用的腐蝕檢測手段,通過觀察金屬材料在特定環境下的腐蝕程度,以評估管道的健康狀況。在該實驗中,研究人員沿著管段沿線均勻布設了200個監測點,以確保對整個管段進行全面覆蓋。在實驗過程中,研究人員將特定時間內(例如100 d)的腐蝕數據進行收集。經過數據預處理和篩選,最終得到了900組具有代表性的腐蝕數據。這些數據涵蓋了管段沿線各個監測點的腐蝕情況,為后續分析和建模提供了豐富且有價值的樣本。然而,為了進一步提高模型的預測精度和泛化能力,研究人員還需要對原始數據進行進一步篩選和處理。在這個過程中,他們可以采用數據挖掘、機器學習等方法,找出具有典型特征的數據子集。通過這種方式,可以降低模型的過擬合風險,提高其在實際應用中的泛化能力[5]。最終,研究人員從900組數據中選取了202組具有代表性的數據。這些數據既包括了管段沿線各個監測點的腐蝕情況,也涵蓋了不同時間跨度和環境條件下的腐蝕特征。通過使用這些典型數據,研究人員可以構建更加精確和可靠的Elman神經網絡模型,以預測管道的腐蝕發展趨勢。部分數據見表1。

表1 管道腐蝕原始數據
針對不同因素之間的差異,提出了一種基于premnnmx函數的方法,來消除尺度效應的影響。通過隨機森林算法將樣本數據10種腐蝕單因素變量納入隨機森林模型得到各變量重要性由高到低排序;根據重要性評分排序得到的結論,從評分最高的單個變量進行逐步隨機森林。分析結果如圖4所示。當變量數為8時估算誤差率最低,因此,選取電阻率、環境pH、鹽度、含水率、氧含量、H2S含量、注入水體pH等8個因子作為神經網絡的輸入參數。

圖4 變量重要性排序圖
為了驗證RF-MEA-Elman模型的性能,研究人員將篩選后的數據分為訓練集和檢測集。其中,186組數據作為MEA-Elman模型的訓練集,剩余的20組數據作為檢測集。研究人員通過不斷迭代優化,揭示了模型在訓練過程中的進化歷程,如圖5所示。為了評估RF-MEA-Elman模型的預測準確性,研究者選取了MEA-Elman和Elman兩個模型作為對比[5]。思維進化迭代過程如圖6展示的那樣。在迭代過程中,研究人員不斷調整模型參數,以期達到更高的預測精度。通過圖5,我們可以觀察到模型的精度隨著迭代的進行而逐步提高。了更直觀地評估RF-MEA-Elman模型的性能,研究人員選擇了MEA-Elman和Elman兩個模型進行對比。通過對比三種模型的預測結果,可以清楚地看出RF-MEA-Elman模型在預測精度方面的優勢[6]。圖6展示了思維進化迭代過程,從中我們可以看到模型在迭代過程中的逐步優化。通過對比預測結果及相對誤差,研究人員可以直觀地評估RFMEA-Elman模型的性能。如圖7、8和表2所示,RFMEA-Elman模型在預測精度、準確性和穩定性方面均表現出顯著優勢。RF-MEA-Elman模型在迭代優化過程中具有較高的預測精度,可以有效地應用于管道腐蝕預測。與MEA-Elman和Elman模型相比,RFMEA-Elman模型在預測性能方面具有明顯優勢,為管道管理部門提供了有力支持。通過應用RF-MEAElman模型,可以提高管道的安全運行水平和維護效率,降低管道腐蝕帶來的風險[7]。

圖5 逐步隨機森林分析結果

圖6 思維進化算法迭代變化過程

圖7 模型預測結果的比較
如圖6所示,經過30個迭代后,該方法的誤差很快降至0.05以下,表明該方法有很好的推廣性能和穩定性。如圖7所示,RF-MEA-Elman預測值與真實值之間的差異較小,且與單個 Elman模型及MEAElman模型的擬合結果吻合較好,說明 RF法剔除了冗余變量,采用演化思想對神經網絡權重及門限進行了優化,得到了準確、快速的神經網絡模型。從圖8和圖2中可以看出,RF-MEA-Elman方法的相對預報誤差比其他兩種模式都要小,而所建立的模型大部分誤差在4%之內。為了更好地評估該模式的預報效能,我們使用前一節介紹的兩種統計方法來評估該模式,并將其結果顯示在表3中。

表3 模型預測性能指標對比

圖8 相對誤差對比圖
進一步的分析顯示,在誤差指標(MSE)方面,最小的只有0.86,判決系數R2高達0.98,比兩個對照模型都要高得多,并且都非常逼近1,這表明演化算法可以很好地對 Elman神經網絡進行優化。研究結果表明,本文提出的方法預報準確率高,泛化能力強,可以為管線腐蝕評價提供一定的理論依據。
針對腐蝕管道影響因素復雜與傳統方法預測效果差等問題,構建含腐蝕管線的RF-MEA-Elman剩余壽命預測模型,并對其進行驗證。結果如下:
1)利用隨機森林方法,有效地提取出了腐蝕過程中的主導因子,減弱了數據冗余性對預測結果的影響。
2)利用演化算法對神經網絡的權重門限進行優化,以克服因參數隨機性而導致的學習效率下降,從而達到快速、準確、節省計算量的目的[7]。
3)將本模型用于管線的剩余壽命預測,結果表明RF-MEA-Elman模型在推廣能力、穩定性和精度上都有很大的改善,具有較好的推廣價值。通過本項目的實施,將進一步完善含腐蝕管線剩余壽命的研究方法,為我國LNG接收站的安全運行和維護工作提供理論支撐。