金龍 曾德智 孟可雨 肖國清 譚四周 張昇
1.油氣藏及地質開發工程國家重點實驗室·西南石油大學 2.中海石油(中國)中國有限公司深圳分公司3.中國石油天然氣股份有限公司東北銷售分公司
腐蝕失效一直以來是油氣行業亟需解決的難題之一[1-2],腐蝕造成的管道、井筒、套管等油氣裝備損壞現象嚴重影響油氣田的生產安全[3-5]。在大數據分析與人工智能快速發展的今天,大數據驅動的人工智能方法開始在腐蝕科學領域得以運用。從非線性系統角度來看,腐蝕速率受多種因素共同影響,影響因素之間存在信息疊加與相互耦合,造成傳統預測模型不準。目前,引入以神經網絡為代表的人工智能方法對腐蝕速率進行預測取得了良好的效果。粒子群優化支持向量機、粒子群優化廣義回歸神經網絡、主成分分析支持向量機、隨機森林、集成式學習等一批方法在腐蝕預測方面都得到了廣泛的應用[6-11]。此外還包括多種方法的聯合運用,例如S. B. Peng等[12]提出了一種混合智能算法來預測多相流管道的腐蝕速率,該模型結合了支持向量回歸、主成分分析和混沌粒子群算法,并利用該模型對管道多相流腐蝕速率進行預測,取得了良好的效果;田源等[13]將半經驗腐蝕速率預測模型與BP神經網絡結合開發了含硫氣田集輸管道預測軟件,軟件預測結果與腐蝕掛片數據吻合度較好。
從前人研究成果來看,研究重點為提高預測精度和減低預測耗時等方面。筆者在大數據腐蝕預測研究中發現,最小二乘支持向量機(LSSVM)作為支持向量機算法的提升版,屬于學習效率高,泛化性能強,結構性能穩健的預測模型,其在腐蝕預測方面鮮有文獻報道。本研究將LSSVM模型與群智能優化算法—灰狼優化(GWO)算法相結合,形成GWO-LSSVM預測模型,旨在探索開發一種新型高效率、高精度的多元非線性腐蝕速率預測模型。將該模型應用于海洋油氣管道的外腐蝕速率預測中,是對大數據腐蝕預測方法的探索與豐富,具有一定的重要意義與應用價值。
海水內部溶質種類較多,屬于天然電解質,為電化學腐蝕創造了天然有利條件,容易造成海洋油氣裝備的腐蝕失效。圖1為某海洋管道受海水腐蝕破壞的宏觀與微觀形貌[14]。海水中影響金屬腐蝕的因素主要包括海水溫度、氧溶解量、鹽含量、pH值、氧化還原電位、管道材質、海水流速[15-16]。

海水溫度在不同緯度、不同季節與不同海洋深度下均有不同的變化。溫度升高會加快海水腐蝕金屬的速率,但是溫度升高又會降低海水的氧溶解量,而氧溶解量又決定了吸氧腐蝕進行的快慢。其陰極反應方程式如式(1)所示。
O2+2H2O+4e-→4OH-
(1)
同時,鹽含量也會影響海水導電率和氧含量。鹽含量增加會使得海水電導率增加,但是會導致海水氧溶解量降低。因此,鹽含量對海水腐蝕的作用機理較為復雜。海水的pH值相對穩定,一般為7.2~8.6,呈現出中性或弱堿性,與前面3個影響因素相比,pH值主要影響海水中的含鐵鹽水垢沉積過程,其對腐蝕的影響作用相對較弱。海水作為一種腐蝕性電解質,其內部存在諸多氧化劑與還原劑,故用氧化還原電位表示海水氧化還原程度的強弱。由于不同材料的耐蝕性不同,因此,也應當考慮材料對腐蝕速率的影響。海水流速也會影響腐蝕過程的傳質作用,同時流速還會影響海水含氧量的變化,因此,海水腐蝕影響因素還需考慮流速。圖2為本實驗構建的海底管道腐蝕速率預測指標體系。

1995年,C. Cortes[17]在研究有限小樣本推測大樣本的算法模型時,從VC維與結構風險最小原則出發,提出一種通用有效機器學習模型-支持向量機(support vector machine,SVM)模型。該模型具有出色的學習能力以及強大的泛化性能,尤其擅長對小樣本數據的機器學習。LSSVM模型是對傳統支持向量機的簡化改進[18-19],改變了問題的求解類型,將二次規劃不等式求解轉化為等式求解,進而提升了算法的求解效率。
LSSVM模型的數學表述為:假設存在一組樣本D={(xi,yi)|i=1,2,…,N}作為訓練集,其中xi作為輸入值,yi作為輸出值。則對于任意的非線性回歸問題,LSSVM模型可以進行如式(2)的表示。
y(x)=ωTφ(xi)+b+ei
(2)
式中:ω為權重向量;φ(xi)為非線性映射函數;b為偏置值;ei為擬合誤差,是訓練集樣本的實際輸出值與預測輸出值之間的誤差。
式(2)中,ω與b可以通過結構風險最小原則獲取,表達式如下:
(3)
式(2)的約束函數表達式可以寫成如下形式:
yi=ωTφ(xi)+b+ei,i=1,2,3,…,N
(4)
如果在式(3)中引Lagrange乘子L,其表達式如式(5)所示。
(5)
式中:αi為拉格朗日乘子;γ為懲罰因子,用于平衡yi與訓練誤差。
根據KKT(Karush-Kuhn-Tucker)優化條件,利用式(5)可分別獲取ω、b、e和α的極大似然估計,如式(6)所示。
(6)
則LSSVM多元非線性回歸方程如式(7)所示,該方程為多維空間中的曲線。
(7)
式中:K(x,xi)為核函數;x為訓練集樣本的輸入向量;α,b為式(5)的求解結果。
核函數K(x,xi)的選取有多種函數,本研究選取穩健性較強的RBF函數作為核函數,其表達式如式(8)所示。
(8)
式中:σ為核參數。
懲罰因子γ與核參數σ為影響LSSVM模型精度的主要參數,也是構建高精度LSSVM機器學習預測模型的關鍵。因此,需要從全局最優的角度出發選取γ與σ,而全局最優則需要依靠智能優化算法來實現。
灰狼優化算法與粒子群優化算法(particle swarm optimization,PSO)均為生物種群仿真算法,算法的原理有所不同。有關粒子群優化最小二乘支持向量機的PSO-LSSVM模型的計算流程參見文獻[20-22]。2014年,Mirjalili等學者從灰狼種群捕食行為中提出一種新型生物種群啟發式算法稱為灰狼優化算法(GWO)。與其他生物種群啟發式算法不同,該算法的核心是抽象模擬灰狼種群捕食規律,GWO算法的原理如圖3所示。在圖3的種群社會等級金字塔中,α狼位于金字塔的頂端,α狼的主要任務是負責覓食和領導其他灰狼。β狼位于種群等級金字塔的第二層,其任務主要是協助α狼管理狼群,并將其他灰狼個體信息反饋給狼α。δ狼位于種群等級金字塔的第三層,其任務主要是執行α狼與β狼的決定。W狼位于種群等級金字塔的最底層,其任務是負責實際獵物捕捉。灰狼優化算法尋找待解決問題的全局最優問題時,α狼領導其他灰狼進行搜尋,狼群在α狼領導下采用包圍、跟蹤、攻擊等方式捕食獵物。

圖3的GWO算法原理圖表明在K維搜索空間中,產生一組由N只狼組成的狼群,狼群會包圍住獵物。在此過程中,獵物與狼群之間的距離函數關系如式(9)所示。
(9)
與其他生物種群啟發式算法相同,灰狼也必須采用隨機搜索的方式逐步逼近全局最優解,在灰狼優化算法中,狼只的隨機搜索控制函數如式(10)所示。
(10)

α狼、β狼、δ狼在算法中表現為每次迭代中所保留的3個暫時擁有全局優解的灰狼,賦予其對狼群的領導能力,其他灰狼會根據α狼、β狼和δ狼的召喚更新自身的位置,但是每一次迭代更新都會產生新的α狼、β狼和δ狼,如此往復迭代直到最底層W灰狼抵達全局最優位置。狼群召喚更新位置過程的數學表達式如式(11)所示。
(11)

由于懲罰因子γ與核參數σ2是影響LSSVM模型預測精度的關鍵參數,將懲罰因子γ與核參數σ2視為獵物,應用GWO算法對目標函數LSSVM的核函數的γ與σ2進行全局尋優,GWO-LSSVM模型計算流程如圖4所示。

為了評價模型的預測精度,引入MAE、RMSE、MSE和R24個預測誤差評估函數對預測模型精度進行綜合評估。MAE反映預測值的真實誤差,RMSE用于反映預測值和真實值之間的偏離程度,MSE反映真實值與預測值之間的差異,MAE、RMSE和MSE越接近零,表示預測精度越高[17],R2衡量的是預測值與真實值之間的擬合程度,其值越接近1,表示擬合程度越好,4個預測誤差評估函數表達式如式(12)所示。
(12)

數據源引文獻[15]中海水掛片實驗的50組數據,腐蝕速率采用陽極電流密度表示。文獻[15]利用灰色關聯分析法對指標進行了降維,同時將管材與海水流速設為獨立值,即不受其他指標影響,單獨統一賦值,經過該處理方式后指標降為五維。從50組數據中隨機選出10組數據作為測試集樣本,剩余的40組數據作為訓練集樣本供預測模型學習。訓練集樣本見表1,測試集樣本見表2。由于海洋油氣管道外腐蝕影響指標的量綱與數值不同,為了提高預測算法精度和消除不同量綱數據對算法精度的影響,數據集經過無量綱與歸一化處理,處理公式如式(13)所示。
(13)
式中:x為變量的具體數值;xmin和xmax分別為該組變量中的最小值與最大值。

表1 訓練集樣本數據序號溫度/℃氧溶解量/(mg·L-1)鹽含量/(103 mg·L-1)pH值氧化還原電位/mV腐蝕電流密度/(μA·cm-2)125.906.7130.105.1037816.40229.356.0929.006.3040016.90327.906.1831.507.0036315.57424.007.9530.208.1032413.65527.323.2129.318.2028112.91627.876.5531.687.2035614.06…………………3724.316.4240.677.882508.753824.116.3841.007.982288.993917.457.4834.088.1013517.054021.958.2834.647.9511317.34

表2 測試集樣本數據序號溫度/℃氧溶解量/(mg·L-1)鹽含量/(103 mg·L-1)pH值氧化還原電位/mV腐蝕電流密度/(μA·cm-2)128.005.0531.409.2024013.34229.376.8230.126.2041417.11328.756.8032.228.0034011.43424.607.5224.427.5721011.83525.576.7032.198.0932511.87628.726.8032.218.0032513.33724.607.5224.427.5721010.74830.707.1531.746.5040115.00925.556.6731.008.0932012.491027.194.9133.507.9927515.48
此處將對比分析粒子群優化最小二乘支持向量機PSO-LSSVM、灰狼優化最小二乘支持向量機GWO-LSSVM、傳統最小二乘支持向量機LSSVM這3種模型的預測結果。PSO速度更新系數c1取1.5,c2取1.7,種群規模為20,迭代次數為100,個體和速度的取值區間分別為[1,1 00 0]和[0.001,100]。經過PSO后的最小二乘支持向量機核函數σ為1.435,懲罰因子γ為1.808 9。GWO對LSSVM的核函數σ、懲罰因子γ的尋優范圍分別為[0.001,500]與[0.001,100],搜索狼群單位數量為20,迭代步數為50次。經過GWO尋優迭代后的最小二乘支持向量機核函數σ為7.465、懲罰因子γ為0.288 3。兩種算法均在相同的16核工作站上完成,分別用時5.6 s和3.5 s。



圖5是3種預測模型的預測結果。由圖5(b)可看出:傳統LSSVM的相對誤差波動較大,其最大相對誤差達到1.64%,高于PASO-LSSVM與GWO-LSSVM的預測結果。PSO-LSSVM預測結果的最大相對誤差為0.44%,GWO-LSSVM預測結果的最大相對誤差為0.16%;GWO-LSSVM算法誤差波動小,算法穩健。同時,利用預測結果計算3種模型的MAE、MSE和RMES,可以看出GWO-LSSVM的MAE、MSE和RMES最小,最接近于零,分析結果見圖6。圖7是真實值與預測值的線性回歸擬合分析。由圖7可以看出,GWO-LSSVM的決定系數R2為0.997 8,與1最接近,擬合程度最好。綜合來看,GWO-LSSVM的預測精度高于PSO-LSSVM及LSSVM,且計算時間也相對較短。
(1) 從系統工程出發,根據海底管道的腐蝕機理,篩選出包括海水溫度、氧溶解量、鹽含量、pH值、氧化還原電位、管道材質、海水流速7個因素作為海底管道腐蝕預測因子,構建了海底管道外腐蝕預測指標體系。
(2) 引入灰狼優化算法對最小二乘支持向量機進行參數尋優,形成GWO-LSSVM預測模型,與傳統最小二乘支持向量機、粒子群優化最小二乘支持向量機相比,GWO-LSSVM預測模型的誤差波動最小,算法穩健性和預測精度更高。