何 躍 蘭永福 樊 星 賈文龍 冷翔宇 吳 暇 黃 軍 韓西成
(1. 中國石油集團西部鉆探工程有限公司井下作業公司儲存改造研究中心,新疆 克拉瑪依 834099;2. 西南石油大學石油與天然氣工程學院,四川 成都 610500;3. 漢正檢測技術有限公司,四川 廣漢 618399)
北美“頁巖氣革命”的成功,給天然氣能源的供給層面帶去了巨大的改變[1],我國以四川盆地埋深3500m內的海相頁巖氣區生產為主的全國頁巖氣生產也在2020年達到了200×108m3的產量[2]。
然而部分頁巖氣站的集輸管道在生產過程中出現了腐蝕穿孔的現象,例如在我國川南頁巖氣開采生產過程中,某單井使用了4×104~5×104m3用量的水平井壓裂液、2.5×103~3.0×103t用量的以石英砂和陶粒為主的支撐劑,這導致了壓裂過程中的返排液會給頁巖氣集輸管線帶來不同程度的沖蝕腐蝕[3,4],并且集輸管道在開采及生產階段還伴隨有運行壓力和流量的快速衰減,根據頁巖氣產量解析模型,頁巖氣生產滿兩年的實際壓力流量平均遞減率為56%[5],其預測年遞減率如圖1所示,這使得沖蝕速率和沖蝕損傷程度也隨時間不斷變化,這些都對頁巖氣集輸管道的長期安全生產產生了巨大威脅,所以建立管道壁厚受沖蝕減薄的動態預測模型對于頁巖氣集輸管道的風險評價及預警具有十分重要的意義,而準確實時的集輸管道沖蝕動態預測模型就顯得尤為重要。

圖1 壓力年遞減率分布
伍麗紅等人[6]用BP神經網絡進行了儲層儲量參數的確定和流體性質的判別,指出了用BP神經網絡做出的快速分析是有意義的。2010年欒瑞鵬等[7]在建立鋼材大氣腐蝕影響因子的評估型時引入了貝葉斯正則化(BR)算法來解決小樣本泛化問題。在2017年,Pandya等[8]將CFD和BP神經網絡相結合,采用了遺傳算法(GA)和貝葉斯正則化(BR)進行優化處理,將對油氣管道彎頭沖蝕速率的預測誤差減小到了10%以下。到了2021年,Zhang Nan等人[9]基于貝葉斯規范化人工神經網絡(BRANN)提出了深水鉆井升井機脆弱性評估方法,證實了其有效性,但缺乏動態預測能力。但是BP神經網絡在沖蝕預測的方面具有容易陷入局部極小值,泛化能力較差,需要提高學習速率和預測精度的缺陷[10],目前少有學者將BP神經網絡與貝葉斯正則化結合起來針對頁巖氣集輸管道的特殊沖蝕情況建立預測模型。
本文將貝葉斯正則化方法與BP神經網絡相結合,基于此建立了針對頁巖氣集輸管道特殊沖蝕情況的動態預測模型,后續能夠直接為頁巖氣集輸管道的監測系統服務,改進神經網絡解決傳統BP神經網絡的泛化推廣能力差的問題,動態預測模型的求解解決了頁巖氣集輸管道的壓力變化問題,應用實例驗證了在管件沖蝕方面的預測精度和有效性。
BP神經網絡(BPNN)是眾多機器深度學習模型中一種常用的人工神經網絡(ANN)預測模型,而ANN是一種被設計出來模仿生物神經系統的結構和功能的運算模型,能夠自我組織、自我學習和自我適應,同時擁有很強的非線性映射能力,現在的學者多用其來解決一些分類問題和非線性問題[11],還可利用其逼近非線性函數的功能應用到預測工作之中。
BPNN便是眾多ANN中最典型的一種神經網絡,其全稱為誤差反向傳播多層前饋神經網絡,現如今應用十分廣泛。激勵信號向前傳遞時產生的計算誤差反向傳播是BPNN最主要的特點,該模型概念是由Rumelhart等學者最先提出的,由三個主要部分組成模型的基本結構,其分別為輸入層、隱含層和輸出層,該模型的計算過程近似一種每層中都包含有許多計算神經元的網絡結構,其神經網絡結構如圖2所示。

圖2 BP神經網絡結構
人工神經網絡模型的基礎是一個個用于計算的“神經元”,神經元是一種計算方式類似生物神經系統響應的拓撲結構。在BP神經網絡的神經元中,其計算過程如圖3所示,輸入層的神經元負責接受所需要的輸入分量Xi(i=1,2,3,···,n)即外部信號,然后通過權值Wi(i=1,2,3,···,n)連接傳遞到隱含層神經元,在加權求和后通過激活函數F處理非線性問題,再傳遞到輸出層進行驗證,得到的誤差反向傳遞回隱含層進行再次學習,其中修正輸出信號Z時會加入閾值λ,整個過程由訓練函數進行調控重復多次,以達到誤差不再下降或者最大迭代次數。

圖3 神經元計算過程
其中激活函數即傳遞函數主要使用logsig函數和tansig函數[12],分別如式(1)、(2)所示:

最常使用的是logsig函數即sigmoid函數,將logsig函數繪制出如圖4所示??煽闯鲈摵瘮祮握{遞增,符合生物學神經元的特點,輸入信號越大,激活后輸出信號越大,該函數的值域為(0,1),其作用就是把定義域(-∞,+∞)映射到(0,1)中,體現了激活函數將大范圍的數限定至0~1的信號中繼續傳遞的能力。

圖4 logsig函數曲線
基于上述的神經元結構及激活函數,傳統BP神經網絡使用了梯度下降法作為學習方法,根據反向傳遞的誤差來調整內部連接的權值和閾值,以完成使誤差盡可能小的目標從而建立預測計算模型。
B R即為貝葉斯正則化(B a y e s i a n regularization)的簡稱,是基于貝葉斯定理發展而來的優化方法,即待求解的量可以通過先驗概率的分布來對其進行描述,待有樣本信息的加入后聯合先驗信息來進行判斷[13],貝葉斯定理的理論計算模型如式(3)所示。

式中:θ為未知的待求量;x為樣本;為后驗信息分布;為先驗信息分布;為未知樣本時的先驗概率即正則項;則為樣本x的邊緣分布,作為對貝葉斯公式進行正則化過程中的歸一化因子,與待求量θ無關。其中后驗信息分布可解釋為由于樣本x的加入對先驗信息分布調整的結果。
在訓練BP網絡模型過程中,BPNN會利用性能函數分析模型輸出的計算誤差來進行自學習,所以BP神經網絡的BR算法核心就是利用正則化訓練函數trainbr對于一般BP神經網絡使用的mse均方誤差性能函數進行修正[14,15]即進行先驗性約束,引入如式(4)所示的函數。

式中:M()ω為進行了先驗約束修正后的性能函數;ED為神經網絡訓練輸出結果的誤差函數;Eω為神經網絡訓練過程中權值ω的誤差函數;α、β均為BR法參數即超參數。
本文采用的trainbr函數其本質是通過對訓練結果與目標的偏差來調整α、β,從而約束權值提升泛化能力,以達到最小化目標函數M()ω,從而來得到自適應的網絡權值參數ω。
貝葉斯定理的引入能夠有效地優化神經網絡模型,有助于解決具有不確定性的非線性問題[16],而正則化的本質是約束要優化的參數,那么貝葉斯正則化其本質就是求解一個問題時,給其求解過程一個先驗性約束或限制。
本文利用傳統BPNN和BR-BP神經網絡同時對一組由50個樣本組成的天然氣管道壁厚檢測數據集進行學習時,在訓練均方誤差低于5并且驗證和測試兩種均方誤差低于10時停止訓練,而其他的參數條件均保持一致,每次訓練人工神經網絡完成時所耗費的時間如圖5所示。

圖5 訓練次數與消耗時間的對比
我們可以發現BR-BP神經網絡的訓練時長低于傳統的BP神經網絡訓練所需要的時間,相對來說BR-BP神經網絡訓練速度更快,這是因為傳統BP神經網絡使用的算法為梯度下降法,初始權值和閾值隨機指定,而所需要擬合的最小化目標函數又往往比較復雜且為非線性的,那么訓練過程必然比較低效[17]。
在進行初次訓練時,傳統BP神經網絡初始化的權值和閾值均隨機指定的,其范圍很大,不同的方法訓練出來的BP神經網絡其性能也各不相同,這導致了網絡的權值或閾值容易收斂到局部的極小點,即BP神經網絡模型的訓練陷入了局部極小化導致誤差太大訓練失敗,所以初始權值和閾值的設定對于最終BP神經網絡的訓練結果有很大影響,BR-BP神經網絡模型正是通過引入貝葉斯正則化的訓練方法,對模型在訓練計算時的初始權值和閾值進行了先驗性約束,使得模型的權值和閾值在初始化后進行反復訓練學習時不容易陷入局部極小值。
在此基礎上再加入10組新樣本作為兩種神經網絡的檢驗集進行預測時,對比分析50次訓練后神經網絡的預測值,計算后所得的模型預測結果相對誤差曲線如圖6所示。

圖6 平均相對誤差曲線
從中可以看出傳統的BP神經網絡的預測相對誤差的降低是一個緩慢過程,容易陷入局部極小值這一特點使得傳統BP神經網絡的誤差曲線有較長的平緩段,而BR-BP神經網絡在訓練時的預測誤差變化非常迅速,并且BR-BP神經網絡的誤差曲線幾乎沒有平緩段,這體現了其泛化能力的優勢。
BP神經網絡的預測能力即泛化能力取決于網絡訓練時的學習能力,但當網絡在訓練過程陷入局部極小值時,其泛化推廣能力反而會大大下降,產生“過擬合”現象,所以傳統BP神經網絡的訓練效果又會對網絡的預測產生影響,為了避免產生“過擬合”,BR-BP神經網絡利用貝葉斯正則化進行約束的方法便顯得尤為重要,其增強了人工神經網絡的泛化能力,從而提升網絡的預測精度。
要利用BR-BP神經網絡建立動態預測模型,則需要建立模型的輸入參量,即壁厚減薄的影響因素。
針對長寧區塊頁巖氣集輸管道具有高壓、高砂量和高液量的工作特點[4],設定了運行時間、最高工作壓力、平均工作壓力、總含砂量、總含液量和施工工藝6個輸入參量;頁巖氣田在不同的井區頁巖氣儲層地質結構和開采深度不同,導致運行壓力、含砂含液量也不盡相同,會進一步影響管道內介質的含砂量含液量,因此設置生產地區為另一個輸入參量。在模型的輸出方面,研究選擇了管件壁厚這個容易在頁巖氣集輸站場監測的數據作為,來作為衡量具體沖蝕情況預測的輸出數值,更符合現場實際,有利于在編程成為預測軟件結合監測系統幫助井區站場進行實時預測、風險分析與報警。
綜上所述,根據相關輸入輸出參量建立了如圖7所示的神經網絡輸入層和輸出層。

圖7 輸入層、輸出層參數設置
使用機器語言對BR-BP神經網絡預測模型進行編程,因為Matlab軟件的神經網絡工具箱在訓練神經網絡時的重復訓練非常麻煩,也無法直觀的觀察到訓練出的神經網絡預測值和相對誤差,所以為了彌補這些缺陷并且完成預測模型的建立,本研究基于Matlab軟件編寫了使用trainbr函數訓練BP神經網絡的程序代碼,該程序可以進行BR-BP神經網絡的自動重復訓練以及自動檢驗預測值,從而實現基于BR-BP神經網絡預測模型建立,其程序流程框圖如圖8所示。

圖8 預測程序流程框圖
該基于BR-BP神經網絡的預測程序運行時,以輸入數據集中80%的數據組為樣本對BP神經網絡模型進行BR法訓練,然后將數據集剩余的20%作為檢驗集,用訓練好的BR-BP神經網絡進行預測,將預測值與實際值相比較,判斷誤差是否達到設定值,若否則返回重新訓練,若是則輸出預測值結束程序。
為了適應頁巖氣集輸管道的沖蝕特點,根據該動態變化的學習訓練過程建立了動態預測模型的計算程序,其流程框圖如圖9所示,該動態預測模型的求解就是BR-BP神經網絡預測模型參數的學習訓練過程,其求解步驟如下:

圖9 動態預測模型求解流程框圖
(1)輸入頁巖氣集輸管道監測數據,由于預測模型需要動態適應沖蝕情況的變化,所以采用現場的頁巖氣集輸管道的監測數據作為神經網絡的訓練集和驗證集,從而完成BR-BP神經網絡的訓練及預測;
(2)判斷是否屬于新監測數據,若是則進入預測計算,然后判斷其預測精度,若滿足要求則輸出預測值結束程序,若不滿足則重復訓練網絡直到預測精度達到設定值再輸出新預測值;若不屬于新監測數據則進行隱含層神經元個數試驗,找到相匹配的個數后重置模型隱含層神經元數量,如今隱含層神經元個數缺乏固定有效的篩選手段[10],所以針對不同的輸入分量的隱含層神經元個數需要進行試驗來選擇最適合的個數;
(3)在隱含層神經元個數選擇完后進入BR-BP神經網絡的訓練過程,每一次訓練完成后通過預測值與實際值的誤差對比來判斷是否需要重復訓練神經網絡模型,在到達設定值之后輸出預測值結束計算。
本文使用Matlab軟件將該BR-BP神經網絡預測模型、傳統BP神經網絡和LM法訓練的BP神經網絡(后文簡稱BR-BPNN、傳統BPNN和LM-BPNN)對于一個由3500組頁巖氣管道監測數據組成的樣本進行學習訓練,并且隱含層神經元個數經過訓練試驗擇優后設定為17個,然后再對一組由30組數據組成的新加入樣本進行管道壁厚的預測,各模型預測的壁厚值結果分別如圖10所示,其相對誤差如表1所示,本文組成樣本的數據集主要取自威202、威204、長寧H24和長寧H25井區的集輸管道監測數據。

表1 壁厚預測值相對誤差

圖10 頁巖氣集輸管道壁厚實際值與預測值
通過對頁巖氣集輸管道壁厚值進行預測的實例驗證可以看出,本文經過改進后的神經網絡預測模型對于頁巖氣集輸管道的沖蝕預測比起傳統方法更加準確,對比預測結果后發現,其預測的相對誤差均有不同程度的減小且最小平均相對誤差為2.69%,而且該預測模型的最大相對誤差更小其最小值為2.96%、最大值為16.40%,更小的預測誤差使得該動態預測模型擁有更加準確可靠的沖蝕預測能力,證明了該模型對于頁巖氣集輸管道沖蝕情況進行動態預測的可行性。
(1)針對容易“過擬合”的常規BP神經網絡模型,用貝葉斯正則化方法來進行BP神經網絡的學習訓練,進而建立進行機器學習的神經網絡預測模型,能夠改善傳統BP神經網絡容易陷入局部極小值的狀況,進一步增強動態預測模型的泛化推廣能力;
(2)針對頁巖氣集輸管道管壁受沖蝕減薄較快和壓力流量的動態變化問題,基于BR-BP神經網絡建立了壁厚動態預測模型,使預測模型能夠根據新的頁巖氣集輸管道監測數據進行動態化學習訓練,從而實現了模型對于頁巖氣集輸管道沖蝕情況的動態預測;
(3)通過實例驗證可以得出,該預測模型的預測相對誤差要明顯小于傳統BP神經網絡和LM法訓練的BP神經網絡,證明該預測模型的精度得到了較大提升,進而使得針對頁巖氣集輸管線的動態預測模型在實時學習訓練時也能得到較為準確的預測值。