李玉春 李治東 李越 孟嵐 姚毅立 孫巍 成慶林 孫海英
1大慶油田設計院有限公司
2東北石油大學
3大慶油田有限責任公司第五采油廠
隨著信息技術的高速發展,工程上獲得數據的難度越來越低、手段越來越多、效率越來越高,從而導致信息數據庫的規模不斷增大,其復雜程度也持續增大,演變成為龐大復雜的信息數據體系[1-3]。因此有必要基于大數據平臺,針對雙管摻水流程建立水力熱力回歸預測模型[4-6]。
目前,很多學者在管道預測方面進行了大量研究。張青松利用人工神經網絡強大的非線性映射能力,建立了人工神經網絡混油黏度預測模型,該方法誤差小,并能夠同時考慮溫度變化等因素的影響[7];高山卜利用BP神經網絡建立輸油管道的能耗預測模型,其預測誤差不超過4.06%,為管輸能耗提供了新的預測方法[8];李建松建立灰色神經網絡預測模型對輸油管道運行費用進行預測,結果表明預測模型精度高,計算量小,收斂速度快[9];林冉用人工神經網絡建立了管道耗能的預測模型,該模型的計算結果相對偏差在±5%以內,滿足工程實際需要,為預測管道的能耗總量提供了便利[10];李樹杉根據大數據思想,基于管道SCADA 系統提供的大量管道運行歷史數據,利用神經網絡構建了管道預測模型,并用其替代傳統的管道數學模型,計算油品的溫度和壓力,求解能耗優化的目標函數,得出優化方案,提高了方案的準確性和實用性[11]。
通過調研發現,采用傳統理論公式計算得到的管道傳熱系數以及水力摩阻系數通常與現場實際情況不符[12-13],因此構建了雙管摻水流程大數據平臺。運用水力熱力基礎運行參數,通過python語言編程,分別建立了BP 神經網絡管線傳熱系數和水力摩阻系數的預測模型,并通過迭代自修正權重和偏置,經過參數的降維處理校正了傳統的計算公式,最終對所得出的預測模型進行了驗證,其滿足實際工程標準,可以用來計算管線的節點參數,為計算管線節點參數奠定了基礎,也為后續的預測管線能耗提供了數據保障。
大數據平臺由三個數據集構成:初始數據集、存儲數據集和應用數據集。雙管摻水流程大數據平臺的特點是數量大、種類多、更新快、季節性明顯。數量大:數據“量的大小”是直接影響所建立預測模型準確程度的主要因素之一,數據越多,預測模型的精度越高;種類多:如管道起點和終點壓力、起點和終點溫度、環境溫度、管線輸量等,通過多個參數得到多元預測模型,并向水力熱力理論公式靠攏,增強了預測模型的理論性;更新快:各基礎參數的采集采用數字化技術,按設定頻次定時采集,不間斷更新;季節性明顯:管線各基礎參數,尤其是熱力參數受季節變化影響較大,由于冬夏氣溫差異較大,管線運行參數的變化也較為明顯。雙管摻水流程大數據平臺的結構與特點如圖1所示。

圖1 大數據平臺結構特點Fig.1 Structural characteristics of big data platform
基于傳統傳熱系數的計算方法,即軸向溫降基本公式,也稱作舒霍夫溫降公式[14],可以看出采出液溫度的變化受土壤環境溫度、管徑、管道長度、流量、采出液比熱容等參數的影響。舒霍夫溫降公式表達式為

式中:T2為管線終點溫度,℃;T0為環境溫度,℃;T1為管線起點溫度,℃;L為管道長度,m;a為參數,無量綱;G為油井產液量,kg/s;C為井口采出液比熱容,J/(kg·℃);D為管道直徑,m;K為管道傳熱系數實際值,W/(m2·℃)。
由上式得出管線傳熱系數的基本公式(3)。

但在現場實際運行過程中,不同管道的傳熱系數還與管道內結蠟厚度、保溫層完整性、管道直徑、土壤溫度等數據相關。因此,僅通過理論公式的計算難以滿足現場的實際應用,需要建立以油田數字系統為基礎的大數據平臺,將難以直接測量的多組固定參數降維處理[15]。對于同一條管道來說,C、π、D、L等參數是固定不變的,因此將這些參數全部融合到新的參數A中,同時,由于擬合管道傳熱系數的目的是計算管道終點的溫度,因此利用參數A、B將模型中的T2隱去,用新的回歸關系式的形式來表示簡化后的熱力模型為

式中:A、B均為待回歸參數,無量綱。
在水力參數方面,主要針對水力摩阻系數進行研究,水力摩阻系數是與起終點壓力、混輸流量、管道外徑和管道長度相關的參數,將混輸水力模型簡化為與起點和終點壓力、流量相關的數學模型,如式(5),得到水力摩阻系數的理論公式,從而對此理論公式進行修正,最后得出實際管線水力摩阻系數的回歸模型。

聯立式(5)與式(6)得

式中:λ為管線水力摩阻系數;L為管道長度,m;D為管道內徑,m;V為混合物平均流速,m/s;p1、p2分別為管線起點和終點壓力,MPa;Q為井口產液量,m3/s;g為重力加速度,m/s2;ρ為井口采出液密度,kg/m3。
同管道傳熱系數,對于同一條管道來說,ρ、π、D、L等參數是固定不變的,因此將這些參數全部融合到新的參數A′中。同時,由于擬合水力摩阻系數的目的是計算管道終點的壓力,因此利用參數A′、B′將模型中的p2隱去,用新的回歸關系式的形式來表示簡化后的水力模型為

式中:A′、B′均為待回歸參數,無量綱。
由于Q的數量級較小,擬合后系數的數量級極小,因此將Q的單位改為m3/h后再進行擬合。
雙管摻水流程水力熱力運行參數的BP 神經網絡模型具體搭建過程如下:
(1)建立大數據平臺。進行收集數據,數據預處理,大數據清洗、分類與儲存等。
(2)數據集劃分。從建立好的大數據庫中提取待預測的數據集,將數據集分為訓練集和測試集。先用訓練集訓練模型,再通過測試集對訓練的模型進行測試,導入訓練集數據,檢驗模型是否合理。
(3)確定隱含層數及神經元數。本項目在以往的BP 神經網絡模型的基礎上進行簡化,建立三層神經網絡模型,設置單隱層,且該隱層僅設置一個神經元,輸入層和輸出層也各含一個神經元。
(4)設置超參數。設置神經網絡進行預測的學習率、迭代的總次數和輸出預測結果的步長。這些超參數決定了預測速度及結果的準確度。
(5)構造損失函數。以訓練集中數據的預測值和實際值的二維歐式距離之和,即總誤差和最小構造損失函數作為神經網絡的訓練模型。
(6)訓練模型。根據初始設置超參數訓練神經網絡模型,通過BP 神經網絡中的誤差反向傳播算法修正權重w和偏置b,直至損失函數達到最小值,認為此時的w和b為該組數據集下最右的權重與偏置。
(7)得到預測模型。根據步驟(6)中預測得到的w和b,建立轉油站系統管線運行水力熱力參數—管線傳熱系數和水力摩阻系數的預測模型。
(8)檢驗模型。導入測試集數據,通過預測的模型計算得出計算值,再與實際值進行比較,檢驗誤差結果是否在設置的運行范圍內。
模型具體搭建過程如圖2所示。

圖2 BP神經網絡模型流程Fig.2 BP neural network model flow
對大慶油田某計量間及其所轄6口采油井運用上述搭建的BP 神經網絡模型,采集超過700 組現場運行數據,訓練管線傳熱系數和水力摩阻系數,計算方程中的權重、偏置等參數。各管線傳熱系數與水力摩阻系數計算模型的訓練結果見表1。

表1 各管線計算模型訓練結果Tab.1 Training results of each pipeline calculation model
經過以上步驟可以得出管線傳熱系數和水力摩阻系數的計算方程。為檢驗計算方程的準確性,通過計算預測值與實際值之間的偏差,從客觀數字的角度上分析預測結果的準確性。引入平均相對誤差概念,平均相對誤差=,根據平均相對誤差的計算值是否在工程允許的范圍內來判斷預測方程的可行性。通過實際值和預測方程得出的計算值來計算該組數據的平均相對誤差,繪制各訓練結果的誤差曲線,來判斷預測方程的準確程度。各管線傳熱系數與水力摩阻系數的相對誤差如表2所示,誤差曲線如圖3與圖4所示。

表2 各管線計算模型相對誤差Tab.2 Relative error of each pipeline calculation model

圖3 傳熱系數誤差曲線Fig.3 Error curve of heat transfer coefficient

圖4 水力摩阻系數誤差曲線Fig.4 Error curve of hydraulic friction coefficient
通過分析管線傳熱系數誤差曲線可以看出,存在一個新參數?=Gln(T1-T0),使得管線傳熱系數隨之變化。6口采油井的管線傳熱系數K*均隨著的?的增大而增大,呈線性關系。管線傳熱系數相對誤差最小的是井4,為2.186%,而相對誤差最大的是井1,為3.344%,均滿足工程計算所需的精度。
通過分析水力摩阻系數誤差曲線可以看出,存在一個新參數σ=,使得水力摩阻系數隨之變化。6口采油井集輸管線的水力摩阻系數λ*均隨著σ的增大而增大,呈線性關系。水力摩阻系數相對誤差最小的是井3,為3.564%,而水力摩阻系數相對誤差最大的是井4,為4.716%,均滿足工程計算所需的精度。
經計算,各集輸管道的管線傳熱系數和水力摩阻系數的平均相對誤差均在工程允許的誤差范圍內,因此認為此BP 神經網絡模型對于管線傳熱系數以及水力摩阻系數計算方程的預測準確性高,回歸后的方程可以用于該計量間集輸管線的實際運行參數計算。
構建了雙管摻水流程大數據平臺,通過python語言編程,建立了BP 神經網絡管線傳熱系數和水力摩阻系數的回歸預測模型,并通過迭代自修正權重和偏置,經過參數的降維處理校正了傳統的計算公式。對所建立的神經網絡模型進行驗證,發現大慶油田某計量間所轄6口井集輸管道的管線傳熱系數和水力摩阻系數的平均相對誤差均小于5%,滿足實際工程計算的精度,因此所建立的模型可以用來計算現場管道實際運行參數,也為各管段的節點計算以及后期的能耗預測分析打下了堅實的數據基礎。