涪陵焦石壩頁巖氣井調(diào)產(chǎn)分析及預(yù)測(cè)

2019-10-15 07:17:40夏欽鋒

現(xiàn)代計(jì)算機(jī) 2019年24期

夏欽鋒

（中石化重慶涪陵頁巖氣勘探開發(fā)有限公司，重慶408014）

0 引言

近年來，隨著我國頁巖氣勘探開發(fā)的快速推進(jìn)，我國已經(jīng)成為繼美國和加拿大之后全球第三個(gè)開展頁巖氣商業(yè)開發(fā)的國家[1-2]。目前國內(nèi)外學(xué)者根據(jù)翁氏模型理論基礎(chǔ)，結(jié)合多元線性回歸系數(shù)求解法，對(duì)實(shí)際頁巖氣生產(chǎn)井進(jìn)行產(chǎn)能預(yù)測(cè)，分析頁巖氣井產(chǎn)量變化規(guī)律［3］；謝維楊[4]結(jié)合頁巖氣藏水平井壓裂后產(chǎn)生水力壓裂縫這一情況，建立水力壓裂縫導(dǎo)流的頁巖氣藏水平井后期穩(wěn)定開采的滲流模型；任俊杰等人［5］綜合考慮頁巖氣解吸、擴(kuò)散和滲流特征，建立頁巖氣藏壓裂水平井產(chǎn)能模型。總體而言，目前國內(nèi)外學(xué)者在研究頁巖氣井產(chǎn)能時(shí)，一般采用經(jīng)驗(yàn)法、解析法和數(shù)值模擬三種方法來預(yù)測(cè)頁巖氣井生產(chǎn)規(guī)律，可靠性都不高，不能依據(jù)已有的歷史生產(chǎn)數(shù)據(jù)進(jìn)行準(zhǔn)確的壓力預(yù)測(cè)。

在調(diào)產(chǎn)過程中產(chǎn)量發(fā)生變化時(shí)，壓力也隨之變化。生產(chǎn)過程中采集的大量數(shù)據(jù)蘊(yùn)含信息豐富，根據(jù)歷史生產(chǎn)數(shù)據(jù)對(duì)氣井的生產(chǎn)壓力進(jìn)行預(yù)測(cè)，對(duì)后期持續(xù)開發(fā)和利用有著促進(jìn)作用。然而調(diào)產(chǎn)過程中產(chǎn)量變化梯度多、調(diào)產(chǎn)周期波動(dòng)大、歷史數(shù)據(jù)不平衡、生產(chǎn)數(shù)據(jù)具有強(qiáng)非線性[6]、強(qiáng)耦合等特點(diǎn)，導(dǎo)致生產(chǎn)壓力難以預(yù)測(cè)。在調(diào)產(chǎn)井中，壓力的遞減趨勢(shì)隨產(chǎn)量的變化而發(fā)生改變，不能通過一般模型進(jìn)行建模[9-10]。

針對(duì)上述問題，本文采用FCM 方法對(duì)調(diào)產(chǎn)井生產(chǎn)數(shù)據(jù)進(jìn)行自適應(yīng)聚類，保證數(shù)據(jù)的準(zhǔn)確性；再運(yùn)用Kendall 秩相關(guān)系數(shù)分析法對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行相關(guān)性分析，以確定用于遞歸神經(jīng)網(wǎng)絡(luò)建模的輸入變量；最后分別對(duì)每一類數(shù)據(jù)進(jìn)行建模，形成多模型庫。在壓力預(yù)測(cè)時(shí)，輸入需要預(yù)測(cè)的產(chǎn)量以及歷史數(shù)據(jù)，系統(tǒng)將自動(dòng)識(shí)別并調(diào)用其對(duì)應(yīng)的模型進(jìn)行壓力預(yù)測(cè)，實(shí)現(xiàn)不同產(chǎn)量下的壓力預(yù)測(cè)。

1 相關(guān)性分析

通過對(duì)原始生產(chǎn)數(shù)據(jù)進(jìn)行相關(guān)性分析，找出數(shù)據(jù)之間的隱藏特性，從而挖掘出有用的數(shù)據(jù)進(jìn)行進(jìn)一步分析。其主要相互影響的參數(shù)有：產(chǎn)量、壓力、水。進(jìn)行相關(guān)性分析主要分為以下兩個(gè)部分：

（1）評(píng)價(jià)數(shù)據(jù)質(zhì)量的可靠性，包含產(chǎn)量、壓力、水等重要指標(biāo)。

（2）數(shù)據(jù)相關(guān)性檢驗(yàn)。依據(jù)典型氣井的生產(chǎn)數(shù)據(jù)分析可知，壓力、產(chǎn)量、水之間有較強(qiáng)的相關(guān)性，通過提取幾組生產(chǎn)數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn)，其中包括產(chǎn)量-壓力、產(chǎn)量-時(shí)間和壓力-時(shí)間。

圖1 壓力預(yù)測(cè)流程圖

使用Spearman 相關(guān)性分析對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行分析[11]，它是利用數(shù)據(jù)的秩進(jìn)行計(jì)算，適用于有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)，關(guān)聯(lián)值范圍在[-1，1]，絕對(duì)是越大，表明相關(guān)性越強(qiáng)。先對(duì)原始變量的數(shù)據(jù)排秩，根據(jù)秩使用Spearman 相關(guān)系數(shù)公式進(jìn)行計(jì)算，相關(guān)系數(shù)符號(hào)表示相關(guān)方向。其計(jì)算公式為：

式中，αi是第i 個(gè)x 值的秩，βi是第i 個(gè)y 值的秩。αˉ、βˉ分別是αi和βi的平均值。

選取涪陵焦石壩區(qū)塊的以下典型井生產(chǎn)數(shù)據(jù)，通過上面方法進(jìn)行數(shù)據(jù)相關(guān)性，其原始生產(chǎn)數(shù)據(jù)如圖2、圖3 所示。

圖2 焦頁24-1HF數(shù)據(jù)圖

圖3 焦頁37-3HF數(shù)據(jù)圖

表1 焦頁24-1HF 相關(guān)性分析結(jié)果

表2 焦頁37-3HF 相關(guān)性分析結(jié)果

根據(jù)圖2、3 和表1、2 可以說明產(chǎn)水量明顯變化時(shí)，壓力也發(fā)生變化，壓力變化與產(chǎn)水量之間有著良好的負(fù)相關(guān)。該氣井水主要由產(chǎn)氣攜液得到，其水量與得到的氣體是有正相關(guān)性，說明產(chǎn)氣越豐富，得到的水就越多。由于地層存儲(chǔ)豐富，所以產(chǎn)氣量較為豐富，得到的水量也較為充足，從而致使壓力遞減速度比較慢。

2 模糊C均值聚類算法

模糊C 均值聚類算法（FCM）是用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法。FCM 把n 個(gè)向量xi（i=1,2,…,n）分為c 個(gè)模糊組，并求每組的聚類中心，使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。FCM 用模糊劃分，使得每個(gè)給定數(shù)據(jù)點(diǎn)用值在[ ]0，1間的隸屬度來確定其屬于各個(gè)組的程度。與引入模糊劃分相適應(yīng)，隸屬矩陣U 允許有取值在[ ]0，1 間的元素。不過，規(guī)定一個(gè)數(shù)據(jù)集的隸屬度的和總等于1。

那么，F(xiàn)CM 的價(jià)值函數(shù)（或目標(biāo)函數(shù)）就是：

這里uij介于[0 ，1] 之間；ci為模糊組I 的聚類中心，dij=‖ ci-xj‖為第i 個(gè)聚類中心與第j 個(gè)數(shù)據(jù)點(diǎn)間的歐幾里德距離，且m ∈[1,∞)是一個(gè)加權(quán)指數(shù)。

構(gòu)造如下新的目標(biāo)函數(shù)，使公式（2）達(dá)到最小值的必要條件：

這里λj( j= 1,…,n )是公式（2）的n 個(gè)約束式的拉格朗日乘子，對(duì)所有輸入?yún)⒘壳髮?dǎo)，使公式（3）達(dá)到最小的必要條件為：

和：

由上述兩個(gè)必要條件，F(xiàn)CM 算法是一個(gè)簡單的迭代過程。在批處理方式運(yùn)行時(shí)，F(xiàn)CM 用下列步驟確定聚類中心ci和隸屬矩陣U：

步驟1：用值在[0 ，1] 間的隨機(jī)數(shù)初始化隸屬矩陣U，使其滿足公式（2）中的約束條件；

步驟 2：用公式（5）計(jì) 算 c 個(gè) 聚類中心ci（i=1,2,…,c）；

步驟3：根據(jù)公式（3）計(jì)算價(jià)值函數(shù)。如果它小于某個(gè)確定的閾值，或它相對(duì)上次價(jià)值，函數(shù)值的改變量小于某個(gè)閾值，則算法停止；

步驟4：用公式（6）計(jì)算新的U 矩陣。返回步驟2。

通過FCM 算法對(duì)原始數(shù)據(jù)進(jìn)行聚類分析，然后把原始數(shù)據(jù)分為我們想要的幾種情況，具體結(jié)果如圖4、圖5 所示，首先根據(jù)每口調(diào)產(chǎn)井產(chǎn)量類型大致設(shè)置需要分類的數(shù)量。

圖4 焦頁24-1HF分類結(jié)果圖（設(shè)置為3類）

圖5 焦頁37-3HF分類結(jié)果圖（設(shè)置為4類）

通過圖4 可以看出，把焦頁24-1HF 井中的產(chǎn)量分為三類，能夠良好地顯示出產(chǎn)量的梯度，從而更好地進(jìn)行預(yù)測(cè)分析。圖5 中焦頁24-1HF 井的數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜，把它分為三類，能夠良好地分出其梯度。

3 Elman神經(jīng)網(wǎng)絡(luò)多模型建模以及預(yù)測(cè)

根據(jù)不同的劃分標(biāo)準(zhǔn)，神經(jīng)網(wǎng)絡(luò)可劃分成不同的種類。按連接方式來分主要有兩種：前向神經(jīng)網(wǎng)絡(luò)和反饋（遞歸）神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)以其自身的自組織、自適應(yīng)和自學(xué)習(xí)的特點(diǎn)，被廣泛應(yīng)用于各個(gè)領(lǐng)域，在控制領(lǐng)域?qū)Ψ蔷€性系統(tǒng)的建模與控制的應(yīng)用也發(fā)揮越來大的作用。不過一般采用的前向網(wǎng)絡(luò)所建立的輸入/輸出之間的關(guān)系式往往是靜態(tài)的，而實(shí)際應(yīng)用中的被控對(duì)象通常都是時(shí)變的。因此采用靜態(tài)神經(jīng)網(wǎng)絡(luò)建模就不能準(zhǔn)確地描述系統(tǒng)的動(dòng)態(tài)性能[7]。而Elman 神經(jīng)網(wǎng)絡(luò)不僅可以反映系統(tǒng)動(dòng)態(tài)特性而且可以存儲(chǔ)信息。網(wǎng)絡(luò)中存在信息的延時(shí)，并且具有延時(shí)信息的反饋。遞歸網(wǎng)絡(luò)存儲(chǔ)信息的特性來源于網(wǎng)絡(luò)信號(hào)的反饋，信號(hào)遞歸使得網(wǎng)絡(luò)在某時(shí)刻k 的出入狀態(tài)不僅與k時(shí)刻的輸入狀態(tài)有關(guān)，而且還與k 時(shí)刻以前的信號(hào)有關(guān)，這充分的表現(xiàn)了網(wǎng)絡(luò)系統(tǒng)的動(dòng)態(tài)性能，非常適用于具有時(shí)序性的頁巖氣生產(chǎn)數(shù)據(jù)的建模與預(yù)測(cè)[8]。其各層關(guān)系式為：

輸入層：

隱含層：

關(guān)聯(lián)層：

輸出層：

最終采用Elman 神經(jīng)網(wǎng)絡(luò)多模型建模，考慮到每口頁巖氣井整體都有一個(gè)下降趨勢(shì)，針對(duì)這種情況我們不僅對(duì)分類結(jié)果分別建立模型，還把所有歷史數(shù)據(jù)也建立了模型，并且將建模結(jié)果保存在數(shù)組中，以便后期預(yù)測(cè)使用，如圖6 所示。

圖6 神經(jīng)網(wǎng)絡(luò)建立模型（37-3HF分為4和5類）

其中，Net 表示整體數(shù)據(jù)建立的模型，net 中有4個(gè)神經(jīng)網(wǎng)絡(luò)模型，分別對(duì)應(yīng)于產(chǎn)量不同的分類結(jié)果建立的模型，最后根據(jù)需要預(yù)測(cè)的產(chǎn)量自動(dòng)調(diào)用模型進(jìn)行預(yù)測(cè)。

4 實(shí)驗(yàn)研究

設(shè)置需要預(yù)測(cè)的產(chǎn)量，以及輸入當(dāng)前產(chǎn)量下對(duì)應(yīng)壓力的歷史數(shù)據(jù)，通過識(shí)別需要預(yù)測(cè)的產(chǎn)量，對(duì)應(yīng)找到最符合設(shè)置的產(chǎn)量的模型，調(diào)用模型進(jìn)行預(yù)測(cè)。首先設(shè)置自行選擇預(yù)測(cè)天數(shù)功能，操作人員可根據(jù)實(shí)際情況選擇需要預(yù)測(cè)的天數(shù)，并且填入哪種產(chǎn)量下的壓力預(yù)測(cè)，導(dǎo)入幾天歷史數(shù)據(jù)方可預(yù)測(cè)。在建模時(shí)以及預(yù)測(cè)時(shí)，不僅考慮了氣井壓力整體下降趨勢(shì)（對(duì)整體建立模型，將預(yù)測(cè)結(jié)果作為局部模型的輸入）以及各生產(chǎn)因素之間的相互影響，而且充分考慮當(dāng)天生產(chǎn)壓力與歷史生產(chǎn)壓力的關(guān)系（歷史4 天預(yù)測(cè)第五天）。當(dāng)輸入產(chǎn)量為100000 時(shí)（37-3HF），需要預(yù)測(cè)的天數(shù)設(shè)置為5，分類數(shù)設(shè)置為5 時(shí)，選取為經(jīng)過訓(xùn)練的歷史真實(shí)數(shù)據(jù)如表3。

表3 37-3HF 真實(shí)值與預(yù)測(cè)值對(duì)比表

從表3 可以看出，采用Spearman 相關(guān)性分析對(duì)歷史數(shù)據(jù)之間進(jìn)行相關(guān)性分析后，在運(yùn)用FCM 算法分類得到的幾類歷史數(shù)據(jù)，分別建立Elman 模型，針對(duì)不同產(chǎn)量下，預(yù)測(cè)得到的值非常接近真實(shí)值，有良好的預(yù)測(cè)結(jié)果，可供工作人員在后續(xù)調(diào)產(chǎn)中提供可靠的依據(jù)。

從圖7 可以看出，調(diào)產(chǎn)井37-3HF 在不同類別和不同產(chǎn)量的情況下，采用Elman 神經(jīng)網(wǎng)絡(luò)針對(duì)每一類的局部模型進(jìn)行預(yù)測(cè)時(shí)，通過對(duì)預(yù)測(cè)輸出值與當(dāng)天真實(shí)數(shù)據(jù)對(duì)比可以看出，預(yù)測(cè)精度可以達(dá)到預(yù)期效果。而BP 神經(jīng)網(wǎng)絡(luò)不能通過擬合歷史數(shù)據(jù)得到良好的模型進(jìn)行預(yù)測(cè)，誤差較大，僅適用于定產(chǎn)井的預(yù)測(cè)。

當(dāng)輸入產(chǎn)量為100000 時(shí)（24-1HF），需要預(yù)測(cè)的天數(shù)設(shè)置為5，分類數(shù)設(shè)置為3 時(shí)，選取為經(jīng)過訓(xùn)練的歷史真實(shí)數(shù)據(jù)如表4。

表4 24-1HF 真實(shí)值與預(yù)測(cè)值對(duì)比表

圖7 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果及誤差（37-3HF）

圖8 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果及誤差（24-1HF）

從表4 可以看出，采用Spearman 相關(guān)性分析對(duì)歷史數(shù)據(jù)之間進(jìn)行相關(guān)性分析后，在運(yùn)用FCM 算法分類得到的幾類歷史數(shù)據(jù)，分別建立Elman 模型，針對(duì)不同產(chǎn)量下，預(yù)測(cè)得到的值非常接近真實(shí)值，有良好的預(yù)測(cè)結(jié)果，可供工作人員在后續(xù)調(diào)產(chǎn)中提供可靠的依據(jù)。

從圖8 可以看出，調(diào)產(chǎn)井24-1HF 在不同分類、產(chǎn)量的情況下，利用Elman 神經(jīng)網(wǎng)絡(luò)每一類的局部模型進(jìn)行預(yù)測(cè)時(shí)，通過對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出與實(shí)際數(shù)據(jù)對(duì)比可以看出，預(yù)測(cè)精度可以達(dá)到預(yù)期的效果。而BP 神經(jīng)網(wǎng)絡(luò)不能通過擬合歷史數(shù)據(jù)得到良好的模型進(jìn)行預(yù)測(cè)，誤差較大，僅適用于定產(chǎn)井的預(yù)測(cè)。

5 結(jié)語

本文提出了一種適用于頁巖氣調(diào)產(chǎn)井生產(chǎn)數(shù)據(jù)預(yù)處理的方法，通過FCM 算法把不同產(chǎn)量進(jìn)行了分類，消除了異常數(shù)據(jù)對(duì)Elman 神經(jīng)網(wǎng)絡(luò)建模的影響；從而構(gòu)造良好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)，與傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)相比，提高了預(yù)測(cè)精度；但在網(wǎng)絡(luò)收斂速度上仍有改進(jìn)空間。

本文方法適用于涪陵焦石壩頁巖氣調(diào)產(chǎn)井，在模型精度優(yōu)化上，還需要對(duì)神經(jīng)網(wǎng)絡(luò)建模做進(jìn)一步改進(jìn)，仍需要考慮到頁巖氣生產(chǎn)壓力受多種因素影響，開發(fā)實(shí)踐中，需要充分考慮產(chǎn)量、水、油壓、套壓等各方面的影響，同時(shí)盡量保證數(shù)據(jù)的準(zhǔn)確性與真實(shí)性，這樣方可建立相對(duì)準(zhǔn)確的生產(chǎn)壓力模型，以提高評(píng)價(jià)精度。