夏欽鋒
(中石化重慶涪陵頁巖氣勘探開發(fā)有限公司,重慶408014)
近年來,隨著我國頁巖氣勘探開發(fā)的快速推進(jìn),我國已經(jīng)成為繼美國和加拿大之后全球第三個(gè)開展頁巖氣商業(yè)開發(fā)的國家[1-2]。目前國內(nèi)外學(xué)者根據(jù)翁氏模型理論基礎(chǔ),結(jié)合多元線性回歸系數(shù)求解法,對(duì)實(shí)際頁巖氣生產(chǎn)井進(jìn)行產(chǎn)能預(yù)測(cè),分析頁巖氣井產(chǎn)量變化規(guī)律[3];謝維楊[4]結(jié)合頁巖氣藏水平井壓裂后產(chǎn)生水力壓裂縫這一情況,建立水力壓裂縫導(dǎo)流的頁巖氣藏水平井后期穩(wěn)定開采的滲流模型;任俊杰等人[5]綜合考慮頁巖氣解吸、擴(kuò)散和滲流特征,建立頁巖氣藏壓裂水平井產(chǎn)能模型。總體而言,目前國內(nèi)外學(xué)者在研究頁巖氣井產(chǎn)能時(shí),一般采用經(jīng)驗(yàn)法、解析法和數(shù)值模擬三種方法來預(yù)測(cè)頁巖氣井生產(chǎn)規(guī)律,可靠性都不高,不能依據(jù)已有的歷史生產(chǎn)數(shù)據(jù)進(jìn)行準(zhǔn)確的壓力預(yù)測(cè)。
在調(diào)產(chǎn)過程中產(chǎn)量發(fā)生變化時(shí),壓力也隨之變化。生產(chǎn)過程中采集的大量數(shù)據(jù)蘊(yùn)含信息豐富,根據(jù)歷史生產(chǎn)數(shù)據(jù)對(duì)氣井的生產(chǎn)壓力進(jìn)行預(yù)測(cè),對(duì)后期持續(xù)開發(fā)和利用有著促進(jìn)作用。然而調(diào)產(chǎn)過程中產(chǎn)量變化梯度多、調(diào)產(chǎn)周期波動(dòng)大、歷史數(shù)據(jù)不平衡、生產(chǎn)數(shù)據(jù)具有強(qiáng)非線性[6]、強(qiáng)耦合等特點(diǎn),導(dǎo)致生產(chǎn)壓力難以預(yù)測(cè)。在調(diào)產(chǎn)井中,壓力的遞減趨勢(shì)隨產(chǎn)量的變化而發(fā)生改變,不能通過一般模型進(jìn)行建模[9-10]。
針對(duì)上述問題,本文采用FCM 方法對(duì)調(diào)產(chǎn)井生產(chǎn)數(shù)據(jù)進(jìn)行自適應(yīng)聚類,保證數(shù)據(jù)的準(zhǔn)確性;再運(yùn)用Kendall 秩相關(guān)系數(shù)分析法對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行相關(guān)性分析,以確定用于遞歸神經(jīng)網(wǎng)絡(luò)建模的輸入變量;最后分別對(duì)每一類數(shù)據(jù)進(jìn)行建模,形成多模型庫。在壓力預(yù)測(cè)時(shí),輸入需要預(yù)測(cè)的產(chǎn)量以及歷史數(shù)據(jù),系統(tǒng)將自動(dòng)識(shí)別并調(diào)用其對(duì)應(yīng)的模型進(jìn)行壓力預(yù)測(cè),實(shí)現(xiàn)不同產(chǎn)量下的壓力預(yù)測(cè)。
通過對(duì)原始生產(chǎn)數(shù)據(jù)進(jìn)行相關(guān)性分析,找出數(shù)據(jù)之間的隱藏特性,從而挖掘出有用的數(shù)據(jù)進(jìn)行進(jìn)一步分析。其主要相互影響的參數(shù)有:產(chǎn)量、壓力、水。進(jìn)行相關(guān)性分析主要分為以下兩個(gè)部分:
(1)評(píng)價(jià)數(shù)據(jù)質(zhì)量的可靠性,包含產(chǎn)量、壓力、水等重要指標(biāo)。
(2)數(shù)據(jù)相關(guān)性檢驗(yàn)。依據(jù)典型氣井的生產(chǎn)數(shù)據(jù)分析可知,壓力、產(chǎn)量、水之間有較強(qiáng)的相關(guān)性,通過提取幾組生產(chǎn)數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),其中包括產(chǎn)量-壓力、產(chǎn)量-時(shí)間和壓力-時(shí)間。

圖1 壓力預(yù)測(cè)流程圖
使用Spearman 相關(guān)性分析對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行分析[11],它是利用數(shù)據(jù)的秩進(jìn)行計(jì)算,適用于有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù),關(guān)聯(lián)值范圍在[-1,1],絕對(duì)是越大,表明相關(guān)性越強(qiáng)。先對(duì)原始變量的數(shù)據(jù)排秩,根據(jù)秩使用Spearman 相關(guān)系數(shù)公式進(jìn)行計(jì)算,相關(guān)系數(shù)符號(hào)表示相關(guān)方向。其計(jì)算公式為:

式中,αi是第i 個(gè)x 值的秩,βi是第i 個(gè)y 值的秩。αˉ、βˉ分別是αi和βi的平均值。
選取涪陵焦石壩區(qū)塊的以下典型井生產(chǎn)數(shù)據(jù),通過上面方法進(jìn)行數(shù)據(jù)相關(guān)性,其原始生產(chǎn)數(shù)據(jù)如圖2、圖3 所示。

圖2 焦頁24-1HF數(shù)據(jù)圖

圖3 焦頁37-3HF數(shù)據(jù)圖

表1 焦頁24-1HF 相關(guān)性分析結(jié)果

表2 焦頁37-3HF 相關(guān)性分析結(jié)果
根據(jù)圖2、3 和表1、2 可以說明產(chǎn)水量明顯變化時(shí),壓力也發(fā)生變化,壓力變化與產(chǎn)水量之間有著良好的負(fù)相關(guān)。該氣井水主要由產(chǎn)氣攜液得到,其水量與得到的氣體是有正相關(guān)性,說明產(chǎn)氣越豐富,得到的水就越多。由于地層存儲(chǔ)豐富,所以產(chǎn)氣量較為豐富,得到的水量也較為充足,從而致使壓力遞減速度比較慢。
模糊C 均值聚類算法(FCM)是用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法。FCM 把n 個(gè)向量xi(i=1,2,…,n)分為c 個(gè)模糊組,并求每組的聚類中心,使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。FCM 用模糊劃分,使得每個(gè)給定數(shù)據(jù)點(diǎn)用值在[ ]0,1間的隸屬度來確定其屬于各個(gè)組的程度。與引入模糊劃分相適應(yīng),隸屬矩陣U 允許有取值在[ ]0,1 間的元素。不過,規(guī)定一個(gè)數(shù)據(jù)集的隸屬度的和總等于1。

那么,F(xiàn)CM 的價(jià)值函數(shù)(或目標(biāo)函數(shù))就是:

這里uij介于[0 ,1] 之間;ci為模糊組I 的聚類中心,dij=‖ ci-xj‖為第i 個(gè)聚類中心與第j 個(gè)數(shù)據(jù)點(diǎn)間的歐幾里德距離,且m ∈[1,∞)是一個(gè)加權(quán)指數(shù)。
構(gòu)造如下新的目標(biāo)函數(shù),使公式(2)達(dá)到最小值的必要條件:

這里λj( j= 1,…,n )是公式(2)的n 個(gè)約束式的拉格朗日乘子,對(duì)所有輸入?yún)⒘壳髮?dǎo),使公式(3)達(dá)到最小的必要條件為:

和:

由上述兩個(gè)必要條件,F(xiàn)CM 算法是一個(gè)簡單的迭代過程。在批處理方式運(yùn)行時(shí),F(xiàn)CM 用下列步驟確定聚類中心ci和隸屬矩陣U:
步驟1:用值在[0 ,1] 間的隨機(jī)數(shù)初始化隸屬矩陣U,使其滿足公式(2)中的約束條件;
步 驟 2:用 公 式(5)計(jì) 算 c 個(gè) 聚 類 中心ci(i=1,2,…,c);
步驟3:根據(jù)公式(3)計(jì)算價(jià)值函數(shù)。如果它小于某個(gè)確定的閾值,或它相對(duì)上次價(jià)值,函數(shù)值的改變量小于某個(gè)閾值,則算法停止;
步驟4:用公式(6)計(jì)算新的U 矩陣。返回步驟2。
通過FCM 算法對(duì)原始數(shù)據(jù)進(jìn)行聚類分析,然后把原始數(shù)據(jù)分為我們想要的幾種情況,具體結(jié)果如圖4、圖5 所示,首先根據(jù)每口調(diào)產(chǎn)井產(chǎn)量類型大致設(shè)置需要分類的數(shù)量。

圖4 焦頁24-1HF分類結(jié)果圖(設(shè)置為3類)

圖5 焦頁37-3HF分類結(jié)果圖(設(shè)置為4類)
通過圖4 可以看出,把焦頁24-1HF 井中的產(chǎn)量分為三類,能夠良好地顯示出產(chǎn)量的梯度,從而更好地進(jìn)行預(yù)測(cè)分析。圖5 中焦頁24-1HF 井的數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜,把它分為三類,能夠良好地分出其梯度。
根據(jù)不同的劃分標(biāo)準(zhǔn),神經(jīng)網(wǎng)絡(luò)可劃分成不同的種類。按連接方式來分主要有兩種:前向神經(jīng)網(wǎng)絡(luò)和反饋(遞歸)神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)以其自身的自組織、自適應(yīng)和自學(xué)習(xí)的特點(diǎn),被廣泛應(yīng)用于各個(gè)領(lǐng)域,在控制領(lǐng)域?qū)Ψ蔷€性系統(tǒng)的建模與控制的應(yīng)用也發(fā)揮越來大的作用。不過一般采用的前向網(wǎng)絡(luò)所建立的輸入/輸出之間的關(guān)系式往往是靜態(tài)的,而實(shí)際應(yīng)用中的被控對(duì)象通常都是時(shí)變的。因此采用靜態(tài)神經(jīng)網(wǎng)絡(luò)建模就不能準(zhǔn)確地描述系統(tǒng)的動(dòng)態(tài)性能[7]。而Elman 神經(jīng)網(wǎng)絡(luò)不僅可以反映系統(tǒng)動(dòng)態(tài)特性而且可以存儲(chǔ)信息。網(wǎng)絡(luò)中存在信息的延時(shí),并且具有延時(shí)信息的反饋。遞歸網(wǎng)絡(luò)存儲(chǔ)信息的特性來源于網(wǎng)絡(luò)信號(hào)的反饋,信號(hào)遞歸使得網(wǎng)絡(luò)在某時(shí)刻k 的出入狀態(tài)不僅與k時(shí)刻的輸入狀態(tài)有關(guān),而且還與k 時(shí)刻以前的信號(hào)有關(guān),這充分的表現(xiàn)了網(wǎng)絡(luò)系統(tǒng)的動(dòng)態(tài)性能,非常適用于具有時(shí)序性的頁巖氣生產(chǎn)數(shù)據(jù)的建模與預(yù)測(cè)[8]。其各層關(guān)系式為:
輸入層:

隱含層:

關(guān)聯(lián)層:

輸出層:

最終采用Elman 神經(jīng)網(wǎng)絡(luò)多模型建模,考慮到每口頁巖氣井整體都有一個(gè)下降趨勢(shì),針對(duì)這種情況我們不僅對(duì)分類結(jié)果分別建立模型,還把所有歷史數(shù)據(jù)也建立了模型,并且將建模結(jié)果保存在數(shù)組中,以便后期預(yù)測(cè)使用,如圖6 所示。

圖6 神經(jīng)網(wǎng)絡(luò)建立模型(37-3HF分為4和5類)
其中,Net 表示整體數(shù)據(jù)建立的模型,net 中有4個(gè)神經(jīng)網(wǎng)絡(luò)模型,分別對(duì)應(yīng)于產(chǎn)量不同的分類結(jié)果建立的模型,最后根據(jù)需要預(yù)測(cè)的產(chǎn)量自動(dòng)調(diào)用模型進(jìn)行預(yù)測(cè)。
設(shè)置需要預(yù)測(cè)的產(chǎn)量,以及輸入當(dāng)前產(chǎn)量下對(duì)應(yīng)壓力的歷史數(shù)據(jù),通過識(shí)別需要預(yù)測(cè)的產(chǎn)量,對(duì)應(yīng)找到最符合設(shè)置的產(chǎn)量的模型,調(diào)用模型進(jìn)行預(yù)測(cè)。首先設(shè)置自行選擇預(yù)測(cè)天數(shù)功能,操作人員可根據(jù)實(shí)際情況選擇需要預(yù)測(cè)的天數(shù),并且填入哪種產(chǎn)量下的壓力預(yù)測(cè),導(dǎo)入幾天歷史數(shù)據(jù)方可預(yù)測(cè)。在建模時(shí)以及預(yù)測(cè)時(shí),不僅考慮了氣井壓力整體下降趨勢(shì)(對(duì)整體建立模型,將預(yù)測(cè)結(jié)果作為局部模型的輸入)以及各生產(chǎn)因素之間的相互影響,而且充分考慮當(dāng)天生產(chǎn)壓力與歷史生產(chǎn)壓力的關(guān)系(歷史4 天預(yù)測(cè)第五天)。當(dāng)輸入產(chǎn)量為100000 時(shí)(37-3HF),需要預(yù)測(cè)的天數(shù)設(shè)置為5,分類數(shù)設(shè)置為5 時(shí),選取為經(jīng)過訓(xùn)練的歷史真實(shí)數(shù)據(jù)如表3。

表3 37-3HF 真實(shí)值與預(yù)測(cè)值對(duì)比表
從表3 可以看出,采用Spearman 相關(guān)性分析對(duì)歷史數(shù)據(jù)之間進(jìn)行相關(guān)性分析后,在運(yùn)用FCM 算法分類得到的幾類歷史數(shù)據(jù),分別建立Elman 模型,針對(duì)不同產(chǎn)量下,預(yù)測(cè)得到的值非常接近真實(shí)值,有良好的預(yù)測(cè)結(jié)果,可供工作人員在后續(xù)調(diào)產(chǎn)中提供可靠的依據(jù)。
從圖7 可以看出,調(diào)產(chǎn)井37-3HF 在不同類別和不同產(chǎn)量的情況下,采用Elman 神經(jīng)網(wǎng)絡(luò)針對(duì)每一類的局部模型進(jìn)行預(yù)測(cè)時(shí),通過對(duì)預(yù)測(cè)輸出值與當(dāng)天真實(shí)數(shù)據(jù)對(duì)比可以看出,預(yù)測(cè)精度可以達(dá)到預(yù)期效果。而BP 神經(jīng)網(wǎng)絡(luò)不能通過擬合歷史數(shù)據(jù)得到良好的模型進(jìn)行預(yù)測(cè),誤差較大,僅適用于定產(chǎn)井的預(yù)測(cè)。
當(dāng)輸入產(chǎn)量為100000 時(shí)(24-1HF),需要預(yù)測(cè)的天數(shù)設(shè)置為5,分類數(shù)設(shè)置為3 時(shí),選取為經(jīng)過訓(xùn)練的歷史真實(shí)數(shù)據(jù)如表4。

表4 24-1HF 真實(shí)值與預(yù)測(cè)值對(duì)比表

圖7 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果及誤差(37-3HF)

圖8 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果及誤差(24-1HF)
從表4 可以看出,采用Spearman 相關(guān)性分析對(duì)歷史數(shù)據(jù)之間進(jìn)行相關(guān)性分析后,在運(yùn)用FCM 算法分類得到的幾類歷史數(shù)據(jù),分別建立Elman 模型,針對(duì)不同產(chǎn)量下,預(yù)測(cè)得到的值非常接近真實(shí)值,有良好的預(yù)測(cè)結(jié)果,可供工作人員在后續(xù)調(diào)產(chǎn)中提供可靠的依據(jù)。
從圖8 可以看出,調(diào)產(chǎn)井24-1HF 在不同分類、產(chǎn)量的情況下,利用Elman 神經(jīng)網(wǎng)絡(luò)每一類的局部模型進(jìn)行預(yù)測(cè)時(shí),通過對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出與實(shí)際數(shù)據(jù)對(duì)比可以看出,預(yù)測(cè)精度可以達(dá)到預(yù)期的效果。而BP 神經(jīng)網(wǎng)絡(luò)不能通過擬合歷史數(shù)據(jù)得到良好的模型進(jìn)行預(yù)測(cè),誤差較大,僅適用于定產(chǎn)井的預(yù)測(cè)。
本文提出了一種適用于頁巖氣調(diào)產(chǎn)井生產(chǎn)數(shù)據(jù)預(yù)處理的方法,通過FCM 算法把不同產(chǎn)量進(jìn)行了分類,消除了異常數(shù)據(jù)對(duì)Elman 神經(jīng)網(wǎng)絡(luò)建模的影響;從而構(gòu)造良好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),與傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)相比,提高了預(yù)測(cè)精度;但在網(wǎng)絡(luò)收斂速度上仍有改進(jìn)空間。
本文方法適用于涪陵焦石壩頁巖氣調(diào)產(chǎn)井,在模型精度優(yōu)化上,還需要對(duì)神經(jīng)網(wǎng)絡(luò)建模做進(jìn)一步改進(jìn),仍需要考慮到頁巖氣生產(chǎn)壓力受多種因素影響,開發(fā)實(shí)踐中,需要充分考慮產(chǎn)量、水、油壓、套壓等各方面的影響,同時(shí)盡量保證數(shù)據(jù)的準(zhǔn)確性與真實(shí)性,這樣方可建立相對(duì)準(zhǔn)確的生產(chǎn)壓力模型,以提高評(píng)價(jià)精度。