馬文禮,李治平,孫玉平,張靜平,鄧思哲
(1.中國(guó)地質(zhì)大學(xué)(北京),北京 100083;2.非常規(guī)天然氣能源地質(zhì)評(píng)價(jià)與開發(fā)工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100083;3.中國(guó)石油勘探開發(fā)研究院,河北 廊坊 065007;4. 中國(guó)華騰工業(yè)有限公司,北京 100080)
頁(yè)巖氣的高效開發(fā)對(duì)優(yōu)化中國(guó)能源結(jié)構(gòu)、保障中國(guó)能源安全意義重大[1-3]。頁(yè)巖氣井鉆前產(chǎn)能預(yù)測(cè)是頁(yè)巖氣開發(fā)方案制訂與優(yōu)化的重要環(huán)節(jié),可為頁(yè)巖氣開發(fā)投資風(fēng)險(xiǎn)的評(píng)估提供依據(jù)。由于頁(yè)巖氣開發(fā)受很多不確定性因素影響,使得目前在頁(yè)巖氣的實(shí)際生產(chǎn)中,確定性的產(chǎn)能預(yù)測(cè)方法可靠性差[4-10]。考慮頁(yè)巖氣開發(fā)的不確定性,開展頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)方法研究,是解決上述問題的有效途徑。然而,現(xiàn)有的頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)方法僅適用于投產(chǎn)后的頁(yè)巖氣井[11-15],缺少適用于頁(yè)巖氣井鉆前產(chǎn)能非確定性預(yù)測(cè)的方法。針對(duì)上述問題,建立了一種適用于頁(yè)巖氣井鉆前產(chǎn)能非確定性預(yù)測(cè)的方法,新方法可利用已投產(chǎn)井的地質(zhì)、工程及生產(chǎn)數(shù)據(jù),預(yù)測(cè)了擬鉆頁(yè)巖氣井投產(chǎn)后的產(chǎn)能概率區(qū)間,包括頁(yè)巖氣井的產(chǎn)能上限與下限,以及每種可能產(chǎn)能動(dòng)態(tài)的概率。運(yùn)用該方法,可在頁(yè)巖氣井鉆前快速獲得較為可靠的、基于概率的產(chǎn)能信息。
頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)方法的實(shí)施流程如圖1所示。

圖1 基于機(jī)器學(xué)習(xí)的頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)方法流程
技術(shù)要點(diǎn)①選用參考文獻(xiàn)[16]提出的最大信息系數(shù)相關(guān)性分析方法,定量分析影響頁(yè)巖氣產(chǎn)能指標(biāo)的各種地質(zhì)因素與工程因素,所確定的主控因素將作為下一步建立產(chǎn)能指標(biāo)確定性預(yù)測(cè)模型的輸入變量。利用最大信息系數(shù)分析變量之間相關(guān)性的核心思想是:制作2個(gè)變量的散點(diǎn)圖,將該散點(diǎn)圖網(wǎng)格化后,變量之間相關(guān)性越強(qiáng),散點(diǎn)圖中的點(diǎn)應(yīng)包含在越少的網(wǎng)格之內(nèi)。基于這一原理,不僅可以識(shí)別變量之間的線性相關(guān)關(guān)系,也可以探測(cè)非線性相關(guān)關(guān)系,這是傳統(tǒng)Pearson相關(guān)系數(shù)不具備的優(yōu)點(diǎn)。
支持向量機(jī)(SVM)立足于嚴(yán)密的數(shù)學(xué)分析,當(dāng)處理小樣本時(shí),模型泛化能力更強(qiáng),不易出現(xiàn)過擬合的問題[17-20],文中選用支持向量機(jī)技術(shù)建立頁(yè)巖氣產(chǎn)能指標(biāo)確定性預(yù)測(cè)模型。通常支持向量機(jī)需要借助優(yōu)化算法選擇最優(yōu)的初始參數(shù),而遺傳算法(GA)和粒子群算法(PSO)往往是首選。然而,傳統(tǒng)的遺傳算法局部搜索能力較弱且收斂速度慢,傳統(tǒng)的粒子群算法由于缺少變異性容易陷入局部最小化[21-23]。考慮到經(jīng)典遺傳算法與粒子群算法的各自優(yōu)勢(shì),提出一種混合優(yōu)化算法(HGAPSO),用以優(yōu)化支持向量機(jī)的參數(shù)。該算法的核心思想是將經(jīng)典遺傳算法的演化算子集成到經(jīng)典粒子群算法中,以彌補(bǔ)其劣勢(shì)。圖2為HGAPSO的計(jì)算流程,由圖2可知,每一次迭代過程,在更新了所有粒子的速度和位置后,將演化算子(選擇、交叉、變異)隨機(jī)應(yīng)用到一部分粒子之中,產(chǎn)生了一些新粒子,新粒子增加到粒子群中,解決了經(jīng)典粒子群算法容易陷入局部最小的問題。

圖2 利用HGAPSO優(yōu)化SVM模型的流程圖
通過技術(shù)要點(diǎn)②預(yù)測(cè)擬鉆頁(yè)巖氣井的產(chǎn)能指標(biāo),計(jì)算得到該擬鉆井確定性的產(chǎn)量動(dòng)態(tài)q。通過對(duì)已投產(chǎn)頁(yè)巖氣井產(chǎn)能指標(biāo)的統(tǒng)計(jì)分析,估計(jì)擬鉆頁(yè)巖氣井產(chǎn)能指標(biāo)的先驗(yàn)分布。基于文獻(xiàn)[12],開展“蒙特卡洛-馬爾科夫鏈”模擬,預(yù)測(cè)擬鉆頁(yè)巖氣井產(chǎn)能指標(biāo)后驗(yàn)分布,在此基礎(chǔ)上對(duì)該井產(chǎn)量動(dòng)態(tài)進(jìn)行非確定性預(yù)測(cè)。擬鉆頁(yè)巖氣井產(chǎn)能指標(biāo)后驗(yàn)分布的“蒙特卡洛-馬爾科夫鏈”模擬步驟如下。
(1) 在各產(chǎn)能指標(biāo)先驗(yàn)分布中抽取一組樣本Xproposal,運(yùn)用常規(guī)氣藏工程方法,計(jì)算得到該產(chǎn)能指標(biāo)樣本下的產(chǎn)量動(dòng)態(tài)qproposal。
(2) 按下式計(jì)算判定系數(shù)α。
(1)
式中:α為判定系數(shù);σt-1為上一時(shí)間步由隨機(jī)抽取的產(chǎn)能指標(biāo)Xt-1計(jì)算得到的動(dòng)態(tài)產(chǎn)量qt-1與預(yù)測(cè)確定性的動(dòng)態(tài)產(chǎn)量q之間的標(biāo)準(zhǔn)差;std為計(jì)算標(biāo)準(zhǔn)差函數(shù);σproposal為當(dāng)前時(shí)間步由隨機(jī)抽取的產(chǎn)能指標(biāo)Xproposal計(jì)算得到的動(dòng)態(tài)產(chǎn)量qproposal與預(yù)測(cè)確定性的動(dòng)態(tài)產(chǎn)量q之間的標(biāo)準(zhǔn)差;σ為所有已投產(chǎn)井計(jì)算產(chǎn)能指標(biāo)時(shí)擬合誤差的均值;q為利用技術(shù)要點(diǎn)②預(yù)測(cè)的產(chǎn)能指標(biāo)計(jì)算得到的日動(dòng)態(tài)產(chǎn)量,m3·d-1;qproposal為利用當(dāng)前時(shí)間步隨機(jī)抽取的產(chǎn)能指標(biāo)Xproposal計(jì)算得到的日產(chǎn)量動(dòng)態(tài),m3·d-1;qt-1為利用上一時(shí)間步隨機(jī)抽取的產(chǎn)能指標(biāo)Xt-1計(jì)算得到的日產(chǎn)量動(dòng)態(tài),m3·d-1。
(3) 從均勻分布U(0,1)抽取隨機(jī)數(shù)u。
(4) 如果α>u,則Xt=Xproposal,t=t+1,并返回步驟(1);否則,放棄Xproposal,返回步驟(1),重新抽取一組樣本Xproposal。
(5) 當(dāng)獲得足夠數(shù)量的產(chǎn)能指標(biāo)樣本后,結(jié)束迭代,并進(jìn)行統(tǒng)計(jì)分析,獲得產(chǎn)能指標(biāo)后驗(yàn)分布。
為了驗(yàn)證文中方法的可行性,選取中國(guó)24口頁(yè)巖氣井進(jìn)行算例分析。首先收集各井的地質(zhì)參數(shù)、工程參數(shù)及產(chǎn)量數(shù)據(jù),選用Arps雙曲遞減模型計(jì)算各井產(chǎn)能指標(biāo),擬合得到各井的初期最大產(chǎn)氣量、初期遞減率及遞減指數(shù),得到由24口井組成的計(jì)算數(shù)據(jù)集。表1為數(shù)據(jù)集中各參數(shù)的主要統(tǒng)計(jì)指標(biāo)。
隨機(jī)選取1口井(W井)作為擬鉆頁(yè)巖氣井,剩下的23口井作為已投產(chǎn)頁(yè)巖氣井,開展頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)算例分析,即隨機(jī)用23口井?dāng)?shù)據(jù)對(duì)另外1口井產(chǎn)能進(jìn)行非確定性預(yù)測(cè)。運(yùn)用最大信息系數(shù)相關(guān)性分析方法,確定有機(jī)碳含量、含氣量、總液量、單段液量、總砂量、單段砂量、用液強(qiáng)度、加砂強(qiáng)度等8個(gè)參數(shù)為主控因素。以這8個(gè)因素為輸入變量,以初期最大產(chǎn)氣量、初期遞減率及遞減指數(shù)為輸出變量,運(yùn)用混合支持向量機(jī)技術(shù)HGAPSO-SVM,訓(xùn)練產(chǎn)能指標(biāo)確定性預(yù)測(cè)模型,運(yùn)用訓(xùn)練好的模型確定性預(yù)測(cè)擬鉆井的產(chǎn)能指標(biāo)。

表1 數(shù)據(jù)集中各參數(shù)的主要統(tǒng)計(jì)指標(biāo)
本算例僅考慮初期遞減率與遞減指數(shù)的不確定性。通過前人研究成果,初期遞減率滿足對(duì)數(shù)正態(tài)分布,遞減指數(shù)滿足正態(tài)分布。統(tǒng)計(jì)分析23口已鉆頁(yè)巖氣井的產(chǎn)能指標(biāo)可知,初期遞減率的樣本均值與方差為0.24與0.02,遞減指數(shù)的樣本均值與方差為1.02與0.41。由此可以確定擬鉆井的初期遞減率與遞減指數(shù)的先驗(yàn)分布。根據(jù)已投產(chǎn)井計(jì)算產(chǎn)能指標(biāo)時(shí)的擬合誤差,確定σ2為0.03。利用“蒙特卡洛-馬爾科夫鏈”模擬方法預(yù)測(cè)擬鉆井的初期遞減率與遞減指數(shù)的后驗(yàn)分布,在此基礎(chǔ)上進(jìn)行該擬鉆井產(chǎn)能的非確定性預(yù)測(cè)。
不同于確定性產(chǎn)能預(yù)測(cè)方法,文中方法對(duì)擬鉆頁(yè)巖氣井產(chǎn)能預(yù)測(cè)的結(jié)果不是一個(gè)確定的產(chǎn)能動(dòng)態(tài),而是一個(gè)范圍,這個(gè)范圍包含了這口井的產(chǎn)能上限與產(chǎn)能下限,以及上、下限之間每個(gè)可能的產(chǎn)能動(dòng)態(tài)發(fā)生的概率。
圖3為利用文中方法對(duì)W井產(chǎn)能進(jìn)行非確定性預(yù)測(cè)的結(jié)果。圖中P90、P50與P10曲線分別代表在90%、50%、10%概率下W井所能達(dá)到的產(chǎn)能水平,P90曲線代表W井的產(chǎn)能下限,P10曲線代表W井的產(chǎn)能上限,W井投產(chǎn)后的產(chǎn)能曲線很可能會(huì)落在P90曲線與P50曲線之間的區(qū)域(概率超過50%)。對(duì)比W井實(shí)際產(chǎn)量,可見利用該方法對(duì)W井產(chǎn)能的非確定性預(yù)測(cè)結(jié)果是可靠的。

圖3 W井產(chǎn)氣量的非確定性預(yù)測(cè)結(jié)果
產(chǎn)能非確定預(yù)測(cè)模型可靠性的評(píng)價(jià)方法與傳統(tǒng)方法存在差異。文中結(jié)合頁(yè)巖氣現(xiàn)場(chǎng)生產(chǎn)實(shí)踐,制訂了適用于頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)模型的可靠性評(píng)價(jià)方法。該評(píng)價(jià)方法實(shí)施步驟如下:①對(duì)若干口擬鉆頁(yè)巖氣井產(chǎn)能進(jìn)行非確定性預(yù)測(cè),將各井產(chǎn)能非確定性預(yù)測(cè)結(jié)果與該井實(shí)際產(chǎn)量進(jìn)行對(duì)比;②如圖3所示,將P90的30%誤差限與P10之間的區(qū)域稱為“準(zhǔn)確率評(píng)價(jià)區(qū)間”,將P90的15%誤差限與P50之間的區(qū)域稱為“大概率事件區(qū)間”;③若1口井有超過70%的實(shí)際產(chǎn)量數(shù)據(jù)落在“準(zhǔn)確率評(píng)價(jià)區(qū)間”,則認(rèn)為這口井的非確定性預(yù)測(cè)結(jié)果是“可靠”的,將這類井的占比稱為模型的“準(zhǔn)確率”,若“準(zhǔn)確率”超過70%,則認(rèn)為該模型具有較高的預(yù)測(cè)精度;④若1口井有超過50%的實(shí)際產(chǎn)量數(shù)據(jù)落在“大概率事件區(qū)間”,則認(rèn)為這口井的非確定性預(yù)測(cè)結(jié)果屬于“大概率事件”,若這類井的占比超過50%,即大概率事件發(fā)生的概率超過50%,則認(rèn)為該模型預(yù)測(cè)結(jié)果滿足概率統(tǒng)計(jì)規(guī)律;⑤若模型具有較高的預(yù)測(cè)精度,同時(shí)預(yù)測(cè)結(jié)果滿足概率統(tǒng)計(jì)規(guī)律,則認(rèn)為該模型是可靠的。
根據(jù)上述可靠性評(píng)價(jià)方法,將24口井逐一作為擬鉆井進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果表明:利用文中方法進(jìn)行產(chǎn)能非確定性預(yù)測(cè)的準(zhǔn)確率為70.8%,預(yù)測(cè)結(jié)果為“大概率事件”的井占54.2%,說明該方法具有較高的預(yù)測(cè)精度,且預(yù)測(cè)結(jié)果滿足概率統(tǒng)計(jì)規(guī)律。將該方法用于頁(yè)巖氣井產(chǎn)能非確定性預(yù)測(cè)是可靠的。
(1) 文中提出了一種基于機(jī)器學(xué)習(xí)的頁(yè)巖氣產(chǎn)能非確定性預(yù)測(cè)方法,該方法將最大信息系數(shù)相關(guān)性分析方法、混合支持向量機(jī)技術(shù)HGAPSO-SVM及“蒙特卡洛-馬爾科夫鏈”模擬有機(jī)結(jié)合,可利用已投產(chǎn)井的地質(zhì)及工程數(shù)據(jù)對(duì)1口擬鉆頁(yè)巖氣井未來的產(chǎn)能進(jìn)行非確定性預(yù)測(cè)。
(2) 選取中國(guó)24口頁(yè)巖氣井算例,分析結(jié)果表明:利用文中方法進(jìn)行產(chǎn)能非確定性預(yù)測(cè)的準(zhǔn)確率為70.8%,預(yù)測(cè)結(jié)果為“大概率事件”的井占54.2%,說明該方法具有較高的預(yù)測(cè)精度且預(yù)測(cè)結(jié)果滿足概率統(tǒng)計(jì)規(guī)律。