陳鋼花,董維武
(中國(guó)石油大學(xué)地球資源與信息學(xué)院,山東青島266555)
遺傳神經(jīng)網(wǎng)絡(luò)在煤質(zhì)測(cè)井評(píng)價(jià)中的應(yīng)用
陳鋼花,董維武
(中國(guó)石油大學(xué)地球資源與信息學(xué)院,山東青島266555)
煤層氣儲(chǔ)層具有很強(qiáng)的非均質(zhì)性和各向異性,使得測(cè)井資料解釋結(jié)果具有多解性、模糊性和不確定性。提出了將遺傳算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的連接權(quán)值及閾值,從而提高網(wǎng)絡(luò)訓(xùn)練精度和煤層氣儲(chǔ)層評(píng)價(jià)精度。該方法避免了標(biāo)準(zhǔn)BP算法易陷入局部最小和遺傳算法局部搜索能力較差的缺點(diǎn),提高了運(yùn)算速度。介紹了利用遺傳算法優(yōu)化網(wǎng)絡(luò)連接權(quán)值及閾值的步驟和煤質(zhì)參數(shù)預(yù)測(cè)步驟。通過(guò)選取學(xué)習(xí)樣本、確定網(wǎng)絡(luò)結(jié)構(gòu)、歸一化處理數(shù)據(jù),建立了基于 GA-BP神經(jīng)網(wǎng)絡(luò)的煤層氣儲(chǔ)層煤質(zhì)測(cè)井評(píng)價(jià)模型。對(duì)26個(gè)樣本數(shù)據(jù)的分析對(duì)比表明,該算法具有較高的預(yù)測(cè)精度和較快的運(yùn)算速度。10多口井的實(shí)際應(yīng)用表明,GA-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果與煤心測(cè)試數(shù)據(jù)匹配很好,且與體積模型計(jì)算結(jié)果具有良好的一致性。
測(cè)井解釋;煤層氣;煤質(zhì)分析;地球物理測(cè)井;BP神經(jīng)網(wǎng)絡(luò);遺傳算法
煤層氣儲(chǔ)層具有很強(qiáng)的非均質(zhì)性和各向異性,造成儲(chǔ)層地質(zhì)特征和測(cè)井響應(yīng)之間的關(guān)系復(fù)雜,表現(xiàn)出明顯的非線性特征,使得測(cè)井資料解釋結(jié)果具有多解性、模糊性和不確定性[1]。煤層煤質(zhì)參數(shù)的計(jì)算是煤層氣儲(chǔ)層評(píng)價(jià)的重要方面,是影響煤層物性和含氣性的重要因素。利用統(tǒng)計(jì)模型法和體積模型法評(píng)價(jià)煤質(zhì)參數(shù)只能用“顯式”的函數(shù)表達(dá)式表達(dá)測(cè)井參數(shù)與煤層參數(shù)間關(guān)系,是對(duì)二者之間復(fù)雜關(guān)系的簡(jiǎn)化,且較難合理選擇煤質(zhì)組分測(cè)井響應(yīng)參數(shù),所以有時(shí)會(huì)產(chǎn)生較大誤差。
BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)之一[2]。由于BP算法是基于梯度最大下降的搜索方法,其缺陷是易陷入局部極小點(diǎn),從而影響網(wǎng)絡(luò)訓(xùn)練精度。遺傳算法是模仿自然界生物進(jìn)化思想而得出的自適應(yīng)啟發(fā)全局搜索算法,它具有很強(qiáng)的全局搜索能力,但其不足之處在于,當(dāng)搜索到最優(yōu)解附近時(shí),無(wú)法精確地確定最優(yōu)解的位置,即局部搜索能力較差。因此,考慮將遺傳算法和BP神經(jīng)網(wǎng)絡(luò)結(jié)合,使二者取長(zhǎng)補(bǔ)短,提高網(wǎng)絡(luò)訓(xùn)練精度。利用GA-BP神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)煤層氣儲(chǔ)層煤質(zhì)參數(shù),具有綜合利用多種測(cè)井參數(shù),客觀反映輸入?yún)?shù)與煤層參數(shù)之間復(fù)雜規(guī)律和無(wú)需選擇測(cè)井解釋參數(shù)等優(yōu)點(diǎn)。
標(biāo)準(zhǔn)BP算法是基于梯度下降法的學(xué)習(xí)算法,學(xué)習(xí)過(guò)程是通過(guò)調(diào)整權(quán)值和閾值,使輸出期望值和神經(jīng)網(wǎng)絡(luò)實(shí)際輸出值的均方誤差趨于最小而實(shí)現(xiàn)。在實(shí)際應(yīng)用中存在易陷入誤差函數(shù)的局部最優(yōu)、收斂速度慢、網(wǎng)絡(luò)的學(xué)習(xí)記憶具有不穩(wěn)定性等不足。針對(duì)這些缺點(diǎn),目前已有不少人對(duì)此提出了改進(jìn)方案,如修正學(xué)習(xí)率、增加動(dòng)量項(xiàng)、引入陡度因子及改進(jìn)神經(jīng)元激勵(lì)函數(shù)等[3]。
遺傳算法是一種全局優(yōu)化搜索算法,可以有效克服BP神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)的不足。利用遺傳算法優(yōu)化BP網(wǎng)絡(luò)權(quán)值及閾值的基本思想是利用遺傳算法全局搜索能力強(qiáng)的特點(diǎn),先用遺傳算法對(duì)神經(jīng)網(wǎng)絡(luò)的初始權(quán)值進(jìn)行粗略的全局優(yōu)化,并在解空間中定位出較好的搜索空間;然后利用BP算法在這些小的解空間局部搜索,最終使其快速搜索到全局最優(yōu)值[5]。
遺傳算法優(yōu)化網(wǎng)絡(luò)權(quán)值及閾值的一般步驟:
(1)確定BP網(wǎng)絡(luò)結(jié)構(gòu)及網(wǎng)絡(luò)訓(xùn)練樣本;
(2)對(duì)神經(jīng)網(wǎng)絡(luò)權(quán)值及閾值進(jìn)行編碼,初始化遺傳算法控制參數(shù),產(chǎn)生含 P個(gè)個(gè)體的初始種群(權(quán)值);
(3)確定適應(yīng)度函數(shù),一般以誤差函數(shù)的倒數(shù)作為適應(yīng)度函數(shù),誤差越小,適應(yīng)度越大;
(4)輸入樣本訓(xùn)練集,經(jīng)BP前向傳播得到網(wǎng)絡(luò)實(shí)際輸出;
(5)計(jì)算每個(gè)個(gè)體的適應(yīng)度,根據(jù)適應(yīng)度的大小對(duì)種群中的個(gè)體進(jìn)行優(yōu)選操作;
(6)對(duì)優(yōu)選出來(lái)的個(gè)體進(jìn)行交叉、變異等遺傳操作,生成新一代群體;
(7)重復(fù)步驟(4)~(6),一代一代繁殖種群,直到滿足終止條件為止,得到經(jīng)遺傳算法優(yōu)化的網(wǎng)絡(luò)權(quán)值及閾值;
(8)將上述經(jīng)遺傳算法全局優(yōu)化的權(quán)值及閾值,作為BP網(wǎng)絡(luò)的初始權(quán)值及閾值,利用BP算法局部搜索能力強(qiáng)的特點(diǎn)進(jìn)一步優(yōu)化網(wǎng)絡(luò)權(quán)值,訓(xùn)練網(wǎng)絡(luò),直至滿足終止條件為止。
(1)煤心實(shí)驗(yàn)數(shù)據(jù)及測(cè)井?dāng)?shù)據(jù)的預(yù)處理包括煤心數(shù)據(jù)和測(cè)井?dāng)?shù)據(jù)的深度歸位,測(cè)井?dāng)?shù)據(jù)的標(biāo)準(zhǔn)化、環(huán)境校正和歸一化處理等;
(2)選取網(wǎng)絡(luò)訓(xùn)練樣本集;
(3)構(gòu)建 GA-BP網(wǎng)絡(luò),用學(xué)習(xí)樣本集訓(xùn)練網(wǎng)絡(luò),直到滿足精度要求為止,保存網(wǎng)絡(luò),建立煤質(zhì)參數(shù)預(yù)測(cè)網(wǎng)絡(luò)模型;
(4)應(yīng)用上述網(wǎng)絡(luò)預(yù)測(cè)模型,預(yù)測(cè)未知煤層層段的煤質(zhì)參數(shù)。
用神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)煤質(zhì)參數(shù),就是尋求測(cè)井信息與煤質(zhì)參數(shù)之間的某種非線性映射或擬合,通過(guò)給定的訓(xùn)練樣本集進(jìn)行學(xué)習(xí)得到解釋模型。可見(jiàn),網(wǎng)絡(luò)的訓(xùn)練樣本集的選取至關(guān)重要,它直接影響到網(wǎng)絡(luò)訓(xùn)練的效果和預(yù)測(cè)模型的建立。學(xué)習(xí)樣本選取應(yīng)遵循的原則:①剔除個(gè)別明顯異常的數(shù)據(jù)點(diǎn);②適當(dāng)減少相同特征點(diǎn)數(shù);③適當(dāng)補(bǔ)充特征明顯的典型樣點(diǎn);④適當(dāng)控制訓(xùn)練樣本總量;⑤盡量避免選擇在薄層和巖層界面處的數(shù)據(jù)點(diǎn)。
根據(jù)神經(jīng)網(wǎng)絡(luò)的連續(xù)函數(shù)映射定理,具有3層(1個(gè)輸入層、1個(gè)隱含層和1個(gè)輸出層)的網(wǎng)絡(luò)結(jié)構(gòu),即可實(shí)現(xiàn)任意連續(xù)函數(shù)從輸入空間向輸出空間的映射。本文采用3層 GA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行煤質(zhì)參數(shù)的測(cè)井評(píng)價(jià),輸入層神經(jīng)元數(shù)等于輸入測(cè)井參數(shù)個(gè)數(shù),輸出層神經(jīng)元個(gè)數(shù)為4個(gè)(即4種工業(yè)組分含量),隱含層神經(jīng)元個(gè)數(shù)較難確定,無(wú)統(tǒng)一規(guī)律,一般通過(guò)反復(fù)試驗(yàn)確定。確定隱含層神經(jīng)元數(shù)的經(jīng)驗(yàn)公式為

式中,n1為隱含層神經(jīng)元數(shù);m、n分別為輸入層和
輸出層神經(jīng)元數(shù);k為0~10之間的常數(shù)。
由于各種測(cè)井?dāng)?shù)據(jù)量綱不一致,進(jìn)入神經(jīng)網(wǎng)絡(luò)之前,無(wú)論是學(xué)習(xí)訓(xùn)練樣本還是預(yù)測(cè)數(shù)據(jù),都需先進(jìn)行歸一化處理,使其數(shù)值在一定范圍之內(nèi),如[0,1]之間。對(duì)于具有近似線性特征的輸入?yún)?shù),如密度、中子、聲波和自然伽馬等,可以采用如下線性歸一化公式

式中,X、X*分別是歸一化前后測(cè)井值;Xmax、Xmin分別為該段測(cè)井曲線的極大值、極小值。
對(duì)于具有非線性對(duì)數(shù)特征的輸入?yún)?shù),如電阻率等,可以采用式(3)對(duì)數(shù)歸一化公式

在歸一化過(guò)程中,測(cè)井曲線的極大值、極小值的選取至關(guān)重要,不同的取值可造成歸一化結(jié)果的差異,進(jìn)而影響預(yù)測(cè)結(jié)果。一種較好的選取方法是在需歸一化的層段內(nèi),將占據(jù)數(shù)據(jù)點(diǎn)總點(diǎn)數(shù)α%的較大值、較小值,按 Hodges-Lehmann統(tǒng)計(jì)均值原則,自動(dòng)選取該層段極大、極小值。其中,α一般取1~5。
選取反映煤質(zhì)參數(shù)敏感的體積密度(D EN)、聲波時(shí)差(AC)、補(bǔ)償中子(CNL)和自然伽馬(GR)等4種測(cè)井參數(shù)作為網(wǎng)絡(luò)的輸入,煤心實(shí)驗(yàn)室工業(yè)分析參數(shù)(固定碳、灰分、揮發(fā)分和水分)作為網(wǎng)絡(luò)的輸出,構(gòu)建一個(gè)輸入層神經(jīng)元數(shù)為4、隱含層神經(jīng)元數(shù)為10、輸出層神經(jīng)元數(shù)為4的3層 GA-BP神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)煤質(zhì)參數(shù)。
將26個(gè)樣本數(shù)據(jù)分為訓(xùn)練樣本集(20個(gè)樣本數(shù)據(jù))和測(cè)試樣本集(6個(gè)樣本數(shù)據(jù))2組。前者用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),后者用于測(cè)試網(wǎng)絡(luò)的訓(xùn)練效果及網(wǎng)絡(luò)的泛化能力。表1列出了經(jīng)歸一化處理后的全部樣本數(shù)據(jù)。
GA-BP神經(jīng)網(wǎng)絡(luò)的主要參數(shù)設(shè)計(jì)為:染色體編碼采用實(shí)數(shù)編碼,適應(yīng)度函數(shù)為誤差平方和的倒數(shù),種群規(guī)模為50,遺傳代數(shù)為100,網(wǎng)絡(luò)最大訓(xùn)練次數(shù)為100,訓(xùn)練誤差精度為1×10-5。
用訓(xùn)練樣本訓(xùn)練網(wǎng)絡(luò),經(jīng)過(guò)100代遺傳操作,得到遺傳算法優(yōu)化的BP網(wǎng)絡(luò)初始權(quán)值和閾值,適應(yīng)度函數(shù)值為0.45(見(jiàn)圖1)。再用改進(jìn)的BP算法訓(xùn)練網(wǎng)絡(luò),經(jīng)35次迭代,網(wǎng)絡(luò)總誤差達(dá)到精度要求(1 ×10-5),網(wǎng)絡(luò)訓(xùn)練停止(見(jiàn)圖2)。

圖1 GA-BP網(wǎng)絡(luò)適應(yīng)度變化曲線

圖2 GA-BP網(wǎng)絡(luò)總誤差傳播曲線
為了測(cè)試網(wǎng)絡(luò)預(yù)測(cè)煤質(zhì)參數(shù)的效果,分別用訓(xùn)練樣本的測(cè)試樣本作為訓(xùn)練好的網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出結(jié)果及其與期望輸出的對(duì)比見(jiàn)表2。從表2可見(jiàn),訓(xùn)練樣本輸出結(jié)果的絕對(duì)誤差都很低,說(shuō)明網(wǎng)絡(luò)的訓(xùn)練精度較高;訓(xùn)練樣本輸出結(jié)果的絕對(duì)誤差較前者有所增加,固定碳含量誤差最大,但也只有0.020 5,說(shuō)明網(wǎng)絡(luò)具有很好的泛化能力,對(duì)訓(xùn)練樣本之外的數(shù)據(jù)也可以給出較準(zhǔn)確的預(yù)測(cè)結(jié)果。
利用該方法對(duì)研究區(qū)10多口井煤層煤質(zhì)進(jìn)行了評(píng)價(jià),取得了較好的效果。圖3為研究區(qū)B井某煤層煤質(zhì)評(píng)價(jià)成果圖。可見(jiàn)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果與煤心測(cè)試數(shù)據(jù)能夠很好地匹配(見(jiàn)表3),且與體積模型計(jì)算結(jié)果具有很好的一致性,說(shuō)明利用 GABP網(wǎng)絡(luò)預(yù)測(cè)煤質(zhì)參數(shù)是可行的,且具有較高的精度。

表1 GA-BP網(wǎng)絡(luò)樣本數(shù)據(jù)(已歸一化)

表2 網(wǎng)絡(luò)測(cè)試結(jié)果及誤差分析表

表3 研究區(qū)B井煤質(zhì)分析對(duì)比表

圖3 研究區(qū)B井某煤層煤質(zhì)評(píng)價(jià)成果圖
(1)將遺傳算法應(yīng)用到BP神經(jīng)網(wǎng)絡(luò)中,通過(guò)優(yōu)化神經(jīng)網(wǎng)絡(luò)的連接權(quán)值及閾值,解決了由于BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值的隨機(jī)性以及標(biāo)準(zhǔn)BP算法易陷入局部最小的問(wèn)題,網(wǎng)絡(luò)訓(xùn)練精度及運(yùn)算速度都得到提高。
(2)將GA-BP神經(jīng)網(wǎng)絡(luò)引入煤質(zhì)測(cè)井評(píng)價(jià)中,基于GA-BP神經(jīng)網(wǎng)絡(luò)的煤質(zhì)參數(shù)預(yù)測(cè)方法可不考慮具體數(shù)學(xué)模型,可以綜合利用多種測(cè)井參數(shù),能夠“隱式”表達(dá)出煤質(zhì)參數(shù)與測(cè)井響應(yīng)信息間的復(fù)雜非線性關(guān)系,且避開(kāi)了選擇測(cè)井解釋參數(shù)的難點(diǎn)。
(3)應(yīng)用 GA-BP神經(jīng)網(wǎng)絡(luò)模型對(duì)研究區(qū)10多口井煤層進(jìn)行了煤質(zhì)測(cè)井分析,預(yù)測(cè)結(jié)果與煤心測(cè)試資料能夠很好匹配,具有較高的預(yù)測(cè)精度。但這種方法對(duì)樣本數(shù)據(jù)具有很大的依賴性,當(dāng)樣本資料較少或代表性較差時(shí),網(wǎng)絡(luò)的判斷能力差,預(yù)測(cè)效果便會(huì)降低。另外,樣本數(shù)據(jù)的選取及預(yù)處理、網(wǎng)絡(luò)結(jié)構(gòu)及網(wǎng)絡(luò)參數(shù)的確定也很關(guān)鍵,有待進(jìn)一步研究。
[1] 侯俊勝.煤層氣儲(chǔ)層測(cè)井評(píng)價(jià)方法及應(yīng)用[M].北京:冶金工業(yè)出版社,2000.
[2] 章立清.基于遺傳神經(jīng)網(wǎng)絡(luò)的煤層瓦斯含量預(yù)測(cè)[J].煤礦安全,2007(9):23-25.
[3] 魏俊超.BP神經(jīng)網(wǎng)絡(luò)算法改進(jìn)研究[C]∥山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集, 2005.
[4] 雷英杰,張善文,李繼武,等.MA TLAB遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學(xué)出版社, 2005.
[5] 劉明軍.遺傳BP神經(jīng)網(wǎng)絡(luò)模型在彬長(zhǎng)礦區(qū)測(cè)井?dāng)?shù)據(jù)巖性識(shí)別中的應(yīng)用研究[D].北京:煤炭科學(xué)研究總院,2009.
Application of Genetic Neural Network to Coal Quality Evaluation Based on Log Data
CHEN Ganghua,DONGWeiw u
(College of Geo-resources and Info rmation,China University of Petroleum,Qingdao,Shandong 266555,China)
Coalbed methane reservoir log data interp retation results often show multi-solutions, ambiguity and uncertainty due to its heterogeneity and anisotropy.Put fo rw ard is amethod to imp rove network training accuracy and coalbed methane reservoir evaluation accuracy by combining genetic algorithm and neural network.Thismethod uses genetic algorithm to op timize neural network connection weights and threshold.It increases computing speed by avoiding its disadvantages that standard BP algo rithm is ap t to trap in local m inimal solution,and genetic algo rithm is w eak at the locally searching capability.Introduced is the p rocess for op timizing neural network connection weights and threshold and coal quality parameters forecast.Established is a coal quality log evaluation model based on GA-BP neural network,learning-samp les selection and network structure determination,and data no rmalizing.Comparative analysis of 26 samp les show s that this algo rithm has higher accuracy and faster p rocessing speed.Practical app lications in mo re than 10 w ells indicate that the p rediction resultsof GA-BPmethod match w ellw ith coal co re test data, and have good consistency w ith volume model calculation results.
log interp retation,coalbed methane,coal quality analysis,geophysical logging,BP neural network,genetic algorithm
P631.84 文獻(xiàn)標(biāo)識(shí)碼:A
十一五國(guó)家重大科技專項(xiàng)“煤層氣地球物理勘探關(guān)鍵技術(shù)”(項(xiàng)目編號(hào)2008ZX05035)
陳鋼花,女,1963年生,教授,主要從事測(cè)井?dāng)?shù)據(jù)處理與綜合解釋方面的教學(xué)與科研工作。
2010-10-18 本文編輯 王小寧)