999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于地震屬性集成學習的自然伽馬測井數據預測方法

2021-10-28 03:33:54單立群祁妍嫣姜淑賢劉彥昌劉修遠
測井技術 2021年4期
關鍵詞:模型

單立群,祁妍嫣,姜淑賢,劉彥昌,劉修遠

(1.東北石油大學秦皇島校區,河北秦皇島066004;2.西南石油大學石油與天然氣工程學院,四川成都610500;3.大港油田公司同欣集團綜合管理部,天津300280)

0 引 言

準確、高效地進行油藏描述是油氣藏工程中最常見、最具挑戰性的工作。地震數據提供了有關地質井間非均質性的寶貴信息,減少了盆地和油藏地質建模的不確定性。地球物理測井中的地震反演是油氣藏定性過程中的一個重要步驟。它可以將地震反射數據轉換成儲層的定量巖石性質描述[1],這些性質與孔隙度、滲透率、巖相、流體飽和度等巖石物理特征有關[2]。測井曲線通常用于油藏描述,作為條件約束或反演結果的驗證,可以直接測量井位的巖石和流體性質,給出巖石的彈性和物理性質[3]。Doyen[4]首次提出了利用地震屬性預測儲層屬性的想法,利用地質統計學方法從水平的單地震屬性中獲得儲層屬性。該方法在20世紀90年代初被推廣到使用多個屬性,提出了在井位建立地震屬性與儲層屬性統計關系的多屬性方法。Schultz等[5]利用這種關系預測儲層參數。Kalkomey[6]發現在反演過程中涉及太多的屬性會導致孔隙度預測的測井曲線高度不準確。

目前,儲層參數預測主要使用人工神經網絡(Artificial Neural Network,ANN)、支持向量機(Support Vector Machire,SVM)、模糊邏輯方法、模擬退火法、粒子群優化和遺傳算法等[7-11]。這些技術使用多屬性地震數據,所獲得的儲層特征與井眼內存在的固有不確定性無關,提高了油氣行業儲層物性預測的準確性。但是,上述技術訓練單個模型以尋求對訓練數據模式的理解。單一模型往往會過度擬合,導致預測效果不佳。同時,這些方法沒有考慮地震屬性的重要性對測井曲線識別精度的影響。針對這些問題,提出基于集成學習的自然伽馬測井曲線預測方法,與傳統方法比較,該方法具有較高的預測精度。

1 理論方法

1.1 集成學習

集成學習在處理小樣本、高維度、復雜的數據結構方面具有獨特的優勢,是機器學習和模式識別領域的研究熱點。集成學習方法通常是將多個機器學習模型(如決策樹、人工神經網絡、樸素貝葉斯等)的預測結果結合起來,形成集成學習模型,以提高預測的準確性和泛化能力。與在單個模型上進行參數調整的傳統做法相比,聚合來自多個模型的結果是提高模型精度的一種更復雜的方法。由于決策樹對訓練集上的微小變化非常敏感,適合于訓練數據的攝動過程,所以集成學習方法一般都使用決策樹作為基類學習器。以協商一致的方式組合基類學習器,通常使用投票或平均的組合策略。

1.2 隨機森林

隨機森林(Random Forest,RF)是一種基于樹的集合方法,利用bagging方式生成整個訓練集的各種子集來構建單獨的樹。RF基類學習器通常選擇分類和回歸樹算法,在每個節點的分割過程中,隨機選擇1個特征子集,而不是考慮所有可用的特征。在結構樹中,獨立向量和隨機向量是同分布的,禁止在RF中修剪樹木。這樣,在給定相同的訓練樣本的情況下,生成的樹是隨機構建的,并且主要由生成的隨機向量控制。RF可能會產生不同的樹,從而在樹之間提供額外的多樣性。由于采用了樹的組合算法,使得預測精度有了明顯的提高。

1.3 AdaBoost算法

AdaBoost算法的主要思想是針對同1個訓練集訓練不同的分類器(弱分類器),然后把這些弱分類器集合起來,構成1個更強的最終分類器(強分類器)。Adaboost算法本身是通過改變數據分布實現的,它根據每次訓練集之中每個樣本的分類是否正確,以及上次的總體分類的準確率,在隨后的訓練中,盡量少考慮那些容易識別的樣本,而前幾輪中被錯誤分類的例子將引起更多的注意,來確定每個樣本的權值。將修改過權值的新數據集送給下層分類器進行訓練,將每次得到的分類器融合起來,作為最后的決策分類器。

1.4 XGBoost算法

XGBoost算法是1種梯度提升集成樹的構建方法,通過不斷地添加樹,不斷地進行特征分裂來生長1棵樹,每次添加1個樹,其實是學習1個新函數f(x),擬合上次預測的殘差。當訓練完成得到k棵樹,得到預測1個樣本的分數,然后根據這個樣本的特征,在每棵樹中落到對應的1個葉子節點,每個葉子節點就對應1個分數。最后只需要將每棵樹對應的分數加起來就是該樣本的預測值。

XGBoost算法使用了一階和二階偏導,二階導數有利于梯度下降地更快更準。使用泰勒展開取得函數做自變量的二階導數形式具有足夠的靈活性,僅僅依靠輸入數據的值就可以進行葉子分裂優化計算,這將損失函數的選取和模型算法優化(參數選擇)分開,這種去耦合增加了XGBoost算法的適用性,使得它按需選取損失函數,可以用于分類,也可以用于回歸。

1.5 自然伽馬測井曲線預測的基本步驟

①收集特征測井曲線和地震資料;②從研究區地震體中提取地震屬性;③將測井和地震屬性整合到同一個域中;④對測井和地震屬性進行預處理和歸一化;⑤通過XGBoost算法分析,優選地震屬性中重要的特征來預測各類測井曲線;⑥利用網格搜索和交叉驗證優化集成學習(XGBoost、AdaBoost和隨機森林)方法的參數;⑦利用所選特征和最優參數訓練集成學習模型,構建測井曲線預測模型;⑧利用建立的集成學習模型對地震資料進行測井預測和評價。

2 樣本集構建

2.1 數據收集

在大港油田X區塊A區明化鎮組高產砂巖儲層收集了125口井的常規測井資料,包括補償中子測井、自然伽馬測井、自然電位測井、聲波測井、中子伽馬測井、微梯度電阻率測井、0.5 m電位電阻率和2.5 m梯度電阻率測井資料。研究區測井自下而上進行,深度間隔為0.125 m,測井數據是十進制格式。搜集的三維疊后地震數據總面積約為6.5 km2,測量時間間隔是2 ms,在整個時間范圍內數據質量良好。在該研究中,從地震數據中提取的屬性是測井預測的輸入數據;輸出數據是由地震屬性估計得到的測井數據。選擇巖石物理研究中最常用的34個地震屬性作為測井數據預測學習模型的候選輸入(見表1)。

表1 地震屬性列表

2.2 測井數據預處理

通過對測井資料分析,首先選取研究區中的5口井進行測井曲線深度校正。然后,對測井數據進一步處理,包括數據清洗、數據歸一化和數據標準化。

關于數據清洗,本研究采用均值替代方法和散點圖可視化方法剔除異常值和噪聲信息。

數據歸一化能夠減少不同測量設備在不同時間觀測到的測井數據系統誤差,可以使所有測井數據符合相同的標準。同時,數據標準化具有加快訓練過程的作用。在本文的實驗中,根據式(1)將輸入序列被縮放到0到1的范圍實現歸一化。

(1)

測井曲線標準化步驟:①確定全區穩定分布的標準層(選擇厚段泥質層);②采用直方圖進行特征峰值的分析和確定標準井;③將待標準化的井峰值以標準井為基準,進行標準化處理。

2.3 測井數據和地震數據集成

由于測井資料(深度域)和地震資料(時間域)在不同的尺度域有不同的分辨率,測井資料和地震資料需要整合到同1個尺度域。首先,測井數據從深度轉換到時間域,以匹配地震剖面;然后將地震響應與測井數據在準確的井位進行匹配。本文利用Jason Geoscience Workbench(JGW)軟件確定井震時間深度關系,每隔2 ms從井筒軌跡中提取1個測井數據點,實現測井數據與地震數據具有相同的尺度。

2.4 地震屬性優選

使用XGBoost算法進行地震屬性重要性分析,優選重要的屬性進行測井曲線分析,地震屬性重要性由XGBoost算法獲得的權重值來評價。以自然伽馬預測為例,圖1顯示了34個地震屬性在預測自然伽馬曲線時的重要性權重。在直方圖中,屬性1排名最高,而屬性9、17、22、23、26、27和29與自然伽馬沒有相關性。重要性屬性選擇基于得分為0.01或更高的權重。

圖1 預測自然伽馬時地震屬性重要性權重

2.5 樣本集構建

測井曲線預處理和地震屬性優選后,構建樣本數據集。根據測井樣本個數確定地震數據點,以保證模型輸入與輸出的一致性。確定該研究區用于自然伽馬預測的數據集樣本個數為1 111,聲波測井預測的樣本個數為2 121,自然電位測井預測的樣本個數為2 121以及微梯度電阻率測井預測的樣本個數為1 919。數據集被隨機分為訓練集(80%)和測試集(20%)。利用訓練集學習輸入地震屬性與測井曲線之間的關系,保留測試集以評估最終學習模型的效率。用于模型測試的數據沒有用于訓練和最終優化的訓練過程,僅用于最終的模型性能分析。

3 實驗結果與討論

3.1 預測準確性評價

該研究所有成果均由Python軟件平臺實現,采用網格搜索與十折交叉驗證相結合的方法對模型參數進行優化,采用均方根誤差(MSE)和決定系數(R2)評價集成學習模型預測準確性。

圖2~圖4為測試階段預測的測井曲線與實際測井曲線的對比。測試階段對應的預測數據點幾乎落在真實測量值附近,集成學習模型的預測結果與實際測井數據吻合較好,表明提出的集成學習模型在地震資料與測井資料的匹配方面具有良好的性能。因此,本文提出的集成學習方法能夠較好地預測非均質砂巖油藏生產過程中缺失的自然伽馬測井曲線。

圖2 XGBoost算法預測與實際自然伽馬測井對比

圖3 AdaBoost算法預測與實際自然伽馬測井對比

圖4 RF算法預測與實際自然伽馬測井對比

表2為在地震屬性重要性選擇閾值下,利用不同的集成學習模型預測自然伽馬測井曲線時,在測試階段得到的均方根誤差和決定系數。由表2可見,通過優化地震屬性選擇,XGBoost、AdaBoost和RF集成學習算法對非均質砂巖儲層測井曲線具有較好的預測效果。3種方法預測測井曲線得到的均方根誤差值均小于0.009,決定系數R2值均大于0.950 0。從表2中可以看出,當閾值為0.05時,預測精度較高。

表2 集成學習算法評價參數

3.2 模型對比評價

圖5描述了XGBoost、AdaBoost、RF、ANN和SVR這5種算法預測自然伽馬時預測數據點和實際數據點的分布,其中特征重要性閾值設置為0.05。XGBoost、AdaBoost和RF算法預測的自然伽馬數據點與實際自然伽馬數據點接近,具有顯著的一致性。基于ANN和SVR算法預測的自然伽馬測井數據點與實際的自然伽馬測井數據點離散,數據一致性較差,這表明集成模型比用ANN和SVR算法預測自然伽馬更準確。

圖5 集成學習算法與ANN、SVR算法對比

4 結 論

(1)將測井曲線和地震體的異構數據進行集成,實現基于集成學習方法的測井曲線預測。

(2)新開發的自然伽馬預測算法生成的決定系數值大于0.950 0,均方根誤差值小于0.009。這些數值表明該研究采用的方法對項目研究的非均質砂巖儲層測井曲線具有良好的預測效果。

(3)將已有的研究結果與集成學習算法進行了比較,結果表明集成學習算法在預測測井曲線方面具有更好的性能。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲国产理论片在线播放| 好紧好深好大乳无码中文字幕| 一本色道久久88综合日韩精品| 国产青青草视频| 九色综合伊人久久富二代| 欧美特黄一级大黄录像| 91福利在线看| 日日碰狠狠添天天爽| 99视频在线精品免费观看6| 久久久成年黄色视频| 国产精品密蕾丝视频| 国产精品三级专区| 欧美激情第一欧美在线| 欧美日韩在线观看一区二区三区| 亚洲资源站av无码网址| av大片在线无码免费| 色综合天天综合中文网| 日韩123欧美字幕| 精品福利网| 欧美一级夜夜爽www| 国产1区2区在线观看| 人妻丰满熟妇啪啪| 人妻丰满熟妇αv无码| 国产三级成人| 亚洲天堂777| 69视频国产| 日本精品影院| 青草视频网站在线观看| 国产乱码精品一区二区三区中文| 成人在线不卡视频| 在线无码九区| 亚洲码一区二区三区| av在线无码浏览| 99视频在线观看免费| 亚洲国产欧美国产综合久久| 老司机精品99在线播放| 无码专区第一页| 97在线观看视频免费| 美女免费黄网站| 久久鸭综合久久国产| 精品伊人久久大香线蕉网站| 色噜噜久久| 日韩黄色大片免费看| 一级做a爰片久久免费| 97成人在线视频| 日韩午夜片| 毛片卡一卡二| 成人亚洲天堂| 精品久久久久久成人AV| 毛片视频网| 中文字幕无码电影| 免费激情网站| 亚洲三级色| 亚洲人成人伊人成综合网无码| 国产成+人+综合+亚洲欧美| 激情网址在线观看| 久久男人视频| 国产在线一区视频| 四虎国产精品永久在线网址| 亚洲天堂在线视频| 亚洲精品成人福利在线电影| 成人精品午夜福利在线播放| 国产成年女人特黄特色毛片免| 狠狠色噜噜狠狠狠狠色综合久 | 国产美女免费网站| 色偷偷一区| 久久精品中文字幕少妇| 热99精品视频| 在线免费看片a| 伊人久久综在合线亚洲2019| 国产午夜人做人免费视频中文| 人妻精品全国免费视频| 国产成年女人特黄特色大片免费| 国产在线八区| 91蝌蚪视频在线观看| 91外围女在线观看| 国产精品美女自慰喷水| 欧美午夜理伦三级在线观看| 中文字幕日韩久久综合影院| 中文字幕永久在线看| 又粗又硬又大又爽免费视频播放| 国产SUV精品一区二区6|