999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SOM和模糊識別的復雜碳酸鹽巖巖性識別

2019-09-11 03:54:36仲鴻儒成育紅林孟雄高世臣仲婷婷
巖性油氣藏 2019年5期

仲鴻儒,成育紅,林孟雄,高世臣,仲婷婷

(1.中國地質大學(北京)信息工程學院,北京100083;2.中國石油長慶油田分公司第五采氣廠,西安710016;3.中國地質大學(北京)數(shù)理學院,北京100083)

0 引言

測井巖性識別是儲層評價的重要工作,測井資料中包含著豐富的巖性信息,隨著數(shù)學理論的發(fā)展和計算能力的提高,利用測井資料結合計算機技術判別巖性已成為測井技術人員高度關注的內容[1]。通過對測井數(shù)據(jù)的定性、定量解釋,地質學家建立了測井參數(shù)和所需儲層信息的匹配關系,并對目標儲層進行預測。以復雜碳酸鹽巖巖性識別為例,多元統(tǒng)計方法[2]、主成分分析技術[3-4]、模糊數(shù)學[2]、支持向量機[5]和人工神經網(wǎng)絡[4,6]等方法在生產實踐中被廣泛應用,但是這些方法在提高目標體預測準確率的同時,也出現(xiàn)了一些問題,如BP神經網(wǎng)絡方法難以解釋輸出節(jié)點之間的關系,并且難以將地質知識結合到網(wǎng)絡中[7];同時,BP模型往往簡化了現(xiàn)實條件,將地質學家面對的工作簡單處理為一個函數(shù)尋優(yōu)過程,這使得地質工作者無法了解和控制中間過程,當出現(xiàn)算法結果和地質經驗相沖突時,很難通過局部調整來尋求兩者的統(tǒng)一。

據(jù)文獻[8]報道,自組織映射(Self-Organizing Map,SOM)是Kohonen在1982年發(fā)明的一種數(shù)據(jù)降維聚類技術,該方法通過“拓撲保持映射”的方法將高維度相似輸入數(shù)據(jù)映射到彼此接近的映射區(qū)域,進而挖掘隱藏在數(shù)據(jù)中的組織結構[9]。這些組織結構揭示了關于自然群體的分類結構的重要信息,而其他方法很難獲得這些信息。該方法已經用于許多領域,例如金融、工業(yè)控制、語音分析和天文學[10-11]。Roy 等[12]描述了該神經網(wǎng)絡自 20 世紀 90年代后期以來在地質行業(yè)中如何使用以解決各種地球科學解釋問題。在以往的地學應用中,地質工作者往往僅關注SOM的降維作用和聚類能力,對其保拓撲結構的作用分析不足。采用SOM挖掘測井參數(shù)的關系信息和拓撲結構,同時將模糊識別的原理結合起來,利用專家信息,對分類規(guī)則進行有監(jiān)督校正,以期既能夠體現(xiàn)數(shù)據(jù)的本來特征,也在模型中融入監(jiān)督信息,使判斷的準確性較同類方法得到有效提升。

1 地質背景

蘇里格氣田蘇東41-33區(qū)塊位于蘇里格東區(qū)西部,西與蘇5區(qū)塊接壤、西北部接蘇25區(qū)塊、西南接蘇6區(qū)塊,區(qū)域構造屬于陜北斜坡北部,主要勘探目的層位為石盒子組、山西組砂巖和馬家溝組碳酸鹽巖。該地區(qū)碳酸鹽巖儲層受巖溶古地貌、沉積、成巖等因素影響,儲層普遍具有低孔、低滲、非均質性強等特征,其特性致使該地區(qū)的碳酸鹽巖儲量探明率整體較低,具有良好的勘探開發(fā)前景[13-14]。

應用常規(guī)測井資料對儲層進行評價,必須在儲層四性關系研究的基礎之上進行。儲層內巖性、含氣性和物性之間既存在聯(lián)系又相互制約,其中巖性起主導作用,因此巖性的精準識別是儲層評價中至關重要的一步[15-16]。通過袁照威等[1]的研究和測錄井資料分析(圖1),該地區(qū)巖石類型主要發(fā)育灰?guī)r、白云質灰?guī)r、泥質灰?guī)r、白云巖、灰質白云巖、泥質白云巖和泥巖等7種類型,同時選擇對巖性較為敏感的聲波時差、自然伽馬、補償中子、密度、光電吸收截面指數(shù)和電阻率等 6 種測井資料[1,3],應用于巖性精準分類。

圖1 不同巖性類型測錄井曲線響應特征Fig.1 Logging curve response characteristics of different lithologies

如圖1所示,不同巖性具有不同的測井參數(shù)特征,自然伽馬曲線能夠將泥巖和其他幾種類型明顯區(qū)分開,泥巖自然伽馬多大于96 API,所以研究過程中重點分析其他6種類型的測井參數(shù)。泥質灰?guī)r和泥質白云巖2種類型由于泥質含量較高,自然伽馬值相對較高;灰?guī)r的光電吸收界面指數(shù)值高于其他幾種類型;對于電阻率曲線而言,灰?guī)r和白云質灰?guī)r呈現(xiàn)出高值特征,當含泥量增加時,泥質灰?guī)r和泥質白云巖的電阻率降低;對于密度曲線而言,白云巖相對于灰云巖表現(xiàn)出較高的參數(shù)特征。

雖然不同巖性在測井參數(shù)上存在一定的差異,但是不同巖性的測井參數(shù)構成的樣本特征空間存在著較多的重疊(圖2),用常規(guī)手段難以判斷巖性歸屬的問題。在實際工區(qū)中,地質工作者使用的測井參數(shù)種類較多,難以把握數(shù)據(jù)在高維空間中的分布特征,對測井數(shù)據(jù)的相互關系也缺乏直觀的解讀。因此,馬家溝組碳酸鹽巖儲層巖性識別較為困難。

圖2 不同巖性測井參數(shù)平行坐標圖(均值)Fig.2 Parallel coordinates of logging parameters of different lithologies

2 方法理論

2.1 自組織映射

SOM是具有權重矩陣的兩層全連接結構的神經元網(wǎng)絡,在分析高維變量問題時,實驗者往往不能一次性的獲得多種數(shù)據(jù)簇之間的關系,SOM可以通過生成與原始數(shù)據(jù)具有相似性的二維拓撲結構來達到降維的目的[8][圖 3(a)]。SOM 向神經元分配初始值,然后對于每個多屬性樣本通過歐式距離找到最接近該樣本的神經元,并且修正神經元的權重,網(wǎng)格中附近的其他神經元也同步修正[圖3(b)]。對訓練集中的每個樣本重復該過程,從而完成一次SOM學習。衡量SOM算法是否收斂的一個重要依據(jù)是神經元修正的程度,當達到收斂條件或者迭代次數(shù)后,整個SOM的學習將結束[8]。

圖3 自組織映射結構圖(a)及權重向量調整示意圖(b)Fig.3 SOM structural diagram chart(a)and weight vector adjustment diagram(b)

自組織映射算法執(zhí)行以下3個過程[14]:

(1)競爭:對每個輸入矢量,網(wǎng)絡中的神經元計算各自的判別函數(shù)的值,具有判別函數(shù)最大值的神經元成為競爭的獲勝者。

(2)合作:獲勝神經元決定輸入矢量在拓撲鄰域的空間位置,并激活相鄰近的神經元。

(3)調節(jié):隨著算法的迭代,對輸入矢量對應的最佳匹配單元進行局部調整,使它們對相似輸入矢量的響應增強。

SOM采用競爭Hebb學習規(guī)則來建立神經元之間的連接,Ritter等[17]已經證明用這種方法建立的連接,能夠形成神經元集合的Delaunay三角剖分的子圖。同時,這種子圖在神經元足夠稠密的條件下,能夠完美保持原始數(shù)據(jù)的拓撲鄰域關系。具體實現(xiàn)步驟如下[10]:

(1)輸入空間X為N維向量空間xi∈X,xi=[xi1,xi2,…,xiN]。其中xi表示第i個測井樣本,N為需要進行分析的測井參數(shù)個數(shù)。

(2)確定輸出網(wǎng)格大小為m行n列,隨機生成l=m×n個網(wǎng)格節(jié)點,每個網(wǎng)格節(jié)點代表一個權重向量,記為 wj,其中 j=1,2,…,l。

(3)在第t次迭代過程中,在輸入空間隨機選取向量xi∈X作為輸入向量。

(4)計算xi到所有權重向量的歐式距離,選取距離最近的權重向量wb作為最佳匹配單元。

(5)以最佳匹配單元為中心,更新最佳匹配單元及鄰域范圍內的神經元的權重向量,應用更新公式

式中:wj(t +1)為第t+1次迭代過程中第j個節(jié)點的權重向量;η(t)為學習速度參數(shù);hbj(t)為鄰域核函數(shù),用來對最佳匹配單元周邊的激發(fā)向量移動距離進行計算,通常選取高斯函數(shù),即:

式中:(σ)t為第t次迭代過程的鄰域半徑。

(6)重復步驟(3)—(5),直到算法達到收斂或迭代達到指定的次數(shù),迭代過程終止。

2.2 模糊識別方法

傳統(tǒng)的SOM分類模式,一旦學習過程完成,使用獲勝神經元集合來對集合中的每個多屬性樣本進行分類。每個樣本的類別由其最佳匹配神經元的類別提供。而神經元的類別可以采用“委員會投票法”獲得。在這種情況下,可能會造成該神經元局部空間的信息損失,因此,采用模糊系統(tǒng)的相關理論進行局部空間有監(jiān)督判定準則的校正[18]。

模糊系統(tǒng)是“if-then”規(guī)則的集合,這些規(guī)則將輸入映射到輸出,每一條規(guī)則將輸入的一部分映射到輸出的一部分,通常采用隸屬度函數(shù)定量地描述這種規(guī)則。因此,模糊系統(tǒng)通常采用模糊基函數(shù)的線性組合來描述,根據(jù)Stone-Weierstrass定理,模糊基函數(shù)的線性組合總能以任意精度逼近緊致集U上的任意連續(xù)勢函數(shù)[18]。

將在局部神經元空間中的數(shù)據(jù)點看作是多維歐氏空間的點,根據(jù)樣品與類中心之間的隸屬度進行類型的劃分,也即每個樣品可以屬于任何一個類中心,但是屬于每種類可能性不同,即隸屬度不一樣。通常輸入變量的模糊集合的隸屬函數(shù)采用高斯函數(shù),即:

式中:pj(xi)為第i個樣本屬于第j種類型的概率;T為pj(xi)取最大值時對應的巖性類型。

針對研究目標,具體算法如下:

(1)通過前人研究及不同巖性測井參數(shù)分析,選擇對巖性較為敏感的測井參數(shù)[1]。

(2)初始化SOM網(wǎng)絡,通過測井參數(shù)數(shù)據(jù)訓練SOM網(wǎng)絡,根據(jù)式(1)計算神經元與測井樣本的距離,確定最佳匹配單元,并根據(jù)式(2)更新權重。

(3)當SOM網(wǎng)絡收斂或者達到指定迭代次數(shù),則訓練完成,否則迭代步驟(2)。

(4)通過SOM網(wǎng)絡訓練過程中,每個樣本數(shù)據(jù)投影到SOM神經元中。根據(jù)式(4)計算神經元中每個樣本與每種巖性類型之間的隸屬度。并通過式(5)得到每個樣本屬于每種巖性類型的概率。

(5)根據(jù)式(6)計算每個樣本點的巖性類型,最終得到整個測井的巖性序列。

3 SOM分析過程

3.1 拓撲結構選擇

在開始使用SOM進行測井相分析時,首先要確定SOM神經元的個數(shù),其個數(shù)不同對數(shù)據(jù)分布的擬合會有不同的效果。SOM分析過程中主要執(zhí)行“矢量投影”(或稱為“拓撲保存”)和“矢量量化”2個過程[19]。為了定量表征SOM拓撲結構的效果,通常采用平均量化誤差(Quantization Error,QE)和地形誤差(Topographic Error,TE),前者通過計算樣本點和最佳匹配單元距離的平均值度量SOM的矢量量化的能力,后者通過計算樣本點最佳匹配單元和次優(yōu)匹配單元是否相鄰來衡量拓撲保存的質量。平均量化誤差和地形誤差計算公式如下

式中:wb為當前輸入樣本的最佳匹配單元;d(xi-wb)為當前輸入樣本與其最佳匹配單元的歐氏距離;μ(xi)為第i個樣本的映射函數(shù);m為樣本數(shù),個。

通過選擇圖1所示的6種測井參數(shù),確定其輸入空間的維數(shù)為六維,不同的測井參數(shù)具有不同的單位,因此,在輸入之間需要對其進行歸一化處理。通過設置不同的網(wǎng)格大小,采用QE和TE評價SOM不同網(wǎng)格大小的拓撲結構的性能(表1)。網(wǎng)格數(shù)的增加會降低QE,但TE并不隨著做線性變化。顯然,不同構型的SOM對于原始數(shù)據(jù)參數(shù)空間展布結構的描述不盡相同,并沒有一個全面的指標來衡量哪種構型的SOM更能代表原始數(shù)據(jù)的分布,在本文中使用10×15的SOM進行問題分析。

表1 不同網(wǎng)格大小SOM的性能指標值Table 1 Performance index values of SOM with different size grid

圖4 拓撲網(wǎng)絡示意圖(a)和U矩陣(b)Fig.4 Sketch map of topology network(a)and U matrix(b)

3.2SOM可視化分析

以往地質工作者僅將SOM作為一種無監(jiān)督聚類方法或者降維技術來使用,從而忽視其作為一種強大的可視化工具,SOM具有從多種角度為地質工作者展現(xiàn)測井數(shù)據(jù)在參數(shù)空間中的分布情況以及測井參數(shù)之間的聯(lián)系和變化趨勢等特征的能力[19]。

拓撲結構示意圖是最基本的可視化技術,圖4(a)是通過研究工區(qū)測井數(shù)據(jù)得到的結果,圖中六邊形表示采用的神經元的結構,其大小表示該神經元所能激活的范圍,數(shù)字表示落入到該神經元中樣本的數(shù)量,顏色表示神經元在拓撲結構中的位置,顏色相近表示位置相鄰。從整體上看,網(wǎng)格北西—南東方向(以正上為北)的神經元覆蓋更多的數(shù)據(jù)點和更大的參數(shù)空間區(qū)域,當?shù)刭|工作者對某一神經元更感興趣時,可以對該區(qū)域的數(shù)據(jù)點進行更精細更深層次的描述與刻畫。需要特別指出的是,在網(wǎng)格結構中,存在著空白神經元,說明訓練數(shù)據(jù)中缺乏這些神經元所對應的輸入模式。

為了更好地表征輸入樣本之間的相似性,計算相鄰神經元之間的距離,得到標準化距離矩陣(U矩陣)[8],該距離是通過神經元及其周邊多個神經元的距離的平均值得到的,距離矩陣本質上顯示了不同部分神經元的密度。因而它不僅能夠反映不同神經元之間的距離,還可以展示神經元之間的差異性。對于一個含有10×15個神經元的網(wǎng)絡,其矩陣中對應19×29個節(jié)點,通過SOM訓練,得到如圖4(b)所示的U矩陣,可以明顯看出存在著2個類別,暖色區(qū)域代表神經元之間的距離較大,數(shù)據(jù)分布較為分散,冷色部分代表神經元之間的距離較小,數(shù)據(jù)分布比較緊密,結合數(shù)據(jù)標簽,這兩大類對應的是灰?guī)r和白云巖。U矩陣表征了將高維數(shù)據(jù)投影到二維空間,為下一步的巖心識別和分析提供了初步的認識。

圖5 二維拓撲結構在三維數(shù)據(jù)空間中的折疊(a)及與訓練數(shù)據(jù)的疊合圖(b)Fig.5 2-D topological structure(a)and train data(b)fold in 3-D data space

3.3 測井參數(shù)拓撲結構分析

通過袁照威[20]的研究,識別模型常分為有監(jiān)督的學習和無監(jiān)督的學習,但從本質上這2種模型都依賴于不同類型的數(shù)據(jù)在特征空間中的某種距離度量方式的可分性,一旦距離被定義,那么距離小的樣本比較相似,距離大的樣本彼此不同[12]。在傳統(tǒng)的基于全局歐氏距離的模型范氏下,數(shù)據(jù)的成簇結構是以某個統(tǒng)計量為中心,以不同類別的該統(tǒng)計量的距離的某個分位點為半徑的超球體結構呈現(xiàn)的,例如K-means方法的聚類中心和聚類半徑,貝葉斯推斷中高斯函數(shù)的均值和方差等,這些無序的超球體填充在數(shù)據(jù)的分布空間中,直接構成了樣本的分類空間,但數(shù)據(jù)的本征維度是否是歐式空間,數(shù)據(jù)流形是否符合實驗者的假設卻往往不得而知。

SOM的有序輸出,能夠為此類問題提供另一種解決思路。實際上,SOM的訓練可以看做是探究二維平面在歐式空間中的卷曲情況,從外蘊空間(歐式空間)的坐標倒推內蘊空間(拓撲空間)的坐標的過程[19]。如圖 5(a)所示,紅框圈出來的區(qū)域分別是117號神經元(團)和150號神經元(團),這2團神經元在歐氏距離度量下較接近,如5(b)所示,這2團神經元映射著不同標簽的樣本(紅色樣本代表灰?guī)r,綠色樣本代表白云質灰?guī)r),在映射完成后,SOM隱式的執(zhí)行了一種“展開”操作,即在2 D平面內,117號神經元(團)和150號神經元(團)彼此遠離,至此,SOM完成了對于嵌在高位歐式空間下的二維流形的挖掘,有序的輸出結構將數(shù)據(jù)本身的流形結構得以恢復,經過這種映射,一種新的距離取代了歐氏距離,衡量了2類樣本的相似性。同類別數(shù)據(jù)更接近,而不同類別的數(shù)據(jù)更加遠離。同時,SOM訓練完畢后,每個神經元形成獨立的局部空間,同時相比全局空間,依據(jù)局部空間的光滑性,可以假定該空間為歐式空間。這也為后續(xù)的有監(jiān)督微調局部空間判別準則提供了依據(jù)。

4 巖性識別結果分析

為了說明算法的應用效果,以蘇里格氣田蘇東41-33區(qū)塊W1井為例,選擇自然伽馬、密度、光電截面吸收指數(shù)、補償中子、聲波時差、深側向電阻率等6種測井特征參數(shù),也即上述算法中N=6,M=7。首先結合專家信息和巖屑測錄井資料,對該區(qū)域部分特征明顯的樣本進行巖性標定,然后將有巖性類型的測井參數(shù)樣本數(shù)據(jù)作為算法輸入訓練SOM模型,訓練完畢后,每個神經元都會形成一個局部空間,使用該區(qū)域內帶有標記的樣本建立模糊系統(tǒng),使用公式求取待測樣本對于每一個類型的概率,最后選擇概率最大的類別作為該樣本的最終類別,得到最終的巖性識別結果,同時采用傳統(tǒng)的模糊識別方法作為對比方法,并與測錄井資料進行對比分析。

從定性角度看出,本文方法得到的巖性識別結果和鉆錄井巖心得到的結果整體上表現(xiàn)出一致的特征,而模糊識別方法則存在很大的差異(圖6)。在3 431.8~3 435.4 m井段處,本文方法得到的灰質白云巖,而模糊識別則識別為泥質白云巖,在其他深度處也存在一定的誤判現(xiàn)象。這進一步說明了所選擇的特征在歐式空間相近,但在拓撲空間中得到“展開”,這樣得到的結果就存在一定的差異。

圖6 W1井巖性識別結果Fig.6 Lithology identification result of well W1

通過統(tǒng)計不同方法的混淆矩陣,定量得到不同方法的識別精度(表2)。使用本文提出的基于SOM和模糊識別的方法對該工區(qū)W1井的所有樣本點進行測試,最終的準確率為87.9%,而在全局空間使用傳統(tǒng)的模糊識別方法的準確率為80.6%,準確率提高了7.3%。

表2 不同巖性識別方法混淆矩陣Table 2 Confusion matrix of different lithology identification methods

5 結論

(1)自組織映射模型能夠反映測井參數(shù)之間的相關性,挖掘數(shù)據(jù)中的典型模型,將高維變量映射到二維平面上,利用多種可視化手段展示出中間過程,便于和地質工作者的經驗相結合。

(2)SOM作為拓撲學習的典型代表,可以捕捉到數(shù)據(jù)的局部鄰域信息和整體變化趨勢,通過和專家信息的有效結合,在局部空間使用模糊識別方法調整分類策略。

(3)通過全局無監(jiān)督學習和局部有監(jiān)督分類相結合的方法,得到更符合實際巖性的識別結果,與傳統(tǒng)的模糊識別方法相比,識別正確率得到大幅度提高。

(4)“全局無監(jiān)督拓撲學習+局部有監(jiān)督分類”具有可行性和有效性,為地質人員在儲層評價過程中提供了一種新的解決方法和思路。

主站蜘蛛池模板: 日韩精品一区二区三区swag| 熟女日韩精品2区| 亚洲人网站| 这里只有精品免费视频| 热这里只有精品国产热门精品| 久久免费看片| 国产精女同一区二区三区久| 欧美日韩国产在线观看一区二区三区| 日韩精品无码免费专网站| 国产亚洲精久久久久久无码AV| 亚洲无码熟妇人妻AV在线| 日韩欧美国产综合| 2020久久国产综合精品swag| 午夜欧美在线| 国产精品99一区不卡| 美女被操黄色视频网站| 免费av一区二区三区在线| 九九线精品视频在线观看| 国产97区一区二区三区无码| 精品国产欧美精品v| 国产成人啪视频一区二区三区| 国产欧美日本在线观看| 久久精品只有这里有| 欧亚日韩Av| 台湾AV国片精品女同性| 被公侵犯人妻少妇一区二区三区| 免费人成在线观看成人片| 巨熟乳波霸若妻中文观看免费| 国产亚洲精品资源在线26u| 色综合久久88| 成人毛片免费在线观看| 午夜精品影院| 亚洲成人动漫在线观看| 婷五月综合| 国产成人AV综合久久| 国产日韩欧美精品区性色| 伊大人香蕉久久网欧美| 欧美色丁香| m男亚洲一区中文字幕| 亚洲一区二区三区在线视频| 亚洲男人天堂久久| 国产成人精品午夜视频'| 美女裸体18禁网站| 欧美精品在线免费| 97视频免费在线观看| 亚洲男人天堂久久| 99青青青精品视频在线| 久久精品视频一| 久久久精品无码一二三区| 97免费在线观看视频| 亚洲资源在线视频| 99青青青精品视频在线| 亚洲成A人V欧美综合| 久久国产亚洲偷自| 99视频只有精品| 亚洲美女一区二区三区| 国产情精品嫩草影院88av| 国产高清不卡| 国产一区二区三区在线无码| 久草青青在线视频| 国产99精品视频| 亚洲一道AV无码午夜福利| 久久人人爽人人爽人人片aV东京热 | 波多野结衣视频一区二区| 呦女亚洲一区精品| 日韩毛片免费| www亚洲精品| 国产日韩欧美在线播放| www.91在线播放| 91亚洲免费视频| 国产97视频在线观看| 久久久亚洲国产美女国产盗摄| 伊人福利视频| 亚洲日韩精品无码专区97| 99视频在线观看免费| 欧美五月婷婷| 99999久久久久久亚洲| 亚洲第一黄片大全| 亚洲中文字幕日产无码2021| 一级毛片在线播放免费观看 | 成人免费黄色小视频| 不卡无码网|