藍(lán)茜茜, 張逸倫, 康志宏*
(1.中國(guó)地質(zhì)大學(xué)(北京)能源學(xué)院, 北京 100083; 2.北京大學(xué)地球與空間科學(xué)學(xué)院, 北京 100871)
儲(chǔ)層流體性質(zhì)識(shí)別是一項(xiàng)重要的儲(chǔ)層表征和含油氣性評(píng)價(jià)方法,對(duì)后續(xù)油田開(kāi)發(fā)方案的制定與調(diào)整起到關(guān)鍵作用。復(fù)雜儲(chǔ)層具有儲(chǔ)集空間多樣、巖性復(fù)雜、非均質(zhì)性強(qiáng)等特點(diǎn),由于測(cè)井資料受多種因素控制導(dǎo)致流體響應(yīng)特征不明顯,僅利用單一的測(cè)井資料或者儲(chǔ)層參數(shù)無(wú)法準(zhǔn)確識(shí)別儲(chǔ)層流體性質(zhì)[1]。目前以綜合多種測(cè)井資料及儲(chǔ)層參數(shù)解釋為主要識(shí)別手段,常用的方法包括多參數(shù)重疊法、交會(huì)圖法、經(jīng)驗(yàn)公式法等[2-5]。近年來(lái)隨著數(shù)據(jù)挖掘技術(shù)的快速發(fā)展,回歸算法、聚類(lèi)算法、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)算法、隨機(jī)森林、支持向量機(jī)等技術(shù)及結(jié)合上述多種技術(shù)的綜合判別方法均被用于儲(chǔ)層流體識(shí)別中[6-13]。
在眾多的機(jī)器學(xué)習(xí)算法中,BP神經(jīng)網(wǎng)絡(luò)及其改進(jìn)算法由于在綜合多屬性數(shù)據(jù)預(yù)測(cè)中優(yōu)秀的非線性映射能力,已成為最為廣泛使用的儲(chǔ)層性質(zhì)識(shí)別技術(shù),但該方法網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,只能挖掘到樣本淺層的特征信息。與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)相比,深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)更深,學(xué)習(xí)能力更強(qiáng),具備處理大量樣本數(shù)據(jù)、解決復(fù)雜非線性預(yù)測(cè)問(wèn)題的能力,同時(shí)避免了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)易陷入局部極小值,梯度消失的問(wèn)題[14-16]。針對(duì)目前復(fù)雜儲(chǔ)層流體識(shí)別中常規(guī)方法存在的識(shí)別率低、嚴(yán)重依賴人工經(jīng)驗(yàn)的問(wèn)題,將深度學(xué)習(xí)方法引入,建立了多屬性測(cè)井參數(shù)和復(fù)雜儲(chǔ)層流體性質(zhì)之間的非線性關(guān)系,并將其應(yīng)用于車(chē)排子油田低滲油藏某井區(qū),體現(xiàn)了深度學(xué)習(xí)在復(fù)雜儲(chǔ)層流體識(shí)別中的優(yōu)越性。
深度神經(jīng)網(wǎng)絡(luò)是一種有監(jiān)督式的特征學(xué)習(xí)模型,它在人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,通過(guò)增加隱含層數(shù)提高特征提取能力。與隱含層數(shù)量較少的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相比,深度學(xué)習(xí)可以將低層特征進(jìn)行組合,提取潛在的復(fù)雜高層特征信息,從而較好地解決復(fù)雜的非線性問(wèn)題。
典型的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、多個(gè)隱含層和輸出層構(gòu)成,層與層之間采用全連接方式,上一層的神經(jīng)元輸出即為下一層神經(jīng)元的輸入。訓(xùn)練模型包括信息前饋傳遞和誤差反向傳遞兩個(gè)過(guò)程。以隱含層中的一個(gè)神經(jīng)元為例,前饋傳遞過(guò)程如圖1所示。經(jīng)多結(jié)點(diǎn)加權(quán)求和與非線性函數(shù)激活,神經(jīng)元在傳遞過(guò)程中具備了非線性表達(dá)能力。誤差反向傳遞過(guò)程采用小批量梯度下降法更新網(wǎng)絡(luò)[17]。

Y、Z分別表示神經(jīng)元的輸入和輸出值;Xi、ωi、b分別為上一層第i個(gè)神經(jīng)元(共m個(gè)神經(jīng)元)的輸出值、連接權(quán)值和偏置項(xiàng);G為非線性激活函數(shù)圖1 單個(gè)神經(jīng)元前饋傳遞過(guò)程Fig.1 Feedforward transmission process of a single neuron
深度神經(jīng)網(wǎng)絡(luò)是建立在擬均衡樣本集的基礎(chǔ)上,樣本選取是否合理直接影響到深度學(xué)習(xí)的預(yù)測(cè)效果。儲(chǔ)層流體性質(zhì)識(shí)別本質(zhì)上是一個(gè)多屬性分類(lèi)問(wèn)題,對(duì)于復(fù)雜儲(chǔ)層區(qū)塊,非產(chǎn)層段在所有井段中往往占絕對(duì)優(yōu)勢(shì),作為開(kāi)發(fā)目標(biāo)的產(chǎn)層段明顯少于水層、干層等非產(chǎn)層段,在深度學(xué)習(xí)中極易忽視產(chǎn)層段帶來(lái)的影響,出現(xiàn)誤判和錯(cuò)判的情況。
采用混合采樣技術(shù)進(jìn)行樣本均衡優(yōu)化。該方法將上采樣和下采樣有機(jī)結(jié)合,在上采樣過(guò)程中采用Smote算法增加少樣本類(lèi)別的樣本數(shù);下采樣過(guò)程中采用K-means聚類(lèi)算法減少多樣本類(lèi)別的樣本數(shù)[18-19]。假定一個(gè)包含N個(gè)樣本的非均衡數(shù)據(jù)集分為m類(lèi){C1,C2,…,Cm},每類(lèi)中的樣本數(shù)為{N1,N2,…,Nm},具體實(shí)現(xiàn)步驟如下。
(1)據(jù)式(1)計(jì)算每類(lèi)中樣本數(shù)的平均值k,以k為分界,大于k的類(lèi)別為大樣本類(lèi),反之則為小樣本類(lèi)。經(jīng)混合采樣后每類(lèi)樣本大小均為k,原始不均衡樣本集將演化為均衡樣本集。
(2)對(duì)于大樣本類(lèi),K-means算法將樣本聚為k類(lèi),僅保留距離每個(gè)聚類(lèi)中心最近的一個(gè)樣本,聚類(lèi)后的k個(gè)樣本在降采樣的基礎(chǔ)上仍保留了原始數(shù)據(jù)的全部特征。


(1)

(2)
式中:R為一個(gè)均勻分布在0~1間的隨機(jī)數(shù)。
1.2.1 ReLU-Softmax激活函數(shù)
神經(jīng)網(wǎng)絡(luò)中引入激活函數(shù)的目的是最大限度地?cái)M合輸入層與輸出層之間復(fù)雜的非線性關(guān)系,目前Sigmod、Tanh和ReLU是常用的隱含層激活函數(shù),如圖2所示。Sigmod和Tanh函數(shù)在反向誤差傳播過(guò)程時(shí),由于函數(shù)值在邊界處變化緩慢,導(dǎo)數(shù)趨近于0,容易出現(xiàn)梯度消失現(xiàn)象從而導(dǎo)致模型無(wú)法收斂,且Sigmod和Tanh函數(shù)本身及其求導(dǎo)過(guò)程涉及指數(shù)和除法運(yùn)算,計(jì)算復(fù)雜度高。ReLU是一個(gè)分段函數(shù)[式(3)],求解函數(shù)及其導(dǎo)數(shù)過(guò)程均較為簡(jiǎn)單,避免了梯度消失現(xiàn)象,計(jì)算便捷高效,故選用ReLU函數(shù)作為隱含層神經(jīng)元節(jié)點(diǎn)的激活函數(shù)[20]。

圖2 不同類(lèi)型的激活函數(shù)Fig.2 Different types of activation function
對(duì)于多分類(lèi)問(wèn)題,在輸出層后添加一個(gè)Softmax層,如式(4)所示,假定輸出層有T個(gè)原始輸出,該層使用Softmax函數(shù)將輸出值Vi映射為0~1區(qū)間內(nèi)的概率值Si,即轉(zhuǎn)換為“軟分類(lèi)”模型。利用Softmax激活函數(shù)后,以交叉熵作為損失函數(shù),誤差反向傳導(dǎo)過(guò)程易于實(shí)現(xiàn),應(yīng)用效果較好。ReLU、Softmax激活函數(shù)分別應(yīng)用于隱含層和輸出層,兩者的有機(jī)結(jié)合起到了優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的作用。

(3)

(4)
1.2.2 Dropout正則化
隱含層的增加保證了訓(xùn)練模型較好的學(xué)習(xí)能力,但同時(shí)復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)使得模型預(yù)測(cè)結(jié)果嚴(yán)重依賴于訓(xùn)練樣本集,出現(xiàn)“過(guò)擬合”現(xiàn)象。在儲(chǔ)層流體識(shí)別中具體表現(xiàn)為:預(yù)測(cè)樣本集識(shí)別率顯著低于訓(xùn)練集,模型泛化能力差,跨井位、跨工區(qū)的遷移性較差。Dropout正則化通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行取平均有效防止模型“過(guò)擬合”,模型訓(xùn)練過(guò)程中按照一定比例隨機(jī)丟棄一些“神經(jīng)元”(圖3),每一次訓(xùn)練的網(wǎng)絡(luò)結(jié)構(gòu)均不同,使得網(wǎng)絡(luò)在每次迭代過(guò)程中并不依賴于所有全連接層神經(jīng)元,降低了網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜的關(guān)聯(lián)性,學(xué)習(xí)到的樣本特征更具魯棒性[21]。

圖3 Dropout正則化示意圖Fig.3 Diagram of Dropout regularization
將深度學(xué)習(xí)應(yīng)用于多分類(lèi)問(wèn)題時(shí),其識(shí)別效果受多種因素影響。因此,需要提出適用于復(fù)雜儲(chǔ)層流體性質(zhì)識(shí)別問(wèn)題的優(yōu)化方案。針對(duì)樣本數(shù)據(jù)和網(wǎng)絡(luò)結(jié)構(gòu)兩方面進(jìn)行優(yōu)化。
利用混合采樣進(jìn)行樣本優(yōu)化后,大樣本類(lèi)的樣本數(shù)減少,小樣本類(lèi)的樣本數(shù)增加,原本不均衡樣本集轉(zhuǎn)換為均衡樣本集,使得模型訓(xùn)練時(shí)不會(huì)過(guò)分受某一類(lèi)別干擾而影響識(shí)別效果。在優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)時(shí),將ReLU激活函數(shù)、Softmax層和Dropout正則化引入,可使網(wǎng)絡(luò)模型更好地適應(yīng)多分類(lèi)問(wèn)題,防止出現(xiàn)“過(guò)擬合”現(xiàn)象,有效提高訓(xùn)練模型的穩(wěn)定性。
在識(shí)別過(guò)程中,首先將優(yōu)化后的樣本集作為深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集,經(jīng)改進(jìn)后的網(wǎng)絡(luò)訓(xùn)練得到神經(jīng)網(wǎng)絡(luò)模型,并對(duì)儲(chǔ)層流體性質(zhì)進(jìn)行識(shí)別。樣本數(shù)據(jù)和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化策略的有機(jī)統(tǒng)一提高了本文方法的應(yīng)用效果。
車(chē)排子油田位于準(zhǔn)噶爾盆地西北緣,是盆地內(nèi)主要的油氣富集區(qū)之一。研究區(qū)儲(chǔ)層沉積了一套以礫巖、砂礫巖為主的粗碎屑沉積,儲(chǔ)層非均質(zhì)性較強(qiáng)。根據(jù)部分巖心資料分析,研究區(qū)儲(chǔ)層孔隙度分布區(qū)間為1.2%~26.7%,平均值為17.54%;絕對(duì)滲透率分布區(qū)間為0.02~802 mD,平均值為4.19 mD,為中孔低滲儲(chǔ)層。自2016年新井投產(chǎn)后,該研究區(qū)部分出現(xiàn)高部位斷塊油井試油出水,同一斷塊不同部位試油結(jié)論差異大,因此,有效識(shí)別油層對(duì)儲(chǔ)層精細(xì)描述和開(kāi)發(fā)方案調(diào)整至關(guān)重要。
目標(biāo)區(qū)測(cè)井資料包括聲波時(shí)差(AC)、補(bǔ)償中子(CNL)、密度(DEN)、自然伽馬(GR)、井徑(CAL)、自然電位(SP)、沖洗帶電阻率(RXO)、淺側(cè)向電阻率(RI)、深側(cè)向電阻率(RT)9種,測(cè)井資料統(tǒng)計(jì)情況如表1所示,根據(jù)多種測(cè)錄井解釋方法和試油分析的聯(lián)合標(biāo)定結(jié)果,將研究區(qū)內(nèi)12口開(kāi)發(fā)井的所有層段劃分為干層、水層、油層和油水同層4類(lèi)。

表1 目標(biāo)區(qū)測(cè)井資料統(tǒng)計(jì)Table 1 Logging data statistics in target area
該區(qū)塊地層中鈣質(zhì)含量較低,水層一般為低電阻響應(yīng)特征,深側(cè)向電阻率小于淺側(cè)向電阻率,但負(fù)差異較小,沖洗帶電阻率低,自然伽馬低,井徑顯著增大,自然電位異常幅度最大,且變化幅度劇烈,呈“齒狀”,聲波時(shí)差為中等值。干層的儲(chǔ)層物性一般較差,電阻率低,深淺側(cè)向電阻率無(wú)明顯正負(fù)差異,部分干層由于含鈣質(zhì)導(dǎo)致電阻率增大,沖洗帶電阻率低,自然伽馬低,自然電位可能存在微小異常,井徑無(wú)明顯響應(yīng),聲波時(shí)差低,密度高,中子低。油層電阻率明顯高于水層,一般為水層的3~5倍,深淺側(cè)向電阻率曲線基本重疊且均為高阻特征,沖洗帶電阻率高,自然伽馬值一般較低,自然電位異常幅度較水層小,聲波時(shí)差低且無(wú)明顯變化,曲線呈“箱形”,密度和中子變化平緩。油水同層的測(cè)井響應(yīng)特征介于油層和水層之間,深淺側(cè)向電阻率高于水層且低于油層,其他測(cè)井響應(yīng)特征與油層基本一樣。
目標(biāo)區(qū)塊多種測(cè)井參數(shù)與儲(chǔ)層流體性質(zhì)間無(wú)明顯的線性響應(yīng)特征,且參數(shù)間耦合關(guān)系復(fù)雜,單一的測(cè)井響應(yīng)很難準(zhǔn)確識(shí)別該區(qū)塊的儲(chǔ)層流體性質(zhì),依靠人工解釋時(shí),往往結(jié)合多種測(cè)井參數(shù)綜合識(shí)別,但容易顧此失彼,解釋結(jié)果嚴(yán)重依賴人工經(jīng)驗(yàn),準(zhǔn)確識(shí)別還有賴于綜合利用其他資料,如地震、錄井資料和試油結(jié)論等。因此,可以利用深度神經(jīng)網(wǎng)絡(luò)建立測(cè)井響應(yīng)特征與儲(chǔ)層流體性質(zhì)之間的非線性映射關(guān)系,準(zhǔn)確識(shí)別儲(chǔ)層流體性質(zhì)。
由于深度學(xué)習(xí)良好的自動(dòng)學(xué)習(xí)能力,將所有測(cè)井參數(shù)利用式(5)進(jìn)行歸一化處理后均作為神經(jīng)網(wǎng)絡(luò)模型輸入?yún)?shù),避免了常規(guī)訓(xùn)練模型中半定量化優(yōu)選參數(shù)導(dǎo)致的誤差影響,有效節(jié)省了算法用時(shí)。采用的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。經(jīng)過(guò)多次重復(fù)試驗(yàn),最終確定網(wǎng)絡(luò)參數(shù)為輸入層9個(gè)神經(jīng)元(對(duì)應(yīng)9種測(cè)井參數(shù))、5個(gè)隱含層(神經(jīng)元個(gè)數(shù)依次為20、25、30、25、15,Dropout比例為0.2)、輸出層4個(gè)神經(jīng)元[邏輯數(shù)組{1,0,0,0},{0,1,0,0},{0,0,1,0},{0,0,0,1}分別表示4種流體性質(zhì)]和一個(gè)Softmax層。Softmax層中最大概率值對(duì)應(yīng)的類(lèi)別即為最終分類(lèi)結(jié)果。

圖4 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 The deep neural network structure

(5)
將12口開(kāi)發(fā)井中的10口井?dāng)?shù)據(jù)作為訓(xùn)練樣本集,其余兩口作為測(cè)試樣本集。圖5所示分別為訓(xùn)練集和測(cè)試集的樣本集數(shù)量分布,原始訓(xùn)練集儲(chǔ)層流體中水層段占絕對(duì)優(yōu)勢(shì),在1 297個(gè)樣本中占比達(dá)67.85%,為高度不均衡樣本集,經(jīng)混合采樣后達(dá)到均衡。兩口井?dāng)?shù)據(jù)組成的測(cè)試數(shù)據(jù)集共包括 197個(gè)樣本,其中水層樣本122個(gè),占61.9%;干層樣本46個(gè),占23.4%;油水同層和油層樣本分別為18、11個(gè),僅占9.1%、5.6%,樣本不均衡程度與訓(xùn)練集接近,均為高度不均衡樣本集。

圖5 樣本集數(shù)量分布Fig.5 Distribution of sample set
利用訓(xùn)練得到的深度神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)儲(chǔ)層流體性質(zhì),并對(duì)結(jié)果進(jìn)行綜合評(píng)價(jià)。其中,混淆矩陣是神經(jīng)網(wǎng)絡(luò)多分類(lèi)器中常用的評(píng)價(jià)手段,矩陣中每行代表相應(yīng)類(lèi)別的實(shí)際樣本數(shù),每列代表預(yù)測(cè)樣本數(shù)(表2),評(píng)價(jià)指標(biāo)包括精準(zhǔn)率(Precision),召回率(Recall),F(xiàn)值(F-measure)。式(6)~式(8)為第i類(lèi)樣本(共K類(lèi))的評(píng)價(jià)指標(biāo)表達(dá)式精準(zhǔn)率和召回率從不同維度評(píng)價(jià)多分類(lèi)問(wèn)題,而F值是對(duì)精準(zhǔn)率和召回率的平均估計(jì),是評(píng)價(jià)多分類(lèi)問(wèn)題的最佳參數(shù),F(xiàn)值越高,代表分類(lèi)結(jié)果越好。

表2 識(shí)別結(jié)果混淆矩陣Table 2 Confusion matrix of identification results

(6)

(7)

(8)
式中:Aij為實(shí)際結(jié)果為第i類(lèi)、預(yù)測(cè)結(jié)果為第j類(lèi)的樣本數(shù);β為調(diào)節(jié)精準(zhǔn)率和召回率的權(quán)值常數(shù),取1。
由混淆矩陣可知,對(duì)角位置為正確識(shí)別樣本,水層、干層、油水同層和油層分別為105、35、15、8個(gè),累計(jì)占總樣本數(shù)的比例達(dá)82.7%。兩個(gè)大樣本類(lèi)(水層和干層)的F值分別為88.6%、69.3%,兩個(gè)小樣本類(lèi)(油水同層和油層)的F值分別為90.9%、69.6%。結(jié)果顯示,本文方法在保證了整體識(shí)別率的基礎(chǔ)上,目標(biāo)流體層的識(shí)別率也達(dá)到理想預(yù)測(cè)結(jié)果。
混淆矩陣非對(duì)角位置為錯(cuò)誤分類(lèi)結(jié)果,分析可知,水層與干層之間、油層與干層之間互相誤判的樣本數(shù)較多,分別為24、7個(gè),這兩類(lèi)誤判中均包含干層,其主要原因是干層的測(cè)井響應(yīng)特征不明顯,導(dǎo)致對(duì)其他層段的識(shí)別造成干擾。進(jìn)一步結(jié)合區(qū)塊內(nèi)開(kāi)發(fā)井史得知,部分干層也出現(xiàn)了少量的工業(yè)油氣流,推測(cè)區(qū)塊內(nèi)可能存在“假性”干層。同時(shí),由于采用概率輸出值的不確定性預(yù)測(cè),對(duì)于測(cè)井響應(yīng)不明顯的層位,網(wǎng)絡(luò)輸出值經(jīng)Softmax層得到的 4個(gè)概率間的差異可能較小,將其歸入概率最大值對(duì)應(yīng)的類(lèi)中會(huì)造成結(jié)果的誤判,可根據(jù)實(shí)際情況將樣本類(lèi)別進(jìn)一步細(xì)分來(lái)減少錯(cuò)誤識(shí)別樣本數(shù)量。
將儲(chǔ)層流體性質(zhì)的模型預(yù)測(cè)結(jié)果與人工解釋結(jié)論進(jìn)行對(duì)比,如圖6所示,選取的目標(biāo)層段為其中一口測(cè)試井2 580~2 640 m共60 m的儲(chǔ)層段。該段內(nèi)的含油飽和度So均較高,平均值達(dá)37.2%。結(jié)合測(cè)井響應(yīng)特征、儲(chǔ)層物性特征和試油結(jié)果等,人工解釋結(jié)論將目標(biāo)段劃分為9個(gè)流體層段。其中,油層段有4個(gè),層厚分布不一;油水同層和水層段各有1個(gè),均為厚層;干層有3個(gè),均為薄層。

圖6 人工解釋結(jié)論與模型預(yù)測(cè)結(jié)果對(duì)比Fig.6 Comparison of artificial interpretation conclusions and model prediction results
結(jié)果顯示,厚層段的預(yù)測(cè)結(jié)果與人工解釋結(jié)果完全一致,包括3個(gè)油層段、1個(gè)水層段、1個(gè)油水同層段。這是由于厚層段測(cè)井曲線呈現(xiàn)“鐘形”或“箱形”結(jié)構(gòu),響應(yīng)特征變化幅度小,樣本的輸入測(cè)井參數(shù)在段內(nèi)較為穩(wěn)定,預(yù)測(cè)結(jié)果抗干擾能力強(qiáng),模型對(duì)厚層段的容錯(cuò)率較高。
對(duì)于薄層段,僅有兩個(gè)極薄的干層段被錯(cuò)識(shí)為油層段,主要原因是薄層段“鋸齒形”或“脈沖形”的測(cè)井曲線變化幅度大,選取的測(cè)井輸入?yún)?shù)無(wú)法較好地反映段內(nèi)真實(shí)的測(cè)井響應(yīng)特征。但由于局部的極薄層段在開(kāi)發(fā)過(guò)程中不作為主力產(chǎn)層段,對(duì)整體預(yù)測(cè)結(jié)果的影響可近似忽略。在復(fù)雜儲(chǔ)層流體精細(xì)識(shí)別中,可將模型的預(yù)測(cè)結(jié)果作為預(yù)判,在此基礎(chǔ)上,對(duì)薄層段做進(jìn)一步人工解釋。
為了進(jìn)一步驗(yàn)證混合采樣技術(shù)和Dropout正則化組合策略的應(yīng)用效果,在參數(shù)設(shè)置一致的前提下,以F值為綜合評(píng)價(jià)指標(biāo),設(shè)置3個(gè)參照組與本文方法進(jìn)行對(duì)比,各方法的識(shí)別結(jié)果如圖7所示。其中,4種方法對(duì)水層的識(shí)別效果均較好,F(xiàn)值接近,分布為84%~90%;干層的識(shí)別情況也較為接近,與未采用兩種優(yōu)化策略的結(jié)果相比,本文方法的F值提高了10.2%;4種方法在油水同層和油層中的識(shí)別效果差異顯著,其中,本文方法的識(shí)別效果最好。

圖7 不同優(yōu)化方法的識(shí)別效果(F值)對(duì)比Fig.7 Comparison of identification effects (F-measure) of different optimization methods
分析可知,若未采用混合采樣技術(shù),F(xiàn)值大小與各類(lèi)別的樣本數(shù)量明顯正相關(guān),大部分樣本被歸為水層和干層這兩個(gè)大樣本類(lèi)中,導(dǎo)致水層和干層的識(shí)別效果較好,但油水同層和油層的識(shí)別率極差,驗(yàn)證了混合采樣技術(shù)可顯著提高不均衡樣本集中小樣本類(lèi)的識(shí)別效果。
在未采用混合采樣時(shí),Dropout正則化對(duì)識(shí)別效果的提高不顯著;采用混合采樣對(duì)樣本集進(jìn)行均衡處理后,Dropout正則化顯著提高了油水同層和油層的識(shí)別率,說(shuō)明Dropout正則化在樣本均衡的前提下可有效防止模型“過(guò)擬合”。綜上,充分說(shuō)明了樣本數(shù)據(jù)選取與網(wǎng)絡(luò)結(jié)構(gòu)之間相互制衡和統(tǒng)一的關(guān)系,驗(yàn)證了基于優(yōu)化組合策略的深度神經(jīng)網(wǎng)絡(luò)方法在實(shí)際應(yīng)用中的優(yōu)越性。
針對(duì)常規(guī)儲(chǔ)層流體性質(zhì)識(shí)別中存在識(shí)別效果差、嚴(yán)重依賴人工經(jīng)驗(yàn)的問(wèn)題,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),從樣本數(shù)據(jù)和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化入手,創(chuàng)新性地提出一種綜合混合采樣技術(shù)、ReLU-Softmax激活函數(shù)、Dropout正則化的儲(chǔ)層流體性質(zhì)識(shí)別新方法,建立了儲(chǔ)層測(cè)井參數(shù)與流體性質(zhì)之間的神經(jīng)網(wǎng)絡(luò)模型,得到以下結(jié)論。
(1)優(yōu)化策略的有機(jī)結(jié)合有效提高了儲(chǔ)層流體性質(zhì)的識(shí)別效果。混合采樣技術(shù)使樣本集均衡化,顯著提高了小樣本類(lèi)的識(shí)別率;ReLU-Softmax激活函數(shù)使得多分類(lèi)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)得以優(yōu)化;Dropout正則化降低了模型對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的“過(guò)擬合”。
(2)車(chē)排子油田目標(biāo)井區(qū)12口井資料的識(shí)別結(jié)果顯示:儲(chǔ)層流體性質(zhì)的總體識(shí)別準(zhǔn)確率達(dá)82.7%,樣本量分別僅占9.1%、5.6%的油水同層和油層的識(shí)別率均顯著高于其他未優(yōu)化方法結(jié)果,滿足實(shí)際測(cè)井資料解釋的要求。與其他未優(yōu)化方法的識(shí)別效果對(duì)比,優(yōu)化策略的有機(jī)結(jié)合使得本文方法的流體識(shí)別準(zhǔn)確率大幅提高,進(jìn)一步驗(yàn)證了本文組合優(yōu)化策略在儲(chǔ)層流體性質(zhì)識(shí)別中的優(yōu)越性。展示了深度學(xué)習(xí)在復(fù)雜儲(chǔ)層流體識(shí)別中良好的應(yīng)用效果。