沈 華,宋 煒,唐傳章,張銳鋒,王澤丹,黃新亞,王會來,劉 慧
(1.中國石油天然氣股份有限公司華北油田分公司勘探事業(yè)部,河北任丘062550;2.中國石油大學(北京)地球物理學院,北京102249;3.中國石油天然氣股份有限公司華北油田分公司勘探開發(fā)研究院,河北任丘062550)
隨著油田精細勘探的不斷推進,深層巖性油氣藏和復雜潛山油氣藏成為油氣勘探的重要地質目標,提高地震資料分辨率、改善目的層成像精度已深入到地震勘探的全過程。決定地震分辨率的關鍵是有效頻帶寬度,而制約有效頻帶寬度的兩個主要因素是反射信號的能量和頻寬,因此,如何在地震采集和處理過程中保持有效信號的能量和頻寬,是研究的焦點問題之一。
地震波在地下介質中傳播時,波的能量吸收因素主要來自介質粘彈性引起的吸收作用[1]。在松散的地層或裂隙發(fā)育的地層中,地震波的吸收響應比地震波速響應更為敏感[2-4]。華北油田冀中探區(qū)地表平緩,但表層結構松散且復雜多變、速度低,對地震波的吸收、衰減嚴重,導致地震資料分辨率低,尤其在表層結構復雜地區(qū)地震資料品質較差,難以滿足復雜構造、深潛山和地層巖性勘探的需求[5-8]。巖石物理學研究結果表明,地下介質對地震波的吸收作用與介質固結程度、孔隙度和孔隙充填物關系密切[9-10]。因此,固結巖層的吸收規(guī)律不能簡單地應用于表層未固結低、降速帶。在常規(guī)地震資料處理中,地震波的吸收衰減補償只針對淺、中、深層,而表層低、降速帶介質對地震子波的吸收衰減基本未進行補償。為了更好地消除復雜近地表因素對采集、處理帶來的影響,需要對近地表結構有清晰的認識,并獲取準確的近地表結構屬性參數(shù)模型,如低、降速帶厚度、速度、品質因子(Q)等。多年來,諸多學者在復雜近地表結構特征參數(shù)調查[2-4]、激發(fā)條件及觀測方式[5-8]、復雜近地表的吸收衰減因子求取與有效補償[11-21]、復雜近地表速度建模及靜校正[22-24]等方面開展了大量的研究,并取得豐碩的研究成果。華北油田冀中探區(qū)表層結構的復雜性、介質不均勻性以及未固結低、降速帶嚴重的吸收衰減,使得表層地震波的衰減補償變得十分復雜。
本文針對華北油田實際生產面臨的兩個問題開展研究。一個是在高吸收衰減區(qū)地震資料分辨率和信噪比低,往往處理后,再要求施工方補炮,延誤了數(shù)據(jù)采集的進度。另一個是基于環(huán)保的需要和對資料精度的要求,2018年底華北油田引進自適應非線性掃描激發(fā)采集技術,在冀中探區(qū)同口三維工區(qū)開展可控震源采集,由于自適應非線性掃描激發(fā)需要在每個激發(fā)點先按常規(guī)線性掃描激發(fā),然后根據(jù)接收的單炮數(shù)據(jù)設計自適應激發(fā)參數(shù),導致野外施工進度緩慢,成本增加,當時提出了施工前將近地表分類,再根據(jù)近地表類別分別進行常規(guī)線性掃描采集,確定不同類別地表條件下的自適應激發(fā)因子,具體施工時,按分類結果實施,但是由于時間倉促,未能提出較好的分類算法,主要采用平均衰減因子作為分類依據(jù),由于分類太粗,在生產中并不能滿足需求。
本文在前人研究的基礎上,利用冀中探區(qū)近萬平方公里范圍內的微測井解釋成果,在構建和分析近地表結構特征屬性參數(shù)的基礎上,基于機器學習的平衡迭代規(guī)約和層次聚類分析(balanced Iterative reducing and clustering using hierarchies,BIRCH)方法[25-28],對華北油田冀中探區(qū)進行了多屬性參數(shù)分類劃分,將不同類別勘探區(qū)域的表層吸收衰減參數(shù)用于采集參數(shù)設計優(yōu)化和地震資料處理,為深化華北油田冀中探區(qū)復雜地質目標的地震勘探提供有效的技術支撐。
華北油田冀中探區(qū)雖然地表平緩,但表層結構復雜多變,特別是人類活動對表層結構的改造,加劇了表層結構的縱橫向變化。從高程數(shù)據(jù)可以看出,冀中探區(qū)地勢總體平坦,南、北部較高,中間區(qū)域較低,海拔在-1.7~36.8m,平均海拔14.24m(圖1)。探區(qū)表層結構變化復雜,低、降速帶厚度從幾米到四五十米,橫向變化劇烈。地震勘探過程中,由于表層結構松散、速度比較低,因而對地震波的吸收、衰減非常嚴重,一些表層結構復雜的地區(qū)地震資料品質較差,甚至得不到有效的深層反射信息。受表層和深層條件雙重影響,研究區(qū)內已有的一次和二次三維采集的地震資料信噪比低、頻帶窄,深層地震波吸收衰減嚴重,處理、解釋結果達不到實際生產的要求。

圖1 華北油田冀中探區(qū)地表高程分布情況
通過微測井數(shù)據(jù)分析將華北油田冀中探區(qū)近地表分為低速層、降速層,冀中探區(qū)低、降速層的厚度(h)不同,速度橫向上也有顯著差別(圖2)。
球面擴散是導致反射信號能量降低的主要因素,吸收是使反射信號頻帶寬度變窄的主要因素,其中表層吸收尤為嚴重,是降低分辨率的主要因素之一。描述介質吸收性質的有關參數(shù)包括吸收系數(shù)α和品質因子Q。均勻吸收介質中傳播的平面波振幅方程為:
A(r,t)=A0e-αrω(t)
(1)

圖2 低、降速層厚度及速度屬性
在吸收介質中,振幅隨傳播距離的增大而呈指數(shù)減小。其中,r為地震波的傳播距離,A0是初始振幅,A是地震波傳播r后的振幅譜,ω(t)是波動函數(shù),α為吸收系數(shù)。品質因子是用來度量介質對地震波能量吸收衰減的參量,地震勘探中常用能量損耗因子來表達:
(2)
其中,在諧波激勵情況下,ΔE表示每震動一個周期的能量損耗量,E表示系統(tǒng)中處于最大應力和應變狀態(tài)下的瞬時彈性勢能,品質因子Q代表了儲能與耗散能量之比,1/Q表示能量損耗因子,其值越大說明地層對地震波的吸收衰減作用越劇烈。由對數(shù)函數(shù)關系表可知,品質因子是一個正數(shù),Q值越小,能量損耗越大。圖3是冀中探區(qū)低、降速帶品質因子屬性圖,可見探區(qū)內品質因子變化較大。地震波在近地表傳播衰減過程可以表示為:
(3)
式中:Hi為第i層的厚度;Vi為第i層的速度;Qi為第i層的Q值;W0(f)為初始地震波的頻譜;WN(f)為地震波在近地表傳播N層后的頻譜;f為頻率。
基于公式(3),根據(jù)地表速度、Q值和厚度可以模擬地震信號不同頻率成分經過地表傳播后的相對衰減量。頻率越大,衰減量越大。圖4給出了不同主頻的子波能量相對衰減量。由圖4可見,不同頻率成分有不同的衰減量,特別是高頻成分,在穿透低、降速帶時,衰減更嚴重?;诠?3),對比分析了主頻為30Hz的雷克子波經過地表傳播后峰值頻率和頻寬的變化(圖5)。由圖5a和圖5b可見,衰減越嚴重的地區(qū),峰值頻率和頻寬減小得越多。為了進一步評價子波穿過近地表后能量的變化,通過對比分析衰減前、后子波峰值振幅比屬性(圖5c)和子波總能量比屬性(圖5d)來研究地表橫向衰減特征的變化。由圖5c 和圖5d可以看出,在高衰減區(qū)域,無論是子波峰值振幅比還是子波總能量比其變化都很明顯,因此低、降速帶不僅對地震資料的分辨率有影響,對信噪比也同樣有影響。
為了研究近地表本身屬性的影響,需要將與地震信號有關的物理參數(shù)消除。定義:
(4)
式中:QNA為N層近地表介質的平均衰減效應因子,其與近地表地層條件有關,與頻率和地震信號的特征無關。利用華北油田冀中探區(qū)的微測井資料計算得到的QNA見圖6a;以QNA為基準,以子波衰減前、后最大振幅比和能量比為參考,將冀中探區(qū)表層條件分為3類(圖6b)和9類(圖6c)。3類表層條件的具體劃分閾值細節(jié)如下。

圖3 冀中探區(qū)低、降速帶品質因子(Q)

圖4 不同主頻的子波能量相對衰減量

圖5 30Hz雷克子波穿透低降速帶后屬性變化情況
1) 第1類:QNA<0.01,該表層表現(xiàn)為輕度衰減。
2) 第2類:0.01 3) 第3類:QNA>0.023,該表層表現(xiàn)為嚴重衰減。 9類表層條件的具體劃分閾值細節(jié)這里不贅述。 基于上述分類結果,分別就不同地表類型對地震信號的分辨率、振幅衰減、頻譜特征和信噪比的影響開展討論。圖7a給出了目的層時間厚度Δt=16ms,對于不同地表類型,以主頻30Hz雷克子波穿透近地表,再由目的層頂、底反射回地面,觀測到的反射波對地層的分辨能力。圖7a中藍色線是第1類近地表條件,屬于低衰減區(qū),薄層可以分辨;紅色線是第2類近地表條件,屬于中等衰減區(qū),薄層不可分辨;綠色線是第3類近地表條件,屬于高衰減區(qū),薄層不可分辨。圖7b給出了目的層時間厚度Δt=25ms,對于不同地表類型,以主頻30Hz雷克子波穿透近地表,再由目的層頂、底反射回地面,觀測到的反射波對地層的分辨能力。圖7b中藍色線是第1類近地表條件,屬于低衰減區(qū),薄層可以分辨;紅色線是第2類近地表條件,屬于中等衰減區(qū),薄層可分辨;綠色線是第3類近地表條件,屬于高衰減區(qū),薄層不可分辨。由圖7可見,在地震資料的采集處理過程中需要考慮地表的影響。圖8展示的是主頻30Hz雷克子波穿過不同類型的地表后子波波形和頻譜變化規(guī)律。由圖8 可見,第3類區(qū)域子波振幅衰減嚴重(圖8a中綠色子波);第1、2、3類區(qū)域子波頻譜主頻向低頻方向移動,頻帶變窄(圖8b)。 圖6 利用華北油田冀中探區(qū)的微測井資料計算得到的平均衰減效應因子(a)以及基于衰減因子門檻值的3類(b)和9類(c)分類結果 圖7 不同地表類型對不同目的層厚度的分辨率影響(雷克子波主頻30Hz) 圖8 主頻30Hz雷克子波穿過不同類型的地表后子波波形(a)及頻譜(b)變化規(guī)律 地震信號的信噪比和地表條件密切相關。在相同噪聲水平下,由于地表條件不同,有效信號的衰減量不同,因此反射地震數(shù)據(jù)信噪比也不同。如圖9所示,含噪聲主頻30Hz雷克子波穿過第1類輕度或無衰減區(qū)域后信噪比最高(信噪比為3.20),第2類次之(信噪比為0.90),第3類由于信號衰減嚴重,信噪比較低(信噪比為0.06),有效信號幾乎淹沒在噪聲中。盡管上述分類方式具有一定的指導意義,但是這種分類方式要根據(jù)具體的地質情況確定分類門檻,而且門檻的設定對分類結果影響較大,將復雜地表結構簡單地分成3類,在生產實踐中難以起到指導作用,因此需要新的分類劃分方法。 圖9 不同地表條件對反射地震數(shù)據(jù)信噪比的影響 BIRCH算法是由ZHANG等[28]提出的對大規(guī)模數(shù)據(jù)集進行聚類分析的一種非常有效的基于距離的層次聚類算法。該算法首先采用自底向上的層次聚類算法,然后再通過迭代重定位來改進聚類結果。BIRCH算法利用聚類特征樹(clustering feature tree,CF Tree)來實現(xiàn)快速聚類。特征樹的節(jié)點由多個聚類特征(clustering feature,CF)組成。CF是一個由(N,LS,SS)來表示的三元組,其中,N代表CF中擁有的樣本點的數(shù)量;LS代表CF中樣本點各特征維度的和;SS代表CF中樣本點各特征維度的平方和。例如,在CF Tree某個節(jié)點的某個CF中,有5個樣本(1,3),(3,5),(2,4),(4,6),(5,7),則其三元組參數(shù)N=5,LS=(1+3+2+4+5,3+5+4+6+7)=(15,25),SS=(12+32+22+42+52+32+52+42+62+72)=190。CF滿足線性運算,如CF1+CF2=(N1+N2,LS1+LS2,SS1+SS2)。在CF Tree上,對于每個父節(jié)點中的CF節(jié)點,它的(N,LS,SS)三元組的值等于這個CF節(jié)點所指向的所有子節(jié)點的三元組之和。CF Tree的重要參數(shù)有:①每個內部節(jié)點的最大CF數(shù)B;②每個葉子節(jié)點的最大CF數(shù)L;③葉子節(jié)點每個CF的最大樣本半徑閾值T,即在CF中所有樣本點一定要在半徑小于T的超球體內。 在聚類開始時,CF Tree是空的,首先從訓練集讀入第1個樣本點,將它放入新的CF三元組A,該三元組的參數(shù)N=1,將新的CF作為根節(jié)點,此時的CF Tree如圖10a所示。繼續(xù)讀入第2個樣本點,如果該樣本點和第1個樣本點A在半徑為T的超球體范圍內,則屬于同一個CF,將該點也加入CFA,此時A的三元組參數(shù)N=2,CF Tree如圖10b所示。繼續(xù)讀入第3個樣本點,如果不能融入前面的節(jié)點形成的半徑為T的超球體內,則需要新的CF三元組B來容納這個新值。此時根節(jié)點就由兩個CF三元組A和B組成,CF Tree如圖10c所示。讀入第4個樣本點時,如果它和B在半徑小于T的超球體內,則更新后的CF Tree如圖10d所示。 當葉子節(jié)點的最大CF數(shù)L=3時,隨著樣本點的不斷讀入,CF Tree的節(jié)點需要分裂,假設分裂前的CF Tree如圖11a所示,葉子節(jié)點LN1有3個CF,LN2和LN3各有兩個CF。當新的樣本點讀入時,可發(fā)現(xiàn)它離LN1節(jié)點最近,因此需要判斷它是否在sc1,sc2,sc3這3個CF對應的超球體之內,如果不在,則要建立一個新的CF,即sc8來容納它。如果設定葉子節(jié)點的最大CF數(shù)L=3,即LN1的CF個數(shù)已經達到最大值,不能再創(chuàng)建新的CF,就需要將LN1葉子節(jié)點分裂為二,并從LN1所有CF元組中,找到兩個最遠的CF作為這兩個新葉子節(jié)點的種子CF,然后將LN1節(jié)點里所有CF(sc1,sc2,sc3),以及新樣本點的新元組sc8劃分到兩個新的葉子節(jié)點上。LN1節(jié)點分裂后的CF Tree如圖11b所示,如果設定內部節(jié)點的最大CF數(shù)B=3,則此時葉子節(jié)點一分為二會導致根節(jié)點的最大CF數(shù)超出范圍,因此根節(jié)點也要分裂,分裂的方法和葉子節(jié)點分裂一樣,分裂后的CF Tree如圖11c 所示。當所有的訓練集樣本建立了CF Tree,一個基本的BIRCH算法就完成了,對應的輸出就是若干個CF節(jié)點,每個節(jié)點里的樣本點就是一個聚類的簇。因此BIRCH算法的主要過程就是建立CF Tree的過程。 BIRCH算法的主要優(yōu)點有:①節(jié)約內存,所有的樣本都保存在磁盤上,CF Tree只保存了CF節(jié)點所對應的指針,聚類特征樹概括了聚類的有用信息,并且占用空間較元數(shù)據(jù)集合小得多,可以存放在內存中,從而可以提高算法在大型數(shù)據(jù)集合上的聚類速度及可伸縮性;②只需要掃描訓練集一次就可以建立CF Tree,且CF Tree的增、刪、改都很快速,因此聚類速度快;③可以識別噪聲點,還可以對數(shù)據(jù)集進行初步分類的預處理。BIRCH算法的主要缺點有:①由于CF Tree對每個節(jié)點的CF個數(shù)有限制,導致聚類結果可能和真實的類別分布不同;②對高維特征數(shù)據(jù)聚類效果不好,比如樣本數(shù)據(jù)維度超過20,此時可以選擇Mini Batch K-Means。 圖12a為隨機生成的樣本數(shù)據(jù),共1000個樣本,每個樣本2個特征,共4個簇;圖12b是不指定聚類類別數(shù)得到的聚類結果,共分為8個類簇;圖12c是指定類別數(shù)為4時得到的聚類結果。由圖12b和圖12c 可見,如果對數(shù)據(jù)的類別屬性有所了解,指定類別數(shù)可獲得更好的聚類結果。圖13顯示的是由兩組1500個點構成的隨機樣本,一組是兩個圈形數(shù)據(jù),另一組是兩個月牙形數(shù)據(jù),分別采用K-means和BIRCH算法進行聚類得到的結果。對比聚類結果可以看出,傳統(tǒng)K-means聚類方法主要依據(jù)樣本點的距離關系進行聚類,因此聚類結果和真實數(shù)據(jù)分布不一致,如圖13a和圖13c將圈形和兩個月牙形的樣本簇按距離遠近進行聚類,得出了錯誤的聚類結果。而本文所述的BIRCH算法則是一種基于距離的層次聚類算法,根據(jù)其樹形結構的特征層次聚類思想,得到如圖13b和圖13d的正確聚類結果。而本文所涉及的問題,即近地表類別的變化類似于圖13所示的樣本點分布,需要基于多屬性的層次關系,尋找到正確的聚類結果,因此最終選用了BIRCH算法。當然,在機器學習領域,還有很多聚類算法,比如DBSCAN、凝聚層次聚類、譜聚類等都可以取得和BIRCH方法類似的效果,因為本文的重點不是分析算法的差異,因此不作詳細對比分析。 圖10 聚類特征樹生成示意 圖11 CF Tree節(jié)點分裂示意 圖12 隨機樣本不同參數(shù)BIRCH聚類結果 圖13 兩組隨機樣本分別采用K-means和BIRCH聚類方法得到的結果 本文以華北油田冀中探區(qū)近10000km2范圍內的微測井處理解釋成果資料為基礎,用于多屬性聚類分析的向量由以下屬性構成:近地表高程,低、降速帶速度、厚度、Q值,不同主頻率(10Hz,20Hz,30Hz,40Hz)的雷克子波能量相對衰減量,主頻30Hz雷克子波峰值振幅比屬性、總能量比、峰值頻率屬性、頻帶寬度屬性,平均衰減因子屬性。 BIRCH多維向量層次聚類假設特征數(shù)據(jù)為正態(tài)分布(即滿足零均值且單位方差呈高斯分布),需要對輸入多屬性向量數(shù)據(jù)進行標準化,使其滿足正態(tài)分布。算法實現(xiàn)中,以Scikit-Learn的開源數(shù)學庫為基礎,選擇其中的Preprocessing.StandardScalar函數(shù)實現(xiàn)輸入數(shù)據(jù)標準化[25]。按上述方法,完成了研究區(qū)近10000km2的無監(jiān)督BIRCH聚類分析研究。 圖14給出了基于BIRCH多維向量層次聚類方法得到的近地表結構分類結果。圖14中將冀中探區(qū)分為9類,與圖6b的分類結果相比,將近地表結構的差異劃分得更加細致,圖14中劃分的1、2、3類相當于圖6b中的第3類,對應吸收衰減比較嚴重的區(qū)域;4、5、6類相當于圖6b中的第2類,對應吸收衰減中等區(qū)域;而7、8、9類相當于圖6b中的第1類,對應吸收衰減相對較弱的區(qū)域。對比圖14和圖6c可見,盡管圖6c也通過門檻值將平均衰減因子屬性劃分成了9類,但是分類細節(jié)還是不如多屬性參數(shù)BIRCH聚類分析方法。由此可見,兩種分類方法有一定相關性,但是BIRCH聚類分析方法無需人為設定任何門檻值,更易于實現(xiàn),且分類更精細。例如圖14中左下角紅色區(qū)域和右上角橙色區(qū)域,按圖6采用的分類方法都歸為第3類,實際上從圖2的低、降速帶厚度、速度和圖3中的Q值分布來看,這兩個區(qū)域還是有明顯差異的。 沿圖14中測線AA′和BB′進行吸收衰減試驗來驗證近地表結構對子波能量、分辨率和信噪比的影響。圖14中的a1,b1分別表示主頻為30Hz的雷克子波穿透測線AA′和BB′所在位置的低、降速帶層,經吸收衰減后波形特征的變化,可以明顯看到,不同類別地層對子波波形的改變。圖14中的a2,b2分別表示主頻為30Hz的雷克子波穿透測線AA′和BB′所在位置的低、降速帶層,然后透過一個厚度為Δt=20ms的地層反射回來后的子波,可見低衰減區(qū)域分辨率明顯高于高衰減區(qū)域。圖14中的a3,b3分別表示主頻為30Hz疊加隨機噪聲的雷克子波在相同信噪比情況下穿透測線AA′和BB′所在位置的低、降速帶層,經吸收衰減后的子波??梢悦黠@看到,低、降速帶對地震資料信噪比的影響。 圖14 基于BIRCH多維向量層次聚類方法得到的近地表結構分類結果 在實際應用中,通常要考慮不同類別的近地表結構下激發(fā)條件對地震資料品質的影響。冀中探區(qū)的三維地震資料采集以井炮為主,圖15給出了圖14中C點所在位置采用BIRCH聚類方法得到的1類區(qū)域不同激發(fā)深度的單炮記錄,由圖15可見,激發(fā)深度對單炮質量的影響明顯。圖16給出了圖14中D點所在位置采用BIRCH聚類方法得到的1類區(qū)域不同藥量激發(fā)的單炮記錄。由圖16可見,同樣在高速頂以下15m激發(fā),采用的炸藥量不同,單炮記錄品質明顯不同。小藥量激發(fā)的單炮記錄高頻低能,大藥量激發(fā)的單炮記錄低頻高能,隨著藥量的增加,單炮記錄質量提高。由圖16h可見,繼續(xù)增大藥量,單炮記錄的質量提高有限,但生產成本卻明顯提高,因此在采用BIRCH聚類方法得到的1類區(qū)域,激發(fā)藥量達到8~9kg即可滿足生產要求。 圖15 基于BIRCH多維向量層次聚類方法得到的1類區(qū)域不同激發(fā)深度的單炮記錄(激發(fā)藥量為8kg) 圖16 基于BIRCH多維向量層次聚類方法得到的1類區(qū)域相同激發(fā)深度(15m)下不同藥量的單炮記錄 另外,在觀測系統(tǒng)設計時,可采用如圖14所示的分類結果進行分區(qū)設計,如BIRCH聚類分析的1類區(qū)域,屬于強吸收衰減區(qū)域,可采用加密炮增加覆蓋次數(shù)提高信噪比。 本文方法采用多種屬性參數(shù)構成的向量作為輸入進行空間聚類分析,可有效克服基于平均衰減因子的單屬性劃分近地表特征的缺點,提高分類劃分的精度。當然,輸入參數(shù)的多少也值得關注。圖17a是采用12個屬性參數(shù)(去掉低、降速層的速度和厚度屬性)進行BIRCH聚類分析得到的近地表結構平面分布圖。從圖17a可見,分類結果大體趨勢上和圖14一致,但是缺少細節(jié)信息。圖17b是采用8個屬性參數(shù)(去掉了低、降速層的Q值屬性)進行BIRCH聚類分析得到的近地表結構平面分布圖。從圖17b可見,分類結果大體趨勢和圖14一致,但更加平滑??梢?如果用來聚類的屬性相關度不是太大,保留多屬性聚類分析,可以更加精細地描述表層特征的變化。 圖17 基于BIRCH多維向量層次聚類方法得到的近地表結構平面分布 近地表參數(shù)的變化,對地震資料的信噪比、分辨率有直接影響,因此無論是資料采集還是處理,確定目標區(qū)近地表結構類別,并合理利用,是提高采集資料品質和處理質量的關鍵環(huán)節(jié)。本文引入無監(jiān)督機器學習的BIRCH多屬性向量層次聚類方法劃分近地表結構類型,可以有效克服基于平均衰減因子屬性分類劃分的缺點,提高近地表結構分類劃分精度和可靠性,理論模型和實際資料分析結果證明了本文方法的有效性,并得出以下結論: 1) 平均衰減因子屬性可以作為近地表結構劃分的參考性屬性,但是由于門檻值很難把握,因此在實際應用中并不是好的分類依據(jù); 2) 基于無監(jiān)督機器學習的BIRCH多屬性向量層次聚類分析方法,可以很好地利用近地表多屬性參數(shù)向量實現(xiàn)近地表結構的分類劃分,為觀測系統(tǒng)設計和地震資料激發(fā)、接收和處理提供幫助; 3) 通過對華北油田冀中探區(qū)近地表結構的分類劃分及其對地震資料信噪比和分辨率的影響因素分析,認為基于近地表多屬性參數(shù)聚類分析結果優(yōu)化地震資料采集和處理參數(shù)是可行的,為地震資料采集和處理參數(shù)優(yōu)化提供了新依據(jù)。



2 平衡迭代規(guī)約和層次聚類方法原理
2.1 BIRCH算法核心思想
2.2 聚類特征樹的生成




3 應用效果分析




4 結論