張鳳東, 劉景亮, 黃學斌, 石 磊
(中國石油化工股份有限公司石油勘探開發研究院,北京 100083)
預測儲量是指在圈閉預探階段預探井獲得了油氣流或綜合解釋有油氣層存在時,根據區域地質條件分析和類比,有進一步勘探升級價值的儲量[1]。預測儲量發現后,對預測儲量進行合理評價和升級是石油公司勘探開發過程中的一項重要任務,它直接影響著勘探開發決策部署和儲量接替。因此開展預測儲量升級潛力研究具有重要的現實意義。
一些學者對儲量升級動用及應用聚類分析方法進行了相關研究。秦偉軍等[2]以油氣預測儲量區塊為研究對象,提出了油氣預測儲量區塊升級綜合評價方法。采用聚類分析方法,不同學者對儲層分類、產能預測、融合算法等進行了研究[3-6]。譚鋒奇等[7]以克拉瑪依礫巖油藏為例,基于聚類分析方法對儲層類型進行了精細劃分。也有學者從不同角度對儲量替代率預測方法等進行了研究[8-13]。
為此,應用聚類分析方法,將有升級潛力的單元從預測儲量中快速篩選出來,不僅能為下一步儲量升級動用提供控制儲量目標,為勘探開發部署提供決策依據,而且能夠提高決策效率、節省研究成本。
預測儲量升級主要取決于儲量本身的內在要素及當前的認識程度,如油氣藏地質條件、品位和儲量規模等[2],而油藏圈閉類型、儲層類型、儲量豐度、埋深、產能、儲量規模等因素對儲量升級都有較大的影響。從儲層物性來看,孔隙性、滲透性及流體飽和度等對能否升級具有直接的影響,而原油地下黏度及地面密度是決定開發難易的重要條件,也影響儲量升級的重要因素。還有政策及外部環境等條件,雖然也會影響儲量升級,但在此不作為研究對象。
根據儲量升級的主要影響因素,運用聚類分析方法對預測儲量單元和控制儲量單元進行統計、計算、歸類,從預測儲量中找出和控制儲量相似程度高的儲量,從而優選出預測儲量單元。聚類分析就是將儲量單元分組形成多個類或簇,在同一個類中的單元具有較高的相似度,而不同類中的單元差別較大。核心是通過對多個儲量單元特征信息的綜合分析,從大量數據中尋找隱含的數據分布規律,將數據體中具有相似地質特征、物性特征、產能等特征的儲量單元分為同一類,從而達到在預測儲量中找出目前可升級儲量的目的。
聚類結果是反映原始數據的自然結構特征,以發現原始數據中某些潛在的聯系和特征。聚類算法要使類間對象(樣本)的相似性盡可能小,類內對象的相似性要盡可能大,同一類對象具有相近的宏觀和微觀特征,從而實現聚類的有效劃分。常用的聚類分析方法有快速聚類法、系統聚類法和二階聚類法[12]。
2.1.1 快速聚類分析
快速聚類法又稱為k-mean聚類法,是一種迭代求解的聚類分析算法,具有分類高效、易于操作、擴充性好等特點。快速聚類對儲量單元分類的基本思路:判斷每個單元儲量與每類儲量的相近程度,然后將其合并到最近的類中。聚類中心以及分配給它們的單元就代表一個類。每分配一個新成員,各聚類中心會根據現有的單元被重新計算。重復再分配的過程,直到每類中心包含的單元不再變化。算法過程:①選擇n個初始聚類中心;②計算每個單元與這n個中心各自的距離,按照最小距離原則分配到最近聚類;③重新計算,使用每個聚類中的樣本單元均值作為新的聚類中心;④重復步驟②和③,直到聚類中心不再變化;⑤結束,得到n個聚類。
2.1.2 系統聚類分析
系統聚類是聚類分析中常規方法。在系統聚類的過程中,首先判斷不同樣本之間的相似程度,每次將具有最小歐式距離的兩個類合并,合并后再重新計算類與類之間的距離,再次進行合并,直至所有樣本都歸為一類為止,得到系統最終聚類結果,同時可繪出聚類過程譜系圖。
2.1.3 二階聚類分析
二階聚類又稱兩步聚類,主要用來揭示數據內在的自然分組[12]。二階聚類整個聚類過程分為前后兩大步驟來完成,第一步對所有單元進行距離考察,構建聚類特征樹,同一個樹節點內的記錄相似度高,相似度低的則會生成新的節點;第二步,在分類樹的基礎上,用凝聚法對節點進行分類,每一個聚類使用Bayesian信息準則(BIC)或Akaike信息準則(AIC)進行判斷,得出最終的聚類結果。
預測儲量升級潛力優選的聚類分析就是以儲量單元本身的特性為基礎,對比與控制儲量的相似性或相異性,并根據這種相似或相異程度將其劃分為不同的類。聚類結果要滿足合理性及進一步研究的可操作性,既反映同類間性質的相似性,又把和控制儲量對象差別大的單元劃出去,利于從預測儲量中篩選出可升級單元。為此,利用聚類分析方法對預測儲量的優選升級可遵循以下流程。
(1)確定所要考察的預測和控制儲量單元。
(2)檢查整理數據,補齊缺失值,消除異常點,保證數據的完整性、系統性和合理性。
(3)確定性能評估方案,聚類的內部度量標準以及實際評價中對分類精度的要求和深入研究的可操作性。
(4)選擇聚類范圍,如同一盆地。也可根據需要選擇聚類范圍,比如細分沉積相,在同一構造沉積相中計算,例如控制儲量、預測儲量沉積相都選擇灘壩砂。
(5)對數據集進行挖掘。
(6)得出計算結果,對聚類結果進行分析。
首先選取聚類變量。由于參與聚類的變量決定聚類的結果,因此篩選有效的聚類變量非常重要。從影響聚類的多種因素中抽取相關性強的變量進行類比,以對所有樣本數據進行有效分類,進而從中優選出目標單元。
把選擇的456個預測儲量單元和946個控制儲量單元放在一個系統中作為數據源,運用SPSS統計分析軟件,對系統中的樣品集數據進行快速聚類。選擇計算單元名稱作為標注個案,把地質儲量、有效厚度、油氣藏埋深等15項數值型參數作為計算變量,使用k-mean聚類法對大系統中的數據進行迭代計算,直至所有類中心收斂。計算結果如表1所示,方差分析F檢驗值及顯著性表明各參數對聚類分析的顯著影響程度。

表1 聚類變量篩選方差分析Table 1 Analysis of variance of cluster variable selection
依照聚類均方應大于誤差均方的原則,根據F檢驗值和顯著性大小聚類計算結果,確定儲量單元聚類的主控因素主要為:地下黏度、有效孔隙度、豐度、油藏埋深、凝固點、含油飽和度、滲透率、技術可采儲量、地面密度、地質儲量,其次為單元面積、采收率,而千米井深日產量、硫含量和儲層有效厚度的F最小,類間處理的不同帶來的差異小于類內個體差異所帶來的差異,故在聚類分析時去除該3類變量,保留其余12項變量參與聚類分析。
再選取2017年渤海灣盆地稀油油藏366個保有控制儲量單元、118個新增預測儲量單元,共484個單元作為樣本分析的數據源,采用快速聚類法對各儲量單元進行計算,根據距離和相似性逐次分解、合并,經多次集群至所有類中心收斂,把所有單元分類到不同的類中得出最終聚類結果。
如表2所示,聚類計算把20個預測儲量單元和175個控制儲量單元歸為一類, 表明該20個預測儲量單元和控制儲量單元具有較高的相似性,這為下一步升級動用提供了明確的優選目標。在選出的這20個預測儲量單元其中,經實際驗證,截至2018年底已有永斜558、利943、樁海111(5)等9個單元升級為控制儲量單元,升級率已達45%。可見通過聚類分析優選潛力預測儲量單元具有較高的準確度。表2為選出的11個預測儲量單元及9個證實已升級為控制儲量的預測儲量單元。
聚類結果方差分析如表3所示。從表3可以看出,各變量聚類均方差都遠大于誤差均方差,且顯著性水平均遠小于0.05,說明拒絕12個變量使各類之間無差異的假設,表明參與聚類分析的12個變量能很好地區分各類,類之間的差異足夠大,能夠較好地把具有相同特征的單元歸于一類,同時把不同類的單元分開。
通過系統聚類,能夠表明聚類的整個過程及各類之間的距離。冰柱圖代表了不同類的聚集過程,把所有單元的聚類過程直觀地表現出來。從冰柱圖可以看出,選出的樁海111(5)、樁海111(4)、樁海111(3)、樁海111(2)等目標單元,在聚類過程中經不同次的聚類計算,最終歸為同一類。圖1為一部分單元的聚類過程。

圖1 系統聚類分析冰柱圖Fig.1 System cluster analysis icicle diagram
(1)影響預測儲量升級的主要因素是儲量本身的內在品質及認識程度。計算表明影響儲量單元聚類的主控因素為:黏度、有效孔隙度、豐度、油藏埋深、凝固點、含油飽和度、滲透率等要素。
(2)聚類分析根據儲量本身屬性定量確定各儲量單元之間的親疏程度并進行歸類。應用該分析技術,不僅能對可升級預測儲量進行早期識別,加快儲量升級動用節奏,為勘探開發部署提供決策依據,而且能夠節省研究人員時間和精力,降低研究成本、提高決策效率。
(3)利用聚類分析方法選出的預測儲量,作為具有優先升級潛力的單元,還需結合圈閉構造、儲層連續性及評價井試采等認識確定當前預測儲量能否升級為控制儲量。