譚鑫龍
(重慶科技學院,重慶 401331)
國內大部分油田投產后都會進行注水開發,保證長期穩產并維持地層壓力。通過研究注采井之間的連通性,有助于了解油藏的性質,指導注水開發方案的設計及調整,對穩產、控水和提高采收率具有重要意義[1]。注采井之間連通性的判斷方法分為傳統方法和動態反演法。傳統方法主要為地球化學法[2]、試井法[3]、示蹤劑測試法[4]和數值模擬法[5],這些方法操作復雜、成本高、工作時間長,對生產影響較大,需要分析油藏注采的動態情況并進行反演,明確注采井組間的連通情況;動態反演法主要為Spearman相關法[6]、多元線性回歸法[7]、神經網絡模型分析法[8]、系統模型分析法[9]等,這些方法操作簡便,價格低廉,對生產影響較小。文中基于循環神經網絡(RNN)與動態時間規整(DTW)算法,模擬應用機器學習方法并進行注采井間連通性分析,開展注采井組的井間連通狀況的研究。
井間連通性的判斷主要有以下四個步驟:①對井組的歷史注采數據進行預處理;②應用RNN神經網絡對注水量與產液量在時間序列上進行訓練,并預測生產井產液量;③將預測的產水量與注入井注水量數據輸入到DTW算法中進行相似性判斷;④確定注采井組之間的連通狀況。
通過構建RNN神經網絡模型,對油田生產數據進行訓練及優化,并預測油井未來產量;再使用DTW算法建立注水井與生產井之間的連通關系模型,明確注采井間的連通情況。
2.1.1 循環神經網絡(RNN)
循環神經網絡是一種特殊的神經網絡,其特點是存在回歸環路,可以在序列數據的基礎上進行預測和分析,也可以用于處理序列數據,例如語音識別、文本生成、機器翻譯等。與普通神經網絡的不同之處在于,循環神經網絡可以保存之前的狀態并將其作為當前狀態的輸入,利用前面的信息對后面的輸入數據進行更準確地預測。
模型結構為:輸入層、隱藏層和輸出層。隱藏層中的每個神經元將當前時刻的輸入數據和上一個時刻的隱藏狀態結合,并通過激活函數進行計算,得到當前時刻的隱藏狀態;輸出層中的神經元將當前時刻的隱藏狀態作為輸入,并通過計算得到當前時刻的輸出。
循環神經網絡有多種不同的變體,例如:長短時記憶網絡(LSTM)和門控循環單元(GRU)等,這些變體的目的是為了解決循環神經網絡的一些問題,例如長時間依賴問題,即在處理長序列數據時,隨著時間的推移,循環神經網絡對之前信息的依賴會逐漸減少,導致預測結果不準確。這些變體需要通過引入門機制來解決長時間依賴問題,從而提高循環神經網絡的預測精度。
總的來說,循環神經網絡是一種非常有用的深度學習模型,可以用于處理序列數據,并在不同領域取得了較好的成果。在石油工程中,運用循環神經網絡模型可以用來記憶油井產量遞減規律與影響特征規律,預測油井未來產量,其計算方法是在時序方向上進行遞歸且所有的節點(循環單元體)以鏈式連接的方式遞歸,遞歸方程如下[10]:
h(t)=f(uh(t-1)+wX(t)+b),y(t)=g(vh(t)+c)
(1)
y(t)=f(uy(t-1)+wX(t)+b),y(t)=g(vh(t)+c)
(2)
式中:f和g為激勵函數,例如邏輯斯蒂函數或雙曲正切函數;h(t)和h(t-1)為t時刻和t-1時刻的隱藏狀態。隱藏狀態捕捉上一個時間步中輸入的信息,并傳遞給下一個時間步以進行預測或進一步的處理;y(t)為t時刻的輸出。輸出可以是對當前時間步進行的預測、分類或其他任務的結果;u為隱藏狀態h(t-1)到隱藏狀態h(t)的連接權重;w為輸入向量X(t)到隱藏狀態h(t)的連接權重;b和c為偏置項,用于偏移線性組合的輸入;X(t)為t時刻的輸入向量,輸入向量可以是各種特征的組合,用于對當前時間步進行預測或處理;v為隱藏狀態h(t)到輸出y(t)的連接權重。
2.1.2 DTW算法
DTW算法是一種適用于時間序列匹配的算法,主要目的是通過序列間對齊尋找一個最佳對應關系,從而使兩個不同長度的序列可以進行比較。工作方式:將兩個需要比較的時間序列看作兩個數組,建立一個距離矩陣,該矩陣的每個元素存儲了序列中對應元素之間的距離,在距離矩陣中找到一條從左上角到右下角的最短路徑,該路徑為兩個序列之間的最佳對齊;對齊后的序列沿著這條路徑分別計算最短路徑的距離。如圖1所示,將兩個時間序列中變化趨勢相似的點對應起來,時間序列之間的虛線代表兩個時間序列之間相似點的規整路徑。DTW算法利用所有相似點之間距離的和來衡量兩個時間序列整體之間的相似性[11]。

圖1 DTW路徑
DTW算法的優點在于其能夠容忍序列之間的時間偏移,適用于許多實際應用場景,但是計算量大,在處理長度較大的序列時速度較慢,而且DTW算法存在無法處理缺失數據的情況,可能會影響數據的準確性。
RNN神經網絡的數據:從油田采集到的生產數據可能會存在缺失,需要通過反距離加權插值法進行數據預處理。為提高模擬精準度,選擇數據較多、生產時間長的井組,對空數據、重復數據與異常數據進行近似處理,并進行歸一化,最后劃分數據訓練集與驗證集,訓練集占數據的前70%,驗證集占后30%。
DTW算法的數據:輸入的數據即注水量數據與產液量數據需要保持相同的時間間隔。
模型訓練:將訓練集的數據輸入到RNN神經網絡模型,并使用默認參數進行訓練;通過不斷地訓練,模型損失值不斷減小,代表模型預測的結果與實際結果越來越近。但是,不同的訓練程度,產生的誤差也不同,例如:訓練時間較短則會出現擬合趨勢較差,訓練時間過長則會出現過度擬合,二者均會導致預測值與真實值偏差較大。因此,需要根據計算的誤差與數據量,調整訓練步長與訓練次數。
訓練驗證:根據調整好參數的模型在驗證集中進行預測對比,檢驗訓練效果,并繼續優化調整參數,最終得到訓練良好的模型。
數據預測:使用訓練好的模型對注采井組產液量進行預測。
考慮到注水傳播到生產井見效時間的延遲,依靠神經網絡預測未來產液量,并從中選擇從注水見效開始到與之相同時間間隔的產液量數據。將注水量數據與產液量數據輸入到DTW算法進行數據曲線的相似度分析,并根據分析結果明確注采井組間的連通性。
通過數值模擬軟件建立簡易地質模型并模擬油田生產,得到生產動態數據;將得到的數據輸入到RNN神經網絡中進行訓練并預測產液量,并將預測的產液量數據與注水量數據輸入到DTW算法中,判斷數據變化相似程度,從而獲得各井之間的連通性。
1)典型模型。利用數值模擬軟件建立典型模型,將四口井所在區塊的孔隙度、滲透率分區設定,WU-1井與WU-4井處于1 000×10-3μm2滲透率區,WU-2井與WU-3井處于100×10-3μm2滲透率區;WU-1井與WU-2井處于24%孔隙度區,WU-3井與WU-4井處于12%孔隙度區。為方便得到注水傳播優勢通道,初始儲層中不含邊水、底水,即含油飽和度為100%。
2)預測。四口生產井同時開始生產(控制井底壓力),半年后注水(控制井底壓力),總共模擬開發15個月,生產動態情況見圖2。從圖中可以看出,從圖中可以看出,從2023年8月7日開始注水,于2023年9月7日有生產井見效,為避免注水見效延遲對DTW算法的影響,將各生產井的產液量輸入到RNN神經網絡模型中匹配性訓練,并預測各生產井的產液量。

圖2 井組生產動態曲線
3)連通性判斷及驗證。將各井預測的后9個月數據與9個月的注水數據輸入到DTW算法中,計算得到各采油井與注水井的DTW距離(表1),從結果來看,生產井與注水井連通性從好到差依次為WU-4、WU-1、WU-3、WU-2。

表1 簡易模型各生產井與注水井的DTW距離
綜合滲透率、孔隙度以及圖3,可以得到各生產井與注水井之間的連通性為:WU-4>WU-1>WU-3>WU-2,與模型評價結果一致,證明RNN-DTW模型方法可靠。

圖3 模擬注水開采后儲層含水分布情況
研究區共有5口油水井,其中水井1口,油井4口,井組分布狀況如圖4所示。該井組自2019年7月開始注水,于2020年4月生產井見效,產油量與產水量開始增加。為減少注水見效延遲與DTW數據量一致性的誤差,將各生產井的產液量輸入到RNN神經網絡模型中匹配性訓練,并預測各生產井的產液量。

圖4 研究區井組分布
從井組注采動態曲線可以看出,神經網絡訓練擬合程度好,預測結果可靠(圖5)。將各井預測的后13個月數據與13個月的注水數據輸入到DTW算法中,計算得到各采油井與注水井的DTW距離(表2),從結果來看,W2井與注水井連通性最好,W1井、W5井次之,W3井最差。

表2 各生產井與注水井的DTW距離

表3 井組地層系數統計
將模型算法結果與注采井組物性特征相對比,結果較符合,間接驗證了采用RNN-DTW方法得到的結果的可信度較高(其中生產井W3井產液量變化程度與注水量變化程度差異較大,總體呈上升趨勢,綜合判斷為W3井不為或不完全為注水井W0井注水傳播控制)。
1)文中通過構建RNN神經網絡并結合DTW算法判斷注采井間的連通性,可用于油田現場注采井間的連通性評價。現場應用表明,使用RNN-DTW算法分析注水井注水量數據曲線與生產井產液量數據曲線的相似程度越好,DTW距離越小,其注采井間的連通性越好,且分析結果與注采井組的物性特征相符合,但是W3生產井不為或不完全為W0注水井注水傳播控制,若要判斷具體控制井,需進行多注水井符合數據分析。
2)通過RNN神經網絡預測,將生產井的產液量的趨勢在時序上延后,再通過DTW算法分析注采數據在時間序列上的相似度,可在一定程度上減少注水傳播衰減性與滯后性帶來的影響,提高了注采井間連通性識別的精度。