李智文, 王 偉
(1.河北煤炭科學研究院, 邢臺 054000; 2.中國科學院地理科學與資源研究所,資源與環境國家重點實驗室,北京 100101)
在油田的開發過程中,測井曲線的應用不僅涉及到地震資料的解釋與反演,提供井位的關鍵參數,也是評價油井優劣的重要依據,因此測井曲線具有重要應用價值[1]。在早期的測井工作,其結果保存在圖紙中,由于圖紙保存時間長、使用頻繁,導致圖紙出現折痕、褪色、破損、變形等問題,嚴重損失了測井曲線有效信息,不利于今后保存與使用[2-3]。測井圖紙資料以數字矢量化的方式保存為電子文件,能夠有效保護測井曲線數據,有利于后期的存儲、管理、再利用、網絡傳輸與資源共享。因此對老圖紙數字化處理從上世紀90年代起,一直是油田急需解決的重點工作之一[4],也是地學與計算機技術研究的重要核心課題之一[5]。早期測井曲線矢量化通常采有數字化儀或國外矢量化軟件來完成這一工作,但是速度較慢、耗時長、效率較低,且在圖紙移動過程中經常出現拼接不連續、錯位和失真等問題,甚至重新對曲線掃描[6]。隨著計算技術與圖像識別技術的不斷進步,圖紙測井曲線矢量化方法正向更快、更準確、智能化方向快速發展。測井曲線矢量化方法必須能夠解決此類圖紙圖像存在的問題[7-9]:①圖像灰度背景隨時間褪色不均勻、圖紙斷裂造成曲線間斷斷裂問題多;②各類目標測井曲線橫坐標不一致出現相互交叉、重疊現象;③圖像柵格線類型多樣;④目標測井曲線有點線、實線、劃線、點劃線等多種類型并存;⑤圖像中目標測井曲線與刻度坐標功能的網格線相互交叉重疊;⑥曲線縱向、橫向刻度標準不一致,縱向像素多,橫向像素少;⑦目標曲線的峰值信息價值大,中間部分信息價值小。測井曲線矢量化具體實現過程一般分為兩步:①去除圖紙背景噪音與網格線;②追蹤各種測井曲線,并完成數字化[10]。頻率域濾波和空間域濾波方法可以消除背景噪音。頻率域去噪方法的優點是不過度依賴于網格線的強弱、連續性信息,對測井曲線信息損失小,其缺點是在二維變換中引入一些混迭效應,反變換后恢復的圖像含有灰色區域塊,且運算量大,要求像素長與寬度是2的整數次冪,不適合計算機優化算法[11-12]??臻g域去噪方法直觀、簡單,且易于實現,因此當前的柵格圖像背景識別算法多在空間域實現(如對網格先進行縱橫向投影以消除灰度值為零的高值區域的投影法方法、針對網格線的直線特征進行識別的線性Hough變換法和基于擊中/擊不中原理的十字模板匹配法等[13-16])。筆者根據測井曲線圖紙資料特點,介紹一種這類測井曲線矢量化的實現算法,從而為油田降低管理成本、延長保存期限,提高測井成果的利用效率,推進測井數據庫建設,實現資源共享,推動油田數字化健康發展。
在測井曲線圖紙信息分析與處理中,首先對背景噪音進行壓制,保留有效的測井曲線信息,然后對測井曲線進行矢量化。背景噪音有兩類:①圖紙上的具有刻度的橫縱等間隔的網格線;②圖紙的灰度及褪色、破損噪音。
為了方便清繪測井曲線,測井圖紙印有表示坐標的橫縱網格線,兩兩相交形成樣式相同的十字形圖案,因此可以根據基于十字模板的擊中/擊不中變換(Hit/Miss Translation)原理,在圖形區域內識別并搜索十字形網格,并消除其影響。設定閥值,當相關性大于閥值時,認為搜索到交叉點,區域就是交叉點所在的區域。
數學形態學中的“擊中/擊不中變換”又叫塞拉變換,該變換方法將圖像分為目標內部區與目標外部區,并能同時進行識別。因此在目標圖像識別和模式識別等領域,利用HMT原理從背景噪音中提取目標圖像,取得很好的效果,并得到廣泛應用。如果對圖像按照結構單元劃分,每個結構單元屬于目標單元或者非目標單元,具體到圖紙網格線圖像中,由十字形單元和非十字形單元構成,檢測到十字形區域為擊中事件,未檢測到十字形為未擊中事件,其數學描述為: 給定圖像M,不相交集合對S(S1,S2),即:
S=S1∪S2,S1∩S2=Φ
(1)
則擊中/擊不中變換定義為:

(2)


圖1 十字形模板Fig.1 Cross template

圖2 去除十字形背景噪音Fig.2 Remove cross background noise(a)去噪前;(b)去噪后
利用基于十字形模板的擊中/擊不中方法,消除測井曲線中的網格線背景,其效果對比如圖2所示,從去噪前、后對比可以看出,圖像中網格線組成的十字形干擾得到有效壓制。
二值化處理就是在[0 255]區間內根據閾值選擇函數確定一個閾值,超過閾值則判斷該像素為選擇目標,且設置為255。將圖像的圖灰度值設置為1~m級,灰度值i的像素個數為ni。則總的像素數:
(3)
各灰度值的概率為:
Pi=ni/N
(4)
用k將其分為兩組,C0={1-k},C1={k+1~m},則C0、C1產生的概率及其平均值分別為:
(5)
(6)
(7)
(8)
其中:μ是柵格圖像的灰度平均值;μ(k)是閾值為k的灰度平均值,其表達式分別為:
(9)
(10)
全部采樣的灰度平均值為μ=ω0μ0+ω1μ1。 其方差為:
σ2(k)=ω0(μ0-μ)2+ω1((μ1-μ)2)=
(11)
σ2(k)被稱為閾值選擇函數,k在1~m之間改變,利用最小二乘法可獲得極值時的k閾值。
為達到優化處理,通過采取設置靈活參數的方法,使得每一幅圖像都能獲得一個比較理想的效果。去噪效果如圖3所示,有效壓制了圖紙中的灰色背景噪音。

圖3 去除灰色背景噪音Fig.3 Remove gray background noise(a)去噪前;(b)去噪后

圖4 搜索圖N-1一點相鄰Fig.4 Search graph N-1

圖5 搜索圖N-1多點相鄰Fig.5 Search graph N-1

圖6 搜索圖N-2Fig.6 Search graph N-2

圖7 基本跟蹤算法流程圖Fig.7 Basic trace algorithm flow chart
曲線跟蹤包括手動跟蹤和自動跟蹤兩部分,手動跟蹤即只記錄鼠標點擊的位置,這種方式的優點是可靠性好,人工識別的準確度高,一般不會出現誤判現象,但是缺點也很明顯,需要手工點擊幾乎所有曲線上的點,工作量大;自動跟蹤就是在手動跟蹤的基礎上,加上了計算機的自動識別,達到大大減小矢量化工作量的目的。
鼠標點擊目標曲線,以鼠標點擊點為中心,探測一定的矩形區域內各點的深度值,以深度值較大的點作為探測起點,并把該深度設為目標曲線的深度。然后把矩形區域內與起始點相鄰的深度最大的點(線的中點centre)作為下一個點。如果有多個最大值點,則應該根據曲線的走向來判斷取哪個點,判斷不出就停止跟蹤。這在曲線粗細均勻(nlen)或者由細變粗的時候是可以很好地識別。
曲線由粗變細的情況比較復雜,設該點的深度值為N,從距離該點2像素的矩形框上找深度值為N-1的點,若僅有一個則該點為下一個點,若有多個相鄰任取一個點作為下一點(圖4、圖5),不相鄰則表示是交叉點,應該根據曲線的走向來判斷取哪個點,判斷不出停止跟蹤;如距離原點2像素的矩形框上找不到深度值為N-1的點,則在距離原點3個像素的矩形框上找深度值為N-2的點(圖6),若僅有一個則該點為下一個點,若有多個,繼續判斷是否相鄰;如果沒有找到,則探測4個像素范圍內深度值為N-3的點,再進行判斷,直到N-m=0為止。如果都沒有找到滿足條件的點,跟蹤結束。

圖8 設計流程圖Fig.8 Design flow chart

圖9 測井曲線矢量化結果Fig.9 Vectorizing oilfield well logging curves result
探測過程中如果遇到矩形區域的邊界,則以最后一個加入頂點數組的點為中心,進行下一個矩形區域探測,探測時要排除已經探測過的點。
圖7是實現基本跟蹤算法的流程圖,圖8是系統整體設計流程圖。
通過對大慶油田的多種測井圖紙進行了自動跟蹤識別,有效提取了測井曲線,并進行了矢量化處理。圖9是對大慶油田北-1-362-622井的試驗跟蹤結果。矢量化處理的結果,不同網格線清晰,測井曲線連續光滑,達到了預期目的。
早期測井資料的矢量化是非常有實用價值意義的一項工作,不僅方便地保持相應資料,同時便于用戶使用。筆者通過研究此類測井資料特點并進行歸類,有針對性的消除背景噪音,實現了對曲線的識別與自動追蹤,可以快速地對這些資料進行矢量化,方便使用,利用資料維護。本系統在背景復雜的條件下存在對搜索到的斷口后的曲線和當前跟蹤曲線特征高吻合度的判斷問題,可能引起誤判現象,這是我們下一步工作的研究重點。