蔣 歡 謝禮科 劉 明 吳耀坤 滕奇志*
(1.新疆油田分公司實(shí)驗(yàn)檢測研究院 克拉瑪依 834000)(2.四川大學(xué)電子信息學(xué)院圖像信息研究所 成都 610065)
采用數(shù)字圖像處理技術(shù)對巖石薄片圖像進(jìn)行處理與分析已經(jīng)成為石油地質(zhì)行業(yè)的常用手段。利用巖石薄片的正交偏光序列圖像對礦物顆粒進(jìn)行提取與識別是一種新方法,已取得了較好的效果。在進(jìn)行顆粒礦物識別研究中,需要對算法的識別效果進(jìn)行評價(jià),因此,有必要定義一個(gè)評價(jià)方法。本文主要針對石英、長石的自動識別,討論了礦物顆粒機(jī)器識別是否正確、以及統(tǒng)計(jì)整個(gè)巖石薄片圖像中礦物識別率的方法。
巖石薄片中礦物顆粒形狀大小不一、具有復(fù)雜的紋理特性,因此,針對巖石薄片單一圖像的顆粒分割往往不能滿足實(shí)際應(yīng)用。結(jié)合巖石薄片的正交偏光序列圖像存在顆粒消光性[1~2]的特點(diǎn),可以達(dá)到較為良好的分割效果,更能滿足實(shí)際的應(yīng)用需求。目前,在實(shí)際應(yīng)用中主要采用以下幾種分割方法。
1)基于灰度閾值的分割算法[3]:一些標(biāo)準(zhǔn)巖石薄片中,石英、長石等礦物的灰度均值存在明顯差異,利用基于灰度閾值的圖像分割算法可以將石英和長石顆粒提取出來。
2)統(tǒng)計(jì)區(qū)域融合(Statistical Region Merging,SRM)算法[4~5]:對感興趣區(qū)域采用基于區(qū)域生長和區(qū)域合并的SRM算法進(jìn)行進(jìn)一步分割,可以較好地解決礦物顆粒之間粘連的問題。
3)基于邊緣流的分割算法[6~7]:礦物顆粒在不同正交偏光角度下具有不同的消光位置,顆粒之間會形成良好的邊界,基于邊緣流算法的優(yōu)秀特性有利于保證顆粒目標(biāo)的準(zhǔn)確性與完整性。
顆粒提取后,利用顆粒表面特征進(jìn)行礦物成分的識別。在礦物顆粒種類識別的研究中,目前主要采用基于機(jī)器學(xué)習(xí)[8]的框架對顆粒進(jìn)行訓(xùn)練與識別分類,需要建立石英、長石的特征參數(shù)[9~10]樣本庫,采用貝葉斯分類[11]、隨機(jī)森林[12]、支持向量機(jī)[13]等算法進(jìn)行訓(xùn)練,基于訓(xùn)練結(jié)果對待識別顆粒進(jìn)行分類。在實(shí)際應(yīng)用中,隨機(jī)森林算法對顆粒的分類效果比較理想[6]。
由于巖石礦物的表面特性很復(fù)雜,其代表性的特征受多種因素影響。因此,采用圖像處理方法進(jìn)行石英、長石的識別是較為困難的問題,識別率是衡量識別效果的重要指標(biāo),為了準(zhǔn)確統(tǒng)計(jì)薄片識別率,首先要有“金標(biāo)準(zhǔn)”,由薄片鑒定崗位專業(yè)人員對薄片圖像進(jìn)行顏色標(biāo)注,形成標(biāo)準(zhǔn)圖像,以此為基準(zhǔn),將機(jī)器識別圖像與其作對比,對標(biāo)準(zhǔn)圖像中每一個(gè)顆粒進(jìn)行判別,最終統(tǒng)計(jì)識別率。
巖石薄片圖像的識別效果實(shí)際由顆粒分割的準(zhǔn)確率和機(jī)器分類識別的正確率兩方面因素決定,在實(shí)際應(yīng)用中,需要將這兩方面因素結(jié)合在一起進(jìn)行巖石薄片圖像礦物識別率的統(tǒng)計(jì)分析。
以石英、長石的識別為例,圖1(a)為一幅巖石薄片圖像,大部分顆粒為石英和長石,由薄片專業(yè)鑒定人員對其進(jìn)行手工提取與顏色標(biāo)注,以此作為識別的標(biāo)準(zhǔn)圖像,圖1(b)為同樣薄片采用機(jī)器識別后的結(jié)果。從圖中可以看出,受顆粒目標(biāo)提取和粘連分割的影響,顆粒圖像的表現(xiàn)形態(tài)與人工標(biāo)識的不完全相同,如果嚴(yán)格采用圖像逐像素對比進(jìn)行識別率統(tǒng)計(jì),會出現(xiàn)較大誤差,因此需要研究判別統(tǒng)計(jì)的策略,能夠良好處理兩幅圖像中顆粒目標(biāo)的差異,減小識別率統(tǒng)計(jì)誤差。

圖1 巖石薄片圖像
3.1.1 石英、長石的識別判定
以標(biāo)準(zhǔn)圖像為基準(zhǔn),判別標(biāo)準(zhǔn)圖像中所有石英、長石在機(jī)器圖像中是否識別正確。利用連通區(qū)域標(biāo)記算法[14~15]得到標(biāo)準(zhǔn)圖像中所有待判定顆粒目標(biāo)區(qū)域的邊界、面積等信息,由此,可單獨(dú)提取每一個(gè)待判定的石英、長石,建立一幅同等大小,且只有該顆粒目標(biāo)的二值圖像(前景為1值,背景為0值)。將該二值圖像與標(biāo)準(zhǔn)圖像相乘[16],可得到該待判定顆粒目標(biāo)區(qū)域在機(jī)器圖像中重合的信息圖像。
當(dāng)機(jī)器圖像與標(biāo)準(zhǔn)圖像中相應(yīng)的兩顆粒目標(biāo)完全一致,圖像相乘得到的區(qū)域也與原顆粒目標(biāo)完全一致(如圖2),因此,僅以顏色便可判別是否識別正確。

圖2 圖像相乘示意圖
標(biāo)準(zhǔn)圖像為人為勾畫目標(biāo),計(jì)算機(jī)自動提取的目標(biāo)與標(biāo)準(zhǔn)圖像有一定差異,進(jìn)行圖像相乘時(shí)主要存在以下四種情況。
1)標(biāo)準(zhǔn)圖像中顆粒與機(jī)器圖像中基本一致
當(dāng)原始顆粒邊界明顯,利于顆粒分割時(shí),得到的顆粒目標(biāo)圖像區(qū)域往往與標(biāo)準(zhǔn)圖像相差不大,如圖3所示。

圖3 標(biāo)準(zhǔn)圖中顆粒與機(jī)器圖基本一致
由上圖可見,相乘圖像中的目標(biāo)區(qū)域基本與標(biāo)準(zhǔn)圖像的顆粒區(qū)域基本一致。
2)標(biāo)準(zhǔn)圖像中的顆粒目標(biāo)在機(jī)器圖像中未被提取
由于原始顆粒目標(biāo)整體亮度較低,在分割時(shí)可能會被當(dāng)作背景而未被提取出來,其相乘圖像中沒有任何目標(biāo)區(qū)域。對于該種情況,應(yīng)判定標(biāo)準(zhǔn)圖像中該顆粒被識別錯誤。
3)標(biāo)準(zhǔn)圖像中若干顆粒在機(jī)器圖像中被合并成一個(gè)
由于原始顆粒之間的粘連性或者顆粒間邊界不明顯,在分割時(shí)會導(dǎo)致若干顆粒目標(biāo)融合成了一個(gè)顆粒目標(biāo),如圖4所示。

圖4 標(biāo)準(zhǔn)圖中兩個(gè)顆粒融合成一個(gè)
直接對標(biāo)準(zhǔn)圖像中每一個(gè)單顆粒目標(biāo)單獨(dú)進(jìn)行圖像相乘后判別。由圖4可見,每一個(gè)顆粒目標(biāo)的相乘圖像與標(biāo)準(zhǔn)圖像中該顆粒目標(biāo)區(qū)域基本一致,因此,圖4(b)中顆粒1應(yīng)判定為識別正確,顆粒2應(yīng)判定為識別錯誤。
4)標(biāo)準(zhǔn)圖像中一個(gè)顆粒在機(jī)器圖像中被分成若干個(gè)
由于原始顆粒表面紋理的干擾,在分割時(shí)會導(dǎo)致一個(gè)顆粒目標(biāo)在機(jī)器圖像中被分成若干個(gè)顆粒目標(biāo),并且分割出的顆粒目標(biāo)均大致分布在標(biāo)準(zhǔn)圖像中原顆粒目標(biāo)區(qū)域,如圖5所示。

圖5 標(biāo)準(zhǔn)圖中顆粒被分成兩個(gè)
由圖5可見,相乘圖像中出現(xiàn)了兩塊與機(jī)器圖像重合的目標(biāo)區(qū)域,并且面積大小不一,針對此情況,我們以重合區(qū)域的面積判定相應(yīng)顆粒是否被識別。計(jì)算其中最大重合區(qū)域的面積與標(biāo)準(zhǔn)圖像中待判定顆粒目標(biāo)區(qū)域面積的比值,若比值達(dá)到一定的閾值,可以認(rèn)定在機(jī)器圖像中存在該顆粒目標(biāo),且以該重合區(qū)域的顏色進(jìn)行識別判定。對于標(biāo)準(zhǔn)圖像中一個(gè)顆粒目標(biāo)被分割成很多個(gè)顆粒目標(biāo)的情況,相乘圖像中一定會出現(xiàn)很多塊較小的重合區(qū)域,并且其中沒有一塊區(qū)域的面積可以達(dá)到相應(yīng)的閾值,這樣的情況則被視為識別錯誤,符合實(shí)際情況。同時(shí),將面積比值作為機(jī)器圖像中顆粒存在的判定準(zhǔn)則也適用于上述三種情況,并且判定結(jié)果也符合相應(yīng)情況。
考慮到顆粒之間的影響,相乘圖像中往往會出現(xiàn)干擾區(qū)域,綜合上述幾種情況,對于單個(gè)顆粒的判定,利用相乘圖像中最大區(qū)域的面積與待判定顆粒目標(biāo)區(qū)域面積的比值作為判定標(biāo)準(zhǔn),當(dāng)兩者面積比達(dá)到70%時(shí),可基本認(rèn)定在標(biāo)準(zhǔn)圖像中存在該顆粒目標(biāo)。因此,規(guī)定單個(gè)石英(長石)顆粒的具體判定策略如下。
在相乘圖像中尋找是否存在與標(biāo)準(zhǔn)圖像中待判定顆粒目標(biāo)顏色相同的區(qū)域,如果存在,且該區(qū)域的面積達(dá)到待判定的顆粒目標(biāo)區(qū)域面積的70%,則認(rèn)定機(jī)器圖像中存在該顆粒目標(biāo),判定計(jì)算機(jī)對該顆粒目標(biāo)識別正確,同時(shí),記錄下標(biāo)準(zhǔn)圖像中識別正確的顆粒信息用于統(tǒng)計(jì)計(jì)算。
3.1.2 未知類顆粒的識別判定
薄片圖像礦物成分分析主要針對石英、長石進(jìn)行分析統(tǒng)計(jì),定義異于石英、長石的礦物類型以及巖屑顆粒屬于未知類,因此,在進(jìn)行成分分析時(shí),不考慮未知類顆粒目標(biāo)。但是,對未知類顆粒仍需進(jìn)行判定統(tǒng)計(jì),將未知類識別的錯誤率作為虛警率。未知類的判定仍然采取圖像相乘的形式,崗位人員根據(jù)未知類在薄片圖像中的整體情況對提取的目標(biāo)圖形層進(jìn)行預(yù)處理,最終存在以下幾種情況:
1)標(biāo)準(zhǔn)圖像中單個(gè)未知顆粒目標(biāo)基本被提取出來,與3.1.1節(jié)中情況1)相類似。
2)一些未知類顆粒在正交偏光下沒有消光性,在進(jìn)行顆粒分割時(shí)未被提取出來。由于分析時(shí)不考慮未知類,因此,判定未提取出的未知類顆粒識別正確。
3)正交偏光下的巖屑顆粒自身形態(tài)比較復(fù)雜,會導(dǎo)致標(biāo)準(zhǔn)圖像中單個(gè)未知顆粒目標(biāo)被提取成幾個(gè)大小不一的目標(biāo)區(qū)域,并且這些目標(biāo)區(qū)域只占原顆粒目標(biāo)區(qū)域的一部分,如圖6所示。

圖6 巖屑顆粒示意圖
由圖6可見,相乘圖像中目標(biāo)區(qū)域總面積僅占標(biāo)準(zhǔn)圖像中原始顆粒區(qū)域面積的小部分,當(dāng)這些目標(biāo)區(qū)域識別為未知類時(shí),根據(jù)實(shí)際情況應(yīng)判定識別正確。
結(jié)合顆粒提取的實(shí)際情況以及崗位人員的分析需求,并綜合上述情況的分析,當(dāng)未知類顆粒被提取出一部分目標(biāo)區(qū)域,且這些目標(biāo)區(qū)域中識別成未知類的總面積達(dá)到原顆粒面積的40%,可認(rèn)定該未知類顆粒識別正確。同時(shí),考慮到顆粒之間的影響,相乘圖像中會出現(xiàn)較小面積的干擾區(qū)域,因此,規(guī)定單個(gè)未知類顆粒的判定策略如下。
在相乘圖像中,所有目標(biāo)區(qū)域的面積總和低于待判定未知顆粒目標(biāo)區(qū)域面積的10%,或者,所有與未知類顏色相同的目標(biāo)區(qū)域的面積總和達(dá)到待判定未知顆粒目標(biāo)區(qū)域面積的40%,均認(rèn)定計(jì)算機(jī)對該未知類顆粒目標(biāo)識別正確,同時(shí),記錄下標(biāo)準(zhǔn)圖像中識別錯誤的未知類顆粒信息用于統(tǒng)計(jì)計(jì)算。
完成標(biāo)準(zhǔn)圖像中每一個(gè)顆粒目標(biāo)的判別后,需要進(jìn)行石英、長石的識別率統(tǒng)計(jì)計(jì)算。綜合以上分析,分別以面積或數(shù)目定義識別率統(tǒng)計(jì)的計(jì)算方式。
以面積統(tǒng)計(jì),分別計(jì)算石英、長石的識別率P ,如式(1)所示:

式中,S正確為標(biāo)準(zhǔn)圖像中所有識別正確的石英(長石)的總面積,S總為標(biāo)準(zhǔn)圖像中所有石英(長石)的總面積。
以數(shù)目統(tǒng)計(jì),分別計(jì)算石英、長石的識別率P ,如式(2)所示:

式中,N正確為標(biāo)準(zhǔn)圖像中所有識別正確的石英(長石)的總數(shù),N總為標(biāo)準(zhǔn)圖像中所有石英(長石)的總數(shù)。
同時(shí),以未知類顆粒識別的錯誤率作為巖石薄片圖像的虛警率,對整個(gè)巖石薄片圖像的識別效果進(jìn)行輔助評估。
以面積統(tǒng)計(jì),虛警率 P虛警的計(jì)算如式(3)所示:

式中,S錯誤為標(biāo)準(zhǔn)圖像中所有識別正確的未知顆粒的總面積,S總為標(biāo)準(zhǔn)圖像中所有未知顆粒的總面積。
以數(shù)目統(tǒng)計(jì),虛警率 P虛警的計(jì)算如式(4)所示:

式中,N錯誤為標(biāo)準(zhǔn)圖像中所有識別正確的未知顆粒的總數(shù),N總為標(biāo)準(zhǔn)圖像中所有未知顆粒的總數(shù)。
上述計(jì)算方法均能滿足3.1節(jié)中列舉的各種情況的判定結(jié)果,達(dá)到評估的目的。在實(shí)際應(yīng)用中,崗位人員可以結(jié)合巖石薄片圖像中礦物顆粒的大小和數(shù)目的整體分布情況,根據(jù)分析需求選用式(1)或式(2)計(jì)算巖石薄片圖像的識別率,同時(shí)選取式(3)或式(4)計(jì)算虛警率。
為了驗(yàn)證本方法統(tǒng)計(jì)的準(zhǔn)確性,對大量的巖石薄片圖像進(jìn)行識別率統(tǒng)計(jì)計(jì)算:首先按照3.1節(jié)中的判定方法對標(biāo)準(zhǔn)圖像中每一個(gè)單個(gè)顆粒進(jìn)行識別判定,最終根據(jù)標(biāo)準(zhǔn)圖像中全部顆粒的判定結(jié)果利用3.2節(jié)中計(jì)算方法分別計(jì)算薄片中石英、長石的識別率以及薄片圖像的虛警率。
以下列舉3.1節(jié)中的巖石薄片予以說明。按照常規(guī)的機(jī)器學(xué)習(xí)分類算法進(jìn)行識別統(tǒng)計(jì),應(yīng)將薄片圖像中所有顆粒單獨(dú)、完整地提取出來,形成單獨(dú)的顆粒圖像,逐一送入基本的機(jī)器學(xué)習(xí)系統(tǒng)中進(jìn)行識別分類,從而得到每一個(gè)顆粒目標(biāo)單獨(dú)分類的結(jié)果,該過程如圖7所示,最終根據(jù)所有顆粒目標(biāo)單獨(dú)識別的結(jié)果進(jìn)行識別率統(tǒng)計(jì)。
在實(shí)際的生產(chǎn)薄片分析中,顆粒提取對識別率產(chǎn)生了較大影響,因此對于實(shí)際應(yīng)用來說,需要直接對整個(gè)薄片圖像分割出的顆粒進(jìn)行識別分類,得到完整的機(jī)器識別圖像,如圖8所示,其中已用圓圈大致標(biāo)注出機(jī)器識別圖像與標(biāo)準(zhǔn)圖像中明顯有差異的顆粒目標(biāo),最后利用本文提出的方法進(jìn)行識別率的統(tǒng)計(jì)。以上兩種方法的識別率計(jì)算結(jié)果見表1。

圖7 顆粒單獨(dú)識別示意圖

圖8 巖石薄片圖像
對比兩組計(jì)算結(jié)果可知,由于圖像分割的影響,不能保證顆粒目標(biāo)提取的完整性,導(dǎo)致巖石薄片圖像的識別率會有所降低。并且,結(jié)合圖8中巖石薄片機(jī)器圖像與標(biāo)準(zhǔn)圖像的整體情況,利用本文提出的統(tǒng)計(jì)方法進(jìn)行識別率計(jì)算的結(jié)果與崗位人員目估結(jié)果基本一致,能夠達(dá)到崗位人員分析的需求。

表1 識別率計(jì)算結(jié)果
實(shí)驗(yàn)結(jié)果表明,本文提出的識別率統(tǒng)計(jì)方法能夠良好處理標(biāo)準(zhǔn)圖像與機(jī)器圖像中顆粒目標(biāo)的各種差異情況,達(dá)到以原始顆粒目標(biāo)為衡量的標(biāo)準(zhǔn)進(jìn)行嚴(yán)格判別,對于整幅圖像的礦物識別率統(tǒng)計(jì)符合實(shí)際情況。
本文針對巖石薄片圖像中礦物顆粒的分割和識別中的差異問題,提出一種巖石薄片圖像中礦物識別率統(tǒng)計(jì)的方法。結(jié)果表明,該方法實(shí)現(xiàn)了對完全不同、但有相關(guān)性的兩幅圖像進(jìn)行識別判定,能夠良好的處理各種情況;實(shí)現(xiàn)了利用計(jì)算機(jī)自動統(tǒng)計(jì)巖石薄片圖像中礦物的識別率、虛警率,對不同算法的識別效果進(jìn)行評判,進(jìn)而減少崗位人員工作量,提高工作效率。