余曉露,葉 愷,杜崇嬌,宮晗凝,馬中良
(1.中國石化 油氣成藏重點實驗室,江蘇 無錫 214126; 2.中國石化 石油勘探開發研究院 無錫石油地質研究所,江蘇 無錫 214126)
確定碳酸鹽巖沉積環境最有效的方法之一,是對碳酸鹽巖薄片中的生物化石進行研究[1]。不同的生物門類指示不同的古生態環境,部分生物化石或生物組合還可以成為判斷水體鹽度、深度和濁度的特殊標志[2]。WILSON[3]就曾以巖石中的生物類型、完整程度等特征為基礎,對碳酸鹽巖沉積環境、相帶標志等進行了詳細劃分。
傳統的生物化石碳酸鹽巖微相研究方法是通過偏光顯微鏡對碳酸鹽巖薄片中的生物化石進行觀察,根據其形態、顯微結構,并參考礦物成分、大小及表面紋理特征等對生物進行鑒定。不同生物在薄片中具有不同的鑒定特征,例如三葉蟲切面常為彎鉤狀,具玻纖結構;有孔蟲常為多房室的殼體,且殼體具粒狀結構;海綿骨針呈單軸、三軸或四軸的放射狀,具晶粒結構,常見硅化特征[4]。但是,傳統的人工鑒定方法,不但耗時、效率較低,而且受主觀影響較大,為識別工作帶來許多不必要的錯誤。
近年來,人工智能技術已經應用于醫學、天文學、地球科學、遙感、軍事、農業等眾多領域。20世紀初深度學習算法概念的問世,使得機器學習技術在人類信息(如語言、視覺)處理方面出現突飛猛進的進步。在圖像識別領域,諸多學者圍繞圖像識別與分類研究進行了大量工作,并產生了很多新的應用。
圖像識別作為人工智能的一個重要領域,隨著人工智能的快速興起而得到發展。現階段在地質學的巖石圖像分析中也廣泛采用BP神經網絡和支持向量機等技術方法。有學者運用圖像對巖石中的礦物進行分類和計算,THOMPSON等[5]嘗試通過神經網絡在圖像中提取礦物的紋理特征,識別出石英、長石、黑云母等10類礦物;ROSS等[6]嘗試利用遺傳規劃算法識別薄片圖像中的礦物,并結合決策樹分析,利用閾值分析來識別巖石礦物類型;葉潤青等[7]采用多尺度分割技術處理碎屑巖圖像,并提取礦物顆粒形態、含量等特征;ALIGHOLI等[8]采用色彩跟蹤方法,通過計算和比較單偏光和正交偏光模式下礦物的顏色變化進行礦物分類和識別;MAITRE等[9]提出了基于計算機視覺和機器學習對礦物特征向量進行分類的方法,同時采用超像素分割替代傳統方法,有效分割出光學顯微圖像中的顆粒。有人利用圖像對巖石進行分類,李培軍[10]在巖石光譜數據的基礎上,利用變差函數提取巖石圖像紋理,提高了巖石分類的準確性;郭超等[11]利用模式識別方法,通過計算并提取巖石圖像的特征空間值,對圖像進行分類;楊艷梅等[12]以Spark平臺的巖石圖像聚類分析為基礎,對巖石圖像進行處理并使其更易于區分。也有人著力于對巖石結構、孔隙等進行識別,MARMO等[13]利用圖像處理和多層感知器神經網絡方法,基于鄧哈姆碳酸鹽巖結構分類,識別出未受成巖改造的海相碳酸鹽巖圖像;程國建等[14]提出了一種模糊聚類和神經網絡相結合的方法,實現了鑄體薄片圖像孔隙的分割和識別。上述工作多數集中在礦物類別和巖石圖像類別的識別上,所使用的方法以復雜的特征參數提取算法為基礎,但難以在種類繁雜的巖石薄片圖像中得到泛化。
相對而言,學者們對顯微生物化石的圖像識別研究比較少,劉曦陽[15]嘗試利用SIFT算法對生物化石圖像中的特征點進行匹配識別;岳翔等[16]嘗試利用VGG16模型和GoogleNet模型對電子顯微鏡下的典型有孔蟲化石進行識別,但上述研究均未達到滿意的效果。本文利用人工智能深度學習技術,對碳酸鹽巖薄片圖像進行處理,并對其中的生物種類、數量等特征進行識別和分析。
在碳酸鹽巖薄片樣本拍攝的過程中,由于使用不同品牌或不同型號的偏光顯微鏡,并設置不同的拍攝參數,導致圖像分辨率、圖像格式和色調等性質出現差異,造成難以使用統一的算法對圖像進行分析。
為保證碳酸鹽巖薄片圖像的有效性,需要對其進行預處理,例如圖像歸一化、圖像去噪和增強等。具體來說,就是將所有圖像歸一化到相同比例尺,然后使用雙邊濾波算法去除圖像中的椒鹽噪聲,使用直方圖均衡化算法增強顆粒區域和背景區域的灰度差異,在保持所有原圖像特征統一的情況下,使圖像特征更加清晰、圖像噪聲影響更低。
經過圖像去噪和圖像增強預處理過程之后的效果如圖1所示。圖1a是一張碳酸鹽巖薄片顯微圖像原圖,圖1b是經過圖像去噪和圖像增強后的新圖像,可以看出紋理和色彩的清晰度得到明顯提升。

圖1 圖像預處理對比Fig.1 Comparison of image preprocessing
深度學習技術需要從大量的數據中學習有效的特征,因此收集和制作生物顯微圖像數據集具有重要的意義。碳酸鹽巖生物化石顯微圖像數據集需要分步制作,先制作生物圖像目標檢測數據集,由此得到生物圖像分類數據集;再通過增強獲得最終數據集。
2.2.1 制作數據集
由專業巖礦鑒定人員審查篩選了327張具有典型特征的碳酸鹽巖薄片生物化石圖像,邀請專家使用專業軟件工具將圖像中典型的生物化石區域框選出來,并按照所設計的類別命名規則來標記名稱,經過標注和整理即得到生物圖像目標檢測數據集。該數據集中,每張圖像中都標注了生物的位置,并且每種生物都有其對應的類別標簽。
接著,再將目標檢測數據集中的生物標注提取出來,根據生物標注的位置將該區域提取成一個個的子圖像,并用該區域的類別名作為子圖像的類別標簽,即得到生物圖像分類數據集。
2.2.2 數據集增強
由于專家標注的圖像為具有典型特征的碳酸鹽巖薄片生物化石圖像,為提升數據的泛化性,要將現有的圖像進行多種變換操作,來增強數據的多樣性。
本研究使用了圖像裁剪、旋轉、翻轉、縮放和調換顏色通道等方法對原始數據進行數據增強,過程如圖2所示。將原始的碳酸鹽巖生物化石圖像分類數據集中的327張圖像擴展到1 635張圖像,即得到碳酸鹽巖生物化石顯微圖像數據集,為后續訓練深度學習模型提供數據支撐。

圖2 碳酸鹽巖生物化石圖像數據集增強過程示例Fig.2 Example of enhancement process for micro fossils image data set of carbonate rocks
本研究采用深度學習算法來識別碳酸鹽巖薄片圖像中的生物化石,并設計了2個階段的生物化石識別方法。第一階段是將原圖像分割成多個子圖像;第二階段是對每個子圖像進行分類識別。生物化石圖像的分類流程主要包括設計卷積神經網絡模型、訓練模型,再將分割得到的子圖像送入訓練好的模型,得到生物化石識別結果。
2.3.1 卷積神經網絡模型
卷積神經網絡(Convolutional Neural Networks, CNN)是現階段深度學習的主要算法之一,具有一定深度結構并包含卷積計算,屬于前饋神經網絡。卷積神經網絡通過局部區域連接、權重共享和降采樣等策略,大大降低了網絡模型的復雜度,同時對于圖像平移、旋轉、縮放等形式的變形具有高度不變性,因此廣泛應用于圖像識別領域。
卷積神經網絡特殊的仿生結構,使得其能以較小的計算量對目標對象進行大量的特征提取。從結構上看,卷積層為卷積神經網絡的核心,其功能是提取輸入數據的特征參數;卷積層內部包括多個卷積核,其功能類似于神經元;在卷積層中,神經元之間呈網絡狀連接,功能類似于生物視覺皮層細胞中的感受野。卷積神經網絡在計算時,先通過卷積核掃過輸入特征,再在感受野內對輸入特征進行計算,計算方式為矩陣元素乘法求和,再疊加偏差量,公式如下所示:
Zl+1(i,j)=[Zl×wl](i,j)+b(i,j)∈{0,1,…,Ll+1}
式中:Zl和Zl+1分別代表第l+1層的卷積輸入和輸出;wl代表第l層的卷積核;Ll+1代表Zl+1的尺寸;Z(i,j)代表對應特征圖的像素;b代表偏差量。
卷積層的關鍵參數通常有3個:卷積核大小、步長和填充,3個參數的共同作用決定卷積層輸出圖像的空間尺寸。
2.3.2 設計模型
設計不同的網絡連接方式和卷積方式,便可生成適用于不同任務的卷積神經網絡模型。目前經典的卷積神經網絡模型有AlexNet、VGG、ResNet、InceptionNet等模型,其模型性能在近幾年的研究和實踐中都得到了驗證。
本研究采用的是ResNet模型(Deep Residual Network),并根據需要對模型進行了一定改進。ResNet模型是一個非常有創造性并且非常深的卷積神經網絡,基本解決了較深網絡中出現的性能退化問題,可以用于圖像分類、目標檢測和語義分割等多種圖像識別任務。
ResNet模型由多個卷積塊組成,圖3示意了每個卷積塊的結構,其重要特征是卷積塊內包含的跨層連接,輸入圖像x可以通過跨層傳遞實現同等映射,經過卷積處理之后,輸出一個F(x)的非線性函數。ResNet模型的深度由卷積塊的數量決定,經過卷積處理之后,所有輸出相加,可以讓底層網絡得到充分訓練,同時也可以大大提高正確率。本研究所使用的ResNet卷積神經網絡模型具有50層,其網絡結構的詳細信息參考圖4,模型中每個卷積塊之后使用ReLU激活函數,在最后一層卷積層之后使用全局平均池化層(global average pooling),再連接兩層全連接層,最終模型輸出的全連接層的神經元個數和當前生物圖像分類數據集中生物的種類數相等。

圖3 ResNet模型中殘差塊結構示意[17]Fig.3 Residual block structure in ResNet model[17]
2.3.3 訓練模型
本研究使用TensorFlow框架構建模型,并在高性能計算機上進行訓練。
首先將碳酸鹽巖生物化石顯微圖像數據集劃分為兩類:訓練集和測試集,訓練集占80%,測試集占20%。這兩類數據集起著不同的作用,訓練集的功能是為訓練模型提供數據樣本,通過訓練集中的數據使模型學習相應的特征;測試集的功能是測試并調整模型參數,以及初步評估模型的性能,并對最終模型的泛化能力進行評估。
將訓練集中的圖像逐個送入模型進行計算,并反向傳播偏差來修正模型權重。模型將訓練集中所有數據迭代計算200輪,并采用早停策略,即當測試集在模型上的準確率經過N輪迭代后沒有提升便停止訓練。
2.3.4 實驗結果分析
ResNet模型最終的輸出為一個向量,如圖4所示,將一張含有棘皮動物化石的子圖像輸入模型,經過計算之后,模型輸出一個一維向量。由于在數據集中將生物化石分為10個類別,因此輸出向量也包含10個值,其中的每個值代表該類別生物化石的概率,且10個值相加之和為1。對于圖像分類任務,一般將所有值中輸出概率最大的值所對應的物體類別作為輸入圖像的類別。以圖4為例,該子圖像經過計算后輸出的向量中,棘皮動物化石對應位置的概率值在所有值中最大,因此將該

表1 ResNet模型中網格結構示意[17]

圖4 ResNet卷積神經網絡生物化石分類過程Fig.4 Fossil classification process by ResNet Convolutional Neural Network
子圖像判斷為棘皮動物化石。
在計算機視覺領域的圖像分類任務中,最常用的模型性能評價指標為Top-N準確率。由于本研究當前數據量較少,涉及到的類別也較少,因此使用Top-1準確率來衡量分類精度。

(1)
本研究使用ResNet模型在包含327個樣本的測試集上進行測試,對10種類別生物識別的綜合準確率約為86%。
2.3.5 碳酸鹽巖生物化石顯微圖像識別過程
基于ResNet卷積神經網絡模型的碳酸鹽巖生物化石顯微圖像識別在具體實現時,需要先將原圖像分割成多個子圖像,再對每個圖像進行分類。
具體識別流程如圖5所示,先將碳酸鹽巖薄片圖像中的典型生物化石所在區域通過專業軟件工具框選出來,然后運用計算機程序處理并提取子圖像,經過圖像預處理,再輸入到已經訓練好的ResNet模型中,最后經過前向計算獲取輸出結果,并根據最大值在索引文件中查找,即得到對應的生物類別識別結果。

圖5 ResNet卷積神經網絡碳酸鹽巖生物化石的識別過程Fig.5 Fossil dentification of carbonate rocks by ResNet Convolutional Neural Network
在圖像識別領域,以ResNet為代表的卷積神經網絡模型屬于兩步走算法,即先提取候選區域(子圖像),再通過模型進行計算與分類。而以YOLO(You Only Look Once)模型為代表的目標檢測模型則屬于一步走算法,可對輸入圖像進行計算之后,直接輸出目標對象的類別和位置。目標檢測技術是指從一張圖像中識別待檢測目標的類別,并同時確定目標在圖像中的位置,可以簡單理解為輸入一張圖像到模型中,經過卷積計算之后,將從圖像中提取到的特征同時送入2個分類器:一個分類器通過分類計算輸出目標對象的類別;另一個分類器通過坐標預測計算輸出目標對象在圖像中的位置。
因此,本研究同時嘗試了YOLO模型作為進階目標檢測模型,并使用標注的生物化石圖像目標檢測數據集來訓練模型。
YOLO模型一共包含24個卷積層和2個全連接層,通過卷積層提取特征,再通過全連接層輸出預測值。卷積層和全連接層之后使用LeakyReLU激活函數,并在模型的最后一層使用線性激活函數。
對于YOLO生物化石目標檢測模型的訓練,模型的初始權重不使用隨機初始化,而是使用遷移學習的策略,將ResNet模型訓練獲取模型的權重作為YOLO的初始權重,其余訓練策略則是與ResNet模型使用的訓練策略一樣。
使用訓練好的YOLO模型對碳酸鹽巖薄片圖像中的生物化石進行檢測和識別,相對于先分割圖像后識別的方法更加智能化,不再需要對待檢測圖像進行人工框選。如圖6所示,對圖像進行預處理之后,輸入到YOLO模型中,經過前向計算和回歸之后,得到一系列輸出。因為輸出是多維的,每一維都預測了一個矩形框和該矩形框對應的類別,因此將所有的矩形框在原圖像中繪制出來,并從生物類別索引文件中匹配該矩形框對應的類別,即可檢測到一張碳酸鹽巖薄片圖像中所有典型的生物化石所在區域,并識別其類別。

圖6 YOLO目標檢測模型碳酸鹽巖生物化石的檢測與識別過程Fig.6 Fossil detection and identification of carbonate rocks by YOLO object detection model
將生物化石圖像目標檢測數據集中80%的數據作為訓練集,剩下20%的數據作為測試集,YOLO模型識別碳酸鹽巖薄片圖像生物的平均準確率為85%。
(1)本文提出改進的ResNet卷積神經網絡模型,可以對碳酸鹽巖顯微圖像中的生物化石進行識別,識別準確率約為86%。
(2)本文同時提出進階YOLO目標檢測模型,可以對碳酸鹽巖顯微圖像中的所有典型生物化石所在區域進行檢測,并識別其類別,識別準確率約為85%。
(3)該方法表明,使用數字圖像處理技術和卷積神經網絡對生物化石進行智能識別具有一定的可行性,可作為傳統人工鑒定方法的有益補充,具有一定的實際應用價值。如果增加使用場景,圖像識別技術在本行業將具有廣闊的應用前景。
(4)現有數據集樣本量有限,僅包括少量常見生物化石類型,對于復雜的生物化石類別,后續研究可通過擴充樣本庫等方式來進一步提高識別準確率,提升應用價值。