鐘羽, 曹夢雪, 尹冬妹,路來君
1.成都理工大學 數理學院,四川 成都 610059;
2.成都理工大學數學地質四川省重點實驗室,四川 成都 610059
在過去的幾十年中,地球化學勘查在礦產資源預測中發揮著關鍵作用,其中地球化學異常識別[1]對于礦床發現的價值已得到廣泛認可。地表中金屬富集異常可能涉及各種地質和外力的復雜作用。這些過程可以在廣泛的時間和空間尺度上發生,并且因地而異,由此產生的地球化學模式錯綜復雜,為地球化學異常的識別帶來了很大的挑戰[2]。因此,開發能夠有效識別地球化學異常復雜關系的新方法成了近幾十年來的研究重點。
隨著機器學習算法引入到地球科學領域,學者們逐漸發現這些方法能夠較好地表達礦床與多源數據之間的非線性關系,并且不依賴于數據分布。相比于傳統處理方法而言,機器學習方法[3]對于處理復雜的非線性數據方面存在一定優勢,可對多維特征進行建模,進而提高預測精度,以此彌補一般傳統方法無法有效識別隱藏空間模式的不足。正因如此,機器學習系列方法被廣泛用于地球化學異常識別,例如:支持向量機方法[4-5]可以通過搜索最佳超平面將采樣樣本分為化學異常或非異常,從而建立成礦預測模型。隨機森林方法[6-7]可通過整合多個基分類器,生成更強的礦產潛力預測模型,而且對其優化還能夠應用于具有少量標記樣本的研究領域。隨著深度學習[8,23]的興起,研究者們開始將卷積神經網絡[9-10, 24]、生成對抗網絡[11]和深度自動編碼器[12-13]等方法引入到地球化學異常識別及礦產遠景預測領域。這些方法能夠自動從多源地球信息中提取高級特征,并實現大規模數據表征。尤其是卷積神經網絡,汪雪萍學者[14]運用卷積神經網絡完成地球化學數據分類與巖性填圖;李童學者[15-16]通過全卷積神經網絡對離子吸附型稀土礦進行預測;王海俊學者[17]將卷積神經網絡和自編碼器結合運用在金銻礦集區的找礦預測。通過眾多學者的研究可以看出,通過卷積層提取特征,挖掘指示因子的空間分布與礦床位置的相關性。
本文以吉林省輝南—江源一帶鐵礦床為例,通過卷積神經網絡模型挖掘Fe元素富集分布特征,并利用其訓練模型對研究區進行地球化學異常識別,揭示地表元素與礦體位置之間的關系。
研究區[18-21]位于吉林省東南部,東經126°00′~ 127°00′,北緯42°00′~ 42°40′(圖1)。行政區劃隸屬于吉林省白山市的靖宇縣,通化市輝南縣等。研究區中南部地勢較高,西北部較低。區內主要受東西向構造、北東向構造影響,其中東西向構造是最早形成。區內礦產資源較為豐富,已知礦床、礦點及礦化點較多,主要以鐵礦為主,在研究區的鞍山群各組段中均見有沉積變質鐵礦,這些鐵礦分布在龍崗背斜的南北兩翼,其展布方向受地層的控制,與龍崗背斜軸向方向一致,呈北東—南西方向帶狀分布。區內出露地層主要為鞍山群四道砬子河組,巖性以黑云斜長片麻巖為主。區內褶皺構造和斷裂構造較為發育。區內由于東西兩部地層產狀差異而構成為向斜構造。礦體產狀則隨地層的彎曲或產狀變化而異,區內發育北東向和北西向斷裂,造成了礦體的折斷或不完整。礦石為磁鐵石英巖型,呈條帶狀構造,礦物成分有磁鐵礦、石英及石榴石。

圖1 吉林省輝南—江源一帶地質簡圖
神經網絡是一種模仿人類大腦行為特征的機器學習模型。神經網絡依靠內部大量節點之間相互連接的關系,進行分布式運算,從而達到處理數據的目的。每個節點接受數據的輸入后,先進行線性加權,然后為每個節點加上非線性的激活函數,最后完成非線性的數據輸出。每個節點之間的連接表示加權值,不同的加權值使神經網絡產生不同的輸出結果。
卷積神經網絡[22]是一類包含卷積計算的前饋神經網絡。卷積相對全連接網絡不再是處理每個像素的輸入信息,而是處理像素區域。這種做法的優點是使圖像可以作為數據直接輸入,加強了圖片信息的連續性。卷積神經網絡結構通常包括輸入層、卷積層、池化層、全連接層和輸出層(圖2)。其中,卷積層、池化層和全連接層構成多層感知器的隱藏層[23]。隱含層的卷積層和池化層是實現卷積神經網絡特征提取功能的核心模塊。

圖2 卷積神經網絡結構圖
采用研究區化探報告中Fe元素含量,運用克里格法插值法繪制成Fe元素濃度分布圖(圖3)。對研究區進行網格化,由西向東由北向南分成320個4 100 m×4 625 m的小格,編號為1~320。研究區樣本被先標記后分為1和0兩類。參考邏輯分類原則為:單位格子內含有礦點,則標記為1表示有礦。單位格子內沒有礦點,則標記為0表示無礦。由于77、78、270、271、287、306號緊鄰見礦孔,故均標記為有礦。

圖3 吉林省白山市靖宇縣Fe元素濃度圖
本文所使用的卷積神經網絡結構為:卷積層-池化層-卷積層-池化層-全連接層-全連接層。設定損失函數為交叉熵(CrossEntropy),學習率為0.001,訓練次數為25次,將研究區內30%樣本數據作為驗證集,以此得到訓練集和測試集的準確率(圖4a)和損失函數值(圖4b)。通過迭代運算發現:在第15次迭代時,訓練集準確率可達到99.90%,損失函數值為0.000 1,模型訓練到最佳效果。將驗證集輸入到訓練好的模型中,驗證集的準確率為96.88%,損失函數值為0.16,表明相對當前數據而言,訓練模型結果是有效的。

圖4 Fe元素卷積神經網絡訓練準確率(a)和損失函數(b)
傳統地球化學異常識別是通過對研究區元素含量水平進行統計分析。利用統計學的方法把元素含量人為分為背景和異常兩部分,但背景和異常沒有一個“清晰”的界限,在不同條件下,背景和異常可以相互轉換。本文轉變了以往思路,通過Fe元素地表分布圖像與礦體位置進行研究。建立起準確率為0.968 8,損失函數值為0.16的卷積神經網絡模型。對比模型結果與元素濃度分布特征發現在地表元素濃度并不是異常的地下位置卻有礦體分布。在此情形下,僅通過對異常值的識別是不能反映地表元素與地下礦體的關聯性,而運用卷積神經網絡模型卻識別出異常區域。這表明,在沒有其他信息條件下,僅依靠數據分析的神經網絡方法能夠發現地球化學異常有一定優勢。
本文利用深度學習中的卷積神經網絡模型挖掘輝南—江源一帶鐵礦床地表Fe元素分布特征,并進行地球化學異常識別。通過研究發現:卷積神經網絡可以深入探索地表元素分布與礦體地下位置關系,模型效果顯著,結果可靠。在后續深入的研究中,也可考慮將機器學習方法與地質約束條件相結合或考慮地質學理論替換模型的隱藏層,或許會增加所識別信息的可解釋性與可靠性,這可作為進一步研究的新思路。
致謝:感謝路來君導師、曹夢雪老師、尹冬妹碩士給予的指導和幫助,感謝成都理工大學數學地質四川省重點實驗室的大力支持!