劉婷玥, 代晶晶, 田淑芳
1. 中國地質大學(北京), 北京 100083 2. 自然資源部成礦作用與資源評價重點實驗室, 中國地質科學院礦產資源研究所, 北京 100037
石榴子石是一族具有島狀結構的硅酸鹽礦物的總稱, 化學式為X3Y2[ZO4]3, 其中X代表二價陽離子鈣、 鐵、 鎂、 錳, Y代表三價陽離子鋁、 鐵、 鉻、 錳, Z一般代表四價陽離子硅。 依據X位置和Y位置陽離子的特征, 可將目前已知的石榴子石族礦物分為兩類: 鈣系列石榴子石和鋁系列石榴子石[1-2]。 鈣系列石榴子石包括鈣鉻榴石、 鈣鐵榴石、 鈣鋁榴石等亞類, 鋁系列石榴子石包括錳鋁榴石、 鐵鋁榴石、 鎂鋁榴石等亞類。 傳統的石榴子石亞類分類的判別主要是通過實驗室測試分析, 存在耗時耗力、 破壞性、 昂貴等缺點, 所以迫切需要一種新方法快速、 準確地判別石榴子石類型。 高光譜可以捕獲大量信息, 反映研究對象復雜的內在特征, 且具有無損探測、 省時省力的優點[3], 近年來被應用到礦物識別中。 高光譜研究表明金屬離子替代引起的礦物成分變化可以反映在光譜上[4], 石榴子石也不例外。 石榴子石亞類之間通過金屬離子替代相互轉化, 反映在高光譜上為熱紅外波段吸收谷及反射峰位置的不同。 其中, 鈣鉻榴石和錳鋁榴石反射峰位置特征明顯, 易于識別, 而鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石的反射峰位置特征不明顯, 有較大重疊區域, 無法直接進行判別, 因此需要找到一種能夠挖掘熱紅外波譜中的成分信息進而識別石榴子石亞類的方法。 BP(back propagation)神經網絡是一種非線性監督分類方法, 無需事先確定映射關系, 僅通過自身的訓練得到連接規則[5], 能夠解決許多傳統信息分析方法解決不了的問題。 目前, 還沒有利用熱紅外波譜特征和神經網絡開展石榴子石亞類分類的相關報道。
嘗試將石榴子石在熱紅外波段的反射峰波長特征作為亞類判別標志, 開展BP神經網絡與聚類分析、 多元線性判別分析方法對比研究, 經過精確率、 召回率和F1值三個評價指標的評定, 找到一種判別石榴子石亞類類型的快速有效的方法, 并對其他礦物的快速識別提供新的技術啟示。
熱紅外譜段在結構分析和組成分析中非常重要, 它能夠探測可見-短波紅外譜段探測不到的無水硅酸鹽類(架狀、 島狀、 鏈狀硅酸鹽)、 硫酸鹽、 磷酸鹽等礦物, 石榴子石是一種島狀硅酸鹽礦物, 因此熱紅外波段對于石榴子石的識別具有更大優勢[6]。
受硅酸根離子影響, 石榴子石在9~13 μm的熱紅外譜段具有診斷性的三峰式吸收特征(如圖1所示), 3個反射峰分別為反射峰1、 反射峰2、 反射峰3(reflection peak 1, 2, 3), 主吸收谷位于反射峰1與反射峰2之間, 次吸收谷位于反射峰2與反射峰3之間[5]。 礦物的吸收譜帶主要由陰離子決定, 但是當陽離子變化時, 吸收譜帶位置將會有微小的位移。 石榴子石亞類之間的不同主要是陽離子的不同, 因此可以通過反射峰波長判斷石榴子石中陽離子的類型, 進而判別石榴子石類型, 本文將選擇反射峰的波長位置作為石榴子石亞類識別的標志。

圖1 石榴子石熱紅外光譜圖
表1是在熱紅外光譜庫中提取的石榴子石光譜特征數據, 包括18個鐵鋁榴石、 15個鈣鐵榴石、 25個鈣鋁榴石、 18個鎂鋁榴石、 6個錳鋁榴石、 3個鈣鉻榴石的3個反射峰波長信息(反射峰1波長、 反射峰2波長、 反射峰3波長)和1個反射峰波長差值信息(波峰3波長減去波峰2波長)。 將表1中的石榴子石光譜特征數據繪制成6種石榴子石反射峰波長分布圖(圖2), 由圖可知: ①鈣系和鋁系石榴子石可以通過反射峰波長進行區別。 ②鈣鉻榴石和錳鋁榴石反射峰波長特點明顯, 易于與其他類型分別, 而鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石的各反射峰均有較大重疊, 通過簡單的閾值劃分無法判別這幾類石榴子石。

表1 石榴子石光譜特征信息統計表

續表1

圖2 6種石榴子石反射峰波長位置分布圖
利用聚類分析、 多元線性判別分析和BP神經網絡3種方法開展石榴子石亞類分類實驗, 使用表1中的3個反射峰波長信息和1個反射峰波長差值信息; 在SPSS和Python軟件中進行, 分類效果將通過預測結果正確的概率——精確率、 樣本被正確預測的概率——召回率、 精確率和召回率結合得到的F1值進行綜合評價。
聚類分析與多元線性判別分析采用的是k均值聚類和Bayes多元線性判別, 分析均通過SPSS軟件實現, 結果如表2、 表3所示。

表2 聚類分析結果及評價

表3 判別分析結果及評價
由表4可知: 分類的精確率、 召回率和F1值均能達到100%, BP神經網絡創建的模型有效, 所有石榴子石都能正確分類, 鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石能夠很好地區分開。 由此可見, BP神經網絡更適用于石榴子石亞類判別。
由表2、 表3可知: k均值聚類分析的精確率、 召回率和F1值分別為86.1%, 80%和79.2%, 除了鈣鉻榴石(類型4)完全正確地分類, 其他類型的石榴子石都有被誤分類的情況, k均值聚類分析是一種非監督分類方法, 僅僅從距離的角度劃分類別, 判別效果不理想。 多元線性判別分析的精確率、 召回率和F1值分別為84.2%, 80%和79.5%, 鐵鋁榴石、 鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石依然沒有得到很好的區分, 多元線性判別計算復雜度相對較低, 判別石榴子石亞類的效果同樣不理想。
BP神經網絡是一種基于人腦所建立的模型, 通過模擬人腦結構和功能來處理信息, 具有任意復雜的模式分類能力和優良的多維函數映射能力。 BP神經網絡方法與熱紅外光譜特征的結合, 可以充分利用二者優勢, 構建快速判別模型。 BP神經網絡非線性判別分析借助Python軟件完成, 采用典型的三層神經網絡模式。 表1中的反射峰波長信息及反射峰波長差值信息作為BP神經網絡的輸入信息, 6個石榴子石亞類類型作為BP神經網絡的輸出類型, 根據公式(1)和測試結果確定隱含層神經元個數為10個。
(1)
式(1)中,m為隱藏層神經元數,n為輸入層神經元數,a為輸出層神經元數,b為0—10的任意常數。 分類模型的構建過程如下[7]: ①實驗數據劃分訓練集和驗證集。 ②信息輸入到BP神經網絡中并進行歸一化處理。 ③參數初始化, 設置神經網絡的隱含層層數、 隱含層神經元個數、 激活函數、 優化方法、 輸出函數和終止條件。 ④正向傳播并計算各層的輸出值, ReLU函數增加網絡非線性[8]。 ⑤計算輸出層與期望值的誤差, 若是計算得到的輸出值與期望得到的輸出值存在不符合要求的誤差, 則轉為誤差反向反饋過程。 ⑥反向反饋并利用L-BFGS算法修正權值。 ⑦達到終止條件終止訓練, softmax回歸函數對輸出值歸一化處理[9]。 ⑧得到石榴子石亞類分類預測模型。 ⑨使用精確率、 召回率和F1值進行結果及精度評價, 評價報告如表4所示。

表4 BP神經網絡預測結果評價
(1) 通過BP神經網絡和聚類、 多元線性判別分析應用于石榴子石亞類分類的結果對比可知, 非線性的BP神經網絡在光譜信息挖掘方面具有無可比擬的優勢, 能夠將鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石很好地區分, 判別石榴子石亞類分類的效果最好。
(2) 用來訓練BP神經網絡的樣本數據會對判別結果產生決定性的影響。 一般來說, 樣本數量和涵蓋的產出環境類型越多, 訓練結果越好, 因此實際應用中還需要不斷擴充樣本數據。 對已有樣本數據進行微調是一種擴充樣本數據、 提高模型訓練精度的有效手段, 也可以給小樣本訓練的神經網絡增加自學習能力, 以滿足復雜的現實需要[10]。