鄒奇奇 廖寅飛 蘇海龍 羅國蘭 王凱瑞
(1.中國礦業大學 國家煤加工與潔凈化工程技術研究中心,江蘇 徐州 221116;2.中國礦業大學 化工學院,江蘇 徐州 221116)
近年來,隨著國民經濟社會的飛速發展,戰略性礦產資源是新能源、國防軍工、航空航天等戰略性產業發展的物質基礎。我國作為礦產資源大國,儲量豐富,但部分戰略性礦產資源開發利用率較低,對外依存度大[1]。戰略性稀有金屬礦因其“貧、細、雜”特點,分離回收難,屬于復雜難選礦產資源。以鉬礦為例,我國大多數鉬礦品位低,成分復雜、嵌布粒度細等,造成鉬礦的開采和回收成為多數選廠的技術難題[2-3]。浮選作為鉬礦分離回收的重要選礦方法之一,通過在礦漿之中添加浮選藥劑,實現精礦與尾礦的分離,提高礦漿中精礦品位。浮選精礦品位的檢測一直是選廠的首要指標,關系到選廠的經濟效益[4-5]。
實際生產中,浮選工藝流程是一個復雜的工業過程,存在眾多影響浮選精礦品位指標的因素。受制于設備檢測技術、礦廠環境、生產成本等問題,大多數國內選廠采取輪班制采樣,通過人工化驗得到精礦品位結果,但這種化驗方式嚴重滯后于浮選工藝,難以滿足對生產過程進行實時監測和操作指導[6]。
軟測量技術在復雜的工業流程中得到了廣泛應用,實現重要工藝節點監測、產品質量預測等關鍵性應用。軟測量是一種以易測量數據變量作為輸入,將難以測量的變量作為輸出,基于機理和大數據相結合建立復雜軟測量模型,解決某些變量測量困難、滯后等技術難題[7-9]。
浮選主要針對于微細粒礦物的分選,其浮選工藝流程極為復雜,往往需多流程聯合分選,浮選可控制變量多而雜,且變量之間存在強非線性、強耦合等問題。部分學者利用軟測量模型實現了對于浮選精礦品位的測量,為精礦品位測量提供了新方法。NAKHAEI等[10]研究了人工神經網絡(ANN)與多元非線性回歸(MNLR)在中試浮選柱中預測銅、鉬品位的能力。利用化學試劑用量、泡沫高度、氣體流量、循環水流速、氣含率、粗選進料、浮選柱進料、塔尾中Cu和Mo品位等作為輸入變量,使用ANN預測Cu和Mo品位和回收率的準確性高于MNLR模型,其誤差變化較小且平滑。TIAN等[11]利用泡沫特征參數、浮選藥劑添加量等變量,采用可變性注意力機制的LSTM(Long Short Term Memory)模型,自動增強重要變量權值。結果表明所提出的模型均方根誤差RMSE和平均絕對誤差MAE值分別降低了13.8%和13%,并且決定系數R2增長了9.7%。YAN等[12]利用選礦廠在各分選流程中X熒光品位分析儀的銅品位測量數據,對比了不同模型預測性能,得出窗口自適應偏最小二乘法是最準確的方法,可以提前準確預測下一個測量周期的銅精礦品位,并可用于指導操作。李海波等[13]在分析了浮選工藝指標相互影響,利用核主元分析的方法(KPCA)對模型輸入變量(礦漿密度、流速、藥劑量、溶液pH值、入料品位等)進行降維處理,建立極限學習機(ELM)軟測量模型,輸出精礦品位和尾礦品位,應用結果表明軟測量模型精礦品位和尾礦品位的預測效果良好。王洪勛等[14]利用SBS算法對原礦品位、充氣量、粗選pH值等易測變量進行篩選作為輸入變量,采用非線性自回歸神經網絡進行訓練,實現對浮選精礦品位進行預測,相比于其他算法具有一定的優越性。
針對浮選精礦品位結果嚴重滯后于生產流程,不能實時檢測和反饋指導操作,本文通過對采集的各平臺數據源進行數據預處理,利用LSTM網絡在處理長時間序列信息的優勢,提出一種基于LSTM的浮選鉬精礦品位軟測量模型,并與其他神經網絡模型進行模型性能指標對比,充分驗證基于LSTM的軟測量模型預測精度高,實現浮選鉬精礦品位的在線預測。
柿竹園東坡選廠礦產資源豐富,礦物種類之多,是聞名世界的多金屬礦床,被國內外知名專家譽為“世界有色金屬博物館”[15]。東波多金屬礦選礦廠主要生產鎢精礦、鉬精礦、鉍精礦、螢石等礦物產品,其原礦中有用礦物種類多、嵌布粒度細、共生關系復雜。針對柿竹園東坡多金屬原礦品位低、成分復雜、嵌布粒度細等問題,通過多家科研單位聯合攻關研發了“柿竹園法”——鎢鉬鉍復雜多金屬礦綜合選礦新技術,解決了低品位稀有多金屬礦分離回收的選礦技術難題。
柿竹園多金屬礦為網脈狀云英巖-矽卡巖鎢鉬鉍礦石,有用金屬元素鉬主要以輝鉬礦和鉬礦等礦物存在,品位低,嵌布粒度細,成礦作用復雜,導致稀有金屬鉬精礦分離回收難。針對上述選礦技術難題,東坡選礦廠鉬礦浮選工藝流程:鉬鉍硫全浮—鉬鉍-硫分離—鉬-鉍分離(圖1)。浮選流程是一個十分復雜的工業過程,浮選藥劑、操作條件、礦漿pH值和泡沫狀態等是影響浮選鉬精礦指標的關鍵因素,精礦指標一直是各大選廠生產效益的關鍵參考點。

圖1 東坡選礦廠鉬礦浮選工藝流程Figure 1 Flotation process flow of molybdenum ore in Dongpo concentrator.
深度學習鄰域中,循環神經網絡(Recurrent Neural Networks,RNN)常常被用在處理時序問題,其特點是RNN在t時刻會將t-1時刻的隱節點作為當前時刻的輸入,而傳統神經網絡模型的隱節點的輸出只取決于當前時刻的輸入特征,RNN鏈式結構如圖2所示。

圖2 RNN鏈式結構Figure 2 The RNN chain structure.
梯度消失和梯度爆炸是困擾RNN模型訓練的關鍵原因之一,產生梯度消失和梯度爆炸是由于RNN的權值矩陣循環相乘導致的,相同函數的多次組合會導致極端的非線性行為。梯度消失和梯度爆炸主要存在RNN中,因為RNN中每個時間片使用相同的權值矩陣。LSTM是一種特殊的循環神經網絡,引入門(gate)機制用于控制特征的流通和損失,解決一般RNN中普遍存在的長期依賴問題。使用LSTM可以有效地傳遞和保存長時間序列中的信息并且不會導致有用信息被忽略(遺忘),從而解決RNN中的梯度消失和爆炸問題。經典LSTM神經網絡模型包括:遺忘門、輸入門和輸出門,其結構如圖3所示。

圖3 LSTM神經網絡模型Figure 3 The LSTM neural network model.
遺忘門是控制是否遺忘,在LSTM中即以一定的概率控制是否遺忘上一層的隱藏細胞狀態,選擇要遺忘的信息ft:
ft=σ(Wf·ht-1,Uf·Xt+bf)
(1)
式中:Wf、Uf為遺忘門的系數權重矩陣;σ為ReLU激活函數;ht-1為上一序列LSTM模塊的隱藏狀態輸出;Xt為t時刻樣本序列的輸入;bf為遺忘門的偏移項。
LSTM模塊中輸入門負責處理當前序列位置的輸入,其數學表達式為:
it=σ(Wi·ht-1,Ui·Xt+bi)
(2)
(3)
式中:Wi、Ui、WC、UC為輸入門的系數權重矩陣;σ為ReLU激活函數;ht-1為上一序列LSTM模塊的隱藏狀態輸出;Xt為t時刻樣本序列的輸入;bi、bC為輸入門的偏移項。
LSTM模塊中細胞狀態的更新,通過前面的遺忘門和輸入門的結果作用于細胞狀態,將細胞狀態Ct-1更新得到Ct,其數學表達式為:
(4)

LSTM模塊中輸出門當前時刻隱藏層狀態的數學表達式為:
Ot=σ(Wo·ht-1,Uo·Xt+bo)
(5)
ht=Ot×tanh(Ct)
(6)
式中:Wo、Uo為輸出門的系數權重矩陣;σ為ReLU激活函數;ht-1為上一序列LSTM模塊的隱藏狀態輸出;Xt為t時刻樣本序列的輸入;bo為輸出門的偏移項;Ct為t時刻序列的細胞狀態。

東坡多金屬選礦廠作為一個創新型的現代化選礦廠,其選廠整體自動化、數字化、智能化水平較高,實現了選廠生產流程的自動化控制和監控[16]。特別是浮選生產流程中關鍵設備和操作條件的實時監控與數據傳輸。經走訪調研,東坡多金屬選廠擁有集控平臺、浮選柱控制系統、藥劑控制系統、選廠浮選質量臺賬、數據云平臺等,為此實驗提供大量可靠的實驗數據。
分析整理上述各平臺采集的源數據,通過對選礦廠浮選工藝和浮選機理分析,篩選出多個影響浮選鉬精礦的變量作為模型輸入,具體模型輸入量如表1所示。

表1 預測模型輸入變量Table 1 The prediction model input variables
各系統平臺源數據的真實性和可靠性對浮選鉬精礦品位軟測量模型的準確度起著關鍵性作用。實際上因選廠環境復雜、人為操作不當和設備測量異常等原因導致實測數據與真實數據存在較大誤差,影響浮選鉬精礦數據庫質量,降低浮選鉬精礦品位軟測量模型的準確度。因此,采集的源數據使用前需經過異常值判定和缺失值填充等數據預處理方法,提高模型輸入變量的質量。
(7)
(8)
常用異常值檢測方法有:統計分析法、3σ原則[17]、箱線圖[18]等,采用3σ原則進行異常值判定。3σ原則:假設一組檢測數據含有隨機誤差,數據進行計算處理得到均值μ和標準差σ,按概率函數確定一個正常值區間(μ-3σ,μ+3σ),當樣本中某一數據超過這個區間,就不屬于隨機誤差而判定為粗大誤差,含有該誤差的樣本數據應予以剔除。
異常值經判定策略執行剔除處理,將導致樣本數據部分缺失,影響數據庫的完整性。針對缺失數據的常用預處理方法包括均值填充法、中位數填充法、眾數填充法等[19-20],實驗采取均值填充法,在一定程度上保留數據的真實性和可靠性。
東坡選廠自動化程度較高,選廠關鍵位置均安裝大量傳感器,用于數據的傳輸、處理、顯示、記錄和控制等,實現了選廠自動化檢測和數據實時傳輸。鑒于浮選工藝復雜、設備故障、溶液環境等影響,傳感器難以長期穩定工作,造成傳感器采集的數據存在大量噪聲,從而影響模型性能。針對上述傳感器采集的數據集中進行數據降噪,實驗采取小波變換[21-22]。具體參數為:Sym8小波基、3層小波分解、軟硬閾值折中法,以全浮掃選-BK205藥劑用量為例,數據經小波變換結果如圖4所示。

圖4 小波變化結果Figure 4 Results of wavelet transform.
分析整理柿竹園東坡多金屬各系統平臺的數據源,篩選確定影響浮選產品質量的主要因素,建立以每天兩班浮選工藝源數據的選廠浮選鉬精礦品位時間序列數據庫。將平臺采集的數據經異常值判定、缺失值填充、數據降噪等數據預處理方法,獲得617個樣本數據,將樣本數據庫的80%作為浮選鉬精礦品位軟測量模型的訓練集,數據庫的20%作為測試集用于驗證模型的準確度。
樣本數據進行模型訓練時,神經網絡結構參數的選擇尤為重要,直接影響模型的準確度。模型通過前向傳播算法,計算預測值與真實值的誤差,更新網絡結構權值和閾值,滿足訓練要求,尋找最優LSTM模型,評估模型性能指標,輸出預測值和保存最優模型?;贚STM的浮選鉬精礦品位軟測量模型流程如圖5所示。

圖5 軟測量模型流程Figure 5 Soft measurement model process.
實驗采取均方根誤差(Root Mean Squared Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和決定系數(Coefficient Of Determination,R2)對浮選鉬精礦品位軟測量模型性能指標進行評估,其計算公式為:
(9)
(10)
(11)

實驗機器內存為32 GB,GPU為NVIDIA GeForce RTX 3060,神經網絡模型采用PyCharm軟件進行編碼。基于LSTM的浮選鉬精礦品位軟測量網絡模型結構和參數設置如表2所示。

表2 模型結構和參數設置Table 2 Model structure and parameter settings
確保模型輸入數據的統一性,通過對比Linear模型、CNN模型與LSTM模型在測試集中的預測結果,真實值與預測值的對比如圖6~8所示。上述三種軟測量模型的性能指標進行評估,其結果見表3。不同模型預測值與真實值誤差如圖9所示。三種軟測量模型的真實值與預測值擬合結果如圖10~12所示。

表3 模型性能指標評估Table 3 Evaluation of model performance indicators

圖6 LSTM模型預測結果圖Figure 6 The LSTM model prediction result.

圖7 Linear模型預測結果圖Figure 7 The Linear model prediction result.

圖8 CNN模型預測結果圖Figure 8 The CNN model prediction result.

圖9 不同模型預測值與真實值的誤差Figure 9 The error between the predicted and true values of different models.

圖10 Linear模型真實值與預測值的擬合結果Figure 10 The fitting result of the real value and the predicted value of the Linear model.

圖11 CNN模型真實值與預測值的擬合結果Figure 11 The fitting result of the real value and the predicted value of the CNN model.
通過觀察真實值與預測值的對比圖可看出,Linear模型和CNN模型預測效果一般,在大部分樣本數據的預測值與真實值偏差很大,尤其是樣本數據出現突變時,模型誤差會增大。由圖7、8、10、11和表3可以看出Linear模型預測準確度較低,其MAPE=3.46%,RMSE=2.1646%,在3種模型中效果最差,真實值與預測值R2僅為0.300 2,擬合結果一般。CNN模型預測性能指標評估結果(MAPE=1.72%,RMSE=1.1453%),比Linear模型好,其R2為0.673 5,擬合效果較好。這是因為Linear模型為線性回歸,模型對于高維數據處理能力較低,而浮選鉬精礦品位數據量大、強非線性和強耦合,導致模型泛化能力降低,預測誤差大,擬合效果一般。CNN模型在多層神經網絡基礎上,加入卷積層、激活層和池化層操作以及局部權重共享結構,可以較好地處理高維數據和網絡并行學習,很好地提高了模型預測準確度。
LSTM作為一種特殊的循環神經網絡RNN,引入輸入門、輸出門、遺忘門控制機制可有效地傳遞或選擇性丟棄長時間序列中的信息,從而實現記憶或遺忘的功能,解決了循環神經網絡RNN中長序列依賴、梯度消失和爆炸等問題。試驗LSTM模型采用BatchNorm批量規范化處理樣本數據,加入Dropout正則化防止過擬合,進一步提高模型預測準確度,增強模型的泛化能力。從圖6、圖12和表3可知,其MAPE=1.13%,RMSE=0.7049%均為實驗模型最低值。以MAPE為例,LSTM模型預測誤差分別比Linear模型和CNN模型降低了2.33%和0.59%。經LSTM模型訓練后預測值與真實值決定系數R2為0.876 3,擬合效果很好。從圖9可看出,相對于Linear模型和CNN模型的樣本數據誤差波動,LSTM模型誤差波動相對平穩,浮動范圍小,浮選鉬精礦品位誤差≤±2.45%,充分說明基于LSTM的浮選鉬精礦品位軟測量模型可以實現鉬精礦品位軟測量的需求。

圖12 LSTM模型真實值與預測值的擬合結果Figure 12 The fitting result of the real value and the predicted value of the LSTM model.
1)針對浮選鉬精礦品位數據量大、強非線性、強耦合和難以準確預測等問題,收集及分析東坡稀有多金屬選礦廠各系統平臺數據源,篩選影響浮選鉬精礦的變量,將各平臺數據源進行數據預處理,建立柿竹園東坡稀有多金屬選廠浮選鉬精礦品位時間序列數據庫。
2)結合LSTM模型處理時間序列信息的優勢,構建基于LSTM的浮選鉬精礦品位軟測量模型,選擇MAPE、RMSE和R2用來評估浮選鉬精礦品位軟測量模型性能指標。
3)結果表明基于LSTM的浮選鉬精礦品位軟測量模型預測效果良好,相比于Linear模型和CNN模型,LSTM模型對浮選鉬精礦品位預測的MAPE和R2,分別為1.13%和0.876 3?;贚STM的浮選鉬精礦品位軟測量模型,預測準確度高,模型泛化能力強。針對于現場人工化驗方式大大滯后于浮選生產過程,本文提出的浮選鉬精礦品位軟測量方法,有助于浮選工根據預測結果實時判斷浮選產品質量調整工藝參數,對節約藥劑用量、提高浮選產品質、選廠智能化建設等方面起著非常關鍵的作用。