朱偉,陳凝,李旺洲,吳宇航
(1.華北理工大學數(shù)學建模創(chuàng)新實驗室,河北 唐山 063210;2.華北理工大學理學院,河北 唐山 063210;3.河北省數(shù)據(jù)科學與應用重點實驗室,河北 唐山 063210;4.唐山市數(shù)據(jù)科學重點實驗室,河北 唐山 063210)
當前我國現(xiàn)存的100噸以下的中小型轉(zhuǎn)爐約有500余座,占全國煉鋼產(chǎn)能的50%左右,這些轉(zhuǎn)爐在地方骨干鋼鐵企業(yè)中也起著舉足輕重的作用。由于中小型轉(zhuǎn)爐無法安裝副槍系統(tǒng),終點控制命中率較低,且面臨著“去產(chǎn)能、綠色制造和市場競爭”的耦合壓力,因此,突破中小型轉(zhuǎn)爐煉鋼的技術瓶頸,開辟中小型轉(zhuǎn)爐智能煉鋼勢在必行。現(xiàn)有的轉(zhuǎn)爐煙氣分析系統(tǒng)是在靜態(tài)控制方程控制下在煉鋼的最后階段引入動態(tài)檢測,根據(jù)實時情況改變控制方程相關參數(shù),從而引導煉鋼終點的精準命中。轉(zhuǎn)爐煙氣分析動態(tài)控制是通過連續(xù)檢測轉(zhuǎn)爐吹煉中產(chǎn)生的煙氣成分(CO、CO2、N2、O2、Ar、H2)和煙氣流量,計算熔池的瞬時脫碳速度和脫碳量,并根據(jù)瞬時供氧量和渣料加入量計算氧在C、Si、Mn、P、S等元素的分配比,推算出熔池中各元素含量與爐渣成分。在我國雖然已經(jīng)有一部分轉(zhuǎn)爐采用煙氣分析系統(tǒng),對煉鋼終點進行控制,但是該系統(tǒng)對鋼水中碳含量和溫度值的動態(tài)預報精度取決于煙道安裝環(huán)境和數(shù)據(jù)信息同步狀況,魯棒性不高,無法切實實現(xiàn)智能煉鋼。因此,深度挖掘煙氣分析系統(tǒng)采集的煉鋼過程數(shù)據(jù)信息,獲取魯棒性高的碳溫動態(tài)預報模型成為了一個關鍵問題,在實踐生產(chǎn)中也是一個關鍵技術。
通過實驗獲取了5組在不同轉(zhuǎn)爐情況下5次煉鋼進程中(靜態(tài)控制模型預設的累計耗氧比例)70%~100%過程中時間同步的氧氣消耗比例PQ、氧氣消耗總量Q、煙氣中的CO含量[CO]、煙氣中的[CO2]和該時刻對應的實際情況下鋼水中的碳含量[C]和鋼水溫度值[T],其中由于煙氣分析系統(tǒng)硬件與安裝的客觀原因[CO]和[CO2]指標值與其余的幾個標值雖然在時間上同步對應,但在實際反映上有一定的延遲,也就是說當前采集的[CO]和[CO2]兩個指標反映的是前一個時刻或前n個時刻的熔池反映信息。針對獲取的樣本數(shù)據(jù),對其進行基于Z-score[1]的標準化處理,使樣本符合標準正態(tài)分布,去除參數(shù)量綱的影響,以提高訓練網(wǎng)絡時的收斂速度和模型的預測精度。
對標準化處理后的參數(shù)進行分析。可見每一個樣本均代表一次煉鋼過程,其各項參數(shù)均具有時間序列性。故對樣本按順序選取訓練集和驗證集的方式顯然是欠妥的,可能會導致網(wǎng)絡對特定情況下精度極低。鑒于上述情況,將5組樣本數(shù)據(jù)進行組合后,運用SPSS軟件對總體進行隨機取樣,隨機取樣情況如圖1所示。隨機選取70%的數(shù)據(jù)作為訓練集,選取30%的數(shù)據(jù)作為驗證集。

圖1 隨機取樣情況直方圖Fig. 1 Histogram of random sampling situation
由圖1可見其取樣情況較為均勻,訓練和驗證集的可信度較高。
運用Matlab以樣本的氧氣消耗比例PQ、氧氣消耗總量Q、煙氣中的CO含量[CO]、煙氣中的[CO2]為影響因素,鋼水中的碳含量[C]和鋼水溫度值[T]為目標預測值,建立三層神經(jīng)網(wǎng)絡預測模型,網(wǎng)絡設置為單隱含層,神經(jīng)元節(jié)點為10個,求解器選取TRAINLM,L-M優(yōu)化權值算法[5],節(jié)點傳遞函數(shù)選取了TANSIG函數(shù)[6]。網(wǎng)絡的學習速率為0.1,梯度下降為0.001。在MSE(均方誤差)精度的選取上[7],發(fā)現(xiàn)MSE的選取與BP神經(jīng)網(wǎng)絡的預測精度有著直接的關系,精度選取過高,會使網(wǎng)絡雖然收斂于樣本,但其泛化能力急劇降低,反而并不能很好用于預測;精度選取過低,則網(wǎng)絡收斂性較差,模型預測的準確率低。如何在模型的泛化能力和準確度中選取一個合適的精度顯然是一個需要多次試驗研究的過程。
建立碳含量和溫度值的BP網(wǎng)絡預測模型,設定其MSE精度分別為0.1、0.01、0.001、0.0001、0.00001。通過不同精度的網(wǎng)絡對驗證集進行驗證,尋找其最佳精度。
由表1可知當MSE精度選取為0.0001時,含碳量和溫度值預測模型的網(wǎng)絡收斂性和泛化能力均較強,能夠很好的運用于預測模型。因此,分別建立碳含量和溫度值的預測模型,預測情況如圖2~3所示。

圖2 碳含量預測網(wǎng)絡收斂示意圖Fig. 2 Schematic diagram of carbon content prediction network convergence
對碳含量以及溫度預測模型的誤差進行分析,可發(fā)現(xiàn)其網(wǎng)絡誤差的產(chǎn)生具有一定規(guī)律性,其誤差往往呈現(xiàn)波動態(tài)勢。其預測誤差分布圖如圖4所示。

表1 不同MSE精度下的預測均方誤差Table 1 Prediction mean square error under different MSE accuracy

圖3 溫度值預測網(wǎng)絡收斂示意圖Fig. 3 Schematic diagram of temperature prediction network convergence

圖4 預測誤差分布圖Fig. 4 Distribution of forecast error
為研究誤差產(chǎn)生的原因,將PQ,Q,CO,CO2以及前5次預測值等變量和訓練所產(chǎn)生的誤差進行相關性分析,分析結(jié)果顯示:

表2 誤差與CO相關性Table 2 Error and CO correlation
由表可見誤差的產(chǎn)生同CO和CO2的檢測量有著顯著性相關。
故可推斷出原模型的訓練過程中,可能丟失了部分CO與CO2相關的規(guī)律,導致了誤差的產(chǎn)生,這正好同數(shù)據(jù)表中的[CO]和[CO2]指標值與其余的幾個指標值在實際反映上有一定的延遲性相對應。

表3 誤差與CO2相關性Table 3Error and CO2 correlation
鑒于誤差產(chǎn)生的因素分析,提出基于預測誤差構建誤差分析預測模型,以修復原模型誤差的方法。將樣本訓練中所產(chǎn)生的誤差,重新構成誤差分析數(shù)據(jù)序列。將該時間點的煙氣中的CO含量[CO]、煙氣中的[CO2]作為網(wǎng)絡的變量,訓練誤差分析網(wǎng)絡,以預測該時間點的誤差。并將該預測誤差反向修復原預測值。其流程基本如下:

圖4 誤差預測修復模型流程圖Fig. 4 Flow chart of error prediction and repair model
對含碳量預測模型和溫度值預測模型分別構建誤差預測模型,反向修復原誤差值。
隨機選取總體中70%的數(shù)據(jù)作為訓練集,30%的樣本作為驗證集。并針對碳含量和溫度預測模型,分別引入誤差預測模型進行修復。
碳含量預測模型,誤差修復后的預測誤差分布圖及改進前后的預測誤差對比如圖所示:

圖5 含碳量預測模型誤差修復后的預測誤差分布圖及改進前后的預測誤差對比Fig. 5 Prediction error distribution of carbon content prediction model after error repair and comparison of prediction error before and after improvement
溫度值預測模型,誤差修復后的預測誤差分布圖及改進前后的預測誤差對比如圖6所示
差修復模型較好的改善了原網(wǎng)絡的誤差。改進前和改進后的模型誤差在波動規(guī)律上具有相似性。這也側(cè)面反應誤差分析網(wǎng)絡較好得描述出了誤差產(chǎn)生的原因。剩余誤差大致為誤差分析網(wǎng)絡對具體誤差大小的規(guī)則描述尚不完善,尚有改進的余地。
在改進后地碳含量預測在PQ [76.75-82.35]區(qū)間具有較為穩(wěn)定準確的預報結(jié)果,其誤差均低于0.02。

圖6 溫度值預測模型誤差修復后的預測誤差分布圖及改進前后的預測誤差對比Fig. 6 Prediction error distribution of temperature prediction model after correction and comparison of prediction error before and after improvement
改進后的溫度預測在PQ [79.54-84.45]區(qū)間預測結(jié)果較為精準,誤差均小于1。
因此可得出結(jié)論預測模型在PQ [79.54-82.35]期間模型的C&T預測的均較為穩(wěn)定,且預測的準確度較高。
另由于模型的驗證集是由5個樣本中隨機選取30%的數(shù)據(jù)進行驗證,其精度較為穩(wěn)定,故可得出該模型在樣本中具有一定的普適性,其魯棒性較高。
通過建立BP神經(jīng)網(wǎng)絡預測模型。較精確得獲取了鋼水含碳量和溫度值的預測值,泛化能力較好,模型具有較高的魯棒性。在問題的解決過程中,通過誤差的反向挖掘,較為準確的分析出了誤差產(chǎn)生的原因,提出建立了誤差的預測模型,修復預測模型所產(chǎn)生的誤差,極大得提高了預測模型的精度。且該方法具有一定的普適性,可用于其他的預測模型和方法。