趙 哲,張 勇,于楠楠,崔桂梅
(內(nèi)蒙古科技大學(xué) 信息工程學(xué)院,包頭 014010)
高爐冶煉是一個(gè)持續(xù)性的高溫生產(chǎn)過(guò)程,高爐的穩(wěn)定順行是一切生產(chǎn)技術(shù)經(jīng)濟(jì)指標(biāo)和良好的經(jīng)濟(jì)效益的基礎(chǔ)[1]。爐溫是高爐穩(wěn)定順行的一個(gè)重要指示,在高爐冶煉過(guò)程中,一直以化學(xué)熱[Si](高爐鐵水硅含量)來(lái)表征爐溫,一定時(shí)期內(nèi)對(duì)于指導(dǎo)高爐操作具有積極的作用。但由于爐況的波動(dòng),爐況非平穩(wěn)時(shí)會(huì)出現(xiàn)高硅、高硫及低爐溫的現(xiàn)象[2],再利用鐵水硅、硫含量這種傳統(tǒng)方法去表征高爐爐溫是不準(zhǔn)確的甚至是與實(shí)際相反的。隨著測(cè)量手段的發(fā)展鐵水溫度測(cè)量數(shù)據(jù)的獲取和存儲(chǔ)已在各大高爐得到了廣泛的應(yīng)用,以鐵水溫度表征爐溫的物理熱的形式也越來(lái)越受到了爐長(zhǎng)們的關(guān)注。
鐵水溫度除了表征高爐爐溫以外,還是影響高爐出鐵和出渣的重要參變量,鐵水溫度過(guò)高或過(guò)低都不利于出鐵和出渣。而現(xiàn)行的高爐操作是以爐長(zhǎng)為主的人為操作制度,鐵水溫度數(shù)據(jù)受人為因素、測(cè)量環(huán)境變化等影響容易出現(xiàn)數(shù)據(jù)缺失及記錄異常。這些異常數(shù)據(jù)的存在,使得通過(guò)鐵水溫度觀測(cè)爐溫,反映爐況運(yùn)行狀態(tài)及指導(dǎo)高爐操作變的比較困難。
針對(duì)數(shù)據(jù)缺失及異常,常規(guī)方法主要采取3σ法則進(jìn)行異常值剔除[3],并用均值插補(bǔ)法進(jìn)行數(shù)據(jù)修補(bǔ)。研究發(fā)現(xiàn)采取傳統(tǒng)的方法進(jìn)行異常數(shù)據(jù)處理則有可能造成數(shù)據(jù)的填充不準(zhǔn)確或正確數(shù)據(jù)被誤剔除的現(xiàn)象。在數(shù)據(jù)檢測(cè)上本文首先針對(duì)數(shù)據(jù)樣本進(jìn)行常規(guī)的數(shù)學(xué)統(tǒng)計(jì),確定均值、方差及問(wèn)題數(shù)據(jù)的時(shí)間點(diǎn),進(jìn)而從多尺度[4]的角度對(duì)問(wèn)題數(shù)據(jù)的時(shí)間點(diǎn)采取短時(shí)間序列[5]的重新組合、統(tǒng)計(jì)及計(jì)算。在數(shù)據(jù)修補(bǔ)上,結(jié)合AR模型[6]對(duì)缺失值插補(bǔ),并考慮數(shù)據(jù)本身的特點(diǎn)。最后,以某鋼廠高爐數(shù)據(jù)做模型試驗(yàn),結(jié)果表明本方法比常規(guī)方法具有良好的檢測(cè)效果及修補(bǔ)優(yōu)勢(shì)。
現(xiàn)行的高爐操作是以爐長(zhǎng)為主的人為操作制度,高爐數(shù)據(jù)受人為因素、測(cè)量環(huán)境變化等影響容易出現(xiàn)數(shù)據(jù)記錄異常。如表1所示536批鐵次的鐵水溫度明顯是異常數(shù)據(jù);而表2第1032批鐵次鐵水溫度缺失則是受人為或儀器故障造成。如何更精確地檢測(cè)到異常數(shù)據(jù),并還原數(shù)據(jù),讓以數(shù)據(jù)為基準(zhǔn)的高爐操作更具可操作性,是高爐建模、優(yōu)化及操作面臨的首要問(wèn)題。

表1 鐵水溫度異常Tab.1 The Thm abnormal

表2 鐵水溫度缺失Tab.2 The Thm missing
常規(guī)異常值檢測(cè)主要采用3σ法則,在3σ法則中σ表征標(biāo)準(zhǔn)差,μ為均值,以某鋼廠高爐鐵水溫度3000組數(shù)據(jù)為例,計(jì)算得其均值μ=1493,標(biāo)準(zhǔn)差σ=12.71。由3σ法則對(duì)于值不在內(nèi)的概率小于0.3%既認(rèn)為其為異常值,可找到其異常值位置并對(duì)其進(jìn)行剔除。現(xiàn)對(duì)某鋼廠3000組鐵水溫度進(jìn)行檢測(cè),發(fā)現(xiàn)表1中的第536批鐵次的異常值被正常剔除,其結(jié)果如圖1所示。但遇到表3中第853、854、855批鐵次由于高爐在停爐、休風(fēng)、檢修及開(kāi)爐時(shí),爐況波動(dòng)較大,數(shù)據(jù)變化也大,常規(guī)3σ法則無(wú)法判斷其鐵水溫度下降原因,從而導(dǎo)致正常值被誤剔除,其結(jié)果如圖2所示。正常數(shù)據(jù)被誤剔除給高爐后期的建模、優(yōu)化及操作帶來(lái)不利影響。所以針對(duì)高爐這種高度復(fù)雜系統(tǒng)采用傳統(tǒng)3σ法則進(jìn)行數(shù)據(jù)異常值檢測(cè)是不合理的。

圖1 鐵水溫度異常值被剔除Fig.1 Reject abnormal data of Thm

圖2 鐵水溫度正常值被剔除Fig.2 Reject normal data of Thm

表3 鐵水溫度正常Tab.3 The Thm normal
常規(guī)缺失值補(bǔ)值主要采取均值插補(bǔ)法[7]。由于高爐冶煉是一個(gè)持續(xù)性的高溫生產(chǎn)過(guò)程,其鐵水溫度前一時(shí)刻與后一時(shí)刻均相互關(guān)聯(lián),因此利用均值插補(bǔ)法進(jìn)行補(bǔ)值是合理的。首先確定鐵水溫度缺失位置,然后以其前一時(shí)刻的鐵水溫度與最近的下一時(shí)刻鐵水溫度求均值,最后對(duì)缺失位置進(jìn)行補(bǔ)值。現(xiàn)對(duì)于表2中的第1032批鐵次缺失值可以利用均值插補(bǔ)法進(jìn)行補(bǔ)值,但如遇到由儀器長(zhǎng)時(shí)間故障造成鐵水溫度連續(xù)缺失,顯而易見(jiàn),簡(jiǎn)單地利用均值插補(bǔ)法對(duì)連續(xù)缺失的數(shù)據(jù)進(jìn)行補(bǔ)值則是不合理的。
針對(duì)傳統(tǒng)異常數(shù)據(jù)檢測(cè)及修補(bǔ)方法對(duì)于高爐這種高度復(fù)雜的系統(tǒng)的不合理性,現(xiàn)結(jié)合高爐數(shù)據(jù)本身特點(diǎn)提出新的解決方法,為節(jié)能型高爐建模、優(yōu)化及操作提供更為真實(shí)的數(shù)據(jù)。
由于常規(guī)異常值檢測(cè)3σ法則存在無(wú)法準(zhǔn)確區(qū)分?jǐn)?shù)據(jù)超出μ±3σ范圍外的問(wèn)題,既當(dāng)高爐正常休風(fēng)維護(hù)時(shí)造成的鐵水溫度正常下降超出μ±3σ范圍時(shí),被誤當(dāng)做異常值給剔除的問(wèn)題。現(xiàn)結(jié)合高爐數(shù)據(jù)本身特點(diǎn)引入多尺度與常規(guī)3σ準(zhǔn)則相互結(jié)合來(lái)判斷鐵水溫度超出μ±3σ范圍是否由異常值引起的。
尺度是空間數(shù)據(jù)的共有特征,同時(shí)人們對(duì)數(shù)據(jù)的觀測(cè)及判斷也是在不同尺度上進(jìn)行的。因此用多尺度來(lái)描述、分析數(shù)據(jù)是非常自然的事情[8]。
多尺度與傳統(tǒng)3σ法則結(jié)合,先用粗尺度對(duì)數(shù)據(jù)共性進(jìn)行認(rèn)識(shí),再進(jìn)行尺度變換以細(xì)尺度對(duì)數(shù)據(jù)個(gè)性進(jìn)行認(rèn)識(shí),最終通過(guò)尺度變換達(dá)到對(duì)數(shù)據(jù)的準(zhǔn)確認(rèn)識(shí),如圖3所示為其檢測(cè)流程圖,針對(duì)鐵水溫度異常值檢測(cè)具體步驟為
步驟13σ法則對(duì)整個(gè)樣本空間進(jìn)行粗尺度異常值檢測(cè),找到μ±3σ外鐵水溫度的鐵間批次Tn;
步驟2以Tn為中心與n-1、n+1批鐵次組成小樣本空間對(duì)其進(jìn)行細(xì)尺度3σ檢測(cè),找到μ1±3σ1外鐵水溫度的鐵間批次 T(1)n,其中 μ1、σ1分別為小樣本空間的均值與方差;
步驟3鐵間批次T(1)n所對(duì)應(yīng)的鐵水溫度既判定其為異常溫度對(duì)其進(jìn)行剔除。

圖3 新異常值檢測(cè)方法流程圖Fig.3 New outliers detection method flow chart
均值插補(bǔ)對(duì)于數(shù)據(jù)的單一缺失值有良好的補(bǔ)值效果,但對(duì)于事故造成一段時(shí)間內(nèi)數(shù)據(jù)連續(xù)缺失時(shí)再簡(jiǎn)單的利用均值插補(bǔ)法進(jìn)行補(bǔ)值會(huì)對(duì)數(shù)據(jù)產(chǎn)生較大的偏差,這些偏差較大數(shù)據(jù)難以反映高爐數(shù)據(jù)的真實(shí)性。
AR模型是數(shù)據(jù)處理、修補(bǔ)及噪聲方差估計(jì)過(guò)程中常用的模型,其可以通過(guò)時(shí)間序列的歷史數(shù)據(jù)來(lái)體現(xiàn)數(shù)據(jù)隨時(shí)間的變化規(guī)律,將這種變化延伸到未來(lái),從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的預(yù)測(cè)[9]。既某一時(shí)刻的鐵水溫度可由前幾個(gè)時(shí)刻的數(shù)據(jù)并依據(jù)自回歸時(shí)間序列模型修復(fù):

式中:yt為第t批鐵次的鐵水溫度。
考慮高爐數(shù)據(jù)特點(diǎn),此處值可由異常數(shù)據(jù)的前2個(gè)時(shí)刻數(shù)據(jù)并依據(jù)二階自回歸模型修復(fù),其中ai(i=1,2)為模型參數(shù),由鐵次t前的正常高爐爐溫樣本數(shù)據(jù){y1,y2,…,y(t-1)}訓(xùn)練可得。
an為第t-n批鐵次與第t批鐵次相關(guān)系數(shù),an用最小二乘辨識(shí)方法進(jìn)行參數(shù)估計(jì)[10],普通的最小二乘需要更多的數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練,但高爐的復(fù)雜性使其數(shù)據(jù)存在不確定性,不能有效的保證更多的訓(xùn)練數(shù)據(jù)都為正常數(shù)據(jù),對(duì)其進(jìn)行參數(shù)估計(jì)存在較慢的收斂速度,較低的估計(jì)精度,因此在此選用多信息最小二乘方法進(jìn)行參數(shù)估計(jì)[11],即用更少的數(shù)據(jù)獲得更快收斂速度,更高的預(yù)測(cè)精度。
考慮到t-p+1到t時(shí)共有p組數(shù)據(jù),令


矩陣方程:

取準(zhǔn)則函數(shù):

使準(zhǔn)則函數(shù)最小的多信息最小二乘算法如下:

式中:yt∈R為系統(tǒng)輸出,a∈Rn為待辨識(shí)的參數(shù)向量,Φt∈Rn是由系統(tǒng)輸入ut∈R和輸出Xt構(gòu)成的回歸信息向量,εt為均值為零的干擾噪聲。在此用100組數(shù)據(jù)即可對(duì)a進(jìn)行參數(shù)估計(jì)。
現(xiàn)應(yīng)用新方法對(duì)鐵水溫度進(jìn)行檢測(cè),其檢測(cè)結(jié)果如圖4、圖5所示。從圖中可看出鐵水溫度異常值被準(zhǔn)確剔除,而由于休風(fēng)引起的鐵水溫度正常下降未被誤剔除,數(shù)據(jù)處理結(jié)果表明常規(guī)準(zhǔn)則與多尺度結(jié)合針對(duì)高爐這種高度復(fù)雜的系統(tǒng)可以準(zhǔn)確地剔除異常值,并有效地防止高爐因正常維護(hù)引起的鐵水溫度過(guò)低被誤剔除。

圖4 鐵水溫度異常值被剔除Fig.4 Reject abnormal data of Thm

圖5 鐵水溫度正常值未被剔除Fig.5 Not reject normal data of Thm
現(xiàn)人為去除表4中2002~2007批鐵次的鐵水溫度,分別使用常規(guī)均值插補(bǔ)法與AR模型對(duì)缺失值進(jìn)行補(bǔ)值,并與原始值進(jìn)行對(duì)比,校驗(yàn)數(shù)據(jù)修補(bǔ)性能。

表4 鐵水溫度Tab.4 Data of Thm
現(xiàn)分別對(duì)2種補(bǔ)值方法用平均相對(duì)誤差、最大相對(duì)誤差、預(yù)測(cè)精度相對(duì)比,結(jié)果如表5所示,其中用均方根誤差表示預(yù)測(cè)精度:

式中:Xt為鐵水溫度實(shí)際值;X^t為預(yù)測(cè)鐵水溫度;n為預(yù)測(cè)樣本個(gè)數(shù)。

表5 各模型性能比較Tab.5 Model performance comparison
從表5中可以看出AR模型補(bǔ)值的效果優(yōu)于均值插補(bǔ)法,在鐵水溫度連續(xù)缺失時(shí)AR模型也能取得較好的補(bǔ)值效果。
其修補(bǔ)結(jié)果如圖6所示,圖6為2種方法修補(bǔ)后數(shù)據(jù)與原數(shù)據(jù)進(jìn)行對(duì)比,從圖中也可以明顯地看出AR補(bǔ)值相比于傳統(tǒng)的均值插補(bǔ)法補(bǔ)值效果更好。

圖6 均值插補(bǔ)與AR模型補(bǔ)值對(duì)比Fig.6 Comparisons between mean interpolation and AR model process
本文針對(duì)傳統(tǒng)修補(bǔ)方法不適合高爐這種高度復(fù)雜的系統(tǒng)的問(wèn)題,結(jié)合高爐本身特點(diǎn),提出多尺度與傳統(tǒng)3σ法則相結(jié)合對(duì)鐵水溫度進(jìn)行異常值檢測(cè)、異常數(shù)據(jù)的位修補(bǔ)、基于AR模型的數(shù)據(jù)修補(bǔ)等新方法。并應(yīng)用某鋼廠數(shù)據(jù)仿真,數(shù)據(jù)仿真結(jié)果表明,本文提出的新方法可有效地剔除異常值,同時(shí)防止正常值被誤剔除,補(bǔ)值效果也更接近于實(shí)際值,這為后期節(jié)能型高爐建模、優(yōu)化及操作提供了更為真實(shí)的數(shù)據(jù)。
[1]范廣權(quán).高爐煉鐵操作[M].北京:冶金工業(yè)出版社,2008.
[2]周傳典.高爐煉鐵生產(chǎn)技術(shù)手冊(cè)[M].北京:冶金工業(yè)出版社,2012.
[3]桂衛(wèi)華,陽(yáng)春華.復(fù)雜有色冶金生產(chǎn)過(guò)程智能建模、控制與優(yōu)化[M].北京:科學(xué)出版社,2010.
[4]高惠君.城市規(guī)劃空間數(shù)據(jù)的多尺度處理與表達(dá)研究[D].北京:中國(guó)礦業(yè)大學(xué),2012.
[5]肖輝.時(shí)間序列的相似性查詢(xún)與異常檢測(cè)[D].上海:復(fù)旦大學(xué),2005.
[6]常太華,王璐,馬巍.基于AR、ARIMA模型的風(fēng)速預(yù)測(cè)[J].華東電力,2010,38(1):59-62.
[7]金勇進(jìn).缺失數(shù)據(jù)的插補(bǔ)調(diào)整[J].數(shù)理統(tǒng)計(jì)與管理,2010,20(5):47-53.
[8]潘泉,張磊,崔培玲,等.動(dòng)態(tài)多尺度系統(tǒng)估計(jì)理論與應(yīng)用[M].北京:科學(xué)出版社,2007.
[9]胡勁松,楊世錫.EMD方法基于AR模型預(yù)測(cè)的數(shù)據(jù)延拓與應(yīng)用[J].震動(dòng)、測(cè)試與診斷,2007,27(2):116-170.
[10]彭秀艷,王茂,劉長(zhǎng)德.AR模型參數(shù)自適應(yīng)估計(jì)方法研究及應(yīng)用[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2009,41(9):12-16.
[11]丁鋒.系統(tǒng)辨識(shí)[J].南京信息工程大學(xué)學(xué)報(bào):自然科學(xué)版,2012,4(1):1-28.