都勝朝,劉 貝,石和乾,徐本橋,王 銳,沈 錢
(武漢鋼鐵有限公司設備管理部,湖北 武漢 430083)
鋼鐵企業的生產流程中,連鑄設備是連接上游工序(煉鋼)和下游工序(軋鋼)非常關鍵的生產設備[1]。連鑄設備運行正常與否,對整個鋼鐵生產流程有著極其重要的影響。一旦連鑄機發生故障,將會導致大批量的鑄坯質量問題[2]。扇形段是連鑄機的關鍵部件,若出現故障將會影響整個連鑄過程。因此,需要找到合適的扇形段狀態監測方法,對扇形段運行狀態進行評估,并且為了方便工作人員查看狀態信息,需要開發一套扇形段運行過程的狀態監測系統使狀態信息可視化。
都勝朝等為了提前發現連鑄機扇形段故障發生的位置,基于SIMTAC系統的WINCC在線監測技術,建立3種模型進行對比試驗,結果表明開澆過程雙流拉矯力模型的效果最好,但是方法實施過程復雜,并且需要人工進行曲線比對[3]。
隨著大數據時代的來臨,工程設備實時運轉數據背后所隱含的健康信息需要去深究[4-5]。基于數據驅動的故障預測方法主要有人工神經網絡、遺傳算法、支持向量機(SVM)、奇異譜分析等[6]。如文獻[7-10],很多學者采用SVM方法去解決故障診斷問題,或者采用參數優化方法去優化SVM模型的參數,以提高模型的準確率。近年來,采用SVM模型進行故障預測的方法也越來越多,如張梅等[11]采用基于最小二乘支持向量機(LS-SVM)的提升機故障預測模型對礦井提升機進行故障預測,并且與小波神經網絡模型進行對比,結果顯示LS-SVM模型預測誤差小,收斂速度快。DUAN等[12]研究了模型參數(懲罰因子核、函數寬度和不敏感帶損函數)和訓練樣本量對回歸模型預測精度的影響,提出了確定最優支持向量機回歸模型(SVR)的方法。上述方法雖然利用SVR模型進行故障預測,但是并沒有對模型參數選取進行優化。
本文基于數據分析、數據挖掘技術實現故障診斷。故障預測部分考慮到故障樣本數據數量的局限性,并且需要對拉矯力數值進行預測,所以采用支持向量機回歸算法(SVR)來進行預測,搭配SG平滑濾波去噪。采用粒子群優化算法(PSO)對SVR進行參數尋優,尋找最優參數,并且通過對比試驗,驗證SG-PSO-SVR模型的預測效果。
故障預測法是一種在故障診斷的基礎上發展起來的一種更準確的維修方法。故障預測的最大價值是技術人員利用設備的設計數據、狀態數據等信息,運用適當的方法預測未來的設備故障,提前發現可能存在的缺陷,根據情況進行維修。這可以有效地保證設備的工作效率,減少設備故障帶來的不必要的損失。
連鑄機扇形段的故障預測是依靠扇形段運行過程中產生的實時數據,并對數據進行分析,利用合適的機器學習模型實現故障預測。首先,利用傳感器將扇形段運行過程中產生的總拉矯力、分拉矯力、拉速、鑄流長度數據進行采集并存儲到數據庫,然后利用數據分析及數據挖掘技術進行工況分割、狀態識別,采用灰色關聯分析(GRA)實現故障定位,采用SG-PSO-SVR實現拉矯力的數值預測,通過預測到的拉矯力數值再進行狀態識別,這樣就使故障預測的問題變成了故障診斷問題,然后將診斷結果返回可視化界面,方便工作人員查看并記錄信息。預測思路如圖1所示。
Savitzky-Golay卷積平滑(SG)關鍵在于矩陣算子的求解。設濾波窗口的寬度為n=2m+1,各測量點為x=(-m,-m+1,……,-1,0,1,……,m-1,m),采用k-1次多項式對窗口內的數據點進行擬合,令y=a0+a1x+a2x2+…+ak-1xk-1。
產生n個這樣的方程,構成k元線性方程組。要使方程組有解則n應大于等于k,一般選擇n>k,通過最小二乘法擬合確定擬合參數A。由此得到:
用矩陣表示為:
Y(2m+1)×1=X(2m+1)×k·Ak×1+E(2m+1)×1

B=X·(XT·X)-1·XT,其中最重要的可調參數是窗口長度n及階數k值選用。
選取最佳窗口長度n及階數k進行對比試驗,其中窗口長度n一般選取奇數,并且k必須要小于n。由于標準差可以反映數據的離散程度,標準差越小,數據的離散程度越低,數據就越平滑,所以采用標準差作為去噪效果的評價指標,試驗結果如表1所示。

表1 對比試驗結果Table 1 Comparative test results
從表1可以看出,在窗口長度n不變的情況下,隨著階數k的遞增,S1與S2的標準差也逐漸降低,但是,當k>3時,標準差又開始遞增,因此,選用階數k為3。然后,保持k不變,逐漸增加窗口長度n,可以看出,隨著窗口長度的遞增,標準差也是逐漸遞減,直至n>15時才出現遞增現象。綜上所述,選取窗口長度n=15,階數k=3。
圖2為去噪后的兩流總拉矯力數據及原始兩流拉矯力數據曲線。從圖2可看出處理后的數據較原始數據相對平滑,且數據曲線呈現的鋸齒形波動也明顯減弱。

圖2 平滑后曲線對比Fig.2 Curve comparison after smoothing
SVR作為支持向量機(SVM)的分支從而被提出,其基本思想是通過核函數,將輸入空間映射到高維空間,進而求出原樣本集的最優分類面,使得所有樣本離該最優分類面的誤差最小[13-15]。
設在高維特征空間中建立的線性回歸函數為式(1):
f(x)=wTφ(x)+b=
(1)
式中:xi(xi∈Rm)是第i個樣本的輸入向量,yi(yi∈R)為隊形的輸出值;w=(w1,w2,…,wn)T為權值系數向量,φ(x)為非線性映射函數,f(x)為y的估計值,b為常數項。
可以將最有分類面的構造轉化為二次規劃問題,即式(2):
(2)
約束條件見式(3):
(3)
式中:αi為與每個樣本對應的拉格朗日乘子;ε為線性不敏感損失誤差;C為懲罰因子,其值越大表示對誤差大于ε樣本的懲罰力度越大,反之越小。
最終SVR可以表示為式(4):
(4)
在SVR模型中,超參數的選擇對模型的泛化能力及準確度都有較大的影響[16]。使用傳統的網格搜索法尋找最優超參數效率低下,因此本文采用PSO優化算法對SVR進行參數尋優,具體步驟如圖3所示。

圖3 算法流程圖Fig.3 Algorithm flow chart
其中,將懲罰參數C、參數epsilon作為PSO算法中的粒子,由SVR模型計算出的各個粒子的均方根誤差(MSE)作為適應度函數來驗算粒子的優劣。通過不斷更新粒子的速度和位置,直至達到最小誤差或最大迭代次數,從而得到滿足適應值函數最小的全局最優解,即得到了經過PSO算法優化的SVR模型參數。
扇形段故障預測系統從功能上分為3部分,包括基于Windows平臺的人機交互界面,用于故障預測系統的管理與控制;基于Python語言編寫的腳本文件,用于工況分割、狀態識別、故障定位及拉矯力數值預測;基于傳感器的數據感知層,用于扇形段運行過程中的數據采集。
運行扇形段故障預測系統由數據采集、數據庫、業務邏輯處理及前端展示4個單元組成,如圖4所示。數據采集主要負責獲取扇形段運行過程中產生的總拉矯力、分拉矯力、拉速及鑄流長度實時數據,采集數據的頻率為每5 s采集一次數據;數據庫負責存儲采集數據、系統固有信息及系統參數;業務邏輯處理主要負責系統業務處理、系統管理及負責對外接口的部分;前端展示負責系統各項功能展示。

圖4 系統邏輯結構Fig.4 System logic structure
扇形段故障預測系統在物理架構上,主要包括WEB服務器、應用服務器、上位機及數據庫服務器等,并可與外部接口開展數據交換,為扇形段故障預測系統提供數據支撐。
系統采用成熟和標準的J2EE企業級應用架構搭建,該架構的應用特點是多環境多系統的交互、海量數據、高并發(用戶訪問量)、高TPS(每秒吞吐量)、安全等級高及自動化集群管理,提供分布式服務與彈性計算,具有良好的兼容性和跨平臺特性。系統軟件架構主要包括數據層、應用層及界面層,如圖5所示。

圖5 系統軟件架構Fig.5 System software architecture
考慮到連鑄機扇形段工作環境惡劣、便于數據管理及數據觀測性要求較高的特點,扇形段故障預測系統選用配置較高的臺式電腦作為上位機。為滿足實際的狀態監測和故障預測需求,共設置5個模塊,分別為:
(1) 參數設置模塊。該模塊用于設置模型中用到的參數,以達到適應不同場景不同設備的需求,提高系統的適用性,該模塊的參數設置可以由專業人員設置,設置合適的參數可以達到最好的效果。
(2) 用戶管理模塊。用于查看登錄信息、設置權限及增加不同的登錄用戶。
(3) 數據管理模塊。該模塊主要是負責與數據庫之間的數據交換,模型中保存的預測值及傳感器獲取的數據都儲存在數據庫中,為了不破壞原有的數據文件,設置該模塊。
(4) 數據查詢模塊。配合數據管理模塊使用,可以按照時間查詢兩流總拉矯力、拉速、分拉矯力及兩流狀態的數據查詢,方便后續需要時查看。
(5) 數據可視化模塊。該模塊主要負責數據可視化及狀態信息可視化,首先是可以查看兩流的總拉矯力及分拉矯力的數據,可以根據模型判斷條件查看開始澆鑄階段及正常澆鑄階段的動態數據曲線及查看兩流拉矯力預測值曲線對比值;其次可以選擇預測時間,便于拉矯力數值的預測。開澆階段故障定位利用灰色關聯性分析定位故障發生的扇形分段。根據拉矯力預測值及故障定位,將信息匯總顯示,在報警信息區顯示時間及預測將會發生故障的扇形段的位置。
扇形段的狀態識別依靠數據分析、數據挖掘技術實現,主要包括工況分割、狀態識別及故障定位3個部分。利用鑄流長度數據及提前設置的參數條件來區分當前數據是否屬于開始澆鑄階段的數據,剔除非開澆階段的數據,提取屬于開澆階段的拉矯力數據,構建開澆工況數據集。利用SG平滑算法對兩流拉矯力數據進行去噪處理,然后通過去噪后的拉矯力數據方差及參數條件來剔除非正常澆鑄階段的數據,構建正常澆鑄階段數據集。對開澆工況中拉矯力數據進行降噪處理,然后通過兩流拉矯力數據及拉速數據的差值進行貼標簽處理,狀態異常數據標記為1,正常狀態標記為0。
對正常澆鑄階段拉矯力數據進行SG平滑濾波去噪,通過計算拉矯力前10個采樣點的均值及提前設置的參數條件對正常澆鑄階段的數據進行貼標簽處理,對判定正常狀態的數據標記為0,異常數據標記為1。對出現異常的時間點對應的分拉矯力數據進行去噪處理,然后使用GRA相關性分析獲取出現故障概率最大的扇形分段,實現故障定位。如圖6所示,上述流程的實時數據狀態及報警信息都可以在系統的數據可視化模塊查看。

圖6 實時狀態界面Fig.6 Real time status interface
扇形段故障預測的關鍵是拉矯力數值的預測,因此可以預測未來某時間段內的拉矯力數值,通過與其他分拉矯力的變化趨勢進行對比可以達到故障預測的目的??紤]到故障樣本數據數量的局限性,采用支持向量機回歸算法(SVR)進行故障預測,并采用粒子群優化算法(PSO)對SVR算法進行參數尋優。
模型的搭建及訓練過程寫在一個函數中,以便后續重復的調用。以一流總拉矯力(F1)為例,選取一個小時的數據量,即720個樣本點。首先對該分段的拉矯力數據進行SG平滑去噪處理,對降噪處理后的拉矯力數據構建總體樣本集。設置滑動窗口的長度為30,滑動步長為1在拉矯力時間序列數據上滑動,以窗口中的數據作為特征數據,窗口的下一個數據作為對應的預測值,得到特征集及目標集,即將窗口內的30個數據作為特征值,對應窗口的下一個值作為目標值,不斷重復這個過程,直到對所有數據劃分完畢,構成總體樣本集。然后分割數據集,以7﹕3的比例得到訓練集及測試集。因為訓練集的數值較大,所以要對訓練集進行無量綱化處理,也就是對訓練集進行標準化。將得到的訓練樣本分別輸入到SG-SVR模型及SG-PSO-SVR模型,并使用測試集驗證兩個核函數的效果,選擇平均絕對百分誤差(Mean Absolute Percentage Error,MAE)和均方根誤差(Root Mean Square Error,RMSE)對不同核函數的支持向量回歸模型進行評價。兩個評價指標的計算公式如式(5)、式(6)所示:
(5)
(6)

然后進行模型的訓練并將拉矯力預測值保存,上述步驟的流程圖如圖7所示。

圖7 故障預測流程圖Fig.7 Fault prediction flow chart
模型的預測結果如圖8所示。由圖8可得,采用SG-PSO-SVR模型預測的拉矯力數值與真實拉矯力數值差異較小,預測效果較好;而采用SG-SVR模型預測的拉矯力數值與真實值相差較大,預測效果較差,兩種模型的評價指標如表2所示。由表2可知,SG-PSO-SVR模型的性能更好。將保存的預測值作為狀態識別方法的輸入,以達到故障預測的目的,并進行故障定位,確定可能會發生故障的扇形分段,預測結果及故障定位的相關信息可以在上位機的可視化界面中查看。管理人員可根據預警信息及時檢修可能發生故障的位置,及時進行維護檢修,減少因為設備停工造成的不必要損失。

表2 兩種模型預測的誤差對比Table 2 Error comparison of two prediction models

圖8 預測結果對比Fig.8 Comparison of prediction results
采用在線監測與診斷后的連鑄機各項指標見表3??梢钥闯?在相同的鑄機作業率下,通過在線監測與診斷能提前發現扇形段存在的隱患,極大改善了鑄坯受力狀況,鑄坯質量得到大幅提高,顯著減少了改判量和故障時間。

表3 2020—2022年連鑄機主要經濟技術指標Table 3 Main economic indicators of the conticaster from 2020 to 2022
本文針對惡劣環境下容易出現故障的連鑄機扇形段,結合當今很流行的機器學習中的SVR模型,設計扇形段故障預測系統。整個系統的軟件部分分為3層:界面層、應用層及感知層。為了提高系統預測的準確率,使用SG平滑濾波去噪對原始數據進行降噪處理,然后利用對小樣本數據和非線性數據具有良好的分辨能力及精度較高的SVR模型對拉矯力數據進行數值預測,并采用PSO算法進行參數尋優,最終達到扇形段故障預測的目的。全年因扇形段故障更換11臺扇形段,其中10臺扇形段故障被發現,扇形段故障發現率由75%提高到91%,根據本文提出的故障預測系統可以保證連鑄過程在非人為因素影響下正常進行,進而降低整個工程成本。