陳思勤,周浩豪,茅大鈞
(1.華能國際電力股份有限公司上海石洞口第二電廠,上海 200942;2.上海電力大學自動化工程學院,上海 201306)
國內大多數燃煤電廠針對磨煤機等輔機的檢修仍以計劃檢修為主,往往在檢修時才發現設備已經損壞嚴重。這在平時運行過程中容易引發非停等事故,存在較大安全隱患。同時,由于國際能源市場波動頻繁,煤炭等燃料價格居高不下,國內大多數燃煤電廠采用摻燒非設計煤種的配煤方案。摻燒的非設計煤種大多為發熱量低、可磨性差的劣質煤。研磨這些煤種將大幅增加磨煤機的運行負荷,并增加磨煤機的故障頻率。因此,開展燃煤電廠磨煤機故障預警的研究對優化燃煤電廠運維具有重要意義。
李峰等[1]在多元狀態估計技術(multivariate state estimation technique,MSET)的基礎上提出了1種包含典型工況特性的記憶矩陣選取方法。該方法能夠有效選擇具有較大工況特性的樣本,提高MSET預警模型的精度。V.Agrawal[2]等通過機理建模的方式對煤粉細度、煤粉分離過程,以及原煤水分對出口溫度的影響進行分析和建模,通過模型實現對原煤水分含量的預測。張彼德等[3]提出了1種基于k值自適應加權K近鄰算法的變壓器故障診斷,不僅彌補了傳統K近鄰算法k值固定的缺陷,還從距離與分布這2個方面對近鄰點權重進行了考慮,減小了數據分布問題給分類決策帶來的不利影響。彭道剛等[4]提出了1種基于變分模態分解(variational mode decomposition,VMD)、自回歸模型(autoregressive model,AR)和輕量級梯度提升機(light-gradient boosting machine,LightGBM)算法的燃氣輪機控制系統分層故障診斷方法,解決了傳統算法存在的訓練時間過長、知識“組合爆炸”等問題,具有95%以上的故障識別率和較高的泛化能力。徐勇等[5]提出了1種基于改進灰狼算法優化概率神經網絡的混合智能故障診斷方法,通過對灰狼算法的控制因子和加權距離進行修改,提高了算法收斂精度及穩定性。
綜上所述,目前針對磨煤機的故障預警研究存在以下問題。①研究主要集中在事后故障處理,缺乏對早期故障征兆的分析預測。②現有參數預測、故障預測等研究方向主要以機理建模為主,難以實現對設備的長期故障預警。
為解決上述問題,本文提出了1種基于改進灰狼優化(gray wolf optimization,GWO)-LightGBM的故障預警方法。該方法通過搭建并訓練基于GWO-LightGBM的參數預測模型,由該模型預測得到當前磨煤機正常狀態下預警參數的預測殘差值。該值通過滑動窗口法處理后作為預警閾值,實現對磨煤機的早期故障預警。
ZGM型中速磨煤機結構如圖1所示。

圖1 ZGM型中速磨煤機結構示意圖
燃煤電廠磨煤機主要以中速磨煤機為主,轉速通常為60~300 r/min,具有煤粉細度可調節、噪聲小、能耗低、占地面積小等優勢。但中速磨煤機結構復雜、研磨非設計煤種對其負擔較大,易引發部件損壞且維修成本較高[6]。
磨煤機軸承振動異常和溫度異常是常見故障。造成這些故障的主要原因為煤塊中混雜的雜質和可磨性較差的煤種與磨輥發生碰撞、軸承氣封損壞、潤滑油泄漏或污染等。
本文以磨煤機前軸承溫度作為預警參數設置預警閾值。
預警模型流程如圖2所示。

圖2 預警模型流程圖
考慮到磨煤機本身工作環境的復雜性,在歷史運行數據中會出現一些傳感器故障等原因導致的空值和噪聲值。這些異常數據在建模過程中會降低預測模型的預測精度。為此,有必要通過數據預處理的方式清洗原始數據集中的各類異常值[7]。
本文數據取自上海某電廠廠級監控信息系統(supervisory information system,SIS)中的1#機組1臺ZGM型中速磨煤機B的歷史運行數據。磨煤機B相關測點包括熱風門開度(%)、冷風門開度(%)、磨煤機入口溫度(℃)、磨煤機入口流量(km3/h)、給煤機電流(A)、磨煤機電流(A)、磨煤機電機繞組線圈溫度(℃)、磨煤機電動機驅動端軸承溫度(℃)、磨煤機電動機非驅動端軸承溫度(℃)、磨煤機前軸承溫度(℃)、磨煤機前軸承x向振動(μm)、磨煤機前軸承y向振動(μm)。
本文從SIS中采集以上12個測點在2021年10月15日 10∶00至2021年11月15日0∶00期間的共計8 040個樣本。采樣間隔為5 min。采集到的全部數據作為原始數據集A。
數據準備流程如下。
①利用Matlab中的isnan函數對A中的空值進行篩選和剔除。
②根據3σ準則篩選并剔除A中的噪聲值。
③對數據集進行歸一化處理,以此解決原數據集里量綱對后續建模的影響[8]。歸一化式如下。
(1)

④考慮到當前數據集維度較高,為防止后續建模過程因輸入變量太多導致過擬合而影響結果精度,本文采用皮爾遜相關系數篩選出與磨煤機前軸承溫度相關性較高的測點[9]。
(2)

相關性系數r取值范圍為(-1,1)。皮爾遜系數的相關性表示如表2所示。

表1 皮爾遜系數的相關性表示

表2 各參數皮爾遜相關性系數
LightGBM是基于梯度提升決策樹(gradient boosting decision tree,GBDT)算法框架構建的1種改進梯度提升算法[9-10]。
相比傳統預測算法,LightGBM的計算速度更快、精度更高。LightGBM處理海量數據的效率更高,被廣泛應用于數據預測等方面。
LightGBM模型具體可表示為:
(3)
式中:fT為算法模型的函數表達式;ft為第t棵決策樹;Θ為所有樹的集合。
本文假定1個樣本訓練集為{x1,x2,…,xn},設損失函數期望最小的估計函數為H*(x)。
(4)
式中:L[y,H(x)]為損失函數,y為輸出,H(x)為估計函數。
梯度提升迭代過程中,當前模型損失函數負梯度輸出值集合為{g1,g2,…,gi,…,gn}。其中,gi為xi的損失函數的負梯度值。在此過程中,本文在弱學習器信息增益最大的特征分裂點處對其進行分割[11]。

LightGBM算法具有超參數多、參數取值范圍大小不一的問題[12]。在迭代次數較多的情況下,依靠經驗手動設定超參數的方法在處理大量數據時效率較低,難以應用到實際工程中。為此,本文提出通過改進GWO算法對LightGBM算法超參數進行優化,以提高預測模型的預測精度。
GWO算法[13]是1種群智能優化算法。該算法的原理是模仿灰狼群的捕食行為,具有簡單、快速、易實現等優點。在GWO算法中,灰狼個體對應算法的解。依據族群等級,其被依次劃分為α、β、δ。其中:α代表頭狼,即最優解;β、δ分別代表第二、第三優解。剩余個體依據這3類個體的位置更新其位置。位置更新式如下。
灰狼個體的位置更新式為:
D=|CXP(t)-X(t)|
(5)
式中:D為灰狼個體與獵物的距離;C為系數向量;XP(t)為獵物的位置向量;X(t)為當前灰狼個體的位置向量。
X(t+1)=X(t)-AD
(6)
式中:X(t+1)為迭代更新后的灰狼個體向量;A為系數向量。
根據式(6)和式(7)可知,灰狼個體根據α、β、δ這3類個體找到的獵物位置信息進行的位置更新式為:
(7)
式中:Ai、Ci為系數向量,i=1,2,3。
(8)
在標準GWO算法中,由于初始化后種群位置是隨機產生的,容易導致部分個體的位置集中到某一極值點而忽略一些關鍵信息。為保證種群初始化時個體位置分布均勻及其多樣性,本文引入Halton序列對種群進行初始化[14]。
基于改進GWO算法的超參數優化流程如圖3所示。

圖3 基于改進GWO算法的超參數優化流程圖
LightGBM算法超參數較多,受計算機算力限制難以全部進行優化。綜合各參數的特性,本文對估計量、參數學習率、葉子節點數和樹的最大深度這4種超參數進行優化[15]。
通過第2節介紹的數據預處理方法處理A后,本文根據得到的各參數與磨煤機前軸承溫度相關性系數篩選出較高的前4組參數。各參數皮爾遜相關性系數如表2所示。
本文以這4組測點為數據集AI對模型進行訓練和驗證。試驗選取前1 500組作為訓練集、后400組作為測試集。對模型的初始參數的設置如下:GWO種群個數N初始值為50、最大迭代次數為10;樹的最大深度的初始值為5、選取范圍為[1,9];葉子節點的初始值為40、選取范圍為[2,2 000];學習率的初始值為0.3、選取范圍為[0.001,2];估計量的初始值為50、選取范圍為[1,400]。設置完成后,本文開始進行預測模型訓練和測試。
為驗證模型性能,本文將改進GWO-LightGBM預測模型預測結果與LightGBM模型和支持向量機(support vector machine,SVM)模型的預測結果進行對比。不同模型預測結果對比如圖4所示。

圖4 不同模型預測結果對比
由圖4可知,相比其他2個模型,改進GWO-LightGBM預測模型的預測精度更高,泛化能力更強。
為了更直觀地表述改進GWO-LightGBM預測模型的預測精度,本文通過絕對平均誤差(mean absolute error,MAE)和均方誤差(mean squared error,MSE)這2項指標量化表述3種模型的預測精度。
(9)

(10)
式中:Es為MSE指標的計算結果。
3種模型預測性能對比如表3所示。

表3 模型預測性能對比
由表3可知,本文提出的改進GWO-LightGBM模型的MAE和MSE更低。這表明改進GWO-LightGBM具有更高的預測精度。
本文以磨煤機前軸承正常溫度殘差作為預警閾值選取范圍標準。考慮到在數據預處理后仍有可能因傳感器故障等問題而產生溫度異常點,而經過滑動窗口法處理可以一定程度上處理掉這些異常點產生的影響,因此本文采用滑動窗口法處理得到的預測值。
本文定義1個數量為m的殘差樣本為[X1,X2,…,Xm]。
本文設定滑動窗口寬度為n(n≤m)、計算步長為1,得到的滑動窗口法計算式為:
(11)

根據式(12)計算得到的殘差平均值,即可確定預警閾值的范圍。
本文對改進GWO-LightGBM預測模型得到的溫度殘差作滑動窗口法處理,并將窗口寬度設置為20、步長設置為1。
滑動窗口法處理結果如圖5所示的結果。

圖5 滑動窗口法處理結果
由圖5可知,殘差平均值均勻分布在(-0.3,0.3)之間,因此本文將預警閾值范圍設定在這一區間。需要說明的是,本文對于預警閾值范圍的設定僅僅是針對當前樣本的。在實際應用中,因為設備機理會隨使用時間的增加而變化,所以對于本文設計的故障預警方法需要根據實際情況定期更新預警模型的訓練集,以動態調整預警閾值,從而實現預警模型對設備的自適應。
本文以某電廠1#機組的1臺磨煤機某次溫度超限報警為例,選取報警的前后500組參數樣本對預警模型進行驗證。在2021年8月19日15∶00左右,電廠SIS中關于磨煤機B前軸承溫度測點發生短時間報警。定檢過程中發現磨煤機軸承箱內部潤滑油全部結塊、軸承箱空腔處堆積有較多黑色油污。運維人員給出的結論系潤滑油加油不規范導致軸承箱內部油脂硬化結塊,因而軸承運行時沒有得到良好潤滑,進而導致軸承溫度上升。
以上案例根據第2節的數據預處理方法,對故障數據集進行處理,之后輸入到改進GWO-LightGBM參數預測模型計算得到軸承溫度殘差值,再經滑動窗口法處理。處理后故障軸承溫度殘差平均值如圖6所示。

圖6 故障軸承溫度殘差平均值
由圖6可知,軸承溫度殘差平均值曲線從第375個樣本點開始上升,并于第380~385個樣本點之間突破了閾值范圍。突破閥值的區間對應系統采樣時間為2021年8月19日13∶06,比系統的報警時間提早了2 h左右。結果證明本文方法可以實現電廠磨煤機早期故障預警。
本文提出基于改進GWO-LightGBM的磨煤機故障預警方法。該方法首先通過皮爾遜系數等方法對原始數據集進行數據預處理;然后通過搭建并訓練基于GWO-LightGBM的參數預測模型,由該模型預測得到當前磨煤機正常狀態下預警參數的預測殘差值;最后以滑動窗口法處理結果作為預警閾值,實現對磨煤機的早期故障預警。實際案例對預警模型的驗證結果表明,該方法可以實現對燃煤電廠磨煤機的早期故障預警,并具有以下優點。
①所提出的基于改進GWO-LightGBM算法的預警模型具有更高的精度和泛化能力,MAE為0.081 5、MSE為0.011 4,相比LightGBM和SVM精度更高。
②本文預警模型能夠實現磨煤機早期故障預警,降低事故概率,提高電廠運行安全性和經濟效益,可在故障發生前2 h提前發出預警。