趙 亮,趙 輝,李 杰,楊柏依,周衛慶
(1.華能萊蕪發電有限公司,山東 濟南 271102;2.南京工程學院 能源與動力工程學院,江蘇 南京 211167)
配備中速磨煤機的制粉系統是火電機組的重要組成部分,其運行的好壞直接影響到鍋爐燃燒穩定及機組負荷的安全性。由于磨煤機的工作環境較為惡劣,雜質磨損、潮濕堵煤等情況均可能引起磨煤機的故障。故障特征主要體現在溫度、風壓、通風量等監測參數上。例如,磨煤機堵煤會導致通風量驟減,原煤水分與出口溫度有著直接的關系。因此,基于信號的設備監測評估技術對于機組的安全生產具有重大的現實意義。
目前已有各類先進數據建模方法應用于磨煤機故障預警及診斷中。文獻[1]應用證據理論對磨煤機的故障進行診斷。文獻[2]選取特征參數,采用模糊C均值方法實現了斷煤故障的快速診斷。文獻[3]基于磨煤機的振動信號,提出了一種K值優化結合最小二乘支持向量機的磨煤機振動故障識別方法。文獻[4]分別應用CNN(Convolutional neural networks)和BiLSTM(Bi-directional long short term memory)學習數據的空間特征、時間特征,提出了基于注意力機制的卷積神經網絡–雙向記憶長短神經網絡的磨煤機故障預警方法。類似基于數據建模方法的機組磨煤機故障診斷方法還有相似性建模方法[5,6]、信號多元處理法[7,8]、進化優化智能算法等[9-13]。
盡管數據建模方法在磨煤機故障預警診斷領域得到了一定程度的應用,但是也存在著模型過于復雜、工程適用性不強等問題。為此,本文引入可擴展的機器學習方法XGBoost,以提高建模時對海量數據的利用效率和模型精度;同時,提出一種具有自適應能力的可靠性監測指標及可靠性評價方法,以此實現磨煤機實時預警及評價。
XGBoost本質上是一種機器學習的算法[14],由多個分類回歸算法組合而成,并且這種組合可以不斷擴展。
對于一個訓練用的數據集樣本,設其所包含的數據組數為n,數據集的特征參數個數為m,記為{x1,x2,…,xn,xi∈Rm,yi∈R}。其中,xi是第i個樣本的特征參數向量,yi是特征向量對應的真實值。XGBoost的集成數學模型為:
式中:F為CART的函數集合;fk為第k棵樹的結構,包含獨立的樹結構、樹葉的結點數T和權重向量ω。
對于一個觀測樣本,XGBoost模型在每棵樹上將其映射到每片葉子結點上,然后將所有葉結點的權重求和,即得到最終的預測值。
損失函數是用于衡量實際值和預測值的誤差。損失函數值越小則說明偏差越小。
損失函數為:
式中:l為訓練損失函數;
正則項Ω為處理目標函數復雜度的約束函數,其作用為平衡模型的準確度和復雜度、避免過度擬合、取得最佳的模型準確度和泛化能力。
XGBoost算法通過迭代增加樹模型的方式完成訓練。過程中,在每次增加決策樹函數后,損失函數的值則會相應減小。
對于第t次迭代過程中的第i個樣本,其損失函數的變化為:
可以看出,預測的輸出變為+fi(xi)。
為使損失函數取得最小值,進行泰勒級數展開:
式中:hi為損失函數l在展開點處的二階導數;gi為損失函數在展開點處的一階導數。
除去常數項,由此得到簡化目標函數為:
通過對ωi求導,得到對應樹結構下的最優葉節點權重,其公式為:
得到的最優損失函數為:
采用公式(7)可以對算法中的樹結構進行綜合評價。若取得最小值,則表明此時的樹結構達到最優。
目前關于樹結構搜索采用較多的算法為貪心算法,其基本原理為從單片葉結點開始,通過不斷迭代增加樹的分枝,確定最終的模型參數。
在實際應用中,可利用模型的預測值和實測值構造一種衡量偏差程度的指標。一般采用某種距離測度來直觀地表示這種偏差。
選用最為常見的相似度指標為:
式中:x、y分別代表2個不同的向量;deuc(x,y)代表x、y兩者之間的距離測度,如歐氏距離、馬氏距離等。
顯然,相似度指標處于0~1之間。2個向量之間的差距越小,其相似度越接近于1。
監測指標超限則應給出對應的預警判定。傳統的閾值確定方法一般為歷史值統計方法。然而,考慮到目前各機組因普遍參與調峰而經常出現各種新的運行工況,再考慮到生產現場環境復雜、電磁干擾較大等因素,傳統意義上固定不變的閾值確定方式已經不能適應生產實際需求。
引入一種能夠適應工況變化的自適應閾值確定方法[14],其中心思想是采用迭代的思想代替不斷累積的時間窗,計算公式為:
式中:為前n時刻的相似度均值;simn為第n時刻的相似度值;為前n時刻的方差均值,thr為自適應閾值。
由以上公式可見,通過時間上的滾動迭代,可以實現統計量和閾值的更新。
在實際工程應用中,為防止出現誤報的情況,當連續3個采樣點出現超限時,給出對應的報警信號。
通常,設備的故障存在著一個逐漸劣化的過程。雖然設備狀態的變化可以通過其相關的特征參數被直接反映出來,但是應用中存在參數數量多、變化原因多的問題。由此,為判定各參數的總體劣化情況,定義多參數的劣化度綜合指標[15],計算式為:
式中:m為設備故障個數;n為參數個數;xij為設備第i個故障第j個參數的測量值;wi為第i個故障發生時對設備出力的影響權重;wj為第j個參數對設備出力的影響權重;為設備第i個故障時第j個參數的正常狀態閾值,為設備第i個故障時第j個參數的停運閾值。
如式(12)所示,當xij<時參數處于正常狀態;當
根據公式的定義,多特征參數的綜合劣化度計算過程為:首先將各特征參數與機組負荷組合為狀態向量,采集歷史數據進行聚類,劃分為典型的設備工況運行區間。根據特征參數的觀測值,判定其所在的工況區間,并計算各特征參數的劣化度,最終通過加權計算出所有特征參數的綜合劣化度。
在得到特征參數的劣化度后,構造一種具備短期實時評價功能的可靠性評價模型,這樣有助于在設備故障發生的早期進行判斷并采取對應的有效措施。
將設備特征參數的狀態與可靠性融合考慮,定義設備的可靠性評價模型為[15]:
定義第j個參數對設備性能的影響權重為:
式中:qj為通過專家經驗及層次分析法得到的第j個特征參數異常對設備整體性能的影響權重;wj為只考慮參數異常影響時,其對設備整體性能的影響權重。
目前大型火電機組一般配備的是中速磨煤機。在磨煤的過程中,常見的故障包括堵煤、斷煤、著火。
以國內某600 MW機組為驗證對象,其所配磨煤機型號為HP1003。在設計煤種下,磨煤機的額定出力為55.5 t/h,對應的通風量為97.98 t/h。
根據運行機理[16],堵煤時,磨煤機的主要參數變化為磨出口溫度降低、磨電流增大、磨差壓增大等;斷煤時的主要參數變化為磨出口溫度升高、磨電流大幅度減少、磨差壓減小等;著火故障會影響出口溫度、冷風門開度等。
根據故障機理分析,在選取參數時應考慮到數據易于直接獲取,并且對于特定故障的敏感性較大。該磨煤機現場測點共30多個,經過綜合比較和典型故障分析[17],確定10個特征參數,如表1所示。

表1 磨煤機特征參數Tab.1 Characteristic parameters of coal mill
設置采樣周期為10 s。采集表1所列參數的歷史運行數據800組。采用高低限和波動率檢測2種方法,將超過正常區間、恒定不動和突變的異常值剔除,得到正常工況數據,并將其用于訓練模型,最終得到XGBoost預測模型。
以同樣的采樣周期采集到得磨煤機另一連續時段的共500組運行數據,并將其用于所建立的模型進行電流參數和熱風調節門開度參數測試,結果如圖1和圖2所示。

圖1 磨煤機電流參數估計Fig.1 Estimation of coal mill current parameters

圖2 熱風調節門開度參數估計Fig.2 Estimation of hot air regulating valve opening parameters
圖1和圖2顯示了磨煤機電流和熱風調門開度的參數預測效果。從圖中可以看出,在磨煤機運行狀態正常的情況下,模型的預測值和實測值之間的吻合度較高。該結果說明模型具有較好的預測能力,即:在正常運行狀態下,參數的實測值和預測值偏差很小,相似度指標維持在一個較高的水平。反之,若兩者之間出現偏差甚至隨著時間發展其呈現出不斷增大的趨勢,則說明設備的運行已經偏離了正常狀態,此時應給出對應的預警信息,提醒現場人員及時介入處理。
以同樣的采樣周期,采樣得到一段磨煤機發生故障前后的數據220組,計算其相似度指標如圖3所示。

圖3 相似度指標監測Fig.3 Similarity index monitoring
圖3中黑色的實線為相似度指標的計算值,點劃線為采用傳統的統計方法得到的固定閾值線,紅色虛線為動態閾值線。從圖中可以看出:1)如果使用固定閾值的方式,在56、116、202等幾個正常工況點處會出現誤報警的情況,而動態閾值會隨著工況的變化實時調整,在設備運行正常的情況下,均未發生誤報警的情況。2)當設備發生故障后,相似度指標線首先越過動態閾值線,說明動態閾值能夠適應工況的變化,比固定閾值提前給出預警信號。
利用模型訓練數據,對正常工況下的設備可靠度進行統計分布分析,計算結果如圖4所示。圖中各柱的高度值表示設備的平均可靠度。低負荷區間設備運行可靠度偏低;在高負荷區間,設備的可靠度較高,與實際運行的情況相符。

圖4 磨煤機可靠度分布統計Fig.4 Reliability distribution statistics of coal mills
利用故障數據進行可靠度計算,結果如圖5所示。

圖5 磨煤機整體可靠度趨勢Fig.5 Overall reliability trend of coal mills
從圖5可以看出:在故障發生前,磨煤機的整體可靠度維持在0.7附近;當發生故障后,其可靠度值也出現了明顯的下降趨勢。
圖中紅色圈出的地方表示通過相似度指標進行監測預警的區域。顯然,可靠度的大幅下降與相似度指標的越限能夠相互驗證,并且兩者得到的結論與實際情況一致。
本文建立了磨煤機特征參數的XGBoost預測模型。利用某600 MW機組中速磨實際運行數據進行驗證,結果表明,模型的預測值與實際值吻合度較高,有效地實現了特征參數的實時監測。
引入自適應的動態閾值確定方法。該方法能夠根據運行工況的變化實時更新調整,比傳統的固定閾值具有更高的可靠性和靈敏度,能夠有效地降低誤報率。
基于特征參數的劣化度計算磨煤機整體的運行可靠度,利用可靠度趨勢監測其整體的運行狀態,進一步提高了預警的準確性。