萬 欣,艾新波
(1.國能大渡河大數據服務有限公司,四川省成都市 610041;2.北京郵電大學人工智能學院,北京市 100876)
近年來,隨著物聯網、大數據、人工智能、云計算等新技術的日新月異,海量的工業數據正在向云端遷移,數據挖掘與大數據分析貫穿于設備生產運行過程中,這對于電力企業設備的智能化管控[1]提出了更高的要求。然而,傳統電力生產企業對于設備的智能化管理依然存在著某些短板。比如,各種設備運檢類業務系統存在信息孤島,系統間信息和數據融合度低、互動性差,設備狀態評估依賴人工經驗,影響了設備管理決策的科學性。
本文以設備多源信息為基礎,利用大數據與機器學習技術,建立起設備間的關聯關系,不斷挖掘設備故障產生的規律[2],通過對設備故障發生的時間、空間、實體對象等特征量的分析,指導設備的運維策略,構建“數據驅動管理”的設備管理新模式[3]。
本次研究以大渡河公司流域生產管理系統(工作票、設備缺陷、設備隱患等)、各電站設備手冊(設備型號、生產廠家、設計使用年限、投運時間等)、設備運行分析(每周、月度設備分析等)等多維度數據為基礎,建立設備故障關鍵詞數據辭典,通過對設備故障關鍵詞的辨識、分析及應用,選擇恰當的空間、時間維度,挖掘設備故障率、設備生命周期、設備制造廠商的關聯,探索設備故障之間的伴生關系,構建起設備管理策略模型,進而得出設備運行維護、檢修技改、設備選型輔助策略[4]。整個建模過程,采用了CRISP-DM框架模型。
CRISP-DM框架模型(見圖1)分為六個環節,分別是:業務理解、數據理解、數據預處理、模型建立、模型評估和模型部署。其中,業務理解主要是面向電力生產設備管理這一復雜系統,從系統間故障誘發關系出發,定義了數據分析的目標,找準業務痛點;數據理解,主要是開展EDA探索性數據分析;數據預處理,則包括數據類型轉換、垃圾數據清理、數據標注等。由于現有數據大部分是非結構化的文本數據,因而數據預處理的重點是短文本半自動化標注與分類;數據建模,重在挖掘隱藏在數據背后、發生于系統之間的故障伴生關聯關系;模型評估,主要從條件概率、因果置信度等角度,對從系統設備間故障依存關系的強度及其有效性進行量化。

圖1 CRISP-DM框架模型Figure 1 CRISP-DM framework model
設備多源數據雖有一定的積累(設備缺陷記錄約1.5萬條、設備樹10萬余條、設備手冊數據萬余條),但以短文本、自然語言描述等非結構化數據為主,存在描述不規范、分類不清晰的問題。本文采用業內領先的ICTCLAS、THULAC分詞算法、Jaccard距離及余弦相似性原理,對設備故障描述內容進行了結構化解析,對其中發生的系統設備部位及具體描述進行了半自動化析取和規范化處理。

其中,A、B分別為不同設備缺陷描述文本在進行分詞之后的關鍵詞集合;x、y分別為不同缺陷描述文本中的詞頻向量。
通過集成分詞算法的專業文本的結構化解析技術,并基于歷史語料庫、電力百科全書專業詞典(其中,故障載體類詞匯56361條,故障描述類詞匯13686條),形成了電力設備故障類專用詞庫(見圖2),從而實現對短文本的精確分詞、詞性標注、關鍵字提取。

圖2 電力設備故障類專用詞庫(部分)Figure 2 Special thesaurus for power equipment fault(part)
在盡量少的先驗假設下,采用雷達圖、對比詞云現代統計圖形分析對系統設備缺陷發生的特征量進行刻畫,對不同設備之間的缺陷發生頻率、分位數、趨勢進行分析。
通過計算相對隸屬度,對不同階段的缺陷狀況進行分析,繪制其對比詞云(見圖3)。

圖3 基于相對隸屬度的對比詞云Figure 3 Comparative word cloud based on relative membership

其中,freqi,j為第i個詞出現在第j個階段缺陷描述中的頻次。
基于對比詞云,對各階段故障頻繁的設備進行刻畫,識別各系統故障發生的周期性特征,并通過相對熱度的定量計算。
從缺陷大數據可以看出,在檢修期(11月~次年4月),檢修排水系統、調速系統、圓筒閥系統等出現故障較多;在汛期(6~9月),泄洪閘、風機、技術供水等系統出現故障較多。
電力生產紛繁復雜的各類設備以系統的方式存在,設備之間千絲萬縷的聯系決定了各類故障的發生也并非孤立與偶然。不同的設備故障之間,可能存在的促進、誘導,或是伴隨、先后關系,揭示這些潛在的關系,有利于從系統層面重新認識設備系統的健康狀況。本文將挖掘設備故障關聯關系,在此基礎上建立易發故障的關聯網絡,并對關鍵節點進行分析。這些關鍵節點,可能是在故障傳導過程中,誘發能力較強的;也可能是故障傳導過程中,控制能力較強的。關鍵節點的防控,有望顯著提升設備缺陷管理水平。
(1)通過建立設備故障率與設備投運時間以及設計使用年限的關聯關系(見圖4),為設備管理(檢修技改、設備選型、備品備件儲備)提供科學決策依據[5]。

圖4 設備故障率與設備投運時間關聯關系圖Figure 4 Relationship between equipment failure rate and equipment operation time
根據設備可靠性理論,結合設備故障數據,建立設備故障發生隨運行時間t變化的函數,在設備從投運到報廢的整個壽命周期內,引入設備設計使用年限T這個影響因子,構建了Bathtub曲線模型。

在早期故障階段,呈現為以自然常數e為底的指數遞減的函數,即:y=ae-bt+c+ε1,其中a、b、c由具體設備確定,ε1為隨機項,k為不穩定周期;在損耗故障階段,表現為自然常數e為底的指數遞增函數,與早期故障呈現近似對稱的趨勢:;在偶然故障階段,缺陷發生數趨近于常數。整體呈現出U形曲線——以運行時間為橫坐標,以故障率為縱坐標,形狀呈兩頭高,中間低。
以電站C調速器系統為例,其Bathtub曲線模型具體擬合過程如圖5所示(擬合度近95%)。
通過建立設備故障率與設備投運時間以及設計使用年限的函數關系,構建設備缺陷發生過程與時間關系的特性曲線,通過對其整體趨勢分析,找出對于設備全生命周期不同階段下設備故障率的關聯規則,為設備改造以及備品備件更換、儲備提供科學依據[6]。
(2)基于列聯表方法,對設備故障和設備制造廠商之間的關聯關系(見圖6)進行分析。列聯表制作過程如下:

圖6 設備故障率與設備制造廠商關聯關系圖Figure 6 Relationship between equipment failure rate and equipment manufacture
設備故障總體中的個體可按所屬設備和所屬制造商這兩個屬性進行分類,分別為屬性A和屬性B。其中,A有r個取值水平A1、A2、…、Ar,B有c個取值水平B1、B2、…、Bc,從現有缺陷記錄進行頻次匯總,ni,j個個體的屬性屬于水平Ai和Bj,將r×c個ni,j排列為一個r行c列的二維列聯表。
通過設備故障率與設備制造廠商數據的有效融合,得出相同或不同設備制造商生產的設備在不同電站發生的故障率,為設備管理(設備選型、設備采購、備品備件儲備)提供科學決策依據,也可指導設備制造廠商優化設計。
設備故障間關聯矩陣圖如圖7所示。

圖7 設備故障間關聯矩陣圖Figure 7 Correlation matrix between equipment faults
(3)通過計算Pearson相關系數和灰色關聯度,對設備故障之間可能存在的關聯關系進行分析。

通過對不同設備故障發生時序曲線的幾何相似性進行量化,刻畫不同設備間故障發生的內在關聯性,識別出獨立性故障和從屬性故障。
由于電力生產是典型的復雜巨系統(設備樹內部節點及葉子結點多達10多萬個),對于何時何地何種情形之下容易出現何種故障,目前并無有效的模型對內在的規律進行定量刻畫,難以做到各類設備事故的事前預防,設備健康管理離“治未病”的目標相去甚遠,影響了設備管理決策的科學性。
在融合多源數據的基礎上,對設備故障發生的時間、空間、實體對象等特征量進行分析,挖掘設備故障之間的正向依存關系[7],通過建立貝葉斯網絡模型,將業務判斷與數據積累相融合,更加準確地提供了故障發生的可能性。
前導項和后繼項之間的依存關系通過以下條件概率求得:

在式(5)中,后繼項對于前導項的依存關系主要體現在:一旦觀察到前導項E故障的發生,對于后繼項H發生概率P(H)將進行調整。換言之,將E作為新觀測到的證據時,P(E|H)/P(E)可視為該證據下對于先驗概率P(H)的調整因子。
本文中選取設備缺陷數據截止日期至2019年7月31日,設備缺陷貝葉斯網絡如圖8~圖9所示。

圖8 設備缺陷貝葉斯網絡總圖Figure 8 Bayesian network general drawing of equipment defects

圖9 與冷卻水相關的設備缺陷貝葉斯網絡圖Figure 9 Bayesian network diagram of equipment defects related to cooling water
以2019年7月31日前所有缺陷數據為基礎,選取30天為周期,得出部分依存規則如表1所示。

表1 貝葉斯依存規則Table 1 Bayesian dependency rule

續表

續表
2019年8~10月設備缺陷實際發生結果于依存規則對比 如表2所示。

表2 設備缺陷發生可能性與實際發生對比結果Table 2 Comparison between the possibility of equipment defects and the actual results
通過分析不同設備在特定時間段內發生缺陷的關系,進一步挖掘設備之間的聯系,構建設備故障依存規則,得出下一時間段內發生設備故障的可能性,為設備運行維護提供針對性指導。
本文引入文本挖掘技術,實現以設備多源結構化和非結構化數據的融合;通過計算相對隸屬度,對設備故障描述進行對比分析并采用對比詞云進行可視化建模;基于Bathtub曲線和灰色關聯分析,識別設備缺陷與時間、廠商以及故障之前的關系;通過建立設備缺陷事件貝葉斯網絡,對事故缺陷的演化發生進行預測和推斷。通過深入的數據挖掘分析,構建設備管理策略模型,為設備管理從業務驅動向數據驅動轉變提供了基礎,由依賴人工經驗向讓數據說話轉變提供了可能,進而為設備運行維護、檢修技改、設備選型提供決策支持[8]。
同時,受限于現有研究條件及基礎,也存在以下幾方面問題需要進一步提升:
(1)數據標準化方面:目前生產數據存在維度不統一、人為記錄不規范、記錄不全等弊端,為數據建模及數據分析工作帶來了不小難度,需要進一步利用標準化手段不斷提升數據質量。
(2)數據量及數據維度方面:目前已初步建立了設備故障間關聯網絡,但局限于大的系統這一層級,對于細化到具體設備的哪一類故障還缺乏有效的數據支撐,關聯結果的準確性有待提高,需要通過不斷的數據積累以及豐富數據維度來持續訓練模型,實現設備狀態評估等功能。
(3)模型進階方面:在現有Bathtub曲線模型的基礎上,探索建立包括投資成本、運行維護成本、損耗成本等邊界條件在內的設備全壽命周期成本模型。