謝秋華,楊廷勇
(中國長江電力股份有限公司,湖北 宜昌443000)
傳統(tǒng)水電站設備狀態(tài)監(jiān)測系統(tǒng)在故障診斷與分析中主要采取兩大方向的分析方法與手段:一是通過定期的趨勢分析,運行與維護人員對設備未達到報警閾值之前的劣化趨勢進行預判或趨勢預警,分析工作主要依靠運行和維護人員經(jīng)驗;隨著傳感器技術、數(shù)據(jù)采集、處理及傳輸技術等計算機網(wǎng)絡技術的飛速發(fā)展,電站運行過程中產(chǎn)生越來越多、精度越來越高的生產(chǎn)數(shù)據(jù),歷史數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇膨脹,導致人工分析工作量巨大、時間上滯后,同時人工分析深度和廣度受限,設備潛在故障分析的全面性和準確性也難以保障。二是采用故障模式識別技術,即用設備已知的各種故障模式特征對新發(fā)生的設備故障進行特征比對,將新故障歸并為匹配性最好的已知故障模式,從而實現(xiàn)設備故障診斷。由于水電站全面的故障模式收集非常困難,且水電站設備故障發(fā)生機理復雜、多樣,因此很難實現(xiàn)故障模式的精準匹配。因此,該理論雖然發(fā)展多年,目前依然無法成功應用于水電站生產(chǎn)實踐中。
為解決上述問題,新型設備狀態(tài)監(jiān)測系統(tǒng)致力于實現(xiàn)設備趨勢自動預警和劣化程度自動辨識,提升故障診斷智能水平,促進勞動生產(chǎn)力解放。
當設備運行于某一穩(wěn)態(tài)工況時,系統(tǒng)通過大數(shù)據(jù)挖掘方法,對該工況下設備的歷史大數(shù)據(jù)特征值進行學習,總結出該工況下設備的健康基準值,將該值與設備當前值比較,利用偏差分析法計算兩者相對偏差,形成動態(tài)預警帶,從而判斷設備運行狀態(tài)是否正常。根據(jù)相對偏差的大小,設備運行狀態(tài)分為正常運行階段、早期預警階段、缺陷階段和故障階段(見圖 1)。

圖1 新型設備狀態(tài)監(jiān)測系統(tǒng)核心思想示意圖
可見,新系統(tǒng)的核心思想是實現(xiàn)了設備動態(tài)預警,與傳統(tǒng)固定閾值報警有著本質(zhì)區(qū)別,具體如下:
(1)早期異常識別方面:設備早期異常特征非常不明顯,遠遠沒有達到預設定的報警閾值,因此傳統(tǒng)系統(tǒng)無法產(chǎn)生報警信息,即使經(jīng)驗豐富的運行人員也不易發(fā)現(xiàn)。新系統(tǒng)通過大數(shù)據(jù)挖掘計算出設備當前工況的健康基準值,能夠精準識別出設備早期異常,產(chǎn)生預警信息,如圖2所示。

圖2 設備早期異常識別示意圖
(2)報警定值確定方面:傳統(tǒng)閾值報警的定值需要行業(yè)專家或者設備廠家提供,需要極強的專業(yè)性,動態(tài)報警健康基準值由設備歷史大數(shù)據(jù)特征值學習總結而來,是基于設備自身歷史運行數(shù)據(jù),而不是簡單的行業(yè)經(jīng)驗數(shù)據(jù),更貼近設備實際運行情況。
(3)定值適應性方面:傳統(tǒng)閾值報警的定值是預先設定的一個固定值,不隨設備運行工況變化而變化,“以不變應萬變”;新系統(tǒng)定值是根據(jù)設備不同運行工況計算而來,會隨設備運行工況的改變發(fā)生相應的變化,具有很強的自適應性。
(4)報警處理及設備損壞方面:新系統(tǒng)能夠產(chǎn)生早期預警,而傳統(tǒng)系統(tǒng)只能夠產(chǎn)生缺陷報警,因此新系統(tǒng)故障預警后有更多的故障處理時間,對設備損壞也小很多。
此外,新系統(tǒng)通過層次分析法對設備報警部件進行全局性影響評估,為設備檢修決策提供支持;通過預警案例的不斷積累對設備報警處理提供解決方案,為故障檢修的精準定位提供依據(jù)。
總之,新系統(tǒng)以設備健康樣本大數(shù)據(jù)為核心,一切以大數(shù)據(jù)為依據(jù)、用大數(shù)據(jù)說話,
對于識別設備非健康狀態(tài)、防止設備故障、減少非計劃停運、提高設備利用率、延長設備使用壽命等方面,都是傳統(tǒng)系統(tǒng)無法比擬的。
新型設備狀態(tài)監(jiān)測系統(tǒng)主要功能包括設備動態(tài)預警、緩變量曲線趨勢自動識別和設備故障劣化程度評估3大部分。
設備趨勢分析相對于平穩(wěn)數(shù)據(jù),更關注最大值、最小值、平均值等特征數(shù)據(jù),本系統(tǒng)按照設備分析需求,預先計算出并存儲設備分鐘、小時、天、月、年特征值,即數(shù)據(jù)泛化,當用戶請求時直接提供計算結果,而不是請求時才去計算,能夠在保證準確展現(xiàn)設備真實趨勢的前提下,實現(xiàn)長周期大數(shù)據(jù)請求系統(tǒng)的快速響應。
傳統(tǒng)故障診斷模式是故障案例匹配,即用設備已知的故障樣本訓練系統(tǒng),以期當設備出現(xiàn)異常時,系統(tǒng)能夠從已知故障中匹配一個最相似故障樣本作為診斷結果。
這種模式在實際應用中存在如下問題:
(1)設備故障樣本數(shù)量很難達到系統(tǒng)訓練要求,導致系統(tǒng)學習精度和深度無法保障。
(2)設備故障樣本種類很難收集全面,導致模式匹配困難。
(3)設備故障變化多樣性,即使兩個相似故障也存在差異,導致模式匹配困難。
本項目逆向思維,采用健康樣本匹配模式,主要依據(jù)事實是:設備故障變化多端,但是設備正常運行表象是基本相同的,而且設備多數(shù)時間處于健康運行狀態(tài),能夠提供足夠的健康樣本供系統(tǒng)訓練學習。總之,設備健康表象相似,樣本豐富,模式匹配能夠保證精度和深度。
(1)核心算法:動態(tài)預警實現(xiàn)的核心算法是k-means聚類分析法,它是將各個聚類子集內(nèi)的所有數(shù)據(jù)樣本的均值作為該聚類的代表點,算法的主要思想是通過迭代過程把數(shù)據(jù)集劃分為不同的類別,使得評價聚類性能的準則函數(shù)達到最優(yōu),從而使生成的每個聚類同一簇中的對象彼此相似,不同簇中的對象彼此相異。
(2)模型建立:新系統(tǒng)采用面向對象建模方式,將設備關鍵測點以及相關測點作為一個整體的“模型”對象,模型更關注設備關鍵參數(shù)之間的整體性和關聯(lián)性,更注重系統(tǒng)思維,而不是單個參數(shù)的固定限值。
(3)健康基準值計算:對于水電站設備而言,一般情況下設備正常運行記錄會遠遠大于異常記錄,即設備正常運行狀況的運行數(shù)據(jù)數(shù)量,遠遠大于體現(xiàn)設備異常工況的數(shù)據(jù)數(shù)量。
因此,對于給定的特定工況下的一組設備運行數(shù)據(jù)集,通過聚類算法,大部分樣本會收斂于唯一的同一個簇(主簇),少量樣本會屬于其他簇,如圖3所示。大量健康樣本匯聚的主簇中心,正是設備健康基準值。對于其他簇,是異常數(shù)據(jù)或者設備的異常狀態(tài),予以剔除。顯然,設備健康基準值的產(chǎn)生是基于設備自身歷史運行大數(shù)據(jù),不是固定的值,會隨機組運行工況的改變發(fā)生相應的變化。

圖3 健康基準值計算示意圖
(4)偏差計算:為了更好的表達設備狀態(tài)偏離健康基準值嚴重程度,新系統(tǒng)使用相對偏差分析法,即相對偏差=[(健康基準值-模型實時值)/健康基準值]×100%,從而實現(xiàn)設備動態(tài)預警。
水電站一些重要設備參數(shù),如軸承瓦溫、調(diào)速器系統(tǒng)油位等,正常情況下變化量非常小,稱之為緩變量。緩變量緩慢上升或下降的趨勢往往是故障征兆的反映,而這種變化趨勢運行人員很難發(fā)現(xiàn),趨勢的自動識別非常必要。
緩變量自動識別基于概率統(tǒng)計理論。設曲線斜率為Kp,當曲線總體趨勢向上時,從概率論知識可知,曲線斜率Kp>0為極大概率事件,即斜率Kp>0的概率必將大于Kp<0的概率,反之亦然。對曲線上所有點的斜率分別進行正負統(tǒng)計,根據(jù)統(tǒng)計結果就能夠自動識別曲線的變化趨勢。
為了消除測點波動引起的識別誤差,需要設定測點變化死區(qū),即測點相鄰兩次測值之差大于設定值時,才統(tǒng)計該次斜率變化。某電站推力油槽油混水曲線自動識別過程特征數(shù)據(jù)如表1所示,曲線如圖4所示。

表1 特征值數(shù)據(jù)(小時平均值)

圖4 推力油槽油位天趨勢曲線
由表1可知,曲線斜率上升次數(shù)百分比為100%。曲線為加速上升狀態(tài)。事后結果表明,推力油槽油混水在7月26日凌晨3:00多開始出現(xiàn),并一直持續(xù)發(fā)展。
本項目采用層次分析法(AHP)對設備狀態(tài)進行評估,是一種定性與定量分析相結合的多目標決策分析方法。傳統(tǒng)設備狀態(tài)評估是一種定性分析方法,需要考慮設備多個屬性之間的權重關系,主觀性較強。
層次分析法每次只需要考慮設備兩個屬性之間的權重關系,形成屬性關聯(lián)矩陣,然后通過其計算出設備多個屬性之間的權重關系,降低定性成分,增加定量分析,設備狀態(tài)評估更容易實施,也相對更加合理。
新型水電站設備狀態(tài)監(jiān)測系統(tǒng)針對當前設備狀態(tài)監(jiān)測技術中的不足,充分利用現(xiàn)有的數(shù)據(jù)中心及大數(shù)據(jù)挖掘技術,從海量數(shù)據(jù)中挖掘出設備健康狀態(tài)樣本,實現(xiàn)設備早起故障報警、緩變量趨勢報警、設備劣化狀態(tài)評估等功能;應用數(shù)據(jù)泛化兼顧運算速度與精度,將歷史數(shù)據(jù)從以往“不被重視、利用難度大”的現(xiàn)狀,變成設備診斷分析最原始、最權威的專家;從而真正實現(xiàn)大數(shù)據(jù)分析與輔助決策,助力電站本質(zhì)安全。