999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則的一次風機故障預警方法研究

2016-11-11 06:21:42仝衛國
電力科學與工程 2016年10期
關鍵詞:關聯規則故障

高 瑜, 仝衛國

(華北電力大學 控制與計算機工程學院,河北保定071003)

?

基于關聯規則的一次風機故障預警方法研究

高瑜, 仝衛國

(華北電力大學 控制與計算機工程學院,河北保定071003)

為了減少發電廠設備故障造成的損失和降低檢修費用,基于DCS數據庫中的大量運行數據,利用關聯數據挖掘的方法發現一次風機各測量量之間隱藏的關系,建立關聯規則庫,通過當前運行數據與規則庫的匹配程度,判斷設備是否處于故障形成過程,從而達到故障預警的目的。實驗結果表明,該方法能夠在設備故障形成早期及時發現問題,提前報警,進而證明基于運行數據的關聯規則,可以準確地反映一次風機各測量量之間的關系,并在故障預警中達到良好的效果。

電廠;數據挖掘;關聯規則;故障;預警

0 引言

關聯規則是指從大量的,看似沒有關系的數據中發現潛藏在數據多個屬性之間的相互關聯或者某種規律,關聯規則發現是數據挖掘中最重要的任務之一[1]。火電廠DCS數據庫中蘊含著大量的機組運行數據,而這些數據中隱藏著大量不為人所知的知識,關聯規則即是設備各測點之間隱含的耦合關系,當故障開始形成時,這種關系就逐漸被打破。據此,本文旨在運用數據挖掘的方法,發現蘊藏在大量數據中的關聯規則,從而利用關聯規則建立設備故障預警模型,并驗證關聯規則在設備預警中的有效性。DCS數據庫中各測點均為數量型屬性,本文采用CA算法將數量型屬性劃分成若干個優化的區間,從而達到將數量型屬性離散化的目的[2],然后用經典的Apriori挖掘算法發現頻繁項集并挖掘關聯規則。再利用所挖掘出的關聯規則建立預警模型,并驗證本文所提出的預警方法的有效性。本文采集了某電廠1號一次風機的歷史運行數據作為研究對象。

1 關聯規則

布爾型關聯規則″W?Z″的支持率定義為:

其中,Support(W∪Z)為數據庫所有記錄中包含W∪Z的記錄個數,稱為W∪Z的支持數;n為數據庫的記錄總條數。即支持率代表事物在所有記錄中出現的頻率。

布爾型關聯規則″W?Z″的信任度定義為:

即信任度代表某事物在已經發生的事務中出現的條件概率。

滿足給定的最小支持率(minSup)和最小信任度(minConf)條件的關聯規則稱為有意義的關聯規則,關聯規則的挖掘問題就是要從數據庫的記錄中找出有意義的關聯規則。

Aprori算法是一種廣度優先算法,用來產生頻繁項集。通過對數據庫T的多次掃描來發現所有的頻繁屬性集,在每一次掃描中只考慮包含相同屬性個數的所有集合(含有k個屬性的集合稱為k-屬性集)。在第1次掃描中,Apriori算法計算I中所有屬性的支持度,生成所有1-頻繁屬性集L1;然后根據L1確定2-候選屬性集的集合C2,從C2找出所有2-頻繁屬性集L2;然后再根據L2確定3-候選屬性集的集合C3,從C3找出所有3-頻繁屬性集L3;如此下去直到不再有候選屬性集產生。算法中采用任何非(k-1)-頻繁屬性集都不可能是k-頻繁屬性集的子集這樣一個性質修剪候選屬性集,有效地減少了候選集支持數的計算量,同時還引入散列樹來有效地計算每個屬性集的支持數[3]。

2 數據離散化

本文選取了某電廠1號一次風機20個測量量作為關聯變量,從DCS數據庫中導出該一次風機自2013年8月至2014年3月的歷史記錄,經數據預處理后將各測點采樣間隔統一為5 s,選取其中5 000組運行數據組成待挖掘數據庫,測量量信息及數據形式如表1、表2所示,都是連續型屬性,如溫度、壓力、振動等。而Apriori算法針對的是離散型數據,要求每個測量量的取值是有限個,因此,需要將連續型屬性離散化。當屬性的取值連續變化時,將其劃分為若干個區間,然后將每個區間映射為一個值,這樣一個連續的量就變為有限個取值。為此,可以用聚類的方法將連續量劃分為若干個區間,并要求這些區間能有效反應數據的實際分布情況。

2.1區間劃分方法

聚類算法主要分為兩大類:硬聚類與模糊聚類。硬聚類有層次凝聚算法、C-均值算法和球型C-均值算法等。模糊聚類算法有FCM算法、關系模糊C-均值算法(RFCM)、模糊競爭凝聚算法(CA)和FC-MDE算法等。

表1 測量量信息

表2 部分測量數據

C-均值和球型C-均值等硬聚類算法,是基于某一目標數據只能被劃分到一個類而展開的。例如,C-均值算法可以根據數據的實際分布情況將連續型屬性離散化成若干個區間,但C-均值算法的類個數是預先給定的,在迭代過程中不再改變,因此聚類個數依賴于人的經驗。

本文采用模糊聚類算法將連續型屬性劃分成若干個優化的區間,CA算法(競爭凝聚算法)綜合了分層聚類與劃分聚類的優點,對于預先給定的不同類個數,能夠隨著迭代過程不斷改變類的數目,一些競爭力差的類在迭代過程中不斷消失,并最終得到能夠有效地體現數據的實際分布情況的優化聚類個數,從而將連續型屬性離散化成若干個優化的區間[4]。

2.2區間劃分過程

CA算法將記錄在連續型屬性“一次風機A相電流”上的取值劃分成c個區間:把“一次風機A相電流”的所有取值放在一起作為數據集Y,用CA算法對Y進行聚類,迭代過程中不斷改變劃分矩陣U和聚類中心,矩陣U中每一行的元素即是Y中的每一個取值分別在c個模糊集上的隸屬度。根據最大隸屬度原則將Y中的元素聚成c類,并取出類中最小、最大的值作為區間的左右端點,這樣“一次風機A相電流”就被離散化為12個優化的區間。20個測點通過CA算法劃分得到的優化區間個數分別為:9,5,9,20,16,12,9,11,20,11,5,7,7,9,15,13,11,10,20,13。

給每一個測量量對應的所有區間從小到大編號,例如“一次風機入口調節檔板開度”的9個優化區間分別編號1-9,這樣所采集到的“一次風機入口調節檔板開度”每個數據就映射到這9個區間中,另外,鑒于數據挖掘的需要,20個測量量的區間要加以區分,故將20個測量量的序號體現在最終的待挖掘數據庫中。例如,“一次風機入口調節檔板開度”為55.66,即該值落在1號測量量“一次風機入口調節檔板開度”的第4個區間,故將該數據記為104。同樣,將20個測量量的數據全部轉變為該種形式。

最終得到如表3所示的離散化數據庫。

表3 離散化數據庫

3 實驗驗證

3.1minSup與minConf的選取及規則庫的建立

為了使挖掘出的規則準確地表達一次風機各測點之間的關系,minSup與minConf的選取是關鍵。本文采用匹配率作為評價在某一組minSup與minConf參數下關聯規則的準確性的指標,并通過多組實驗,找到一組最佳的minSup與minConf作為最終故障預警規則庫的挖掘參數。

用5 000組訓練數據與規則庫進行匹配,匹配率mr=k1/k2×100%,其中k1為該組數據符合的關聯規則總數,k2為只符合規則前件而不符合規則后件的規則數,mr即表示規則庫對該組數據的適用性。mr越大,表示規則更正確地反映了該組數據各屬性的內在聯系。同理,用所有訓練數據的匹配率均值mean來表達規則庫對訓練數據的平均匹配程度。同時,用各組數據匹配率的方差variance來表達規則庫適用于訓練數據的穩定程度,方差小即表示規則很好的覆蓋所有運行數據,并且匹配率波動不是很大。

通過觀察在不同minSup與minConf下均值與方差的變化,尋找一對最佳的minSup與minConf,作為挖掘算法的參數。實驗結果如圖1、圖2所示。

圖1 不同支持率下,匹配率均值與信任度的關系

由圖1、圖2,總體而言支持率數值越大、信任度越高,那么均值越大、方差越小,但支持率和信任度過大都會導致均值驟然降低、方差驟然升高。這是由于支持率和信任度過大導致規則數驟減,降低了規則庫的覆蓋率,也就是大量運行數據找不到與之相配的規則,反而使匹配率降低。支持率和信任度過小則會導致挖掘時間過長,且規則數過多,會拉低平均匹配率,也就是很多規則并不可信。另外,由于Apriori算法效率不高,需考慮挖掘過程的時間成本。表4為不同支持率下,尋找頻繁項集所用時間,支持率越小時,用時越長。據此,本文選擇minSup=2%,minConf=95%作為Apriori算法的參數。挖掘出的頻繁項集共計14 089條,關聯規則共計27 729條,部分頻繁項集及關聯規則形式如表5、表6所示。

支持率/支持數1%/502%/1003%/1504%/2005%/2506%/300時間/min>1000123261276

表5 部分頻繁項集

表6 部分關聯規則

對表5所列關聯規則進行解釋,例如第6條關聯規則的意思是:如果1號測量量(一次風機入口調節檔板開度)取值落在第1個區間([34.14,41.02]),11號測量量(一次風機后軸承溫度2)取值落在第1個區間([28.96,31.96]),18號測量量(一次風機電動機定子線圈溫度4)取值落在第1個區間([69.86,73.60]),那么15號測量量(一次風機電動機定子線圈溫度1)取值落在第1個區間([73.24,77.29]),16號測量量取值落在第1個區間([72.88,78.48])的可能性為98.88%。

3.2規則庫的有效性驗證

由挖掘出的所有規則組成規則庫,另外選取了風機在2014年7月的一次故障報警前共5 019組數據(經插值處理后各測量量時間間隔統一為5 s)進行規則庫的有效性驗證。為了避免因不確定因素及隨機干擾導致的實時數據偏離正常值,而產生誤報警,本文采用滑動窗口的統計方法。設窗口寬度為20,即把包括當前匹配率在內的前20組數據的匹配率取均值,作為當前的匹配率。在實驗中,預警閾值選為80%。實驗結果如圖3。

圖3 實驗結果

由圖3,當運行數據與規則庫的匹配率降至80%時即發生報警,較原有系統超限報警時間提前約2.5 h,有效地起到了預警作用。

4 結論

故障往往是一個逐漸發生的過程,在故障早期,各測點值雖均未超限,但實際上設備各測點之間原有的關系正在被逐漸打破,不斷惡化。關聯規則即是設備在正常狀態下各測點之間關系的體現,在故障形成的過程中,原本的關聯規則對當前運行數據的適用性逐漸降低,直至低于閾值,發生報警。通過實驗,驗證了關聯規則在故障預警過程中的有效性,且該預警方法不依賴于任何有關設備的先驗知識,完全依靠歷史數據即可方便地建立設備的“預警模型”——關聯規則庫。當各參數選擇恰當,該規則庫能夠準確地體現設備的正常狀態,故具備良好的預警效果。

[1]王鳳良, 富學斌, 許志銘.發電廠一次風機異常振動故障診斷及處理[J].風機技術,2014(3):88-92.

[2]崔建,李強,吳瑕.大型數據庫的模糊關聯規則挖掘算法研究[J].計算機工程與設計,2011(10):3424-3427.

[3]郭康維.基于相似性建模的鍋爐一次風機故障預警研究[D].保定:華北電力大學,2014.

[4]郭嘉美.模糊關聯規則挖掘及在工業數據中的應用[D].鄭州:鄭州大學,2014.

[5]陸建江.模糊關聯規則的研究與應用[M].北京:科學出版社,2008.

[6]高明.火電廠送風機故障預警系統的研究[D].保定:華北電力大學,2013.

[7]楊錫運,郭鵬,岳俊紅. 風力發電機組故障診斷技術[M]. 北京:中國水利水電出版社,2015.

[8]朱彥廷.連續屬性的關聯規則挖掘[J].華中師范大學學報(自然科學版), 2013,47(2):178-180.

[9]魯緒閣,范云霄,錢抗抗.設備故障診斷技術綜述及其發展趨勢陰[J].礦山機械,2008,35(12):15-18.

[10]SIMON J W,XIANG B J,YANG W X.Condition monitoring of the power output of wind turbine generators using wavelets[J].IEEE Transactions on Energy Conversion,2010,25(3):715-721.

[11]AGRAWAL R, INIELINSKI T,SWAMI A. Database mining:A performance perspective[J].IEEE Transactions on Knowledge and Data Engineering, 1993, 5(6):914-925.

[12]周子煜,文麗書.數據挖掘技術與關聯規則挖掘算法探討[J]. 電子技術與軟件工程,2016(14):27-29.

Research of Method to Failure Prognostic of Primary Air Fan Based on Association Rules

GAO Yu,TONG Weiguo

(School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China)

Aiming at reducing the loss and cost caused by equipment failure, by using the method of data mining to find the hidden relationships among each measuring point of primary air fan, a collection of association rules basing on mass DCS operation data in the database are established. By judging the matching degree of the running current data with the rule base, the primary air fan state is analyzed and judged so as to achieve a goal of prognostic. The experimental results show that this method is able to find the problem and give an alarm in time. And then it proves that association rules based on the operation data can accurately reflect the relationship between each measuring point of the fan, and achieve good results in the early prognostic.

power plant; data mining; association rules; failure; prognostic

2016-05-31。

高瑜(1990-),男,碩士研究生,主要從事數據挖掘與故障預警方面的研究,E-mail:285640220@qq.com。

TM614

ADOI:10.3969/j.issn.1672-0792.2016.10.007

猜你喜歡
關聯規則故障
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
故障一點通
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
奔馳R320車ABS、ESP故障燈異常點亮
故障一點通
主站蜘蛛池模板: 四虎精品国产AV二区| 国产成人高清精品免费5388| 综合色在线| 午夜精品福利影院| 55夜色66夜色国产精品视频| 99青青青精品视频在线| 亚洲无码高清一区| 欧美特黄一级大黄录像| 国产视频一区二区在线观看| 亚洲第一综合天堂另类专| 91久久国产综合精品女同我| 狠狠亚洲婷婷综合色香| 国产成人三级在线观看视频| 毛片视频网| www.精品国产| 亚洲综合婷婷激情| 99久久性生片| 亚洲大尺码专区影院| 国产美女91视频| 国产福利一区视频| 又爽又大又光又色的午夜视频| 免费国产好深啊好涨好硬视频| 亚洲午夜18| 色哟哟国产精品一区二区| 一级毛片免费高清视频| 青青草国产在线视频| 国产理论一区| 无码福利视频| 国产福利免费视频| 成人a免费α片在线视频网站| 欧美无专区| 爱色欧美亚洲综合图区| 国产a v无码专区亚洲av| 亚洲av无码片一区二区三区| 在线观看av永久| 乱人伦99久久| 国产伦精品一区二区三区视频优播 | 亚洲欧美不卡| 久久精品人妻中文视频| 国产制服丝袜91在线| 狠狠亚洲五月天| 青青青视频91在线 | 国产精品太粉嫩高中在线观看| 国产精品区网红主播在线观看| 亚洲小视频网站| 玖玖精品在线| 97超碰精品成人国产| 71pao成人国产永久免费视频 | 欧美精品成人一区二区在线观看| 国产96在线 | 91小视频版在线观看www| 国产制服丝袜无码视频| 国产精品无码久久久久AV| 亚洲av中文无码乱人伦在线r| 国产一区二区精品福利| 亚洲精品福利视频| 91精品专区| 中文字幕欧美日韩| 91精品国产91久久久久久三级| 国产91丝袜在线观看| 色噜噜在线观看| 激情综合五月网| 亚洲精品男人天堂| 无码精品国产dvd在线观看9久| 国产成人高清亚洲一区久久| 国产小视频a在线观看| 999福利激情视频| 在线另类稀缺国产呦| 2048国产精品原创综合在线| 亚洲国产天堂在线观看| yjizz国产在线视频网| 91无码网站| 免费a级毛片视频| 国产大全韩国亚洲一区二区三区| 91探花在线观看国产最新| 亚洲欧洲日韩久久狠狠爱| 天天综合网亚洲网站| 日韩精品免费一线在线观看| 97国内精品久久久久不卡| 91年精品国产福利线观看久久| 在线观看无码a∨| 久久这里只精品热免费99|