張鑫
(廣西省電力公司柳州供電局,廣西 柳州 545005)
目前,國內(nèi)狀態(tài)檢修主要還是利用狀態(tài)監(jiān)視和診斷技術(shù)獲取設備的狀態(tài)和故障信息,進而做出檢修決策的階段。狀態(tài)檢修的重點在于預測故障發(fā)展趨勢,在故障發(fā)生前,根據(jù)設備狀態(tài)決定對其檢修。因此,在電氣設備的狀態(tài)監(jiān)測與故障診斷中,尋找設備故障與其外在表象之間的相關(guān)關(guān)系是很重要的。當建立故障與表象之間的相關(guān)關(guān)系越全面、越準確,進行故障診斷準確性就越高。
在生產(chǎn)實踐中比較常用的判斷方法是利用統(tǒng)計方法,從大量的現(xiàn)場檢修記錄中,總結(jié)出一些存在于故障狀態(tài)與表現(xiàn)之間的相關(guān)關(guān)系,從而為故障的判定提供依據(jù),但其具有一定的局限性[1],統(tǒng)計方法的本質(zhì)是一種歸納總結(jié)的方法,因此很難發(fā)現(xiàn)隱含在大量數(shù)據(jù)中的結(jié)構(gòu)。在日常的檢修試驗中,基層單位積累了大量的試驗數(shù)據(jù),這本身就是個巨大的資源,如何利用這個資源并發(fā)揮其巨大的作用顯得越來越重要。
數(shù)據(jù)挖掘就是為了滿足大量數(shù)據(jù)的處理,并從中抽取有價值的潛在知識,而應運而生的。它可以利用計算機技術(shù)對大量數(shù)據(jù)進行自動處理,從而發(fā)現(xiàn)其中隱含的關(guān)系或規(guī)律[2,3]。數(shù)據(jù)挖掘作為信息處理的一個新領域,發(fā)展很快,在科學技術(shù)領域也發(fā)揮著越來越大的作用。本文對數(shù)據(jù)挖掘技術(shù)在SF6氣體分析和故障診斷做一嘗試研究,通過探索希望對數(shù)據(jù)挖掘技術(shù)在在線監(jiān)測上的發(fā)展上做一努力。
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程[4]。數(shù)據(jù)挖掘需要明確的是:數(shù)據(jù)源必須是真實的、大量的、可能含噪聲的:從數(shù)據(jù)源中可發(fā)現(xiàn)用戶感興趣的知識;發(fā)現(xiàn)的知識是可接受、可理解、可運用的;并不需要發(fā)現(xiàn)放之四海而皆準的知識,僅支持特定的發(fā)現(xiàn)問題(即支持特定主題的知識發(fā)現(xiàn));它主要以數(shù)據(jù)庫或數(shù)據(jù)倉庫作為工作對象,但是也可以直接從操作數(shù)據(jù)中挖掘信息。
進行數(shù)據(jù)挖掘可采用許多不同的算法,如神經(jīng)網(wǎng)絡、決策樹、遺傳算法和粗糙集等。模糊神經(jīng)網(wǎng)絡一方面可以對專家描述的事件直接編碼,跟蹤推理過程,使網(wǎng)絡中的權(quán)值具有明顯的含義;另一方面,它也具有學習功能,可以通過學習提高代碼精度。模糊神經(jīng)網(wǎng)絡一般有5層,分別是輸入層,模糊化層,規(guī)則控制層,或神經(jīng)元,輸出層,如圖1所示。

圖1 模糊神經(jīng)網(wǎng)絡結(jié)構(gòu)
粗糙集理論是一種刻劃不完整性和不確定性的數(shù)學工具,能有效地分析和處理不精確、不一致、不完整等各種不完備信息,通過發(fā)現(xiàn)數(shù)據(jù)間隱藏的關(guān)系,揭示潛在的規(guī)律,從而提取有用信息,簡化信息的處理[5]。理論中應用決策表描述論域中對象。它是一張二維表格,每一行描述一個對象,每一列描述對象的一種屬性。屬性分為條件屬性和決策屬性,論域中的對象根據(jù)條件屬性的不同,被劃分到具有不同決策屬性的決策類。表1為一張決策表,論域U有8個對象,編號1~8,{a,b,c}是條件屬性集,d為決策屬性。對于分類來說,并非所有的條件屬性都是必要的,有些是多余的,去除這些屬性不會影響原來的分類效果。約簡是為不含多余屬性并保證分類正確的最小條件屬性集。一個決策表可能同時存在幾個約簡,這些約簡的交集定義為決策表的核,核中的屬性是影響分類的重要屬性。“約簡”和“核”這兩個概念很重要,是粗糙集方法的精華。粗糙集理論提供了搜索約簡和核的方法。計算約簡的復雜性隨著決策表的增大呈指數(shù)增長,引入啟發(fā)式的搜索方法如遺傳算法有助于找到較優(yōu)的約簡,即所含條件屬性最少的約簡[6]。

表1 原始決策表
本文選擇基于粗糙集的模糊神經(jīng)網(wǎng)絡理論,它能充分發(fā)揮粗糙集和模糊神經(jīng)網(wǎng)絡各自的優(yōu)點。一般神經(jīng)網(wǎng)絡結(jié)構(gòu)不易理解,各條連接,各層節(jié)點,各個輸出輸入含義不清晰;模糊神經(jīng)網(wǎng)絡雖然結(jié)構(gòu)易于理解,但連接復雜,學習時間長,而基于粗糙集理論的模糊神經(jīng)網(wǎng)絡則克服了上述缺點,結(jié)構(gòu)清晰簡單,易于理解,訓練時間大大縮短。粗糙集理論特別適用于處理模糊和不精確性問題。模糊神經(jīng)網(wǎng)絡優(yōu)異的逼近和分類能力可實現(xiàn)SF6氣體分析和故障故障診斷。粗糙集方法能有效地對樣本數(shù)據(jù)進行約簡,去除冗余屬性、簡化規(guī)則集,在保證分類能力的前提下,優(yōu)化了模糊神經(jīng)網(wǎng)絡的拓撲結(jié)構(gòu),使網(wǎng)絡更清晰、簡單,大大降低了網(wǎng)絡規(guī)模,提高了學習速度。如圖2所示,為基于粗糙集的模糊神經(jīng)網(wǎng)絡。

圖2 基于粗糙集理論的模糊神經(jīng)網(wǎng)絡結(jié)構(gòu)
第1層為輸入層,輸入變量為b,c(a為冗余條件屬性,已被約簡掉)。
第2層為規(guī)則的前件,實現(xiàn)輸入變量的模糊化。
第3層的各節(jié)點分別表示各條規(guī)則。第2層與第3層之間的連接方式由粗糙集最終約簡規(guī)則決定。圖2 中,u1=b0,u2=b1,u3=b2c0,u4=c1。
第4層為各條規(guī)則的后件,與第5層之間的連接由粗糙集最終約簡規(guī)則決定。圖2中,wi為有權(quán)系數(shù),d1=u1w1+u4w4,d1=u1w1+u4w4。
數(shù)據(jù)挖掘的過程如圖3所示。

圖3 數(shù)據(jù)挖掘過程
SF6氣體分析和故障診斷是一個多輸入多輸出系統(tǒng),SF6氣體成分分析是判斷SF6設備故障的主要方法。通過分析各種氣體的含量,判斷其故障類型。本文收集了某些變電站SF6設備歷史數(shù)據(jù),共100個樣本??紤]到SF6氣體成分分析較全面地反映了SF6設備的運行狀態(tài)。因此,選擇了“SF6、SO2、CO、HF、H2S、氣體濕度體積分數(shù)、露點、故障原因、故障否”作為預測變量。確定數(shù)據(jù)挖掘的主題為:(1)該研究以SF6設備故障狀態(tài)與故障表現(xiàn)(SF6氣體分析結(jié)果)之間的關(guān)系作為挖掘處理的目標:(2)選擇“故障否”作為因變量。
利用基于粗糙集的模糊神經(jīng)網(wǎng)絡理論建模需要構(gòu)建一個7輸入,7輸出的模糊神經(jīng)網(wǎng)絡,輸入為SF6、SO2、CO、HF、H2S、氣體濕度體積分數(shù)和露點,輸出為導電金屬對地放電,懸浮電位放電,導電桿連接接觸不良,互感器匝間和套管電容屏短路,及影響值,頻率和聯(lián)合。首先要隨機選擇80個樣本訓練,另外20個用來測試模型。
模型建立之后,就可以檢查有關(guān)模型的信息。其中頻率和影響值是用來表明輸入和輸出元素之間存在著密切的聯(lián)系。Freq說明各分組數(shù)據(jù)中故障記錄占當前記錄的百分比。Impact用以說明一個記錄值對預測的重要性,其值在0~100之間。對于有兩個結(jié)果的研究,若Impact值超過60或70,預測準則將隨之產(chǎn)生。一般來說,Impact為100表示非常具有預測性。中間值50表示沒有預測性,Impact在0~30之間表明有很大的負面影響。
聯(lián)合指的是有兩個或者更多的共同影響某個輸出結(jié)果的輸入元素的集合,只要聯(lián)合中的一個元素出現(xiàn)在包含特殊輸出結(jié)果的記錄中,其余的元素也總會同時出現(xiàn)。Conjunction為l并不重要,它代表的規(guī)則是多余的。
首先對80個訓練樣本進行數(shù)據(jù)模糊化處理,形成原始決策表,然后根據(jù)前面介紹的約簡方法,可以方便地將這些規(guī)則精簡35%,得到最終決策表,獲得相關(guān)模型,有利于得出SF6中各種氣體成分含量與故障之間的直觀聯(lián)系,為判斷SF6設備的運行狀態(tài)提供了有力的依據(jù)。生成的模型對 SO2、CO、HF、H2S比較敏感,都得到了與SF6設備發(fā)生故障密切相關(guān)的各種氣體含量的范圍,見表2,結(jié)果與電力設備預防性試驗規(guī)程的規(guī)定相差不大,很有利用價值。

表2 與故障密切的各種氣體含量范圍
選擇歷史數(shù)據(jù)中的某一數(shù)據(jù)進行單例預測,并選擇相關(guān)數(shù)據(jù)進行批預測。單例預測根據(jù)發(fā)現(xiàn)的模型,以交互的方式預測某一情況的結(jié)果;批預測一次性獲得一系列情況,在沒有用戶干預的情況下直接進行預測。
選擇表3的記錄值作為預測的輸入。預測結(jié)果是104CT,水分超標,故障。作出故障判斷的主要原因是濕度體積分數(shù)和SO2含量,這兩個分類對的Impact值都為100。
批預測的結(jié)果是104CT,故障,其余均無故障。將預測結(jié)果與實際記錄逐條分析比較,因變量“故障否=否”時,有個記錄預測失敗;“故障否=是”時,預測準確度是100%;為“無法判斷”時,僅有條記錄預測失敗。這樣的預測準確度是可以接受的。
通過對SF6設備故障和檢修記錄中的SF6氣體成分數(shù)據(jù)進行挖掘,建立了SF6設備運行狀態(tài)與各種氣體含量之間的直觀聯(lián)系,所建立的模型具有較高的預測準確度,可以作為SF6設備運行狀態(tài)診斷的判斷依據(jù)。而且,數(shù)據(jù)量越大,數(shù)據(jù)越復雜,數(shù)據(jù)挖掘模型的適應性越強,預測結(jié)果也越有實際價值。

表3 某變電站SF6測試數(shù)據(jù)
研究說明,數(shù)據(jù)挖掘技術(shù)具備在電力設備故障診斷中應用的前景,SF6氣體分析是現(xiàn)在SF6設備故障分析的主要方法,且在不斷發(fā)展中,更多的成分分析被引入其中,數(shù)據(jù)的分析量也在不斷增大,因此對于應用于此的數(shù)據(jù)挖掘技術(shù)還需要更多的研究和補充。
[1]Hand D J.Data Mining:Statistics and More[J].The American Statistician,l998,52(1):112 - l18.
[2]Groth R.Data Mining:Building Competitive Advantage[M].New York:Prentice-Hall Inc,1997.
[3]D.Hawkins.Identification of Outliers[M].Chapman and Hall,London,1980.
[4]Anand T,Kahn G.Opportunity Explorer:Navigation Large Datable U-sing Knowledge Discovery Templates[A].Proc.AAAI-93 Workshop Knowledge Discovery in Databases[C].Washington DC,1993.
[5]劉璨,陳統(tǒng)堅,彭永紅,等.基于粗集理論的模糊神經(jīng)網(wǎng)絡建模方法研究[J].中國機械工程,2001,12(11):1256 -1259.
[6]Jelonek J.,Krawiec K.,Slowinski R.Rough set reduction of attributes and their domains for neutral networks[J].Computational Intelligence,1995,11(2):339 -347.