鄭 偉,劉偉東,王 星
ZHENG Wei1, LIU Wei-dong2, WANG Xing1
(1. 河北北方學院 理學院,張家口 075000;2. 河北北方學院 信息科學與工程學院,張家口 075000)
故障診斷是20世紀60年代發展起來的一門新學科。隨著現代科學技術水平的日益提高,尤其是計算機科學和控制科學的飛速發展,現代設備的結構日益復雜,功能越來越完善,規模也越來越龐大,人們對于設備的安全性、可靠性和有效性的要求也越來越高,因此機械設備的故障診斷技術愈來愈受到人們的重視。故障診斷研究需要解決的問題之一是在保證機器狀態評價一致的情況下如何選擇最少的特征集。也就是說,在保證診斷精度大致不變的情況下,如何盡可能減少特征維數,以降低計算工作量和減少不確定性因素的影響。在診斷過程中,描述狀態的特征往往很多,有些特征是相關的,有些是獨立的,獨立的特征能提供互補信息,應加以保留;相關性特征產生冗余信息,同時會增加計算工作量,需要加以消除[1],基于粗糙集的屬性約簡正好為去除這種冗余性特征提供了方便。
本文著重研究了粗糙集理論的約簡算法利用其從大量的數據中挖掘出其內在的規律,找出有用的信息,可以大大提高故障的診斷精度。
粗糙集(Rough Set,RS)理論是波蘭數學家Pawlak在982年提出的,是一種新的軟計算方法[2],粗糙集方法的優勢在于它不需要任何預備的或額外的有關數據信息,解決一些不確定性問題。如統計中要求的先驗概率和模糊集中要求的隸屬度,因此其算法具有簡單、易于操作等特點。目前粗糙集理論已經在數據挖掘、機器學習、過程控制、決策分析、模式識別等科學與工程領域取得了成功的應用。
決策表中的一個樣本就代表一條基本決策規則,如果把所有這樣的決策規則羅列出來,就可以得到一個決策規則集合。但是,這樣的決策規則集合是沒有多大用處,因為其中的基本決策規則沒有適應性,只是機械地記錄了每個樣本的情況,不能適應新的、其他的情況。為了從決策表中抽取得到適應度大的規則,我們需要對決策表進行約簡,使得經過約簡處理的決策表中的一個記錄就代表一類具有相同規律特性的樣本,這樣得到的決策規則就具有較高的適應性。
決策表屬性約簡的過程,就是在不損失原有信息的前提下,從決策表系統的條件屬性中去掉不必要(對得到決策不重要)的條件屬性,從而分析所得約簡中的條件屬性對于決策屬性的決策規則。
傳統的屬性約簡算法有一般屬性約簡,可辨識矩陣約簡、基于屬性重要度的約簡[3,4]、條件信息熵[5]等,可辨識矩陣約簡該算法的不足是論域的對象與屬性的規模較大時,差別矩陣將占有大量的存儲空間,其次, 差別函數的化簡本身就是一個NP-hard問題,基于屬性重要度的約簡得到是一個最小約簡集,并不是最優集,結合信息論中條件信息熵的信息度量功能和屬性重要度的作用,本文改進了條件信息熵約簡算法,提出了一種基于屬性重要度和條件信息熵的屬性約簡算法。
算法描述:
1)從條件屬性集C中求出核屬性并放到屬性集CORE中,C=C-CORE。
2)計算決策表T中決策屬性D相對條件屬性C的條件熵H(D|C);
3)計算決策屬性相對每個條件屬性的條件熵H(D|{ai})(ai∈C),將ai按H(D|{ai})的大小降序排列;
4)令B=C,按H(D|{ai})遞減的順序對每個ai重復1)、2)運算:
(1)計算決策屬性集相對條件屬性集B在去掉ai后的條件熵H(D|B-{ai});
(2)判斷條件熵的變化:如果H(D|C)= H(D|B-{ai}),則屬性ai應約簡,記為B=B-{ai};如果H(D|C)!= H(D|B-{ai}),則屬性ai不被約簡,B不變;CORE=CORE+ai;
最后得到CORE集合為約簡的最終結果。
內燃機是一種動力機械,它是通過使燃料在機器內部燃燒,并將其放出的熱能直接轉換為動力的熱力發動機。內燃機的供油系統是內燃機的重要組成部分,供油系統產生故障將直接影響內燃機燃燒質量,其結果是降低了內燃機功率和熱效率,從而影響內燃機的性能和可靠性。因而查找供油系統的故障部位原因,對于保證設備正常工作具有十分重要的意義。

圖1 單缸4沖程柴油機工作原理示意圖
表3為內燃機的故障診斷決策表[1],1 表示存在,0 表示不存在;S1 表示低殘壓,S2 表示高殘壓,S3 表示壓力上升緩慢,S4 表示壓力急劇上升,S5表示開啟壓力提前,S6表示開啟壓力滯后,S7 表示二次噴射;F1表示噴孔堵塞,F2表示針閥常開或噴油器滴油,F3 表示開啟壓力過高,F4 表示開啟壓力過低,F5 表示油管堵塞。

表1 內燃機故障診斷決策表
采用基于屬性重要度和條件信息熵的屬性約簡方法進行故障規則的提取是,先求決策表中特征屬性集對應的核屬性,核屬性為特征S1與特征S6,再對特征集中剩余的特征依次進行條件信息熵計算,最后就可得特征屬性的約簡結果。表2給出了約簡結果。

表2 約簡后的內燃機故障診斷決策表
基于屬性重要度和條件信息熵的屬性約簡算法得到的約簡結果與采用一般屬性約簡、可辨識矩陣約簡的結果一致,該算計算時間復雜度小地優點。粗糙集約簡理論的優勢在于它不需要任何預備的或額外的有關數據信息。而統計中要求的先驗概率和模糊集中要求的隸屬度,因此其算法具有簡單、易于操作等特點。目采用該技術用于故障規則提取,提取的特征更具有典型特性,在故障診斷時能夠有效地降低故障診斷時間與提高診斷效果。
[1]康世英,姚斌.粗糙集屬性約簡理論在故障診斷中的應用研究[J].制造業自動化,2009,31(7):13-14.
[2]張文修,吳偉志,梁吉業,李德玉.粗糙集理論與方法[M].科學出版社,北京,2001,12-34.
[3]陳淑珍.基于粗集的幾種屬性約簡算法分析[J].武漢工業學院學報,2005,24(3):118-121.
[4]植小三,印勇,黃揚帆.基于粗糙集理論的一種數據約簡算法[J].云南民族學院學報,2008,2003,12(2):86-88.
[5]王國胤,于洪,楊大春.基于條件信息熵的決策表約簡[J].計算機科學,2008,2002,25(7):759-765.