李國慶,侯國安,張 浩
(銀川能源學院,寧夏 銀川 750015)
隨著現代工業的發展,工業由原來的簡單控制系統發展為復雜的智能化控制系統,齒輪箱是現代化機械設備中最常用到的動力部件,主要起傳遞運動和調配速度的作用。齒輪箱一旦發生故障,整個機械設備就會因此而無法正常運行或無法保證運行精度,從而造成巨大經濟損失[1]。
現今,數據挖掘[1]已成為一種新的知識發現方法,在工程診斷領域的發展日益重要,在監測診斷項目方面,許多國家和研究機構都已開始了對數據挖掘的研究和應用[2]。
軸承的故障一般表現為軸承疲勞剝落和點蝕,外圈故障和內圈故障[4]。
(1)軸承疲勞剝落和點蝕的主要特征:在其頻譜中高頻區外環,固有頻率附近出現明顯的調制峰群,產生以外環固有頻率為載波頻率,以軸承通過頻率為調制頻率的固有頻率調制現象;由于滾動軸承在變速箱中產生的振動與齒輪振動相比能量較小,解調譜中調制頻率幅值較小,一般只出現一階[5]。
(2)外圈故障特征:在轉頻、外滾道特征頻率及其高倍頻處有明顯的譜線。
(3)內圈故障特征:在轉頻、內滾道特征頻率及其高倍頻處有明顯的幅值下降的譜線。
軸的主要故障有軸向竄動、軸不平衡和軸嚴重彎曲。
(1)軸向竄動故障的主要特征:故障軸上齒數多的齒輪嚙合頻率的幅值大幅度增加;振動能量(包括有效值和峭度指標)有較大程度的增加[6]。
(2)軸不平衡故障的主要特征:以齒輪嚙合頻率、諧波為載波頻率,齒輪所在軸轉頻、倍頻為調制頻率的嚙合頻率調制,調制邊頻帶數量少而稀,解調譜上一般只出現所在軸的轉頻;故障軸的轉頻成分有較大程度的增加;振動能量(包括有效值和峭度指標)有一定程度的增加,包絡能量有一定程度的增加。
(3)軸嚴重彎曲故障的主要特征:以齒輪嚙合頻率、諧波、齒輪固有頻率、箱體固有頻率為載波頻率,以齒輪所在軸轉頻為調制頻率的嚙合頻率調制,如果彎曲軸上有多對齒輪嚙合,則會出現多對嚙合頻率調制,譜圖上邊帶數量較寬,解調譜上出現所在軸的轉頻和多階高次諧波;振動能量(包括有效值和峭度指標)有較大程度的增加,包絡能量有大幅度的增加。
粒子群優化是1995年提出的,Kennedy博士是首位研究者,他是源于對遷徙類覓食過程,通過觀察鳥類的遷移和群居的擬態[7]。其數學表達方式描述為:Pd=(Pd1Pd2…Pdn),V=(Vi1Vi2…Vin),Pi=(Pi1Pi2…Pin),X=(Xi1Xi2…Xin)。
設目標為d維,種群由m構成,每個粒子按照此式:
vid(t+1)=vid(t)+c1r1(pid-xid(t))+c2r2(pgd-xid(t))
(1)
所有的值都要大于零,其中i取值[1,M],r1,r2是在[0,1]范圍,d的取值[1,D],c1,c2為加速因子,c1=c2=2ptd,表示最優的位置;在實際的工程應用速度之前要乘以系數ω,通常粒子的速度迭代公式(1),pxtd(t)表示現在的方位;ω取值范圍為0.1~0.9之間。
條件屬性的個數為T,根據粗糙集理論[8]中粒子群優化算法,基于決策表的成型的構成特點,實際應用中將連續屬性離散化,并且是每一個屬性都要一一的進行離散化[9]。
定義:設斷點個數h,則起初位置是h×t的矩陣向量。
粗糙集理論粒子群優化算法中的速度公式表示如下:
v(t+1)=wv(t)+c1r1(pbest-p(t))+c2r2(Gbest-p(t))
(2)
p(t+1)=p(t)+v(t)
(3)
粒子群優化的基礎理論是粗糙集理論的核心基礎,對于這點不足,導致屬性歸類效果難以分辨[10]。
粗糙集理論的基礎是它的決策能力,通過對Na?ve Scaler算法的靈活應用也可以發現基本與粒子優化沒有關系,依據決策屬性值選取斷點值。
但是,有可能兩個決策值不同,隨著信息的組合不同會被除去。為了處理類似情況,其中改進的 Naive Scaler算法[11]可以在原來的NS算法中加入一個步驟,具體如下:
(1)每一個a的大小組合,a∈C,根據(xi)的值,仍記xi,…x,不失一般性,并將樣本保留1個以方便決策;
(2)如果D(xi)D(xi+1)≠a(xi)a(xi+1),得到一個斷點c,取c=(a(xi)+a(xi+1))/2。
如果a(xi)≠a(xi+1)且D(xi)=D(xi+1),a(xi+1)=a(xi+2)且D(xi+1)D(xi+2),則得到一個斷點,取c=(a(xi)+a(xi+2))/2。
如果a(xi)=a(xi+1)且D(xi)=D(xi+1)且屬性值與決策值都相同的樣本只保留一個,D(xi)≠D(xi+1),a(xi+1)≠a(xi+2),則得到一個斷點,取,c=(a(xi)+a(xi+2))/2,加入兩條計算斷點的規則。
分析上述過程,在所得不相同理論值之間的理論算法和屬性相結合的離散化算法中都找到了數量不等的斷點,在進行屬性約簡[12]后改進的NS算法中,離散化的斷點個數數量就會大大的減少,這樣就有利于計算生成規則[13]。
表1的數據是利用敏感元件進行對齒輪箱故障詳細診斷所得到的基本數據情況,決策屬性D分別用1、2、3、4、5、6表示齒輪箱故障的六種情況:良好、內圈劃傷、外圈剝落、保持架壞、齒面磨損、崩齒;C={a,b,c,d,e}為條件屬性,U代表論域,通過HS算法分解后,得到能夠代表不同情況的數值,總共二十個樣本,每種情況取三到四個樣本。下面分別采用基于改進NS的全局尋優的離散化算法對該決策表進行離散化。

表1 連續屬性決策

表2 改進NS的斷點集
計算離散化前條件:
X1={x1},X2={x2},X3={x3},X4={x4},X5={x5},X6={x6},X7={x7},X8={x8},X9={x9},…X20={x20}。
計算離散化前決策的屬性:
D1={x1,x2,x3,x5},D2={x6,x7,x8,x9,x10},D3={x11,x12,x13,x14,x15,x16},D4={x17,x18,x19,x20}。
則POSc(D)={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16,x17,x18,x19,x20}。
各個條件屬性的斷點集用改進的NS算法計算,0.5528,0.3979,0.5712,0.3618,0.16322通過選取原則各取一個斷點,NS算法得出的決策表見表3。

表3 離散化后的決策表
Pawlak屬性約簡算法的公式如下:
sig(a;B;D)=γ(B)-γb-(a)(D)
sig(a;B;D)={card(posIND(B)(D))-card(posIND(B-(a))(D))}/card(posIND(B)(D))
可根據公式直接證明定理[15],具體從略。
D核B=core(D)={a,b};
U/IND(c)={{1},{2}…{20}};
U/IND(D)={{1,2,3,4};{5,6,7};{8,9,10,11};{12,13,14};{15,16,17};{18,19,20}};
U/IND(B)={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20};{12,13,14};{15,16,17};{18,19,20}};
U/IND(B∪{c})={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20}};
U/IND(B∪g0gggggg)={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20}};
U/IND(B∪{e})={{14};{6,8,10};{1,2,3,4,5,7,9,12,17,16,20,11,15,18,19}}。
根據上述可得:
posB(D)=B{x}={1,2,3,12,14,17};
posB∪(c)={1,2,3,12,14,17};
posB∪(d)={1,2,13,14,17};
posB∪(e)={14}。
由此可以消除d、e,得到化簡后的決策表4。

表4 化簡后的決策表
計算條件屬性等價類:
X1={x1},X2={x1,x5},X3={x3},X4={x4},X5={x6,x7,x8,x9,x10},X6={x11,x12},X8={x14},X9={x16,x17,x18,x19,x20}。
最終的離散化決策表就是表4。
當且φ≠∩[t]∈B,集合T是B的最小決策值,即最小值約簡。
該表存在5個決策值:(D,1),(D,2),(D,3),(D,5),(D,6),D1=(D,1)={1,2},D2={5},D3={9},D5={16},D6={20}。
該表的每個屬性有兩個屬性值對,共有八個:(a,0),(a,1),(b,0)(b,1),(c,0),(c,1),(d,o),(d,1)。
為便于表示,用A0,A1,B0,B1,C0,C1,D0,D1表示。
A0=(a,0)={1,4,20};A1={5,9,11};B0={1,9,16};B1={4,5,20};C0={1,4,16};C1={5,9,20};D0={1,16};D1={1,4,16}。
可以根據定義逐個看條件屬性的不可分辨關系以及組合求解。
A0≠D1,A0≠D2,A0≠D3,A0≠D,A0≠D6,同理A1,B0,B1,C1,C0,D0,D1均無法推導出規則。
變換組合求解得以下規則:

表5 規則表
由此推斷出新的診斷規則,也可知道粗糙集理論的診斷優勢。本文只針對齒輪箱內部主要事故進行分析,此規則也只是適用于集中且大量出現的故障。
經過數據挖掘算法的粗糙集理論得出了一種診斷規則,我們需要對其進行驗證。把訓練樣本數據處理后代入得出的規則中,進行準確率驗證。

表6 待驗證離散化表
采用10組驗證數據,由表7驗證表得出,診斷規則準確率為90%。

表7 驗證表
通過差別矩陣和決策樹得出的診斷規則準確率為80%。
由此得出粗糙集理論中改進的Na?ve Scaler屬性約簡算法和基于決策間不可分辨關系的值約簡算法得出的診斷規則優于決策樹和差別矩陣所得出的規則。所以,此次改進的算法具有一定的可行性和實用性。
在全局動態尋優離散化算法中,改進Na?ve Scaler算法能夠得到所有保證不可分辨關系的斷點,通過斷點均分樣本集、逐漸增加斷點,動態地選擇斷點集,在信息系統分類能力不改變的情況下,使斷點個數最少,最終得出診斷規則;和決策樹的數據挖掘算法進行比較,表明改進Na?ve Scaler算法的全局動態尋優離散化算法準確率較高,說明該算法有一定的優越性和有效性。