陳仁祥, 吳昊年, 韓彥峰, 趙 玲, 吳志元, 陳里里
(1.重慶交通大學 機電與車輛工程學院,重慶 400074;2.重慶大學 機械傳動國家重點實驗室,重慶 400030)
工程實際中各種旋轉機械(如風力發電機組、數控機床主軸等)往往在不同轉速工況下運行。轉速不同勢必改變信號特征(如能量、頻譜結構等)[1],不同轉速下的振動信號難以比較。使得目前面向同一工況故障診斷方法不能有效實現不同轉速下設備診斷。不同轉速工況下旋轉機械診斷問題已成為當前機械故障診斷領域的難點與熱點。
對于不同轉速工況下旋轉機械故障診斷,目前主要有階次分析和時頻分析兩種方法[2]。階次分析方法是將時間域的非平穩信號轉化為角域的平穩或循環平穩信號,使傳統信號處理方法能夠重新發揮作用。如:任凌志等[3-4]分別采用多尺度線調頻基稀疏信號分解和自適應時變濾波進行階比分析從而對齒輪箱進行故障診斷。Zhao等[5]提出了一種基于無鍵相包絡階次分析的變轉速軸承診斷技術。Eggers等[6-7]將時域平均技術和階次跟蹤相結合進行變工況下齒輪箱故障診斷。時頻分析方法能同時提供時間域與頻率域的聯合分布信息,以進行機械信號瞬態特征的提取。Zhao等[8]提出了一種基于IMF(Intrinsic Mode Fuction)的自適應包絡譜分析技術進行復雜服役環境下的滾動軸承多損傷檢測。Li等[9-10]提出了一種基于廣義壓縮變換的時頻表達方法進行變轉速齒輪箱故障診斷。Vicua[11]采用STFT (Short-Time Fourier Transform)分析變速變載下振動信號的調頻、調幅特性以進行故障特征提取。
以上方法取得了較好的效果,但仍存在一定的局限。階次分析的方法受制于硬件和算法精度,且所獲得的階次譜在角域尺度一致但其振動能量仍受轉速影響。時頻分析方法存在如交叉項干擾、小波基難以選擇等問題,在轉速波動小時效果較好,但不適合于轉速波動大的場合。同時,這兩種方法需要進行人工參與,依賴于人的專業知識與經驗,難以實現自動診斷。
目前,在進行旋轉機械故障自動診斷時主要采取“信號采集-故障特征集-故障識別”的模式進行[12-14]。而要進行不同轉速下旋轉機械故障自動診斷面臨的關鍵問題是提取對轉速不敏感的特征量,并建立故障特征集,實現不同轉速下故障特征的同尺度定量表征。岑健等[15-16]利用無量綱指標對轉速的不敏感性,構建出以無量綱指標為基礎的檢測器,通過閾值檢測實現了不同運行條件下的故障判定。雖然這種方法只是獨立使用某一無量綱指標且只是通過閾值判定故障,但為實現不同轉速下故障特征同尺度表征提供了思路。
為此,提出不同轉速工況下融合無量綱指標與信息熵的旋轉機械故障診斷方法。首先提取對轉速敏感性低的無量綱指標(如偏度指標、波形因素等)和信息熵(如EMD(Empirical Mode Decomposition)信息熵、小波時頻熵、奇異值譜熵)構建出故障特征集,實現不同轉速下故障特征的同尺度定量表征。并設計出故障敏感指標算法,濾除非敏感和敏感性差的特征,選取對故障敏感性好的特征構建得到表征能力更強的故障敏感特征集。再將故障敏感特征集輸入線性局部切空間排列(Linear local Tangent Space Alignment,LLTSA)進行非線性降維與融合,獲得分類特性好的低維故障敏感特征集。最后應用魯棒性好的加權最近鄰分類器[17-18](Weight K-Nearest Neighbors Classifier,WKNNC)實現不同故障類型的診斷。將所提方法應用于不同轉速下齒輪箱故障診斷,工程應用結果證明了所提方法的可行性和有效性,為不同轉速工況下旋轉機械故障診斷提供了一種新的思路與方法。
轉速和扭矩是旋轉機械運轉過程中動態激振力的來源,轉速的變化勢必導致信號模式的變化,使得振動信號的能量和頻譜結構發生改變。現有某行星齒輪箱實驗臺如圖1(a)所示。四種故障類型:正常狀態、太陽輪斷齒、太陽輪缺齒、行星輪齒根裂紋。在每種故障類型下輸入軸轉速分別為1 800 r/min、2 400 r/min、3 000 r/min時采集振動信號,采樣頻率為30 720 Hz,采樣長度102 400點。以齒輪正常狀態為例,在不同轉速下計算出幅值譜(僅給出0~200 Hz范圍)如圖1(b)所示。從圖1(b)可知,齒輪箱振動信號隨著轉速的提高其頻率結構、能量等特征等發生了改變,如主頻的頻率和幅值隨著轉速的提高而增大。可見,雖屬同樣的狀態,但由于轉速不同,所測得信號能量和頻率結構發生改變、缺乏可比性。

(a) 實驗臺及故障齒輪

(b) 不同轉速下的幅值譜
進一步,每種故障類型下在三個轉速時分別采集兩組振動信號(采樣參數同上),取前2 048點計算三種轉速下信號的概率密度函數,如圖2所示。從圖2可知,不同轉速下處于相同故障類型的概率密度函數曲線形狀相似,具有相同的特征,且概率密度函數曲線的位置相對固定。

(a) 1 800 r/min

(b) 2 400 r/min

(c) 3 000 r/min
圖2 不同轉速下的概率密度函數
Fig.2 The probability density function under variable speed
為了實現不同轉速下旋轉機械故障診斷,必須進行不同轉速下故障特征的同尺度定量表征,構建出故障特征集,才能應用模式識別算法自動識別故障。由上節分析,由于不同轉速下采集得到信號的強度、頻率結構特征不同,不能直接提取與能量有關的特征量作為故障特征集。而不同轉速下處于同一故障類型的概率密度函數曲線特征相似和位置相對固定。所以,提取反映概率密度曲線特征的無量綱指標和反映組分概率的信息熵構建故障特征集,實現不同轉速下故障特征的同尺度定量表征。
1.2.1 無量綱指標提取
反映概率密度函數曲線特征的無量綱指標定義如下
(1)
式中:x為信號幅值,p(x)為信號的概率密度函數。
當n和m取不同的數是可構建出不同的無量綱指標(見表1中P1~P6),如:偏度指標(P1);峭度指標(P2);波形指標(P3);脈沖指標(P4);裕度指標(P5);峰值指標(P6)。時域無量綱指標不受振動信號絕對水平的影響,對轉速、載荷等敏感性低。以上無量綱指標從不同側面反映出概率密度函數曲線的特征,如偏斜度反映概率密度函數曲線不對稱性的程度,峭度指標是反映信號幅值偏離正態分布的。
同理,在頻域也存在偏度指標(見表1中P7)、峭度指標(見表1中P8)和頻率方差(見表1中P9)。
1.2.2 信息熵提取

(2)

信息熵反映的是信號組分概率情況,當處于不同故障類型時其振動信號組分概率pi不同,則信息熵也不同,且信息熵受轉速影響小。基于此,利用經驗模式分解、小波變換和奇異值分解可將信號進行不同域的正交分解,通過信息熵方法可提取出EMD信息熵(見表1中P10)、小波時頻熵(見表1中P11)和奇異值譜熵(見表1中P12)。
融合9個無量綱指標和3個信息熵,構建出故障征集如表1所示。這些特征量對轉速敏感性低,可實現不同轉速下故障特征同尺度定量表征。
在此,需要注意,提取無量綱指標與信息熵時對應的信號需為平穩信號,即需在轉速相對穩定時提取特征量構建故障特征集,這一點在轉速變化慢或適當減少信號分析長度時易于實現。
為了盡量全面反映故障信息,所建立的故障特征集包含多個常見無量綱指標和信息熵,但每個特征量對故障的敏感性不同。故障敏感性差的特征量不僅會增加計算量還會降低故障特征集的表征能力,影響故障診斷率。因此,需要分析每個特征量的對故障的敏感性,選擇對故障敏感性好、辨識性強的特征量構成故障敏感特征集,增強對故障的表征能力,提高故障診斷率。
對于不同故障類型的故障特征集,如其中某一特征量在不同類故障特征集間的數學期望值差別越大,同時在同類故障特征集間的一致性越好則說明該特征量的故障敏感性好,反之,則差。特征量在不同類故障特征集間的區分性可通過該特征值的在不同類故障特征集間數學期望值差別來反映。特征量在同類故障特征集中的一致性可通過其在同類故障特征集中的概率密度函數來反映。因此,可綜合利用特征值在不同類故障特征集間的數學期望值差別與同類故障特征集中的概率密度函數來進行特征值選取,設計出基于核函數概率密度估計的故障敏感特征指標算法,從而選取故障敏感性好的特征量構成故障敏感特征集。

表1 故障特征集

(3)



(4)


(j≠j′)
(5)
根據以上分析可知,FSI的取值范圍為[0,2],當某特征值在不同類故障特征集中概率密度函數完全相同時,其故障敏感性指標FSI=0,對故障表征能力最差,不具有區分能力。當某特征值在不同故障特征集中概率密度函數完全不同即FSI=2時對故障表征能力最強,具有最好的區分能力。
根據敏感性指標選取故障特征量時,選取特征越多,信息越全面,會有利用提高識別精度,但選取特征越多則會帶入敏感性差的特征量,影響故障診斷率。根據式(5)可知,當FSI<1時,特征量間概率密度函數曲線重疊面積就會超過50%,特征量的表征能力就很差,認定這部分特征量對故障敏感性差。因此,在本文中從原始故障特征集中選擇FSI≥1的特征量構成故障敏感特征集。
由于故障敏感特征集的維數高且包含了大量冗余信息,影響故障診斷率,需要對其進行維數約簡,得到便于模式識別、區分性更好的低維故障特征集。線性局部切空間排列算法具有自動簡化高維混合特征集和高效率分類別的雙重作用,是十分有效的非線性維數約簡方法。在此,采用該方法對故障敏感特征集進行維數約簡。
LLTSA的目的在于尋找轉換矩陣A將Rm空間中具有N個點的含噪聲數據集Xraw(即故障特征集)映射為Rd空間的數據集Y=[y1,y2,y3,…,yn],即
Y=ATXrawHn(d (6) 式中:Hn=I-eeT/n為中心矩陣,I為單位矩陣,e為所有元素都為1的n維列向量,Y就是Xraw為潛在的d維非線性流形。LLTSA的計算步驟如下: 步驟1 PCA投影;實際問題中數據(如故障樣本)的特征維數n要比樣本數m大得多,導致矩陣XrawHnXrawT往往是奇異的。利用主成分分析將數據集投影到PCA(Principal Component Analysis)子空間,使XrawHnXrawT成為非奇異矩陣,同時,PCA預處理還可實現降噪。設PCA轉換矩陣為APCA,xi為PCA投影后的數據。 步驟2 確定鄰域;利用K-近鄰法(KNN)或ε近鄰法構建xi點的局部領域圖,獲得xi(i=1,2,3,…,n)的k個近鄰點xij(j=1,2,3,…,k)。 步驟3 提取局部信息;找出每點的局部信息,通過計算XiHk的(Xi=[xi1,xi2,xi3,…,xik],Hk=I-eeT/k)的d個最大右奇異值對應的奇異矢量,得到d個特征向量構成的局部低維矩陣Vi。 步驟4 構造排列矩陣;通過局部累加構造矩陣B如下 (7) 步驟5 計算映射;計算式(6)所示廣義特征問題的特征值和特征向量,得到線性映射向量如式(7)。 XHnBHnXTa=λXHnXTa (8) ALLTSA=[a1,a2,…,ad] (9) 所以,所求映射矩陣A=APCAALLTSA,則X→Y=ATXrawHn。通過映射矩陣A可以將樣本集從高維空間映射到低維流形子空間:Y=ATXrawHn,從而實現對高維故障敏感特征集的維數約簡得到低維故障敏感特征集。低維故障敏感特征集相對于高維故障敏感特征集區分性更好,且特征間相互獨立,將其輸入分類器即可實現自動故障診斷。 為了最終實現不同轉速下旋轉機械故障自動診斷與智能識別,需要對LLTSA約簡后的低維故障敏感特征集進行分類識別。加權最近鄰分類器(WKNNC)是最近鄰分類器[19](K-Nearest Neighbors Classifier,KNNC)的改進,不僅具有KNNC計算效率高的優點,而且能避免KNNC識別精度易受鄰域大小k值影響的缺點。 WKNNC根據各近鄰樣本與測試樣本的相似程度對近鄰樣本賦予不同的權重,使得測試樣本的分類結果更加接近于相似程度更高的訓練樣本。從而提高識別精度和削弱對k值選擇的敏感性,使得識別結果的精度和魯棒性更好。所以,在此應用WKNNC對低維故障敏感特征集進行分類識別。 設X={(xi,li),xi∈Rm,i=1,2,…,n}是一個由n個樣本組成的訓練集,每個樣本xi的類標簽li已知,li∈{l1,l2,…,lr}。xt為測試樣本,其類別標簽lt待測。WKNNC分類的基本思想是:對于給定的測試樣本xt,在訓練集中找出它的k個最近鄰,根據k個最近鄰的分類屬性投票確定測試樣本xt的分類屬性lt。分類的目標是使分類誤差M最小,即對于每一個取值lj,分類誤差M(lj)為 (10) 式中:P(li|xt)為將測試樣本xt分類為li的概率;R(li,lj)為將屬性li分類為lj產生的誤差,當i=j時R(li,lj)=1,否則R(li,lj)=0。 WKNNC實現分類的具體算法步驟: 步驟1 利用歐式距離計算測試樣本xt與每個訓練樣本xi之間的距離d(xt,xi) (11) 根據d(xt,xi)大小,從訓練集X中找出xt的k+1個近鄰樣本xt,1,xt,2,…xt,k+1。 步驟2 從k+1個近鄰樣本中選擇與xt距離最大的樣本設為xt,k+1,相應的距離為d(xt,xt,k+1),利用d(xt,xt,k+1)對其他k個近鄰樣本與xt的距離進行標準化,即: (12) 步驟3 對標準化后的距離D(xt,xi),利用高斯核函數將其轉化為xt與xi的同類概率p(xi|xt),即: (13) 步驟4 根據xt與k個近鄰樣本的同類概率p(xi|xt)求出xt為類別li(i=1,2,…,r)的后驗概率P(li|xt),即: (14) 則,獲得最有可能的分類結果KNN(xt),即: (15) 不同轉速工況下融合無量綱指標和信息熵的旋轉機械故障診斷流程,如圖3所示。 圖3 故障診斷流程 具體步驟包括: 步驟1 提取振動信號無量綱指標與信息熵構建出包括12個特征量的故障特征集,實現不同轉速下故障特征的同尺度定量表征。 步驟2 計算每個特征量的故障敏感性指標,選擇敏感性指標好的特征值構建出故障敏感特征集。 步驟3 將應用LLTSA對訓練樣本和測試樣本的高維故障敏感特征集進行降維與融合,輸出低維故障敏感特征集用于模式識別。 步驟4 利用WKNNC對降維后的低維故障敏感特征集進行模式識別,獲得測試樣本的故障類別,實現故障診斷。 將“1”節中處于四種故障類型下的振動信號用于故障診斷。四種故障類型在1 800 r/min,2 400 r/min,3 000 r/min三種轉速下分別采集振動信號,即每種故障類型下有3個振動信號,長度為102 400點,采樣頻率30 720 Hz。以2 048點從每個振動信號中隨機取出50組,則每個故障類型下有150組信號(每種轉速50組)。訓練樣本構成:每種故障類型在1 800 r/min下隨機抽取20組,在2 400 r/min下隨機抽取10組,共計四種故障類型有4×(20+10)=120組信號。測試樣本構成:每種故障類型在2 400 r/min下從剩下的信號中隨機抽取10組,3 000 r/min下隨機抽取20組,共計四種故障類型有4×(10+20)=120組信號。 為了對比有量綱指標、無量綱指標和信息熵對轉速的敏感性,以行星輪齒根裂紋為例提取出三種轉速下20個樣本的平均幅值、有效值、波形因數和奇異值譜熵,如圖4所示(限于篇幅未給出其他無量綱指標和信息熵)。從圖4可知,平均幅值、有效值均因轉速不同而明顯不同,波形因數和奇異值譜熵隨轉速的變化不敏感。說明包含無量綱指標與多域信息熵的故障特征集受轉速影響小,可實現不同轉速下故障的同尺度表征。 圖4 不同轉速下的特征量 應用本文所提的故障診斷方法進行診斷。首先為了證明所構建故障特征集的可行性和有效性,分別將包含了有量綱指標(如有效值、方差、標準差)的故障特征集和本文所構建的故障特集輸入LLTSA進行降維。根據后文診斷結果和便于觀與比較,當降維目標維數設置為2,結果如圖5所示。圖5(a)中,每種故障類型的訓練樣本降維后分成兩部分。如正常狀態在1 800 r/min轉速下的20個訓練樣本和2 400 r/min轉速下的10個訓練樣本被分成了兩部分,對其他故障類型也存在相同情況。這是由于特征集中包含了受轉速影響大的有量綱參數,在轉速不同時,相互間失去可比性。同時,也說明需要在不同轉速下對故障特征進行同尺度表征才能進行故障診斷。圖5(b)是對本文所構建的原始特征集的降維結果。由于原特征集中包含了較多對故障敏感性差的特征,降維效果不佳,四種故障類型均有相互重疊的情況,但未出現圖5(a)中同一故障類型的訓練樣本被分成兩部分的情況,說明實現了不同轉速下故障特征的同尺度定量表征。 (a) 包含有量綱參數特征集 (b) 原始特征集 進一步,計算出12個特征量的故障敏感性指標,如表2所示。選取敏感性指標≥1的9個特征量(表2黑體部分)構造成故障敏感特征集。由表2可知,敏感性最好的的特征量是峭度指標、波形指標、脈沖指標、裕度指標、峰值指標、頻域偏度指標、EMD信息熵、小波時頻熵和奇異值譜熵。將獲得的故障敏感特征集分別輸入PCA和LLTSA進行降維,結果如圖6所示。 表2 故障特征量的敏感性指標 圖6(a)中,PCA降維結果中太陽能缺齒被分離出來,但其他三種狀態有交叉和重疊部分,這是因為PCA適用于線性降維,而故障特征集往往是非線性的,所以降維效果不佳。圖6(b)中,四種故障類型被有效分離,同時聚類性能更好,說明LLTSA降維效果好。對比圖5(b),將故障敏感性低的特征量濾除后,降維效果明顯改善,說明特征集表征能力得到增強。 將三種特征集降維后的低維故障特征集輸入WKNNC中進行識別,結果如表3所示。采用包含有量綱指標特征集的平均診斷率為35%,是由于測試樣本中有10個(占樣本數的33.3%)樣本與訓練樣本中的10個樣本在相同轉速(2 400 r/min)下獲得,這部分測試樣本被準確診斷,而在3 000 r/min轉速下的測試樣本診斷錯誤。采用原始特征集的平均診斷率為69.2%,是因為原始特征集中存在信息冗余,干擾了識別結果。采用敏感特征集時應用PCA與LLTSA降維的平均診斷率分別為83.3與91.7%,是因為濾除了原始特征集中的冗余信息,增強了特征集對故障的表征能力,同時也再次證明了LLTSA降維效果優于PCA。 (a) PCA (b) LLTSA 表3 診斷精度對比 根據FSI選取特征量時,其取值越小則選取特征量越多,其取值越大則選取特征量越少。為分析敏感特征指標選取對診斷結果的影響,分別選取FSI≥1.4、FSI≥1.2、FSI≥1、FSI≥0.8、FSI≥0.6的特征量構成敏感特征集進行診斷,診斷率分別為78.3%、89.2%、91.7%、72.5%、69.2%。說明特征量選取過多(FSI≥0.8、FSI≥0.6)會引入故障表征能力差的特征量使得診斷率下降,如特征量選取過少(FSI≥1.4、FSI≥1.2)則會丟失部分信息,也會降低診斷率。由此通過實驗證明選取FSI≥1的特征量構成敏感特征集時適當的。 為分析WKNNC和KNNC的分類特性。將故障敏感特征集進行LLTSA降維后再分別輸入KNNC和WKNNC進行識別,診斷率隨鄰域大小k(k=1,2…,30)的變化曲線,如圖7所示。WKNNC在不同k值下的診斷率均大于KNNC,其診斷率的平均值也大于KNNC,而峰峰值和標準差均小于KNNC,證明WKNNC的識別率更高且魯棒性更好。 圖7 診斷結果對比 為分析診斷結果受轉速的影響情況,分別將三種轉速1 800 r/min、2 400 r/min、3 000 r/min的樣本作為訓練樣本,另外兩種轉速下的樣本作為測試樣本進行診斷,其中訓練樣本數為故障類型數4×50=200,測試樣本數為兩種轉速下共計2×4×50=400。應用所提方法對上述樣本進行診斷,結果見表4(同時給出了包含有量綱指標特征集的診斷結果)。觀察該表,所提方法受訓練樣本與測試轉速影響較小,三種情況下均能達到約92%的診斷率。同時,由于有量綱指標受轉速影響大,導致包含有量綱指標特征集的診斷結果很低約8%。綜合表3和表4,進一步證明了所建立的特征集受轉速影響小。 以上工程應用結果和分析表明所構建的融合無量綱指標和信息熵的故障特征集實現了不同轉速工況下旋轉機械故障特征同尺度定量表征,故障敏感特征量的選取方法有效濾除了對故障敏感性差的特征量,所獲得的故障敏感特征集表征性能更好,所提方法的診斷率更高和穩定性更好,證明了本文方法的可行性和有效性。 表4 不同轉速下的診斷結果 針對不同轉速工況下旋轉機械故障的同尺度表征和診斷的問題,提出了融合無量綱指標與信息熵的旋轉機械故障診斷方法。 (1) 通過利用對轉速敏感性低的無量綱指標和信息熵構建故障特征集,實現了不同轉速下故障特征的同尺度表征。并設計出基于核函數估計的故障敏感性指標算法,選取故障敏感性好的特征量,獲得表征能力更強的故障敏感特征集。 (2) 采用LLTSA進行非線性降維融合獲得了分類特性更好的低維故障敏感特征集,再應用WKNNC實現了故障類型的穩定診斷。工程應用結果證明所提方法的可行性和有效性。 (3) 本文的后續將分析載荷對振動信號的影響機理,研究不同載荷下旋轉機械故障診斷問題,與本文研究成果一起終形成不同工況下故障診斷的理論與方法。
3 低維故障敏感特征集的WKNNC識別
4 應用實例
4.1 故障診斷流程

4.2 診斷實例









5 結 論