董志遠,劉淑杰,張洪潮,2
(1.大連理工大學機械工程學院,遼寧 大連 116024;2.德克薩斯理工大學工業工程系,美國 德克薩斯盧伯克 79409)
當前,隨著工業生產技術水平的提升和產品的不斷更新換代,機械設備朝著復雜、高效和智能化發展。其中,旋轉部件(如軸承、齒輪、螺旋槳等)作為機械設備的關鍵組成部分,其性能表現直接決定了機械設備是否能夠長時間安全平穩地運行。因此,對其運行狀態的監控、對運行數據的分析以及對故障的檢測診斷方法的研究就顯得十分重要。
信息和工業自動化工業的發展使得工業生產線上可以分布著大量的各種類型的傳感器用以實時獲取反映設備運行狀態的數據。這些數據中往往含有數量龐大、精確且高效的故障信息,由于設備運行的復雜性和傳感器的多樣性,在這些數據中也同時存在著大量冗余和無關信息,對這些數據進行特征提取進而識別其運動狀態成為當前重點研究方向。Sugamaran[1]等對滾動軸承的振動信號采用了時域特征提取法來進行故障診斷;蘇文勝[2]等提出了一種基于小波包樣本熵的特征提取方法對滾動軸承信號的故障特征進行了分析提取;朱利民[3]等提出信號的短時傅里葉變換的時頻特性可以用于系統故障診斷,并獲得了理想的結果。李世玲[4]等人針對旋轉設備的故障信息判斷問題,將徑向基函數與小波包算法相結合以進行故障信息提取,并對其預測效果進行了檢測。
然而在實際的復雜系統中采集的信號,僅通過時域或時頻域上的單一特性并不能獲得系統中的所有線性和非線性信息。所以,需要結合多域特征提取方法,從原始數據集中提取出包含多域信息的高維特征集合,以便更精確、完整地表達系統的狀態信息。
局部線性嵌入算法(LLE)能夠依靠局部線性逼近來逼近整體非線性,算法在保持局部集合特性不變的條件下,通過找到高維數據的低維嵌入以實現對原始數據的非線性降維[5],降維后的數據能夠保持原有的拓撲結構。該算法在旋轉機械的運行狀態識別中得到了廣泛運用,胡建中[6]等人利用LLE算法對齒輪箱不同故障下的信號進行二次特征提取并進一步融合特征集,實現故障識別;刑廣鑫[7]等人使用該算法對滾動軸承信號的時域和LMD排列熵組成的高維特征集進行降維處理,完成故障特征的二次提取。
因此,本文將LLE算法和神經網絡中的RBF算法相結合,構建了基于LLE-RBF的旋轉機械特征融合與運行狀態識別系統,以實現對旋轉機械設備的在線監控,并通過實測的滾動軸承信號進行驗證。
信號故障特征提取是判斷旋轉機械設備運行狀態的關鍵,當前,主要可分為三大類別:基于時域的特征提取、基于頻域的特征提取和基于時頻域的特征提取。常用的時域特征參數有:均方根值、峰-峰值、峭度值、波形因子、脈沖因子等。頻域特征參數主要是基于頻域或時域分析方法進行特征提取的結果,如均值頻率、中心頻率、頻率方差、均方根頻率。
旋轉機械運動時所形成的振動信號主要是非平穩信號,僅依靠上述特征提取方法中的某一個獲取的單個退化特征數據無法全面、精確地顯示出設備運行時的狀態[8],因此必須利用時頻域分析方法來分析非穩定信號的頻率成分隨時間而改變的情形。常用的時頻域特征提取方法有三角函數變換、小波變換、EEMD分析等。
這些特征參數在特征融合與狀態識別中已經得到普遍應用,本文選擇時域、頻域和EEMD分析結果作為設備運行信號的描述特征,分別提取時域5個特征參數、頻域4個特征參數和時頻域5個特征參數用于運行狀態識別。
(1)時域特征參數
本文所用到的時域特征參數有:均方根值、標準差、峰-峰值、峭度因子、裕度因子,以上特征及其計算方法如表1所示。

表1 時域特征參數

(2)頻域特征參數
本文所用到的頻域特征參數有:均值頻率、中心頻率、頻率方差、均方根頻率。以上特征及其計算方法如表2。

表2 頻域特征參數
表2中,s(K)表示x(n)的頻譜,K=1……Nfft,Nfft為譜線總數,fK是第K條普賢對應的頻率值。均值頻率可以描述頻域振動能量信息;頻率標準差反映頻譜的收斂程度;中心頻率、均方根頻率用于描述頻域振動能量信息。
(3)時頻域特征參數(EEMD分解)
集合經驗模態分析(EEMD)是當前較為常見的時頻域分析方式,在經驗模態分解(EMD)的基礎上,在信號處理中加入了輔助高斯白噪聲,當加入的白噪聲平均散布于一個時頻空隙中時,該時頻空隙就由分割成的各種小尺度成分所組成,是一個經典的時頻段區間分析,克服了信號在分析過程中產生的模式混合問題[9]。EEMD方式的內在實質上是基于高斯白噪聲具備頻譜均勻分布的統計學特點,在信道中經過多次加入只有幅值相同的高斯白噪聲,改善了信道的極值問題點特征,以便于得到信號的所有IMF分數,最后對得到的所有IMF加以總體平衡來抵消新加入的白噪音的負面影響,以便于有效控制模態混疊現象的產生。而采用EEMD方式處理,就能夠自適應地把時域映射信息分解成一些頻譜由高至低順序的IMF分數,包括一個頻譜較低的殘余項。
EEMD分解的主要步驟如下:
1)對于待分析信號x(t),多次加入正態分布白噪聲ni(t)進行平滑,得到混合信號xi(t)。
xi(t)=x(t)-ni(t)
(1)
其中i為添加白噪聲的次數。
2)尋找xi(t)在時域上的所有局部極大值和極小值,并且連接所有極值點得到對應的上下包絡線;
3)記上下包絡線的均值為m(t),則可計算得到信號與包絡均值之差為:
h(t)=xi(t)-m(t)
(2)
4)判斷h(t)是否滿足成為IMF分量的條件,若不滿足則令h(t)為xi(t)重復步驟2)和步驟3),直到h(t)滿足成為IMF的條件,此時得到第一個IMF分量,記為c1j。
5)將c1j從xi(t)中分離,得到剩余信號r1j(t),再令剩余信號r1j(t)為xi(t)進行新一輪IMF分量求取,最后得到x(t)的所有n個IMF分量cij(t)和一個剩余項ri(t):
(3)
6)將每次分解得到的IMF分量進行平均化處理以消除加入的白噪聲的影響,由于加入的n組白噪聲不相關,其統計均值為0,所以得到最終的IMF為:
(4)
式中,cj(t)為原信號EEMD的第j個IMF,N為過程中加入白噪聲的次數。
將每一段時域信號都進行集成經驗模態分解得到其IMF分量,然后計算每個IMF分量的能量值:
(5)
經過EEMD分解后,IMF分量的能量在不同頻段變化很大,為了避免這一現象造成的影響,對IMF分量的能量值進行歸一化處理,將歸一化后的能量值作為時頻域的特征指標:
(6)
流形學習能夠從原始數據集中挖掘隱含信息,并找出所產生數據的內部規律性。局部線性嵌入算法(LLE)是由Sam T.Roweis和Lawrence K.Saul在2000年左右提出的[10],它是一種新的降維技術,針對非線性數據而提出,并且能夠使降維后的數據保持原有的拓撲結構。流形算法LLE的基本思想是將全局非線性轉化為局部線性,數據集任何一個點都能夠用其鄰近節點的線性組合來描述,對每個局部實現了其線形維度的約化,進而將約化結果按照規律進行綜合求得更低維的全局坐標,最后完成了數據子集的非線形維度約化[11]。
LLE算法能夠充分挖掘機械設備高維非線性數據集映射到低維坐標系中,以得到聚類性良好的低維特征,排除冗余信息。高維數據集AD×n={a1,a2,…,an},由n個D維數據組成,進行LLE降維,可得到低維坐標系中的數據集Bd×n={b1,b2,…bn}(d≤D)。
LLE算法主要分三步,具體步驟如下。
1)計算高維數據空間中每個樣本點ai(i=1,2,…,n)與其n-1個樣本點之間的距離。依據樣本點相互之間距離的大小,選取前K個和ai距離最近的點作為其領域。其中兩點之間的距離的度量采用歐氏距離,即:
(7)

(8)


L(B)=tr(BTMB)
(9)
式中,M=(I-W)T(I-W),I為單位矩陣。
為了使L(B)能夠對平移、旋轉和伸縮變化都保持不變,公式(9)應滿足兩個約束條件,即:
(10)
L(B)取得最小值之后的結果,是矩陣M的前d+1個最小非零特征值所對應的特征向量。在處理過程中,將所有M的特征值按照小到大的次序加以排列,由于第一個特征值幾乎接近于零,所以舍去這個特征值,而取第2~d+1之間的特征值,其對應的特征向量所構成的矩陣B就是要求取的低維空間中的特征向量。

圖1 特征提取融合方法流程圖
本文采用滾動軸承的故障運行數據進行方法的驗證,實驗數據來源于西安交通大學機械工程學院雷亞國教授[12]團隊公開的XJTU-SY軸承數據集。試驗使用的滾動軸承為LDK UER204滾動軸承,根據測試滾動軸承的損壞原因分為內圈損壞、外環磨損、保持架斷裂,試驗使用的傳感器為PCB 352C33單向加速度感應器,進行滾動軸承的全生命周期振動信號的采集,在試驗中設定取樣頻率為25.6 kHz,取樣間距為1 min,每次取樣時間為1.28 s。實驗設備布置如圖2所示。
滾動軸承的疲勞主要包括二種過程:材料破壞累積過程和斷裂磨損傳播發展的過程。前者耗費了疲勞階段的大多時間,而裂縫的損傷傳播過程卻只有一個相對比較短暫的階段。這也表明了若采用傳統的基于單特征的狀態檢測方式,則從故障得到證實后開始一直到再出現故障之前所留給維護人員實現及時預見修復的時間都十分短暫,從而根本就無法實現通過及時預見修復減少經濟損失。

圖2 滾動軸承試驗臺
在數據來源的文章中指出,該實驗中軸承所受的載荷施加在水平方向,因此在水平方向上采集的振動信號能夠包含更多的退化信息,故選取水平方向上的振動信號進行處理。
振動信號經EEMD分解后可得到14個IMF分量和一個殘差,如圖3所示為某一段信號經分解后的結果,其中1~14行為原信號,最后一行為殘差。
計算各個分量與原信號的相關程度,各個分量的相關系數如表3所示。由表3可知,從IMF5往后的分量的相關系數過小,與原信號特征相差較大,因此不考慮IMF5往后的分量。取前4個IMF分量,計算其能量值并進行歸一化處理,將其作為時頻域特征指標。

圖3 水平方向信號EEMD分解結果

表3 各IMF分量與原信號相關系數
EEMD提取結果組成軸承振動信號的時頻域特征參數集T3,與表1中的時域特征參數集T1和表2中的頻域特征參數集T2共同組合為原始高維特征集T,見表4。圖5為時域特征中的峰-峰值。

表4 故障原始特征集

圖4 時頻域特征

圖5 峰-峰值
基于上文得到的高維特征集,采用基于LLE的特征融合處理。LLE算法的步驟可分為三步:
1)尋找每個樣本ai(i=1,2,…,n)的K個近鄰點;
2)根據每個樣本點的近鄰點計算局部重建矩陣W;
3)根據W矩陣,計算M矩陣,然后求解M矩陣的最小d個非零特征值所對應的特征向量。
基于上述步驟,進行能夠完全反映螺旋槳全生命周期性能退化信息的低維融合特征指標的提取。LLE的輸入參數為13×123階向量,選取輸出維數為1階,并通過計算得到鄰域參數k=30。最后對融合結果進行滑動濾波消除特殊值影響,結果如圖6所示。

圖6 LLE特征融合結果
由圖6可知,基于LLE算法得到的融合退化特征指標對滾動軸承的性能退化趨勢信息體現得較為敏感。通過對特征融合結果分析,可以把滾動軸承的整體生命周期粗略分成了三個階段:在階段一,當滾動軸承剛投入使用,退化特征值較小且在很長一段時間內均處于相對穩定狀態,此時認為滾動軸承正處在平穩運行階段;在階段二,退化指標波形在第78~79個樣本點處發生顯著上升,說明此時滾動軸承開始發生外圈損傷,退化特征值也開始以相應的速率增加,該階段簡稱為衰退期;在階段三,衰退指標波形在121~122點處出現顯著增大,此時滾動軸承的故障程度也顯著加深,并且增長速度明顯加快直至最終失效,該階段被稱為快速失效期。
在設備運行的整個周期中,旋轉部件隨著時間的推移而持續退化,對設備不同退化階段進行識別劃分,是健康監測技術的又一前提條件。因此,需設定適當的健康閾值以識別軸承退化過程和失效的開始時間節點。采用切比雪夫不等式:
(11)
式中:E為軸承的融合特征序列;μk和σk分別是序列E的均值和標準差,εk是某個選定的實數。

取α=4%,表示在選定條件下軸承的融合特征能量值落在|μk-εk,μk+εk|區間內的置信概率為96%。
設置εk=2σk,此時閾值μk+εk為軸承完全報廢點,設置εk=0σk,此時閾值μk+εk為軸承初始故障時間點。
使用根據切比雪夫不等式設置的閾值可以將LLE融合結果清楚地劃分為三個階段,可以看出軸承在第79個時間點開始進入故障階段,該點為初始故障時間點。在第122個時間點后軸承性能急劇退化,進入報廢階段,軸承在運行到該點處時應對軸承及時進行更換維修以避免損失。
為了再次驗證上述實驗結果,本文繼續采用另一個軸承退化實驗數據來驗證特征融合結果及退化階段劃分的有效性。結果如圖8所示,可以看出該方法依然可以較為準確地進行退化階段劃分。

圖7 退化階段劃分 圖8 軸承二退化階段劃分
本文主要進行了以下研究:
1)首先,本文采用西安交通大學雷亞國教授公開的軸承數據進行了多域特征提取,在提取時域與頻域特征的基礎上,基于EEMD分析提取了時頻域特征,并構建多域特征集。
2)隨后采用了一種基于LLE的多域特征融合算法。該方法在對設備故障信號進行時域、頻域、時頻域特征提取后組成的高維特征向量進行融合降維處理,得到能夠準確反映滾動軸承設備全生命周期性能退化狀態的一維退化特征指標,可以準確地表示軸承全生命周期的性能退化情況。
3)最后,采用切比雪夫不等式對特征融合結果進行狀態劃分,可以清楚地劃分出軸承初始故障時間點和報廢時間點,以便及時對軸承進行維修或更換,避免損失。