崔瀾,張宏立,馬萍,王聰
(新疆大學 電氣工程學院,烏魯木齊 830046)
滾動軸承是機械設備中極易發生故障的重要部件, 鑒于滾動軸承故障物理模型的不確定性以及智能化處理技術的飛速發展,基于數據驅動的滾動軸承退化趨勢預測方法成為一個深具潛力的研究方向[1],其核心在于狀態變化敏感特征的提取,最優退化特征的選擇以及預測模型的建立3個方面。
對于敏感特征的提取,文獻[2]提取滾動軸承的時域指標并通過主成分分析法構建敏感特征,但該方法增加了人工提取的難度,且易受噪聲的影響。文獻[3]提出了一種從二維圖形上分析非線性時間序列內部動力學特性的遞歸方法——遞歸圖法(Recurrence Plot,RP),但遞歸圖僅是對非線性動力學的定性描述,觀察起來極不方便。文獻[4]在遞歸圖的基礎上進行遞歸定量分析(Recurrence Quantification Analysist,RQA),從定量的角度對非線性動力學系統進行分析,克服了傳統方法對過程平穩的嚴格要求且對噪聲具有一定的抑制作用。文獻[5]采用遞歸定量分析方法,利用遞歸量指標進行離心泵的故障診斷并得到了較好的結果,但未對故障的預測進行討論。因此,本文嘗試采用遞歸定量分析方法提取滾動軸承的遞歸量,并選取最能體現滾動軸承退化趨勢的遞歸量作為滾動軸承的退化指標。
為更好預測滾動軸承的退化趨勢,需進行退化狀態分割,滾動軸承在完全失效之前需要經歷多狀態過程,文獻[6]利用自動譜聚類的方法將滾動軸承全壽命周期劃分為多狀態,文獻[7]將譜聚類與遺傳算法相結合進行時序曲線的聚類。因此,本文利用譜聚類方法對提取的遞歸量指標進行時序曲線聚類,劃分滾動軸承的多種運行狀態。
在對滾動軸承退化趨勢進行的研究中,文獻[8]將遞歸定量分析與卡爾曼濾波方法結合,但卡爾曼濾波方法需要建立具體的物理模型,對于滾動軸承的非平穩狀態而言,建立準確的物理模型比較困難。長短期記憶神經網絡[9](Long Short-Term Memory,LSTM)可以處理長期依賴問題,與卡爾曼濾波和馬爾可夫模型[10]相比,LSTM不需要預先選擇有限個狀態即可進行預測,文獻[11]利用LSTM進行了故障序列的多步預測且取得了比傳統預測模型要好的結果,故本文選擇LSTM作為預測模型,對滾動軸承的退化趨勢進行預測。
在準確預測滾動軸承退化趨勢時,提取最優特征是關鍵步驟,嵌入定理[12]指出,在確定合適的延遲時間τ和嵌入維數m的情況下,可以從一維混沌時間序列中重構一個與原動力系統在拓撲意義下一樣的相空間。對于長度為n的時間序列{x1,x2,x3,…,xn},重構后的相空間向量為{xi,xi+τ,…,xi+(m-1)τ},其中M為相空間向量個數,M=n-(m-1)τ,重構后的相空間可表示為
(1)
由此可見,選擇合適的τ和m至關重要,本文利用互信息量法確定延遲時間τ并選擇虛假臨近點法確定嵌入維數m,從而對滾動軸承的原始振動信號進行相空間重構,得到體現系統運行狀態的高維特征,并對高維特征進行定性以及定量分析,以挖掘能夠體現系統運行狀態的信息量。
對重構相空間向量進行定性分析,可得遞歸矩陣
(2)
式中:Θ為階躍函數;Yi,Yj為相空間中任意2個點;ε為遞歸閾值。
采用基于原始時間序列標準差的方法改進遞歸閾值,具體步驟如下:
1)采用最大相空間尺度的10%[13]確定t1時刻的標準遞歸閾值ε1。
2)確定t1時刻數據的標準差σ1,得比例系數k=ε1/σ1。
3)確定t2時刻數據的標準差σ2,則t2時刻的遞歸閾值為ε2=kσ2,以此類推得tn時刻的遞歸閾值為εn=kσn。
從遞歸圖的點線關系求出系統的遞歸量[14],結果見表1。

表1 遞歸量特征指標Tab.1 Characteristic index of recurrent quantity
(3)
(4)
式中:p(l),p(v)分別為遞歸圖中45°和垂直方向直線的長度;Nl,Nv分別為遞歸圖中45°和垂直方向上長度為l/v的直線的條數;lmin,vmin分別為遞歸圖中45°和垂直方向上直線的最小長度(一般取2);lmax,vmax分別為遞歸圖中45°和垂直方向直線的最大長度。
滾動軸承在其全壽命周期內依次經歷平穩運行階段、輕微退化階段、加速退化階段和失效階段,對滾動軸承所處的運行狀態進行明確劃分,只針對失效階段前的數據進行預測更具有實際意義。因此,采用譜聚類的方法對退化指標進行時序曲線聚類,以此區分不同的運行階段。
譜聚類源于圖論中的圖譜[15],通過建立各數據點之間的相似度矩陣,將數據聚為不同類別,具體步驟如下:
1)采用全連接法確定所有數據點之間的相似度矩陣wij,即
(5)
式中:xi,xj為任意2個數據點;σ為距離閾值,控制著樣本點的鄰域寬度,即σ越小表示樣本點與距離較遠的樣本點相似度越小。
2)確定權重矩陣W
(6)
3)確定度矩陣D為
(7)

4)確定量綱一化后的拉普拉斯矩陣L
(8)
5)計算L的特征向量和特征值,將特征值按降序排列得{λ1>λ2>…>λm},取前m個最大的特征值對應的特征向量X=[v1,v2,…,vm],其中m就是要聚成的類別個數。
6)將X量綱一化得到Y,對矩陣Y按每行為一個數據點,進行k-means聚類,其中第i行所屬類就是原來xi所屬的類。
由于滾動軸承全壽命周期共經歷4個階段,因此規定譜聚類數目為4。
處理非線性時間序列時首選具有時間步的循環神經網絡(Recurrent Neural Network,RNN),但在處理較長的時間序列時,RNN容易造成梯度消失和梯度爆炸的問題,導致更早時刻的數據在訓練過程中丟失。針對RNN的缺陷,提出如圖1所示的長短期記憶循環神經網絡,相對于循環神經網絡對系統狀態建立的遞歸計算,3個門控對LSTM單元的內部狀態建立了自循環(self loop),從而使其具有長期記憶功能。

圖1 LSTM隱藏層細胞結構Fig.1 LSTM cell structure in hidden layer
LSTM的長期記憶能力可表示為
(9)
式中:xt為當前時刻的數據輸入;ht-1為前一時刻的細胞輸出;ft為長期記憶c的遺忘比例;it為當前信息輸入到長期記憶c的比例;ot為長期記憶c輸出到當前狀態h的比例。
由(9)式可以求出當前細胞的狀態,即
(10)
則t時刻隱含層的狀態值ht為
ht=ottanh(ct) 。
(11)
規定輸入層數據為提取的遞歸熵Fo={f1,f2,…,fl},LSTM輸入層數據需滿足的格式為(樣本個數,時間步,特征個數),假定遞歸熵長度為l,時間步大小為s,特征個數為a,則總樣本個數為l-s,具體步驟如下:
1)確定訓練集樣本個數m,則訓練集數據輸入為
X={X1,X2,…,Xm},
(12)
X1={f1,f2,…,fs},
X2={f2,f3,…,fs+1},
Xm={fm,fm+1,…,fm+s-1},
若Xm為s×a的二維矩陣,則X為m×s×a的三維矩陣。
2)確定對應的理論輸出,即
Y={Y1,Y2,…,Ym},
(13)
Y1={fs+1},
Y2={fs+2},
Ym={fs+m},
若Ym為a×a的二維矩陣,則Y為m×a×a的三維矩陣。
3)確定測試集輸入數據,即
X′={X′1,X′2,…,X′n};n=l-s-m,
(14)
X′1={fm+1,fm+2,…,fm+s},
X′2={fm+2,fm+3,…,fm+s+1},
X′n={fm+n,fm+n+1,…,fm+n+s-1},
若X′n為s×a的二維矩陣,則X′為n×s×a的三維矩陣。
4)測試集對應的理論輸出為
Y′={Y′1,Y′2,…,Y′n},
(15)
Y′1={fm+s+1},
Y′2={fm+s+2},
Y′n={fm+s+n},
若Y′n為a×a的二維矩陣,則Y′為n×a×a的三維矩陣。
5)將RMS作為誤差函數,采用Adam優化器對訓練集數據進行訓練,訓練結束后對測試集數據進行測試。
結合上述理論分析,所設計的滾動軸承退化趨勢預測算法如圖2所示,具體步驟為:

圖2 滾動軸承退化趨勢預測算法流程圖Fig.2 Flowchart of rolling bearing degradation trend prediction algorithm
1)選擇合適的延遲時間和嵌入維數對原始振動信號進行相空間重構,得到滾動軸承高維相空間向量。
2)對高維相空間向量進行遞歸定量分析,計算遞歸熵、遞歸率、層流性和確定性等退化指標。
3)利用譜聚類方法對各退化指標進行時序曲線聚類,找到最能體現滾動軸承退化趨勢的退化指標。
4)譜聚類后劃分滾動軸承在運行過程中的各個狀態,選擇滾動軸承處于正常運行狀態數據。
5)將正常運行狀態的數據輸入長短期記憶神經網絡中進行滾動軸承的退化趨勢預測。
為驗證本文所提方法的有效性,采用美國辛辛那提大學NSF I/UCR智能維護系統中心提供的滾動軸承全壽命周期振動試驗數據,該試驗共安裝了4套Rexnord ZA-2115雙列圓柱滾子軸承,通過PCB353B33加速度計每隔10 min采集1次數據,采樣頻率為20 kHz,一次共采集20 480個數據。
試驗共采集3組數據集,每組數據集都包含4套軸承的振動信號,其中數據集1包含X,Y這2個方向的振動信號,數據集2和3則只包含X方向的振動信號。本文選用數據集2的1#軸承進行驗證,該數據集共有984組數據,該組試驗起始于2004-02-12T10:32:39,一直監測到2004-02-19T06:22:39,約7天,在該組試驗結束后,拆解發現軸承外圈損壞。
對984組數據進行相空間重構,畫出系統的遞歸圖,以第1組數據為例,利用互信息量法求得τ=4,利用虛假臨近點法求得m=4,標準差σ1=0.073 5,利用最大相空間尺度的10%求得遞歸閾值ε1=0.904,比例系數κ=12.3,將第1時刻的20 480個數據點分為10等份,每2 048個數據點做一次遞歸圖并求遞歸量,取10次遞歸量的平均值作為第1時刻的遞歸量。以此類推,共可求出984組遞歸量。將滾動軸承全壽命周期數據平均分為9份,觀察9類不同時刻的遞歸圖,畫出每個時刻前2 048個數據點的遞歸圖,如圖3所示。
由圖3可以看出,不同衰退程度的遞歸特征具有較明顯的差別,遞歸圖中黑色區域越大,表明動力學系統中出現的急劇或突然的變化越多。在滾動軸承的正常運行階段不會出現大面積的黑色區域,隨著滾動軸承磨損,會產生大量的沖擊信號,導致在滾動軸承最后運行階段出現大面積的黑色區域。因此,可以用遞歸量作為反映滾動軸承退化程度的退化指標。

圖3 不同時刻的遞歸圖Fig.3 Recurrence diagram at different moments
對遞歸圖進行定量分析得到4個遞歸量作為評價所選的退化指標,對各遞歸量進行灰色關聯性[16]分析,結果見表2,由表可知改進后遞歸量(利用標準差改進遞歸閾值的方法)的灰色關聯性指標均要高于改進前。因此,對改進后的遞歸量指標以及均方根、峭度進行譜聚類。

表2 各退化參數灰色關聯性Tab.2 Gray correlation of degradation parameters
選擇聚類數目m=4,距離閾值σ=0.1,譜聚類的結果如圖4、圖5所示。

圖4 時域指標譜聚類Fig.4 Spectral clustering of time-domain index

圖5 改進后遞歸量指標譜聚類Fig.5 Spectral clustering of recurrent quantity index after improvement
不同退化指標對滾動軸承全壽命周期不同退化階段的劃分見表3,其中T1~T4表示滾動軸承在不同退化階段停留的時間。

表3 退化停留時刻Tab.3 Degraded residence times
由圖4、圖5、表3綜合分析可知:均方根、峭度、確定性,層流性以及遞歸率指標均在第490個時刻附近判斷滾動軸承進入加速衰退階段。國內外的研究學者經大量試驗表明,該試驗中1#軸承的早期故障點在第530—550的時刻區間,由圖5d可見,改進遞歸熵指標判斷系統在第539個時刻進入加速衰退階段,結果更加接近真實情況。
相較于其他指標,選擇遞歸熵作為退化指標可確定該軸承的平穩階段持續時間比輕微退化階段長,符合滾動軸承的實際運行情況。對遞歸熵進行譜聚類時,在第710個時刻處遞歸熵發生突變,標志著軸承進入失效階段,而其他指標的譜聚類結果均表明軸承在第760個時刻附近進入失效階段,但此時相應指標并未發生明顯突變。雖然確定性和層流性的灰色關聯性高于遞歸熵,但在進行譜聚類時,遞歸熵能更好體現軸承的實際運行狀態,兩者結合能夠更加準確的區分軸承的運行狀態。
采用長短期記憶神經網路模型進行滾動軸承的退化趨勢預測,從圖5d可以看出該軸承在運行的第710個時刻進入失效階段,軸承已受到嚴重損壞,遞歸熵值上下波動較大,不具備實際研究意義,故刪除第710—984時刻的數據點,利用前710時刻的數據點進行研究。
時間步確定為4,特征值為遞歸熵,大小為1,一共構成706個樣本,取前682個樣本作為訓練集對模型進行訓練,后24個樣本作為測試集對模型進行驗證,采用Adam優化器,迭代訓練120次,LSTM網絡結構見表4。將LSTM模型與傳統預測模型進行對比,預測結果如圖6所示。

表4 LSTM的網絡結構Tab.4 Network structure of LSTM

圖6 各模型的退化趨勢預測曲線Fig.6 Prediction curve of degradation trend for each model
選擇均方誤差eMSE和均方根誤差eRMSE對預測結果進行評價,其表達式分別為
(16)
(17)
式中:Fi為實際值;Fp為預測值。
由表5可知,相比于其他3種網絡模型,LSTM模型的eMSE和eRMSE更低,表明LSTM模型對滾動軸承退化趨勢的預測更加有效。

表5 不同預測方法的性能比較Tab.5 Performance comparison of different prediction methods
采用相空間重構法得到滾動軸承的動力學特性并在此基礎上進行遞歸定量分析,選擇更加符合滾動軸承實際運行工況的遞歸熵作為滾動軸承的退化指標。然后,采用譜聚類方法,通過對退化指標的劃分,明確了滾動軸承的多狀態模式并去除滾動軸承失效點。最后,采用具有記憶功能的長短期記憶神經網絡對滾動軸承的退化趨勢進行預測,結果表明其預測精度要高于BP神經網絡和RBF神經網絡,證明了遞歸熵退化指標結合譜聚類及LSTM神經網絡對滾動軸承退化趨勢預測的有效性。