胡文濤,孟建軍
(蘭州交通大學 機電技術研究所,蘭州 730070)
軸承做為牽引電機的關鍵部件,其可靠性直接影響動車組運行的安全性.我國幅員遼闊,自然條件差異較大,造成動車組的運行環境惡劣,交路長,且長期交變的高頻振動和高速運轉,也會導致牽引電機軸承失效.因此,對牽引電機進行健康狀態的評估和預測是十分必要的[1].目前,已有大量的專家學者對此展開了研究,其中應用最多是基于傳統可靠性理論的評估預測方法、基于數據驅動的評估預測方法和基于物理失效的評估評估方法.可靠性理論以機械裝備在全生命周期內的失效形式以及失效機理為研究對象,利用數理統計的方法分析挖掘這些故障的演化規律,并通過故障發生的密度函數和概率等指標,來評估預測設備的健康狀態,其應用較廣,但是對于復雜系統,難以建立較為準確的模型[2].基于數據驅動健康狀態評估方法,是通過對設備全生命周期內信息的采集和處理,利用機器學習構建數據輸入和輸出的映射關系,使用預測模型取代物理模型來實現的.其評估預測精度較高,但是對于數據要求也較高,而且資金投入相對較大[3].基于失效物理的評估方法可在存儲條件下進行評估預測,而且對數據要求不高,可利用傳感器進行數據采集,尤其對損失積累造成的失效,將數據信息和模型結合,其評估預測精度更高,但是資金投入也更高,而且應用范圍較窄[4].
基于此,綜合考慮評估精度、應用范圍和資金投入,論文選取長短期記憶網絡(LSTM)對動車組牽引電機軸承的健康狀態進行評估與預測.通過采集軸承的振動信號,提取和選擇退化特征,利用特征融合算法對特征進行融合,計算最小量化誤差,并構建HI曲線.最后采用長短期記憶網絡對動車組牽引電機軸承的健康狀態進行評估與預測,驗證評估方法的合理性和準確性.
長短期記憶網絡(Long-Short Term Memory,LSTM)最早是由Hochreiter提出的,一經提出,便有很多專家學者對其進行了研究改進,目前已在許多領域得到廣泛應用.LSTM網絡實質上是一種改進的遞歸神經網絡(Recurrent Neural Networks,RNN ),其結構與RNN相似,由輸入層、隱藏層和輸出層三層網絡構成,具有一連串的鏈狀重復神經網絡模塊,所不同的是它有四層神經網絡,且以特殊的方式相互作用,而不是單個神經層,可以有效克服RNN出現梯度消亡的現象[5].
LSTM網絡中添加了三個門限結構,分別是遺忘門、輸入門和輸出門,重復模塊中包含有四個相互作用的激活函數,一個tanh函數和三個sigmoid函數,不僅解決了退化時間的關聯性,還考慮較遠信息之間依賴性的問題,其一般結構如圖1所示.其中,每條線都表示一個完整的向量,從一個節點的輸出到其他節點的輸入,線條合并表示串聯,線條分叉表示復制內容并輸出到不同的節點,σ和tanh表示門限激活函數,x表示某個時刻的輸入數據,h表示某個時刻的輸出,?和⊕表示乘法操作和向量加法,代表允許傳遞的信息量[6].

圖1 LSTM網絡結構圖Fig.1 Structure of the LSTM network
LSTM網絡信息傳遞分為正向傳遞和反向傳遞,對于正向傳遞,輸入門控制何時讓激活函數傳入存儲單元,而輸出門控制何時讓激活函數傳出存儲單元.相應的,對于反向傳遞,輸出門控制何時讓錯誤流入存儲單元,輸入門控制何時讓錯誤流出存儲單元.其傳遞可分為三個步驟,下面進行詳細介紹.
第一步:遺忘門限層,控制哪些信息從單元狀態中拋棄,其計算公式如式(1)所示[7].
ft=σ(Wf·[ht-1,xt]+bf),
(1)
式中,ft表示t時刻的值,σ表示激活函數,Wf是遺忘門連接權重矩陣,ht-1是隱含層上一個時間節點的輸出,bf是遺忘門的偏移值,xt是t時刻的輸入層的輸出.
第二步:控制單元狀態中哪些信息需要儲存,具體過程為生成臨時新狀態和更新舊狀態,生成臨時新狀態的計算公如式(2)和式(3)所示[8].
it=σ(Wi·[ht-1,xt]+bi);
(2)
(3)


(4)
第三步:控制輸出,首先通過sigmoid激活函數,控制輸出信息,再將單元狀態輸入到tanh激活函數,將值轉化到-1到1之間,再乘以sigmoid門限值,即可得到輸出.具體計算公式如式(5)和式(6)所示[9].
ot=σ(Wo?ht-1,xt」+bo);
(5)
ht=ot*tanh(Ct).
(6)
式中,ot表示輸出值,Wo表示輸出門連接權重矩陣,bo表示輸出門的偏移值.
動車組在運行過程中主要受橫向振動和垂向振動,橫向振動主要影響動車組的平穩性,垂向振動主要影響乘客的舒適性,所以,我們主要從振動特性入手,對動車組牽引電機軸承進行數據的采集和分析,用加速度來表示.而采集的方法是通過安裝在牽引電機上加速度傳感器來體現,采樣頻率為1 800 Hz,采樣間隔為5 min,共采集不同工況條件下的500組數據,每組數據1 200個點,以此作為牽引電機軸承健康狀態評估和預測的依據.
退化特征提取是進行健康狀態評估和預測的首要任務,直接影響到評估預測的準確性.由于動車組牽引電機軸承運行環境惡劣,運行時間長,載荷重,各個部件之間振動信號疊加,干擾因素較多,耦合現象嚴重;如果僅憑某一個退化特征是不能夠完全反映動車組牽引電機軸承的健康狀態,而且單一的特征很容易受動車組運行工況和環境影響的,也不能完全反映牽引電機軸承的運行狀態,因此,需要從振動信號的時域、頻域以及時頻域中提取退化特征,以便更全面地反應牽引電機軸承的健康狀態.
在動車組牽引電機軸承的全生命周期內,不同的特征對退化的敏感性和相關性影響不同.健康狀態評估時,需要退化特征能夠識別出不同健康狀態,而健康狀態預測時需要退化特征能夠反映出動車組牽引電機軸承的退化過程,所以需要選擇一些敏感的退化特征.而常用退化特征的選擇指標主要有單調性、相關性和魯棒性等,下面就這三項指標,給出詳細的定義,并以此進行特征的選取.
1) 單調性指標
單調性指標用來表示設備性能退化的一致性,取值范圍為[0,1],單調性的值越大,越接近于1,表明該特征的單調性趨勢越強.單調性指標具體定義如式(7)所示[10].
(7)

2) 相關性指標
相關性指標是用來反映退化程度和退化時間之間的相關程度,相關性指標值越大,表明相關程度越高,對于退化過程的描述也更加清楚完整,具體定義如式(8)所示[11].
Corr(X)=
(8)
式中,n為樣本數,X=(x1,x2,…,xn)為退化時間序列,T=(t1,t2,…,tN)為采樣時間序列.
3) 魯棒性指標
魯棒性通常是用來表示退化特征的穩定性,退化特征的時間序列越平滑,魯棒性越好,穩定性越好,在進行健康狀態評估與預測時不確性越小,其取值范圍[0,1],具體定義如式(9)所示[12].
(9)

為了準確體現這三項指標,現將這三項指標作為約束條件,建立線性組合方程,將問題轉化為求解多目標優化的問題,通過對每項指標賦一個權值,以此來選取敏感性較大的退化特征.建立的線性組合方程如式(10)所示[13].
(10)
式中,W為多目標優化函數,ωi=(1,2,3)為各個退化特征評價指標的權重.
在牽引電機退化過程建模時,查閱相關參考文獻[14]并結合現場工作經驗,各個退化特征評價指標的權重分別為ω1=0.5,ω2=0.2,ω3=0.3.根據式(10)可計算出各個退化特征的綜合性評價指標,最終從時域、頻域和時頻域內選取的退化特征有最大值、方差、頻率方差、平方根比率、平均幅值、標準差、平方根頻率、方根幅值、中心頻率、頻率標準差、均方根、均方頻率、均方根植和能量特征共14個退化特征[15].
采用多目標優化函數對敏感退化特征進行選取之后,還需要運用特征融合算法對選取的這些特征進行融合,生成一條能夠全面反映動車組牽引電機軸承退化狀態的健康指數(Health Indicator,HI)曲線.深度學習是智能機器數據分析研究中的一個新領域,來源于人工神經網絡,每次學習只訓練一層,將其訓練結果作為高一層的輸入,并能使用監督學習去調整所有層,對于特征的融合和降維非常合適.因此,本文借助深度學習網絡對所選取的退化敏感特征進行特征融合,并計算最小量化誤差(Minimum Quantization Error,MQE)[16].具體步驟如下:
1) 數據預處理,為了簡化計算,對上一節中選取的退化特征進行歸一化處理,使各個退化特征變為純量.
2) 定義算法公式,對于一個特征向量X=[x1,x2,…,xn]T,首先計算X與拓撲層神經元之間的歐式距離,然后以距離最小神經元為取勝神經元C,計算公式如式(11)所示[17].
(11)
式中,wij為輸入層第i神經元與拓撲層第j個神經元之間的權值向量[11].
3) 數據迭代訓練,將前300組數據作為訓練集,剩下的數據作為測試集,因為特征維數為14,所以輸入層神經元為14,輸出層維數為5×5,學習速率為0.8,訓練次數為100,以此來進行訓練.
4) 計算最小量化誤差MQE,MQE是輸入特征向量與取勝單元C之間的距離,計算公式如式(11)所示[18].
MQE=‖X-wc‖.
(12)
式中,wc為獲勝單元權值向量[13].
通過以上計算可以得出MQE,但是,這樣得到的MQE會存在大量的毛刺和干擾因素,直接作為HI進行牽引電機軸承健康狀態的評估和預測,會影響預測的準確性,所以多MQE進行db5小波分解,以低維趨勢項作為HI曲線,分解結果如圖2所示.有圖可知,牽引電機軸承的退化可分為兩個階段,在420×5 min之前退化緩慢,之后快速退化,直到失效[14].
由2.4節可知,動車組牽引電機軸承的退化分為兩個過程,在緩慢退化階段,牽引電機軸承的可靠性較高,對動車組的安全性影響不大;但是在加速退化階段,牽引電機軸承可靠性降低,會危及行車安全.因此,論文以前420組數據對LSTM網絡進行訓練,對后80組HI值的變化趨勢進行預測.
在使用LSTM網絡進行健康狀態評估與預測時,首先要對網絡參數進行設置,具體參數如下:輸入層節點為5,輸出層節點為1,學習效率為0.8,誤差為0.05,迭代次數為200,記憶單元數為5,損失函數選擇平方損失函數.并設置牽引電機軸承失效的閾值為2,對快速退化階段HI值的變化進行預測,最終預測結果如圖3所示.
由圖3可看出,隨著服役時間的推移,LSTM網絡的預測值雖然可以跟蹤真實值,但是誤差變得越來越大,預測失效時間為468×5 min,而實際失效時間為461×5 min,滯后了7×5 min.出現失效時間滯后的主要原因是誤差累計造成的,但是通過HI值,可以反映牽引電機軸承的健康狀態,也可為零件的預測性維護提供理論依據.

圖2 MQE和HI曲線Fig.2 MQE and HI curve

圖3 LSTM網絡預測結果Fig.3 Forecast results of the LSTM network
為了驗證LSTM網絡預測的性能,同時采用ANN對牽引電機軸承的健康狀態進行評估和預測,并對預測結果進行比較分析.同樣以前420組數據ANN網絡進行訓練,對后80組HI值的變化趨勢進行預測,最終預測結果如圖4所示.
由圖4可看出,使用ANN模型進行預測時,隨著時間的增加,預測值跟實際值之間的偏離程度越來越大,預測失效時間為473×5 min,而實際失效時間為461×5 min,滯后了12×5 min.
對兩種方法的預測結果進行對比分析,可發現,LSTM網絡的預測精度比ANN網絡預測精度高,預測的失效點也更加接近于實際值,因此,可得出,LSTM網絡的預測性能更優,更適合動車組牽引電機軸承健康狀態的預測和評估.

圖4 ANN預測結果Fig.4 Forecast results of ANN
本文提出了一種基于LSTM網絡的健康狀態評估預測方法,已動車組牽引電機軸承為研究對象,可以得出以下結論:
1) 基于LSTM網絡的健康狀態評估預測方法綜合考慮了評估精度、可行性和資金投入,使得該方法具有更加廣泛的適用性和經濟性.
2) 通過深度學習網絡對軸承的退化特征進行了融合和降噪,提高了評估預測的效率和精確性.
3) 將人工神經網絡的評估預測結果和LSTM的結果進行了比較分析,二者基本趨勢相同,但是LSTM的評估預測結果更加接近于真實值,說明LSTM網絡的預測性能更優,更可靠,具有良好的應用價值.