呂明珠
(1.遼寧裝備制造職業技術學院自控學院,遼寧 沈陽 110161;2.遼寧廣播電視大學,遼寧 沈陽 110034 )
滾動軸承作為旋轉機械的易損件之一,其健康狀況直接關系到整臺設備能否良性運行[1]。一般情況下,滾動軸承從投入使用到完全失效是一個逐漸演變的過程,若能及時對滾動軸承進行狀態監測和退化狀態預測,則可以有效避免重大安全事故的發生。提高軸承退化趨勢預測精度的關鍵措施在于尋找合適的退化指標及建立準確的預測模型。振動信號不僅易于采集而且可以敏感地表征滾動軸承的退化狀態,描述振動信號特征參數常用的指標有時域指標、頻域指標和時頻域指標[2],單一的指標很難全面描述軸承退化的信息,只有提取多域特征參數才能正確評價軸承非線性、非平穩性的退化過程。文獻[3]提出了一種新的多域優化算法并應用于滾動軸承故障特征提取之中。文獻[4]提出了基于多域特征及多傳感器網絡融合的滾動軸承故障診斷方法。對于多域特征參數的評估,雖然能涵蓋故障特征的大量信息,但普遍存在信息冗余、維度較高的問題。
流形學習是一種包含線性和非線性數據降維方法統稱[5]。對于軸承這種非線性特征明顯的振動信號,必須采用非線性流形學習方法進行降維。常用的非線性流形學習方法有等距特征映射法(Isometric Feature Mapping,ISOMAP)、局部線性嵌入法(Locally Linear Embedding,LLE)、t分布隨機近鄰嵌入法(T?Distribution Stochastic Neighbour Embedding,T_SNE)等,其中T_SNE不僅能保持原特征空間的拓撲結構,還能獲得良好的分類及可視化效果。
支持向量回歸(Support Vector Regression,SVR)是一種適應于小樣本、非線性、非平穩性場合的機器學習方法,其良好的泛化能力使之廣泛應用于故障診斷及性能預測領域[6]。當前很多學者主要致力于研究SVR的參數優化問題[7~9],而對如何加強突變點的學習沒有太多考慮。這里依據軸承的不同退化階段,在標準SVR的基礎上引入權函數,搭建自適應加權支持向量回歸(Adap‐tive Weighted Support Vector Regression,AW?SVR)模型,使其增強對突變點的學習能力,實現對軸承退化狀態的預測。
這里提出了基于T_SNE和AW?SVR的狀態預測方法,充分發揮了多域特征提取在特征評估、T_SNE在維度約簡、AW?SVR在狀態預測方面各自的優勢,取得了良好的預測效果。
T_SNE算法是在SNE基礎上由Hinton于2008年提出的一種降維方法[10],目的是為了解決SNE算法的不對稱問題和投影到低維空間的擁擠問題。T_SNE算法屬于非線性流行學習方法,它能幫我們將高維數據映射到2維或3維空間同時實現可視化展示,能為后續的機器學習提供依據。
T_SNE算法的基本思想是在低維空間構造一個與原數據空間相似的概率分布,這意味著在高維空間相距較近的數據點,其映射點會相互吸引;而在高維空間相距較遠的數據點,其映射點會相互排斥。當這種親疏關系達到平衡時,即得到最終的映射。
設原高維空間的數據樣本為X(x1,x2,…,xN)∈Rn,對應的低維空間樣本為Y(y1,y2,…,yN)∈Rd(d< 定義原數據空間的兩點xi和xj的條件概率為pj|i,如式(1)所示。 式中:σi—以xi為中心的高斯方差,通過事先設定的復雜度因子(perplexity)經二進制搜索算法確定。 設原數據空間的聯合概率為: 式中:pij—數據間的親疏度。 在低維空間中采用自由度為1的t—分布表示映射點yi和yj之間的親疏度,如式(3)所示。 為使qij盡可能與pij接近,需要借助最小化兩個分布P和Q之間的KL(Kullback?Leiber)散度(損失函數)來實現,記為c。 c的梯度可由式(5)計算: 根據式(6)梯度下降法尋優迭代: 式中:η—學習率;α(t)—第t次迭代的動量參數。 循環迭代(3)~(5)步,直到t從1到最大迭代次數T,得到低維樣本數據y(T)={y1,y2,…,yN} 。 T_SNE 算法利用t分布的長尾特性緩解了降維后各類數據點擁擠問題,使用聯合概率分布替代條件概率解決了SNE的不對稱問題,達到了良好的可視化效果。 支持向量機(SVR)是基于結構風險最小化的預測方法,在訓練時剔除了數據樣本中的突變點和奇異點,雖然回歸曲線有較好的平滑性但是卻加大了那些突變故障被錯分的概率,因此在訓練時需要對突變點賦予較大的權值,加強對對突變點的訓練力度,提升SVR對突變點的學習能力,從而提高對突變故障的預測準確度。 假設某個給定訓練樣本中包含m個樣本點,記為S={(xi,yi) |i=1,2,…,m} 。通過非線性映射在高維空間中構造一個線性回歸函數: 式中:αi和α*i—拉格朗日乘子;b—截距;k(xi,x)—核函數,通常采用徑向基核函數。 式中:g—核參數。 在標準SVR中,每一個樣本點都具有相同的權值,而自適應加權支持向量回歸機(AW?SVR)對于不同的數據點訓練的權重是不同的,在訓練中增加了對突變樣本點的懲罰程度,提高了對突變故障點的跟蹤能力,防止在故障預測中發生漏判的問題,算法,如式(9)所示。 式中:ω(i)—第i個樣本點的權值函數;C—懲罰因子;ξi與ξi*—松弛變量;ε—線性ε不敏感損失函數的參數。 給定SVR的參數以及最大迭代次數T,設t為當前迭代次數(t=1,2,…,T),ω(t)(i)代表第i個樣本經t次學習后獲得的權值。循環開始時,設m個樣本點的初始權值相等,則ω(1)(i)=1m。 根據第t次學習的回歸函數f(t)(xi)計算錯誤率,并令e(t)=若e(t)>1/2,則退出循環。 令β(t)=log[(1 ?e(t)) 2e(t)],并通過式(10)實現權值函數自適應更新。 ω(t+1)(i)=ω(t)(i)× 式中:δ—最大允許誤差的門限值,δ>0。 循環結束后,得到最終的回歸函數,如式(11)所示。 通過加大對回歸擬合曲線有重要影響的突變點的權值,增強對此類突變點的訓練強度,從而提高預測精度。 對于漸進退化的滾動軸承,基于T_SNE和AW?SVR的退化狀態預測流程,如圖1所示。 此項主要通過對比相同沖擊在采取不同貨幣政策規則下對于產出變化的歷史貢獻。首先對比同一外生沖擊的不同文獻,可以發現相同的外生沖擊在不同的貨幣政策規則下會對產出變化造成一定程度的影響,但要注意的是這個影響是有限的,不會對產出變化的根本趨勢造成影響。第二,在利率規則下出現的外生沖擊對產出變化歷史貢獻的波動幅度相較于數量規則下更為明顯,這說明了相較于利率規則環境下,數量規則下的各個外生沖擊對產出波動的貢獻更小。從側面也能說明數量規則能夠更為有效抑制存在多個外生沖擊下,單個沖擊對于產出波動的影響。第三,兩種貨幣政策規則下,數量規則和利率規則在不同歷史時期對于產出變化的歷史貢獻具有相似性。 圖1 退化狀態預測流程圖Fig.1 Flowchart of Predicting Degradation State 離線階段: (1)全壽命振動信號,進行時頻域特征提取; (2)應用T_SNE進行維數約簡獲取2維退化指標; (3)結合歷史數據劃分退化階段; (4)訓練最優AW?SVR模型。 在線階段: (1)采集當前振動信號,進行時頻域特征提取; (2)應用T_SNE進行維數約簡獲取當前2維退化指標; (3)把當前退化指標輸入訓練好的模型,預測軸承當前的退化階段和退化趨勢。 這里采用辛辛那提大學智能維護中心[11]提供的滾動軸承全壽命數據來驗證所提方法的有效性。實驗臺裝置示意圖,如圖2所示。 圖2 實驗裝置示意圖Fig.2 The Test Equipment 實驗臺簡單描述如下:4個Rexnord ZA?2115雙列滾子軸承并列安裝在同一轉軸上,驅動力來自交流電機及帶傳動,轉速為2000r/min,實驗過程中在軸承上施加26.67kN 的徑向載荷,PCB 353B33加速度傳感器收集來自軸承的振動信號,數據采集卡的型號為NI DAQ?6062E每隔10min采集一次,采樣頻率為20kHz,采樣點數為20480點,以軸承1作為測試軸承,運行時間約164h后出現外圈嚴重故障而失效,共984組數據。 對軸承1的振動數據提取時域和頻域綜合指標,主要包括有量綱的時域特征如均方根值、方根幅值、絕對平均值、偏斜度、峭度、方差、最大值、最小值、峰峰值,無量綱的時域特征如波形指標、峰值指標、峭度指標、脈沖指標;頻域特征如均方根頻率、頻率標準差,各指標的表達式見參考文獻[12]。此外,還對振動數據進行了以“db5”為基底的3層小波包分解,得到8個分量的小波包能量熵,總計23個統計指標作為滾動軸承的原始特征集,形成984×23維的高維特征向量矩陣。 為了便于分析和比較,對所得的特征向量矩陣按式(12)進行歸一化處理。 式中:xscale—歸一化之后的數據;x—原始數據。 有效值(RMS)能反映出軸承的振動幅值隨時間緩慢變化的趨勢,當軸承發生故障時,RMS會隨著故障程度的加深而顯著增加,因此常用作軸承故障識別的重要指標,其定義,如式(13)所示。 式中:x(i)—振動信號序列,i=1,2,…,n為點數。 然而,即使在相同的工況下,軸承因個體差異而使有效值(RMS)相距較大。因此,取相對有效值(RRMS)更有利于對軸承的全壽命數據進行階段劃分,其定義,如式(14)所示。 式中:xbase—正常狀態下的有效值均值。 文獻[13]定義相對有效值(RRMS)取1.1 和3.0 作為軸承退化階段的起始閾值和失效閾值,文獻[14]指出當軸承狀態類別劃分為5個類別時,可以使支持向量機的識別率達到最優,采用7點3次平滑處理法[15]對RRMS曲線進行預處理后(采用平滑處理法的目的是減少隨機振動的影響,增加曲線的光滑度),如圖3所示。 圖3 基于相對有效值的退化階段劃分Fig.3 Degradation Stage Classification Based on Relative Effective Value 由圖3的相對有效值(RRMS)變化曲線可知,軸承1在543號數據之前為正常狀態,在(543~698)號數據之間為輕度退化狀態,此時相對有效值開始緩慢上升;在(699~789)號數據之間為中度退化狀態,此時相對有效值呈振蕩趨勢;在(790~963)號數據之間為重度退化狀態,此時相對有效值迅速攀升;964號數據以后軸承1處于完全失效狀態。 由于當軸承失效后再做故障預測已失去實際意義,故只針對前4個階段(正常狀態、輕度退化、中度退化、重度退化)的RRMS狀態進行預測。 對4種退化狀態每種狀態抽取50組樣本,每組按4.1節所述提取23個特征值,組成(200×23)維的原始特征向量矩陣。由第2節所述,采用T_SNE算法進行維度約簡,為增加可視化效果,將維度約簡至2維,故約簡后的特征向量為(200×2)維。將結果與等距特征映射(ISOMAP)、局部線性嵌入法(LLE)等常用的流行學方法進行對比,三種方法降維后得到的二維分布圖,如圖4所示。 圖4 三種流行學習算法的二維分布圖Fig.4 2D Manifold Diagrams of Three Algorithm 從圖4(a)中明顯看出,采用T_SNE算法進行降維后4個階段的二維特征得到了很好的分離,沒有混淆現象。而從圖4(b)可以看出,采用ISOMAP算法降維后,前3個階段的特征分布完全混疊。從圖4(c)可以看出,采用LLE算法降維后,4個階段的特征也有交叉現象。 由此可知,T_SNE算法比ISOMAP算法和LLE算法更能有效挖掘樣本間的低維敏感特征,有利于下一步的退化狀態預測。然后,將經T_SNE 降維后得到的(200×2)低維特征向量集作為輸入,取前160 個樣本對AW?SVR 模型進行訓練,結合遺傳算法(GA)對SVR的懲罰因子C和核函數參數g進行優化,GA參數中最大種群數和最大進化代數分別為20和200,懲罰因子和核函數參數的范圍均為(0,100),得到最佳C和g為(66.7219,0.1760)。設置權函數的最大迭代次數T=20,門限值δ=0.01。 取樣本集的后40組樣本作為測試集,輸入已經訓練好的回歸模型中進行預測,并與ISOMAP、LLE 和T_SNE 算法結合標準SVR的預測結果進行對比,如圖5所示。 圖5 四種預測模型的結果Fig.5 The Results of Four Prediction Model 從圖5(a)中可以看出,由于ISOMAP降維后各階段的樣本沒有很好地分離,導致經標準SVR預測后的效果比較差。沒有對退化過程的各個階段進行準確的預測,且預測結果的波動性較大。 圖5(b)雖然可以預測出正常狀態和輕度退化狀態的趨勢,但是對于中度和重度兩個階段的退化狀態不能很好的預測,也不能體現真實值的波動趨勢,這將造成軸承失效狀態的漏判。 圖5(c)中可明顯看出,對于處于正常階段和輕度退化階段的軸承,預測結果與實際退化狀態比較接近,這是因為此時的RRMS曲線波動并不強烈,突變點較少,但隨著軸承逐漸進入中度退化階段,由于軸承運行的非平穩性,RRMS曲線含有的突變點越遠越密集,標準SVR 回歸函數的平滑作用減弱了訓練樣本中的突變數據對當前預測值的影響,從而導致對突變點的預測精度不高,同樣會導致軸承失效時的漏判。 圖5(d)是采用AW?SVR對樣本進行一步預測的結果,由于該算法每一次迭代訓練時都能對回歸誤差較大的突變點賦予更大的權值,使之在下一次迭代中增加訓練力度,從而對突變故障取得了較好的預測效果,基本上能保證軸承各個階段的預測值與真實的退化狀態保持一致,在軸承的實際退化指標達到失效閾值時能夠及時發出故障預警,避免安全事故。 如表1所示,選取了均方根誤差(RMSE)、平均絕對值百分比誤差(MAPE)和相關系數(R2)作為預測結果的評價指標,其中均方根誤差和平均絕對值百分比誤差用來帶票預測精度,其值越小說明預測值與真實值差距越小,預測精度越高;而相關系數用來代表趨勢預測的好壞,其值越接近于1說明預測趨勢與真實情況越接近。通過對比可知,T_SNE+AW?SVR預測測模型的綜合指標均明顯高于其他模型,說明這里所提方法更適合于預測滾動軸承的退化狀態。 表1 4種模型的預測性能比較Tab.1 Prediction Performance Comparison of Four Models 根據以上實驗結果的分析對比,T_SNE 降維方法能夠更好地挖掘軸承低維退化敏感信息,增加不同退化階段的辨識度;AW?SVR 模型在含有突變點的狀態預測上有非常突出的表現,將兩者結合使預測結果更優。 這里首先介紹了T_SNE的降維方法,得到軸承在不同退化階段的二維特征指標;其次構建自適應加權支持向量回歸對滾動軸承的退化狀態進行預測;最后通過實驗對比,驗證了這里所提方法的優越性。(1)T_SNE克服了ISOMAP 和LLE方法在降維時的交叉和混疊現象,使約簡后的特征融合了更加豐富的故障信息。(2)采用相對有效值(RRMS)將軸承的全壽命運行狀態劃分為有預測意義的4個階段,可以避免因軸承個體差異不同造成的有效值相距較大的問題。(3)AW?SVR在標準支持向量機的基礎上引入權函數,并使之隨著數據點對預測結果的影響強弱不同自適應地賦予不同的權重,增強了SVR對突變點的學習能力。(4)基于T_SNE和AW?SVR 相結合的方法能更清晰、更全面地反映軸承的衰退狀態,能有效識別出軸承狀態變化的突變點,在退化狀態預測上獲得的結果更加準確。





3 自適應加權支持向量回歸機





4 滾動軸承退化狀態預測流程

5 實驗驗證

5.1 特征提取

5.2 退化階段劃分



5.3 模型構建

5.4 結果分析


6 結論