姜戰(zhàn)偉, 鄭近德, 潘海洋, 潘紫微
(安徽工業(yè)大學(xué) 機(jī)械工程學(xué)院,安徽 馬鞍山 243032)
基于多尺度時不可逆與t-SNE流形學(xué)習(xí)的滾動軸承故障診斷
姜戰(zhàn)偉, 鄭近德, 潘海洋, 潘紫微
(安徽工業(yè)大學(xué) 機(jī)械工程學(xué)院,安徽 馬鞍山 243032)
為了精確地提取機(jī)械振動信號的非線性故障特征,提出了一種新的振動信號復(fù)雜性測量方法——多尺度時不可逆。同時結(jié)合t-分布鄰域嵌入(t-SNE)流形學(xué)習(xí)和粒子群優(yōu)化-支持向量機(jī)(PSO-SVM),提出了一種新的滾動軸承故障診斷方法。采用多尺度時不可逆提取復(fù)雜振動信號的特征信息;利用t-SNE對高維特征空間進(jìn)行降維;將低維特征向量輸入到基于PSO-SVM多故障模式分類器中進(jìn)行識別與診斷。將提出的方法應(yīng)用于試驗數(shù)據(jù)分析,并與現(xiàn)有方法進(jìn)行了對比,分析結(jié)果表明,該方法不僅能夠有效地診斷滾動軸承的工作狀態(tài)和故障類型,而且優(yōu)于現(xiàn)有方法。
多尺度時不可逆;t-分布鄰域嵌入;支持向量機(jī);滾動軸承;故障診斷
滾動軸承的振動信號往往是非平穩(wěn)、非線性的復(fù)雜信號,從振動信號中提取非線性特征信息是滾動軸承故障診斷的關(guān)鍵。對于非線性系統(tǒng)產(chǎn)生的時間序列,與分形特征類似,復(fù)雜性已成為時間序列的一個基本屬性。許多衡量機(jī)械動力學(xué)系統(tǒng)的非線性時間序列復(fù)雜性的方法,如K熵,近似熵[1-2]、樣本熵[3-4]、排列熵[5-6]和模糊熵[7-8]等陸續(xù)被提出,并被應(yīng)用于機(jī)械振動信號復(fù)雜性特征的提取。如Cui等[2]通過提取振動信號經(jīng)局域波分解后的近似熵來反映滾動軸承故障的復(fù)雜性特征變化;Zhu[4]通過提取經(jīng)驗?zāi)B(tài)分解后本征模態(tài)函數(shù)的包絡(luò)樣本熵,實(shí)現(xiàn)了滾動軸承的故障診斷;Zheng等[9]將局部特征尺度分解與模糊熵結(jié)合,提取滾動軸承的故障特征信息等,都取得了不錯的效果。
但是,基于熵的算法只能通過測量重復(fù)模式的出現(xiàn)(模板匹配)來反映時間序列的規(guī)則度,即復(fù)雜性的損失表明有較大的周期性[10]。因此隨著隨機(jī)程度增大而單調(diào)增高。然而,研究發(fā)現(xiàn),規(guī)則度和復(fù)雜度之間并沒有直接的一一對應(yīng)關(guān)系,復(fù)雜度伴隨著更豐富的結(jié)構(gòu)[11]。因此,那些賦予不相關(guān)隨機(jī)信號高值的算法并不能真實(shí)反映非平衡系統(tǒng)根本的動力學(xué)特征。
為了避免熵測量的上述不足,文獻(xiàn)[12-14]提出了時不可逆(Time Irreversibility, TI)算法。TI是指信號在時間序列反向操作下,其缺乏統(tǒng)計特征的不變性[12-17]。換言之,信號在時間反向操作下如果其統(tǒng)計特性是不變的,則信號的時間序列具有可逆性,它提供了一種有效的方法來測量非平衡系統(tǒng)的復(fù)雜度和反映時間序列的方向性[18]。由于TI評價指標(biāo)有多種,選擇合適的指標(biāo)提取時間序列的不可逆性特征非常重要。Porta’s指標(biāo)和Guzik’s指標(biāo)具有很好的統(tǒng)計特性[19-21],可以組合評價時間序列不對稱性。論文在對時間序列多尺度化的基礎(chǔ)上,同時結(jié)合多尺度思想,提出了基于上述指標(biāo)的多尺度時不可逆(Multiscale Time Irreversibility, MSTI),用來提取時間序列在不同尺度下復(fù)雜性信息。
論文考慮將MSTI用于滾動軸承故障振動信號的特征信息提取。由于原始時間序列在進(jìn)行粗粒化提取不對稱特征時故障特征維數(shù)過高,很多有效信息被淹沒,難以被有效利用。因此,需要采用合適的方法對高維數(shù)據(jù)進(jìn)行降維。流形學(xué)習(xí)是一類借鑒了拓?fù)淞餍胃拍畹慕稻S方法,分為線性流形學(xué)習(xí)算法和非線性流形學(xué)習(xí)算法。在實(shí)際情況下,高維數(shù)據(jù)往往具有非線性結(jié)構(gòu),許多非線性流形學(xué)習(xí)算法,如等距映射(Isometric Mapping, Isomap)[22],Sammon映射(Sammon mapping)[23]、局部線性嵌入(Locally-linear Embedding,LLE)[24]等非常適合處理這類信號。最近,文獻(xiàn)[25]提出了一種深度學(xué)習(xí)的非線性流形學(xué)習(xí)算法——t-分布鄰域嵌入算法(t-Distributed Stochastic Neighbor Embedding,t-SNE)[25-28],并且得出了t-SNE在降維效果上要優(yōu)于Isomap、Sammon mapping和LLE的結(jié)論。因此,論文考慮將t-SNE應(yīng)用于滾動軸承故障特征的降維。
基于上述分析,提出了一種基于MSTI、流形學(xué)習(xí)t-SNE降維算法和粒子群優(yōu)化-支持向量機(jī)(Particle Swarm Optimization-Support Vector Machine, PSO-SVM)[29-30]的滾動軸承故障診斷新方法。將提出的方法應(yīng)用于仿真和滾動軸承試驗數(shù)據(jù)分析,結(jié)果表明,論文提出的方法能夠成功診斷滾動軸承故障的不同狀態(tài),是一種有效的故障診斷方法。
1.1多尺度時不可逆算法

(1)
式中:τ表示尺度因子。對于尺度(τ=1),時間序列{y1}就是原始時間序列,對于給定的τ,原始時間序列被分割成長度為N/τ的粗粒化序列。
通過計算粗粒化時間序列{yτ}兩個臨近點(diǎn)之間的差(yτ(k+1)-yτ(k))來獲得相應(yīng)Δyτ的序列。由于不對稱序列增加的量(Δyτ>0)等于減少的量(Δyτ<0)。有如下三個指標(biāo)來測量不對稱性。
(1) Porta’s指標(biāo),該指標(biāo)基于估計Δy≠0的總數(shù)中Δy(Δy-)小于0的百分比。計算式為

(2)
該指標(biāo)范圍為從0到100。不對稱指標(biāo)P%>50說明Δy-的量比Δy+多。
(2) Guzik’s指標(biāo),該指標(biāo)基于估計所有Δy的累加平方值中正的Δy(Δy+)的平方和的百分比。表達(dá)式為

(3)
該指標(biāo)范圍為從0~100。不對稱指標(biāo)G%>50說明|Δy+|的平均量比|Δy-|大,而且Δy的分布偏向正值。
(3) Costa’s指標(biāo),該指標(biāo)根據(jù)式(4)估計增量和減量百分比之間的差:

(4)
式中:H是Heaviside函數(shù)(當(dāng)a≥0時,H(a)=1;當(dāng)a<0時,H(a)=0),當(dāng)A=0時,時間序列是對稱的。否則,A偏離0越大,相應(yīng)的時間序列越不可逆。
但是Costa’s指標(biāo)可以表示為:A=P--P+=2P-1,這里,P-=P%/100。所以本文只考慮Porta’s指標(biāo)和Guzik’s指標(biāo)。然而,通過單一尺度數(shù)量化多尺度不對稱是不合適的,所以通過分別計算每一尺度的P%和G%的平均值作為多尺度不對稱。
(5)
(6)
式中,L表示最大尺度。
根據(jù)Pm%和Gm%的定義可知,Pm%或Gm%偏離50越大,相應(yīng)的時間序列越不可逆。然而,當(dāng)Pm%=50和Gm%=50說明相應(yīng)的序列是時對稱的。
對于一系列時間尺度,計算各個尺度的不對稱值的總和,就可以定義多尺度不對稱指標(biāo)AI
(7)
多尺度時不可逆指標(biāo)算法步驟如下:
(1) 對于有限頻率的采樣時間序列{x1,x2,…,xi,…,xN},1≤i≤N。對于給定的尺度因子τ=1,2,…,L,根據(jù)式(8)

(8)
構(gòu)造粗粒時間序列;

(3) 根據(jù)式(9)計算各個尺度的不對稱值的總和作為多尺度時不對稱指標(biāo)AI。
(9)
MSTI通過衡量多重尺度時間序列的時不可逆特性,提供了一種新的途徑來測量非平衡系統(tǒng)在不同尺度下的復(fù)雜度。很適合處理由于軸承在剛度、摩擦和載荷條件等發(fā)生瞬態(tài)變化時引起機(jī)械系統(tǒng)產(chǎn)生的非線性、非平穩(wěn)振動信號。
1.2仿真信號分析
為了直觀地觀察多尺度時不可逆分析效果,分別對高斯白噪聲與1/f噪聲進(jìn)行多尺度時不可逆仿真分析。兩者的數(shù)據(jù)長度都為5 000,尺度L取20。圖1(a)和(b)分別為高斯白噪聲波形和1/f噪聲波形,圖2為高斯白噪聲和1/f噪聲的多尺度時不可逆測量,由多尺度時不可逆知,在確定某個尺度下,其不對稱值離零點(diǎn)越近,則在該尺度下越具有對稱性,反之,不對稱值離零點(diǎn)越遠(yuǎn),則在該尺度下越不具有對稱性。且從圖2 中看出,白噪聲不可逆值幾乎所有尺度都在50附近,而1/f噪聲隨著尺度因子的增大逐漸遠(yuǎn)離50,這說明了高斯白噪聲對稱性較強(qiáng),所包含的信息較少,結(jié)構(gòu)較簡單。而1/f噪聲時不對稱性較強(qiáng),所包含的狀態(tài)信息比高斯白噪聲信號要復(fù)雜的多,結(jié)構(gòu)較復(fù)雜。
滾動軸承的振動信號往往是非平穩(wěn)和非線性的復(fù)雜信號,正常滾動軸承的振動信號是復(fù)雜的隨機(jī)振動,當(dāng)滾動軸承發(fā)生故障時,振動出現(xiàn)規(guī)律和周期性的摩擦或沖擊,這導(dǎo)致機(jī)械系統(tǒng)振動的對稱性增加,時不對稱性降低。對于不同的故障類型和故障程度,引起的摩擦和沖擊的頻率和幅度不同,相應(yīng)地振動信號的復(fù)雜性也不同。MSTI具有非平衡系統(tǒng)的基本性質(zhì),因此,非常適合處理非平穩(wěn)、非線性振動信號。在得到振動信號的MSTI故障特征之后,由于特征向量的維數(shù)較多,直接用分類器進(jìn)行模式識別,不但影響分類效率,而且高維數(shù)據(jù)掩蓋了有效信息。因此,采用t-SNE流形學(xué)習(xí)算法對特征向量矩陣進(jìn)行降維,挖掘出具有內(nèi)在規(guī)律的低維向量矩陣。為了實(shí)現(xiàn)智能診斷,采用訓(xùn)練速度快,適合小樣本分類的支持向量機(jī)進(jìn)行模式識別,然而支持向量機(jī)的分類結(jié)果往往受到懲罰因子c和核函數(shù)參數(shù)g的影響較大,所以有必要對支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化。粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種基于群體智能的演化計算技術(shù),通過粒子在解空間搜尋最優(yōu)值達(dá)到尋優(yōu)的目的,而且能夠得到全局最優(yōu)解,很適合對參數(shù)進(jìn)行優(yōu)化。利用PSO算法對SVM中的c和g進(jìn)行優(yōu)化,建立基于PSO-SVM的多類模式分類器。因此,將降維后的低維特征向量矩陣輸入基于PSO-SVM的多類模式分類器進(jìn)行模式識別。

(a) 高斯白噪聲波形

圖2 高斯白噪聲和1/f噪聲的不對稱指標(biāo)
2.1t-SNE流形學(xué)習(xí)算法
t-SNE流形學(xué)習(xí)算法是一種深度學(xué)習(xí)的非線性流形學(xué)習(xí)算法,它可以有效地實(shí)現(xiàn)高維數(shù)據(jù)的可視化降維。t-SNE主要基于如下思想:如果兩個數(shù)據(jù)點(diǎn)在原始空間中距離較近,但它們的兩個映射點(diǎn)距離較遠(yuǎn),它們就會相互吸引;當(dāng)它們的兩個映射點(diǎn)距離較近,則他們會相互排斥。當(dāng)達(dá)到平衡時得到最后的映射,完成原始高維空間與低維映射空間之間的映射關(guān)系。
在t-SNE算法中代價函數(shù)的使用不同于SNE,主要在兩個方面:① t-SNE使用簡化梯度的對稱SNE代價函數(shù);② 它使用t-學(xué)生分布代替高斯分布來計算低維空間兩點(diǎn)間的相似性。t-SNE利用在低維空間的重尾分布來減緩SNE的聚集和優(yōu)化問題。
t-SNE算法步驟如下:
(1) 由原始數(shù)據(jù)序列X={x1,x2,…,xn},根據(jù)式(10)計算復(fù)雜度Perp親疏對Pj|i,其中復(fù)雜度Perp為代價函數(shù)參數(shù)。

(10)
式中,σi是數(shù)據(jù)點(diǎn)xi的高斯方差。

(3) 根據(jù)式(11)計算低維親疏qij

(11)

(12)
(5) 根據(jù)式(13)得到低維數(shù)據(jù)

(13)
式中:學(xué)習(xí)率η,動量α(t)為優(yōu)化參數(shù)。
(6) 迭代循環(huán)(3)~(5),直到t從1到T,最后得到低維數(shù)據(jù)y(T)={y1,y2,…,yn}。
t-SNE是一種深度學(xué)習(xí)非線性降維算法,能夠從高維數(shù)據(jù)中恢復(fù)低維流形結(jié)構(gòu),即找到高維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實(shí)現(xiàn)維數(shù)約減與數(shù)據(jù)可視化。
2.2.1 基于MSTI、t-SNE和PSO-SVM的滾動軸承故障診斷方法
基于MSTI、t-SNE流形學(xué)習(xí)和PSO-SVM的滾動軸承故障診斷方法步驟如下:
(1) 假設(shè)滾動軸承的運(yùn)行狀態(tài)包含K種類型,每種狀態(tài)采集N組樣本;
(2) 提取每類原始振動信號的MSTI,每組樣本得到τ個時不可逆特征值,組成高維特征向量集:RN×τmax,τmax是MSTI算法中最大尺度因子,一般取20;
(3) 采用t-SNE流形學(xué)習(xí)算法對高維特征向量矩陣進(jìn)行降維,設(shè)定參數(shù),通過特征降維,得到低維敏感特征集:RN×i。
(4) 每種狀態(tài)各取N/2組組成訓(xùn)練樣本,將訓(xùn)練樣本輸入到基于PSO-SVM多類模式分類器進(jìn)行訓(xùn)練;
(5) 其余的作為測試樣本,用訓(xùn)練好的PSO-SVM對測試樣本進(jìn)行分類,根據(jù)PSO-SVM分類器的輸出結(jié)果確定滾動軸承的工作狀態(tài)和故障類型。
2.2.2 實(shí)驗驗證
為了驗證本文所提出方法的有效性,將其應(yīng)用于試驗數(shù)據(jù)分析。試驗數(shù)據(jù)采用美國Case Western Reserve University的滾動軸承試驗數(shù)據(jù)[31]。測試軸承為6205-2RSJEM SKF深溝球軸承,使用電火花加工技術(shù)在軸承上布置單點(diǎn)故障。考慮轉(zhuǎn)速1 730 r/min、負(fù)載3HP條件下正常以及轉(zhuǎn)速1 730 r/min、負(fù)載3HP條件下,故障直徑大小與深度分別為0.177 8 mm和0.279 4 mm的外圈、內(nèi)圈和滾動體故障的滾動軸承振動信號。采樣頻率為12 kHz,采集到具有局部單點(diǎn)點(diǎn)蝕的內(nèi)圈(Inner Race Fault, IRF)、外圈(Outer Race Fault, ORF)、滾動體故障(Ball Element Fault, BEF)和正常(Normal,NOR)四種狀態(tài)的振動信號,每種狀態(tài)取29組數(shù)據(jù),每組數(shù)據(jù)長度為4096,四種狀態(tài)軸承的振動信號時域波形如圖3所示,由于背景環(huán)境的影響,從時域波形上很難區(qū)別四種狀態(tài)。將提出的方法應(yīng)用于實(shí)驗數(shù)據(jù)分析,具體步驟與分析如下:
首先提取每類振動信號的MSTI,每種狀態(tài)取29組樣本,每組樣本得到20個特征值,四種狀態(tài)共得到116組樣本,組成原始特征向量矩陣:R116×20,其中,τmax取20。
各狀態(tài)的多尺度Gm%和Pm%值如圖4(a)和(b)所示,在圖(a)中,在各個尺度下三種故障的Gm%值差別很明顯,而且外圈故障的Gm%值隨著尺度的增加先增大后減小,在大尺度時穩(wěn)定在50以上,這說明|Δx+|的平均量級比|Δx-|大;滾動體故障的Gm%值隨著尺度的增加一直減小,最后在大尺度時穩(wěn)定在50以下,說明|Δx+|的平均量級比|Δx-|小;內(nèi)圈故障的Gm%值隨著尺度的增加幾乎穩(wěn)定在50,說明|Δx+|的平均量級和|Δx-|相當(dāng);而圖(b)中,在各尺度下內(nèi)外圈故障幾乎無法區(qū)分且Pm%都維持在50附近,而滾動體故障的Pm%在各尺度下都在50以下。
從圖4(a)和(b)中看出,正常滾動軸承的Pm%和Gm%值在小尺度因子時,遠(yuǎn)離其值50%,隨著尺度因子增加,逐漸靠近不對稱值50%,最后穩(wěn)定在50以下,這說明了當(dāng)滾動軸承發(fā)生故障時,由于周期性脈沖減弱了故障振動信號的不對稱性,越靠近Pm%和Gm%值的50%,其不對稱性越弱,時間序列在反向操作時,其統(tǒng)計特征越具有不變性。單尺度不能夠區(qū)別故障之間的內(nèi)在對稱特征,只有當(dāng)進(jìn)行多尺度化時,故障之間的對稱性特征的差別才能夠充分表現(xiàn)出來。正常滾動軸承具有較強(qiáng)的不對稱性,但由于粗粒化時采取的是線性光滑化和原始時間序列的提取,這導(dǎo)致僅僅捕獲粗尺度上的低頻成分,損失了細(xì)尺度上的高頻成分,而高頻成分往往包含了更多的時不可逆特征信息,這導(dǎo)致隨著尺度的增加,對稱性增強(qiáng)。




圖3 四種狀態(tài)軸承振動信號的時域波形
Fig.3 Time domain waveform of the vibration signals of 4 kinds of state bearings (from top to bottom: NOR, ORF, IRF, BEF)

(a) 指標(biāo)

(b) 指標(biāo)
正常軸承和故障軸承的多尺度Gm%和Pm%值曲線及以上分析說明:正常軸承振動信號時不可逆性較強(qiáng),結(jié)構(gòu)較復(fù)雜;而故障軸承振動信號時不可逆性較弱,結(jié)構(gòu)較簡單,這類似于1/f噪聲信號和白噪聲信號。
各類29組樣本的不對稱性指標(biāo)如圖5所示,從圖5中可以看出,正常滾動軸承振動信號的不對稱指標(biāo)大于故障軸承振動信號的不對稱指標(biāo),內(nèi)圈故障的不對稱指標(biāo)幾乎關(guān)于原點(diǎn)對稱,外圈和滾動體故障的不對稱指標(biāo)偏離原點(diǎn),但仍然在原點(diǎn)附近。此外,29組正常滾動軸承振動信號的不對稱指標(biāo)為AI=-0.696 9±0.086 9(均值標(biāo)準(zhǔn)差),外圈故障振動信號的不對稱指標(biāo)為AI=0.474 8±0.076 1,內(nèi)圈故障振動信號的不對稱指標(biāo)為AI=0.030 6±0.106 9,滾動體故障振動信號的不對稱指標(biāo)為AI=-0.432 3±0.067 3。從各類時不對稱量化指標(biāo)可知,正常滾動軸承比故障軸承振動信號的時不對稱指標(biāo)顯著地高,外圈故障比內(nèi)圈和滾動體故障振動信號時不對稱指標(biāo)高,滾動體故障比內(nèi)圈故障軸承振動信號時不對稱指標(biāo)高,這說明了正常滾動軸承振動信號在時間序列反向操作下其統(tǒng)計特性可變性較強(qiáng),而故障滾動軸承振動信號的時不可逆性較弱,進(jìn)一步說明了正常滾動軸承比故障滾動軸承的振動信號復(fù)雜的多,從不對稱量化指標(biāo)也可知三種故障之間的區(qū)分也比較明顯。這也符合一般性的概念,通過多重時間尺度可知,時不可逆會隨著故障的發(fā)生而降低。

圖5 正常軸承、外圈故障、內(nèi)圈故障和滾動體
Fig.5 Asymmetry index of normal bearing, outer race fault, inner race fault and rolling element fault
以上分析說明了隨著尺度的增加時間序列的長度不斷減少,在序列長度太短時導(dǎo)致時不可逆性的損失,即在時間序列反向操作下,其缺乏統(tǒng)計特征的可變性。所以正常滾動軸承的值Gm%和Pm%值會隨著尺度的增加而逐漸趨向50。而且在衡量序列時不可逆Gm%值比Pm%值區(qū)分故障振動信號效果更好。
為了說明t-SNE方法進(jìn)行特征降維的必要性和優(yōu)越性,將其與Isomap方法、Sammon mapping方法進(jìn)行對比,三者降維后得到的樣本二維和三維分布圖如圖6所示。從圖6(a)和圖6(b)可以很明顯地看出,采用t-SNE方法進(jìn)行特征降維后四種狀態(tài)的二維和三維特征分布分的很開,沒有混淆現(xiàn)象。而從圖6(c)和圖6(d)看出,采用Sammon mapping方法降維后,四種狀態(tài)的三維特征分布靠的很近,特別是內(nèi)圈故障與外圈故障混淆在一起,從二維特征分布也明顯看出,三種故障有交叉混疊現(xiàn)象。從圖6(e)和圖6(f)也很清楚地看出,采用Isomap特征降維后,導(dǎo)致三種故障三維特征分布特征分布很靠近,內(nèi)圈故障和外圈故障有交叉混疊。經(jīng)過對比可知,t-SNE方法比Sammon mapping和Isomap方法更能提取用于區(qū)分樣本的敏感特征。上述分析結(jié)果表明了t-SNE方法進(jìn)行特征降維的優(yōu)越性。

(a) t-SNE二維分布

(b) t-SNE三維分布

(c) Sammon mapping二維分布

(d) Sammon mapping三維分布

(e) Isomap三維分布

(f) Isomap二維分布
然后,設(shè)定嵌入維數(shù)d=3,采用t-SNE方法對高維特征向量空間進(jìn)行特征降維,得到低維特征向量集:R116×3。再次,每種狀態(tài)取15組構(gòu)成訓(xùn)練樣本特征集:R60×3,采用訓(xùn)練樣本特征集對基于PSO-SVM多類模式分類器進(jìn)行訓(xùn)練,由于SVM是二分類器,采用“一對一”的方式建立多故障分類器。其中用粒子群優(yōu)化算法優(yōu)化SVM中懲罰參數(shù)c和核函數(shù)參數(shù)g,對訓(xùn)練樣本特征集進(jìn)行交叉驗證意義下的識別率作為PSO中的適應(yīng)度函數(shù)值,設(shè)定PSO算法中的局部搜索能力c1為1.5,全局搜索能力c2為1.7,種群數(shù)量為20,迭代次數(shù)為200。搜索到的最佳懲罰因子c為0.1,核函數(shù)參數(shù)g為59.566 7。
用訓(xùn)練好的PSO-SVM多模式分類器對測試樣本特征集進(jìn)行分類預(yù)測。根據(jù)PSO-SVM分類器的輸出值確定滾動軸承的工作狀態(tài)和故障類型,其中,1表示正常,2表示外圈故障,3表示內(nèi)圈故障,4表示滾動體故障。預(yù)測樣本輸出結(jié)果如圖7所示。從圖7中可以看出所有測試樣本類別都得到了準(zhǔn)確的分類,論文提出的方法對測試樣本集的識別率達(dá)到100%,這說明了論文方法的有效性。

圖7 論文方法的輸出結(jié)果
為了將本文特征提取方法與傳統(tǒng)的特征提取方法進(jìn)行比較,提取各狀態(tài)原始振動信號的峭度、復(fù)雜度[32]和模糊熵特征值,各狀態(tài)樣本數(shù)、數(shù)據(jù)長度以及訓(xùn)練樣本數(shù)和測試樣本數(shù)與本文上述提出的方法相同,然后將提取的特征值分別輸入到基于PSO-SVM的多故障多模式分類器中進(jìn)行模式識別,其SVM參數(shù)優(yōu)化結(jié)果及分類結(jié)果如圖8(a)和圖8(b)所示。從圖8(b)可以看出有兩個內(nèi)圈故障樣本被錯誤地分到了外圈故障中,其正確識別率為96.428 6%低于本論文提出的方法。
適應(yīng)度曲線Accuracy[PSO method]
(參數(shù)c1=1.5,c2=1.7,終止代數(shù)=200,種群數(shù)量pop=20)
Best c=0.1 g=210.770 2 CVAccuracy=100%

(a) SVM參數(shù)優(yōu)化結(jié)果

(b) SVM參數(shù)優(yōu)化后分類結(jié)果
為了說明PSO參數(shù)優(yōu)化的優(yōu)越性,再采用Isomap降維的低維特征向量空間分別輸入基于SVM和PSO-SVM的多模式分類器進(jìn)行訓(xùn)練與測試,其SVM分類結(jié)果和PSO-SVM參數(shù)優(yōu)化與分類結(jié)果如圖9、圖10(a)和圖10(b)所示。從圖9可以看出,采用Isomap方法進(jìn)行特征空間降維后,SVM未進(jìn)行參數(shù)優(yōu)化時,故障識別率為96.428 6%,而通過對SVM進(jìn)行參數(shù)優(yōu)化選擇,尋優(yōu)得到最佳懲罰因子和核函數(shù)參數(shù)組合為[2.586 4,16.899],識別率提高到了98.214 3%,但未達(dá)到采用t-SNE算法得到的100%識別率。這說明了SVM通過PSO參數(shù)優(yōu)化,選擇了最佳參數(shù)組合,避免了人為因素的干擾,提高了分類精度。

圖9 SVM參數(shù)未優(yōu)化分類結(jié)果

(a) SVM參數(shù)優(yōu)化結(jié)果

(b) SVM參數(shù)優(yōu)化后分類結(jié)果
(1) 提出了一種新的衡量機(jī)械系統(tǒng)非線性、非平衡復(fù)雜信號特征的方法——多尺度時不可逆,并與傳統(tǒng)特征提取方法進(jìn)行了對比,結(jié)果表明MSTI可以提取傳統(tǒng)方法不能提取的特征信息。
(2) 將t-SNE流形學(xué)習(xí)方法應(yīng)用于滾動軸承故障特征的降維,得到具有內(nèi)在規(guī)律性的低維可視化特征,且保留了信息的本質(zhì)特征,試驗分析結(jié)果表明相較于Isomap和Sammon mapping,t-SNE在可視化降維方面更具有優(yōu)勢,更有利于故障的診斷。
(3) 提出一種新的基于MSTI、t-SNE流形學(xué)習(xí)和PSO-SVM的滾動軸承故障診斷方法,仿真和試驗分析結(jié)果表明該方法不僅在非線性特征提取,高維特征可視化降維方面有顯著的優(yōu)勢,而且在分類效果方面,特別地SVM經(jīng)參數(shù)優(yōu)化后,識別率有明顯的提高。
[1] PINCUS S M. Assessing serial irregularity and its implications for health[J]. Annals of the New York Academy of Sciences, 2001, 954(1):245-267.
[2] CUI B Z, PAN H X, WANG Z B. Fault diagnosis of roller bearings base on the local wave and approximate entropy[J]. Journal of North University of China (Natural Science Edition), 2012, 33(5):552-558.
[3] 何志堅, 周志雄. 基于ELMD的樣本熵及Boosting-SVM的滾動軸承故障診斷[J]. 振動與沖擊, 2016, 35(18):190-195.
HE Zhijian, ZHOU Zhixiong. Fault diagnosis of roller bearings based on ELMD sample entropy and Boosting-SVM[J].Journal of Vibration and Shock, 2016, 35(18):190-195.
[4] ZHU K. Fault diagnosis of rolling bearings based on IMF envelope sample entropy and support vector machine[J]. Journal of Information & Computational Science, 2013, 10(16):5189-5198.
[5] BANDT C, POMPE B. Permutation entropy: a natural complexity measure for time series[J]. Physical Review Letters, 2002, 88(17):174102.
[6] 郝旺身, 王洪明, 董辛,等. 基于全矢排列熵的齒輪故障特征提取方法研究[J]. 振動與沖擊, 2016, 35(11):224-228.
HAO Wangshen, WANG Hongming, DONG Xin, et.al. Gear fault feature extraction based on full vector permutation entropy[J].Journal of Vibration and Shock, 2016, 35(11):224-228.
[7] CHEN W, WANG Z, XIE H, et al. Characterization of surface EMG signal based on fuzzy entropy[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2007, 15(2): 266-272.
[8] 舒思材, 韓東. 基于多尺度最優(yōu)模糊熵的液壓泵特征提取方法研究[J]. 振動與沖擊, 2016, 35(9):184-189.
SHU Sicai, HAN Dong. Approach for a hydraulic pump’s feature extraction based on multiscale optimal fuzzy entropy.[J].Journal of Vibration and Shock, 2016, 35(9):184-189.
[9] ZHENG J, CHENG J, YANG Y. A rolling bearing fault diagnosis approach based on LCD and fuzzy entropy[J]. Mechanism & Machine Theory, 2013, 70(6):441-453.
[10] COSTA M, GOLDBERGER A L, PENG C K. Multiscale entropy analysis of biological signals[J]. Physical Review E Statistical Nonlinear & Soft Matter Physics, 2005, 71(1):021906-021906.
[11] COSTA M D, PENG C K, GOLDBERGER A L. Multiscale analysis of heart rate dynamics: entropy and time irreversibility measures[J]. Cardiovascular Engineering, 2008, 8(2): 88-93.
[12] COSTA M, GOLDBERGER A L, PENG C K. Broken asymmetry of the human heartbeat: loss of time irreversibility in aging and disease[J]. Physical Review Letters, 2005, 95(19): 198102.
[13] VAN DER HEYDEN M J, DIKS C, PIJN J P M, et al. Time reversibility of intracranial human EEG recordings in mesial temporal lobe epilepsy[J]. Physics Letters A, 1996, 216(6): 283-288.
[14] PORTA A, GUZZETTI S, MONTANO N, et al. Time reversibility in short-term heart period variability[C]//2006 Computers in Cardiology. IEEE, 2006: 77-80.
[15] COX D R, GUDMUNDSSON G, LINDGREN G, et al. Statistical analysis of time series: Some recent developments[with discussion and reply][J]. Scandinavian Journal of Statistics, 1981: 93-115.
[16] DIKS C, VAN HOUWELINGEN J C, TAKENS F, et al. Reversibility as a criterion for discriminating time series[J]. Physics Letters A, 1995, 201(2): 221-228.
[17] CASALI K R, CASALI A G, MONTANO N, et al. Multiple testing strategy for the detection of temporal irreversibility in stationary time series[J]. Physical Review E, 2008, 77(6): 066204.
[18] PRIGOGINE I, ANTONIOU I. Laws of nature and time symmetry breaking[J]. Annals of the New York Academy of Sciences, 1999, 879(1): 8-28.
[19] PORTA A, CASALI K R, CASALI A G, et al. Temporal asymmetries of short-term heart period variability are linked to autonomic regulation[J]. Ajp Regulatory Integrative & Comparative Physiology, 2008, 295(2):R550-7.
[20] PORTA A, GUZZETTI S, MONTANO N, et al. Time reversibility in short-term heart period variability[C]// Computers in Cardiology. 2006:77-80.
[21] GUZIK P, PISKORSKI J, KRAUZE T, et al. Heart rate asymmetry byPoincaré plots of RR intervals[J]. Biomedizinische Technik Biomedical Engineering, 2006, 51(4):272-5.
[22] KRAMER O, LUCKEHE D. Visualization of evolutionary runs with isometric mapping[C]// Evolutionary Computation. IEEE, 2015.
[23] DYBOWSKI R, COLLINS T D, HALL W, et al. Visualization of binary string convergence by sammon mapping[C]. First Student Workshop of the Psychology of Programming Interest Group, 1996:377-383.
[24] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500):2323-2326.
[25] LAURENS V D M, HINTON G. Visualizing Data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9:2579-2605.
[26] HINTON G E. Visualizing high-dimensional data using t-SNE[J]. Vigiliae Christianae, 2008, 9(2):2579-2605.
[27] KASKI B S. t-distributed stochastic neighbor embedding[C]// In Proc. 2010.
[28] LAURENS V D M. Accelerating t-SNE using tree-based algorithms[J]. Journal of Machine Learning Research, 2014, 15(1):3221-3245.
[29] SUBASI A. Classification of EMG signals using PSO optimized SVM for diagnosis of neuromuscular disorders[J]. Computers in Biology & Medicine, 2013, 43(5):576-586.
[30] ABDI M J, GIVEKI D. Automatic detection of erythemato-squamous diseases using PSO-SVM based on association rules[J]. Engineering Applications of Artificial Intelligence, 2013, 26(1):603-608.
[31] http://csegroups.case.edu/bearingdatacenter/pages/download-data-file. Bearing Data Center, Case Western Reserve University.
[32] 朱永生, 袁幸, 張優(yōu)云,等. 滾動軸承復(fù)合故障振動建模及Lempel-Ziv復(fù)雜度評價[J]. 振動與沖擊, 2013, 32(16):23-29.
ZHU Yongsheng, YUAN Xing, ZHANG Youyun, et al. Vibration modeling of rolling bearings considering compound multi-defect and appraisal with Lempel-Ziv complexity[J]. Journal of Vibration and Shock, 2013, 32(16):23-29.
Rollingbearingfaultdiagnosismethodbasedonmultiscaletimeirreversibilityandt-SNEmanifoldlearning
JIANG Zhanwei, ZHENG Jinde, PAN Haiyang, PAN Ziwei
(School of Mechanical Engineering, Anhui University of Technology, Maanshan 243032, China)
In order to accurately extract nonlinear fault features of mechanical vibration signals, a novel method for complexity measurement of vibration signals called the multiscale time irreversibility (MSTI) was proposed. Meanwhile, combining the t-distributed stochastic neighbor embedding (t-SNE) and the particle swarm optimization-support vector machine (PSO-SVM), a new fault diagnosis method for rolling bearings was proposed. Firstly, MSTI was used to extract the characteristic information of complex vibration signals. Secondly, t-SNE was used to reduce dimensions of the high dimension feature space. Then the selected lower dimensional feature vectors were input to a PSO-SVM-based multi-fault classifier for fault diagnosis. Finally, the proposed method was applied in the test data analysis and compared with the existing methods. The analysis results showed that the proposed method can be used to effectively diagnose the working status and fault types of rolling bearings, it is superior to the existing methods.
multiscale time irreversibility (MSTI); t-distributed stochastic neighbor embedding (t-SNE); support vector machine (SVM); rolling bearing; fault diagnosis
國家自然科學(xué)基金(51505002;51305046);安徽省高校自然科學(xué)研究重點(diǎn)資助項目(KJ2015A080);安工大研究生創(chuàng)新研究基金(2016062)
2016-11-22 修改稿收到日期:2016-12-21
姜戰(zhàn)偉 男,碩士生,1990年5月生
鄭近德 男,博士,碩士生導(dǎo)師,1986年3月生 E-mail:lqdlzheng@126.com
TN911.7;TH165.3
: A
10.13465/j.cnki.jvs.2017.17.010