姜浪朗,張敬超,江國(guó)乾,蘇連成,李英偉,*
(1.燕山大學(xué) 電氣工程學(xué)院,河北 秦皇島 066004;2.燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北 秦皇島 066004)
軸承常用于旋轉(zhuǎn)機(jī)械設(shè)備中,因?yàn)槭芨鞣N惡劣壞境和長(zhǎng)時(shí)間運(yùn)轉(zhuǎn)的影響,所以軸承也是旋轉(zhuǎn)機(jī)械中最容易損壞的一個(gè)零部件。根據(jù)統(tǒng)計(jì),超過1/3的機(jī)器損壞或失效都是由軸承引起的。軸承的運(yùn)行狀態(tài)對(duì)設(shè)備的生命周期、現(xiàn)場(chǎng)操作工人的安全等都有重要的影響[1]。因此,對(duì)工作中的軸承進(jìn)行實(shí)時(shí)狀態(tài)監(jiān)測(cè),發(fā)現(xiàn)早期故障而采取相應(yīng)的針對(duì)性維護(hù)措施,對(duì)延長(zhǎng)設(shè)備使用、保證工作環(huán)境安全和增加企業(yè)經(jīng)濟(jì)效益,均有現(xiàn)實(shí)意義和實(shí)際價(jià)值[2]。
當(dāng)前,為獲取軸承的狀態(tài)信息,針對(duì)振動(dòng)信號(hào)的特征提取和狀態(tài)判斷等處理措施[3],國(guó)內(nèi)外已經(jīng)展開了大量的研究工作,并在電力、車輛、化工等行業(yè)取得較好的效果。在振動(dòng)監(jiān)測(cè)中,文獻(xiàn)[4]系統(tǒng)說明了軸承故障類型和故障特點(diǎn),且描述了故障預(yù)警與判斷的方式,文獻(xiàn)[5]引用振動(dòng)信號(hào)卷積神經(jīng)網(wǎng)絡(luò)法來將數(shù)據(jù)分類,文獻(xiàn)[6]以小波包變換處理振動(dòng)信號(hào),文獻(xiàn)[7]以傅里葉變換和小波包變換相組合來識(shí)別軸承的狀態(tài)信息,證明其結(jié)合后增強(qiáng)狀態(tài)識(shí)別的精準(zhǔn)度。但對(duì)于低速運(yùn)轉(zhuǎn)的設(shè)備,故障產(chǎn)生的信號(hào)頻率較低,大多時(shí)候低頻信號(hào)都會(huì)被過濾掉,導(dǎo)致部分故障信號(hào)被埋沒,故對(duì)振動(dòng)信號(hào)進(jìn)行分析時(shí)效果不太精準(zhǔn),且在振動(dòng)信號(hào)中獲取故障早期特征較為困難。
實(shí)際上,軸承從輕微磨損到最后嚴(yán)重的損壞變形有具體的失效過程[8-9]。因?yàn)楫?dāng)軸承產(chǎn)生欠潤(rùn)滑、微磨破損等狀態(tài)時(shí),通常會(huì)自發(fā)產(chǎn)生一種高頻信號(hào)。這種信號(hào)有別于低頻振動(dòng)(通常頻率是20 Hz~20 kHz,此類范圍人耳可以聽到),而高頻信號(hào)為高頻短波信號(hào),其頻率范圍為20 kHz~100 kHz,它可有效避免工業(yè)現(xiàn)場(chǎng)大量低頻噪聲信號(hào)等的干擾(包括大部分環(huán)境噪聲),從而能夠提供更敏感有效的狀態(tài)信息,但20 kHz~100 kHz的高頻信號(hào)數(shù)據(jù)量極大,對(duì)后期的采集、存儲(chǔ)和信號(hào)處理都極為不便,故本次處理的信號(hào)為高頻信號(hào)經(jīng)過降頻之后的超聲解調(diào)信號(hào),其頻率范圍在20 kHz以下。相較于振動(dòng)信號(hào),經(jīng)過超聲解調(diào)之后的信號(hào)具有更高的信噪比,對(duì)設(shè)備的潤(rùn)滑狀態(tài)或早期磨損極為敏感,故超聲解調(diào)信號(hào)更適用于傳動(dòng)設(shè)備的狀態(tài)監(jiān)測(cè)。
特征提取過程對(duì)于軸承狀態(tài)的識(shí)別至關(guān)重要,且僅用一種或者一類的特征來判斷會(huì)使結(jié)果受限,故本文提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解與多類熵值相結(jié)合的軸承狀態(tài)監(jiān)測(cè)方法,此方法使用經(jīng)驗(yàn)?zāi)B(tài)分解后的各分量與多類熵值結(jié)合來進(jìn)行特征提取,并使用隨機(jī)森林算法構(gòu)建分類模型進(jìn)行狀態(tài)診斷,結(jié)果表明,相較于單一特征,多特征融合方法對(duì)軸承早期故障有更好的區(qū)分效果。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD),可將復(fù)雜的信號(hào)根據(jù)頻率從高到低依次分解為若干本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF),可用來處理非周期性、非線性的信號(hào)[10]。此方法有兩個(gè)約束條件:1)過零點(diǎn)數(shù)目以及局部的零值點(diǎn)在全部時(shí)間軸范圍內(nèi)要保持一致或僅差一個(gè);2)在任何時(shí)間范圍點(diǎn)內(nèi)其上下包絡(luò)線均值要等于0。EMD分解流程圖如圖1所示。

圖1 EMD分解流程圖Fig.1 EMD decomposition flow chart
隨機(jī)森林算法是Leo Breiman在2001年時(shí)提出的一種方法[11],主要是對(duì)樣本使用多棵決策樹來訓(xùn)練并且預(yù)測(cè)的一種集成分類器,它的原理就是利用隨機(jī)生成的決策樹來給出最終的判斷結(jié)果。隨機(jī)森林的優(yōu)點(diǎn)是:相較單棵決策樹而言,隨機(jī)森林可以使用多棵決策樹來進(jìn)行判斷,所以并不依賴于一個(gè)決策樹來判斷最優(yōu)特征,可使其每棵樹的創(chuàng)建都有自己獨(dú)立的樣本集;因?yàn)閱我坏乃惴ㄓ衅渚窒扌裕捎玫募伤惴梢允古袛鄿?zhǔn)確率大大提升;較快的訓(xùn)練速度可以使這種方法在處理大量數(shù)據(jù)集時(shí)效果更佳。
隨機(jī)森林算法的主要處理過程如下:
1)從樣本集中有放回的隨機(jī)采樣選出n個(gè)樣本;
2)從所有特征中隨機(jī)選擇k種較為重要的特征,然后以這些特征為樣本建立決策樹;
3)重復(fù)以上兩步m次,即生成m棵決策樹,形成隨機(jī)森林;
4)經(jīng)過每棵樹的決策及判斷后,最終得出影響因子最大的前幾名特征值用于狀態(tài)判斷。
本文提出了一種EMD分解與多類熵值結(jié)合的特征提取方法,實(shí)現(xiàn)超聲解調(diào)信號(hào)的多尺度分解和故障特征的分頻帶劃分,通過計(jì)算EMD分解后不同分量的多類能量熵,實(shí)現(xiàn)能量分布的量化描述,來提取到更優(yōu)的特征值。再通過隨機(jī)森林進(jìn)行模型訓(xùn)練,利用混淆矩陣進(jìn)行最終的準(zhǔn)確率評(píng)估。具體步驟如下:
1) 通過實(shí)驗(yàn)軸承獲取不同運(yùn)行狀態(tài)的超聲解調(diào)信號(hào)。
2) 將各類不同軸承狀態(tài)的原始信號(hào)使用七點(diǎn)三次平滑法進(jìn)行預(yù)處理,使其得到更加平穩(wěn)的信號(hào)便于下一步更好的特征效果提取,再將平滑后的數(shù)據(jù)進(jìn)行均等化分幀的操作,將每種數(shù)據(jù)的類型分成5 512點(diǎn)為一幀,一類狀態(tài)數(shù)據(jù)共有40 s,采樣率為22 050 Hz,即一類狀態(tài)數(shù)據(jù)共分160幀。
3) 通過EMD自適應(yīng)分解來獲取軸承不同狀態(tài)超聲解調(diào)信號(hào)各種尺度的IMF分量,一種狀態(tài)會(huì)被分成12組左右的IMF分量,考慮后面幾組能量值太小,因此將其舍去,選取能量值信息較高的前7層應(yīng)用于下一步計(jì)算。
4) 對(duì)提取分解后的不同層IMF分量值計(jì)算樣本熵[12-13]、排列熵[14]、小波熵[15]、近似熵[16]等多類熵值。
5) 將EMD提取后的前7層本征模態(tài)分量與多類熵值進(jìn)行結(jié)合,通過優(yōu)化后的特征向量用于隨機(jī)森林構(gòu)建分類模型,進(jìn)行參數(shù)調(diào)優(yōu)提升模型精確度,再利用混淆矩陣[17]進(jìn)行精度評(píng)價(jià),并進(jìn)行特征擇優(yōu)獲取影響因素較好的特征值。
多特征融合算法整體流程如圖2所示。

圖2 多特征融合算法整體流程Fig.2 Overall flow of multi-feature fusion algorithm
本實(shí)驗(yàn)數(shù)據(jù)是在實(shí)驗(yàn)室的軸承上采集得到的,本次采集平臺(tái)所使用的軸承轉(zhuǎn)速為1 050 r/min,分別在軸承內(nèi)部添加不同大小的磨粒,使其模擬出軸承的三類不同運(yùn)行狀態(tài):正常狀態(tài)、輕微磨損狀態(tài)、嚴(yán)重?fù)p壞狀態(tài)。在數(shù)據(jù)采集時(shí),采樣參數(shù)為采樣率22 050 Hz、單通道、16位采樣,單次采樣時(shí)間持續(xù)10 s。再對(duì)不同狀態(tài)的各4組數(shù)據(jù)進(jìn)行組合分析,在基礎(chǔ)分析時(shí),提取每類樣本單次點(diǎn)數(shù)為5 512。實(shí)驗(yàn)軸承數(shù)據(jù)采集流程如圖3所示。

圖3 實(shí)驗(yàn)軸承數(shù)據(jù)采集流程Fig.3 Experimental bearing data collection process
在實(shí)驗(yàn)軸承上采集到的軸承超聲解調(diào)數(shù)據(jù)往往會(huì)受到噪聲的輕微干擾。常見的噪聲信息有周期性的也有非周期性的,50 Hz工頻干擾是周期性的常見來源,隨機(jī)信號(hào)是非周期性噪聲的重要因素。
為消除上述兩類噪聲干擾對(duì)數(shù)據(jù)分析帶來的影響,以及提取數(shù)據(jù)更穩(wěn)定的特征值,需要先對(duì)數(shù)據(jù)進(jìn)行平滑預(yù)處理。常見的平滑處理算法有:樣條插值函數(shù)平滑法、平均值計(jì)算平滑法以及五點(diǎn)三次平滑法[18]等。在這些方法中,樣條插值函數(shù)方法雖較為靈活且有一定效果,但其計(jì)算方式繁瑣,且對(duì)幅度平滑效果較差;平均值計(jì)算方法的濾波效果并不理想;五點(diǎn)三次方法有較好濾波效果,對(duì)幅度平滑效果較好,但需要多次計(jì)算。本文基于五點(diǎn)三次平滑算法改進(jìn)成七點(diǎn)三次平滑算法,其有較為快速的計(jì)算方式,較好的濾波效果,且能保存較為穩(wěn)定的數(shù)據(jù)信息。

t-s=-s,t-s+1=-s+1,…,t-1=-1,t0=0,
t1=1,…,tn-1=n-1,tn=n,
此時(shí)將得到的實(shí)驗(yàn)數(shù)據(jù)用m次多項(xiàng)式進(jìn)行擬合,則擬合多項(xiàng)方程式為
Y(t)=a0+a1t+a2t2+…+amtm
(1)
接著,用最小二乘法推導(dǎo)(1)里的待定系數(shù),令

(2)
為使φ(a0,a1,…,am)達(dá)到最小,讓式(2)分別對(duì)ak(k=0,1,…,m)求導(dǎo),令求導(dǎo)結(jié)果為零,可得

(3)
式(3)稱為正規(guī)方程組。當(dāng)n值為3(即7節(jié)點(diǎn)),m值為3后,可計(jì)算出其正規(guī)方程組,可解出a0,a1,ai,ait,代入式(3),令t值分別為0,1,-1,2,-2,3,-3,則可以解出a0,a1,a2,a3值為

(4)

(5)


將軸承信號(hào)數(shù)據(jù)集經(jīng)七點(diǎn)三次平滑算法進(jìn)行去噪預(yù)處理,數(shù)據(jù)去噪效果對(duì)比如圖4所示。由圖4可以很明顯地看出去噪的效果,因此本方法在數(shù)據(jù)預(yù)處理時(shí)是可行的。

圖4 數(shù)據(jù)去噪效果對(duì)比Fig.4 Comparison of data denoising effect
首先,對(duì)預(yù)處理后的信號(hào)進(jìn)行初步時(shí)頻域分析對(duì)比,軸承三種狀態(tài)的時(shí)頻域信號(hào)如圖5所示。

圖5 軸承三種狀態(tài)的時(shí)頻域信號(hào)Fig.5 Time-frequency domain signals of bearing in three states
從圖5可得出,軸承不同狀態(tài)的超聲解調(diào)信號(hào)幅值有所不同,正常時(shí)呈現(xiàn)近周期穩(wěn)定波動(dòng);微損時(shí)有間斷性波動(dòng),其幅值在0.5 V左右,當(dāng)嚴(yán)重時(shí)呈現(xiàn)極大不規(guī)律性,最大值近1 V左右。正常狀態(tài)和微損狀態(tài)的頻譜較為相似,但微損軸承會(huì)在0.5 kHz左右時(shí)產(chǎn)生較大的波動(dòng),三種狀態(tài)均在0~3 kHz內(nèi)出現(xiàn)主頻成分,而嚴(yán)重故障狀態(tài)的頻譜頻帶較寬,且呈現(xiàn)一定的分布特性。故在實(shí)踐中可通過信號(hào)幅值和頻域初步判斷軸承狀態(tài)。
根據(jù)2.3節(jié)的分析,可以從時(shí)域中看出微損軸承比正常軸承的幅值大且局部有較大波動(dòng),但是間歇性出現(xiàn)的波動(dòng)也極可能是現(xiàn)場(chǎng)各類不確定噪聲或采集數(shù)據(jù)時(shí)人為誤差造成的,并且微損幅度出現(xiàn)的波動(dòng)和頻率存在不穩(wěn)定的非周期性,故僅從時(shí)頻域分析數(shù)據(jù)存在一定局限性,無法準(zhǔn)確區(qū)分軸承運(yùn)行時(shí)不同的狀態(tài)類型,尤其是早期故障的產(chǎn)生,單純靠人的經(jīng)驗(yàn)值來判斷是不科學(xué)的,這樣容易發(fā)生誤判或漏診。因此,需要更深一步對(duì)信號(hào)進(jìn)行EMD分解,實(shí)現(xiàn)超聲解調(diào)信號(hào)的多尺度分解和故障特征的分頻帶劃分,通過計(jì)算不同分量的多類能量熵值來深入判斷。超聲解調(diào)信號(hào)經(jīng)過EMD分解后,提取前7層IMF分量值,不同頻率分量蘊(yùn)含軸承各類狀態(tài)信息,三種狀態(tài)軸承前7層分解信號(hào)圖如圖6所示。

圖6 三種狀態(tài)下軸承前7層分解信號(hào)圖Fig.6 Decomposition signal diagram of the first 7 layers of the bearing in the three states
由圖6可以得出,三種不同狀態(tài)的軸承通過EMD分解,從高頻至低頻自適應(yīng)分解成不同的分量值,每層分量都蘊(yùn)含著不同的特征信息,實(shí)現(xiàn)了軸承狀態(tài)多頻帶的劃分,因此可以通過每一層頻率段提取更為精準(zhǔn)的分類特征。
接下來,為進(jìn)一步明確和細(xì)化不同軸承狀態(tài),采用EMD分解后提取各層的IMF分量來計(jì)算不同種類熵值,得到各類狀態(tài)信號(hào)的不同特征,從而反映故障信號(hào)的非周期性特征并繪制折線圖。同時(shí),在進(jìn)行分析時(shí),考慮到相比較單組數(shù)據(jù)的局部波動(dòng)性,本次實(shí)驗(yàn)每種狀態(tài)選取10 s的數(shù)據(jù),每種狀態(tài)分成40段,每段5 512個(gè)點(diǎn),將每段數(shù)據(jù)都進(jìn)行EMD分解后,舍棄后面的分量較小的層數(shù)以及誤差層,本次主要分析取前7層,提取出每一層的40段數(shù)據(jù)并計(jì)算其平均值,構(gòu)建成新的7層IMF分量后計(jì)算其不同熵的能量值,計(jì)算后的7層分解樣本熵、排列熵、小波熵、近似熵狀態(tài)如圖7~10所示。

圖7 7層分解樣本熵狀態(tài)Fig.7 Sample entropy state of 7-layer decomposition

圖8 7層分解排列熵狀態(tài)Fig.8 Permutation entropy state of 7-layer decomposition

圖9 7層分解小波熵狀態(tài)Fig.9 Wavelet entropy state of 7-layer decomposition

圖10 7層分解近似熵狀態(tài)Fig.10 Approximate entropy state of 7-layer decomposition
實(shí)驗(yàn)結(jié)果表明,經(jīng)EMD分解后的不同熵值能量隨著分解層數(shù)的增加都呈現(xiàn)降低趨勢(shì),對(duì)于不同狀態(tài)的同一熵值的情況,在逐層分解時(shí),嚴(yán)重故障狀態(tài)較正常狀態(tài)的熵值普遍較高,而微損狀態(tài)較正常狀態(tài)的熵值普遍較低,這就為判斷早期故障提供了良好的保障。而且多類熵值的計(jì)算方式也較為簡(jiǎn)單,為后期的在線監(jiān)測(cè)系統(tǒng)打下良好基礎(chǔ)。
本次實(shí)驗(yàn)針對(duì)EMD分解后的1~7層分量與樣本熵、排列熵、小波熵、近似熵進(jìn)行結(jié)合,得到28維特征值,將其代入多特征隨機(jī)森林構(gòu)建分類模型。對(duì)選取的樣本隨機(jī)抽取等比例值進(jìn)行訓(xùn)練,通過對(duì)隨機(jī)森林參數(shù)不斷擇優(yōu),找到最佳參數(shù)的隨機(jī)森林模型后,對(duì)測(cè)試集進(jìn)行準(zhǔn)確率判別,利用混淆矩陣進(jìn)行精度評(píng)價(jià),并對(duì)28維特征值進(jìn)行擇優(yōu),得出對(duì)狀態(tài)評(píng)價(jià)影響較高的特征值。在模型訓(xùn)練時(shí),令正常軸承狀態(tài)標(biāo)簽為1,微損軸承狀態(tài)標(biāo)簽為2,嚴(yán)重軸承狀態(tài)標(biāo)簽為3,每種狀態(tài)訓(xùn)練樣本為112個(gè),測(cè)試樣本為48個(gè)。最終軸承狀態(tài)識(shí)別準(zhǔn)確率見表1。

表1 軸承狀態(tài)的識(shí)別準(zhǔn)確率Tab.1 Accuracy of identification of bearing status %
數(shù)據(jù)分析時(shí),考慮單次軸承狀態(tài)數(shù)據(jù)的偶然性,本次針對(duì)不同時(shí)間段4次采集到的三種狀態(tài)各10 s數(shù)據(jù)(即每種狀態(tài)共40 s數(shù)據(jù))進(jìn)行分析,將其分成160組(每組5 512個(gè)點(diǎn))進(jìn)行EMD分解和多類熵值計(jì)算,最終得到480組數(shù)據(jù)。總數(shù)據(jù)中336組作為訓(xùn)練數(shù)據(jù)(占比70%),144組作為測(cè)試數(shù)據(jù)(占比30%)。
從表1可以看出,超聲解調(diào)信號(hào)在經(jīng)過EMD分解與四類熵值相結(jié)合后對(duì)正常軸承、微損軸承、嚴(yán)重軸承三種特征狀態(tài)均有良好的區(qū)分效果。而且,當(dāng)對(duì)四類熵值進(jìn)行特征融合后,其三種狀態(tài)的準(zhǔn)確率都有一定程度的提高,對(duì)于三種狀態(tài)的平均識(shí)別率提高到99.31%,尤其對(duì)于微損軸承的監(jiān)測(cè)準(zhǔn)確率提高到97.92%,這對(duì)于區(qū)分軸承的早期故障有較好的效果。這也充分說明了利用多特征融合的故障識(shí)別方法提高軸承狀態(tài)分類準(zhǔn)確率的合理性。
最后,考慮分解后各分量的四類熵值曲線在第1~7層有著相似的變化規(guī)律,且通過經(jīng)驗(yàn)無法有效判斷哪類特征的評(píng)價(jià)效果最佳,因此針對(duì)此28維特征,代入隨機(jī)森林獲取不同特征對(duì)準(zhǔn)確率的影響比例,28維特征在狀態(tài)判別中的重要程度占比見表2。

表2 28維特征在狀態(tài)判別中的重要程度占比Tab.2 Percentage of importance of 28-dimensional features in state discriminations %
由表2可知,多維特征值相融合后,各類特征熵值在7層分解中,近似熵對(duì)其三種狀態(tài)準(zhǔn)確率的判別效果最好,占比29.11%,第1層近似熵對(duì)軸承三種狀態(tài)判斷重要度最佳,達(dá)14.74%。同時(shí)隨著分解層數(shù)的增加,對(duì)其判別重要性皆有一定程度的降低,結(jié)果表明通過這28維特征進(jìn)行融合,對(duì)判斷軸承的早期故障起到了良好的幫助效果。因此,多特征融合的方法可以提高軸承不同的狀態(tài)識(shí)別準(zhǔn)確率。
本文基于軸承的超聲解調(diào)信號(hào),提出了一種經(jīng)驗(yàn)?zāi)B(tài)分解后的本征模態(tài)分量與多類熵值結(jié)合的特征提取方法,并進(jìn)行了仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,超聲解調(diào)信號(hào)監(jiān)測(cè)軸承早期故障有較高的識(shí)別準(zhǔn)確率,其時(shí)頻域在某種程度上可以有效反映軸承狀態(tài)類別;對(duì)于各類狀態(tài)識(shí)別,經(jīng)過多特征融合后,相對(duì)于單一特征準(zhǔn)確率更高;經(jīng)EMD分解后第1層近似熵對(duì)其狀態(tài)的區(qū)分效果最佳,可有效判斷軸承早期故障,且各類熵值概念簡(jiǎn)單,計(jì)算也較便捷,因此為后期有效研究在線監(jiān)測(cè)功能提供保障,可及時(shí)對(duì)現(xiàn)場(chǎng)故障類型得出精準(zhǔn)判斷,且可快速深入挖掘不同狀態(tài)下的早期征兆,為有效地提供現(xiàn)場(chǎng)決策奠定科學(xué)基礎(chǔ)。但由于數(shù)據(jù)量有限,因此信號(hào)特征和故障類別的物理機(jī)理還需要進(jìn)一步研究和探索。