劉儒林, 汪 進, 謝忠志
(1.浙江工業(yè)大學 機械工程學院, 浙江 杭州 310014; 2.重慶開放大學 重慶工商職業(yè)學院, 重慶 400052;3.江蘇電子信息職業(yè)學院 數(shù)字裝備學院, 江蘇 淮安 223003; 4.泰州職業(yè)技術學院 智能制造學院, 江蘇 泰州 225300)
機械工業(yè)的發(fā)展是制造業(yè)進步的前提,而建立完善和有效的機械設備狀態(tài)監(jiān)測系統(tǒng)能夠進一步促進制造業(yè)良性發(fā)展。軸承、齒輪等零部件作為常見的機械設備,在運行中難免出現(xiàn)故障,研究機械的故障監(jiān)測和診斷具有較大意義[1-2]。
基于聲信號的故障診斷由于不用與設備接觸使得其不會對設備產(chǎn)生負面影響,具有較好的應用前景[3]。然而由于噪聲、摩擦等因素的影響導致聲信號具有非線性、非平穩(wěn)特點,信號的故障信息嵌入和耦合在噪聲分量中。因此,需要采用信號分解方法對信號進行預處理。常見的有小波變換(Wavelet Transform,WT)、經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)和變分模態(tài)分解(Variational Mode Decomposition,VMD)等。WANG Fei等[4]將WT與神經(jīng)網(wǎng)絡相結合,實現(xiàn)了液壓泵的狀態(tài)檢測;但WT受到尺度參數(shù)和位移參數(shù)的影響,對參數(shù)敏感。付大鵬[5]和張婕等[6]分別將EMD和VMD用于滾動軸承的故障診斷,分離了振動信號中的噪聲和故障成分;但是EMD和VMD存在分量選擇問題,分量過多會產(chǎn)生信息冗余,過少則無法完整描述信號的固有特性[7]。
平滑先驗分析(Smooth Prior Analysis,SPA)通過將信號分解為趨勢項和去趨勢項,避免了EMD和VMD的分量選擇問題,而且SPA僅有單個參數(shù),只需設置單個參數(shù)[8]。戴洪德等[9]將SPA和排列熵相結合,用于提取滾動軸承的故障特征,證明了SPA方法的有效性。葛紅平等[10]利用SPA對軸承振動信號進行分解,并提取趨勢項和去趨勢項的散布熵,基于GK聚類實現(xiàn)了故障的精確識別。
基于此,使用SPA對機械設備聲信號進行分解,分離信號中不同尺度的分量。聲信號為非線性非平穩(wěn)的復雜序列,經(jīng)典的線性分析方法對此不適用。因此,許多非線性分析方法應運而生,如散布熵(Dispersion Entropy,DE)、樣本熵、模糊熵和排列熵等。但上述指標都只是從單個尺度表達信號的故障特性,不能全面和完整地表征信號的復雜特征[11-13]。
學者們提出了多尺度分析方法,利用粗粒化處理將熵相結合,能夠從信號中提取出多個熵值,從不同尺度反映信號的固有特性。在多尺度指標中,多尺度熵(Multiscale Sample Entropy,MSE)、多尺度模糊熵(Multiscale Fuzzy Entropy,MFE)和多尺度排列熵(Multiscale Permutation Entropy,MPE)應用最為廣泛。但是MSE計算復雜,且計算短信號時易出現(xiàn)未定義值;MFE雖然減小了未定義值出現(xiàn)的概率,但對參數(shù)非常敏感。MPE忽視了信號幅值之間的相對關系[14]。
散布熵(Dispersion Entropy,DE)是ROSTAGHI M等[15]于2016年開發(fā)的一種復雜度測量熵值方法,通過正態(tài)分布函數(shù)對時間序列進行處理,引入了幅值信息,不僅具有較高的計算效率而且能夠準確的量化頻率和幅值的變化。ZHANG Yidong 等[16]將多尺度散布熵(Multiscale Distribution Entropy,MDE)用于滾動軸承的故障表征,準確識別了軸承的故障類型。但是該方法僅提取了信號的低頻成分,未考慮高頻故障特征。為捕捉信號高頻分量中的信息,柯赟等[17]提出了層次散布熵(Hierarchical Dispersion Entropy,HDE),并用于噴油器的故障診斷,相較于MDE,HDE同時提取信號低頻和高頻分量的信息,能全面反映信號本質;但是該方法未考慮時間序列中更深層的信息。LI Yuxing等[18]為提高DE的特征表達能力,提出了反向散布熵(Reverse Dispersion Entropy,RDE),船舶噪聲的識別結果驗證了其優(yōu)越性,但未從多個尺度進行分析,不夠全面。
在模式識別方面,故障診斷的特征樣本一般為小樣本和非線性,支持向量機(Support Vector Machine,SVM)非常適合對其進行分析,然而SVM存在參數(shù)優(yōu)化的問題[19]。
針對上述問題,采用層次反向散布熵(Hierarchical Reverse Dispersion Entropy,HRDE)改進MDE無法提取信號高頻信息和HDE特征提取性能不足的缺陷,同時采用最近提出的具有良好全局優(yōu)化性能的蜜獾算法(Honey Badger Algorithm,HBA)對SVM的參數(shù)進行優(yōu)化,提出了一種基于SPA-HRDE和HBA-SVM的機械設備故障診斷方法。首先,使用SPA對聲信號進行分解,實現(xiàn)趨勢項和去趨勢項的分離;然后,利用HRDE方法捕捉趨勢項和去趨勢項的特征值,得到故障特征;最后,將特征輸入至HBA-SVM分類器中,進行故障的識別。
SPA算法的理論[20]如下:
(1) 假定分析信號為Z,趨勢分量設為Zt,構建趨勢分量的線性測量模型:
Zt=Hθ+v
(1)
式中,H—— 測量矩陣
θ—— 回歸系數(shù)
v—— 測量誤差

(2)
式中,λ—— 正則化系數(shù)
Dd——d階微分算子的離散表達
(3) 假定Z有N個局部極值點,也就是:
Ze=[Z1,Z2,…,ZN]
(3)
則其一階和二階趨勢的離散表達分別如下:
Ze1=[Z2-Z1,Z3-Z2,…,ZN-ZN-1]
(4)
Ze2=[Z3-2Z2+Z1,Z4-2Z3+Z2,…,
ZN-2ZN-1+ZN-2]
(5)
(4) 通過理論推導,可得Dd為:

(6)
式中,Zed為Ze的第d階趨勢的離散表達,讓微分項Dd(Hθ)趨近0,則式(2)表示如下:
(7)
(8)
(5) 為約簡趨勢分量的求解,假定H為單位矩陣,Dd設為2階,如下:
(9)
(10)

1) 反向散布熵
反向散布熵是反映時間序列動態(tài)特性的非線性動力學方法,性能優(yōu)于DE[21]。對于長度為L的信號x={xi|1≤i≤L},首先通過NCDF將x歸一化至yi=[y1,y2,…,yL],yi∈(0,1)。隨后,將y映射到c個類別:
(11)
式中,r(·) —— 四舍五入函數(shù)

對映射序列zc進行相空間重構如下:
(12)

求解πv0v1…vm-1的概率:
(13)

反向散布熵定義為:
(14)
2) 層次反向散布熵
對于信號X={x(1),x(2),…,x(N)},HRDE的計算過程如下。
(1) 定義一個算子Qj:
(15)
式中,j=0或1,Qj的形式取決于信號的長度。對信號給定算子有:

(16)

(17)
其中,Q0為信號在第一層分解的低頻分量,Q1為信號在第一層分解的高頻分量。
(2) 構建m階向量[v1,v2,…,vm],其中vm=0或1,通過vm來表示整數(shù)e:
(18)
可知,e為不小于0的整數(shù),對于給定的e有唯一向量[v1,v2,…,vm]與之對應。
(3) 定義信號X每一層的各個節(jié)點組分為:
Xm,e=Qv1·Qv2·…·Qvm(X)
(19)
根據(jù)定義可發(fā)現(xiàn),算子Q0和Q1分別代表Haar小波的低通和高通濾波。對各個節(jié)點分量進行反向散布熵分析,即實現(xiàn)了信號X的層次反向散布熵計算。層次分析中節(jié)點X1,0和X2,0的反向散布熵即相當于多尺度反向散布熵中尺度為2和4時的反向散布熵。本質上,節(jié)點Xm,0對應于多尺度計算中2m尺度的反向散布熵,并且層次分析的右邊節(jié)點計算的是信號的高頻分量。因此,HRDE不但分析了信號的低頻分量,還提取了信號的高頻分量,避免了部分嵌入在高頻分量里的故障信息被遺漏[22]。
1) 蜜獾算法
蜜獾算法是一種模擬蜜獾覓食行為而提出的仿生優(yōu)化算法[23-24]。蜜獾獲取食物的方式分為兩種:① 聞香+挖洞;② 跟隨蜜鹍鳥。在此基礎上,將蜜獾算法分為挖掘階段和采蜜階段。
(1) 初始化部分。初始化蜜獾種群(種群數(shù)量N)和方位:
xi=lbi+r1×(ubi-lbi)
(20)
式中,xi—— 種群中第i個蜜獾
r1—— [0,1]內(nèi)的隨機量
lb—— 尋優(yōu)空間的下限
ub—— 尋優(yōu)空間的上限
(2) 定義強度Q。強度與食物的聚集度和食物之間的距離相關:
(21)
R=(xi-xi+1)2
(22)
di=xfood-xi
(23)
式中,Qi—— 食物的氣味強度
R—— 源強度或聚集度
xfood—— 食物的方位
xi—— 第i個蜜獾的方位
di—— 食物與當前蜜獾個體i的距離
(3) 更新密度系數(shù)。密度系數(shù)a控制時間變化的隨機性,保證從探索到開發(fā)的穩(wěn)妥過渡。更新密度系數(shù)a隨著迭代次數(shù)的增加而減小:
(24)
式中,C—— 不小于1的常數(shù),默認C=2
T—— 當前迭代規(guī)模
Tmax—— 最大迭代規(guī)模
(4) 更新蜜獾的方位。HBA的方位更新xnew分為兩個階段,分別是“挖掘部分”和“采蜜部分”。
在挖掘部分,蜜獾會執(zhí)行類似心形的行為,心形運動能夠基于下式進行模擬:
xnew=xfood+F×β×Q×xfood+
F×r3×a×di×
|cos(2πr4)×[1-cos(2πr5)]|
(25)
(26)
式中,xnew—— 蜜獾更新后的方位
β—— 覓食的能力,默認β=6
r3,r4,r5,r6—— [0,1]內(nèi)的4個隨機量
F—— 改變不同尋優(yōu)角度的符號
在采蜜部分,蜜獾會尾隨蜜鹍鳥達到蜂巢的行為能夠基于下式進行模擬
xnew=xfood+F×r7×a×di
(27)
式中,r7為[0,1]的隨機量。
2) 優(yōu)化支持向量機分類器
針對支持向量機分類器的泛化性能和分類性能受到懲罰系數(shù)和核函數(shù)影響的問題,采用蜜獾算法對SVM的超參數(shù)進行尋優(yōu),構建HBA-SVM分類器,具體步驟如下:
(1) 獲取故障特征,將其進行歸一化,并劃分為訓練樣本和測試樣本;
(2) 設置HBA的參數(shù),如Tmax,N,β,C,并初始化蜜獾種群的方位。通過HBA對SVM的懲罰系數(shù)和核函數(shù)(C,g)進行優(yōu)化搜索,以訓練樣本的分類準確率最大為適應度函數(shù)fi,迭代尋優(yōu)生成一組SVM的最優(yōu)超參數(shù),使得SVM分類器的分類性能最佳;
(3) 訓練SVM分類器。將迭代得到的最佳超參數(shù)賦予SVM模型,輸入訓練樣本對SVM進行訓練,通過測試樣本測試優(yōu)化后的SVM模型,得到測試樣本的識別結果。
為了充分利用機械設備的聲信號,提高故障識別的準確率,開發(fā)了一種結合SPA和HRDE的機械設備聲信號故障診斷方法,具體流程如下:
(1) 聲信號獲取是利用麥克風設備收集離心泵和滾動軸承在不同故障狀態(tài)下的聲信號,生成原始信號樣本;
(2) 信號分解是利用SPA對聲信號樣本進行分解,得到趨勢分量和去趨勢分量,突出信號中的故障信息;
(3) 特征提取是通過計算趨勢分量和去趨勢分量的HRDE熵值,提煉信號的故障特征,得到特征樣本;
(4) 故障識別是通過HBA優(yōu)化SVM分類器,獲得最佳超參數(shù),利用歸一化的特征樣本對分類器進行訓練和測試,得到測試樣本的分類結果,最后評估模型的泛化性。
本節(jié)對離心泵聲信號數(shù)據(jù)集[25]和滾動軸承聲信號數(shù)據(jù)集[26]兩個不同的機械設備數(shù)據(jù)集開展了故障檢測實驗分析,兩個數(shù)據(jù)集都來自印度Sant Longowal Institute of Engineering and Technology。實驗運行的軟件配置為Windows 10 64位操作系統(tǒng),運行內(nèi)存為16G,平臺為MATLAB 2015 a,硬件環(huán)境為i5 12500 H,RTX 2050顯卡。
實驗中,SPA的正則化系數(shù)設置為λ=5,HRDE參數(shù)設置為嵌入維數(shù)m=3,類別個數(shù)c=6,延遲t=1,層次k=2。
離心泵聲信號數(shù)據(jù)采集自圖1所示的實驗裝置,數(shù)據(jù)集在43 Hz的轉速和70 kHz的采樣頻率下,利用麥克風設備,型號ECM8000,采集了離心泵的聲音信號。離心泵設置了4種故障類型:葉輪缺損、葉輪堵塞、軸承內(nèi)圈破損和軸承外圈破損,4種故障部件如圖2所示。軸承是單列深溝球軸承,型號為6203ZZ。

圖1 離心泵實驗臺

圖2 離心泵4種故障部件[25]
對于該數(shù)據(jù)集,通過無重疊的采樣來構建樣本,為了獲得信號在故障一個周期內(nèi)的詳細信息,每2048個數(shù)據(jù)點組成一個樣本,構造的試驗數(shù)據(jù)如表1所示,共有5種工作狀態(tài),分別是1個健康,4種故障。

表1 離心泵試驗樣本組成Tab.1 Sample composition of centrifugal pump test
離心泵5種狀態(tài)的聲音信號波形如圖3所示。

圖3 離心泵各狀態(tài)的時域波形
對5種狀態(tài)的聲信號進行SPA分解,得到對應的趨勢分量和去趨勢分量,結果如圖4所示。

圖4 離心泵聲信號的趨勢項和去趨勢項分量
由圖4可知,經(jīng)過SPA分解后,聲信號的趨勢和去趨勢項分量都實現(xiàn)了明顯的分離,這證明SPA分解能夠比較好的刻畫信號不同尺度的特性。
隨后,采用HDE提取趨勢項和去趨勢項分量的故障特征,如圖5所示。

圖5 離心泵5種狀態(tài)的HRDE值
由圖5可知,HRDE在部分尺度上能夠較好的區(qū)分五種狀態(tài), 證明該方法能夠用于區(qū)分不同離心泵故障,具有一定的有效性。
為了量化SPA-HRDE進行故障表征的性能,建立HBA-SVM分類器進行離心泵的故障識別。蜜獾種群規(guī)模為20,最大迭代次數(shù)為50,懲罰系數(shù)C和核函數(shù)參數(shù)g的搜索范圍設置為[0.01,1]。訓練樣本和測試樣本的比例設置為1∶1,即訓練樣本的數(shù)量為50,測試樣本的數(shù)量也為50,將訓練樣本輸入至HBA-SVM中進行訓練,得到的最優(yōu)C和g為0.935和0.068,則測試集的識別結果如圖6所示。

圖6 基于SPA-HRDE與HBA-SVM識別結果
由圖6可以發(fā)現(xiàn),除了一個C1樣本被誤識別為C4樣本外,其他全部樣本的狀態(tài)都實現(xiàn)了準確的判斷,故障識別準確率達到了99.6%,這表明所提方法能夠有效的判斷離心泵的不同故障類型,具有一定的優(yōu)越性。
為了驗證SPA-HRDE方法進行故障特征提取的優(yōu)越性,利用HRDE,EMD-HRDE,EMD-MRDE,SPA-HDE,SPA-MRDE和SPA-MPE故障特征提取算法進行對比分析。其中MPE的嵌入維數(shù)為6,時間延遲為1。
將上述6種故障特征提取方法提取的故障特征輸入至HBA-SVM中進行故障識別,結果如圖7所示。

圖7 六種方法的HBA-SVM識別結果
由圖7可知,6種方法的識別準確率均低于所提方法,這證明所提特征提取方法是有效且優(yōu)越的。圖7a和圖7b對比,EMD-HRDE的準確率低于HRDE,這是因為僅選取了前2階模態(tài)分量進行特征提取,忽略了其他模態(tài)分量中的故障信息,相比于直接對原始信號進行分析,其造成大量故障信息被遺漏。而所提方法分解只得到了2個分量,不存在分量選擇的難題,因而分析效率更高。
對比圖7d、圖7e和圖7f,可知HRDE的性能優(yōu)于HDE,MRDE和MPE方法,這與之前的分析相一致,即HRDE通過采用層次處理和反向散布熵相結合的分析,能夠從信號中提取出更高質量的故障特征,從而優(yōu)于這3種方法。總之,所提出的SPA-HRDE特征提取方法不僅避免了分量選擇的問題,而且能夠取得較好的特征提取效果。
為驗證HBA-SVM分類器的優(yōu)越性和高效率,利用灰狼優(yōu)化算法(GWO)、粒子群優(yōu)化算法(PSO)、鯨魚優(yōu)化算法(WOA)、遺傳優(yōu)化算法(GA)和麻雀搜索算法(SSA)進行對比,6種優(yōu)化算法的參數(shù)設置如表2所示。

表2 優(yōu)化算法的參數(shù)設置Tab.2 Parameter setting of optimization algorithm
優(yōu)化過程中的適應度迭代曲線如圖8所示。可以發(fā)現(xiàn),HBA-SVM和PSO-SVM均在第2次迭代時得到了各自的最優(yōu)解,這表明HBA和PSO的收斂速度較快,但是PSO優(yōu)化得到的結果是局部最優(yōu)。GA-SVM優(yōu)化曲線在第38次迭代時才獲得最終的結果,GWO-SVM在第29次迭代時獲得最終結果,2個算法的收斂速度較慢, 且優(yōu)化得到的結果不是全局最優(yōu)。從收斂速度和搜索性能來看,優(yōu)化算法性能的排序為HBA 圖8 優(yōu)化適應度迭代曲線 經(jīng)過6種算法優(yōu)化出適應度最佳對應的C和g代入至SVM參數(shù)進行故障識別,C和g的優(yōu)化取值及6種算法的診斷結果如表3所示。 表3 離心泵的不同分類器故障診斷結果Tab.3 Fault diagnosis results of different classifiers for centrifugal pumps 由表3可知,每種算法優(yōu)化得到的2個參數(shù)不一致,而HBA-SVM的優(yōu)化結果最佳,測試樣本的準確率達到了99.2%。在優(yōu)化的總時間上,WOA-SVM分類器的迭代時間最少,為1.36 s,而HBA-SVM的優(yōu)化時長為1.63 s,僅高于WOA-SVM和GWO-SVM,低于另外3種分類器,這證明了HBA-SVM不僅具有較好的優(yōu)化性能,而且效率也較高。此外,未優(yōu)化的SVM取得了91.2%的準確率,低于其他優(yōu)化后的SVM,這證明了優(yōu)化的必要性。因為固定的參數(shù)設置無法適用于不同場景的分類識別問題。 本試驗的滾動軸承聲信號數(shù)據(jù)采集自圖9所示的滾動軸承故障模擬試驗臺。 圖9 滾動軸承試驗裝置 該數(shù)據(jù)集在2050 r/min的轉速下以70 kHz的采樣頻率,通過型號為ECM8000的麥克風傳感器,收集滾動軸承輻射的聲信號。試驗軸承為圓柱滾子軸承,型號為NU205E。設置3種故障狀態(tài),內(nèi)圈破損、外圈破損、滾動體破損,如圖10所示。每種故障狀態(tài)包含2種故障尺寸,因此,總共包含7種工作狀態(tài),分別是1種健康,6種故障。 圖10 軸承的4種健康狀態(tài)視圖[26] 利用無重疊的方式進行樣本的構造,每個樣本的長度為2048,構造好的實驗樣本如表4所示,共有7種工況,分為1個健康和6類故障。 表4 滾動軸承聲信號樣本Tab.4 Acoustic signal sample of rolling bearing 滾動軸承4種工作狀態(tài)下的聲音信號波形如圖11所示。 圖11 滾動軸承各狀態(tài)的聲信號波形 通過SPA對聲信號進行循環(huán)分解,直至全部樣本都完成分解,得到對應的趨勢分量和去趨勢分量。隨后,采用HRDE提取趨勢和去趨勢分量的故障特征,如圖12所示。 圖12 滾動軸承7種狀態(tài)的HRDE值 由圖12可知,7種狀態(tài)的熵值曲線出現(xiàn)了部分重疊交叉現(xiàn)象,如C4和C5樣本具有相同的趨勢,同時熵值非常接近。而其他幾種狀態(tài)的熵值曲線具有比較好的分離效果,能夠很好的表征軸承的故障狀態(tài)。 為了進一步量化SPA-HRDE方法的可行性,將其提取的故障特征輸入至HBA-SVM中進行故障識別,隨機從樣本中抽取50組特征進行訓練,將測試特征輸入訓練好的分類器進行診斷,如圖13所示。 圖13 基于SPA-HRDE與HBA-SVM識別結果 由圖13可知:有4類軸承樣本出現(xiàn)了識別錯誤,其中C2,C3和C5僅出現(xiàn)了一個錯誤樣本,而C4出現(xiàn)錯誤的樣本較多。C1,C6和C7樣本的識別準確率為100%,總的識別準確率為96.86%,證明所提方法能夠較為準確的識別軸承不同類型和損傷等級的故障,但在識別內(nèi)圈故障時有效性較差。 隨后,采用3.1節(jié)中的6種方法進行對比以驗證所提的SPA-HRDE方法的優(yōu)越性,將6種方法提取的故障特征進行HBA-SVM識別,如圖14所示。 圖14 6種方法的HBA-SVM識別結果 由圖14可知,6種方法的識別準確率均低于圖13所提方法,證明了所提方法的優(yōu)越性。可以注意到,6種方法均無法完全識別內(nèi)圈破損,出現(xiàn)了較多的識別錯誤樣本,表明內(nèi)圈破損信號的復雜度與其他信號比較接近,難以準確進行區(qū)分。此外,HRDE方法的識別準確率僅有88%,低于其他5種方法,這證明了采用EMD和SPA進行信號預處理的有效性。 為了對比不同優(yōu)化算法的有效性和優(yōu)越性,利用上節(jié)中的6種算法進行對比分析,對由SPA-HRDE提取的故障特征進行故障識別,具體的故障識別結果如表5所示。 表5 離心泵的不同分類器故障診斷結果Tab.5 Fault diagnosis results of different classifiers for centrifugal pumps 由表4可知,HBA-SVM分類器的診斷準確率最高,WOA-SVM次之,GA-SVM最低,這證明了HBA-SVM的優(yōu)越性,根據(jù)迭代的時間來看,HBA-SVM的效率僅高于SSA-SVM,低于另外4種分類器,證明HBA-SVM的泛化性犧牲了效率,但彼此的效率相差不大,總的性能是能接受的。 針對現(xiàn)有機械設備故障診斷方法一般基于振動信號,而振動信號在獲取時存在接觸式采集,易對設備產(chǎn)生負面影響的問題,提出了一種基于SPA和HRDE的機械設備聲信號故障診斷方法。研究結論如下: (1) 在進行SPA-HRDE進行特征提取的基礎上,HBA-SVM模型的故障識別準確率達到了99.6%和96.86%,高于其他特征提取方法; (2) HBA-SVM分類器的診斷準確率優(yōu)于其他分類器,而迭代速度彼此之間差距較小,因此HBA-SVM具有較優(yōu)異的泛化性; (3) 所提出的基于SPA-HRDE和HBA-SVM故障診斷方法能夠準確的識別離心泵和滾動軸承的故障類型,在診斷準確率和診斷效率方面具有一定的工程使用價值。

3.2 滾動軸承故障診斷








4 結論