韓正功,周知進,李 玢
(1.貴州理工學院機械工程學院,貴州 貴陽 550003;2.貴陽市建筑設計院有限公司,貴州 貴陽 550081)
滾動軸承,是機械系統眾多零件中最常見的傳動易損易耗件。特別是高速運行中,軸承的故障診斷保障機器安全可靠運行起著重要作用[1]。因此,快速、準確、便捷地診斷軸承故障,判別故障類型具有重大意義。
目前,國內外學者對滾動軸承的故障診斷相關理論與技術進行了大量研究。文獻[2]基于集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)奇異值熵判據劃分出了軸承不同工況類別。文獻[3]采用了自適應白噪聲的完整集成經驗模態分解方法(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)有效分解了降噪信號。文獻[4]通過主成分分析法對模糊熵(Fuzzy Entropy,FuzzyEn)特征向量進行可視化降維。文獻[5]提出了概率主成分分析(Probabilistic Principal Component Analysis,PPCA)結合經驗小波變換的軸承輕微故障診斷方法,去除噪聲干擾,重構故障信號。文獻[6]將基于自適應核主成分分析和支持向量機(Support Vector Machine,SVM)的方法消除了冗余數據。文獻[7-9]分別采用了粒子群優化算法(Particle Swarm Optimization,PSO)、遺傳算法(Genetic Algorithm,GA)、灰狼算法(Grey Wolf Optimizer,GWO)對SVM中分類準確率有較大影響的懲罰因子C和參數σ進行優化,均取得一定效果,提高了軸承診斷精度。鯨魚優化算法(Whale Optimization Algorithm,WOA)是文獻[10]在2016年提出的一種模擬座頭鯨狩獵行為的新穎群體元啟發式優化算法,WOA算法具有原理簡單、操作簡便,容易實現,需調參數少,魯棒性強等優點,但WOA 算法也可能會有易陷入局部最優、收斂速度慢、收斂后期出現停滯的缺陷[11],仍需要進一步改進。
綜上所述,提出了一種基于CEEMDAN-FuzzyEn-PPCA 新型的特征提取方法和一種改進鯨魚優化算法優化向量機參數的IWOA-SVM 軸承故障診斷模型,用于提高滾動軸承的故障識別準確率和效率。
CEEMDAN算法是基于EEMD提出的,它能進行原始信號的精確重建,且需要不到一半的篩選迭代而降低計算成本。若給定一原始信號s[n],CEEMDAN算法如下:
(1)利用EMD 對信號s[n]+δ0wi[n]進行分解,式中:i在1,2…,I中取值;δ0為噪聲標準偏差,wi~N(0,1),定義第一個CEEMDAN模態分量為:

(3)定義Ek[·]為對給定信號進行EMD分解后的第k個模態分量,繼續對信號r1[n]+δ1E1(wi[n]) 進行分解,直到解出第一個EMD分量,δk(k=1)在每個階段都可以選擇信噪比,同時定義第二個CEEMDAN模態分量:

(6)下一個k轉到(4),重復(4)~(6),直到余量不能被繼續分解,得到余量R[n],最終轉換為s[n]的表達式。
可在每個階段調整δi,選取不同信噪比的噪聲,并最終通過CEEMDAN算法準確重構原始信號[12]。
基于雖然近似熵與樣本熵等方法也能分析非線性動力學參數,但因它們使用硬閾值判據的緣故,當距離在閾值參數附近出現微小變化時,會導致不同判別結果,影響統計穩定性。而利用模糊熵FuzzyEn在向量重構中加入了去均值化算法,用模糊隸屬度函數替代硬閾值判據,減少依賴于參數選擇以及數據長度,對于噪聲更加魯棒,熵值更加穩定[13],已被成功用于滾動軸承故障診斷領域[14-15]。在信號特征提取時,不同故障類型信號復雜程度不同,其FuzzyEn值也會不同。
給定一個時間序列{t(i),i=1,2…,N},其中,FuzzyEn 算法中引入模糊隸屬度函數算法如下:

故原時間序列的FuzzyEn值為當N趨向于無窮大時,ln?m(r)與ln?m+1(r)差值的極限值。不同FuzzyEn特征值對影響軸承故障類型不一樣,若將所有特征值都用于故障識別,定會增加計算數量和時間。
為改善在工程實際應用中主成分分析技術(Principal Components Analysis,PCA)不能很好地抓住數據的真實子空間結構且降維后直接丟棄子空間外信息[16-17]的這種情況,可用PPCA來處理。
它將傳統PCA中丟棄的非主成分因子以噪聲方差形式引入到隱變量模型求解,在確定主元和誤差的概率函數后,通過期望最大(EM)算法估計參數來建立最佳概率模型。
對于一個由N個d維向量構成的數據向量集x,引入q維隱變量y與之相關:x=Wy+u+ε
式中:ε—觀測噪聲向量ε~N(0,σI2);隱變量y~N(0,I)(I為單位矩陣);u=—樣本均值;W—d×q參數矩陣。
觀測數據的似然函數為:

式中:C=WWT+σ2Id;S—觀測樣本的協方差矩陣。
未知參數W,σ2用極大似然法進行估計,其最優解為:

式中:R—任意正交矩陣;λk—樣本協方差矩陣的第k個最大特征值;Λq=diag(λ1,λ2,…,λq);λk對應的特征向量作為Uq的第k個列向量(k=1,2,…,q)。
PPCA 既可消除噪聲,又能保留信號特征,甚至能增強這種能力,運速比PCA 快,效果比PCA 好,能避免信息冗余,降低維數,現已應用于特征提取與模態識別等領域[5]。
SVM是由文獻[18]基于統計理論提出的一種較為完善的無監督學習方法,它能夠有效解決小樣本、非線性、維數高的問題。給定一組訓練樣本集{(xi,yi)},i=1,2,…,N,式中:輸入向量xi∈Rd,d—輸入的維數,yi∈{- 1,+1} 是類別標簽。
利用SVM 通過訓練樣本構建一個分類函數:y=ωTΦ(x)+b,式中:ω—高維法向量;b—偏移量。
當數據不能線性分離時,引入松弛變量ξi允許錯誤分類,同時引入懲罰因子C對錯誤分類進行懲罰,則SVM 最優分類的超平面問題可轉化為求最小值,可表示為:

式中:‖ω‖—歐式距離;C—懲罰因子;ξ—松弛因子。
SVM 引入的懲罰因子C越大,即懲罰越大,會引起過度學習,致使分類器的泛化能力降低,反之,則會導致分類器的分類正確率過低,甚至失效,故C的選擇會直接影響SVM的學習能力。
對于式(7),再引入拉格朗日系數a,轉為求解:

通過求解最小L(a),最終得到SVM的分類模型為:

而構造出一個具有良好性能的SVM,核函數的選擇同樣是關鍵。常見核函數中因RBF核函數只包含參數σ,對其優化比較簡便,故采用RBF核函數,其定義及適應度函數f分別為:

式中:σ—RBF 核函數參數,它影響樣本在特征空間分布的復雜性。
懲罰因子C反映容錯能力,C值越大,易過擬合,反之則欠擬合,過大或過小,其泛化能力變差。參數σ反映支持向量的數量,影響SVM 訓練與預測的速度,σ值越大,支持向量越少,反之則多,過大過小都會使得SVM的推廣及分類能力變差[19]。故將C和σ作為關鍵尋優變量,能有效地提高SVM分類器的精度。
WOA是一種比較新穎的自然啟發的元啟發式優化技術,它能夠很好地平衡收斂速度和收斂效率進而找到全局最優,被廣泛應用于函數優化[20-21]等問題上。
座頭鯨獨特的泡泡網狩獵策略,如圖1所示。WOA算法模仿座頭鯨的狩獵行為,其狩獵過程主要分為尋找獵物,環繞獵物和氣泡捕食三個階段。

圖1 座頭鯨獨特的泡泡網狩獵策略Fig.1 Bubble-Net Feeding Behavior of Humpback Whales
假設座頭鯨種群規模為N,求解問題的搜索空間維度為D,則第i只鯨魚在D維空間中的位置可表示成i=1,2,…,N,獵物的位置(或最優鯨魚位置)對應于問題的全局最優解。
環繞獵物階段:座頭鯨能夠識別獵物位置并將其包圍。由于在求解最優前對全局最優位置沒有任何先驗知識,假設當前最優解就是目標獵物或接近最優解。在定義好最優鯨魚的位置后,其他鯨魚便會向最優鯨魚位置游去,從而更新自身的位置。算法如下:

式中:t—當前迭代;Y(t)—第t代中鯨魚個體的位置;Y*(t)—第t代中最優鯨魚的位置(獵物位置),且伴隨每次迭代更新自身位置。A和C是系數向量,它們定義為:

式中:r—[0,1]之間的隨機數;a—收斂因子,隨著迭代次數的增加從2線性遞減到0。
氣泡捕食階段(局部搜索):為了對座頭鯨的捕食行為進行數學模擬,設計了有兩種描述方法,即縮小環繞機制和螺旋更新位置。縮小環繞機制,是通過式(11)隨收斂因子a的線性遞減從2到0來更新自身位置(在鯨魚當前位置和獵物位置之間的任一位置);螺旋更新位置,是模擬座頭鯨作螺旋運動來捕獲獵物,其算法描述如下:

式中:D′= |Y*(t)-Y(t)|—第i個鯨魚到獵物的距離;b—螺旋常數;l—[-1,1]中的隨機數。同時假設座頭鯨這兩種捕食行為發生的概率各占一半,即在優化問題中,縮小環繞機制和螺旋更新位置的概率各為50%,即算法表示為:

式中:p—[0,1]之間的隨機數。
尋找獵物階段(全局搜索):事實上,座頭鯨會根據彼此位置進行隨機搜索,其算法如下:

式中:Yr—當前種群中隨機一只鯨魚的位置。
WOA算法對基于群體迭代的優化算法來說,也難免會出現搜索能力差、收斂速度慢、易陷入局部最優等問題[21]。故引入PSO 算法中的慣性權重w與“飛行”速度v更新座頭鯨的位置,用于更好地隨機探索搜索空間,跳出局部最優,IWOA 算法描述如下:
在全局搜索階段:

在環繞獵物階段:

在局部搜索階段:

式中:慣性權重w=1-rand()/2;rand()為[0,1]之間的隨機數;
種群中座頭鯨的位置更新:

故采用改進IWOA算法對SVM懲罰因子C與核函數參數σ進行參數優化選取。綜上,IWOA-SVM 算法的參數選擇步驟如下:
(1)初始化座頭鯨種群。初始化IWOA 算法參數a,A,C,w,v,l,p以及最大迭代次數tmax,在搜索空間隨機生成初始座頭鯨個體,令t=1。
(2)根據鯨魚群體的當前位置,獲取C及σ值,并利用訓練集數據建立SVM分類模型,在考慮適應度函數的獎勵與懲罰機制下,利用測試集數據計算出各個鯨魚個體的適應度值進行比較,并記錄最優鯨魚位置Y*。
(3)更新種群中座頭鯨位置。若p<0.5且 |A|<1,座頭鯨按照式(17)和式(19)更新自身當前位置,否則,按照式(16)和式(19)更新,避免局部極值,跳出局部搜索。若p≥0.5,則依據式(18)、式(13)和式(19)更新。
(4)更新IWOA算法參數a,A,C,w,v,l,p,搜索全局最優。
(5)計算更新后種群中鯨魚個體的適應度值,再次進行評價,重新確定新的全局最優鯨魚個體及其位置。
(6)判斷是否滿足算法的終止條件,即是否達到最大迭代次數,若未達到,則跳轉至步驟3繼續迭代;否則算法結束,輸出Y*,獲得全局最佳參數Cbest及σbest。
因磨損發生故障的滾動軸承在運行的過程中,會產生振動和噪聲,故通過傳感器采集振動數據。
(1)輸入原始故障信號進行CEEMDAN算法分解,提取信號分解后的模態分量IMF。
(2)選擇FuzzyEn熵值較小的幾個IMF分量做故障特征提取分析,重構原始信號。
(3)運用PPCA 進行故障信號的主特征提取,并剔除冗余信息,完成之后得到包含有效故障信息的數據集。
(4)將該數據集等分為訓練集與測試集,其中,將訓練集輸入IWOA-SVM模型進行參數尋優,采取十折交叉驗證運行30次,最后選取均值作為最后的結果。CEEMDAN-FuzzyEn-PPCAIWOA-SVM故障診斷模型算法的總體流程,如圖2所示。

圖2 故障診斷組合模型的流程圖Fig.2 Flowchart of the Fault Diagnosis Portfolio Model
為驗證所提出的新型特征提取方法和故障診斷模型的可行性和有效性,利用美國凱斯西儲大學(CWRU)電氣工程實驗室故障模擬實驗臺所采集的SKF6205滾動軸承數據[22]對其進行驗證,通過對比GA-SVM、PSO-SVM、WOA-SVM等優化方法來強調所提方法的優越性。
該實驗的振動數據是在電機空載,且轉速為1797r/min、采樣頻率為12000Hz的工況下進行采集,實驗使用電火花加工技術在軸承上布置單點故障,故障寬直徑為0.1778mm、深度為0.2794mm,采集到正常、內圈故障、外圈故障和滾動體故障四種狀態的振動信號。
利用CEEMDAN算法對四種振動信號的樣本數據進行分解得到各自的IMF模態分量,對四種振動信號的前三個IMF分量分別求取FuzzyEn熵值,并進行PPCA主特征提取,預處理完成之后取每類樣本各200組,其中訓練集和測試集樣本各一半。CEEMDAN-FuzzyEn處理后的主成分空間分布,如圖3所示。由圖3可見,采用CEEMDAN-FuzzyEn方法提取的故障振動信號的前三個主成分大致實現了軸承故障狀態的區分和辨別。PPCA特征提取處理后結果,如圖4所示。由圖4可見,對樣本進行PPCA分析去除冗余信息,實現了主要的精簡的故障特征的提取。

圖3 CEEMDAN-FuzzyEn處理后的主成分空間分布Fig.3 Spatial Distribution of Principal Components After CEEMDAN-FuzzyEn Treatment

圖4 PPCA主特征提取結果Fig.4 Main Feature Extraction Results of PPCA
對前期預處理好的正常、內圈故障、外圈故障和滾動體故障四類軸承數據樣本分別選用GA-SVM、PSO-SVM、WOA-SVM和IWOA-SVM模型進行實驗,即采用GA、PSO、WOA和IWOA算法分別對SVM分類器參數C和σ進行尋優,每種算法實驗20次,其他實驗條件均在同等情況下進行,如初始種群N、迭代次數t分別設置20、100。為了評估SVM分類器的性能,實驗中同時統計了測試集的最長、最短和平均尋優時間、平均準確率、標準差等五個數據作為評判標準,四種算法經十折交叉驗證。
四種不同故障診斷模型實驗對比結果,如表1所示。由表1可知:WOA-SVM 和IWOA-SVM 測試集的平均尋優時間分別為11.64s、3.96s,相比GA-SVM(112.87s)和PSO-SVM(88.49s)都極大幅縮短了收斂時間,平均準確率達到了98.45%、98.63%,相比兩者提高了(3~4)%,故障識別時間與精準的效果表現得更好,特別地,IWOA算法相比于WOA,平均尋優時間更降低了7.68s,縮短了2/3,平均準確率提高了0.18%,使得尋優速度更快,準確度更高,表現出改進后的IWOA 算法優越性。此外,相比于GA、PSO、WOA算法,IWOA算法的平均尋優時間的標準差值(0.36)約為PSO(3.70)與WOA(3.40)的1/10,約為GA 算法(8.58)的1/25,說明IWOA 算法在尋優時間上能趨于一致,表現出極大的穩定性。從IWOA平均準確率的標準差值(0.10)來看,同樣也是幾種算法中最小,說明IWOA-SVM模型能更好解決算法容易陷入局部最優的問題,確保診斷結果的準確性。

表1 四種不同故障診斷模型實驗對比結果Tab.1 Experimental Comparison Results of Four Different Fault Diagnosis Models
綜上,IWOA-SVM 的收斂速度更快,穩定性更高,更容易達到最優分類,對于軸承故障診斷能力更強,識別準確率更高。實驗驗證了IWOA算法對于SVM參數尋優在軸承故障診斷的可行性與優越性。
(1)實驗利用基于CEEMDAN-FuzzyEn-PPCA 新型的特征提取方法,將CEEMDAN運用于故障振動信號的重構,FuzzyEn熵值應用于區分軸承不同故障狀態的特征參數,采用PPCA進行軸承故障主特征提取,取得了較好的前期預處理效果。
(2)將PSO算法中的慣性權重與粒子“飛行”速度引入WOA,得到改進鯨魚優化算IWOA,通過IWOA算法獲得了SVM的最優參數,解決了SVM分類器對于傳統優化算法出現的搜索能力差、收斂速度慢、容易陷入局部極值的問題。
(3)對比了四種故障診斷方法:GA-SVM、PSO-SVM、WOASVM和IWOA-SVM,利用改進鯨魚優化算法優化向量機參數的IWOA-SVM 軸承故障診斷模型,驗證了IWOA算法對于SVM 參數尋優在軸承故障診斷的可行性與優越性,為軸承的故障診斷提供了新思路。