(北京衛星制造廠有限公司,北京 100090)
隨著科學技術的迅猛發展,機械設備日益呈現出大型化、復雜化、智能化、集成化等特點。這些特點不僅使得更高的運行可靠性、安全性和經濟性成為迫切的需求,同時也為設備的狀態監測和維修管理提出了新的挑戰[1-4]。滾動軸承(Rolling Bearing)作為機械領域應用最廣泛的一種通用部件,在未來工業發展的歷程中將繼續扮演至關重要的角色,大型復雜機械設備長時間運行過程中,類似軸承這樣的關鍵部件很容易出現磨損、疲勞、過載、腐蝕等現象,并進一步造成部件的局部損傷。任何一個細微的損傷都有可能影響機械設備的安全、穩定運行,甚至威脅到人們的生命與財產安全,因此研究能有效識別關鍵部件故障嚴重程度的方法具有重要的現實意義。
近幾年,許多學者針對定量的基于知識的故障診斷方法進行了研究。這些研究內容大體可以分為兩個主要的方面:一方面是,針對特定研究對象監測信號的特點,通過構建更加有效的信號處理方法來提取故障特征,如Wu,Costa等人提出的基于熵值的特征提取方法[5-6],Tian等人提出的基于譜峭度(Spectral Kurtosis,SK)的特征提取方法[7],以及時頻域特征提取方法[8-9];另一方面是,針對故障識別過程,利用各種模式識別方法來學習特征與故障模式之間的映射關系,從而實現自動化的故障識別。近幾年許多模式識別方法被應用于故障診斷問題中,例如 k 近鄰方法(k-Nearest Neighbor,KNN)、人工神經網絡方法(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM)等。Lei 等人根據每一個特征在識別過程中的有效程度不同,構建了基于特征加權 Euclidean 距離的KNN齒輪裂紋程度故障識別方法[10]。結合經驗模態分解(Empirical Mode Decomposition,EMD)和局部均值分解(Local Mean Decomposition,LMD)等特征提取方法,KNN 也被應用于軸承的故障診斷問題中[11-12]。除 KNN 方法之外,ANN 也是一種被廣泛應用于故障識別問題的方法,并且多種神經網絡模型已經被應用于該問題中。多層感知機(Multilayer Perceptron,MLP)是最典型的一類前饋神經網絡模型,通常利用后向傳播(Back Propagation,BP) 算法來學習模型的參數。在構建故障識別模型的過程中,如何優化 MLP 模型的網絡結構是一個重要的研究問題,現在故障診斷領域遺傳算法(Genetic Algorithm,GA)[13]和粒子群優化算法(Particle Swarm Optimization,PSO)[14]已經被用來解決網絡結構的優化問題。
本文針對不同工況下的軸承故障嚴重程度識別問題,提出了一種基于局部均值分解(Local Mean Decomposition,LMD)和遺傳神經網絡自適應增強(Genetic Neural Network Adaptive Boosting,GNN-Adaboost)的滾動軸承故障嚴重程度識別方法。 該方法合理結合了特征提取和模式識別方法的優點,可有效提高滾動軸承故障嚴重程度識別準確率。
滾動軸承通過將運轉中的軸座和軸之間的摩擦形式由滑動摩擦轉變為滾動摩擦以減少由摩擦引起的機械設備損傷。滾動軸承的典型結構一般包括外圈、內圈、滾動體及保持架,如圖1所示。
一般情況下,機械設備在運轉過程中產生的振動主要由兩個方面的原因共同作用引起:一方面是整體或局部不平衡狀態、結構不對中、共振效應以及其他零
件等外部原因;另一方面是軸承結構特點、制造加工和安裝等流程產生的誤差,以及自身損傷故障等內部原因。通常情況下可以將滾動軸承的振動分為以下幾類:
① 軸承結構引起的振動。這種振動是由軸承的固有性質引起的,與軸承是否異常沒有直接關系。如由于軸承運轉過程中,滾動體在不同位置受力程度不同引起軸頸中心偏移而產生的振動等。
② 加工精度引起的振動。這種振動是由加工精度引起的,當加工精度較低時,會引起軸承的振動。如軸承滾動體大小不同、接觸表面粗糙程度不同等。
③ 軸承工作狀態引起的振動。這種振動是由軸承運轉過程中狀態的改變而引起的,如由于加工和后期磨損引起的軸承偏心、軸承出現異常甚至故障情況等。
軸承在長時間的運轉過程中由于保養或使用不當等原因會產生不同部位、不同程度的損壞,即使在正常情況下,軸承工作一段時間后也會出現疲勞故障。常見的軸承故障類型有疲勞剝落、磨損、腐蝕、破損、壓痕、膠合和保持架損壞等。滾動軸承在運轉過程中,當軸承的各個零件經過故障損傷點時會因為相互撞擊形成一系列的脈沖波,并具有一定的周期性,一般來說,把這種脈沖波稱為沖擊脈沖波,其產生的頻率稱為故障特征頻率。滾動軸承主要的故障頻率計算公式如下。
① 內圈故障特征頻率。
(1)
② 外圈故障特征頻率。
(2)
③ 滾動體故障特征頻率。
(3)
④ 保持架故障特征頻率。
(4)
式中,fr為內圈隨軸旋轉的頻率;dm為軸承節圓直徑;Dd為滾動體的直徑;α為接觸角;N為滾動體數量。
軸承發生故障時,產生的周期性沖擊信號具有調幅-調頻特征,而 LMD方法可以將復雜的多分量調幅調頻信號分解為單分量的調幅調頻信號,且分解結果保持原信號的幅值與頻率變化,因此LMD方法非常適合處理滾動軸承故障信號等非平穩非線性且多分量的振動信號[15-16]。
LMD方法將原始信號x(t)分解為PF分量與殘余分量r(t),其中PF分量由瞬時幅值與純調頻信號相乘得到,由純調頻信號又可求得信號的瞬時頻率。忽略殘余分量r(t),原始信號x(t)可以表示為瞬時幅值與瞬時頻率的函數S(f,t),即
(5)
式中,ei(t)為第i個PF分量的瞬時幅值;fi(t)為第i個PF分量的瞬時頻率;k為PF分量的個數。
對原始信號x(t)的分解過程如下:

(6)
② 利用局部均值點,按式(7)計算相鄰兩個極值點aj和aj+1之間的包絡估計值bj,將所有的bj連接后對折線進行平滑處理,得到包絡估計函數b11(t)。
(7)
(8)
(9)
④ 如果s11(t)不是一個純調頻信號,即它的包絡估計函數b12(t)不滿足b12(t)=1,則將s11(t)作為原始信號x(t),重復步驟①~步驟③,直到s1n(t)是一個純調頻信號,即-1≤s1n(t)≤1,它的包絡估計函數b1(n+1)(t)滿足b1(n+1)(t)=1,則有
(10)
(11)
?
(12)
式中:
(13)
(14)
?
(15)
迭代終止條件為
(16)
迭代分解過程在實際應用中是無法實現的,為了獲得較為理想的純調頻信號,設定一個微小量Δ,當滿足1-Δ≤b1n(t)≤1+Δ時,迭代終止。
⑤ 把迭代過程中產生的所有包絡估計函數相乘便可以得到包絡信號(瞬時幅值函數):
(17)
⑥ 將包絡信號b1(t)和純調頻信號s1n(t)相乘便可以得到原始信號的第 1 個PF分量,如式(18)所示。第一個分量包含了原始信號中最高的頻率成分,PF1(t)的瞬時幅值即為包絡信號b1(t),瞬時頻率f1(t)可由式(19)求出。
PF1(t)=b1(t)s1n(t)
(18)
(19)
⑦ 將PF1(t)從原始信號中分離出來,得到新的信號u1(t)。
u1(t)=x(t)-PF1(t)
(20)
⑧ 將u1(t)作為原始信號x(t)重復步驟①~步驟⑦,循環k次,直到uk(t)為一個單調函數為止。
u1(t)=x(t)-PF1(t)
(21)
u2(t)=u1(t)-PF2(t)
(22)
?
uk(t)=uk-1(t)-PFk(t)
(23)
原始信號x(t)被分解為k個PF分量和一個單調函數uk(t)之和,即
(24)
通過LMD方法將原始信號x(t)分解為k個PF分量和一個單調函數uk(t)之和,將瞬時幅值bp(t)和瞬時頻率fp(t)帶入式(5),原始信號x(t)可以表示為瞬時幅值與瞬時頻率的函數S(f,t),即
(25)
根據原始信號x(t)的時頻分布表示形式,可以計算信號在時頻空間的局部能量,即
(26)
由于PF能量矩在考慮能量大小的同時也考慮到能量大小隨時間的分布情況,與僅計算能量值相比,PF能量矩能更好地揭示能量在時間軸上的分布統計特性,因此可以將能量矩作為反映滾動軸承故障特征參數的一部分,進而提高模式識別等方法對滾動軸承的故障類型和故障程度進行分類識別的能力。
遺傳神經網絡(GNN)結合了遺傳算法較強的搜索能力和神經網絡較強能實現非線性映射等特點,在故障辨識領域應用廣泛。
遺傳算法GA(Genetic Algorithm)通過模擬生物進化過程中遺傳選擇的理論建立數學模型,根據遺傳學中染色體復制、交叉、變異等過程,設計出了一系列遺傳算子,遺傳算子作為遺傳算法的操作基礎,對遺傳算法的性能起著決定性作用[17-19]。
遺傳算法的基本流程如下。
① 編碼。對可行域內的點依次進行編碼。常見的編碼方式有實數編碼、0/1編碼等。經過編碼的數據或樣本被稱為個體,隨機從個體集合中選取一部分個體,組成初始種群,作為遺傳進化的第一代。
② 復制、交叉和變異。從種群中隨機選取部分個體,并對其進行復制、交叉和變異操作。常見的交叉方式為單點交叉和多點交叉,常見的變異方式為單點變異和多點變異。交叉和變異操作會產生新的個體,使種群多樣性增加,提高了更優解出現的概率,防止算法陷入局部最優。
③ 選擇。對種群中的個體計算適應度作為尋優信息,從種群中選擇適應度高的個體保留下來,淘汰適應度低的個體,更新種群。
④ 迭代。重復步驟①~步驟③,直至算法收斂。
遺傳算法流程圖如圖2所示。

圖2 遺傳算法流程圖
GNN是一種利用GA算法優化神經網絡的智能算法,GNN的基本步驟如下:
① 樣本輸入。將從原始信號中提取的特征參數作為GNN網絡的輸入。
② 網絡訓練。設定神經網絡的結構、權值、適應度函數等,將樣本輸入設計好的網絡中,對比網絡的實際輸出與期望輸出,直到兩者誤差滿足精度要求即可停止訓練,得到訓練好的網絡。若誤差不滿足精度要求,則修改網絡權值重復訓練,直到滿足精度要求為止。
③ 樣本測試。選取未經過訓練的樣本作為測試樣本 ,輸入到步驟②中已經訓練好的網絡中,得出判斷結果,并對結果進行分析。
GNN流程圖如圖3所示。
Adaboost (Adaptive Boosting)是由Yoav Freund和Robert Schapire在1995年提出的一種將多個弱分類器組合成強分類器的自適應增強方法。其自適應在于,該算法可以對前一個弱分類器分錯的樣本增強其對應的權值,權值更新后的樣本被用來訓練下一個新的弱分類器[20-21]。在每次訓練中,都用樣本總體訓練新的弱分類器,并產生新的樣本權值以及該弱分類器的話語權,一直迭代直到達到最大迭代次數或預設的錯誤率。
對于訓練集A={(x1;y1)…,(xq;yq)…,(xD;yD)},yq∈Y={1,2,…,K},其中D為樣本總數,設迭代最大次數為T,則算法流程如下:

圖3 GNN算法流程圖
① 初始化訓練數據的權值。對每一個訓練樣本,初始化時賦予同樣的權值W=1/D,設第i次迭代訓練集的權值集合為Wi={wi1,wi2,…,wiq,…,wiD},i≤T,wiq為第i次迭代時的第q個樣本的權值。當i=1時,wiq=1/D,q=1,2,…,D。
② 對每個特征f,用具有權值分布Wi的訓練樣本集訓練弱分類器Gf,i(x,f,θ,δ),計算弱分類器的加權錯誤率εf,i為
(27)
式中,θ為弱分類器的閾值;δ為弱分類器的偏差參數。
③ 按最小錯誤率選取最佳弱分類器Gi(x)。
(28)
④ 按最佳分類器調整權重。
(29)
式中,βi=εi/(1-εi)為更新因子;eq為分類檢測變量,當樣本xq被分類正確時,eq=0,否則eq=1。
⑤ 重復步驟①~步驟④,直到i=T,則最后的強分類器為
(30)

GNN-Adaboost算法將GNN作為Adaboost算法的弱分類器,可以高效地解決分類問題。GNN-Adaboost算法的具體步驟如下:
① 樣本預處理與網絡初始化。從樣本空間中隨機選擇D組樣本作為訓練集A,按3.2節中的步驟①初始化樣本權值Wi;確定GNN的結構和閾值。

③ 確定弱分類器的權重。根據各個GNN的預測效果,即εi,計算各個GNN弱分類器的權重αi。

GNN-Adaboost算法流程圖如圖4所示。

圖4 GNN-Adaboost算法流程圖
本文基于LMD方法與GNN-Adaboost算法,提出了一種針對滾動軸承的故障嚴重程度識別方法。對滾動軸承原始信號進行局部均值分解,得到各個PF分量,并計算PF能量矩,結合原始信號的時域特征值,包括方差、偏度、峭度,組成滾動軸承振動信號的特征參數。將特征參數作為GNN-Adaboost算法的輸入樣本,進行訓練與測試,具體流程如圖5所示。

圖5 基于LMD和GNN-Adaboost的軸承故障程度識別流程圖
數據集A、B、C均取自西儲大學(CWRU)的滾動軸承故障診斷數據集[22],如表1所示。測試軸承型號為6205-2RS SKF的深溝球軸承,將振動加速度傳感器固定于軸承上方,采集正常、內圈故障、外圈故障和滾動體故障的振動信號,且每種故障類型包含3個故障程度,即損傷直徑分別為0.178 mm,0.356 mm,0.533 mm,采樣頻率為12000 Hz。A、B、C三組數據對應的測試負載分別為0hp,1hp,2hp(0 kW,0.7355 kW,1.4710 kW),對應的轉速分別為1797 r/min,1772 r/min,1750 r/min,1730 r/min。

表1 數據集A/B/C/D詳細信息
對4.2節中的A、B、C三組數據進行基于LMD的能量矩提取。以工況0hp下的正常軸承為例,其LMD分解結果如圖6所示。圖7為分解所得的6個PF分量對應的能量柱狀圖,由圖可知能量主要集中在前5個PF分量中,因此在后續的軸承振動信號PF分量能量矩提取過程中均選擇前5個PF分量。

圖7 正常軸承信號在0hp工況下的PF能量矩
當載荷為1hp時,各級損傷程度對PF分量能量矩的影響如表2所示,通過對270組數據的測試與分析發現,不同故障類型在同一損傷程度下,外圈故障的第一階PF分量的能量最大,內圈故障其次,滾動體故障最小。此外,根據式(1)~式(3)可計算實驗軸承的內圈故障特征頻率、外圈故障特征頻率、滾動體故障特征頻率分別為162.19 Hz,107.36 Hz ,141.17 Hz,而各類故障信號的PF分量中PF4分量對應的頻率最接近各故障特征頻率,分別為161.90 Hz,106.84 Hz,142.3 Hz,且由表2可知,隨著損傷程度的增加,內圈故障和外圈故障的PF4分量的能量均先減小后增加,而滾動體故障的PF4分量的能量先增加后減少,說明滾動軸承振動信經過LMD分解后的PF分量能量矩可以作為表征軸承故障類型和故障程度的特征參數。

表2 損傷程度對PF分量能量矩的影響
提取滾動軸承原始信號的時域特征,并與4.3節中的PF能量矩組合,形成包含8個分量的特征參數組,如表3所示。

表3 基于PF能量矩與時域特征的滾動軸承特征參數組
以表3所示的滾動軸承特征參數組作為GNN-Adaboost算法的輸入,以表1所示的數據標簽作為GNN-Adaboost算法的分類依據。本文所有算法和程序均用Matlab R2018a編程軟件實現,運行環境為Windows10專業版,Intel Core i5-8400 CPU @ 2.80GHz,16GB RAM。為了保證本文所提出的方法的合理性,從A、B、C三個數據集中,分別隨機選取各個載荷條件和損傷程度條件下的樣本中的70%作為訓練集,其余30%作為測試集。為了驗證本文所提出的方法的有效性,將本文所提方法的故障嚴重度識別準確率與其他方法的識別準確率進行對比,對比結果如表4所示,其中SVM表示支持向量機。
由表4可知,本文所提出的基于LMD和GNN-Adaboost算法的軸承故障嚴重度識別方法與基于EMD或基于GNN算法、SVM的方法相比,準確率更高,說明本文所提的方法能更合理地提取反映軸承故障類型和故障嚴重程度的特征參數,且能更有效、更準確地對所提取的特征參數進行分類。
本文針對滾動軸承故障嚴重度識別問題,分析了滾動軸承的振動機理和主要的故障類型,針對常見的故障類型,即內圈故障、外圈故障和滾動體故障,設計了基于LMD和GNN-Adaboost算法的故障嚴重度識別方法。基于LMD的軸承信號分解方法有效地將滾動軸承的振動信號分解為多個具有瞬時頻率意義的分量PF,通過分析這些PF分量的能量分布情況及其所包含的頻率值發現,不同故障類型的PF分量能量不同,外圈故障的第一階PF分量能量最高,內圈其次,滾動體的第一階PF分量能量最低。同時,考慮到3種不同故障類型的故障頻率,經過分析發現第4階PF分量的瞬時頻率最接近故障頻率,且隨著故障程度的加深,內圈故障和外圈故障的PF4分量的能量均先減小后增加,而滾動體故障的PF4分量的能量先增加后減少,說明PF分量的能量分布可以有效地表征軸承的故障類型和故障程度。通過整合軸承信號的PF分量能量矩和原始信號的時域特征值,得到了包含8個分量的特征參數組,并以該特征參數組作為GNN-Adaboost算法的輸入,實現對軸承故障類型和故障程度的分類。經過訓練與測試,并與其他方法對比發現,基于LMD和GNN-Adaboost算法的滾動軸承故障程度識別方法具有更高的識別準確率。

表4 不同工況下不同方法的滾動軸承故障嚴重度識別準確率
當然,目前對于滾動軸承故障特征提取的方法仍然有待提高,根據實驗結果可以發現,經過LMD分解后的故障特征頻率分量所占的能量比較低,今后的研究重點將放在如何強化故障頻率對信號分解結果的影響,以更好地提高分類算法對故障嚴重程度的敏感度。