于廣偉, 閆莉
(西安工業大學 機電工程學院, 陜西 西安 710021)
滾動軸承是常見且用途廣泛的一類機械器件。然而,滾動軸承常常工作于高溫、高速和重載的復雜服役環境,導致其關鍵構件故障時有發生。因此,進行早期異常檢測和故障診斷對保障滾動軸承的安全運行至關重要。
數據驅動的智能故障診斷方法通常分為3個步驟:振動信號采集、故障特征提取和模式識別。其中,故障特征提取的準確程度直接影響到分類結果。有許多特征提取算法已經得到了廣泛的應用,如時頻域特征、基于復雜度的特征、基于人工智能算法提取的特征等[1]。由于工作環境復雜、滾動體的非線性剛度等因素,旋轉機械的振動信號通常是非線性、非平穩的。
然而,在旋轉機械診斷過程中,為線性信號設計的傳統時域和頻域特征提取技術總是難以提取到有效特征[2]。此時,表現信號復雜程度的非線性信號定量描述方法逐漸進入研究人員的視野[3]。熵可以測量時間序列的無序程度,因此它可以反映出旋轉機械發生故障時系統動力學的突變行為[4-5]。Kolmogorov在1958年提出了K-S熵,用于描述一個系統的復雜性[6]。Pincus在K-S熵的基礎上上提出了近似熵(ApEn),這種算法通過考慮時間序列中生成新信息的速度來衡量信號的復雜性[7]。之后,Richman和Moorman提出樣本熵(SE),以解決ApEn中的自匹配問題[8]。Chen等將模糊隸屬度函數引入樣本熵,并提出了更準確的模糊熵(FE)[9]。此外,一些研究人員將時間序列符號化以觀察信號的變化,如排列熵(PE)和符號動力學熵(SDE)[10-11]。符號動力學熵將振動加速度信號符號化處理,通過比對信號在相空間中的排列模式和產生新模式的概率衡量信號復雜度,具有良好的抗噪性和計算效率。
結合Costa提出的多尺度思想,Li等提出了多尺度符號動力學熵(MSDE),它可以提取振動信號中不同尺度下蘊含的信息[11-12]?,F在得到廣泛應用的熵值方法僅有特征提取功能,這需要大量的標記數據來訓練智能模型進行分類。上述基于熵的方法適用于處理具有相同分布的訓練和測試數據。這意味著需要在診斷前獲取大量同分布的數據。但是,在實際生產應用當中獲取此類數據存在許多困難:
1) 設備不允許在故障狀態下長時間運行,這使得很難獲得大量故障數據。
2) 設備可能僅因一種類型的故障而出現故障,難以收集到所有類型的故障數據。
3) 不可能對要診斷的每個設備實施模擬。
因此,在現實世界中,很難獲得足夠的標記數據來訓練模型。模型只能使用不符合同分布假設的數據進行訓練。這就是本文重點關注的跨域故障診斷問題。
為了解決這個問題,許多研究人員試圖進一步對特征進行數學變換,以減少訓練數據和測試數據之間的分布差異,然后將變換后的特征輸入分類器。這就是基于特征的遷移學習算法的思路。例如,Pan和Yang等提出的最大均值差異嵌入(MMDE)算法[13-14]、在此基礎上發展出的遷移成分分析(TCA)方法[15]、Zheng等于2017年提出遷移局部保持投影(TLPPIFI)算法[16]等。這些遷移學習方法降低了變換后特征的最大均值差異(MMD),使得通過不同分布的數據來識別故障類型成為可能[17]。
本文方法的主要思想是在提取振動信號的MSDE特征后,構建一個降維投影矩陣,將源域和目標域的MSDE特征投影到一個子空間中,使得具有相同類別的樣本更加聚類。
MSDE能夠在不同的尺度下提取滾動軸承的故障信息,同時還具有較好的抗噪性和較高的計算效率。根據文獻[11],計算方法如下:

(1)
式中,τ為尺度,且為正整數,通過調節其值可得不同尺度的時間序列。


(2)

(3)


圖1 MSDE的計算流程


注:N、MT、CT分別代表正常、缺齒和裂齒3種情況;45H表示在45 Hz旋轉頻率和高負載下收集的數據條件圖2 MSDE特征的遷移能力示意圖

(4)
L=LLpp+λLMMD+μLR
(5)
式中:λ>0是MMD項的折衷參數;μ>0是正則化參數。
1.2.1LLpp項
LLpp項的構建方法與核LPP[4]方法相同,如公式(6)所示
LLpp=tr(αTKLKα)
s.t.αTKDKα=I
(6)

值得一提的是,在MTSDE方法中,同一類型的故障的特征作為高維向量,在空間內具有相似的角度。因此樣本鄰邊的權重與余弦距離而非歐式距離相關,這能夠更好地定義相鄰關系。
權重矩陣W的計算如公式(7)所示,余弦距離的定義如公式(8)所示

(7)

(8)
LLpp項的目的是學習樣本之間的角鄰接關系,通過加入LLpp項,可以使得投影后的樣本仍舊保持原有的角鄰關系,這有助于對無標簽的目標域樣本進行分類。
1.2.2LMMD項
MTSDE的第二個目標是最小化學習過程中2個域的分布差異,直接借鑒最大均值差異(MMD)來描述域間差異。令{C1,C2,…,Cg}∈{1,…,C}代表源域和目標域中共享同類標簽的樣本,LMMD項計算如公式(9)所示

隨后,將z=vTφ(x),vT=[φ(x1),…,φ(xn+m)]α代入公式(10),LMMD可進一步改寫為(11)所示的形式
LMMD=tr(αTKMKα)
(11)

(Mc)ij=

(12)
1.2.3LR項
增加正則化項來控制α的復雜度,同時,該正則化項也避免了在求解最小化問題時的秩缺陷,計算如下
LR=tr(αTα)
(13)
將(6)、(11)和(13)代入公式(5),最后模型的目標函數如下
arg min tr(αTKLKα)+λtr(αTKMKα)+μtr(αTα)
s.t.αTKDKα=I
(14)
使用拉格朗日乘子法處理公式(14),即轉化為求解公式(15)。

(15)
上述問題解法類似TCA方法,最終的解α*是(KLK+λKMK+μI)-1KDK最大的l個特征值對應的特征向量組成的矩陣。

(16)
在遷移模型中有5個參數。每個參數對模型的影響為:σ∈R是熱核的尺度參數,僅影響相似性矩陣的值;k∈N是最近鄰節點個數,控制著鄰接圖的結構;MMD項折衷參數λ>0與不同域之間的分布差異有關;正則化參數μ>0控制模型的復雜性;子空間的維度參數l∈N影響MTSDE特征的維數。
請注意,在選擇這些參數時需要考慮兩點。第一,最優參數是在目標域數據上迭代得到的。在遷移學習情景中,源域和目標域的數據分布不同,因此,傳統分類算法的交叉驗證策略無法使用。使用MTSDE算法時,使用源域數據訓練模型,然后使用目標域數據測試不同參數組合下的診斷準確率。最后根據準確率不斷更新參數組合,直到達到最高精度。它可以降低模型的過擬合風險,提高模型的泛化能力。第二,需要更高效的搜索算法選擇不同的參數組合。在MTSDE算法中,使用貝葉斯優化算法來對參數組合進行尋優,而不是傳統的網格搜索或隨機搜索算法。采取這一策略主要有3個原因:
1) 貝葉斯優化算法利用高斯過程不斷更新先驗參數信息,而其他搜索方法不能考慮以前的參數信息。
2) 貝葉斯優化在尋找最佳參數組合時迭代次數更少,計算效率更高。相比之下,網格搜索要遍歷所有參數組合,效率低下。
3) 貝葉斯優化在非凸優化問題上性能優于網格搜索方法,網格搜索方法很容易陷入局部最優解。
基于MTSDE算法和SVM分類器的優勢,本文提出的跨域故障診斷策略的實施步驟如下:
1) 提取目標域及源域采樣信號的符號動力學熵特征,將時延參數t選擇為1,嵌入維數m選擇范圍[2,5],類別參數c選擇范圍[2,10],尺度參數τ選擇范圍為[1,25];
2) 使用全部源域樣本和目標域的正常類型樣本訓練遷移學習模型,得到降維投影矩陣α=[α1,α2,,…,αn+m]T∈R(n+m)×l;
3) 根據貝葉斯優化算法,優化模型的7個超參數:最近鄰節點數量k∈[1,11]、MMD項權重λ∈[0.001,1 000]、正則化參數、子空間的維數l∈[1,10],以及MSDE特征提取時的尺度τ∈[1,25],嵌入維數m∈[2,5],符號數ε∈[2,10]。將貝葉斯優化器的參數設置為:網格尺度20 000,迭代次數100,得到最佳的參數組合,根據最高識別準確率,生成最終的投影矩陣;
4) 根據公式(16)將變換后的源域及目標域的MTSDE特征輸入SVM分類器進行訓練,并計算準確率。
圖3展示了本文方法的計算流程。

圖3 MTSDE-SVM跨域智能故障診斷算法的流程
1) 齒輪箱數據集
2.4 兩組患者心肌酶、LVEF、E峰/A峰比值水平比較 觀察組患者CK-MB水平高于對照組,LVEF、E峰/A峰比值水平低于對照組,差異有統計學意義(P<0.05)。見表3。
齒輪箱數據集來自預測和健康管理協會2009年數據挑戰賽(PHM2009)[18]。圖4展示了實驗平臺和示意圖。實驗臺由電機、測轉矩傳感器、測力計和電子控制器組成。加速度計傳感器安裝在齒輪箱的輸入和輸出端收集振動數據。這一數據集包含3種健康狀態,包括正常(N)、缺齒(MT)和齒缺陷(CT)。要模擬遷移學習場景,需要在不同的轉速條件下(30,35,40,45和50 Hz)和不同的負載條件下(高負載和低負載)選擇數據,來構建不同分布的數據。模擬不平衡的數據集條件,每個域包含200個正常樣本和100×2個故障樣本。在下文中,數字表示旋轉速度,包括30,35,40,45和50 Hz,“H,L”分別表示 “高負載”和“低負載”。例如, 30 H表示在30 Hz旋轉速度和高負載條件下采集的樣品。

圖4 齒輪箱試驗臺的結構示意圖
2) 滾動軸承數據集
CWRU數據集:實驗二中域A和域B的數據收集自凱斯西儲大學的軸承數據中心[19],因此實驗軸承均為SKF 6205-2RS深溝球軸承,但A和B的操作條件不同。圖5展示了試驗臺及其結構示意圖。數據集A由從電機驅動端以0 kW(1 797 r/min)的速度采集的振動信號組成,這些振動信號包含4個不同的健康狀態:正常狀態(N)、外圈故障(OR)、內圈故障(IR)和球故障(B)。對于OR、IR和B狀態,包括3個嚴重程度(0.18,0.36和0.53 mm)的振動信號。數據集B在2.24 kW(1 730 r/min)的條件下采集4種不同的健康狀況下的信號,同樣的,每個故障類別也包含3個嚴重程度信號。數據集A和B中信號的采樣頻率為12 kHz,采樣長度為4 000。

圖5 試驗臺及其結構
MFPT數據集:實驗二的域C收集自機械故障預防技術學會[20],實驗對象也是深溝球軸承,但與域A、B使用的型號不同。軸承參數如下:螺距直徑為31.62 mm,球的直徑是5.97 mn,接觸角為0°,8個球。數據集C包括3種不同健康狀態下采集的振動信號:正常狀態、外圈故障和內圈故障,圖6展示了故障軸承的形態。正常數據選自1 200 N負載下采集的3個信號。外圈故障選擇自1 333 N負載。內圈故障選擇自1 111 N和1 333 N負載下的信號。軸的轉速為1 500 r/min,從原始信號中每一類采樣100個樣本,長度為18 000,信號的采樣率為48 828 Hz。

圖6 故障軸承的照片
NWPU數據集:這一數據集在HD-FD-H-03X轉子滾動軸承與齒輪箱綜合故障實驗臺上收集得到。實驗對象為6205深溝球滾動軸承。實驗臺的結構如圖7所示。

圖7 HD-FD-H-03X實驗臺及其結構示意圖
本文中使用了通道1的傳感器輸出的加速度信號。樣本在不同的轉速(600和1 000 r/min)和負載下(高:H,中:M,低:L)收集得到,并且包含5種健康類型:正常、內圈點蝕、外圈點蝕、內圈裂紋、外圈裂紋。每一種故障形式又包含3種不同程度的故障(內圈點蝕和外圈點蝕包含1,2和3 mm;內圈裂紋和外圈裂紋包含0.2,0.4和1 mm)。從原始信號中,每一類故障采樣90個樣本,長度為4 000。
實驗一 變速箱的跨域故障診斷實驗。基于PHM09齒輪箱數據集,在不同的旋轉速度和負載下設計了3個故障診斷任務(45H→40L、40L→50H、50L→30H)。同時,在不同旋轉速度,相同負載條件下設計了3個任務(30H→40H,40L→50L,45H→35H),最后3個任務在不同的負載,相同轉速條件下進行(35L→35H,40L→40H,30H→30L)。請注意,在目標域中,有一半的正常狀態的樣本與源域一起訓練模型。
實驗二 軸承的跨域故障診斷?;贑WRU和MFPT數據集,設計6個診斷任務。包括4個四類診斷任務(A→B,A→C,B→A,B→C)和2個三類診斷任務(C→A,C→B)。三類診斷任務中,由于域C沒有球故障數據,刪除來自域A和B的球故障樣本。
實驗三 軸承的跨域故障診斷?;贜WPU數據集,在不同的轉速和負載條件下設計6個診斷任務(600M→1 000H,600L→1 000H,600H→1 000M,1 000H→600L,1 000L→600H,1 000M→600H)。
為了展示本文提出的智能故障診斷方法的優越性,將3個傳統分類算法和3個遷移學習方法設置為對照組。
實施以下7種方法時,首先提取訓練集和測試集的MSDE特征作為輸入。
1) MSDE-SVM
直接使用訓練集的MSDE特征訓練SVM分類器,稱為MSDE-SVM方法。然后,測試集的分類準確率為輸出。實現SVM使用了LIBSVM工具箱。并應用RBF核函數,將權衡參數c的設置為1。
2) MSDE-KNN
實驗流程與MSDE-SVM相同,但使用k近鄰(KNN)分類器代替SVM。在范圍{1,5,9,13,17,21,25,29,33,63}中搜索最近鄰節點的個數,然后取準確率最高的情況作為輸出。
3) MSDE-LR
實驗流程與方法1)和方法2)類似,但采用邏輯回歸(LR)分類方法,并在范圍{0.001,0.01,0.1,1,10}中搜索最佳權衡參數。輸出最高的準確率。
4) MSDE-GFK-SVM
這是一種遷移學習算法,對于MSDE-GFK算法,首先提取MSDE特征,然后通過測地層流式核(GFK)方法將源域特征映射到目標域空間[21],最后使用SVM分類器對映射后的特征進行分類。這里采用的子空間嵌入方法是主成分分析(PCA)。
5) MSDE-SSTCA-SVM
將MSDE特征輸入半監督遷移成分分析 (SSTCA)模型[15]。最優超參數由貝葉斯優化方法搜索。分別在范圍[1,25](在實驗一中是[1,50]),[10-3,103],[1,10],[10-3,1]和[10-3,103]搜索MSDE尺度因子τ、正則化權衡參數μ1、子空間維度l1、監督項權衡參數γ1和幾何項權衡參數λ1。最后將低維特征輸入SVM分類器并輸出診斷精度。
6) MSDE-DAFD-SVM
該方法是基于神經網絡的遷移學習算法,將域深度神經網絡(DAFD)作為遷移策略[22]。MSDE特征被輸入一個3層的神經網絡,然后使用SVM分類器對輸出特征進行分類。
7) MTSDE-SVM
MTSDE-SVM智能故障診斷模型的具體計算流程參照本文第1.3節。對于此方法,將熱核參數設置為常數1。然后應用貝葉斯優化算法在超參數空間中搜索MTSDE-SVM方法的最佳參數。分別在范圍[1,25](在實驗一中是[1,50]),[1,10],[1,10],[10-3,103]和[10-3,103]內搜索參數τ,k,l,λ和μ。此外,SVM中出現的2個參數c和g也使用貝葉斯方法進行了優化。在范圍(0,8]中搜索他們,并得到最終的準確率。
注意,所有實驗中,識別準確率采用公式(17)計算

(17)
1) 診斷準確率分析
實驗一 變速箱的跨域故障診斷實驗準確率如表1所示。結果表明,本文提出的方法在7種方法中識別精度最高,這證實了MTSDE能夠提取出具有遷移性的特征。3種傳統方法:MSDE-SVM、MSDE-KNN和MSDE-LR由于缺乏知識遷移過程,分類精度較低。遷移學習方法中,MSDE-SSTCA-SVM的性能略好于上述3種傳統方法,跨域分類準確度較高。MSDE-GFK方法在30H~40H、45H~35H等單個診斷任務中展現了較好的結果,但隨著源域和目標域的變化,結果并不穩定。與這些方法相比,基于神經網絡的MSDE-DAFD算法執行效果不佳。

表1 實驗一的識別準確率 %
最后,本文方法的準確率高達97.9%。對照實驗結果表明,本文方法不僅能有效地將診斷知識從源域轉移到目標域,而且能在相關性假設下保持跨域故障數據的分布結構信息。
實驗二 實驗二的分類結果在表2中。實驗結果表明,本文提出的方法平均準確度為97.1%,是7種方法中最高的。MTSDE算法優勢的一個重要解釋是,本文方法使用余弦距離來定義相似性,從而在投影后更好地保存了數據的分布特性。7種方法的診斷能力排名與實驗一的結果相似,這進一步驗證了MTSDE在遷移故障診斷中的優勢。例如,2個實驗A→C和B→C的準確率達到 100%,而MSDE-SSTCA-SVM方法在這2個實驗中性能不佳。

表2 實驗二的識別準確率 %
實驗三 實驗三的分類結果呈現在表3中。MTSDE-SVM方法的診斷準確率略低于實驗一和實驗二,但仍然達到了90.3%,超過了其他6種方法。值得一提的是,直接將MSDE特征輸入SVM分類器的MSDE-SVM方法取得了85.7%的診斷準確率,這直接體現了選用的MSDE特征提取算法的優越性。

表3 實驗三的識別準確率 %
2) 分布差異分析

圖8展示了獲得的結果??梢杂^察到,使用本文提出的方法處理后,MMD值顯著降低,這意味著源域和目標域之間的分布差異大大降低,從而在不同的工況下為數據提供更好的遷移能力。
3) 故障特征可視化分析

實驗一的數據來自不同的負載條件,其中二維投影結果顯示在圖9中??梢悦黠@看出,SSTCA方法顯著地將不同的樣本聚類在一起。然而,一些正常的樣本與缺齒故障樣本完全吻合。因此,MTSDE性能更好,分類精度更高。圖10展示從不同數據集收集的實驗二的源域和目標域數據的投影結果。在相同類型的不同機械的診斷情景中,MTSDE方法仍可以聚類相同的故障樣本,具有更好的診斷性能。

圖9 特征可視化 圖10 特征可視化
實驗三的數據是從不同轉速和負載下的機器中收集的。圖11展示了特征在MTSDE、SSTCA和原始空間中的二維可視化圖像。在3種方法中,本文方法具有最佳的聚類性能。圖11c)中顯示,在MTSDE空間中,同類型故障樣本聚類形成的簇更少,使用源域數據(以及目標域的正常數據)在MTSDE空間中訓練出的分類模型更有可能正確識別目標域的樣本。該現象驗證了該方法可以將故障診斷問題知識從源域遷移到目標域。

圖11 特征可視化(1 000M-600 H)
本文提出了基于MTSDE-SVM智能故障診斷方法,用于旋轉機械故障診斷。首先,從訓練樣本中提取MSDE特征。其次,通過遷移學習模型將特征降維得到MTSDE特征,在這個過程中,訓練集和測試集的數據分布差異顯著減小。最后,MTSDE特征作為輸入,訓練SVM分類器用于辨別故障類型。本文的主要貢獻包括:
1) 在多尺度符號動力學熵的基礎上,結合特征遷移學習思想提出一種新的特征提取方法-多尺度遷移符號動力學熵。通過提取具有遷移能力的特征,可以使用非同分布的數據訓練診斷模型,從而解決實際生產中標記數據不足的問題。
2) 在參數優化過程中還對MSDE特征的尺度參數、符號數和嵌入維度進行了尋優,這有助于提高診斷精度。
3) 對滾動軸承的故障診斷實驗表明,與其他傳統機器學習方法相比,本文方法可以獲得更高的診斷精度。這意味著本文提出的方法具有良好的實際應用前景,為不同工況下軸承故障診斷提供了一種新思路。