黃曉玲, 周 磊, 張德平
1(南京航空航天大學 計算機科學與技術學院, 南京 211106)
2(北京中船信息科技有限公司, 北京 100044)
滾動軸承是旋轉機械中易發故障的零件. 在旋轉機械中由軸承損壞引起的故障約占30%. 因此, 滾動軸承故障診斷對旋轉機械設備的狀態監測與維護有著重要意義[1].
傳統的機器學習故障診斷方法流程包括: 數據獲取, 人工設計特征, 特征提取和選擇, 分類器訓練. 然而,在數據預處理階段, 機器學習故障診斷存在一定的局限性: 為復雜操作條件下的數據人工設計特征需要耗費大量人力, 并且嚴重依賴領域專業知識, 難度較高.此外, 特征挖掘和決策是分開設計的, 這種不同步的優化將消耗大量時間并限制模型的性能.
作為機器學習的一個分支, 深度學習方法旨在構建非線性轉換的深度神經網絡, 挖掘數據深層特征. 與傳統數據驅動的機器學習方法相比, 深度學習無需大量專業知識即可自動從原始輸入的簡單表示中學習到隱藏的高級層次特征, 是一種端到端的模型. 基于這些優點, 深度學習在過去幾年中引發了智能故障診斷的浪潮. 陳志剛等[2]提出一種改進集成深層自編碼器方法, 設計了3種小波卷積自編碼器對軸承振動信號進行無監督預訓練和有監督微調, 最后, 為保證診斷結果的準確性和穩定性, 用加權平均法輸出診斷結果. 楊平等[3]基于卷積膠囊網絡, 使用帶有兩個卷積層的卷積網絡直接對原始一維時域信號進行特征提取, 然后將其送入膠囊網絡, 輸出故障診斷結果. 周陳林等[4]基于提出的改進型卷積神經網絡設計基本準則, 挖掘原始信號的特征, 直接用卷積神經網絡在滾動軸承原始振動信號上進行“端到端”的學習訓練. Ramu等[5]提出一種基于希爾伯特變換和人工神經網絡的電機故障診斷方法, 首先提取信號的幅值和頻率成分, 然后以最小均方誤差為優化目標, 訓練人工神經網絡實現對故障的高精度識別. Li等[6]通過小波包變換, 將小波包系數轉化為矩陣形式進而轉化為像素, 形成灰度圖輸入到二維卷積神經網絡中進行故障診斷.
在實際工業環境中, 不同的工作負載會導致同類型故障信號的內部特征分布存在巨大差異, 使得模型在某個工況下訓練完成后, 在另一工況下的數據上表現不佳. 這種因數據分布不同而引起的模型性能下降現象被稱為域適應問題. 深度學習要想應用到工業領域, 必須具有良好的域適應能力, 能夠在變化的工況下實現高精度故障診斷. 目前, 針對深度學習故障診斷的域適應問題, 大多數研究采用遷移學習理論. Wen等[7]提出帶有 51 個卷積層的 TCNN網絡用于故障診斷. 該方法與遷移學習結合, 用預訓練的ResNet-50 網絡對原始二維振動信號進行故障診斷; 院老虎等[8]將收集到的原始振動數據轉換為振動信號圖作為訓練樣本, 用預訓練的AlexNet網絡進行訓練和微調, 完成故障診斷任務. 陳仁祥等[9]提出一種自適應正則化遷移學習,首先訓練基分類器預測目標樣本的偽標簽, 然后利用聯合分布對齊兩域分布, 最后使用結構風險最小化框架建立的分類器完成不同工況下的故障診斷. 但是以上文獻中應用的遷移學習方法仍然依賴于測試集樣本的統計信息, 微調模型需要的參數量大, 且調參步驟復雜, 不具備很好的應用性. 此外, 這些研究因為重點關注模型的遷移能力而忽略了對數據特征的充分預處理過程, 沒有從數據的角度挖掘出能增強網絡識別能力的判別性工況特征, 缺少全面性.
因此, 針對當前研究中存在的數據預處理不充分和深度學習故障診斷方法在域適應上的局限性, 本文提出一種基于特征融合和混類增強的故障診斷方法.貢獻如下:
(1) 針對故障數據特征提取不足的問題, 提出一種特征融合方法, 在數據預處理階段, 綜合考慮原始振動信號的時頻域特征、工況特征和時間差分特征, 并將這些特征與原始信號融合在一起形成新的特征向量,增加特征多樣性.
(2) 針對變工況下數據分布差異大導致模型故障識別率低的問題, 提出一種混類增強策略拓展訓練數據分布, 增大訓練集規模, 增加訓練樣本的多樣性, 使模型學習到數據的本質特征, 提高模型域適應能力.
(3) 在CWRU數據集上的實驗結果表明, 該方法在同工況下的預測精度高達100%, 在變工況下的平均預測精度高達93.28%, 域適應性強.
本文提出的基于特征融合和混類增強的深度滾動軸承故障診斷方法框架如圖1所示.
圖1上方虛線框是訓練過程, 下方虛線框是測試過程. 上方信號和下方信號來源于不同的工況, 即樣本的分布不同. 在訓練過程中, 原始一維振動信號經多特征融合后形成新的一維特征向量, 再經相空間重構轉換成二維圖像信號, 通過本文提出的混類增強策略拓展訓練數據的分布, 提高模型在對抗樣本上的魯棒性.最終, 訓練好的模型可以在訓練樣本分布之外的測試樣本上進行高精度故障診斷. 整個故障診斷流程可以概括為以下5步:

圖1 特征融合和混類增強故障診斷方法框架
(1) 對原始信號采用時頻分析方法提取時頻特征,并根據工況條件構建工況特征, 再計算時間差分特征,然后將這3類特征與原始一維信號融合, 得到新的一維特征向量;
(2) 基于相空間重構理論, 將新的一維信號樣本轉換為二維圖像格式, 作為神經網絡的輸入;
(3) 對轉換后的訓練樣本做混類增強, 構造新的虛擬樣本和虛擬標簽, 擴充訓練樣本分布;
(4) 用混類增強后得到的樣本作為訓練集輸入ResNet18網絡中訓練模型;
(5) 將訓練完畢的模型在未做過混類增強的樣本上測試, 獲得故障診斷分類結果.
得益于硬件的高速發展, 現代工業設備的歷史數據大多由傳感器記錄保存. 但是, 傳感器獲取的數據可能會存在異常值, 適當的故障特征提取可以減輕異常值對故障診斷的負面影響.
由于機械故障信號存在周期性脈沖, 因此提取具有信息性和判別性的時頻域特征有助于提高故障數據的質量[10]. 另一方面, 故障數據的原始特征通常是固定的, 當設備在單一工況下運行時, 這些特征用于故障診斷是足夠的. 當設備在變化的負載中工作時, 深度學習模型無法僅利用單工況下的固定特征掌握數據的本質信息. 由傳感器在不同操作條件下觀測到的幀間動態變化數據中包含大量的設備降級信息[11], 因此, 獲取工況特征和時間差分特征也是有必要的.
綜上所述, 本文提出一種新的特征融合方法, 在將原始信號輸入模型前對數據進行預處理, 從多個角度提取多個特征, 包括時頻特征、工況特征和時間差分特征, 實現多特征融合, 增加特征多樣性和全面性, 為網絡提供高質量的輸入. 以下是對這些特征的具體描述:
(1) 原始特征: 原始一維振動信號, 由加速度計獲得, 未經過任何處理, 形式為時間序列.
(2) 時頻特征: 時窗信號的最大值、均值、方差、均方根值、偏度、峰度、峰值、譜偏態系數、譜峰態系數、小波系數. 對于小波系數, 本文使用db1進行8級小波包分解, 得到與故障特征頻率相關的能量較高的小波系數. 每個時頻特征是一個統計值, 統計出的多個時頻特征可以構建形成新的一維時頻特征向量.表1給出了各個時頻特征的計算公式.

表1 時頻特征計算公式
(3) 工況特征: 當前工作條件的獨熱(one-hot)編碼. 以本文實驗的4種工況為例, 獨熱編碼對應的特征向量分別為 [1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0,0, 1].
(4) 時間差分特征: 由于樣本是時間序列, 將每個樣本看成一個時間窗, 計算該時間窗內的變化幅度特征, 構成時間差分特征向量. 具體地, 定義一個時間窗的時間序列為:
X=(x1,x2,···,xm)
以第一個時間點為起點, 依次從后往前求后一個時間點對應值相對于前一個時間點對應值的變化幅度,作為新的特征, 即:

最終得到新的時間差分特征向量為:

為解決新的時間序列與原始時間序列的時間點錯位問題(新時間序列的第i個點表示的是原始特征序列的第i+1個點相對前一時間點的變化幅度), 通過時間窗進行序列劃分時, 從第2個時間窗開始, 其起始時間為上一時間窗結束時間, 這樣可以保證數據變化特征的連續性.
經過以上步驟后, 將提取的時頻特征向量、工況特征向量和時間差分特征向量與原始一維信號拼接形成新的一維特征向量, 該向量增加了特定工況下的判別性信息, 更具全面性, 如圖2所示.

圖2 新的特征向量
本文設計的一維振動信號到二維時頻特征圖像的轉換過程如圖3所示, 包括兩個步驟:

圖3 故障信號到圖像的轉換
(1) 一維振動信號采樣, 經第1.1節的特征融合方法形成新的一維特征向量;
(2) 一維特征向量重構為二維圖像.
以一維格式為輸入數據的故障診斷方法受感受野限制, 在學習的過程中很難提取到設備故障固有模式的相關特征. 與一維信號相比, 圖像是二維數據矩陣,能夠承載更強大的信息, 表示更復雜的結構分布. 為了捕獲周期性信號的特征并利用深度神經網絡在圖像分類上的強大特征提取能力, 本文基于相空間重構理論,將特征融合后的一維信號重構為二維圖像格式作為深度神經網絡的輸入, 具體轉換過程為:
(1) 將原始一維信號劃分為n個相等的部分;
(2) 每個部分按信號圖像的行順序排列:

其中,I表示重構后的信號圖像,x(t)是t時刻的振動信號. 得到二維圖像格式的樣本后, 對每個樣本歸一化處理并賦予像素值:

其中,pi表 示當前樣本的第i個采樣點,pmin和pmax分別表示當前樣本所有采樣點的最小值和最大值. 轉換后的圖像格式為單通道, 為了滿足本文選用神經網絡模型的輸入格式, 將單通道拓展為3通道, 每個通道擁有相同的信息.
深度學習的另一個局限性在于: 網絡深度的增加會帶來許多優化相關問題, 如梯度爆炸、消失等. 深度殘差網絡(residual network, ResNet)[12]的提出有效緩解了深度神經網絡模型增加層數后帶來的退化問題,從根本上杜絕了梯度消失現象, 分類和收斂性能均優于普通的深層網絡結構. 因此本文采用深度殘差網絡作為故障診斷訓練模型.深度殘差網絡由殘差模塊構建, 圖4展示了殘差網絡塊的結構.
如圖4所示, 在殘差塊中, 輸入可通過跨層的數據線路更快地向前傳播, 不會給網絡增加額外的參數和計算量. 殘差網絡通過采用這樣一種跳躍連接的結構,學習信號的差值, 在保持網絡深度的同時提高了模型準確率, 并且易于優化. 由于工業落地環境要求神經網絡模型有速度快、體型小的特點, ResNet18網絡相較于其他ResNet50、ResNet101等網絡更為輕量, 并且足夠完成實驗中數據場景, 因此本文選用ResNet18網絡作為訓練模型, 該網絡有17個卷積層和1個全連接層.

圖4 殘差網絡塊結構示意圖
深度神經網絡模型訓練、更新參數的依據來源于給定的訓練數據, 但是在故障診斷領域, 單一工況下的訓練數據只涵蓋整個數據分布的一部分, 導致訓練出來的網絡只能在擁有類似分布的數據上表現良好, 在分布差異大的數據上表現不佳. 為了充分利用有限數據, 更好地描述數據的整個分布, 提高模型的域適應能力, 有必要進行數據增強[13]. 在計算機視覺領域, 傳統的數據增強方式通過對圖像進行裁剪、旋轉、縮放等幾何變換生成新的訓練樣本, 圖像標簽保持不變. 然而, 這樣的數據增強方法存在以下局限性[14]:
(1) 生成的新樣本局限于同一類別;
(2) 不同類別不同樣本之間的關系沒有被建模;
(3) 由于先驗知識有限, 能拓展的分布也有限, 模型仍然可能會產生過擬合現象.
為解決上述問題, 本文提出一種新的混類增強方法, 改善故障診斷模型在變工況下由于數據分布不一致表現出的域適應性差的問題. 該方法是一種非常規的數據增強方式, 通過線性插值得到新的拓展數據, 即來源于訓練樣本鄰近分布的虛擬訓練樣本和標簽.混類增強對樣本的處理過程如下:

其中,xi和xj代表從訓練數據中隨機抽取的兩個樣本,yi和yj代表對應的標簽獨熱編碼. λ ~Beta[α,α],α∈(0,∞). 從式(4)和式(5)可以看出, 新的樣本——標簽數據 (x?,y?)由兩個樣本——標簽數據對以凸組合的方式線性疊加生成. 該方法使得新樣本來源于訓練樣本的鄰近分布, 不同樣本間的分布更為平滑, 規范了模型的線性表達, 加強了模型抵御分布外的對抗樣本的能力. 混類增強實際可以看作對模型的一種正則化方案. 此外, 混類增強的實現簡單而有效, 符合奧卡姆剃刀原理.
混類增強具體算法如算法1.

算法1. 混類增強算法D={(xi,yi)}Ni=1輸入: 數據集 批次大小M D={(?xi,?yi)}Ni=1輸出: 數據集{xi,yi}Mi=1←Sample(D,M)1) #按批次采樣樣本;Shuffle({xi,yi}Mi=1)2) #隨機打亂順序;3) #隨機配對樣本;for{(xi,yi),(xj,yj)}inPairData{(xi,yi)Mi=1,(xj,yj)Mj=1}do λ←Beta(α,α)4) #采樣樣本的混類因子;?x=λxi+(1-λ)xj 5) #按式(2)合成虛擬樣本;?y=λyi+(1-λ)yj 6) #按式(3)合成虛擬標簽.
為了驗證本文提出方法的有效性, 在美國凱斯西儲大學(CWRU)軸承實驗數據上進行了測試. 關于數據集更詳細的信息可在文獻[15]中查看. 該數據來源于驅動端軸承, 由加速度傳感器計以12 kHz的頻率采集得到. 滾動軸承有4種故障類型: 內圈故障、滾動體故障、外圈故障、正常. 每種故障類型的故障直徑分別為0.017 78 cm, 0.035 56 cm和0.053 34 cm, 因此, 共有10種故障標簽. 表2為滾動軸承數據集的具體描述.數據集A為在轉速1 772 RPM、負載1馬力下收集的振動信號, 數據集B為在轉速1 750 RPM、負載2馬力下收集的振動信號, 數據集C為在轉速1 730 RPM、負載3馬力下收集的振動信號, 數據集D為在轉速1 772 RPM、1 750 RPM、1 730 RPM和負載1、2、3馬力下收集的混合振動信號.

表2 數據集描述
實驗以1 024個采樣點作為一個樣本, 每種故障類型采樣2 200個樣本. 訓練時, 長度為1 024的樣本會被重塑為32×32大小的矩陣, 以二維圖像格式作為ResNet18網絡的輸入. 訓練集、驗證集、測試集的劃分比例為6:2:2. 模型訓練的參數設置如表3所示.

表3 參數設置
本文實驗在Windows 10 的64位操作系統下進行, 內存為16 GB, 處理器為Intel(R) Core(TM) i7-9750H CPU. 所用深度學習框架為TensorFlow和Keras,編程語言為Python 3.6.
為了驗證本文所提方法的優越性, 將其與流行的WDCNN[16]、TICNN[17]、LeNet-5網絡[18]和孿生神經網絡模型[19]在同一實驗環境下進行單一工況、變工況對比分析. 表4給出了不同模型在單一工況下的準確率對比.

表4 單一工況結果對比 (%)
由表4可知, 在單一工況下, WDCNN、TICNN、LeNet-5和孿生神經網絡模型的平均分類精度都可達到97%以上, 但是本文的混類增強模型的平均分類精度可達到100%, 優于現有的流行方法.
表5為變工況下域適應方案設置的具體描述. 其中, 源域指打上標簽的訓練數據, 目標域指未打標簽的測試數據. 根據3種不同工況下數據集的組合, 共有6種域適應方案設置.

表5 域適應方案設置
表6給出了變工況下各個模型在數據集A、B、C的6種域適應設置方案上對滾動軸承故障分類準確率的對比分析結果.

表6 變工況結果對比 (%)
由表6可知, WDCNN、TICNN和孿生神經網絡模型在域適應方案設置中的平均精度在80%以上,LeNet-5模型的平均精度最低, 僅有66%. 受變工況操作條件影響, 這幾種模型的精度與在單一工況下相比都下降了很多. 而本文方法的平均精度達到了93.28%,比WDCNN提高了3.6%, 比One-shot提高了11.52%,比Five-shot提高了11.43%, 比TICNN提高了8.35%,比LeNet-5提高了27.28%, 明顯改善了模型的域適應性, 提高了模型的泛化能力. 實驗結表表明, 在跨域分類問題上, 基于特征融合和混類增強的深度學習滾動軸承故障診斷方法抗干擾能力強, 有效解決了故障診斷在實際工業中因跨域導致特征差異大而無法識別的問題.
本節設計消融實驗分別探索特征融合和混類增強對故障診斷精度提升的貢獻, 表7為具體對比方案. 其中, 方案1對一維信號做特征融合, 在訓練模型時不加入混類增強策略; 方案2用原始一維信號重構二維圖像, 不加入特征融合, 在模型訓練時采用混類增強; 方案3即本文提出方法, 對一維信號做特征融合形成新的特征向量, 重構成二維圖像后在訓練時采用混類增強策略.

表7 方案對比
其中, 方案1對一維信號做特征融合, 在訓練模型時不加入混類增強策略; 方案2用原始一維信號重構二維圖像, 不加入特征融合, 在模型訓練時采用混類增強; 方案3即本文提出方法, 對一維信號做特征融合形成新的特征向量, 重構成二維圖像后在訓練時采用混類增強策略.
表8和表9分別展示了方案1、方案2、方案3在單一工況和變工況下的模型故障診斷分類結果.

表9 變工況結果對比 (%)
由表8可知, 在單一工況下, 方案1和方案2都可以達到99%以上的分類精度, 但是方案3可以使模型提高到100%的分類精度, 證明了特征融合和混類增強結合的有效性, 在單工況條件下表現極佳.

表8 單一工況結果對比 (%)
由表9可知, 在域適應方案設置中, 方案3的平均分類精度分別比方案1、方案2的平均分類精度高8.13%和10.8%. 在域適應設置C→A和C→B中, 方案3相較于方案1和方案2, 分類精度提升十分明顯,最大提升跨度可達28.57%.
綜上, 可得出結論: 特征融合和混類增強結合的方法比僅做特征融合和僅做混類增強的方法在單一工況和變工況下具有更好的分類性能和域適應能力. 本文提出的特征融合和混類增強結合的方法對提高模型同工況下的分類精度和變工況下的域適應能力具有顯著效果.
第2節以準確率為評價指標, 通過比較網絡分類層的最終預測標簽與真實標簽獲得模型的精度, 以此評估模型的有效性. 本節從網絡的中間層出發, 用特征可視化來展示神經網絡對樣本特征的學習過程, 驗證本文提出方法對不同故障類別的識別能力, 增加網絡的可解釋性.
本節采用t-SNE (t-distributed stochastic neighbor embedding)方法[20]對故障樣本的分類過程進行降維和特征可視化. t-SNE方法可以將高維數據映射到適合人類直覺觀察的低維空間, 是一種出色的非線性降維方法, 非常適合數據探索和可視化分析.
圖5(a)–圖5(f)以數據集D為例, 展示了測試樣本在已經訓練好的網絡結構上從中間層到最后一個全連接層的特征分布. 圖中每種顏色類別代表一類故障標簽, 共有10類.
圖5可以看出, 在早期的一些層中, 從圖5(a)到圖5(c), 特征是重疊聚合在一起的, 無法輕易區分. 從圖5(d)到圖5(f), 隨著層數的逐漸加深, 每個類別的特征點開始聚類在一起, 10個故障的類別特征變得越來越可分割, 說明訓練好的神經網絡模型分類效果顯著.

圖5 特征可視化示意圖
t-SNE可視化直觀形象地展示了神經網絡訓練過程中層與層之間逐步提取更深層次數據內部特征的步驟, 增加了網絡的可解釋性, 同時驗證了本文提出方法能夠很好地學習到樣本特征, 實現高精度的故障診斷.
針對深度學習滾動軸承故障診斷模型數據預處理不充分和域適應性差的問題, 本文提出了一種基于特融合和混類增強的故障診斷方法. 該方法在深度學習的基礎上加入了特征工程, 在數據預處理階段綜合考慮原始信號的時域特征、工況特征和時間差分特征,
豐富特征表示, 改善訓練數據的質量. 在模型訓練階段,提出一種混類增強策略構造虛擬樣本和標簽, 拓展訓練數據分布, 增加訓練集多樣性, 并利用ResNet18強大的特征提取能力學習數據的本質特征. 實驗結果表明, 該方法有效緩解了深度學習故障診斷在不同工況下故障識別率低的問題, 提高了滾動軸承故障診斷模型的域適應能力, 適合變工況下故障診斷. 在未來工作中, 將嘗試優化網絡結構, 進一步提高模型收斂速度.