孫 巖, 彭高亮
(哈爾濱工業大學 機電工程學院, 哈爾濱 150001)
滾動軸承在各類機電一體化設備中使用廣泛,由于工作過程中長時間旋轉磨損、高溫等原因,軸承故障是常發故障之一. 軸承發生故障可能造成嚴重的經濟損失或人員傷亡,因此提高診斷效率和準確率十分重要. 軸承故障診斷方法經歷了人工經驗判斷、信號時域分析[1]、頻域譜分析[2]、時頻域分析[3]、模態分析[4]等階段,目前應用廣泛的方法有人工經驗判斷,如經驗豐富的工人通過聽機器響動判斷工作狀態;時域指標分析如峭度值、平滑指數、基尼指數等;頻域分析如傅里葉變換包絡分析;時頻域分析如短時傅里葉變換、小波變換、S變換等;模態分析即信號通過一定規則分解,得到模態分量后分析的方法,如EMD分解后包絡譜分析等. 目前,機電一體化產品日益增多,而傳統的故障診斷方法要求人員具有較高的經驗知識,且需多指標聯合分析后得出診斷結論,無法滿足自動化診斷的需求.
隨著人工智能技術的發展,應用決策樹[5]、支持向量機[6]、樸素貝葉斯[7]等機器學習手段開展故障診斷日益增多,特別是以卷積神經網絡為代表的深度學習方法的使用,使故障診斷逐步走向智能化、自動化. ZHANG Wei等[8]提出了一種基于一維深度卷積網絡的故障診斷模型,實現了基于一維卷積神經網絡端到端的診斷模式;黃馳城[9]利用時頻變換和三種經典卷積神經網絡模型,實現了二維卷積神經網絡在軸承故障診斷中的應用. 雖然一維、二維卷積神經網絡均在故障診斷中取得了一定的效果,但存在神經元輸入輸出采用標量形式導致的細節特征提取不足,池化層丟失部分有用信息,較大規模網絡才能提取更詳細特征等一系列問題,因此提出許多改進方案. 本文采用的基礎膠囊網絡結構由Hinton 等提出,主要思想為將神經元標量輸入輸出改為向量形式,網絡結構保留空間位置等信息,舍棄池化層結構,從而實現更好的效果. Hinton 等提出的膠囊網絡特征提取部分僅采用單層卷積,在此基礎上楊平等[10]提出了雙卷積層膠囊網絡的診斷方法,相較于單卷積層取得了一定的改進,但雙卷積層膠囊網絡僅增加了一個卷積層,卷積層之間采用串聯式連接,沒有從原始圖像數據中進一步提取特征,細節特征仍存在丟失,特征提取能力需進一步優化.
本文利用膠囊結構的同時,采用多尺度Inception結構,配合空間注意力機制,從原始圖像數據中,進行多尺度的特征提取和關鍵信息的識別,配合損失值計算方法的優化,達到更好的分類診斷效果,通過低信噪比實驗,證明了方法的適用性.
卷積神經網絡特征提取過程主要由卷積結構完成,采用共享卷積核的形式對輸入圖像或矩陣進行局部卷積運算,得到結果經激活函數非線性化輸入下一層. 采用k×k卷積核的卷積過程公式為
式中:ai,j為輸出值,xi,j為第i行j列的元素,ωm,n為第m行n列的權重,參數b為偏置項,f為激活函數,常用的激活函數有sigmoid、tanh、Relu等,其中Relu函數表達式為
y=max(0,x).
式中y為輸出值,x為輸入值.
Relu函數為分段線性函數,所有的負值和0輸出為0,所有的正值輸出原值不變,這種操作為單側抑制,實現稀疏后更好地挖掘相關特征,加速模型收斂.
2012年,AlexNet采用Relu激活函數、全局池化層、Dropout方式得到性能優良的成果后,主流的網絡結構突破大致是網絡更深(層數),但是純粹的增大網絡存在容易過擬合,計算復雜,梯度彌散等問題. 為解決這些問題,GoogleLeNet采用了Inception結構,初始V1結構如圖1所示.

圖1 多尺度卷積結構
Inception結構[11]通過改深度增加為寬度增加的方法,解決梯度彌散等問題,但寬度增加同樣增加了參數量,在后續的改進過程中,V2和V3結構均采用卷積核拆分的方式,V2采用3個3×3的卷積核代替7×7卷積,V3采用1×7和7×1卷積核代替7×7卷積,達到了減小網絡結構的目的. Inception結構展示了特征提取過程中,采用卷積核由小到大的方式可以提取更多的細節特征;多層卷積核通過激活函數的增多,非線性表達能力進一步得到提高;寬度代替深度的增加可以避免一定的梯度彌散.
注意力機制模仿人觀察事物關注重點部位的特點[12],廣泛應用于圖像識別、自然語言處理等領域. 空間注意力機制將原始圖像信息變換到另外一個空間,通過訓練空間轉換模塊輸出與原信息的疊加實現關鍵信息的識別,空間轉換模塊采用類池化的方式,關注重點區域,與原圖像或矩陣的融合保證重點信息不丟失,其結構如圖2所示.

圖2 空間注意力模塊
膠囊網絡的概念在2017年由Hinton提出,主要思想為將神經元的輸入輸出由標量形式改為向量形式,從而擁有空間位置特征提取能力,膠囊向量神經元與普通標量神經元類比如圖3所示.

圖3 標量與向量神經元
向量神經元與標量神經元主要區別在于輸入輸出數據的結構形式,采用向量結構具有更豐富的特征表達能力;神經元之間采用動態路由的方式進行特征傳遞,通過相關性計算,特征得到很好的歸類,更加符合現實場景的需要;動態路由每次迭代以0初始化參數,參數規模得到了優化,壓縮向量的尺度,保證了每一層向量神經元之間權重的一致性. 算法過程如下:
1)初始化l層第i個膠囊和l+1層第j個膠囊間特征傳遞參數bi,j為0;
2)利用softmax方式計算兩層膠囊間權重ci,j,具體公式為
3)低層膠囊特征ui傳遞至高層膠囊,得到高層特征
sj=∑ci,j·ui;
4)壓縮高層膠囊特征,得到壓縮后的特征
5)迭代更新為
bi,j=bi,j+ui·vj.
動態路由實現低層膠囊結構與高層膠囊之間的向量式傳遞,通過二者標量積來度量相關性,向量的模長代表實體的存在性,構建了空間位置等關鍵特征.
為提高膠囊網絡的特征提取能力,本文改進膠囊網絡的單一卷積結構為多尺度卷積Inception模塊和空間注意力模塊的結合體,構建更加全面豐富、特征突出的特征提取單元,與初始膠囊結構和數字膠囊結構結合,提出了一種前端特征提取提升的改進膠囊網絡SAP- CapsNets(Start ability promotion capsule network),其結構如圖4所示.

圖4 改進膠囊網絡
SAP-CapsNets輸入數據為振動信號時頻分析(短時傅里葉變換)得到的二維時頻域數據(數組非圖像),網絡前端采用Inception結構配合空間注意力模塊進行特征提取,保證信息提取的充分性,同時具有較強的抗噪聲作用,特征采集作用明顯;后端采用膠囊結構構造向量神經元,通過動態路由實現特征傳遞;激活函數采用Relu函數.
損失函數采用間隔損失和重構損失結合計算總損失的方式,間隔損失表示為
Lk=Tk·(max(0,m)-‖vk‖)2+
λ·(1-Tk)·max(0,‖vk‖-m).
式中:k是分類數,Tk是分類的指示函數 (存在為 1,不存在為 0);m+為上界,懲罰假陽性;m-為下界,懲罰假陰性;λ比例系數,調整兩者比重.
重構損失計算方法為膠囊層后構造3層全連接層如圖5所示,得到與原數據數據點數相同的輸出值,計算原數據與輸出數據距離平方和,作為損失值.
總損失為間隔損失和λ倍重構損失的和,λ平衡二者比重,取0.01左右.

圖5 重構結構
為驗證方法模型的效果,采用凱斯西儲大學軸承公開數據集. 軸承的損傷為電火花加工的單點損傷,人工制造故障的方式,故障特征相對實際工況明顯,故本文采用人工降低信號信噪比的方法,模擬噪聲工況環境,開展實驗分析. 數據為原始數據12 kHz采樣頻率下的驅動端軸承故障,包含1 797、1 772、1 750和1 730 r/min這4種轉速數據;軸承狀態為健康、內圈故障、滾動體故障和外圈故障.
深度學習網絡參數量大,需大樣本數據驅動得到模型,且軸承數據集中正常狀態相對其他故障狀態的樣本較少,樣本存在不均衡問題. 因此本文采用單個數據文件重復采樣的方式減小樣本間的不平衡問題. 本文實驗中采用單個數據文件中單次選取6 000個點,每次向后移動500個點的形式進行采樣,采樣后數據進行時頻變換(短時傅里葉變換[13]),由一維數據變換為二維數據,短時傅里葉變換公式為
( 8 )
式中:f和g為信號和窗函數,輸出結果S為時頻域數據,自變量為時間,變量ω為頻率,變量τ為移動窗口設置量.
變換二維后,為避免數據轉圖像格式容易出現格式轉換誤差的問題,本文將數據直接按數組形式保存使用,不轉換圖像類型,避免格式在轉換過程中引起的原始數據特征損失. 樣本分布情況如表1所示.

表1 數據樣本類型分布
為驗證模型的優劣性,采用雙卷積膠囊網絡和傳統卷積神經網絡[14]作為對比分析,二者結構如圖6、7所示.

圖6 雙卷積層膠囊網絡

圖7 卷積神經網絡
模型均采用Relu激活函數;雙卷積膠囊網絡將傳統膠囊結構單卷積層擴展為雙卷積層,結合了卷積網絡和膠囊網絡的特點;傳統卷積神經網絡為適應時頻變換后的數據結構,采用了一個4×3卷積核,通過卷積和池化的方式,逐層特征提取和壓縮.
樣本按8∶2的比例隨機劃分訓練集和驗證集. 訓練過程采用未做處理的原始信號二維數據. 3種方法均采用Adam優化方法,學習率0.001,訓練時單次讀入數據量batch_size為50,全部樣本迭代次數epoch設置為20,均運行3次取平均結果,改進膠囊網絡(SAP-CapsNets)、雙卷積神經網絡(CNN-CapsNets)和傳統卷積神經網絡(CNN)3種模型訓練結果如表2所示.

表2 模型訓練結果
從表2中可得,改進膠囊網絡在模型訓練時間上沒有明顯的增加,訓練集正確率有了一定的提升.
驗證過程首先采用未做處理的驗證集數據試驗,3個模型驗證集準確率分別為98.2%、96.2%和95.1,從驗證集結果看,模型均達到了訓練效果.
采用添加不同幅值高斯白噪聲,降低信噪比的方式,對訓練集和驗證集進行處理,信噪比公式為
R=10 lg(Ps/Pn).
式中Ps為信號有效功率,Pn為噪聲功率,R為信噪比.
相同坐標下,降低西儲大學軸承數據集中的內圈故障信號信噪比,信號時域圖變化如圖8所示.

圖8 不同信噪比狀態(原始、-1、-2、-3dB)時域圖
統計圖8中幾種不同信噪比狀態信號,統計指標使用敏感度較高的時域峭度值[15]、方差、歪度,結果如表3所示.

表3 不同信噪比狀態時域指標
采用希爾伯特變換構造4種狀態下信號的解析函數,得到包絡信號,求解包絡譜[16],觀察信噪比調整過程中信號頻域的幅值變化情況,得到包絡譜如圖9所示.
從時域指標統計和包絡譜圖信號幅值變換情況分析得出,信噪比降低后信號的時域、頻域變化較大,噪聲嚴重影響了原始信號本身的特征,采用簡單的分析方法,難以直接提取故障特征和判斷故障類型.

圖9 幾種信噪比信號包絡譜
采用上文正常信噪比信號為訓練集樣本,訓練好的卷積神經網絡、雙卷積膠囊網絡和改進膠囊網絡3個模型,輸入調整3種不同信噪比的數據作為診斷驗證集,模型的診斷情況如圖10.

圖10 幾種信噪比驗證集正確率
從圖10可以看出SAP-CapsNets具有一定的抗噪能力,在信噪比-3 dB的情況下,仍能達到80%以上的正確率,相比雙卷積層膠囊網絡和傳統的卷積神經網絡能達到更好的特征提取和故障診斷效果.
為進一步驗證改進方法的效果,訓練集數據直接采用降低信噪比后數據,將-1、-2、-3 dB數據混合作為訓練集樣本,模型訓練過程正確率71%,驗證集采用正常信噪比數據正確率為64%,模型結果較差. 分析原因后認為:直接采用低信噪比數據訓練模型,受噪聲影響,訓練時模型未能準確學習軸承故障主要特征,因此對正常信噪比數據分類正確率仍較低. 采用正常信噪比數據開展訓練,以低信噪比數據進行驗證的方式,具有更好的效果,且當前可用實際工況數據較少,研究實驗室信噪比條件下模型訓練,逐步遷移至實際工況的意義更加明顯.
本文提出了一種前端特征提取模塊提升的膠囊網絡模型(SAP-CapsNets),實驗對比在噪聲環境下的特征提取能力,實驗結果表明:
1) 噪聲環境影響信號的整體指標,深度學習模型識別效果同樣受到嚴重影響.
2) 相比雙卷積層膠囊網絡,本文改進膠囊網絡通過Inception模塊和空間注意力模塊的結合,起到抗噪和特征提取能力提升的作用,模型穩定性和泛化能力更好.
3) 本文提出的模型還需進一步優化,在實驗中模型各層參數經過調整,才取得了較好的結果,后續進一步優化分析,提高模型參數選擇的穩定性和通用性.