




關鍵詞:礦用滾動軸承;故障診斷;ConvNeXt;超小波變換;全維動態卷積;高效局部注意力機制
中圖分類號:TD67 文獻標志碼:A
0引言
滾動軸承作為支撐旋轉體和降低機械載荷摩擦因數的關鍵部件,在礦用機械中扮演著重要的角色。然而,在礦井灰塵污染、潤滑不足及疲勞剝落等工作情況下,滾動軸承可能發生各種故障,進而影響礦用機械的正常工作,嚴重時還可能帶來次生災害,造成重大經濟損失甚至人員傷亡。因此,研究準確率高、實用性強的礦用滾動軸承故障診斷方法,對保障礦用機械正常運行、降低經濟損失和減少人員傷亡具有重要意義[1]。
礦用滾動軸承故障診斷方法需要考慮以下問題:① 跨工況。軸承的工作狀況復雜多變,需要軸承故障診斷方法具有適應多工況的泛化能力。② 跨軸承。礦用軸承類型眾多,需要軸承故障診斷方法能夠診斷不同類型的滾動軸承故障。③ 噪聲干擾。礦井環境含有大量噪聲,需要軸承故障診斷方法具有一定的抗噪能力。
基于深度學習的故障診斷方法使計算機自主地從原始信號中學習和提取關鍵特征[2],是故障診斷領域研究的熱點。目前深度學習網絡主要有卷積神經網絡(Convolutional Neural" Network,CNN)、循環神經網絡(Recurrent Neural Network,RNN)和自編碼器(Auto" Encoder,AE)等。CNN 憑借局部感知和參數共享等優點, 在減少參數的同時提高了網絡性能[3]。雷春麗等[4]采用馬爾可夫轉移場將一維信號轉換為二維特征圖,利用CNN 對特征圖進行特征提取和故障診斷,可在小樣本、變負載環境下完成故障診斷任務。常淼等[5]通過增加CNN 的卷積層數來提高網絡特征提取能力,但卷積層過多會引發梯度彌散、參數過多等問題[6],導致訓練效率降低。為進一步挖掘CNN 潛力, Facebook 和UC Berkeley的科研人員以ResNet 為基礎, 借鑒Transformer 架構,經過一系列改進和優化,設計出純卷積網絡——ConvNeXt[7]。在網絡設計過程中,為降低參數量,使用深度可分離卷積,將傳統卷積操作分解為深度卷積和逐點卷積2 個環節;為增強網絡性能,采取多種優化策略,其中包括使用倒殘差結構、減少批歸一化(Batch Normalization,BN)層和激活函數的應用以及將下采樣層進行分離處理等。ConvNeXt 在保持簡潔高效的同時, 突破了傳統CNN 的性能極限[8],為故障診斷領域提供了一種新的研究方向。但ConvNeXt 在特征提取過程中涵蓋信息較為寬泛,導致網絡將部分注意力分散到非關鍵特征上[9];ConvNeXt 采用7×7 的深度可分離卷積在處理故障診斷這種小樣本分類任務時,無法根據輸入數據的特征動態調整卷積核大小,導致網絡特征提取能力不佳[10];ConvNeXt 中的層歸一化(Layer Normalization,LN)存在泛化性差的問題[11],對網絡泛化性產生不利影響。
為提高現有礦用滾動軸承故障診斷方法的特征提取能力和泛化性,本文提出一種基于超小波變換(Superlet Transform, SLT) 與OD?ConvNeXt?ELA 的礦用滾動軸承故障診斷方法。ConvNeXt 有ConvNeXt?T,ConvNeXt?S,ConvNeXt?B和ConvNeXt?L這4個不同版本,其中ConvNeXt?T 具有復雜度較低、參數量和計算復雜度較小的特點,適用于滾動軸承故障診斷這種小樣本分類任務。本文以ConvNeXt?T為基礎,引入BN 技術[12],旨在提高網絡的泛化性;針對ConvNeXt?T中深度可分離卷積無法動態調整卷積核大小,使用全維動態卷積(OmnidimensionalDynamic Convolution,ODConv)[13]替換原有的深度可分離卷積,使網絡具有更強的適應性;為了使ConvNeXt?T 聚焦關鍵位置特征,引入高效局部注意力(Efficient Local Attention,ELA)[14],以增強網絡的特征提取能力。為充分利用原始信號的時頻特性,選用SLT[15]將一維振動信號轉換為二維時頻圖像,以便網絡更好地提取信號中的關鍵信息。
1基于SLT 與OD?ConvNeXt?ELA 的礦用滾動軸承故障診斷方法原理
1.1OD?ConvNeXt?ELA設計
以ConvNeXt?T 為基礎進行改進, 構建OD?ConvNeXt?ELA,其結構如圖1 所示。主要改進包括:為解決ConvNeXt?T 使用7×7 大小卷積核導致通道間的信息交互不足而造成網絡特征提取能力欠佳的問題,采用ODConv 替換ConvNeXt?T 中的固定大小卷積核,實現根據輸入數據特性對多個卷積核進行線性加權來動態調整卷積核大小,避免信息冗余[16];在部分卷積層后加入ELA 機制,對位置特征圖中的重要特征信息進行編碼,在無需降低維度的前提下,確保對特征信息的優先處理和精確捕捉; 針對ConvNeXt?T 中LN 存在網絡收斂速度慢、泛化性能差的問題,使用BN 替換LN[17]。
1.2基于SLT 與OD?ConvNeXt?ELA的礦用滾動軸承故障診斷流程
為充分利用原始信號的時頻特性,選用SLT 將一維振動信號轉換為二維時頻圖像, 以便OD?ConvNeXt?ELA 更好地提取信號中的關鍵信息。
基于SLT 與OD?ConvNeXt?ELA 的礦用滾動軸承故障診斷流程如圖2 所示,具體步驟如下。
步驟1:采集振動信號。從振動試驗平臺的傳感器數據庫中讀取一維振動信號,構建樣本數據庫。
步驟2:制作故障樣本數據集。利用SLT 將樣本數據庫中的一維振動信號轉換為二維時頻圖像,并按比例劃分為訓練集、驗證集和測試集。
步驟3:訓練OD?ConvNeXt?ELA 網絡。將步驟2中訓練集輸入至已初始化參數的OD?ConvNeXt?ELA 中進行訓練,使用驗證集對網絡性能進行評估,根據評估結果對網絡中的超參數進行調整,防止過擬合現象。經過多輪迭代后,確保網絡充分訓練并達到收斂狀態,然后保留準確率最高的權重。
步驟4:測試OD?ConvNeXt?ELA 網絡。選取美國凱斯西儲大學(Case Western Reserve University,CWRU) [18]和德國帕德博恩大學(PaderbornUniversity,PU)[19]的軸承數據集,其中,CWRU 使用的軸承型號為SKF6025, PU 使用的軸承型號為6203,這2 種軸承均為含有防塵蓋設計的深溝球軸承,是礦井中常用的滾動軸承[20]。將這2 個數據集中劃分的測試集輸入到預先訓練好的OD?ConvNeXt?ELA 中,輸出故障診斷結果。
2滾動軸承故障診斷實驗
滾動軸承故障診斷實驗采用SDG優化函數更新網絡參數,設置訓練輪數為30次,學習率為0.001,批量大小為16,數據加載線程數為3。為防止過擬合,設置Dropout 層的丟棄概率為0.3。為確保實驗的公正性和客觀性,本文所有網絡預訓練權重均源自CIFAR?10數據集。
2.1SLT對滾動軸承故障診斷的影響
為驗證SLT 對滾動軸承故障診斷的優勢,分別選用短時傅里葉變換(Short-Time Fourier Transform,STFT) 、連續小波變換(Continue Wavelet Transform,CWT)和SLT 將CWRU 軸承數據集的一維信號轉換為分辨率為220×220的二維時頻圖像, 并輸入ConvNeXt?T 進行軸承故障診斷,通過比較故障診斷準確率來判斷不同時頻變換方法對滾動軸承故障診斷的優劣。根據軸承負載和轉速的不同,CWRU 軸承數據集分為4 種工況,見表1。將數據集按3∶1∶1的比例構建訓練集、驗證集和測試集。
以A工況為例,對軸承故障類型進行劃分,見表2。
STFT采用hann 窗函數, 窗口長度為50; CWT選用cmor3?3 小波作為小波基,尺度數為256; SLT采用Morlet 小波作為小波基,最小周期為5,階數為5。以A 工況為例,經過STFT,CWT 和SLT 3 種變換后,CWRU 軸承數據集的一維振動信號轉換為二維時頻圖像,如圖3 所示。可看出相較于STFT 和CWT,經過SLT 后的時頻圖像在時間分辨率和頻率分辨率方面實現了較好的兼顧,并且時頻圖像中幾乎不存在冗余信息,能夠清晰地看到信號頻率隨時間的變化情況。
將經過STFT、CWT 和SLT的二維時頻圖像輸入ConvNeXt?T 進行軸承故障診斷,重復測試30 次,得到故障診斷準確率,見表3。在A 工況下,SLT 的準確率較STFT 提高了1.72%,較CWT 提高了1.19%;在B 工況下, SLT 的準確率較STFT 提高了2.91%,較CWT 提高了3.67%;在C 工況下, SLT 的準確率較STFT 提高了3.59%, 較CWT 提高了2.28%; 在D 工況下, SLT 的準確率較STFT 提高了0.94%,較CWT 提高了1.68%。SLT 在4 種工況下由于均保留了原始振動信號的關鍵特征,其準確率優于STFT和CWT。
2.2單一工況下OD?ConvNeXt?ELA性能
為比較ConvNeXt?T 改進前后對軸承故障診斷準確率的影響,將CWRU 軸承數據集單一工況(A 工況、B工況、C工況和D 工況)下經SLT 得到的二維時頻圖像分別輸入ConvNeXt?T 和OD?ConvNeXt?ELA 進行軸承故障診斷,結果如圖4 所示。可看出OD?ConvNeXt?ELA 平均故障診斷準確率達99.65%,較ConvNeXt?T 提高了1.61%。
ConvNeXt?T 和OD?ConvNeXt?ELA 在A 工況下的故障診斷準確率和損失值曲線如圖5 所示。可看出相較于ConvNeXt?T,OD?ConvNeXt?ELA 故障診斷準確率曲線波動更小,網絡損失值曲線呈現更穩定的下降趨勢,且網絡在訓練過程中未出現過擬合現象。
2.3跨工況下OD?ConvNeXt?ELA性能
在實際礦用場景中,軸承運行狀態多為跨工況狀態[21],因此使用不同工況下的CWRU 軸承數據集對EfficientNet_b4, ResNet50, ConvNeXt?T 及OD?ConvNeXt?ELA 進行跨工況滾動軸承故障診斷對比實驗。選取A 工況下訓練集對網絡進行訓練,B,C,D 工況下測試集對網絡進行測試,將上述訓練集與測試集的組合分別記作A?B, A?C 和A?D; 選取B 工況下訓練集對網絡進行訓練,A,C,D 工況下測試集對網絡進行測試,將上述訓練集與測試集的組合分別記作B?A,B?C 和B?D;以此類推。跨工況下不同網絡在CWRU 軸承數據集上的故障診斷準確率如圖6 所示,可看出在12 種跨工況下,OD?ConvNeXt?ELA 的平均故障診斷準確率為87.50%, 比ConvNeXt?T, ResNet50, EfficientNet_b4 分別提高了3.30%,4.57%,4.65%。
為更直觀地展示4 種網絡的故障診斷結果,生成A?B跨工況下4 種網絡在CWRU 軸承數據集上的混淆矩陣,如圖7 所示。可看出在400 個測試集樣本中, EfficientNet_b4 出現11個樣本被誤判,ResNet50出現9 個樣本被誤判, ConvNeXt?T出現5個樣本被誤判,OD?ConvNeXt?ELA 僅有2個樣本被誤判。表明OD?ConvNeXt?ELA 能夠判別多種工況下的滾動軸承故障類型,且具有較高的準確率。
以A?B跨工況為例,采用t 分布式隨機鄰居嵌入(t-Distributed Stochastic Neighbor" Embedding, t-SNE)算法分別對4 種網絡分類層的輸出進行可視化, 如圖8 所示。可看出EfficientNet_b4, ResNet50和ConvNeXt?T 中均存在誤分類的數據點(數據點重疊),而OD?ConvNeXt?ELA 中不存在誤分類的數據點。這是由于OD?ConvNeXt?ELA 憑借ODConv 的動態特性,能夠更好地應對故障診斷這類小樣本任務,并通過ELA 進一步凸顯有用特征,同時弱化無用特征,從而提升故障診斷準確率。
2.4跨軸承、跨工況下OD?ConvNeXt?ELA性能
選用來自不同軸承和不同工況條件下的PU 軸承數據集對EfficientNet_b4, ResNet50, ConvNeXt?T及OD?ConvNeXt?ELA 進行跨工況、跨軸承的故障診斷準確率對比實驗。根據軸承負載的不同,PU軸承數據集分為3種工況,見表4。
選取PU軸承數據集中帶有真實損傷的軸承振動信號開展實驗,并按照3∶1∶1的比例構建訓練集、驗證集和測試集。PU軸承數據集故障類型劃分見表5。
跨工況下4 種網絡在PU 軸承數據集上的故障診斷準確率如圖9 所示。可看出OD?ConvNeXt?ELA在6 種跨工況下的平均故障診斷準確率達89.33%,較ConvNeXt?T, ResNet50 和EfficientNet_b4 分別提高了3.46%,2.10% 和2.09%,表明OD?ConvNeXt?ELA具有更好的泛化能力。
使用混淆矩陣評價E?F跨工況下網絡分類結果,如圖10所示。可看出在320個測試集樣本中,EfficientNet_b4 出現20 個樣本被誤判, ResNet50出現17個樣本被誤判,ConvNeXt?T 出現14個樣本被誤判, 而OD?ConvNeXt?ELA 僅有9 個樣本被誤判。表明OD?ConvNeXt?ELA能有效解決滾動軸承在運行時因負載變化而導致的故障診斷率低和泛化能力差的問題。
2.5不同信噪比下OD?ConvNeXt?ELA性能
礦用軸承故障診斷準確率除了受到跨工況的影響,還會受環境噪聲干擾的影響,因此通過引入高斯噪聲驗證OD?ConvNeXt?ELA在噪聲干擾下的魯棒性。加入信噪比為0,2,4,6 dB 的噪聲,在A 工況下進行4種網絡故障診斷實驗,為去除偶然誤差,重復10 次取平均值,實驗結果如圖11 所示。可看出與EfficientNet_b4, ResNet50, ConvNeXt?T 相比, OD?ConvNeXt?ELA 在不同信噪比下均具有較高的準確率,表現出良好的抗噪性能,適用于礦用軸承故障診斷中含有強噪聲的場景。
3結論
1)采用SLT將一維振動信號轉換為高度保留原始信號故障特征的二維時頻圖像,相較于STFT 和CWT,采用SLT 的滾動軸承故障診斷準確率更高。
2)以ConvNeXt?T為基礎,引入BN技術以提高網絡的泛化性,使用ODConv 替換原有的深度可分離卷積以提高網絡的適應性,引入ELA以使網絡聚焦關鍵位置特征,從而構建礦用滾動軸承故障診斷OD?ConvNeXt?ELA 網絡模型。
3)在CWRU和PU軸承數據集上的滾動軸承故障診斷實驗結果表明,與EfficientNet_b4, ResNet50和ConvNeXt?T 相比, OD?ConvNeXt?ELA 在跨軸承、跨工況及噪聲干擾下具有故障診斷準確率高、泛化能力強的優勢。