
















摘 要:針對包裝機故障信號受噪聲影響且樣本稀少導致傳統的診斷方法不能滿足實際場景應用要求的問題,提出一種新的軸承故障診斷方法。首先,利用連續小波變換(Continue Wavelet Transform,CWT)將振動信號轉換為二維圖像。其次,將其輸入深度網絡模型進行訓練。再次,利用極限學習機(Extreme Learning Machine,ELM)進行故障分類。最后,通過麻雀搜索算法(Sparrow Search Algorithm,SSA)對ELM進行優化。試驗結果顯示,在強噪聲干擾且少樣本訓練的情況下,所提方法的準確率仍能夠達到98.91%,并且模型在不同的軸承數據集中的準確率均達到98.92%,證明所提方法具有一定的實用價值。
關鍵詞:故障診斷;深度學習;特征提取;極限學習機
中圖分類號:TP307 文獻標志碼:A
0 引言(Introduction)
隨著生活質量的提高,人們對產品的包裝要求也隨之提升,進而對包裝機的可靠性和穩定性提出了更高的要求。軸承的健康狀態直接影響包裝機設備的工作和運行狀態。因此,建立一種特征提取能力強、泛化性能優異的軸承故障診斷模型是當前的研究熱點[1]。
目前,振動分析是一種有效的軸承故障診斷方法,其主要包含故障信號的特征提取和分類[2]。傳統的特征提取方法,如信號處理已被廣泛應用,其結合深度學習可以得到較高的診斷準確率。孫佳韻等[3]提出了經驗模態分解算法與卷積神經網絡相結合的軸承故障診斷方法,提高了模型對故障特征的學習能力。但是,與傳統的機器學習方法相比,深度學習模型需要更多的訓練參數和時間,其分類層的分類效果與機器學習算法的分類效果相比,仍有一定的差距。
針對上述問題,本文提出了一種融合深度卷積神經網絡(DCNN)和麻雀搜索算法的優化后的ELM 分類模型,將其加入包裝機軸承故障診斷模型中。該模型既充分利用了深度學習優秀的特征提取能力,又結合了ELM高效的分類能力,并引入SSA對ELM的參數進行尋優,提升了模型在強噪聲干擾下的故障診斷能力。
1 軸承故障診斷方案(Bearing fault diagnosisscheme)
振動分析應用在包裝機的軸承故障診斷中,存在兩個關鍵問題需要解決。首先,考慮到包裝機的工作環境及軸承的安裝位置,傳感器采集的振動信號常常受到噪聲的干擾。現有的一些方法必須依據先驗的專業知識進行一系列復雜的計算,包括濾波、噪聲抑制等,才能對軸承故障進行診斷,例如常用的包絡調節法、模態分解法等,雖然它們可以捕捉許多軸承故障的特征頻率,但是有些特定故障模式可能在振動信號中表現不明顯,特征頻率可能會受到其他頻率成分的掩蓋,導致故障特征難以準確提取。因此,亟須研發一種有效的方法用來在強噪聲場景下準確且快速地提取出軸承故障所固有的特征。此外,鑒于包裝機軸承故障信號的稀缺性,如何僅依靠少量的故障信號實現精準的故障診斷,成為另一個亟須解決的問題。
為了減少因為設備故障帶來的損失,及時發現包裝機的故障,本文采用了一種云邊協同的包裝機軸承故障診斷方案,其流程如圖1所示。首先,邊緣主機通過傳感器收集包裝機的軸承振動信號,將其上傳至云端服務器。其次,采用人工方式依據包裝機的實際情況二次確定故障標簽,輸入模型進行訓練。最后,將訓練好的模型移植到邊緣主機進行包裝機軸承的狀態識別,并在必要時進行控制。此方案通過公開數據集訓練的模型配合包裝機軸承數據進行遷移訓練,可在前期解決包裝機軸承故障信息稀缺的問題,并且隨著故障樣本的增多,模型的準確率也會隨之提高。
同時,本文提出了DCNN-SSA-ELM 模型。其中,深度學習用于消除傳統方法中手動提取特征的需求,降低了人工干預的成本,并且可以捕捉更加深層的故障特征,能夠適應多種類型的數據[4]。ELM的訓練速度非常快,盡管訓練過程使用了隨機權重,但是仍具有較強的泛化能力,相比于其他算法模型,同樣降低了人工干預的成本。雖然ELM 的泛化性較好,但是其結果通常不是最優的,這也是隨機確定權重的一個缺點。通過SSA尋找ELM權重參數的最優解,可以最大限度地提升模型的故障診斷能力。SSA采用種群分組、種群遷移和個體采樣等策略,使算法具有較強的多樣性和全局搜索能力,并且具有較高的收斂速度和精度,能夠在較短的時間內找到較優解。
2 算法介紹(Algorithm introduction)
2.1 深度卷積神經網絡
卷積神經網絡(CNN)[5]是深度學習中的典型算法,具備卷積運算和深度結構。CNN主要由輸入層、卷積層、池化層、全連接層和輸出層組成。模型流程涵蓋卷積層、池化層等的處理,并通過分類器進行結果識別分類。在訓練過程中,CNN根據訓練樣本進行權重優化,運用反向傳播和梯度下降法,與傳統神經網絡的訓練方法相同。
經典的深度卷積神經網絡(DCNN)包括視覺幾何組(VGG)[6]和殘差網絡(ResNet)[7]等。VGG基于CNN進行優化,模型在圖像分類領域廣泛應用,其采用深層網絡結構和小卷積核、池化域,既保證了感受視野,又減少了參數量。通過交替的多個卷積層與非線性激活層,能夠更好地提取深層特征。ResNet基于VGG模型進行改進,引入殘差單元以解決深層網絡引發的退化問題,使網絡能夠更深入地學習特征。
2.2 極限學習機
極限學習機(ELM)[8]是一種廣義單隱層前饋神經網絡,其結構簡單,學習速度快,它的結構分為輸入層、隱藏層和輸出層,如圖2所示。極限學習機中的輸入權重w 與偏置b 是隨機確定的,且隱藏層和輸出層之間的連接權重不需要迭代調整,而是直接輸出結果。因此,極限學習機的學習速度很快,而且具有良好的泛化能力。
2.3 麻雀搜索算法
麻雀搜索算法(SSA)是根據麻雀的覓食行為而提出的群智能優化算法[9],麻雀被分為3類:發現者、跟隨者和警戒者。
在D 維解空間內,每只麻雀的位置X 和適應度f 如公式(1)和公式(2)所示:
X=(x1,x2,…,xD ) (1)
fi=f(x1,x2,…,xD ) (2)
每代發現者的位置更新公式如公式(3)所示,若確定周圍安全,則進行廣泛搜索,若發現危險,則迅速遠離。
其中:Xti+,j1 表示種群中第t代中第i個個體的第j維的位置。
itermax 表示最大迭代次數。a 是0~1的隨機數。R2 和ST 分別是預警值和安全值。隨機變量Q 服從正態分布。L 表示1×d 的矩陣,其中每個元素都為1。
跟隨者會觀察發現者的位置,其位置更新描述如公式(4)所示:
其中:XtP+1 是目前發現者所占據的最優值,Xworst則表示當前全局最差值。矩陣A 的大小和L 一樣,但其中的元素隨機賦值為1或-1,A+ 如公式(5)所示:
A+ =AT(AAT)-1 (5)
還有占一定比例的麻雀用于偵察預警,如公式(6)所示:
其中:Xbest 是當前的全局最優值,β 是均值為0、方差為1的正態分布隨機數,K 是-1~1的一個隨機數,fi 是當前適應度值。fg 和fw 分別是當前全局最佳和當前全局最差的適應度值,ε 為常數。
2.4 連續小波變換
CWT[10]是WT的一種,在使用CWT做時頻分析時,可以在時間分辨率和頻率分辨率之間取得很好的平衡。因此,本文采用CWT將原始時域信號轉換為二維時頻圖像,其數學表達式如公式(7)所示:
其中:α 和β 分別表示比例因子和平移參數,x(t)為原始時域信號,φ 為小波函數,*為復共軛算子。
2.5 改進的DCNN-SSA-ELM 故障診斷流程
首先,利用CWT將軸承的原始振動信號轉換為二維時頻圖像。
其 次,輸入圖像對深度卷積神經網絡模型進行訓練,保存訓練好的模型的參數,使用ELM 替代深度卷積神經網絡模型的全連接層,對軸承故障進行分類。圖3是CNN-ELM模型結構示意圖,圖中CNN為特征提取器,ELM為分類器。
最后,通過引入SSA優化算法對ELM的權值w 和偏置b進行尋優,使得ELM的分類效果達到最優且穩定。
3 試驗驗證(Experimental verification)
為了驗證所提方法的有效性,本小節研究了兩個實例,分別使用CWRU(Case Western Reserve University)軸承數據集[11]和帕德博恩大學軸承數據集[12]。所有試驗模型都是通過Python 3.8和Pytorch實現的,在Ubuntu 18.04上運行,使用3090 24 GB的GPU。
3.1 基于CWRU軸承數據集的試驗驗證
3.1.1 數據集描述
數據由軸承在4種不同負載下(0 hp、1 hp、2 hp、3 hp)運行的數據組成。采樣頻率為12 kHz。該數據集中的軸承故障類別分別為內圈缺陷、滾動體缺陷和外圈缺陷,其中每種故障又有3種不同的直徑(7 mil、14 mil、21 mil)。因此,CWRU軸承數據集的標簽有10個類,其中包括9個故障類和1個正常類。對于不同軸承故障類的每種故障直徑,在不變換數據的情況下,分別從每個負載中選取30 720個采樣點,分為30個樣本,即一種故障類別有120個樣本,并將其按照4∶1的比例分為訓練集和測試集。CWRU軸承數據集分類如表1所示。利用CWT將一維的軸承振動信號轉換為二維時頻圖像,每張圖的大小為64×64,以此作為模型的輸入。
3.1.2 模型試驗
在深度卷積神經網絡模型的訓練中,使用了3種不同的模型結構(CNN、ResNet18、VGG16)。為了提高模型的特征提取能力,首先對模型進行訓練,其中VGG16的模型批處理大小設置為80,學習率設置為0.01,迭代20次。CNN 和ResNet18批處理大小設置為40,學習率設置為0.01,迭代40次。將訓練好的模型的全連接層及之后的網絡層替換為ELM 和SVM進行訓練,其中ELM的隱藏層節點數設置為3 000,SVM核函數選取RBF核函數,懲罰參數設置為1。所有試驗在相同條件下重復10次,以最后的平均準確率作為評價指標。在訓練完成之后,將每個DCNN模型全連接層之前提取的特征進行歸一化,并利用t分布隨機鄰近插入(T-SNE)[13]對提取的特征可視化,各個模型的聚類效果如圖4所示。
從圖4中可以看出,CNN在一些故障類型中的聚類并不明顯,在此模型的基礎上改進的VGG16和ResNet18則具有了明顯的聚類效果。采用VGG16和ResNet18提取特征,不同故障類型相互遠離,同一種類型也不分散。由此可見,利用DCNN作為特征提取器是完全可行的。3種不同的深度學習模型以及融合ELM 和SVM 之后的模型的故障診斷結果如表2所示。
從表2中的數據可以看出,無論選擇哪種DCNN模型結構,在替換了ELM之后,與原本的Softmax分類器相比,最高準確率都得到了提升。此結果證明了將ELM作為故障分類器是具有優勢的。其中,當VGG16作為ELM 特征提取器后,最高準確率從原來的99.17%提升到99.58%,并且結合ELM 的模型故障診斷準確率均高于替換成SVM 的模型,也證明了ELM在分類問題上具有優越性。
模型的穩定性也是考量模型性能的重要指標。從表2中的數據可以看出模型結合ELM的最大準確率和最小準確率的差值比模型結合其余兩個分類器的差值更大,這也證明了前文中提到的ELM輸出不穩定的問題。
為了使ELM的輸出穩定,需要使ELM 隨機確定的權值和偏差更確定,又要確保確定的參數使ELM的分類效果最優。于是,本文在原有模型中加入麻雀搜索算法,利用SSA對ELM的參數進行優化。其中,麻雀數量設為20只,發現者比例為80%,預警值為0.7,意識到危險的麻雀占20%。每次試驗迭代20次,重復10次試驗,試驗結果如表3所示。從表3中的數據可以看出,引入SSA之后,模型的準確率得到了提升,并且模型診斷效果變得穩定,其中基于VGG16和ResNet18的模型準確率都達到了100%。
為了模擬包裝機軸承實際運行時存在的各種噪聲干擾,并驗證強噪聲環境下本文所提方法的有效性,試驗設置了4種噪聲等級,向原始振動信號中添加均值為0的具有不同標準差的高斯白噪聲。噪聲等級設置如表4所示。
根據之前的試驗,可以得出VGG16-SSA-ELM 的診斷綜合效果最好,為了驗證不同噪聲等級下該模型的診斷效果,選取其他模型進行對比,其中LeNet的模型參數與前文CNN的參數相同,每個模型均取最優準確率,試驗結果如表5所示。
從表5中的數據可以看出,隨著噪聲等級的增加,VGG16-SSA-ELM診斷能力表現優秀,平均診斷準確率高于改進前的VGG16-ELM模型1.33百分點,高于VGG16模型1.58百分點。與其他深度神經網絡及傳統模型相比,也有2.91百分點~4.16百分點的提升。驗證了改進的VGG16-SSA-ELM 在提升強噪聲場景下的故障診斷準確率上的成效。
3.2 基于帕德博恩大學軸承數據集的試驗
3.2.1 數據集介紹
為了評估本文所提方法的遷移能力,采用帕德博恩大學軸承數據集進行試驗驗證。帕德博恩大學軸承數據集是從6203軸承上采集的,采樣頻率為64 kHz。本文選取了其中的正常和真實的損傷軸承振動數據,分為3種健康狀態(正常、外圈損壞、內圈損壞)。與CWRU數據集處理方法相同,從數據集中的不同軸承狀態中采集樣本,每個樣本包含1 024個采樣點,每個故障類別共有100個樣本,并將其按照1∶4的比例分為訓練集和測試集(表6)。利用CWT將這些樣本轉換為二維時頻圖像,每張圖的大小為64×64。
3.2.2 試驗驗證
本次試驗的DCNN模型沿用CWRU數據集所訓練的模型,用來提取軸承的故障特征。ELM的模型結構不變,SSA搜索算法的參數設置不變,試驗步驟相同,各個模型的故障診斷準確率如表7所示。從表7中的數據可以看到,訓練完成之后,CNN-ELM的平均準確率達到了88.17%,ResNet18-ELM的平均準確率達到了92.33%,VGG16-ELM 的平均準確率達到了94.67%。加入優化算法SSA后,模型的診斷能力得到了提升,平均準確率提高了4.50百分點~6.83百分點。再次證明了SSA對DCNN-ELM模型是具有優化效果的。圖5中顯示的是DCNN-ELM加入SSA算法前后最好的診斷效果的混淆矩陣圖,從圖中可以明顯看出,SSA對故障分類的提升效果。通過分析試驗數據可以發現,將CWRU數據集訓練的DCNN模型與ELM結合后,在帕德博恩大學軸承數據集上也有較高的故障診斷準確率,這也證明了所提模型具有較強的遷移能力。
為了驗證遷移模型在噪聲影響下的診斷優勢,對帕德博恩大學軸承數據集添加同樣等級的高斯白噪聲,并對VGG16-SSA-ELM與其改進前的模型進行對比試驗。由于CWRU數據集訓練的模型最后的全連接層輸出結果是10,若直接用于帕德博恩大學軸承數據集的故障診斷,則達不到理想的診斷效果。因此,需要將VGG16模型最后的全連接層輸出結果改為3,并且凍結全連接層之前的所有層,對全連接層進行重新訓練,訓練時VGG16模型的批處理數改為20,迭代次數改為40次,其余參數不變。試驗結果如表8所示。
從表8中可明顯看到,盡管VGG16-ELM 模型中的ELM模型在訓練期間采用隨機權重,然而在各種噪聲水平下,其準確率均達到了97%以上,平均準確率也達到了98%。這也證明了ELM 模型在泛化方面的強大能力。而且,VGG16-ELM模型的平均準確率比VGG模型的平均準確率提升了0.92百分點。在經過SSA優化后,故障診斷的準確率達到了98.92%。與Softmax層的訓練不同,ELM 僅需計算隨機生成的權重和偏置,不需要進行諸如反向傳播等迭代過程,這使得ELM更加適用于模型遷移,有助于降低網絡復雜度并縮短訓練時間。值得強調的是,使用的訓練數據是基于少樣本原則,如果能夠獲得更多的故障數據,模型準確率也將相應提升。
4 結論(Conclusion)
本文設計了一個云邊協同的包裝機軸承的故障診斷方案,并指出方案中軸承故障診斷存在噪聲干擾以及樣本稀缺的問題。針對這些問題本文提出了DCNN-SSA-ELM 故障診斷模型,在CWRU數據集和帕德博恩大學軸承數據集上進行了多次對比試驗,得到以下結論。
(1)本文建立DCNN-ELM 模型,對振動信號進行連續小波變換,將一維的軸承振動信號轉換為二維時頻圖像并輸入模型訓練。在相同數據集的情況下進行試驗對比,結果表明VGG16與ResNet18能夠更好地提取軸承的故障信息,并且在融合了ELM之后,模型的最高準確率得到了進一步的提升。
(2)本文又采用SSA對ELM進行參數尋優,在DCNN模型參數不變的情況下進行不同強度的噪聲條件下的對比試驗,結果表明SSA-ELM的分類性能更佳且十分穩定。將在CWRU數據集上訓練的DCNN模型的參數保留,融合SSA-ELM 后在帕德博恩大學軸承數據集進行故障診斷對比試驗,結果表明DCNN-SSA-ELM的泛化性能優于未優化的ELM分類模型且其抗噪聲干擾的能力更強。本文所提方法能夠有效識別軸承故障,對包裝機的故障維修與預防具有一定的實用價值。
參考文獻(References)
[1] 郗濤,葛增元,王莉靜. 基于參數優化的VMD與DBN的滾動軸承故障診斷[J]. 組合機床與自動化加工技術,2022(12):57-61.
[2] 瞿紅春,周大鵬,賈柏誼,等. 基于全矢包絡融合雙層降噪處理的軸承故障特征提取[J]. 噪聲與振動控制,2023,43(1):135-140,184.
[3] 孫佳韻,戰衛俠,孫顯彬,等. 基于卷積神經網絡的端到端低速重載軸承故障診斷方法[J]. 制造業自動化,2023,45(12):194-198.
[4] 李彥夫,韓特. 基于深度學習的工業裝備PHM研究綜述[J].振動、測試與診斷,2022,42(5):835-847,1029.
[5] 盧緒祥,劉順順,陳向民,等. 基于聲發射及WST-CNN協同的滑動軸承潤滑狀態識別[J]. 振動與沖擊,2023,42(22):71-77,229.
[6] 王玉靜,夏林,康守強,等. 基于多源域異構模型遷移的滾動軸承故障診斷方法[J]. 振動與沖擊,2023,42(24):257-266.
[7] 謝澤文,陳裕成,柴琴琴,等. 改進殘差網絡的逆變器開路電路故障診斷[J]. 福州大學學報(自然科學版),2024,52(1):45-52.
[8] 蘭朝鳳,宋博文,郭小霞. 基于改進極限學習機的水輪機運轉狀態識別[J]. 振動與沖擊,2023,42(1):132-138.
[9] XU J,YAN H Z,DING Q,et al. Sparrow search algorithm appliedto temperature control in PEM fuel cell systems[J].International journal of hydrogen energy,2022,47(94):39973-39986.
[10] 陳代俊,陳里里,董紹江. 基于VMD-CWT-CNN的滾動軸承故障診斷[J]. 機械強度,2023,45(6):1280-1285.
[11] 劉杰,李長杰,趙昕,等. 基于多特征融合與GSA-SVM的滾動軸承故障診斷[J]. 傳感技術學報,2023,36(10):1607-1614.
[12] 張英杰,張彩華,陸碧良,等. 基于類別域自適應的滾動軸承故障診斷[J]. 振動與沖擊,2023,42(24):117-126.
[13] 鄭惠萍,王卓,彭立強,等. 基于改進CEEMDAN和t-SNE的故障特征提取方法[J]. 機床與液壓,2023,51(19):216-222.
作者簡介:
汝 欣(1989-),女,博士,講師。研究領域:智能紡織裝備技術,紡織CAD。
孟金鑫(1998-),男,碩士生。研究領域:智能制造與車間信息化技術。
李建強(1990-),男,博士生。研究領域:智能算法,智能制造與車間信息化技術。
彭來湖(1980-),男,博士,副教授。研究領域:智能制造與車間信息化技術,智能裝備與嵌入式控制技術。
基金項目:浙江省科技計劃項目(2022C01065)