
























摘要:為了有效提取齒輪箱中齒輪和滾動(dòng)軸承的故障信號(hào)特征,并克服深度學(xué)習(xí)模型超參數(shù)選取依賴人工經(jīng)驗(yàn)的局限性,提高故障診斷的準(zhǔn)確性和穩(wěn)定性,提出了一種基于蜉蝣算法(MA)優(yōu)化的雙通道神經(jīng)網(wǎng)絡(luò)故障診斷模型。該模型采用一維時(shí)序輸入的門控循環(huán)單元(GRU)和二維圖像輸入的卷積神經(jīng)網(wǎng)絡(luò)(CNN)構(gòu)建雙通道并行架構(gòu),并引入自適應(yīng)批標(biāo)準(zhǔn)化(AdaBN)算法。利用MA的全局優(yōu)化能力,以CNN-GRU的診斷精度為優(yōu)化目標(biāo),自適應(yīng)調(diào)整模型超參數(shù)。將蜉蝣算法優(yōu)化效果與粒子群算法和遺傳算法進(jìn)行了對(duì)比驗(yàn)證,以評(píng)估其在模型參數(shù)優(yōu)化方面的有效性。基于東南大學(xué)齒輪箱數(shù)據(jù)集和凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明:該模型能夠有效提取振動(dòng)信號(hào)特征,其故障識(shí)別精度與穩(wěn)定性均優(yōu)于典型深度學(xué)習(xí)模型,并展現(xiàn)出較強(qiáng)的魯棒性。在穩(wěn)態(tài)工況下,優(yōu)化后的CNN-GRU(MA-CNN-GRU)模型在各數(shù)據(jù)集上的識(shí)別精度顯著提高;在噪聲工況下,MA優(yōu)化的CNN-GRU模型表現(xiàn)出優(yōu)異的抗噪性;在變負(fù)載工況下,結(jié)合AdaBN算法的MA-CNN-GRU模型實(shí)現(xiàn)了最高的平均識(shí)別精度。所提模型能夠高效、準(zhǔn)確地檢測(cè)齒輪箱故障,為機(jī)械設(shè)備的維護(hù)和穩(wěn)定運(yùn)行提供了重要的參考價(jià)值。
關(guān)鍵詞:故障診斷;齒輪箱;門控循環(huán)單元;卷積神經(jīng)網(wǎng)絡(luò);蜉蝣算法
中圖分類號(hào):TH133.3 文獻(xiàn)標(biāo)志碼:A
DOI:10.7652/xjtuxb202505021 文章編號(hào):0253-987X(2025)05-0217-12
Application of Mayfly Algorithm Optimized Dual-Channel Network in Gearbox Fault Diagnosis
YU Ning, WEI Chenqian, TIAN Liyong, ZHAO Jianjun, YU Xiaohan
(College of Mechanical Engineering, Liaoning Technical University, Fuxin, Liaoning 123000, China)
Abstract:In order to effectively extract the fault signal characteristics of gears and rolling bearings in gearboxes, overcome the limitation of deep learning model hyperparameter selection relying on human experience, and improve the accuracy and stability of fault diagnosis, a two-channel neural network fault diagnosis model based on Mayfly algorithm(MA)optimization was proposed. The model uses a one-dimensional timing input gated recurrent unit (GRU) and a two-dimensional image input convolutional neural network (CNN) to construct a dual-channel parallel architecture, and introduces an adaptive batch normalization (AdaBN) algorithm. By using the global optimization ability of MA, the hyperparameters of the model are adaptively adjusted with the diagnostic accuracy of CNN-GRU as the optimization objective. At the same time, MA optimization effort is compared with particle swarm optimization and genetic algorithm to evaluate its effectiveness in model parameter optimization. The experimental results based on the gearbox data set of Southeast University and the bearing data set of Case Western Reserve University show that the model can effectively extract the characteristics of vibration signals, and its fault recognition accuracy and stability are better than typical deep learning models, and it shows strong robustness. Under steady-state conditions, the recognition accuracy of the optimized CNN-GRU model on each data set is significantly improved. Under noise conditions, the MA-optimized CNN-GRU (MA-CNN-GRU) model exhibits excellent noise immunity. Under variable load conditions, the MA-CNN-GRU model combined with the AdaBN algorithm achieves the highest average recognition accuracy. In summary, the proposed model can detect gearbox faults efficiently and accurately, and it can provide an important reference for the maintenance and stable operation of mechanical equipment.
Keywords:fault diagnosis; gearbox; gated recurrent unit; convolutional neural network; mayfly algorithm
齒輪箱作為機(jī)械設(shè)備的關(guān)鍵傳動(dòng)部件,其運(yùn)行的安全穩(wěn)定性,對(duì)工業(yè)生產(chǎn)和人身安全至關(guān)重要[1-3]。由于其復(fù)雜的工作環(huán)境以及長(zhǎng)期時(shí)變、高負(fù)荷運(yùn)轉(zhuǎn),齒輪和軸承易出現(xiàn)故障,造成經(jīng)濟(jì)損失甚至引發(fā)嚴(yán)重的人員傷亡事故,因此準(zhǔn)確、有效地識(shí)別并排除齒輪箱的早期故障,減少事故發(fā)生概率具有重要意義[4-6]。
隨著人工智能迅速發(fā)展,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法廣泛應(yīng)用于旋轉(zhuǎn)機(jī)械故障診斷中,并且效果顯著[7-9],卷積神經(jīng)網(wǎng)絡(luò)是其中性能優(yōu)越的典型代表[10-13]。Chen等采用時(shí)域統(tǒng)計(jì)量對(duì)齒輪箱振動(dòng)信號(hào)進(jìn)行預(yù)處理,將256個(gè)統(tǒng)計(jì)特征轉(zhuǎn)換為尺寸為16的特征矩陣,并作為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的輸入進(jìn)行故障診斷,與其他算法相比,該算法優(yōu)勢(shì)明顯,性能突出[14]。宮文峰等將全連接層替換為過渡卷積層與全局平均池化層,從而減少網(wǎng)絡(luò)的參數(shù)量,并將改進(jìn)的CNN結(jié)合支持向量機(jī)(SVM)應(yīng)用于電機(jī)支撐滾珠軸承的故障診斷中[15]。Monteiro等以傅里葉變換處理齒輪箱振動(dòng)信號(hào)數(shù)據(jù)作為CNN的輸入數(shù)據(jù)集進(jìn)行故障診斷,對(duì)齒輪箱斷齒故障有著良好的檢測(cè)效果[16]。王貢獻(xiàn)等提出了一種多分支卷積神經(jīng)網(wǎng)絡(luò),通過多尺度均值化實(shí)現(xiàn)振動(dòng)信號(hào)重構(gòu),并利用多分支卷積神經(jīng)網(wǎng)絡(luò)(MBCNN)的并行分支提取故障特征[17]。葉壯等提出了多通道一維卷積神經(jīng)網(wǎng)絡(luò)模型,相較于傳統(tǒng)的一維CNN,故障識(shí)別精度有一定的提升[18]。Zhang等提出了一維寬卷積核模型,在噪聲環(huán)境下故障診斷效果突出[19]。
CNN通常采用單通道多層卷積結(jié)構(gòu),這種結(jié)構(gòu)復(fù)雜且超參數(shù)眾多[20]。部分超參數(shù)對(duì)模型的影響較小,但有些關(guān)鍵超參數(shù)對(duì)分類效果具有決定性的作用,僅依靠經(jīng)驗(yàn)或傳統(tǒng)的啟發(fā)式算法來設(shè)定這些關(guān)鍵參數(shù),容易導(dǎo)致模型陷入局部最優(yōu)解,從而影響網(wǎng)絡(luò)輸出的確定性,單通道網(wǎng)絡(luò)結(jié)構(gòu)在提取故障特征時(shí)存在局限性,無法全面準(zhǔn)確地表征故障信號(hào)的特征,這對(duì)識(shí)別精度產(chǎn)生了明顯的影響[21]。在實(shí)際工況下,工作載荷并非穩(wěn)定不變,而是會(huì)隨著生產(chǎn)條件的變化而變化,導(dǎo)致數(shù)據(jù)集的分布出現(xiàn)差異,在此情形下,如何保持故障診斷模型的高性能和高效率,成為一個(gè)亟待解決的重要問題。
基于以上研究,提出了一種基于蜉蝣算法(MA)優(yōu)化的雙通道并行故障診斷模型,用于提取齒輪箱振動(dòng)信號(hào)并識(shí)別故障類型,提升故障診斷的準(zhǔn)確性和穩(wěn)定性。針對(duì)實(shí)際工作過程中,工作載荷隨生產(chǎn)條件變化導(dǎo)致數(shù)據(jù)集分布出現(xiàn)差異的情況,引入自適應(yīng)批標(biāo)準(zhǔn)化(AdaBN)算法以代替?zhèn)鹘y(tǒng)的批量標(biāo)準(zhǔn)化層(BN),使得故障信號(hào)在不同負(fù)載下也能得到有效識(shí)別,極大地提高模型的故障診斷精度,具備重要的實(shí)際應(yīng)用價(jià)值[22]。
1 齒輪箱故障診斷算法
1.1 卷積神經(jīng)網(wǎng)絡(luò)
CNN是一種以仿生視覺機(jī)制構(gòu)建的深度學(xué)習(xí)算法,主要用于圖像識(shí)別和數(shù)據(jù)處理領(lǐng)域[23]。在分類任務(wù)中,卷積和池化運(yùn)算交替進(jìn)行,有效提取高維非線性特征,捕捉并處理局部信息相關(guān)性,通過全連接層的非線性變換,將這些特征整合并最終實(shí)現(xiàn)精確的分類。
卷積層的主要作用是特征提取,輸入圖像或特征圖通過卷積核處理對(duì)應(yīng)區(qū)域,并將特征經(jīng)過激活函數(shù)映射形成新的卷積特征圖,表達(dá)式如下
Mlj=fl(∑Pi=1Ml-1i Wlij+bli)(1)
式中:l為網(wǎng)絡(luò)深度;Mlj為l層第j個(gè)神經(jīng)元特征值;Wl-1i為l-1層第i個(gè)神經(jīng)元的權(quán)值矩陣;P為神經(jīng)元數(shù);Wlij為l層第i個(gè)神經(jīng)元和第j個(gè)神經(jīng)元之間的權(quán)值矩陣;bli為第l層第i個(gè)神經(jīng)元的偏置;fl(·)為l層激活函數(shù)。
池化層一般位于卷積層之后,通過池化操作,在保留重要信息的同時(shí),能夠極大地壓縮數(shù)據(jù),降低計(jì)算復(fù)雜度并加快神經(jīng)網(wǎng)絡(luò)計(jì)算速度。本文采用最大池化操作,表達(dá)式如下
Mlj=poolmax(∑pj=1Ml-1j)(2)
式中:poolmax(·)為最大池化函數(shù)。
全連接層作用是將輸入特征映射到輸出預(yù)測(cè)結(jié)果,表達(dá)式如下
Mlj=fl(WlijMli+bli)(3)
1.2 門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)
對(duì)于時(shí)間序列處理,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)能夠解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)存在的問題,但是LSTM存在復(fù)雜的門控機(jī)制和多個(gè)權(quán)值參數(shù),導(dǎo)致計(jì)算量較大。相比于LSTM網(wǎng)絡(luò),門控循環(huán)單元(GRU)結(jié)構(gòu)更加簡(jiǎn)單,采用更少的門控單元,能夠大幅減少訓(xùn)練參數(shù),提高求解速度[24]。GRU有兩個(gè)門,一個(gè)是更新門,另一個(gè)是重置門,可以很好地解決長(zhǎng)間隔和長(zhǎng)延遲時(shí)間序列的建模問題,故采用GRU網(wǎng)絡(luò)作為時(shí)序數(shù)據(jù)特征提取通道。
更新門控制了上一個(gè)時(shí)間步的信息對(duì)當(dāng)前狀態(tài)的貢獻(xiàn)程度,決定了在新的隱藏狀態(tài)中保留哪些過去的信息,更新門輸出為
zt=σ(wxzpt+whzht-1+bz)(4)
式中:σ(·)表示激活函數(shù);wxz表示更新門輸入層與隱藏層之間的權(quán)值矩陣;whz表示更新門上一隱藏層與當(dāng)前隱藏層之間的權(quán)值矩陣;bz表示更新門偏置項(xiàng);pt表示當(dāng)前時(shí)刻輸入;ht-1表示上一時(shí)刻隱藏層狀態(tài)。
重置門控制了是否忽略前一個(gè)時(shí)間步的信息,本質(zhì)上,重置門被模型用來決定忘記多少過去的信息。重置門輸出為
rt=σ(wxrpt+whrht-1+br)(5)
式中:wxr表示重置門輸入層與隱藏層之間的權(quán)值矩陣;whr表示重置門上一個(gè)隱藏層與當(dāng)前隱藏層之間的權(quán)值矩陣;br表示重置門偏置項(xiàng)。
1.3 蜉蝣算法
蜉蝣算法是Konstantinos等提出的仿生優(yōu)化算法,用于解決復(fù)雜函數(shù)優(yōu)化問題[25]。該算法模擬了蜉蝣飛行及繁衍后代等社會(huì)行為,通過多個(gè)并行子空間搜索,搜索效率高,并且根據(jù)現(xiàn)有位置判斷移動(dòng)方向,避免過早收斂并陷入局部最優(yōu),同時(shí)平衡局部搜索和全局搜索能力,其工作原理如下。
以兩組蜉蝣代表雄性和雌性種群,定義蜉蝣位置為x=(x1,x2,…,xD),速度為v=(v1,v2,…,vn)。
(1)雄性蜉蝣尋優(yōu)。雄性蜉蝣通常在固定區(qū)域內(nèi)并產(chǎn)生群聚行為,會(huì)成群結(jié)隊(duì)向更優(yōu)方向進(jìn)化,以自身情況及種群行為變化來調(diào)整位置。設(shè)xti表示t時(shí)刻雄性蜉蝣i的空間位置,其位置更新定義為
xt+1i=xti+vt+1i(6)
式中,速度更新定義為
vt+1ij=gvtij+a1e-βr2p(bij-xtij)+a2e-βr2g(qj-xtij),
f(xi)gt;f(q)
gvtij+dr, f(xi)≤f(q)(7)
其中,xtij、vtij為j維t時(shí)刻蜉蝣i的位置和速度,g為重力系數(shù),a1、a2分別為用于縮放認(rèn)知和社會(huì)部分的貢獻(xiàn)正的吸引系數(shù);β為固定可見度系數(shù),d為婚舞距離系數(shù),r為[-1,1]之間的隨機(jī)矩陣,bij為j維蜉蝣i的最優(yōu)位置,qj為j維蜉蝣種群的歷史最優(yōu)位置,rp、rg分別為xi與蜉蝣個(gè)體歷史最優(yōu)位置b、xi與蜉蝣種群的全局最優(yōu)位置q之間的笛卡爾距離,表達(dá)式為
‖xi-qi‖=∑nj=1(xij-qij)2(8)
式中:qi為蜉游i的最優(yōu)位置;qij為蜉游i在j維上的最優(yōu)位置。
(2)雌性蜉蝣尋優(yōu)。雌性蜉蝣逐漸靠近適應(yīng)度值更高的雄性蜉蝣,設(shè)yti表示t時(shí)刻雌性蜉蝣i的空間位置,其位置更新定義為
yt+1i=yti+vt+1i(9)
vt+1ij=gvtij+a2e-βr2mf(xtij-ytij),f(yi)gt;f(xi)
gvtij+FLr,f(yi)≤f(xi)(10)
式中:ytij為j維t時(shí)刻蜉蝣i的位置;rmf為蜉蝣對(duì)的笛卡爾距離;FL為飛行系數(shù)。
(3)蜉蝣交配。蜉蝣以最佳匹配機(jī)制交配產(chǎn)生后代,即最優(yōu)雄性與最優(yōu)雌性吸引,次優(yōu)雄性與次優(yōu)雌性吸引,依次類推,交配產(chǎn)生兩個(gè)子代為
S1=LFm+(1-L)Ff
S2=LFf+(1-L)Fm(11)
式中:Fm表示父本;Ff表示母本;L為[0,1]內(nèi)的隨機(jī)數(shù)。
2 MA優(yōu)化的CNN-GRU(MA-CNN-GRU)模型2.1 信號(hào)預(yù)處理
采用變分模態(tài)分解(VMD)和連續(xù)小波變換(CWT)[26]進(jìn)行信號(hào)預(yù)處理工作,其中將VMD降噪重構(gòu)后的時(shí)序信號(hào)作為時(shí)序輸入,將CWT后的時(shí)頻圖作為圖像輸入,VMD能夠有效應(yīng)對(duì)模態(tài)混疊現(xiàn)象,減少噪聲對(duì)信號(hào)的影響,保證信號(hào)在噪聲干擾下依舊能提取到故障信號(hào)特征,CWT糅合了時(shí)域和頻域分析的優(yōu)勢(shì),可把信號(hào)分解為不同尺度(頻率)的小波進(jìn)行多頻帶劃分,能夠捕捉到信號(hào)中的局部變化,分析信號(hào)的瞬時(shí)特性和多尺度特性,能夠兼顧時(shí)間特性和頻率特性,對(duì)復(fù)雜多變信號(hào)分析效果較好。
2.2 CNN-GRU結(jié)構(gòu)優(yōu)化
2.2.1 模型設(shè)計(jì)
首先通過探究不同結(jié)構(gòu)模型對(duì)故障診斷精度的影響,來選擇最合適的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行下一步研究,本實(shí)驗(yàn)通過凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集進(jìn)行驗(yàn)證,圖像通道每層卷積池化步長(zhǎng)均相同,除了卷積層數(shù)外,其他訓(xùn)練參數(shù)保持一致,時(shí)序通道僅改變循環(huán)層數(shù),末層神經(jīng)元數(shù)為128,其他層神經(jīng)元數(shù)為64,每層丟棄率均保持一致,并按照常規(guī)經(jīng)驗(yàn)設(shè)定,其中設(shè)定模型學(xué)習(xí)率為0.000 1,最大迭代次數(shù)為35,每組進(jìn)行5次實(shí)驗(yàn),取其中訓(xùn)練最優(yōu)結(jié)果作為最終結(jié)果。表1設(shè)計(jì)了不同網(wǎng)絡(luò)層數(shù)模型結(jié)構(gòu),以C×3+G×2為例,表示模型由兩個(gè)通道組成,其中2D(圖像通道)有3個(gè)卷積層,1D(時(shí)序通道)有兩個(gè)GRU層,KS表示2D通道卷積核尺寸。Kc表示2D通道卷積核數(shù),Kg表示1D通道神經(jīng)元數(shù),Kd表示神經(jīng)元丟棄率。
不同模型結(jié)構(gòu)識(shí)別精度對(duì)比實(shí)驗(yàn)結(jié)果如圖1所示,當(dāng)2D通道為1層、1D通道為1層時(shí),模型識(shí)別精度最低,訓(xùn)練過程存在較大波動(dòng),隨著網(wǎng)絡(luò)深度增加,識(shí)別精度也在不斷增加。2D通道為3層、1D通道為3層的模型結(jié)構(gòu)時(shí),識(shí)別精度達(dá)到最大。與2D通道為3層、1D通道為4層模型結(jié)構(gòu)時(shí),識(shí)別效果相當(dāng),由于模型深度增加,計(jì)算量增大,因此采用一個(gè)3層CNN通道和一個(gè)3層GRU通道組成雙通道模型,并在此基礎(chǔ)上優(yōu)化。
采用AdaBN算法對(duì)BN層進(jìn)一步優(yōu)化,當(dāng)訓(xùn)練樣本和測(cè)試樣本分布不一致時(shí),采用BN算法會(huì)使網(wǎng)絡(luò)模型性能下降,AdaBN算法則會(huì)將測(cè)試樣本的均值和方差替換為訓(xùn)練階段中通過訓(xùn)練樣本得到的均值和方差,即模型在測(cè)試集中只進(jìn)行正向傳播,而不進(jìn)行反向傳播。
2.2.2 實(shí)驗(yàn)參數(shù)設(shè)定
由于模型中超參數(shù)眾多,綜合考慮優(yōu)化模型時(shí)間成本以及優(yōu)化效果,對(duì)網(wǎng)絡(luò)結(jié)構(gòu)影響較小的超參數(shù)按照經(jīng)驗(yàn)設(shè)定。設(shè)定2D通道首層卷積核數(shù)為32,第2、3層為64,設(shè)定卷積步長(zhǎng)為2×2,池化窗口大小為2×2,池化步長(zhǎng)為2×2,第3層卷積無池化操作,設(shè)定1D通道第3層神經(jīng)元數(shù)為128,1D通道和2D通道提取的信號(hào)特征經(jīng)特征融合后連接,通過softmax分類器進(jìn)行分類。設(shè)定優(yōu)化算法種群數(shù)為20,迭代次數(shù)為10,其中由于蜉蝣算法收斂速度快,故種群數(shù)與迭代次數(shù)相對(duì)較少,為了平衡局部搜索能力和全局搜索能力,設(shè)定子代變異率為0.4,激活函數(shù)類型為Sigmoid、Tanh、Relu、LeakyRelu,優(yōu)化器類型為SGD、RMSprop、Adam。需要進(jìn)行尋優(yōu)的超參數(shù)及尋優(yōu)范圍見表2。
2.3 MA-CNN-GRU模型的流程
本文提出的MA-CNN-GRU模型包括兩部分:通過MA優(yōu)化CNN-GRU參數(shù)來搜尋CNN-GRU最優(yōu)參數(shù)組合;提取訓(xùn)練好超參數(shù)配置模型進(jìn)行測(cè)試。構(gòu)建MA-CNN-GRU模型的具體步驟如下。
步驟1 將CNN-GRU的識(shí)別精度作為蜉蝣算法適應(yīng)度,根據(jù)表2尋優(yōu)參數(shù)集,定義蜉蝣個(gè)體向量坐標(biāo),初始化設(shè)置蜉蝣種群大小、位置和速度等參數(shù),并設(shè)定參數(shù)取值范圍。
步驟2 計(jì)算初始化后適應(yīng)度,并根據(jù)適應(yīng)度由高到低依次排序,將最高適應(yīng)度蜉蝣作為此代最優(yōu)個(gè)體和全局最優(yōu)個(gè)體。
步驟3 按照位置和速度更新公式更新蜉蝣位置坐標(biāo)及速度,按照最佳匹配機(jī)制進(jìn)行配對(duì),并生成子代蜉蝣。
步驟4 再次計(jì)算更新后蜉蝣以及子代蜉蝣的適應(yīng)度,若子代蜉蝣適應(yīng)度高于親代適應(yīng)度較低蜉蝣,則用子代取代親代,若子代蜉蝣優(yōu)于全局最佳蜉蝣,則將子代取代全局最佳蜉蝣,所有蜉蝣對(duì)更新完畢后,以更新后群體作為新一代親本,重新劃定種群,同時(shí),通過加入隨機(jī)突變機(jī)制抑制算法過早收斂,使算法向著其他空間繼續(xù)探索,提高全局搜索能力,一定程度上防止陷入局部最優(yōu)。
步驟5 判斷是否達(dá)到迭代上限,若滿足條件,以全局最優(yōu)蜉蝣參數(shù)重構(gòu)CNN-GRU模型,若不滿足條件,循環(huán)執(zhí)行步驟3~5。
3 實(shí)驗(yàn)驗(yàn)證
3.1 數(shù)據(jù)集描述
為驗(yàn)證本文方法的有效性,采用東南大學(xué)(SEU)齒輪箱數(shù)據(jù)集、凱斯西儲(chǔ)大學(xué)(CWRU)滾動(dòng)軸承數(shù)據(jù)集以及實(shí)驗(yàn)室自測(cè)振動(dòng)平臺(tái)數(shù)據(jù)集,以1 024 個(gè)數(shù)據(jù)點(diǎn)為一個(gè)樣本,采用VMD和CWT分別生成時(shí)序樣本和圖像樣本,驗(yàn)證本文方法的有效性。SEU齒輪箱實(shí)驗(yàn)臺(tái)包含正常、齒輪故障、軸承故障及其復(fù)合故障共計(jì)10類齒輪箱健康狀態(tài)信號(hào)。凱斯西儲(chǔ)大學(xué)選取零負(fù)載下故障直徑為0.007 mm時(shí)的9種故障數(shù)據(jù),構(gòu)成實(shí)驗(yàn)數(shù)據(jù)集。實(shí)驗(yàn)室自測(cè)振動(dòng)平臺(tái)數(shù)據(jù)集如圖2所示,軸承故障預(yù)設(shè)在輸出軸側(cè),齒輪故障預(yù)設(shè)在從動(dòng)齒輪上。在行星齒輪箱上預(yù)制了11種齒輪箱健康狀態(tài),其中軸承故障包括滾動(dòng)體故障、內(nèi)圈故障、外圈故障,齒輪故障包括齒面磨損、齒輪斷齒,復(fù)合故障包括齒輪斷齒加軸承滾動(dòng)體故障、齒輪斷齒加軸承內(nèi)圈故障、齒輪斷齒加軸承外圈故障、齒面磨損加軸承滾動(dòng)體故障、齒面磨損加軸承內(nèi)圈故障、齒面磨損加軸承外圈故障。
3.2 實(shí)驗(yàn)結(jié)果與分析
3.2.1 超參數(shù)優(yōu)化結(jié)果對(duì)比
為展示蜉蝣算法優(yōu)化效果,以粒子群算法、遺傳
算法作為對(duì)比算法,圖3為3種算法迭代過程識(shí)別精度變化情況。根據(jù)圖3中曲線分析,3種優(yōu)化算法均能通過對(duì)超參數(shù)優(yōu)化提高識(shí)別精度。粒子群算法以最快速度收斂,但識(shí)別精度較低,遺傳算法收斂速度較慢,相比于這兩種優(yōu)化算法,蜉蝣算法優(yōu)化效果更好。
3種優(yōu)化算法得到的超參數(shù)組合識(shí)別精度結(jié)果如表3~5所示,3種參數(shù)組合識(shí)別精度均超過98%,并且各超參數(shù)最佳組合并非一成不變,不同參數(shù)組合之間能夠起到較好效果,優(yōu)化算法對(duì)超參數(shù)優(yōu)化結(jié)果影響較大,相比于遺傳算法和粒子群算法,經(jīng)過蜉蝣算法優(yōu)化后模型識(shí)別精度最高,優(yōu)化曲線更加平穩(wěn)。因此,采用蜉蝣算法作為模型優(yōu)化算法。
3.2.2 不同實(shí)驗(yàn)平臺(tái)下實(shí)驗(yàn)結(jié)果與對(duì)比分析
將經(jīng)過MA優(yōu)化初始化參數(shù)后的CNN-GRU模型與CNN、GRU、深度適配網(wǎng)絡(luò)(DAN)[27]和CNN-GRU模型進(jìn)行對(duì)比,在CWRU數(shù)據(jù)集、SEU數(shù)據(jù)集和自測(cè)數(shù)據(jù)集上的對(duì)比結(jié)果如圖4所示。從圖4中可以得出:采用傳統(tǒng)GRU和CNN模型識(shí)別效果不如CNN-GRU模型,未經(jīng)過優(yōu)化的CNN-GRU模型在CWRU數(shù)據(jù)集上識(shí)別精度為97.9%,比GRU模型高5.4%,比CNN模型高3.3%,比DAN模型高2.8%;在SEU數(shù)據(jù)集上識(shí)別精度為96.8%,比GRU模型高6%,比CNN模型高3.1%,比DAN模型高2.6%;在自測(cè)數(shù)據(jù)集上識(shí)別精度為97.5%,比GRU模型高6.3%,比CNN模型高3.6%,比DAN模型高3.2%。經(jīng)優(yōu)化的CNN-GRU模型,在CWRU數(shù)據(jù)集上識(shí)別精度高達(dá)99.8%,在SEU數(shù)據(jù)集上識(shí)別精度為99.5%,在自測(cè)數(shù)據(jù)集上識(shí)別精度為99.6%,相比未經(jīng)優(yōu)化的CNN-GRU模型有明顯提升。
為了直觀、清晰地分析模型性能,通過混淆矩陣顯示某次測(cè)試中故障診斷結(jié)果,具體如圖5所示。GRU模型共識(shí)別正確274個(gè)樣本,識(shí)別錯(cuò)誤26個(gè)樣本,識(shí)別精度為91.33%;CNN模型共識(shí)別正確285個(gè)樣本,識(shí)別錯(cuò)誤15個(gè)樣本,識(shí)別精度為95%;DAN模型共識(shí)別正確288個(gè)樣本,識(shí)別錯(cuò)誤12個(gè)樣本,識(shí)別精度為96%;CNN-GRU模型共識(shí)別正確293個(gè)樣本,識(shí)別錯(cuò)誤7個(gè)樣本,識(shí)別精度為97.67%;MA-CNN-GRU模型共識(shí)別正確299個(gè)樣本,識(shí)別錯(cuò)誤1個(gè)樣本,識(shí)別精度為99.67%,由此可見,雙通道模型能一定程度上提升故障識(shí)別精度,同時(shí)也證明雙通道特征提取具有互補(bǔ)性,相比于單通道,能提取到更多故障特征,故障信息更加完整。
圖6進(jìn)一步展示所提模型及對(duì)比模型的測(cè)試精度,MA-CNN-GRU模型首次迭代準(zhǔn)確率為22.33%,比CNN-GRU模型高1.67%,比DAN模型高10.04%,比GRU模型高11%,比CNN模型高17.33%。初始訓(xùn)練階段,MA-CNN-GRU模型測(cè)試精度曲線斜率較大,證明其正在迅速收斂,4種對(duì)比算法測(cè)試精度曲線斜率均小于MA-CNN-GRU模型。MA-CNN-GRU模型在第54次迭代時(shí)準(zhǔn)確率為100%,并在迭代74次后達(dá)到穩(wěn)定,收斂于100%;CNN-GRU模型在第156次迭代時(shí)準(zhǔn)確率為97.67%,并在迭代246次后達(dá)到穩(wěn)定,收斂于97.67%;GRU模型測(cè)試精度曲線經(jīng)過67次迭代后達(dá)到最大識(shí)別精度,221次迭代后才趨于穩(wěn)定;CNN模型測(cè)試精度曲線經(jīng)過61次迭代后達(dá)到最大識(shí)別精度,但后續(xù)精度仍有一定波動(dòng),較不穩(wěn)定;DAN模型測(cè)試精度曲線經(jīng)過82次迭代后達(dá)到最大識(shí)別精度,180次迭代后才趨于穩(wěn)定。相比于其他算法,MA-CNN-GRU模型測(cè)試精度曲線均能迅速收斂,訓(xùn)練精度曲線更為平滑,所提方法識(shí)別精度明顯優(yōu)于對(duì)比方法。
3.2.3 噪聲工況下實(shí)驗(yàn)結(jié)果與對(duì)比分析
為了驗(yàn)證模型魯棒性,使實(shí)驗(yàn)更逼近真實(shí)環(huán)境下采集的信號(hào)特征,以SEU數(shù)據(jù)集作為實(shí)驗(yàn)數(shù)據(jù),在信號(hào)中添加高斯白噪聲,并與GRU、CNN、DAN、CNN-GRU模型進(jìn)行對(duì)比,結(jié)果如圖7所示。由圖7可知,MA-CNN-GRU模型具有較強(qiáng)的魯棒性,能夠在高頻噪聲影響下保持良好的分類能力,相較于GRU、CNN、DAN、CNN-GRU模型有明顯優(yōu)勢(shì)。
3.2.4 變負(fù)載工況下實(shí)驗(yàn)結(jié)果與對(duì)比分析
以凱斯西儲(chǔ)大學(xué)數(shù)據(jù)集作為實(shí)驗(yàn)數(shù)據(jù),將經(jīng)過MA優(yōu)化初始化參數(shù)后的CNN-GRU模型與CNN、DAN模型進(jìn)行對(duì)比。故障診斷結(jié)果如表6所示,表6中,任務(wù)A→B表示以A數(shù)據(jù)集為信號(hào)源域,B數(shù)據(jù)集為信號(hào)目標(biāo)域,采用遷移學(xué)習(xí)策略訓(xùn)練故障識(shí)別模型。其中,CNN模型未采用遷移學(xué)習(xí)策略,其平均識(shí)別精度為83.85%,DAN模型平均識(shí)別精度為86.51%,使用BN層進(jìn)行歸一化的CNN-GRU模型的平均識(shí)別精度為88.57%,使用BN層進(jìn)行歸一化的MA-CNN-GRU模型相對(duì)表現(xiàn)較好,平均識(shí)別精度為90.51%。在12組變負(fù)載工況下的診斷任務(wù)中,使用AdaBN層進(jìn)行歸一化的MA-CNN-GRU模型故障診斷精度最高,平均識(shí)別精度為92.90%,比CNN、DAN、使用BN層進(jìn)行歸一化的CNN-GRU和使用BN層進(jìn)行歸一化的MA-CNN-GRU模型分別高9.05%,6.56%,4.33% 和2.39%,結(jié)果表明:AdaBN的引入提高了變負(fù)載情況下MA-CNN-GRU模型的診斷性能。
為顯示訓(xùn)練后源域和目標(biāo)域信號(hào)分布,本文采用t分布鄰域嵌入(t-SNE)將全連接層可視化。圖8以CNN和MA-CNN-GRU(AdaBN)模型為例,顯示任務(wù)B→C可視化特征圖,圖8中橫縱坐標(biāo)表示經(jīng)過(t-SNE)降維后前兩列特征。其中,S0~S9為源域?qū)?0種軸承健康狀態(tài)訓(xùn)練得到的網(wǎng)絡(luò)的特征分布,T0~T9為目標(biāo)域?qū)?0種軸承健康狀態(tài)訓(xùn)練得到的網(wǎng)絡(luò)的特征分布。
從圖8可以看出,CNN模型中大部分樣本源域和目標(biāo)域特征距離接近,例如正常狀態(tài)S0、T0,但分布差異較大,例如內(nèi)圈故障損傷尺寸為0.36 mm(S5、T5),并且部分特征之間存在重疊現(xiàn)象,例如滾動(dòng)體故障損傷尺寸為0.36 mm(S2、T2),這是由于CNN沒有使用遷移策略。
與之相比,MA-CNN-GRU(AdaBN)中源域和目標(biāo)域特征重合度較高,無混疊現(xiàn)象出現(xiàn),不同負(fù)載下對(duì)其識(shí)別效果良好,不同類別之前區(qū)分度較高,這進(jìn)一步驗(yàn)證了MA-CNN-GRU模型在處理變負(fù)載狀態(tài)下故障診斷的優(yōu)越性。綜上,所提優(yōu)化后的MA-CNN-GRU(AdaBN)算法模型對(duì)于變負(fù)載后的目標(biāo)域特征具備很好的自適應(yīng)能力,即使面對(duì)特征鄰域分布存在差異的情況,依舊能夠很好地應(yīng)對(duì)軸承故障診斷任務(wù)。
4 結(jié) 論
針對(duì)齒輪箱故障難以準(zhǔn)確提取出微小特征故障,深度學(xué)習(xí)模型超參數(shù)選用對(duì)于人工經(jīng)驗(yàn)的高度依賴性問題,提出一種基于MA算法優(yōu)化的雙通道故障診斷模型CNN-GRU,在SEU齒輪箱數(shù)據(jù)集以及CWRU滾動(dòng)軸承數(shù)據(jù)集進(jìn)行了對(duì)比實(shí)驗(yàn),得到以下結(jié)論。
(1)建立雙通道故障診斷模型CNN-GRU,在對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后,與GRU、CNN和DAN進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明,采用時(shí)序和圖像雙通道輸入的CNN-GRU模型相比于傳統(tǒng)模型具有更高識(shí)別精度,證明了雙通道特征提取具有一定的互補(bǔ)性。
(2)采用MA算法優(yōu)化CNN-GRU超參數(shù),以遺傳算法和粒子群算法作為對(duì)比算法,實(shí)驗(yàn)結(jié)果表明,蜉蝣算法優(yōu)化效果明顯優(yōu)于對(duì)比算法,優(yōu)化后的CNN-GRU模型分類特性明顯高于未優(yōu)化的版本,本文所提方法能夠?qū)X輪箱故障進(jìn)行準(zhǔn)確檢測(cè),對(duì)維修和保持機(jī)械設(shè)備穩(wěn)定運(yùn)行具有一定的實(shí)用價(jià)值。
(3)針對(duì)實(shí)際工作過程中工作載荷隨生產(chǎn)條件變化導(dǎo)致數(shù)據(jù)集分布差異的情況,引入AdaBN算法代替?zhèn)鹘y(tǒng)的BN層,實(shí)現(xiàn)了故障信號(hào)在不同負(fù)載下的有效識(shí)別,極大地提高模型的故障診斷精度。
(4)基于MA優(yōu)化的CNN-GRU診斷模型適用于齒輪箱的故障診斷,具有較高的分類精度,由于其雙通道設(shè)計(jì),計(jì)算參數(shù)量較多,模型訓(xùn)練時(shí)間較長(zhǎng),對(duì)于故障診斷時(shí)間要求不高的場(chǎng)合有重要的應(yīng)用參考價(jià)值。
參考文獻(xiàn):
[1]陳向民, 舒文伊, 韓夢(mèng)茹, 等. 基于URP-ANCNN的變轉(zhuǎn)速齒輪箱智能故障診斷方法 [J]. 噪聲與振動(dòng)控制, 2024, 44(2): 129-135.
CHEN Xiangmin, SHU Wenyi, HAN Mengru, et al. Intelligence fault diagnosis method for gearboxes under variable rotational speed based on URP-ANCNN [J]. Noise and Vibration Control, 2024, 44(2): 129-135.
[2]謝鋒云, 汪淦, 王玲嵐, 等. STFT結(jié)合2D CNN-SVM的齒輪箱故障診斷方法 [J]. 噪聲與振動(dòng)控制, 2024, 44(4): 103-109.
XIE Fengyun, WANG Gan, WANG Linglan, et al. Fault diagnosis method of gearbox based on STFT and 2DCNN-SVM [J]. Noise and Vibration Control, 2024, 44(4): 103-109.
[3]吳勝利, 周燚, 邢文婷. 基于SDP和MCNN-LSTM的齒輪箱故障診斷方法 [J]. 振動(dòng)與沖擊, 2024, 43(15): 126-132.
WU Shengli, ZHOU Yi, XING Wenting. Gearbox fault diagnosis based on SDP and MCNN-LSTM [J]. Journal of Vibration and Shock, 2024, 43(15): 126-132.
[4]陳子旭, 朱振杰, 盧國梁. 一種新的圖譜域滾動(dòng)軸承早期故障檢測(cè)與識(shí)別方法 [J]. 振動(dòng)與沖擊, 2022, 41(6): 51-59.
CHEN Zixu, ZHU Zhenjie, LU Guoliang. Novel early fault detection and diagnosis for rolling element bearings in graph spectrum domain [J]. Journal of Vibration and Shock, 2022, 41(6): 51-59.
[5]王巖紅, 溫笑歡, 揭永琴, 等. 基于對(duì)比學(xué)習(xí)的滾動(dòng)軸承早期故障在線檢測(cè)方法 [J]. 振動(dòng)與沖擊, 2023, 42(14): 229-236.
WANG Yanhong, WEN Xiaohuan, JIE Yongqin, et al. Online detection method for bearing incipient faults based on contrastive learning [J]. Journal of Vibration and Shock, 2023, 42(14): 229-236.
[6]李迎秋, 周威, 郝德成. 基于孿生網(wǎng)絡(luò)的旋轉(zhuǎn)機(jī)械故障診斷方法 [J]. 組合機(jī)床與自動(dòng)化加工技術(shù), 2023(11): 116-120.
LI Yingqiu, ZHOU Wei, HAO Decheng. A fault diagnosis method for rotating machinery based on twin networks [J]. Modular Machine Tool amp; Automatic Manufacturing Technique, 2023(11): 116-120.
[7]ZHANG Jing, TIAN Jing, WEN Tao, et al. Deep fault diagnosis for rotating machinery with scarce labeled samples [J]. Chinese Journal of Electronics, 2020, 29(4): 693-704.
[8]王椿晶, 王海瑞. 深度在線小波極限學(xué)習(xí)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用 [J]. 機(jī)械科學(xué)與技術(shù), 2023, 42(7): 1029-1034.
WANG Chunjing, WANG Hairui. Application of depth online wavelet extreme learning machine in rotating machinery fault diagnosis [J]. Mechanical Science and Technology for Aerospace Engineering, 2023, 42(7): 1029-1034.
[9]吳春志, 馮輔周, 吳守軍, 等. 深度學(xué)習(xí)在旋轉(zhuǎn)機(jī)械設(shè)備故障診斷中的應(yīng)用研究綜述 [J]. 噪聲與振動(dòng)控制, 2019, 39(5): 1-7.
WU Chunzhi, FENG Fuzhou, WU Shoujun, et al. Review of application research of deep learning in fault diagnosis of rotating machinery [J]. Noise and Vibration Control, 2019, 39(5): 1-7.
[10]李益兵, 馬建波, 江麗. 基于SFLA改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷 [J]. 振動(dòng)與沖擊, 2020, 39(24): 187-193.
LI Yibing, MA Jianbo, JIANG Li. Fault diagnosis of rolling bearing based on an improved convolutional neural network using SFLA [J]. Journal of Vibration and Shock, 2020, 39(24): 187-193.
[11]陳功勝, 唐向紅, 陸見光, 等. 基于CNN-ETR的滾動(dòng)軸承故障診斷研究 [J]. 兵器裝備工程學(xué)報(bào), 2021, 42(6): 251-255.
CHEN Gongsheng, TANG Xianghong, LU Jianguang, et al. Research on fault diagnosis of rolling bearing based on CNN-ETR [J]. Journal of Ordnance Equipment Engineering, 2021, 42(6): 251-255.
[12]趙小強(qiáng), 張亞洲. 利用改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承變工況故障診斷方法 [J]. 西安交通大學(xué)學(xué)報(bào), 2021, 55(12): 108-118.
ZHAO Xiaoqiang, ZHANG Yazhou. Improved CNN-based fault diagnosis method for rolling bearings under variable working conditions [J]. Journal of Xi'an Jiaotong University, 2021, 55(12): 108-118.
[13]肖雄, 王健翔, 張勇軍, 等. 一種用于軸承故障診斷的二維卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化方法 [J]. 中國電機(jī)工程學(xué)報(bào), 2019, 39(15): 4558-4568.
XIAO Xiong, WANG Jianxiang, ZHANG Yongjun, et al. A two-dimensional convolutional neural network optimization method for bearing fault diagnosis [J]. Proceedings of the CSEE, 2019, 39(15): 4558-4568.
[14]CHEN Zhiqiang, LI Chuan, SANCHEZ R V. Gearbox fault identification and classification with convolutional neural networks [J]. Shock and Vibration, 2015, 2015(1): 390134.
[15]宮文峰, 陳輝, 張美玲, 等. 基于深度學(xué)習(xí)的電機(jī)軸承微小故障智能診斷方法 [J]. 儀器儀表學(xué)報(bào), 2020, 41(1): 195-205.
GONG Wenfeng, CHEN Hui, ZHANG Meiling, et al. Intelligent diagnosis method for incipient fault of motor bearing based on deep learning [J]. Chinese Journal of Scientific Instrument, 2020, 41(1): 195-205.
[16]MONTEIRO R, BASTOS-FILHO C, CERRADA M, et al. Convolutional neural networks using Fourier transform spectrogram to classify the severity of gear tooth breakage [C]//2018 International Conference on Sensing, Diagnostics, Prognostics, and Control (SDPC). Piscataway, NJ, USA: IEEE, 2018: 490-496.
[17]王貢獻(xiàn), 付澤, 胡志輝, 等. 基于多分支卷積神經(jīng)網(wǎng)絡(luò)的軸承變工況故障診斷 [J]. 噪聲與振動(dòng)控制, 2023, 43(6): 135-141.
WANG Gongxian, FU Ze, HU Zhihui, et al. A multi-branch convolution neural network for fault diagnosis of rolling bearings under variable working conditions [J]. Noise and Vibration Control, 2023, 43(6): 135-141.
[18]葉壯, 余建波. 基于多通道一維卷積神經(jīng)網(wǎng)絡(luò)特征學(xué)習(xí)的齒輪箱故障診斷方法 [J]. 振動(dòng)與沖擊, 2020, 39(20): 55-66.
YE Zhuang, YU Jianbo. Gearbox fault diagnosis based on feature learning of multi-channel one-dimensional convolutional neural network [J]. Journal of Vibration and Shock, 2020, 39(20): 55-66.
[19]ZHANG Wei, LI Chuanhao, PENG Gaoliang, et al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load [J]. Mechanical Systems and Signal Processing, 2018, 100: 439-453.
[20]丁丁, 劉文哲, 盛常沖, 等. 神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索研究進(jìn)展與展望 [J]. 國防科技大學(xué)學(xué)報(bào), 2023, 45(6): 100-131.
DING Ding, LIU Wenzhe, SHENG Changchong, et al. State of the art and prospects of neural architecture search [J]. Journal of National University of Defense Technology, 2023, 45(6): 100-131.
[21]汪祖民, 張志豪, 秦靜, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的機(jī)械故障診斷技術(shù)綜述 [J]. 計(jì)算機(jī)應(yīng)用, 2022, 42(4): 1036-1043.
WANG Zumin, ZHANG Zhihao, QIN Jing, et al. Review of mechanical fault diagnosis technology based on convolutional neural network [J]. Journal of Computer Applications, 2022, 42(4): 1036-1043.
[22]吳宣勇, 黃忠全, 李琪康, 等. 無源數(shù)據(jù)約束下多源域自適應(yīng)的風(fēng)電齒輪箱故障診斷方法 [J]. 太陽能學(xué)報(bào), 2024, 45(4): 238-246.
WU Xuanyong, HUANG Zhongquan, LI Qikang, et al. Multi-source domain adaptive fault diagnosis method of wind turbine gearbox under no-accessing source data constraints [J]. Acta Energiae Solaris Sinica, 2024, 45(4): 238-246.
[23]陳建蓉. 新型多源特征融合模型及應(yīng)用研究 [D]. 南京: 南京大學(xué), 2020.
[24]CHUNG J, GULCEHRE C, CHO K H, et al. Empirical evaluation of gated recurrent neural networks on sequence modeling [J]. Eprint ArXiv, 2014. DOI:10.48550/arXiv.1412.3555.
[25]陳濤, 李欣. 太赫茲光譜在轉(zhuǎn)基因菜籽油鑒別中的應(yīng)
用: 基于改進(jìn)蜉蝣算法的支持向量機(jī)模型 [J]. 物理學(xué)報(bào), 2024, 73(5): 360-368.
CHEN Tao, LI Xin. Application of terahertz spectroscopy in identification of transgenic rapeseed oils: a support vector machine model based on modified mayfly optimization algorithm [J]. Acta Physica Sinica, 2024, 73(5): 360-368.
[26]GAO Zhongke, WANG Zibo, MA Chao, et al. A wavelet time-frequency representation based complex network method for characterizing brain activities underlying motor imagery signals [J]. IEEE Access, 2018, 6: 65796-65802.
[27]王眺. 基于深度交互適配網(wǎng)絡(luò)的通用多模態(tài)學(xué)習(xí)方法研究 [D]. 杭州電子科技大學(xué), 2024.
(編輯 武紅江))
西安交通大學(xué)學(xué)報(bào)2025年5期