賴榮燊,閆高強(qiáng)
(廈門理工學(xué)院 機(jī)械與汽車工程學(xué)院,福建 廈門 361021)
智能制造背景下,機(jī)械設(shè)備正在沿著一體化、自動(dòng)化、智能化趨勢不斷向前發(fā)展。在機(jī)械設(shè)備的發(fā)展過程中,旋轉(zhuǎn)部件的結(jié)構(gòu)越來越精密。滾動(dòng)軸承是旋轉(zhuǎn)部件中最常見的零件,它經(jīng)常因?yàn)殚L時(shí)間高速旋轉(zhuǎn)而產(chǎn)生磨損,所以在生產(chǎn)活動(dòng)中更容易發(fā)生故障。研究顯示,滾動(dòng)軸承產(chǎn)生的故障是很多重大安全事故的導(dǎo)火索,一旦出現(xiàn)故障,輕則使生產(chǎn)機(jī)器受損,重則可能造成生產(chǎn)人員傷亡。因此,滾動(dòng)軸承故障診斷研究具有重大意義。
經(jīng)過國內(nèi)外研究學(xué)者的努力,滾動(dòng)軸承故障診斷技術(shù)發(fā)生了巨大變革,從傳統(tǒng)的人工提取數(shù)據(jù)并分析故障原因,到現(xiàn)在的依靠人工智能領(lǐng)域的深度學(xué)習(xí)進(jìn)行自主診斷。40年來的研究探索從未間斷,為滾動(dòng)軸承故障診斷貢獻(xiàn)了大量實(shí)用方法。
在多種故障診斷研究中[1-4],比較常見的一種方法是基于深度學(xué)習(xí)框架的滾動(dòng)軸承故障診斷方法,它包括故障軸承數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、對故障數(shù)據(jù)特征提取和識別故障類型四部分。傳統(tǒng)故障診斷技術(shù)需要依賴技術(shù)人員的經(jīng)驗(yàn)和專業(yè)知識進(jìn)行故障識別,這極大限制了滾動(dòng)軸承故障診斷的發(fā)展。首先,特征提取必須依賴工程師的經(jīng)驗(yàn)和專業(yè)知識,微小的故障特征易被誤刪或被噪音掩蓋,存在較大的主觀性和盲目性;其次,提取到的特征主要用于解決特定的故障問題,方法通用性較差;另外,在實(shí)際工作環(huán)境下,軸承通常是變負(fù)載、變轉(zhuǎn)速的,如大貨車載重和速度變化、水利發(fā)電機(jī)組水流速度變化等。這導(dǎo)致系統(tǒng)采集到的軸承振動(dòng)信號存在脈沖間隔變化、特征提取困難、信號噪聲污染等問題,僅靠人工進(jìn)行故障診斷的傳統(tǒng)方法無法解決這些條件下的軸承故障診斷問題。
2006年,HINTON G E等人[5]提出了深度置信網(wǎng)絡(luò)的方法,采用無監(jiān)督預(yù)訓(xùn)練中間層的方法,使得深度學(xué)習(xí)(DL)不再受限于手動(dòng)選擇的特征;但該方法的泛化性較差,無法應(yīng)用于其他方面。DL利用深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對輸入樣本數(shù)據(jù)進(jìn)行逐層特征提取,擺脫了對專家經(jīng)驗(yàn)的依賴,實(shí)現(xiàn)了自主診斷和故障分類的目的。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)因其強(qiáng)大的數(shù)據(jù)挖掘能力及特征自適應(yīng)學(xué)習(xí)能力在機(jī)械狀態(tài)監(jiān)測領(lǐng)域受到研究人員的極大關(guān)注,將CNN應(yīng)用到故障診斷領(lǐng)域的研究成果頗豐。
CNN作為一種深度學(xué)習(xí)網(wǎng)絡(luò)模型,可以自主學(xué)習(xí)不同故障信號的故障特征,實(shí)現(xiàn)高準(zhǔn)確度滾動(dòng)軸承的故障診斷目的。曲建嶺等人[6]較早提出了一維CNN滾動(dòng)軸承故障診斷方法,此后將CNN用于軸承故障診斷的研究成果大量問世,促進(jìn)了軸承故障診斷技術(shù)的發(fā)展;但該方法存在診斷精度不高的缺點(diǎn)。目前,在CNN應(yīng)用于滾動(dòng)軸承故障診斷方面,還存在數(shù)據(jù)不平衡、信號噪聲使模型性能減弱、模型特征提取能力不足以及泛化性不強(qiáng)等需要解決的問題。
筆者回顧近5年來CNN用于軸承故障診斷領(lǐng)域的研究進(jìn)展,從深度特征提取、超參數(shù)調(diào)整、網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化等角度闡述CNN應(yīng)用于軸承故障診斷的優(yōu)化路徑,并對幾種經(jīng)典CNN模型、特征提取優(yōu)化方法和超參數(shù)優(yōu)化算法進(jìn)行比較,最后,指明后續(xù)研究工作應(yīng)聚焦于多源數(shù)據(jù)融合、模型性能優(yōu)化以及多方技術(shù)結(jié)合等方向。
CNN結(jié)構(gòu)簡單但具有強(qiáng)大的特征提取能力,通過構(gòu)建多個(gè)卷積層和池化層可以將輸入數(shù)據(jù)的深層特征提取出來,有效減少模型訓(xùn)練參數(shù)量,避免算法過擬合。此外,網(wǎng)絡(luò)層數(shù)越深,非線性擬合能力越強(qiáng),則能夠處理更高維度的數(shù)據(jù),因此,CNN在軸承故障診斷領(lǐng)域得到了廣泛應(yīng)用。
CNN的網(wǎng)絡(luò)結(jié)構(gòu)主要由卷積層、激活函數(shù)、池化層、全連接層和輸出層的SoftMax分類器五部分組成。通過組合交替和堆疊多個(gè)卷積層、激活函數(shù)和池化層就可以設(shè)計(jì)出更深層的CNN結(jié)構(gòu)。
CNN模型的基本架構(gòu)如圖1所示。

圖1 CNN模型的基本架構(gòu)
卷積運(yùn)算是CNN的核心部分,CNN應(yīng)用矩形卷積核遍歷輸入數(shù)據(jù)的每一個(gè)特征數(shù)值,將計(jì)算后的數(shù)值作為下一層卷積層的輸入數(shù)據(jù)。激活函數(shù)引入非線性表達(dá),增加了網(wǎng)絡(luò)的表達(dá)能力和學(xué)習(xí)復(fù)雜模式的能力。池化層的主要功能是降低特征圖的空間維度,提取主要特征并減少計(jì)算量。
全連接層是卷積網(wǎng)絡(luò)部分與輸出層(SoftMax分類器)的連接過渡結(jié)構(gòu),全連接層通過進(jìn)行特征融合和分類,將卷積層輸出映射到最終的輸出類別。全連接網(wǎng)絡(luò)的層與層之間的所有神經(jīng)元相互連接,負(fù)責(zé)將卷積輸出的特征圖轉(zhuǎn)化成一維向量,實(shí)現(xiàn)CNN端到端的學(xué)習(xí)過程。SoftMax分類器將網(wǎng)絡(luò)輸出轉(zhuǎn)化為概率分布,用于多分類任務(wù)的概率預(yù)測和決策。
CNN自被提出以來,經(jīng)過不斷的發(fā)展演變,產(chǎn)生了多種經(jīng)典的模型,如LeNet、AlexNet、GoogleNet、ResNet、Vgg以及DenseNet等。這些模型具備稀疏交互、參數(shù)共享等特點(diǎn),可以有效簡化故障診斷流程,減少訓(xùn)練參數(shù)數(shù)量,提高邊緣檢測效率,既可降低訓(xùn)練難度,又可以提高識別準(zhǔn)確率。由于這些出色的特性,CNN的信號處理能力優(yōu)于其他網(wǎng)絡(luò)。
趙小強(qiáng)等人[7]采用改進(jìn)LeNet-5模型提出了不依賴預(yù)處理復(fù)雜信號的方法,改進(jìn)卷積后的LeNet-5可以直接從原始信號中端到端高效地提取到更完整、更精準(zhǔn)的深層特征信息。徐衛(wèi)鵬等人[8]采用經(jīng)典AlexNet模型的方法,建立了一種由池化層和多級交替卷積層組成的一維CNN模型,采用滑窗法可完成對原始輸入信號特征的自適應(yīng)提取。姚齊水等人[9]以GoogleNet經(jīng)典模型為基礎(chǔ),改進(jìn)了Inception V2對輸入信號特征提取的過程,提出了一種改進(jìn)Inception V2模塊和CBAM注意力機(jī)制的滾動(dòng)軸承故障診斷方法。姚立等人[10]采用格拉姆角場編碼的方法,將一維軸承振動(dòng)信號進(jìn)行了整合,將處理后的信號輸入Vgg16模型,進(jìn)行了充分的特征提取。姜家國等人[11]提出了將馬爾可夫轉(zhuǎn)移場與DenseNet模型結(jié)合的方法,保留了原始振動(dòng)信號時(shí)序信息之間的時(shí)間相關(guān)性,使得DenseNet轉(zhuǎn)向更適合處理的圖像數(shù)據(jù)。高峰等人[12]提出了利用經(jīng)典模型自身為特征提取器的方法,以原始振動(dòng)數(shù)據(jù)為輸入,充分發(fā)揮CNN的特征提取能力。樊星男等人[13]認(rèn)為Hankel矩陣可以和CNN模型互相取長補(bǔ)短,采用區(qū)間歸一化方法,既保持了特征信號之間的連續(xù)性,又可以充分發(fā)揮經(jīng)典模型的特征提取能力。
總體而言,經(jīng)典CNN模型在軸承故障診斷問題上具有較好的表現(xiàn),能夠從原始數(shù)據(jù)中學(xué)習(xí)特征并進(jìn)行故障分類。然而在實(shí)際應(yīng)用中,需要根據(jù)具體的問題和數(shù)據(jù)集進(jìn)行模型選擇、數(shù)據(jù)處理和模型調(diào)優(yōu)等步驟,以獲得更準(zhǔn)確和可靠的故障診斷結(jié)果。應(yīng)用CNN處理滾動(dòng)軸承故障診斷問題的過程如圖2所示。

圖2 應(yīng)用CNN處理滾動(dòng)軸承故障診斷問題的過程
特征提取質(zhì)量的關(guān)鍵在于輸入信息特征的優(yōu)劣、信號處理方法的選擇和模型自身的特征提取能力。通過對采集到的振動(dòng)信號進(jìn)行一系列處理、轉(zhuǎn)換和分析,能夠?qū)⒃颊駝?dòng)信號轉(zhuǎn)化為時(shí)域和頻域信息,從而更好地理解和利用信號的信息。
這種信號處理過程能夠深入挖掘振動(dòng)信號中的特征和模式,為進(jìn)一步的數(shù)據(jù)分析和應(yīng)用提供了有力的基礎(chǔ)。
經(jīng)典CNN模型比較如表1所示。

表1 經(jīng)典CNN模型比較
當(dāng)前,大多數(shù)對于優(yōu)化特征提取的研究思路是應(yīng)用信號分析和數(shù)值計(jì)算等方法對采集到的原始數(shù)據(jù)進(jìn)行處理,再將其作為CNN卷積操作的輸入數(shù)據(jù),通過提高信號提取精度和減少模型計(jì)算量,進(jìn)行滾動(dòng)軸承故障的分類。特征提取中的時(shí)頻分析可以揭示非平穩(wěn)振動(dòng)信號的動(dòng)態(tài)特性,時(shí)頻分析方法包括短時(shí)傅里葉變換(short-time Fourier transform, STFT)、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition, EMD)、變分模態(tài)分解(variational mode decomposition, VMD)、小波變換(wavelet transform, WT)和小波包分解(wavelet packet decomposition, WPD)等。
STFT是一種線性的時(shí)頻分析方法。朱沁玥等人[14]在研究中采用STFT的方法來變換和估算旋轉(zhuǎn)設(shè)備的轉(zhuǎn)速信息。由于STFT的窗口大小固定,無法針對不同信號頻率進(jìn)行自適應(yīng),因此STFT無法從非平穩(wěn)的信號中精確提取到瞬時(shí)信號特征,致使STFT的精確性相對較低。EMD無需借助小波基函數(shù),只針對信號本身進(jìn)行分解,避免了WT的局限性。
此外,為解決小波基函數(shù)造成的信號降噪效果降低和信號有效成分丟失的問題,田少寧等人[15]提出了CNN與VMD結(jié)合的方法,采用可變尺度的非遞歸信號處理方法提取了非平穩(wěn)信號的特征信息,其具有較小的端點(diǎn)效應(yīng)、較高的運(yùn)算效率和良好的噪聲魯棒性。WT的本質(zhì)是采用小波基函數(shù)對信號進(jìn)行各種加權(quán)和濾波操作,因此包含各種尺度下的信號特征信息,故能處理突變和非穩(wěn)定信號。WPD作為一種多時(shí)間分辨率的時(shí)頻分析算法,通過對信號進(jìn)行小波包變換,將其轉(zhuǎn)化為低頻帶的近似系數(shù)和高頻帶的細(xì)節(jié)系數(shù)。
信號的輸入特征直接影響CNN的故障診斷和預(yù)測結(jié)果。信號特征提取的方法不同,獲取的信息不同,同一信號提取到的特征參數(shù)不同,故障診斷的結(jié)果也會(huì)有所差異。
WANG H等人[16]針對信號特征精度提取困難的問題,提出了一種STFT與多同步壓縮變換相結(jié)合的信號特征提取方法,建立了局部特征空間與故障空間之間的映射。BAI R等人[17]采用多尺度剪切融合數(shù)據(jù)增強(qiáng)的方法對故障信號進(jìn)行了增強(qiáng),通過STFT轉(zhuǎn)化后利用多通道CNN進(jìn)行了數(shù)據(jù)融合和故障分類。YAO P等人[18]采用梅爾頻率倒譜技術(shù)的方法提取振動(dòng)信號不同頻段的特征,通過倒拍光譜舉升技術(shù)的特征增強(qiáng)過程,提高了信號提取精度和方法的適應(yīng)性。丁春嶸等人[19]和陳曉雷等人[20]提出了應(yīng)用長短時(shí)記憶網(wǎng)絡(luò)模型,考慮了CNN對于提取序列數(shù)據(jù)和信息數(shù)據(jù)的順序性并在此基礎(chǔ)上進(jìn)行了優(yōu)化,提高了信息的提取精度。董紹江等人[21]和DING C等人[22]為避免丟失微弱信號的故障細(xì)節(jié)特征,采用將帶噪聲信號經(jīng)奇異值分解的方法,消除了噪聲模態(tài)混疊后再將其用于分解原始振動(dòng)信號,保證了CNN特征提取的適應(yīng)性、全面性和多樣性。李魁等人[23]提出了一種融合VMD和CNN的滾動(dòng)軸承故障診斷方法,該方法不僅去除了信號中的噪聲成分,還將相關(guān)系數(shù)作為參考指標(biāo)以優(yōu)化模態(tài)分量選取個(gè)數(shù)。陳仁祥等人[24]和王妮妮等人[25]采用WT獲取振動(dòng)信號時(shí)頻圖的方法,將時(shí)頻圖像作為CNN的輸入,充分提取了軸承振動(dòng)信號的關(guān)鍵故障特征。LI J等人[26]認(rèn)為故障信號中信息最豐富的部分只占時(shí)頻域信號的小部分,提出了基于反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation, BP)的多尺度局部特征學(xué)習(xí)法。SONG X等人[27]提出了BP神經(jīng)網(wǎng)絡(luò)與粒子群算法結(jié)合的方法,先對振動(dòng)信號進(jìn)行了EMD分解,再利用算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對滾動(dòng)軸承故障進(jìn)行了分類。
WPD技術(shù)不僅可以根據(jù)需要調(diào)整時(shí)間分辨率的大小來提取不同頻率的信號,還能夠同時(shí)獲取低頻和高頻信號,從而更全面地分析振動(dòng)信號的特征。
樓劍陽等人[28]采用WPD對振動(dòng)信號進(jìn)行了預(yù)處理,獲得了表征信號相似的小波系數(shù)的方法,再將其輸入CNN進(jìn)行特征提取,實(shí)現(xiàn)了軸承故障分類目的。楊蕊等人[29]采用計(jì)算原始時(shí)域信號頻譜在不同偏移點(diǎn)數(shù)下的相關(guān)峭度值,將其作為新的樣本數(shù)據(jù)方法,使得數(shù)據(jù)之間的差異更加顯著。牛銳祥等人[30]構(gòu)建了多尺度卷積層,充分捕捉了信號特征的過程,增強(qiáng)了特征的復(fù)用性。雷春麗等人[31]則利用馬爾可夫轉(zhuǎn)移場編碼方法,使振動(dòng)信號的時(shí)間相關(guān)性特征得以保留。張珂等人[32]提出的多模態(tài)注意力技術(shù)和丁雪等人[33]提出的多尺度注意力方法,都使得CNN可以更加充分地完成故障信號的特征提取。劉偉等人[34]提出了由兩個(gè)通道組成的并行一維CNN模型,該模型可以用于分別獲取軸承振動(dòng)信號的時(shí)域信息和頻域信息。趙小強(qiáng)等人[35]采用帶跳躍連接線的卷積模塊融合CNN的方法,防止提取到的豐富信號特征在卷積層向前傳遞時(shí)丟失。古天龍等人[36]利用深層多尺度卷積操作過程,提高了CNN對故障信號挖掘的深度和精度。蒙志強(qiáng)等人[37]在CNN中采用多尺度卷積核并聯(lián)的方法對軸承振動(dòng)信號進(jìn)行了更充分的故障信息提取。金江濤等人[38]對信號處理方法進(jìn)行了創(chuàng)新,提出了基于混沌理論的相空間重構(gòu)法,進(jìn)一步推動(dòng)了軸承故障診斷研究。
特征提取的重要性是將滾動(dòng)軸承的故障診斷問題聚焦為軸承故障特征信息的提取問題,采用各種信號處理方法可以減少噪聲和干擾,CNN可以提取有區(qū)分性的特征,并使模型能夠更好地學(xué)習(xí)和識別軸承故障模式,解決了軸承故障診斷中信號包含噪聲、數(shù)據(jù)難以采樣和數(shù)據(jù)分布差異較大的問題。
然而,當(dāng)軸承工況差異較大且信號含有高噪聲時(shí),特征提取性能會(huì)顯著下降。
信號分析方法比較如表2所示。

表2 信號分析方法比較
CNN的模型包含的參數(shù)通常可以分為一般參數(shù)與超參數(shù)。其中一般參數(shù)是模型經(jīng)過不斷地訓(xùn)練自動(dòng)調(diào)整的,不需要人工進(jìn)行設(shè)置。而對于超參數(shù),模型無法通過訓(xùn)練來調(diào)整,一般是在模型訓(xùn)練前就設(shè)定好,如設(shè)置學(xué)習(xí)率0.1、0.001和訓(xùn)練批量大小64、128。
超參數(shù)的設(shè)定值通常依賴過去的經(jīng)驗(yàn),但是依靠經(jīng)驗(yàn)來設(shè)定數(shù)值的方法在用于解決具體問題時(shí)通常效果不佳,因此,對于超參數(shù)的優(yōu)化調(diào)整是基于CNN的滾動(dòng)軸承故障診斷研究的重要組成部分。
近幾年來,國內(nèi)外研究學(xué)者開始以調(diào)整CNN中的最優(yōu)超參數(shù)來進(jìn)行CNN故障診斷的創(chuàng)新,隨后各類算法的創(chuàng)新應(yīng)用大量涌現(xiàn)。其中包含貝葉斯優(yōu)化算法、差分進(jìn)化算法、布谷鳥搜索算法、最大相關(guān)峭度反卷積算法以及稀疏搜索算法等,這些調(diào)整方法都為CNN用于滾動(dòng)軸承故障診斷提供大量研究支持。
貝葉斯優(yōu)化算法(Bayesian optimization, BO)是利用高斯回歸過程搜尋目標(biāo)函數(shù)最優(yōu)值的算法。BO不是使用窮舉搜索算法,而是針對成本函數(shù)f(x)值密度較高的區(qū)域進(jìn)行搜索,這大大減少了計(jì)算工作量。采集函數(shù)和概率代理模型是貝葉斯優(yōu)化的關(guān)鍵組成部分。采集函數(shù)由目標(biāo)函數(shù)的后驗(yàn)概率組成,用于選擇評估點(diǎn)以最小化總損失。
差分進(jìn)化算法(differential evolution algorithm, DE)是一種基于種群的優(yōu)化算法,相比其他優(yōu)化算法,DE具有較高的可操控性。它僅有三個(gè)控制參數(shù)需要調(diào)節(jié),具有簡單結(jié)構(gòu)和易于實(shí)現(xiàn)的優(yōu)勢,同時(shí)具備良好的全局搜索能力。
布谷鳥搜索算法(cuckoo search algorithm, CSA)是一種模擬布谷鳥寄生孵化行為的優(yōu)化算法,它被廣泛應(yīng)用于解決各種優(yōu)化問題。CSA具有強(qiáng)大的全局搜索能力,可以發(fā)現(xiàn)最佳的超參數(shù)設(shè)定值,從而提升CNN的性能和效果。
參數(shù)優(yōu)化的最大相關(guān)峭度反卷積算法(maximum correlated kurtosis deconvolution, MCKD)是通過迭代選擇一個(gè)有限脈沖響應(yīng)濾波器,濾波器利用故障的周期性,突出被強(qiáng)噪聲覆蓋的信號中的連續(xù)脈沖。MCKD具有多個(gè)輸入?yún)?shù),并對它們有嚴(yán)格的要求。除原始信號和原始采樣率外,濾波器長度、故障周期、最大迭代次數(shù)以及位移順序等都對MCKD濾波器的函數(shù)有很大的影響。這些參數(shù)的選擇必須合適和精確,以突出MCKD算法的優(yōu)越性。
除此之外,還有稀疏搜索算法(sparse search algorithm, SSA),SSA模仿麻雀覓食的過程對CNN的最優(yōu)參數(shù)組合進(jìn)行搜索,通過快速搜索和收斂的過程確定適合的參數(shù),然后建立一個(gè)CNN故障診斷模型。
針對調(diào)整超參數(shù)的優(yōu)化方法,LU Y等人[39]和湯亮等人[40]提出了BO與CNN進(jìn)行結(jié)合的診斷方法。該方法通過對CNN的學(xué)習(xí)率等超參數(shù)進(jìn)行調(diào)整,提高了CNN對于故障類型的分類能力。孫祺淳等人[41]采用DE算法的優(yōu)勢來調(diào)節(jié)CNN中的學(xué)習(xí)率、卷積核大小和數(shù)量等6個(gè)超參數(shù),降低了網(wǎng)絡(luò)波動(dòng),將模型的診斷精度和穩(wěn)定性一并作為算法優(yōu)化的目標(biāo)。XIAO M等人[42]利用CSA的全局搜索能力,不斷搜索CNN的輸入層、隱層和輸出節(jié)點(diǎn)數(shù)目的最優(yōu)組合。GAO S等人[43]提出了MCKD和CNN的滾動(dòng)軸承復(fù)合故障診斷方法,利用該算法對CNN的卷積核大小和迭代次數(shù)進(jìn)行優(yōu)化,最后,將處理后的信號輸入CNN模型中進(jìn)行訓(xùn)練和測試。DONG S等人[44]提出了與稀疏搜索算法相結(jié)合的新方法,利用SSA搜索出CNN的學(xué)習(xí)率等最優(yōu)超參數(shù)集合,再利用預(yù)處理后的數(shù)據(jù)集作為CNN的訓(xùn)練和測試樣本。ZHUO P C等人[45]提出了Elman神經(jīng)網(wǎng)絡(luò)模型,結(jié)合遺傳算法的全局尋優(yōu)與Elman神經(jīng)網(wǎng)絡(luò)的局部尋優(yōu)能力,構(gòu)建出了新超參數(shù)集合的Elman神經(jīng)網(wǎng)絡(luò)模型,提高了軸承故障診斷的精度。XU Q等人[46]通過預(yù)訓(xùn)練Off-CNN的過程得到了全連接層的源域特征和參數(shù)集合,再初始化On-CNN的批處理大小和學(xué)習(xí)率等超參數(shù),提高了故障診斷的準(zhǔn)確率。AN F等人[47]提出了重疊群稀疏模型,通過分析信號突出特征來設(shè)置CNN的卷積核數(shù)目等超系數(shù),可以更快地判斷出軸承的故障類型。王亞輝等人[48]采用粒子群算法的方法搜索出CNN的層數(shù)、CNN層的類別、池化層的類型、卷積核的尺寸、卷積核的個(gè)數(shù)、全連接層神經(jīng)元的個(gè)數(shù)等最優(yōu)參數(shù)集合,提高了基于CNN進(jìn)行軸承故障診斷的準(zhǔn)確率。
利用調(diào)整CNN超參數(shù)的方法包括調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)、學(xué)習(xí)率、批量大小、正則化方法、優(yōu)化器選擇、數(shù)據(jù)增強(qiáng)策略和交叉驗(yàn)證等,增強(qiáng)了網(wǎng)絡(luò)模型特征提取精確度和抗干擾能力,為研究復(fù)雜工況下滾動(dòng)軸承故障診斷增加了理論支持,進(jìn)一步提高了滾動(dòng)軸承故障診斷和CNN的研究精度與深度。
超參數(shù)優(yōu)化算法比較如表3所示。

表3 超參數(shù)優(yōu)化算法比較
在故障診斷應(yīng)用中,為了解決LeNet、AlexNet、GoogleNet等經(jīng)典網(wǎng)絡(luò)模型在變工況復(fù)雜條件下診斷精度不高、泛化性差的問題,諸多學(xué)者從CNN模型結(jié)構(gòu)出發(fā),結(jié)合實(shí)際數(shù)據(jù)和訓(xùn)練效果,對經(jīng)典網(wǎng)絡(luò)模型進(jìn)行了優(yōu)化和創(chuàng)新,結(jié)合多種方法進(jìn)行了滾動(dòng)軸承故障診斷,挖掘軸承振動(dòng)信號數(shù)據(jù)下隱含的故障特征,有效檢測了軸承工作狀態(tài),使模型訓(xùn)練速度更快、診斷結(jié)果更可靠。
目前,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)的研究取得了許多突破性進(jìn)展,HE D等人[49]提出了一種新型輕量級CNN模型,模型主體以倒殘差塊構(gòu)建,通過嵌入擠壓激勵(lì)塊和引入輕量化概念,大幅減少了模型計(jì)算量,減少了降維過程中的特征損失。LIU X等人[50]提出了結(jié)合1D-CNN和2D-CNN構(gòu)建故障診斷模型,在其雙域特征信息中提取了故障特征。XUE F等人[51]采用CNN模型對故障信號特征提取的過程,將特征融合策略進(jìn)行連接,使模型整體特征提取效率大大提高。XU Y等人[52]提出了一種輕量級梯度提升機(jī)制(light gradient boosting machine, LGBM),關(guān)鍵是結(jié)合基于梯度的單側(cè)采樣和排他性特征綁定兩種新方法,利用LGBM代替SoftMax分類器,提高了模型診斷的穩(wěn)定性。ZHAO X等人[53]采用基于多尺度學(xué)習(xí)的多尺度殘余收縮層和殘余收縮塊的方法,疊加了多個(gè)多尺度殘余收縮層,從輸入數(shù)據(jù)中自主學(xué)習(xí)振動(dòng)信號的特征。劉洋等人[54]提出了雙池化層取代傳統(tǒng)CNN中的全連接層的方法,進(jìn)行了故障信息整合和數(shù)據(jù)特征再提取,最后經(jīng)過SoftMax層完成了軸承故障狀態(tài)分類。朱奇先等人[55]采用三個(gè)連續(xù)的卷積層代替殘差神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)池化層的方法,不僅增強(qiáng)了特征信息在密集塊中的流動(dòng),還增強(qiáng)了特征信息的重復(fù)利用。王琦等人[56]采用1×1的卷積核的方法,在提高一維CNN非線性表達(dá)能力的同時(shí),將傳統(tǒng)CNN中的全連接層替換為全局平局池化層,大大降低了模型計(jì)算量,不僅防止了模型過擬合,還提高了故障診斷效率。LIU Y等人[57]采用優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)的方法,用膠囊網(wǎng)絡(luò)取代CNN中的部分功能層,保持模型訓(xùn)練過程的平穩(wěn)性。金江濤等人[58]提出了一種混沌特征融合方法,將支持向量機(jī)作為分類器代替全連接層。昝濤等人[59]提出了基于多輸入層CNN的滾動(dòng)軸承故障診斷模型,相比傳統(tǒng)CNN診斷模型具有多個(gè)輸入層,使得該模型可以更充分地提取原始信號的特征信息。XING Z等人[60]提出了一個(gè)多通道并行CNN模型,將在各并行信道中引入注意機(jī)制,提取具有較強(qiáng)沖擊特性的故障特征。宮文峰等人[61]針對傳統(tǒng)CNN模型全連接層存在訓(xùn)練參數(shù)量過多導(dǎo)致模型訓(xùn)練時(shí)間較長的缺點(diǎn),提出了將傳統(tǒng)CNN的全連接層部分引入全局平均池化的方法。CHAO Z等人[62]提出了多尺度級聯(lián)中點(diǎn)殘差CNN的方法,將網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)更改為使用中點(diǎn)剩余塊中的快捷連接,解決了梯度消失和梯度爆炸問題。WU Z等人[63]提出了深度強(qiáng)化傳遞神經(jīng)網(wǎng)絡(luò)模型,利用深度Q網(wǎng)絡(luò)的自學(xué)習(xí)能力來訓(xùn)練一個(gè)對軸承故障分類的智能診斷代理。金江濤等人[64]采用引入支持向量機(jī)的方法,考慮到故障信號的時(shí)間和空間尺度,將故障信號的時(shí)間序列作為輸入源,以挖掘振動(dòng)信號中隱藏的非線性信息。
為解決基于卷積神經(jīng)的滾動(dòng)軸承故障診斷與分類問題,一些研究學(xué)者在原有CNN結(jié)構(gòu)上進(jìn)行大膽改進(jìn)和創(chuàng)新,構(gòu)建新的深層次網(wǎng)絡(luò)結(jié)構(gòu),使故障診斷有更高的效率和精確度[65]。
在軸承故障診斷中,調(diào)整CNN結(jié)構(gòu)是一種常見的方法。以下是對軸承故障診斷中調(diào)整CNN結(jié)構(gòu)常用方法的總結(jié):
1)多尺度卷積層。引入多尺度卷積層可以同時(shí)提取不同尺度的特征,從而更全面地描述軸承信號。這種方法能夠增強(qiáng)模型對不同頻率故障的識別能力,提高診斷的準(zhǔn)確性;
2)注意力機(jī)制。通過引入注意力機(jī)制,可以自動(dòng)學(xué)習(xí)和選擇重要的特征,提高模型對故障信號中關(guān)鍵部分的關(guān)注度;
3)全局平均池化層。使用全局平均池化層可以將特征圖的空間維度壓縮為一個(gè)單一的數(shù)值,減少模型的參數(shù)量和計(jì)算復(fù)雜度。這種方法可以防止過擬合,并提高模型的泛化能力;
4)殘差連接。采用引入殘差連接的方法可以直接將輸入信號與輸出信號相加,從而保留原始信號的信息,避免信息損失和梯度消失問題,有助于提高模型對軸承故障的捕捉能力和表示能力。
為高效準(zhǔn)確地完成滾動(dòng)軸承故障診斷工作,筆者首先對CNN的結(jié)構(gòu)進(jìn)行了簡單介紹,并研究了近年來經(jīng)典CNN模型用于滾動(dòng)軸承故障診斷的重要進(jìn)展;然后,從深度特征提取、超參數(shù)調(diào)整和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化等角度,對各種優(yōu)化CNN的方法原理進(jìn)行了簡單介紹,詳細(xì)探討了將CNN應(yīng)用于滾動(dòng)軸承故障診斷的優(yōu)化途徑;最后對幾種典型優(yōu)化方法的優(yōu)勢與不足進(jìn)行了比較。
通過筆者分析論述,得到的結(jié)論如下:
1)早期經(jīng)典模型存在一些局限性,如特征提取精度和效率較低、模型泛化性能較差以及學(xué)習(xí)率不高等問題[66];
2)采用基于深度特征提取的各種信號處理方法可以減少噪聲的干擾和影響,更利于CNN提取差異性的特征;
3)采用調(diào)整超參數(shù)提高模型學(xué)習(xí)率的方法可以將研究重點(diǎn)轉(zhuǎn)移至模型自身的提取精度,通過調(diào)整超參數(shù)來提高模型的診斷準(zhǔn)確率;
4)采用優(yōu)化模型結(jié)構(gòu)的方法可以使模型的提取精度和泛化性能得到增強(qiáng),提高了軸承故障診斷分類的準(zhǔn)確率,但需要在數(shù)據(jù)量較大的情況下,模型的分類性能才能更佳。
盡管基于CNN的滾動(dòng)軸承故障診斷研究取得了十分顯著的進(jìn)展,但仍有需要改進(jìn)和發(fā)展的空間。例如,需要解決數(shù)據(jù)不平衡、模型特征提取能力不足和泛化性不強(qiáng)的問題。因此,后續(xù)的相關(guān)研究工作應(yīng)聚焦于多源數(shù)據(jù)融合、模型性能優(yōu)化以及多方技術(shù)結(jié)合等方向。