楊騰,寧芊,陳炳才
(1.四川大學(xué)電子信息學(xué)院,成都610065;2.大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,大連116024)
大型機(jī)電設(shè)備是復(fù)雜的非線性動(dòng)態(tài)系統(tǒng),具有不確定性、非線性、時(shí)變等特點(diǎn),故障狀態(tài)復(fù)雜,干擾因素多[1]。滾動(dòng)軸承作為機(jī)電設(shè)備的重要組成部分,故障如若發(fā)現(xiàn)排查不及時(shí),或是診斷出錯(cuò)往往會(huì)導(dǎo)致生產(chǎn)延誤和維修費(fèi)用過(guò)多,甚至成為生產(chǎn)作業(yè)人員人身安全的重大隱患[2],因此準(zhǔn)確及時(shí)的檢查與診斷滾動(dòng)軸承的故障以最大限度地降低性能下降和避免危險(xiǎn)的發(fā)生是必要的,也是故障診斷研究者們近年來(lái)不斷追求的。
早期故障診斷一般先對(duì)收集到的滾動(dòng)軸承振動(dòng)信號(hào)進(jìn)行分析處理,選取合適的特征信號(hào)進(jìn)行提取[3],然后再輸入到支持向量機(jī)(SVM)、模糊C均值聚類等機(jī)器學(xué)習(xí)算法中進(jìn)行故障診斷和分類。傳統(tǒng)的特征特征提取可分為三類:基于時(shí)域分析的信號(hào)特征提取,基于頻域分析的信號(hào)特征提取以及基于時(shí)頻分析的信號(hào)特征提取[4]。Yan提出的一種多域特征支持向量機(jī)優(yōu)化分類算法在滾動(dòng)軸承故障診斷中的應(yīng)用[5],從時(shí)域、頻域、時(shí)頻域等多域方面提取故障特征信息然后利用基于粒子群優(yōu)化的支持向量機(jī)分類模型,實(shí)現(xiàn)了滾動(dòng)軸承多故障狀態(tài)的識(shí)別。Li提出了一種基于置換熵、集成經(jīng)驗(yàn)?zāi)J椒纸夂椭С窒蛄繖C(jī)優(yōu)化的軸承故障診斷模型[6],通過(guò)整體經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)將振動(dòng)信號(hào)分解為一組固有模態(tài)函數(shù),利用特征空間中簇間距離(ICD)優(yōu)化的SVM對(duì)故障類型和故障嚴(yán)重程度進(jìn)行分類。然而基于特征提取的信號(hào)處理技術(shù)比較依賴人為的特征選取和先驗(yàn)知識(shí),在一些時(shí)候可能遺漏原始故障特征,而且泛化性能較低使人們開(kāi)始尋找新的方向[7]。
隨著深度學(xué)習(xí)熱潮的興起,其在自然語(yǔ)言處理、圖像識(shí)別等領(lǐng)域的廣泛應(yīng)用也給軸承故障診斷研究者們帶來(lái)了新的方向。深度學(xué)習(xí)從收集的信號(hào)中自動(dòng)的提取有用特征而不再依賴人工特征提取,使用端到端的形式將原始信號(hào)數(shù)據(jù)和深度學(xué)習(xí)網(wǎng)絡(luò)相連實(shí)現(xiàn)對(duì)滾動(dòng)軸承故障的診斷分類[8]。近年來(lái),較為公眾熟悉的深度學(xué)習(xí)基本模型框架包括深度置信網(wǎng)絡(luò)(DBN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、堆疊自動(dòng)編碼機(jī)(SAE)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)[9]。Xu提出了一種新的自適應(yīng)快速深卷積神經(jīng)網(wǎng)絡(luò)能從振動(dòng)信號(hào)中自動(dòng)學(xué)習(xí)復(fù)雜有用的特征,利用指數(shù)線性單元激活函數(shù)和全局平均池構(gòu)造了深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),具有廣闊的接受域[10]。Wu提出一種用于軸承故障診斷的自適應(yīng)深度轉(zhuǎn)移學(xué)習(xí)方法,使用基于實(shí)例轉(zhuǎn)移學(xué)習(xí)的長(zhǎng)短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)(LSTM)模型,生成輔助數(shù)據(jù)集,引入GWO(Grey Wolf Optimization)優(yōu)化算法,自適應(yīng)地學(xué)習(xí)聯(lián)合分布自適應(yīng)的關(guān)鍵參數(shù),其模型在標(biāo)記故障數(shù)據(jù)不足的情況下依然具備很好的有效性和魯棒性[11]。ZHANG提出一種基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的軸承故障診斷方法,將一維原始數(shù)據(jù)轉(zhuǎn)換為二維圖像數(shù)據(jù),通過(guò)CNN神經(jīng)網(wǎng)絡(luò)消除專家經(jīng)驗(yàn)對(duì)特征提取的影響自動(dòng)的提取特征并對(duì)故障進(jìn)行診斷[12]。以上所構(gòu)建的神經(jīng)網(wǎng)絡(luò)多是對(duì)滾動(dòng)軸承信號(hào)單一域上的診斷,不能很好的學(xué)習(xí)到其他域的特征,所以其泛化性和準(zhǔn)確性依然存在提升空間。
為了解決以上問(wèn)題,本文提出一種基于小波變換和殘差神經(jīng)網(wǎng)絡(luò)模型的變負(fù)載軸承故障診斷模型。該模型將采集到的振動(dòng)信號(hào)通過(guò)小波變換將一維時(shí)域信號(hào)映射到二維時(shí)頻域中,將得到的二維時(shí)頻信號(hào)進(jìn)一步壓縮后作為改進(jìn)殘差網(wǎng)絡(luò)的輸入,由網(wǎng)絡(luò)自身對(duì)信號(hào)進(jìn)行特征提取并進(jìn)行診斷。
小波變換由法國(guó)學(xué)者M(jìn)orlet于提出,傳統(tǒng)的快速傅里葉變換將時(shí)域信號(hào)變換到頻域上,能直觀的從頻域上對(duì)信號(hào)進(jìn)行分析,但是無(wú)法得知信號(hào)在不同時(shí)間點(diǎn)上的頻率信息,小波變換使用面積固定而形狀可變的窗函數(shù)通過(guò)多辨率分析能很好的平衡時(shí)間分辨率和頻率分辨率。連續(xù)小波變換公式(1)如下:

其中w(a,b)為小波變換系數(shù),φ(t)?L2(R)為基本小波或母小波,其傅里葉變換?(w)滿足條件(2):

對(duì)母小波進(jìn)行伸縮、平移將得到一系列小波函數(shù):

凱西西儲(chǔ)大學(xué)(CWRU)滾動(dòng)軸承數(shù)據(jù)中心的數(shù)據(jù)被廣泛應(yīng)用于滾動(dòng)軸承診斷領(lǐng)域和信號(hào)分析領(lǐng)域,大量論文期刊也以此作為訓(xùn)練數(shù)據(jù),為避免數(shù)據(jù)非同一分布帶來(lái)的實(shí)驗(yàn)誤差,本文所有數(shù)據(jù)均使用CWRU數(shù)據(jù)集。驅(qū)動(dòng)端軸承故障由電火花在內(nèi)圈、外圈、滾動(dòng)體三個(gè)位置點(diǎn)觸加工形成:內(nèi)圈損傷、外圈損傷、滾動(dòng)體損傷三種故障位置類型,故障位置損傷有三種不同損傷尺寸分別為:0.007inch、0.014inch、0.021inch,共計(jì)九種故障類別,加上滾動(dòng)軸承正常工作狀態(tài)共計(jì)十種軸承狀態(tài)標(biāo)簽。
在模擬實(shí)驗(yàn)中使用型號(hào)SKF-6205的驅(qū)動(dòng)端作為實(shí)驗(yàn)對(duì)象,信號(hào)采樣頻率為12KHz。根據(jù)軸承工況的不同,數(shù)據(jù)集共四種分別為:0hp、1hp、2hp、3hp。每個(gè)樣本由2048個(gè)振動(dòng)點(diǎn)表征(使用隨機(jī)抽取的方式從長(zhǎng)度為10萬(wàn)左右的振動(dòng)點(diǎn)序列中隨機(jī)的抽取一段連續(xù)的長(zhǎng)度為2048的振動(dòng)點(diǎn),若重復(fù)抽取則舍棄重新抽取)。圖1是1hp工況下軸承不同狀態(tài)標(biāo)簽下的樣本時(shí)域波形圖。鑒于篇幅限制僅展示正常狀態(tài)以及損傷尺寸0.007inch的三種故障狀態(tài)。

圖1 不同故障類型樣本的時(shí)域波形圖
圖2是時(shí)域樣本經(jīng)過(guò)小波變換后得到的時(shí)頻圖,其中采樣頻率12K,尺寸序列長(zhǎng)度為256,使用小波名為cmor3-3。從圖中我們能夠直觀的看到不同故障狀態(tài)的能量分布具有良好的分辨性,其中軸承正常狀態(tài)下的能量集中在低頻分段且在整個(gè)時(shí)間軸上波動(dòng)較小,故障狀態(tài)下則集中在高頻分段并且在時(shí)間軸上出現(xiàn)明顯波動(dòng)對(duì)比明顯。小波變換后的時(shí)頻圖展示出良好的時(shí)間分辨率和頻率分辨率。

圖2 不同故障類型樣本的小波變換時(shí)頻圖
由于小波變換直接輸出的時(shí)頻圖維度較大,若直接將其作為網(wǎng)絡(luò)模型輸入計(jì)算量巨大,所以我們將其維度壓縮至128×128,使深度神經(jīng)網(wǎng)絡(luò)能夠更快的訓(xùn)練模型,更快的診斷故障,提高模型實(shí)際應(yīng)用的實(shí)時(shí)性。圖3為壓縮后的小波變換時(shí)頻圖,從圖中可以看到對(duì)比壓縮前的時(shí)頻圖壓縮后的時(shí)頻圖特征基本保留完整,未出現(xiàn)明顯的特征丟失。

圖3 不同故障類型樣本的小波變換時(shí)頻壓縮圖
每種工況下滾動(dòng)軸承有正常狀態(tài)、內(nèi)圈故障狀態(tài)、外圈故障狀態(tài)、滾動(dòng)體故障狀態(tài),除正常狀態(tài)外其余三種狀態(tài)均有上述提及損傷尺寸共十種軸承狀態(tài)。每種軸承狀態(tài)使用800個(gè)樣本作為訓(xùn)練集200個(gè)樣本作為驗(yàn)證集。單一工況數(shù)據(jù)集信息如表1所示。

表1 單一工況下的數(shù)據(jù)集
為驗(yàn)證本文模型在不同工況下的適應(yīng)性,設(shè)置0hp、1hp、2hp、3hp四種變負(fù)載數(shù)據(jù)集,并使用不同負(fù)載數(shù)據(jù)集進(jìn)行交叉驗(yàn)證。數(shù)據(jù)集設(shè)置可見(jiàn)表2。

表2 交叉驗(yàn)證數(shù)據(jù)集
眾所周知,在深度神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)的深度是至關(guān)重要的,為追求更高的精確度研究者們往往會(huì)選擇擴(kuò)大訓(xùn)練集樣本或是更深的網(wǎng)絡(luò)結(jié)構(gòu),然而選擇更深的網(wǎng)絡(luò)結(jié)構(gòu)同時(shí)帶來(lái)的兩個(gè)問(wèn)題:梯度消失/梯度爆炸以及網(wǎng)絡(luò)的退化問(wèn)題。前者可以通過(guò)歸一化初始化、中間歸一化層得到解決,但是對(duì)于后者研究者們發(fā)現(xiàn)對(duì)一個(gè)網(wǎng)絡(luò)逐漸增加其的深度,模型的準(zhǔn)確度逐漸達(dá)到飽和然后迅速退化。
為解決模型網(wǎng)絡(luò)層數(shù)過(guò)深而導(dǎo)致的退化問(wèn)題,K.He等人受傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)(VGGNET)的啟發(fā)于2017年提出了殘差網(wǎng)絡(luò)(ResNet)[13]。VGGNET使用多個(gè)卷積核尺寸為3×3的卷積層堆疊構(gòu)成卷積組,代替?zhèn)鹘y(tǒng)的大卷積核卷積層,有效的減少了參數(shù),加快了網(wǎng)絡(luò)的學(xué)習(xí)速度。ResNet在VGGNET的基礎(chǔ)上采用一種“shortcut connections”鏈接方式如圖4,假設(shè)將一組堆疊的神經(jīng)網(wǎng)絡(luò)層的映射近似為恒等映射,即該組神經(jīng)網(wǎng)絡(luò)層的輸入為X,堆疊的非線性層映射為F(X),其輸出H(X)則表示為:H(X)=F(X)+X,當(dāng)H(X)近似為X時(shí),這組堆疊的網(wǎng)絡(luò)層可看做一個(gè)恒等映射,F(xiàn)(X)則被看做一個(gè)殘差函數(shù)有:F(X)=H(X)-X,因此在神經(jīng)網(wǎng)絡(luò)中添加若干恒等映射既加深了網(wǎng)絡(luò)深度也不會(huì)導(dǎo)致網(wǎng)絡(luò)的退化。故模型僅需最小化F(X)將化殘差函數(shù)逼近于0即可解決網(wǎng)絡(luò)過(guò)深帶來(lái)的性能退化問(wèn)題。

圖4 快捷連接
恒等殘差塊如圖5(a)所示其輸入的激活和輸出的激活具有相同維度,由三個(gè)二維卷積核組成,三個(gè)卷積核緊連著B(niǎo)atchNorm對(duì)數(shù)據(jù)進(jìn)行歸一化處理,最后一個(gè)卷積層和前兩個(gè)卷積層的不同點(diǎn)在于其沒(méi)有在BatchNorm歸一化后直接聯(lián)接修正線性單元ReLU激活函數(shù),而是和恒等殘差塊的輸入通過(guò)shortcut connections進(jìn)行整合再使用RuLU進(jìn)行激活。
隨著網(wǎng)絡(luò)結(jié)構(gòu)的深入激活函數(shù)輸出的feature map的維度逐漸增大,當(dāng)輸入輸出的維度不一致時(shí)恒等殘差塊不再適用,于是使用圖5(b)所示的卷積殘差塊結(jié)構(gòu)。卷積殘差塊在shortcut connections添加一個(gè)卷積核和BatchNorm歸一化將輸出和輸入對(duì)齊到相同維度再使用RuLU進(jìn)行激活處理。

圖5 兩種殘差塊結(jié)構(gòu)
Dropout層是一種常見(jiàn)的正則化方法,在殘差神經(jīng)網(wǎng)絡(luò)中一般應(yīng)用與全連接層。Dropout每次迭代都會(huì)隨機(jī)的使網(wǎng)絡(luò)輸入節(jié)點(diǎn)或者是上層網(wǎng)絡(luò)的激活失效,相當(dāng)于修改了網(wǎng)絡(luò)結(jié)構(gòu),能夠模擬不同網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),提升網(wǎng)絡(luò)模型泛化性和魯棒性。為提升模型對(duì)變負(fù)載軸承故障檢測(cè)的泛化性和魯棒性僅在全連接層使用DropOut正則化是不夠的,因此本文模型在卷積層后鏈接一個(gè)DropBlock層用以對(duì)卷積層的特征圖(feature map)進(jìn)行隨機(jī)失活處理。Golnaz Ghiasi在文獻(xiàn)[14]中認(rèn)為Dropout正則化在卷積層中僅失活單個(gè)元素,而卷積層的特征圖中相鄰位置元素在空間上共享語(yǔ)義信息,網(wǎng)絡(luò)仍可以通過(guò)其相鄰元素學(xué)習(xí)到對(duì)于特征,因此提出一種新的正則化方法DropBlock,Drop-Block通過(guò)按塊丟棄的方式將特征圖中的語(yǔ)義信息成塊失活,通過(guò)設(shè)置丟棄塊的大小調(diào)整網(wǎng)絡(luò)性能,當(dāng)丟失塊被設(shè)置為1×1時(shí)DropBlock將等效于Dropout。
CNN中使用全連接層將特征圖轉(zhuǎn)化為特征向量通過(guò)softmax層進(jìn)行分類的方法存在權(quán)值參數(shù)過(guò)多的問(wèn)題,有些網(wǎng)絡(luò)甚至?xí)卸鄠€(gè)全連接層,而過(guò)多的權(quán)值參數(shù)會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練慢、過(guò)擬合等問(wèn)題,為解決這一問(wèn)題作者提出使用全局平均池化代替全連接,通過(guò)使用和feature map大小相同的平均池化窗口對(duì)整個(gè)feature map進(jìn)行平均池化,一個(gè)feature map將輸出一個(gè)參數(shù)進(jìn)而從結(jié)構(gòu)上對(duì)網(wǎng)絡(luò)進(jìn)行正則化防止過(guò)擬合。
本文提出的網(wǎng)絡(luò)模型如圖6所示。由殘差單元組conv_x、池化層和分類層相連組成,其中殘差單元組由卷積殘差塊、恒等殘差塊連接組成,每個(gè)卷積殘差塊、恒等殘差塊包含兩層卷積核大小為3×3的卷積層。

圖6 網(wǎng)絡(luò)結(jié)構(gòu)圖
該網(wǎng)絡(luò)模型的輸入是3維數(shù)據(jù),維度為(128,128,1)其中128×128為一個(gè)軸承樣本小波變換后時(shí)頻圖的維度大小,1代表時(shí)頻圖是灰度圖的形式。網(wǎng)絡(luò)的輸入首先使用卷積核為3×3的DropBlock層對(duì)數(shù)據(jù)進(jìn)行隨機(jī)失活,失活范圍區(qū)間設(shè)置(0,0.5),不同批次的輸入數(shù)據(jù)由于失活率是隨機(jī)的因此模型具有更強(qiáng)的泛化性和魯棒性。然后經(jīng)過(guò)一個(gè)由64個(gè)7×7的大卷積核組成的卷積層對(duì)輸入數(shù)據(jù)特征進(jìn)行提取,同時(shí)添加批歸一化層以減少數(shù)據(jù)分布帶來(lái)的影響,在經(jīng)過(guò)一層自動(dòng)填充的池化尺寸為3×3均值池化層。然后經(jīng)過(guò)4層殘差單元組,每層殘差卷積組之間使用池化核為3×3的平均池化層連接,最后通過(guò)全局平均池化層進(jìn)行池化運(yùn)算再通過(guò)失活率為0.5的Dropout層和維度為10的Softmax分類器得到故障診斷結(jié)果。
具體的參數(shù)設(shè)置由試驗(yàn)和故障診斷領(lǐng)域的相關(guān)經(jīng)驗(yàn)決定,池化層的數(shù)量都是和上層的殘差單元層數(shù)量保持一致。DropBlock層的丟失塊大小設(shè)置3×3保留率在0到0.5之間,Conv2D和均值池化層卷積核大小分別為7×7×64、3×3×64卷積步長(zhǎng)均為2×2,Dropout層保留率為0.5。表3詳細(xì)給出了每組殘差卷積組的卷積參數(shù)設(shè)置。

表3 殘差組參數(shù)設(shè)置
為了驗(yàn)證本文提出模型中全局平均池化層和隨機(jī)失活在相同工況和不同工況下對(duì)滾動(dòng)軸承診斷的影響,在保持其他網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)不變的情況下,將使用全局平均池化層和隨機(jī)失活的診斷準(zhǔn)確度和去除全局平均池化層和隨機(jī)失活的診斷準(zhǔn)確度進(jìn)行對(duì)比,為保證結(jié)果的有效性和準(zhǔn)確性對(duì)兩種網(wǎng)絡(luò)結(jié)構(gòu)均進(jìn)行5次測(cè)試取平均值,對(duì)比結(jié)果如表4所示。

表4 全局平均池化和DropBlock對(duì)網(wǎng)絡(luò)模型的影響
從表4中可以看到,在本文模型在相同工況下的準(zhǔn)確度均略低于沒(méi)有全局平均和隨機(jī)失活的網(wǎng)絡(luò)模型,平均降低0.11%。但在不同工況交叉驗(yàn)證的情況下診斷準(zhǔn)確率均優(yōu)于沒(méi)有全局平均和隨機(jī)失活的網(wǎng)絡(luò)模型。從平均診斷準(zhǔn)確度上看本文模型也更具優(yōu)勢(shì)。結(jié)果表明全局平均池化和隨機(jī)失活在犧牲少量準(zhǔn)確度的代價(jià)下減小了過(guò)擬合提高了網(wǎng)絡(luò)的泛化性。
為驗(yàn)證本文提出模型的優(yōu)越性,分別將本文所提方法在不同工況進(jìn)行五次訓(xùn)練及測(cè)試,與文獻(xiàn)[15](離散小波變換+CNN,簡(jiǎn)稱DWT+CNN)以及文獻(xiàn)[16](數(shù)據(jù)二維圖像化+LeNet-5,簡(jiǎn)稱IMA+LeNet-5)所提方法進(jìn)行對(duì)比,對(duì)比結(jié)果如表5所示。
從表5中可以看到,本文方法僅在以0hp與3hp進(jìn)行交叉驗(yàn)證時(shí)準(zhǔn)確率分別為89.84%和92.68%,這是由于0hp和3hp樣本數(shù)據(jù)分布差異過(guò)大導(dǎo)致,在其余情況下準(zhǔn)確率均在95%以上。DWT+CNN僅在訓(xùn)練集為1hp交叉驗(yàn)證0hp時(shí)的準(zhǔn)確率達(dá)到99.58%比本文方法高出0.38%,在其他情況下準(zhǔn)確率均低于本文方法。IMA+LeNet-5在所有情況下不同工況下的準(zhǔn)確率均低于本文方法,足以驗(yàn)證本文提出模型的優(yōu)越性。

表5 經(jīng)典模型效果對(duì)比
本文為解決滾動(dòng)軸承在不同工況下的故障診斷問(wèn)題提出了基于小波變換聯(lián)合殘差神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu),利用小波變換將一維數(shù)據(jù)處理為二維時(shí)頻圖,暴露更多時(shí)頻特性使網(wǎng)絡(luò)更容易提取有效特征,同時(shí)對(duì)比傳統(tǒng)殘差的網(wǎng)絡(luò)模型增添了平均池化層和DropBlock隨機(jī)失活減小了過(guò)擬合具有更高的泛化性。
但是網(wǎng)絡(luò)模型較大導(dǎo)致訓(xùn)練時(shí)間較長(zhǎng),提升不同工況診斷準(zhǔn)確率是以犧牲少量相同工況診斷準(zhǔn)確率為代價(jià)的,同時(shí)在數(shù)據(jù)分布差異較大的情況下準(zhǔn)確率并不令人滿意。希望在以后的研究中能簡(jiǎn)化網(wǎng)絡(luò)模型同時(shí)進(jìn)一步提高在數(shù)據(jù)分布差異較大的不同工況下的準(zhǔn)確率。