閆嘯家, 梁偉閣, 張 鋼, 佘 博, 田福慶
(1. 海軍工程大學(xué) 兵器工程學(xué)院,武漢 430033; 2. 大連艦艇學(xué)院 導(dǎo)彈與艦炮系,遼寧 大連 116000)
復(fù)雜供輸機(jī)構(gòu)是特種裝備的重要組成部分,其可靠性和穩(wěn)定性直接影響特種裝備功能的發(fā)揮,如火炮供輸機(jī)構(gòu),直接影響彈藥的運動狀態(tài)[1],且其運動過程伴隨有猛烈的沖擊、振動等,力學(xué)環(huán)境十分復(fù)雜。因此,開展復(fù)雜供輸機(jī)構(gòu)故障診斷對提高工作效率與可靠性、減少維護(hù)時間與費用等方面具有重要意義[2]。
復(fù)雜的力學(xué)環(huán)境、獨特的機(jī)械結(jié)構(gòu)使供輸機(jī)構(gòu)的振動信號具有非線性、非平穩(wěn)性等特點。時頻分析方法可在時間和頻率兩個維度反映信號的能量強(qiáng)度變化,有效描述信號的細(xì)微故障特征,是分析處理非平穩(wěn)信號的重要方法之一[3]。傳統(tǒng)的短時傅里葉變換(short-time Fourier transform, STFT)能夠?qū)⒁痪S故障振動信號變換成為二維矩陣,從而獲得包含時域和頻域信息的特征圖[4]。但STFT時間窗的大小、形狀相對固定,無法同時滿足時間分辨率和頻率分辨率的需求。而尺度變換連續(xù)的連續(xù)小波變換(continuous wavelet transform,CWT)能夠克服STFT的缺陷,采用與特征分布波形相似的小波基對不同頻率的取樣步長是可調(diào)節(jié)的,在信號低頻處頻率分辨率較高,同時在高頻處時間分辨率較高。因此,CWT能夠在時頻特征圖中細(xì)致刻畫信號的局部形態(tài),具有良好的時頻窗口特性和局部分辨能力,是處理非平穩(wěn)信號突變部分的有力工具[5]。
因此,基于小波時頻圖和深度學(xué)習(xí)的智能算法廣泛應(yīng)用于復(fù)雜機(jī)械系統(tǒng)的特征提取和故障診斷。與傳統(tǒng)方法相比,深度學(xué)習(xí)可以自適應(yīng)提取時頻圖的故障特征,實現(xiàn)端對端的故障診斷。袁建虎等將壓縮后的小波時頻圖輸入至卷積神經(jīng)網(wǎng)絡(luò),能夠有效識別滾動軸承的故障類型;Cheng等[6]提出一種基于CWT和局部二進(jìn)制卷積神經(jīng)網(wǎng)絡(luò)模型的數(shù)據(jù)驅(qū)動旋轉(zhuǎn)機(jī)械故障診斷方法,試驗表明該方法具有更穩(wěn)定、更可靠的預(yù)測精度。然而,在復(fù)雜供輸機(jī)構(gòu)的故障診斷中,運用深度學(xué)習(xí)存在兩方面困難:①樣本數(shù)據(jù)不足,受制于供輸機(jī)構(gòu)機(jī)械結(jié)構(gòu)和工作機(jī)制的復(fù)雜性,通常難以獲取足量的樣本,由于小樣本條件下深度學(xué)習(xí)模型容易過擬合,導(dǎo)致模型故障診斷效果較差;②樣本數(shù)據(jù)非均衡,為適應(yīng)特種裝備工作使用環(huán)境,供輸機(jī)構(gòu)必須長期處于正常運行狀態(tài),關(guān)鍵部件在預(yù)設(shè)壽命范圍內(nèi)更換頻繁,因此故障樣本數(shù)量十分匱乏,實際數(shù)據(jù)集中正負(fù)樣本比例極為懸殊,進(jìn)而導(dǎo)致模型分類結(jié)果偏向多數(shù)類,對少數(shù)類別識別性能不佳[7]。
解決以上問題的傳統(tǒng)方法是基于幾何變換、噪聲擾動和灰度變換等來對訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)。雖然上述方法操作簡單,但產(chǎn)生的數(shù)據(jù)分布過于單一,數(shù)據(jù)非均衡問題本質(zhì)上沒有解決,在小樣本條件下易導(dǎo)致模型在目標(biāo)數(shù)據(jù)集上過擬合。Goodfellow等[8]于2014年提出了生成對抗網(wǎng)絡(luò)(generative adversarial networks, GANs),通過生成器和判別器的互相對抗和學(xué)習(xí)來達(dá)到“納什均衡”,最終使得生成器從簡單隱變量中產(chǎn)生的數(shù)據(jù)分布接近于真實數(shù)據(jù)分布,解決了樣本數(shù)據(jù)不足的問題。但是GANs網(wǎng)絡(luò)僅應(yīng)用于計算機(jī)圖像領(lǐng)域,無法對標(biāo)簽數(shù)據(jù)進(jìn)行分類識別。直到Odena等[9]于2016年提出輔助分類生成式對抗網(wǎng)絡(luò)(auxiliary classifier generative adversarial networks, ACGANs),創(chuàng)造性地認(rèn)為判別器具有識別類標(biāo)簽的能力,且把損失函數(shù)分為真?zhèn)闻袆e損失和樣本分類損失,使得生成器可根據(jù)標(biāo)簽生成對應(yīng)的樣本,判別器在二分類的同時實現(xiàn)多分類的功能。隨著研究的深入,許多學(xué)者對ACGANs進(jìn)行優(yōu)化,以期獲得更好的分類效果。孫燦飛等[10]采用堆棧收縮自動編碼網(wǎng)絡(luò)作為ACGANs的判別器,提高了網(wǎng)絡(luò)的故障診斷性能;牛偉宇等[11]在判別器中引入池化層,加快其在多分類任務(wù)中的計算速度,防止模型過擬合;朱克凡等[12]在ACGANs損失函數(shù)的判別概率中引入權(quán)值系數(shù),根據(jù)權(quán)值大小選擇高質(zhì)量的生成樣本以進(jìn)一步優(yōu)化識別網(wǎng)絡(luò)。在這些ACGANs框架中可以根據(jù)標(biāo)簽學(xué)習(xí)圖像信息,但在樣本數(shù)據(jù)特征不明顯的情況下,無法有效學(xué)習(xí)圖像分布特征,同時沒有考慮生成器的輸入隱變量對于生成數(shù)據(jù)的可解釋性。
為了進(jìn)一步提高ACGANs的特征學(xué)習(xí)能力,更好地解決非均衡小樣本條件下復(fù)雜供輸機(jī)構(gòu)的故障識別問題,本文將稀疏自動編碼器(sparse autoencoder, SAE)與ACGANs相結(jié)合,提出一種基于SAE-ACGANs 的故障診斷方法。SAE可以對高維散射數(shù)據(jù)特征進(jìn)行更深層次地壓縮提取,在ACGANs框架中添加一個SAE結(jié)構(gòu)作為圖像特征的提取器,對原始數(shù)據(jù)進(jìn)行編碼,并通過標(biāo)準(zhǔn)正態(tài)分布為編碼向量添加噪聲以共同構(gòu)成包含真實圖像特征信息的隱變量,再將其與所屬類別信息共同輸入生成器,以強(qiáng)化隱變量表征與圖像所屬類別相關(guān)特征的能力,使得圖像類別特征在模型訓(xùn)練和識別階段都能夠得到有效保持,從而提高判別器的性能。因此,SAE-ACGANs可以捕捉小波時頻圖的內(nèi)在分布,優(yōu)化模型的特征學(xué)習(xí)能力,提高生成數(shù)據(jù)的質(zhì)量和故障識別精度,同時有效改善多數(shù)類分類偏好的影響,最終在非均衡小樣本條件下實現(xiàn)復(fù)雜供輸機(jī)構(gòu)的故障識別。
小波基的選取是CWT的關(guān)鍵,由于復(fù)Morlet(complex Morlet, cmor)小波與供輸機(jī)構(gòu)振動信號波形相似,均為帶沖擊的有阻尼自由衰減信號,其自適應(yīng)能力更好,因此選擇cmor小波作為振動信號進(jìn)行CWT的小波基。
利用cmor小波φ(t)對供輸機(jī)構(gòu)振動信號f(t)進(jìn)行連續(xù)小波變換,其表達(dá)式如下
(1)
式中:α為尺度因子;τ為平移因子。當(dāng)α增大時,時間窗伸展,帶寬變窄,中心頻率降低而頻率分辨率升高,有利于提取信號的低頻特征;當(dāng)α減小時,時間窗收縮,帶寬增加,中心頻率升高而頻率分辨率降低,有利于提取信號的高頻特征。φ(t)為復(fù)Morlet小波基函數(shù),其表達(dá)式為
(2)
式中:fc為小波的中心頻率,決定小波振蕩快慢;fb為帶寬參數(shù),決定小波衰減速度。通過調(diào)整中心頻率和帶寬參數(shù),便可獲得適用于分析復(fù)雜供輸機(jī)構(gòu)振動信號的cmor小波基。
單層自動編碼器(autoencoder,AE)是一種由編碼器和解碼器構(gòu)成的對稱型神經(jīng)網(wǎng)絡(luò)。通過反向傳播算法由編碼器函數(shù)與解碼器函數(shù)進(jìn)行循環(huán)訓(xùn)練,在實現(xiàn)輸出層z對輸入層x重構(gòu)的同時,隱含層h對輸入層x的特征進(jìn)行抽取表達(dá)。
(3)

(4)
解碼器將隱含層hm反向輸出為輸入層xm的重構(gòu)表達(dá)zm,其表達(dá)式為
(5)

通過反向傳播訓(xùn)練學(xué)習(xí)編碼和解碼參數(shù)集{θh,θz},使得輸入層xm與重構(gòu)輸出層zm之間的損失函數(shù)LAE(x,z)最小化
(6)
為提高編碼學(xué)習(xí)的抗噪聲能力,并實現(xiàn)輸入數(shù)據(jù)特征的深層挖掘,稀疏自編碼器[13]在AE的損失函數(shù)中引入一種額外的稀疏性約束,以期控制隱藏神經(jīng)元的激活程度。對于隱含層的第j個神經(jīng)元,其平均輸出激活程度ρj為
(7)

KL散度[14]可以用來度量兩個非對稱性概率分布的差別,因此引入KL散度作為懲罰項來約束ρj,因此稀疏懲罰項Ω的表達(dá)式為
(8)
式中:D為隱含層神經(jīng)元的個數(shù);ρ為稀疏參數(shù)。當(dāng)ρj=ρ時,稀疏懲罰項Ω的值為零;當(dāng)ρj≠ρ時,Ω會隨著偏離的程度而增大,因此,SAE可以通過限制稀疏參數(shù)ρ來控制網(wǎng)絡(luò)的平均激活度ρj,以此來實現(xiàn)網(wǎng)絡(luò)的稀疏懲罰方式。
LSAE(x,z)=AE(x,z)+βΩ(ρ)
(9)
式中,β為稀疏懲罰項的權(quán)值系數(shù)。
在SAE的訓(xùn)練過程中,通過梯度的反向傳播,使得損失函數(shù)最小化,從而更新網(wǎng)絡(luò)中權(quán)值矩陣和偏置向量的
(10)
式中,ε為學(xué)習(xí)率。
若隱含層的維度小于輸入層的維度,訓(xùn)練完成后就可以得到輸入數(shù)據(jù)較好的隱含層稀疏表示,輸入數(shù)據(jù)經(jīng)編碼后可有效學(xué)習(xí)輸入數(shù)據(jù)中復(fù)雜的內(nèi)在特征。
GANs由生成器G和判別器D組成,結(jié)構(gòu)框架如圖1(a)所示,其核心思想基于博弈論中雙人零和博弈。將隨機(jī)隱變量z輸入至G中以盡可能產(chǎn)生服從真實數(shù)據(jù)分布Pdata的生成樣本G(z),G盡可能地將隨機(jī)隱變量z的分布空間Pz映射到真實數(shù)據(jù)分布空間Pdata,從而產(chǎn)生生成樣本G(z),而D用于判斷輸入樣本是真實樣本x還是生成樣本G(z)。
在GANs的訓(xùn)練過程中,通過最大化真實樣本x和生成樣本G(z)數(shù)據(jù)分布的差異來訓(xùn)練D,最小化這個差異來訓(xùn)練生成器。采用基于對抗的機(jī)制,使G和D不斷優(yōu)化自身的性能,最終達(dá)到“納什均衡”,即生成樣本G(z)成功誤導(dǎo)D,從而使G實現(xiàn)對Pdata的近似估計。所以,GANs的損失函數(shù)為

(11)
式中, E[·]為對應(yīng)分布的期望。
GANs屬于無監(jiān)督學(xué)習(xí),無法區(qū)分樣本的不同類別,產(chǎn)生的樣本不可控。而ACGANs在GANs的基礎(chǔ)上進(jìn)行了改進(jìn),其結(jié)構(gòu)如圖1(b)所示。ACGANs的改進(jìn)主要有兩點:將隱變量z和類別標(biāo)簽c一同輸入G,從而引導(dǎo)G產(chǎn)生類條件樣本G(c,z);其次,在D中添加一個softmax分類器,使其在判斷輸入樣本是否為真實數(shù)據(jù)的同時還能計算出類別標(biāo)簽的概率分布。所以,ACGANs的損失函數(shù)由判別損失LS和分類損失LC構(gòu)成

圖1 GANs與ACGANs的結(jié)構(gòu)框圖Fig.1 Block diagram of GANs and ACGANs
(12)
式中:LS為判斷數(shù)據(jù)真?zhèn)蔚膿p失函數(shù);LC為數(shù)據(jù)類別標(biāo)簽概率分布的損失函數(shù);DS(x)為D判斷x是真實樣本的概率;DS(G(c,z))為D判斷生成樣本G(c,z)是真實樣本的概率;LD(cx|x)為D對x的分類損失,cx為x的真實類別;LD(c|G(c,z))為D對生成樣本G(c,z)的分類損失;c為G(c,z)的標(biāo)簽。
由于D應(yīng)盡可能區(qū)分生成樣本和真實樣本,并有效對其進(jìn)行分類;G應(yīng)盡可能模擬真實樣本的內(nèi)在分布,且同樣被有效分類。
所以D的損失函數(shù)為
(13)
G的損失函數(shù)如下所示
(14)
基于ACGANs的傳統(tǒng)改進(jìn)框架可根據(jù)標(biāo)簽類別隱性學(xué)習(xí)圖像信息的分布結(jié)構(gòu),但實際應(yīng)用中數(shù)據(jù)擾動較大,無法直接從圖像中有效學(xué)習(xí)特征,同時沒有考慮生成器的輸入隱變量與生成數(shù)據(jù)的聯(lián)系。為利用ACGANs的特征學(xué)習(xí)能力,提高圖像識別準(zhǔn)確率,本文在ACGANs框架中添加一個稀疏編碼器(sparse encoder, SE)結(jié)構(gòu),提出基于小波時頻圖和SAE-ACGANs 的復(fù)雜供輸機(jī)構(gòu)故障診斷方法。其創(chuàng)新點在于:①將ACGANs框架應(yīng)用到故障診斷領(lǐng)域中,經(jīng)過訓(xùn)練后的判別器能夠直接識別輸入時頻特征圖的真假及所屬故障狀態(tài)的類別,無需將生成數(shù)據(jù)和真實數(shù)據(jù)混合后,另外添加一個模型進(jìn)行訓(xùn)練和識別;②從增加對隱變量進(jìn)行圖像特征約束的角度,通過預(yù)訓(xùn)練一個SE,對原始數(shù)據(jù)進(jìn)行編碼,并通過標(biāo)準(zhǔn)正態(tài)分布為編碼向量添加噪聲以共同構(gòu)成包含真實圖像特征信息的隱變量,再將之與所屬類別共同輸入生成器,以強(qiáng)化隱變量表征與圖像所屬類別相關(guān)特征的能力,縮小生成器學(xué)習(xí)真實樣本特征空間的范圍,使得圖像類別特征在模型訓(xùn)練和識別階段都能夠得到有效保持,從而進(jìn)一步提高判別器的性能。


圖2 基于小波時頻圖和SAE-ACGANs的故障診斷方法原理圖Fig.2 Schematic diagram of fault diagnosis method based on wavelet time-frequency diagram and SAE-ACGANs
(15)

(16)

(17)
式中:Pdata(x)為原始圖像的真實分布;qφ(zr|x)為編碼映射分布;φ為D的參數(shù)集;Dφs(·)和Dφc(·)分別為D對輸入樣本真假及所屬類別的概率輸出;loss(·)為D預(yù)測的樣本類別與真實類別之間的分類損失,本文采取交叉熵?fù)p失函數(shù)。
因此,SE和G的損失函數(shù)為
(18)
D的損失函數(shù)為
(19)
基于小波時頻圖和SAE-ACGANs的復(fù)雜供輸機(jī)構(gòu)故障診斷方法的實現(xiàn)流程如圖3所示,具體步驟如下:

圖3 基于小波時頻圖和SAE-ACGANs的故障診斷方法流程圖Fig.3 Flow chart of fault diagnosis method based on wavelet time-frequency diagram and SAE-ACGANs

步驟2將訓(xùn)練樣本輸入SE,編碼生成隱變量zr;


步驟5基于對抗學(xué)習(xí)的方式,不斷重復(fù)步驟2~步驟4,直至網(wǎng)絡(luò)收斂,完成SAE-ACGANs的訓(xùn)練;
步驟6取出判別器D作為供輸機(jī)構(gòu)故障識別網(wǎng)絡(luò),將測試樣本輸入其中以實現(xiàn)故障診斷,輸出診斷結(jié)果。
某型供輸機(jī)構(gòu)試驗平臺結(jié)構(gòu)如圖4所示,其基本組成包括動力裝置、試驗臺架體、控制裝置、擺動機(jī)構(gòu)及測試系統(tǒng)。試驗平臺采用移動式液壓站為動力,待人工后座油缸返回到位后,扳機(jī)釋放尾部鐵塊快速向后移動,尾部鐵塊在復(fù)進(jìn)過程中為擺動機(jī)構(gòu)儲能。

圖4 供輸機(jī)構(gòu)試驗平臺Fig.4 Bench test platform for bomb supply system
尾部鐵塊在滑板帶動下以滾輪為支撐向后移動,用來模擬機(jī)構(gòu)復(fù)進(jìn)過程,之后擺動機(jī)構(gòu)帶動擺臂由豎直方向擺動到水平方向,用來模擬機(jī)構(gòu)擺動過程。尾部鐵塊的滑動范圍為530~770 mm,在滑板上每分鐘大約滑動9次,滾輪轉(zhuǎn)速約為400 r/min。工作過程中滑板和滾輪的運行狀態(tài)直接影響尾部鐵塊移動能否到位,進(jìn)而影響擺臂能否正常擺動到位,所以滑板和滾輪是決定供輸機(jī)構(gòu)能夠正常工作的關(guān)鍵部件。由于滑板和滾輪無法直接安裝傳感器,試驗在臺架裝置的擺動機(jī)附近和位于滾輪上方的壓板機(jī)附近布置了6個振動加速度傳感器,編號A1~A6,其安裝位置如圖5所示。傳感器類型為ICP加速度傳感器,采樣頻率為10 kHz,采用32通道的LMS信號采集系統(tǒng)。通過反復(fù)試驗表明,滾輪正上方的測點A1所采集的數(shù)據(jù)能夠有效反映供輸機(jī)構(gòu)的運行狀態(tài),因此選取測點A1的振動信號作為分析對象。

圖5 傳感器布置圖Fig.5 Chart of sensor layout
為模擬供輸機(jī)構(gòu)關(guān)鍵部件故障,分別對滑板和滾輪進(jìn)行人工處理,形成磨損和裂紋損傷,其最大損傷尺寸如表1所示,正常狀態(tài)下的滑板和滾輪、磨損的滑板和帶有裂紋的滾輪如圖6所示。由此可形成三種運行狀態(tài):①狀態(tài)1—正常狀態(tài)(normal, NM),所有關(guān)鍵零件無損傷;②狀態(tài)2—滑板磨損(skateboard wear, SW),只有一個滑板出現(xiàn)長帶狀磨損;③狀態(tài)3—滾輪裂紋(roller crack, RC),只有一個滾輪出現(xiàn)多條裂紋。

表1 關(guān)鍵部件最大損傷尺寸Tab.1 Maximum damage size of key components 單位:mm

圖6 正常和損傷零件Fig.6 Normal and damaged parts
將控制裝置調(diào)整至循環(huán)工作模式,對上述三種狀態(tài)下分別采集振動加速度信號,其時域波形如圖7所示。由于試驗成本較高、周期較長,且實際生產(chǎn)過程中關(guān)鍵部件在預(yù)設(shè)壽命內(nèi)更換頻繁,不易進(jìn)入故障狀態(tài),因此試驗共采集80個NM樣本、50個RC和SW樣本,其中隨機(jī)選取40個NM樣本、10個RC和10個SW樣本作為訓(xùn)練數(shù)據(jù),NM、RC和SW樣本各40個作為測試數(shù)據(jù)。訓(xùn)練集中正常樣本和故障樣本比例為4∶1∶1,正負(fù)樣本比例懸殊且數(shù)目較小,屬于典型的非均衡小樣本數(shù)據(jù)集。
由圖7可知,供輸機(jī)構(gòu)測得的振動加速度信號中有較大的沖擊振動,僅根據(jù)振動信號時域波形難以有效區(qū)分各故障類型。另外,試驗平臺采用自動控制系統(tǒng)控制每個動作的運行時間,一個完整的動作循環(huán)時間大約為6.8 s。該動作循環(huán)主要包括4個動作:儲能—復(fù)進(jìn)—起擺—回擺,機(jī)構(gòu)完成4個動作后各個部件回到初始位置,因此將一個動作循環(huán)稱為“單位周期”,而在此期間傳感器所測振動加速度信號稱之為“單位周期信號”。提取RC狀態(tài)下單位周期信號,其時域波形和頻域波形如圖8所示。通過圖8(b)可知,供輸機(jī)構(gòu)的振動加速度信號屬于典型的非平穩(wěn)信號,傳統(tǒng)的頻譜分析難以提取機(jī)構(gòu)故障類別的特征。

圖7 振動信號時域波形圖Fig.7 Time-domain waveform of vibration signal

圖8 RC單位周期信號時頻域波形圖Fig.8 Time-frequency domain waveform diagram of RC unit period signal
選取適用于分析沖擊信號的cmor3-3小波來獲取時頻圖,其中心頻率和帶寬參數(shù)均為3。對三種狀態(tài)下的單位周期振動信號進(jìn)行CWT,所得小波時頻圖圖像清晰且分辨率較高,時頻聚焦性好,能夠揭示信號沖擊能量值高的區(qū)域,如圖9所示。

圖9 不同狀態(tài)的單位周期信號時頻圖Fig.9 Time-frequency diagram of unit period signal in different states
由圖9可知,供輸機(jī)構(gòu)振動信號的能量幾乎分布在所有頻段,且中低頻段內(nèi)的能量高于高頻段內(nèi)的能量。在一個單位周期內(nèi),隨著時間變化信號出現(xiàn)明顯的能量波動,且信號的瞬變特征明顯。對比NM和RC、SW狀態(tài)的時頻圖可知,雖然故障狀態(tài)信號的能量略高于正常狀態(tài),但是無法準(zhǔn)確根據(jù)信號瞬變過程中的差異來判斷供輸機(jī)構(gòu)的故障狀態(tài)。
采用SAE-ACGANs方法研究時,所涉及的網(wǎng)絡(luò)超參數(shù)主要是迭代次數(shù)、批量大小和網(wǎng)絡(luò)結(jié)構(gòu)等,不恰當(dāng)?shù)某瑓?shù)會使故障識別泛化能力不足而導(dǎo)致模型過擬合。綜合考慮輸入時頻圖的尺寸和樣本量大小,采取單因素分析法[15]分析和選擇使得模型故障診斷準(zhǔn)確率最高的參數(shù),如表2所示。

表2 模型參數(shù)表Tab.2 Model parameters table
3.3.1 特征可視化分析
為驗證SAE-ACGANs方法從輸入小樣本中提取深度特征的優(yōu)越性,利用主成分分析(principal component analysis,PCA)從判別器輸出層中提取兩個主成分,并與原始時頻圖和ACGANs判別器輸出層提取的兩個主成分進(jìn)行可視化對比,形成的散點圖如圖10所示。由圖10可知,原始信號三種狀態(tài)下的時頻圖第1主成分分量均分布在-50~50,第2主成分分量均分布在-60~60,特征分布范圍廣且互相交叉重疊;利用ACGANs對時頻圖進(jìn)行特征提取,其SW狀態(tài)的第1主成分分量分布在-20~20,第2主成分分量分布在-3~-10,可以有效區(qū)分SW狀態(tài),但是NM和RC特征分布較為分散且互相交叉重疊;相比于ACGANs方法,SAE-ACGANs能夠充分學(xué)習(xí)輸入樣本的類別信息,三種狀態(tài)的特征分布更為集中,具有更好的聚類性能,驗證了SAE-ACGANs提取深度特征的優(yōu)越性。

圖10 提取特征的PCA可視化對比圖Fig.10 PCA visualization comparison chart of extracted features
3.3.2 診斷準(zhǔn)確率分析
依據(jù)表2設(shè)置模型參數(shù)進(jìn)行試驗,并與采用相同參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)的原ACGANs框架形成對比,記錄模型性能,結(jié)果如圖11所示。
圖11分別表示SAE-ACGANs和原ACGANs學(xué)習(xí)真實樣本內(nèi)在分布和預(yù)測輸入樣本類別的能力,生成器損失表示生成樣本能夠欺騙判別器的概率損耗,判別器損失表示判斷輸入樣本是否是生成樣本的損耗。由圖11(a)和圖11(b)可見,SAE-ACGANs因加入稀疏編碼器,強(qiáng)化隱變量表征與圖像所屬類別相關(guān)特征的能力,生成器與編碼器組成自編碼器,能夠更快地學(xué)習(xí)真實樣本的特征分布(圖11(a)箭頭所示);隨著迭代次數(shù)的增加,ACGANs的生成和分類損失接近于SAE-ACGANs,但變化幅度相對較大,不能趨于穩(wěn)定,從而導(dǎo)致判別器進(jìn)行故障診斷時性能波動較大。
圖11(c)為兩種框架在測試集上分類精度的對比圖,在迭代次數(shù)接近160次、350次的位置,ACGANs出現(xiàn)較大幅度波動(圖11(c)箭頭所指),同樣反映出ACGANs性能的不穩(wěn)定。此外,在訓(xùn)練后期,生成器學(xué)習(xí)到真實樣本的深度特征,SAE-ACGANs的分類精度能夠略微提升。

圖11 SAE-ACGANs與ACGANs的性能對比Fig.11 Performance comparison chart between SAE-ACGANs and ACGANs
綜上,SAE-ACGANs框架對生成器的輸入隱變量進(jìn)行圖像特征約束,模型能夠以更快的速度實現(xiàn)收斂,同時分類精度和穩(wěn)定性都優(yōu)于原ACGANs框架。
3.3.3 樣本非均衡性分析
面向非均衡數(shù)據(jù)集的供輸機(jī)構(gòu)故障診斷問題需要更加注重對于少數(shù)類樣本的識別性能,因此需要計算預(yù)測類別的查準(zhǔn)率Pi和查全率Ri,計算公式如式(20)和式(21)所示[16]。
(20)
(21)
式中:L為數(shù)據(jù)集的類別個數(shù);nii為第i類樣本被正確預(yù)測為類別i的個數(shù);nij為第i類樣本被錯誤預(yù)測為類別j的個數(shù)。
查準(zhǔn)率是分類準(zhǔn)確性的度量,查全率是分類全面性的度量,衡量處理非均衡數(shù)據(jù)集模型的性能評價標(biāo)準(zhǔn)需要考慮二者的綜合表現(xiàn),從而做到兼顧多數(shù)類和少數(shù)類的識別效果。因此,為了能夠在類別失衡的情況下全面、有效地評估模型的分類性能,選用分類準(zhǔn)確率λacc、F1度量λF1和G-mean指標(biāo)λG-mean作為模型綜合分類性能的評價指標(biāo),計算公式如式(22)~式(24)所示[17]。
(22)
(23)
(24)
為進(jìn)一步驗證SAE-ACGANs框架處理非均衡數(shù)據(jù)的優(yōu)越性,選取隨機(jī)過采樣(random over-sampling,ROS)[18]、隨機(jī)欠采樣(random under-sampling,RUS)[19]、合成少數(shù)類過采樣(synthetic minority oversampling technique, SMOTE)[20]、自適應(yīng)樣本合成(adaptive synthetic, ADASYN)[21]和ACGANs五種處理非均衡樣本算法進(jìn)行對比分析。利用上述方法生成使得訓(xùn)練集中類別分布達(dá)到完全均衡的數(shù)據(jù),即使得訓(xùn)練集中NM,RC和SW狀態(tài)下樣本數(shù)目的比例為1∶1∶1。之后對均衡數(shù)據(jù)集進(jìn)行CWT,將時頻圖作為訓(xùn)練集訓(xùn)練與判別器網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù)設(shè)置相同的CNN,再將測試集輸入其中,所得故障診斷結(jié)果如表3所示。

表3 不同算法下故障診斷結(jié)果對比Tab.3 Comparison table of fault diagnosis results under different algorithms
由表3可知,相較于原始數(shù)據(jù)集,經(jīng)過六種算法優(yōu)化后模型的診斷性能都有所提升。ROS算法較RUS算法結(jié)合CNN模型的診斷性能提升較小,說明相較于欠采樣造成的信息缺失,過采樣導(dǎo)致模型過擬合對于診斷性能的影響更大。而SMOTE和其衍生算法ADASYN可以根據(jù)少數(shù)樣本人工合成新樣本,一定程度地解決了樣本非均衡問題,但增加了不同類別樣本之間分布重疊的可能,故障診斷效果略遜于ACGANs和SAE-ACGANs。SAE-ACGANs算法的λacc,λF1,λG-mean指標(biāo)較ADASYN分別提高9.17%,0.107 6和0.108 7,較ACGANs分別提高3.69%,0.043 8和0.052 9,因此與其他非均衡數(shù)據(jù)處理算法相比,本文提出的方法能夠?qū)W習(xí)故障樣本的實際分布特性,有效解決訓(xùn)練集樣本類別分布不均衡的問題,通過稀疏編碼器進(jìn)一步提升判別器的綜合分類能力,降低供輸機(jī)構(gòu)故障的漏判率。
針對復(fù)雜供輸機(jī)構(gòu)智能故障診斷中存在故障樣本少且類別之間存在嚴(yán)重非均衡的問題,本文提出了一種基于小波時頻圖和SAE-ACGANs的供輸機(jī)構(gòu)故障診斷方法,并進(jìn)行了試驗驗證,結(jié)果表明:
(1) SAE-ACGANs可以充分學(xué)習(xí)輸入樣本的內(nèi)在分布,有效區(qū)分不同故障類型的深度特征,具有更好的聚合性能。
(2) 相較于原ACGANs框架,SAE-ACGANs在ACGANs中添加了一個SE結(jié)構(gòu),與生成器共同組成SAE,從而對輸入隱變量施加圖像特征約束,進(jìn)一步提升了判別器的性能,實現(xiàn)了模型收斂速度、訓(xùn)練精度和穩(wěn)定性的提升。
(3) 相較于ROS,RUS等其他非均衡數(shù)據(jù)處理算法,SAE-ACGANs框架能夠更有效地改善診斷模型對于多數(shù)類別樣本的分類偏好問題,模型對于少數(shù)類故障樣本的識別能力大幅提升。