常 春, 梅檢民, 趙慧敏, 沈 虹, 王雙朋
(陸軍軍事交通學院,天津 300161)
柴油機作為重要的動力源,快速、準確診斷其故障具有重要意義。振動信號中蘊含了豐富的故障信息,以其不解體、易采集等優點,越來越廣泛的被應用于故障診斷。但柴油機機構復雜、振源多樣,并且振動信號大多是非平穩和非高斯信號,淹沒在各種高斯噪聲和干擾中,利用傳統的二階統計量(功率譜、自相關等)分析方法,很難達到理想的效果[1]。高階累積量具有對高斯有色噪聲恒為零的特點,理論上可以完全消除高斯噪聲的影響,因而可以用于提取高斯有色噪聲中的非高斯信號[2]。蔡劍華等提出了由信號高階譜恢復功率譜的方法,提取滾動軸承故障特征,但是該方法計算量大耗時長,不便于應用于實時監測。沈虹等[3]利用角域四階量切片譜方法提取連桿軸承故障特征,雖然通過重采樣的辦法,克服了非平穩信號對角切片與非對角切片不相等的問題,但是對于對角線以外的信息不能有效的反映。任金成等[4-5]分別提取振動信號時頻分布圖和三階累積量圖的灰度共生矩陣圖像紋理特征來診斷柴油機故障,取得了一定的效果,但是這些方法要從圖像中再次提取特征用于分類識別,計算繁瑣且易遺漏有效信息,影響了故障診斷的準確率。
卷積神經網絡(convolutional neural network,CNN)專門用來處理圖像等具有類似網格結構的數據,具有自動提取抽象特征的能力,避免人工提取特征的片面性[6],目前已經應用到機械故障診斷領域,并取得了一定的效果。吳春志等[7-8]將一維卷積神經網絡應用于齒輪箱故障診斷,直接以振動信號作為輸入,實現故障診斷,但缺乏對原始振動信號進行噪聲抑制,對低信噪比振動信號的故障診斷效果還需進一步研究。李恒等[9]將短時傅里葉變換(short-time Fourier transform,STFT)時頻圖與卷積神經網絡相結合,袁建虎等[10-12]將不同的小波變換(wavelet transform,WT)時頻圖與卷積神經網絡結合實現機械故障診斷,但因時頻圖本身沒有噪聲抑制能力,圖像識別率容易受到圖像質量好壞的影響。
針對上述問題,本文提出了一種利用卷積神經網絡識別振動信號三階累積量(third-order cumulant,CUM3)灰度圖的柴油機故障診斷方法。利用三階累積量抑制高斯噪聲的先天特點,采用三階累積量對缸蓋振動信號進行分析,生成抑制噪聲后的灰度圖像,作為卷積神經網絡的輸入,用具有動量的隨機梯度下降優化算法和學習率退火方法訓練卷積神經網絡,通過遺傳算法優化訓練參數,用訓練好的網絡對柴油機高壓油路的5種工況進行故障診斷,取得了良好的效果。
設x(t)為零均值的隨機信號,其三階累積量可表示為
(1)
式中:τ1,τ2為滯后量;E{·}為數學期望。
設隨機變量x服從高斯分布N(0,σ2),則x的概率密度函數為
(2)
從而得到x的矩函數為
(3)
則x的第二特征函數為
(4)
利用累積量ck與Ψ(ω)的關系式
ck=(-j)kΨk(0)
(5)
式中,ck為隨機變量x的k階累積量,可以得到隨機變量x的各階累積量為
c1=0,c2=σ2,ck=0,k>2
根據以上推導可以得出,任意一個零均值的高斯隨機過程,其高階(三階及以上)累積量恒為零。因此,對于信號中的加性高斯噪聲,通過三階累積量的計算,可以完全抑制噪聲的影響。
卷積神經網絡是一種帶有卷積結構的多層監督學習神經網絡,它使用卷積運算代替一般的矩陣乘法。該網絡采用梯度下降法對網絡中的權重參數反向調節,通過不斷的訓練迭代提高網絡的精度。一個卷積神經網絡主要由輸入層、卷積層、歸一化層、修正線性單元(ReLU)、池化層、Dropout層、全連接層和softmax層等組成。其結構如圖1所示。

圖1 卷積神經網絡結構圖
1.2.1 輸入層
輸入層是整個網絡的輸入,對于圖像輸入它是一個像素矩陣,一般黑白圖片深度為1,彩色圖片深度為3。
1.2.2 卷積層
卷積層通過卷積核與像素矩陣卷積,得到特征圖,卷積核會有規律的移動,與輸入特征做矩陣乘法求和并疊加偏差量
Zl+1(i,j)=[Zl?wl+1](i,j)+b=
(6)

1.2.3 修正線性單元
修正線性單元(rectified linear unit, ReLU)是一個非常簡單的非線性激活函數,可表示為
yReLU(x)=max(0,x)
(7)
其導數可表示為
(8)
在正數區間ReLU的導數為1,且不會飽和,使用ReLU得到梯度下降的收斂速度要比使用sigmoid或tanh函數時快得多,能有效的避免梯度消失[13]。
1.2.4 池化層
池化層對得到的特征圖進行特征選擇和信息過濾。池化層包含預設定的池化函數,其功能是將特征圖中單個點的結果替換為相鄰區域的特征圖統計量。池化層選取的池化區域由池化大小、步長和填充控制。
Lp池化是受視覺皮層內階層結構啟發而建立的池化模型。其表達式如下
(9)
式中:f為卷積核大小;s0為卷積步長;p為預指定參數。當p=1時,Lp池化在區域內取均值,被稱為均值池化;當p→∞時,Lp池化在區域內取極大值,被稱為最大池化[6]。
1.2.5 Dropout層
Dropout可以通過直接修改神經網絡結構提高網絡的泛化能力。在進行神經網絡訓練時,每一次迭代,隨機刪除固定比例(Dropout率p)的隱藏層單元,構建新的網絡,用以上方法重復迭代直至訓練結束。通過這種方法可以減少神經元之間的依賴性,從而提高網絡的泛化能力[14]。
1.2.6 全連接層
全連接層中的神經元與前一層的所有神經元相連接,整合卷積層或池化層中具有類別區分性的局部信息,以識別較大的模式。最后一個全連接層將特征組合在一起來對圖像進行分類。
1.2.7 softmax層
softmax激活函數對全連接層的輸出進行歸一化。softmax層的輸出由總和為1的多個正數組成,它代表輸入樣例所屬種類的概率分布。
本文充分利用三階累積量對高斯噪聲的抗噪能力和卷積神經網絡自動提取抽象特征的能力,對振動信號進行三階累積量計算并生成灰度圖像,作為卷積神經網絡的輸入;用小批量隨機的方法劃分訓練樣本,采用具有動量的隨機梯度下降算法和學習率退火方法訓練卷積神經網絡,通過遺傳算法優化訓練參數,從而提高網絡的收斂效果和計算效率,形成準確、高效的智能故障診斷方法,具體計算流程如圖2所示。

圖2 基于CUM3-CNN的故障診斷流程圖
試驗對象為濰柴WD615.71Q-1型六缸柴油機。在柴油機的第6缸缸蓋上側和左側分別安裝振動傳感器,采集柴油機的缸蓋振動信號,同步測取柴油機轉速信號,傳感器安裝位置如圖3所示。

(a) 振動加速度傳感器
上位機為NI PXIe-1078計算機,采用PXIe-4499聲音振動采集卡采集振動信號,采用PXIe-6361數采卡同步采集轉速信號;振動傳感器為PCB M603C01振動加速度傳感器,轉速信號為霍爾傳感器,試驗裝置示意圖,如圖4所示。

圖4 試驗裝置示意圖
試驗時,柴油機轉速分別為800 r/min,1 000 r/min,1 200 r/min,1 400 r/min,1 600 r/min,1 800 r/min,對第6缸高壓油路設置了正常、漏油、斷油、噴油器壓力高和噴油器壓力低5種技術狀態,同步采集柴油機空載運轉時的缸蓋振動信號和轉速信號,各通道采樣頻率為65.5 kHz,采樣點數為131 072點。試驗工況如表1所示。

表1 柴油機試驗工況表
圖5為柴油機在轉速1 000 r/min時不同技術狀態下一個工作循環的缸蓋上側振動信號時域圖和功率譜。從時域圖中可以看出,僅圖5(e)斷油工況的振動信號在0 CA°左右的幅值稍小于其他工況,時域圖無法分辨各個工況;從功率譜圖來看,各工況振動信號的能量都集中在5 kHz附近,幅值區別不明顯且沒有規律,說明功率譜也不能有效分辨各個工況。因此,從原始信號的時域和頻域,很難提取出區別不同工況的故障特征。

(a) 正常時域圖
根據式(1),對柴油機在轉速1 000 r/min時不同技術狀態下一個工作循環的缸蓋上側振動信號進行三階累積量分析,取其滯后量為-50≤τ1,τ2≤50,將結果歸一化到0~1的灰度值內。結果如圖6所示。

(a) 正常
從圖6中可以看出,不同工況三階累積量的分布和灰度值有所不同,正常狀態下,其振動信號的三階累積量分布較為集中且能量較大,隨著燃燒情況的變化,三階累積量的分布也越來越分散,在斷油工況下其分布最為分散,雖然通過人為觀察,能在一定程度上發現不同工況下的微弱差別,說明三階累積量能有效抑制信號中的噪聲干擾,突出信號中的有效特征。但不同信號的特征不同,人為觀察效率低、主觀影響大,要提供故障診斷的效率和精度,需要自動提取特征并能智能識別故障的方法。
將一個工作循環缸蓋上側振動信號的三階累積量灰度圖作為一個樣本,對5種工況下的每個轉速分別取60組樣本,每種工況組成360個樣本的數據集,從中取240個樣本作為訓練集,其余120個樣本作為測試集。數據集的劃分情況如表2所示。

表2 數據集劃分情況
本文所用卷積神經網絡模型,如表3所示。輸入圖像為101×101大小的灰度圖像;卷積層設置4個3×3大小的卷積核,步長為1;在卷積層之后使用批量歸一化層,來加速網絡訓練并降低對網絡初始化的敏感度;批量歸一化層后接一個非線性激活函數——修正線性單元(ReLU);池化層采用最大池化層,核大小為2×2,步長為2;之后連接一個Dropout層,其Dropout率用參數p表示,全連接層輸出為5,通過softmax層輸出5種分類的概率。

表3 卷積神經網絡參數
本文采用具有動量的隨機梯度下降優化算法(stochastic gradient descent with momentum,SGDM)訓練卷積神經網絡,學習速率采用退火的方法動態調節,將學習速率乘以一個小于1的系數,每10輪減小一次學習率。為了降低計算成本,用隨機小批量的方法劃分訓練樣本,批量大小為32,每次用一個小批量來訓練網絡,完成整個訓練數據集所有批量的訓練為一輪完整訓練周期,最大的訓練輪數為20輪,每輪訓練都會打亂數據,并在每輪訓練結束計算基于驗證數據集的準確度,驗證數據不用于更新網絡權重。
網絡有3個重要的超參數需要調節,分別是初始學習速率r、學習速率退火系數f和Dropout率p。為了提高模型的精度,降低泛化誤差,本文采用遺傳算法優化訓練參數。遺傳算法個體數目取10,最大進化代數50代,交叉概率取0.4,變異概率取0.2,以網絡對原測試集和分別混有-3 dB,0,3 dB噪聲的測試集的驗證誤差平均值作為適應度函數,其適應度曲線如圖7所示。

圖7 適應度曲線
經過50代進化,最終進化出的最優參數組合為:初始學習速率r=0.004 5、學習速率退火系數f=0.688 5和Dropout率p=0.468 9。
采用訓練集對本文提出的方法(CUM3-CNN)訓練,并通過測試集檢驗訓練后模型的準確率,訓練進度如圖8所示。從圖8中可以看出,經過兩輪的訓練,模型的驗證準確度就達到了95%以上,20輪訓練過后,最終的訓練準確度和驗證準確度都達到了99.5%,表明該方法收斂速度快、泛化能力強。

圖8 訓練進度圖
缸體上側信號和缸蓋左側振動信號訓練網絡模型對5種工況的最終驗證準確度如表4所示。

表4 不同部位采集信號的最終驗證準確度
從表4可以看出,對每個工況的60組測試集數據,CUM3-CNN方法具有較高的準確率,缸蓋上側信號比缸蓋左側信號的準確率更高,說明缸蓋上側振動信號對5種工況蘊藏的故障特征更加敏感,更適合用來進行故障診斷;缸蓋上側振動信號的CUM3-CNN方法能準確區分傳統方法難以分辨的5種工況,并且保持了較高的計算效率,實現了柴油機多故障工況的準確、高效故障診斷。
為了檢驗本文方法的故障診斷性能,分別對比了本文所提出的CUM3-CNN方法和吳春志等和周奇才等所用的1D-CNN方法、李恒等所用的STFT-CNN方法、袁建虎等、陳仁祥等、卓德兵等所用的WT-CNN方法在原測試集和噪聲環境下的故障診斷準確率,驗證本方法的有效性。
3.5.1 不同方法的故障診斷性能對比
用不同的方法對原始信號生成尺寸相同的灰度圖數據集,訓練集和測試集都按照表1進行劃分,所用的卷積神經網絡結構和訓練參數完全相同,對比4種方法故障診斷性能,各方法在其對應的測試集的驗證準確度如圖9所示。

圖9 不同方法的驗證準確度對比
從圖9中可以看出,CUM3-CNN方法的收斂速度比1D-CNN方法、STFT-CNN方法和WT-CNN方法都要快。表5列出了不同方法在各自對應測試集的最終驗證準確度和訓練時間。

表5 不同方法的最終驗證準確度和訓練時間對比
從表5可以看出,CUM3-CNN方法的最終驗證準確度為99.50%,比1D-CNN方法(90.67%)、STFT-CNN方法(96.17%)和WT-CNN方法(97.50%)的最終驗證準確度高。以上結果說明,CUM3-CNN方法比STFT-CNN方法和WT-CNN方法用于柴油機故障診斷的準確率更高。
3.5.2 噪聲環境下的故障診斷性能對比
在實際診斷過程中,所采集到的信號中難免會受到噪聲的干擾。為了驗證噪聲環境下上述3種方法的故障診斷性能,在測試集中加入信噪比為-5~5 dB的高斯白噪聲,分別用不同的方法生成灰度圖數據集,輸入到3.5.1節中訓練好的對應的卷積神經網絡,各方法在噪聲環境下的故障診斷準確度如圖10和表6所示。

圖10 不同方法在噪聲環境下的故障診斷性能對比

表6 不同方法在噪聲環境下的故障診斷準確度對比
從圖10中可以看出,在噪聲環境下CUM3-CNN方法的故障診斷性能明顯優于1D-CNN方法、STFT-CNN方法和WT-CNN方法。從表5中可以看出,隨著信噪比的提高CUM3-CNN方法、1D-CNN方法和STFT-CNN方法的故障診斷性能也總體在提高,CUM3-CNN方法的故障診斷準確度在83%~99%,1D-CNN方法的故障診斷準確度在23.17%~63.50%,而STFT-CNN方法的故障診斷準確度不足50.00%,WT-CNN方法的故障診斷準確度只有20.00%左右。以上結果說明,CUM3-CNN方法有良好的噪聲抑制能力,在噪聲環境下用于柴油機故障診斷,診斷準確度明顯高于1D-CNN方法、STFT-CNN方法和WT-CNN方法。
(1) 本文采用隨機小批量方法劃分訓練樣本,用SGDM算法和學習率退火方法訓練CUM3-CNN方法,通過遺傳算法優化訓練參數,提高了模型的診斷精度和泛化能力。
(2) 缸蓋上側振動信號比缸蓋左側振動信號更適合用于柴油機高壓油路故障診斷。
(3) CUM3-CNN方法有良好的噪聲抑制能力,在柴油機故障診斷的應用中比1D-CNN方法、STFT-CNN方法和WT-CNN方法的診斷準確率更高,特別是在噪聲環境下有明顯的性能優勢。