魏 衛(wèi),王 磊,張 鑫
(武漢理工大學 機電工程學院,湖北 武漢 430070)
滾動軸承作為旋轉機械的重要組成元件,已被廣泛應用于工業(yè)領域。據(jù)統(tǒng)計,旋轉機械中約有45%的故障源于軸承的失效[1]。為避免因軸承失效造成生產(chǎn)線停止甚至人員傷亡等不必要的損失,需要對軸承健康狀態(tài)進行實時有效的監(jiān)測。
近年來,隨著人工智能的發(fā)展,基于數(shù)據(jù)驅動的機器學習算法被廣泛應用于故障的異常檢測。文獻[2]將軸承的異常檢測當作一個二分類問題,通過選擇合適的小波基函數(shù)對原始信號進行小波分解,將得到的小波系數(shù)作為特征輸入,利用支持向量機對正常數(shù)據(jù)和故障數(shù)據(jù)進行分類。文獻[3]則將軸承全壽命周期劃分為正常、早期故障、嚴重故障3個階段,應用經(jīng)驗模式分解將振動信號分解為固有模態(tài)函數(shù),并結合10個時域特征作為人工神經(jīng)網(wǎng)絡的輸入,找出了各階段的時間區(qū)間。
然而,在實際生產(chǎn)中,由于工況的多樣性和滾動軸承失效形式的不確定性,很難將軸承的所有故障數(shù)據(jù)收集完備,因此不能簡單的將軸承異常檢測作為一個分類問題來處理。筆者提出了一種基于自編碼網(wǎng)絡(auto-encoder network,AEN)重構誤差的異常檢測方法。該方法主要包括3個步驟:①對滾動軸承的正常振動信號進行頻譜包絡線特征提取,然后利用AEN的自學習能力,對包絡線進行編碼和解碼,通過分析正常樣本重構誤差的分布情況,確定重構誤差閾值;②獲取測試樣本同樣進行頻譜包絡線特征提取,輸入AEN模型進行訓練,求解測試樣本重構誤差;③對兩個重構誤差進行比較分析,從而判定滾動軸承是否發(fā)生異常。
自編碼網(wǎng)絡AEN是一種無監(jiān)督式神經(jīng)網(wǎng)絡,包含輸入層、隱藏層和輸出層。與用于分類及回歸問題的深度神經(jīng)網(wǎng)絡相比,其主要區(qū)別是該網(wǎng)絡采用對稱式結構[4],即輸入層神經(jīng)元個數(shù)等于輸出層神經(jīng)元個數(shù),如圖1所示。AEN由編碼器和解碼器兩部分組成,編碼器將輸入層數(shù)據(jù)從高維空間映射到低維特征空間,再由解碼器對低維特征空間進行特征重構得到近似于輸入層的輸出結果。

圖1 自編碼網(wǎng)絡結構
首先,編碼器函數(shù)fθ對數(shù)據(jù)集{x1,x2,…,xT}中輸入向量xt進行編碼,得到特征向量ht,編碼過程可表示為:
ht=fθ(xt)
(1)
式中:ht為編碼得到的特征向量;fθ為編碼器函數(shù);θ為編碼器網(wǎng)絡參數(shù)向量;xt為輸入向量。
然后,解碼器函數(shù)gθ′對特征向量ht進行特征重構,通過解碼,將低維空間的ht重新映射到高維空間,解碼過程可表示為:
(2)

(3)
式中:T為訓練樣本個數(shù);L為平方誤差。
(4)
一般情況下,函數(shù)fθ,gθ′的映射過程為仿射映射,可通過向量和矩陣進行表示:
fθ(x)=sf(Wx+b)
(5)
gθ′(x)=sg(WTx+d)
(6)
式中:sf,sg分別為編碼器和解碼器的激活函數(shù);W,WT為權值矩陣;b,d為偏差向量,且參數(shù)θ={W,b},θ′={WT,d}。
當滾動軸承處于正常狀態(tài)下時,其振動信號對應的特征值應滿足其在物理意義上的相關性,當異常發(fā)生時,特征值之間的內部相關性將被破壞[5],對應的自編碼重構誤差會偏離原來的分布范圍,可通過比較其與閾值的大小判定滾動軸承是否存在異常,如圖2所示。
(7)
(8)


圖2 基于AEN重構誤差的異常檢測模型
(1)offline線下模型訓練
步驟1:訓練樣本采集。獲取滾動軸承正常狀態(tài)下的原始信號{x1,x2,…,xN}。

步驟4:確定邊界閾值。通過分析{e1,e2,…,eN}的分布規(guī)律,確定訓練樣本重構誤差的邊界閾值eth。
(2)online在線異常檢測
步驟1:測試樣本采集。獲取滾動軸承受檢時的實時信號x′。
步驟2:特征提取。應用“offline線下模型訓練”中步驟2的頻帶劃分窗口提取信號x′頻譜包絡線f′e。
步驟3:AEN模型訓練。將f′e輸入“offline線下模型訓練”中的步驟3已經(jīng)訓練好的自編碼網(wǎng)絡,求解相應的重構誤差e′。
(3)異常判定
比較重構誤差e′與設定閾值eth,進而判定滾動軸承是否存在異常。
實驗數(shù)據(jù)來自美國NSFI/UCR智能維護系統(tǒng)中心(IMS)[6],裝置如圖3所示。該實驗將4個同型號的雙列滾柱軸承安裝于同一主軸上。主軸由交流電機以2 000 r/min的轉速通過同步帶耦合驅動。以10 min為間隔進行一次數(shù)據(jù)采樣,每一次采樣持續(xù)1 s,采樣頻率為20 kHz,并生成一個包含20 480個數(shù)據(jù)點的記錄文件。實驗一共進行3次,每次測試以任一軸承失效為終止條件。
筆者選用第二次測試中軸承1為研究對象,實驗過程中共采集到984個記錄文件,且該軸承最終因嚴重外圈故障而失效。

圖3 軸承測試實驗平臺示意圖
圖4給出了軸承1振動信號的峭度值K隨時間的變化曲線。當記錄文件采集至第703次時,即t=703時,峭度值開始出現(xiàn)明顯波動,表明軸承已處于退化狀態(tài),直到t=984時,軸承完全失效。峭度值K作為高階時域特征,因其對沖擊信號的敏感特性,常用于對軸承早期異常的檢測[7]。通常將K=3作為異常檢測的判斷依據(jù),當K>3時,則認為軸承存在某種異常。由于該理論是對理想環(huán)境下做出的假設,在實際應用中仍存在較大差異。

圖4 峭度變化曲線圖
2.2.1 樣本獲取
為方便構建基于滾動軸承正常樣本的異常檢測模型,選取t=[0,100]區(qū)間的振動信號作為offline線下模型的訓練樣本,并將t=[101,984]區(qū)間的振動信號作為online在線異常檢測的測試樣本。
當訓練樣本量較少時可能導致檢測模型出現(xiàn)欠擬合問題,需要對樣本進行適度的切片處理,以便增大正常樣本量。已知軸承缺陷(內圈故障、外圈故障、滾動體故障)的固有頻率通常處于低頻范圍內,且小于500 Hz[8],因此在對信號進行頻譜分析時只需保證頻帶范圍大于500 Hz即可。
對單個訓練樣本進行20等分的切分處理,共得到N=20×100的訓練樣本{x1,x2,…,xN},其中xn包含1 024個數(shù)據(jù)點,經(jīng)快速傅里葉變換之后的頻帶范圍為0~512 Hz。
2.2.2 特征提取
滾動軸承產(chǎn)生故障時,伴有尖銳不連續(xù)的脈沖振動信號產(chǎn)生,這種振動信號具有特定的振動頻率,通過頻譜分析能有效的進行識別[9]。
快速傅里葉變換因其計算量小,響應時間快,作為頻譜分析手段被廣泛應用于信號處理及特征提取[10]。由于軸承早期頻帶成分易受噪聲信號干擾,其頻譜圖會在一定程度上進行波動。為魯棒性地得到軸承早期頻譜圖特征,通過對0~512 Hz頻帶進行等間距劃分,提取區(qū)間幅值最高點,將頻譜包絡線作為自編碼AEN模型的特征輸入。
在對頻譜圖進行包絡線提取時,需要選擇合適的劃分窗口,如圖5所示。窗口寬度較小,對頻譜圖的分辨率高,但不能魯棒性地表示軸承正常狀態(tài)下的頻譜固有特征結構。同時,包絡線的繪制點直接影響了模型輸入層的大小,當輸入層過大,會使基于BP(back propagation)算法優(yōu)化的網(wǎng)絡權值陷入局部最優(yōu);當輸入層過小,則不利于提取頻譜圖局部特征。

圖5 原始信號頻譜圖(t=10)

(9)


表2 各窗口大小對應的包絡線整體相似度值
從表2可知,劃分窗口寬度越大,訓練樣本包絡線之間的整體相似度越高,但對于故障頻率的分辨率也會隨之下降。綜合考慮,選擇d=4作為包絡線劃分窗口,利用上述方法提取的頻譜包絡線圖如圖6所示。

圖6 頻譜包絡線圖(t=10)
2.2.3 AEN模型訓練
為防止模型訓練過程中產(chǎn)生過擬合問題,將50%的訓練集作為交叉驗證集。根據(jù)網(wǎng)絡層構建的一般原則,并經(jīng)過反復實驗,選擇128-64-32-16-32-64-128作為自編碼網(wǎng)絡結構,激活函數(shù)選擇tanh函數(shù)。模型的迭代曲線如圖7所示,訓練集和驗證集雖然表示的是軸承同一生命周期的頻譜狀態(tài),但由于軸承早期易受噪聲信號的干擾,兩者之間不可避免的存在頻譜差異性,導致訓練集和驗證集的迭代曲線無法同步擬合,當?shù)螖?shù)大于35時,訓練集重構誤差開始不斷上升,產(chǎn)生過擬合。為防止過擬合現(xiàn)象的產(chǎn)生,以及保證模型的魯棒性,迭代次數(shù)取35。模型訓練之后,得到驗證集的重構誤差{e1,e2,…,eN},N=1 000。

圖7 訓練樣本迭代曲線
利用箱線圖對該重構誤差進行統(tǒng)計分析,并將箱線圖的上限值作為判斷軸承異常的閾值指標。如圖8所示,當數(shù)據(jù)集N=1 000時,部分重構誤差因大于箱線圖的上限而誤判為異常值。這是因為滾動軸承在裝配之后存在一定的磨合期,該時期振動幅度較大,其頻譜包絡線與軸承穩(wěn)定時期存在一定差異,在模型訓練中,由于其重構誤差較大而被視為異常點。

圖8 重構誤差箱線圖(N=50,N=1 000)
在訓練樣本獲取的過程中,由于對同一時刻的振動信號進行了20等分的切片處理,故同一時刻擁有20個頻譜包絡線重構誤差值,其平均值可代表該時刻軸承的整體狀態(tài),在一定程度上,減少了誤差干擾。對驗證集中單個記錄文件的重構誤差進行了平均處理,由圖8可知,當N=50時,重構誤差分布在0.8~1.0范圍內,沒有異常值產(chǎn)生。重構誤差對應箱線圖的具體邊界值如圖9所示,上限閾值為0.948 2。

圖9 箱線圖各邊界值(N=50)
2.2.4 online在線異常檢測
如前所述,將t=[101,984]區(qū)間的信號記錄文件作為測試樣本數(shù)據(jù)逐個在線檢測,通過提取相應的頻譜包絡線,將特征向量輸入offline訓練好的AEN模型,并將單個記錄文件所對應的20個重構誤差進行均值處理。
測試一共得到884個重構誤差值,重構誤差值變化曲線如圖10所示。由圖10可知,t=[101,533]時重構誤差保持平穩(wěn)狀態(tài),可判定軸承處于正常運行狀態(tài)。

圖10 重構誤差曲線圖(t=[101,700])
當t≥533時,重構誤差大于箱線圖的上限閾值0.948 2,且開始隨時間推移逐漸增大,因此,可以判定軸承在t=533時,產(chǎn)生了早期異常。
為更好地驗證筆者提出的異常檢測方法,分別應用樣本熵[11],動態(tài)路徑規(guī)劃理論[12]對滾動軸承的振動信號進行了平穩(wěn)性分析。
軸承樣本熵隨時間的變化趨勢如圖11所示。在t=[500,600]區(qū)間,樣本熵值開始呈現(xiàn)下降趨勢,即信號的復雜性開始降低。這是因為在此階段軸承產(chǎn)生了某種早期異常,導致了振動信號的周期性開始增加。
根據(jù)動態(tài)路徑規(guī)劃理論得到的軸承平穩(wěn)度變化趨勢如圖12所示。在t=[0,532]區(qū)間,平穩(wěn)度穩(wěn)定在0.4左右,且隨著時間的推移,平穩(wěn)度逐漸上升;在t=533左右,開始出現(xiàn)拐點,說明此刻的軸承狀態(tài)發(fā)生了改變。

圖12 振動信號平穩(wěn)度變化趨勢圖
由于樣本熵和動態(tài)路徑規(guī)劃方法需要對信號進行持續(xù)監(jiān)控,通過繪制連續(xù)的變化曲線圖,才能有效地捕捉曲線拐點處信息。且利用樣本熵的方式并不能準確判斷異常點的發(fā)生時刻,同時,雖然動態(tài)路徑規(guī)劃方法確定了軸承早期的穩(wěn)定度在0.4范圍內波動,但其并沒有明確給出判斷異常的閾值指標,文獻[12]從直觀的角度推測了軸承在t=533左右產(chǎn)生了某種異常。
為進一步驗證,對t=532和t=533時刻的滾動軸承狀態(tài)進行了頻譜分析,如圖13所示。當t=533時,振動信號的頻譜圖出現(xiàn)了一定程度的譜峰,與筆者提出的方法檢測出的軸承早期異常發(fā)生時刻相吻合,從而驗證了筆者提出方法的準確性。

圖13 頻譜圖(t=532,t=533)
針對實際工業(yè)環(huán)境下因樣本不平衡,及標簽類樣本易缺失的問題,提出了一種基于AEN重構誤差的異常檢測方法。實驗結果表明,該方法避免了因樣本熵和動態(tài)路徑規(guī)劃理論需持續(xù)進行信號監(jiān)測的要求,且相比于基于時域分析方法和樣本熵方法具有更高的靈敏性。同時,該方法避免了因輸入新數(shù)據(jù)而需重構模型的情況,減少了異常檢測的響應時間,因而能更好地服務于實際工業(yè)場景。