孟 宗 閆曉麗 王 賽
1.河北省測試計量技術及儀器重點實驗室(燕山大學),秦皇島,0660042.國家冷軋板帶裝備及工藝工程技術研究中心,秦皇島,0660043.長城汽車股份有限公司技術中心(河北省汽車工程技術研究中心),保定,071000
?
基于HMM校正與神經網絡延拓的EMD端點效應抑制方法
孟宗1,2閆曉麗1王賽3
1.河北省測試計量技術及儀器重點實驗室(燕山大學),秦皇島,0660042.國家冷軋板帶裝備及工藝工程技術研究中心,秦皇島,0660043.長城汽車股份有限公司技術中心(河北省汽車工程技術研究中心),保定,071000
針對神經網絡延拓方法在抑制經驗模態分解的端點效應時存在的延拓數據與真實數據往往存在誤差的問題,提出了一種基于HMM校正的方法來減小預測延拓數據誤差。首先利用徑向基函數(RBF)神經網絡預測估計方法對部分原始數據進行估計,同時對端點外數據進行預測。然后計算該方法估計的數據與真實數據的誤差序列,再用HMM方法建立估計誤差序列模型,用以預測延拓后數據的誤差。最后用RBF神經網絡延拓數據減去HMM預測的誤差數據得到新的校正后延拓數據。仿真與實驗證明了將HMM預測方法與RBF神經網絡數據延拓結合應用到解決端點效應的過程中所得到的延拓數據更接近真實數據,能夠更好地解決端點效應問題,提高了經驗模態分解精度。
隱馬爾科夫模型;誤差校正;神經網絡;端點效應;經驗模態分解
自1998年經驗模態分解(empirical mode decomposition, EMD)由Huang等[1]提出后,因其優異的時頻分析能力被廣泛應用到各種信號處理領域[2-5]。EMD時頻分析方法的特色是使非平穩信號通過EMD分解平穩化,將不同尺度波動或趨勢逐級分解,獲得本征模態函數(intrinsic mode function, IMF)。該方法適合非線性、非平穩信號的分析,也適合于線性、平穩的信號分析。然而經過多年的發展,EMD方法仍然存在一些問題需要繼續完善。其中端點效應(也稱為邊緣效應)的存在嚴重影響了EMD方法的分解效果[6]。端點效應是指用樣條函數擬合信號的上下包絡線時,因不能確定信號的兩個端點是否為極值點,同時端點附近沒有端點以外信號的約束,使得擬合得到的包絡線在端點附近偏離原信號實際包絡線的現象[7]。端點效應使分解過程中數據兩端產生發散的結果使得整個序列被“污染”而嚴重失真。國內外學者針對端點效應先后提出了一些抑制方法[8-11],其中相當一部分是利用數據預測延拓技術來抑制端點效應。這些方法對抑制端點效應都有一定的效果,但仍然存在著各自的局限性,其主要原因是非線性、非平穩信號是一個不確定的信號,無規律可循,所以無法準確預測它將要出現的信號值,只能借助一些現有算法對其進行估計,因而會存在估計誤差。預測誤差服從特定的概率分布。若能從各預測算法的預測數據中找到預測誤差的變化規律,就可以對預測誤差和預測數據進行修正。
本文嘗試通過尋找誤差序列內在的驅動機制規律來研究誤差序列,發現估計誤差序列服從隱馬爾科夫模型(hidden Markov model,HMM)分布,進而建立HMM[12],預測延拓數據與真實數據之間可能的估計誤差,并利用預測的估計誤差對延拓數據進行校正,從而使延拓數據更接近真實值,更加有效地抑制EMD方法的端點效應。
本文利用神經網絡對數據進行預測估計,然后基于HMM的誤差預測算法對神經網絡預測數據進行校正,以達到抑制端點效應的目的。
1.1經驗模態分解方法
經驗模態分解就是對信號進行平穩化處理,即將信號中不同尺度波動或趨勢逐級分解開,產生具有不同特征尺度的一系列數據序列,使每個序列組成一個IMF分量。IMF必須滿足兩個條件:一是每一序列的極值點和過零點數目必須相等或相差不多;二是對于序列中的任意點,由局部極大值構成的包絡線和局部極小值構成的包絡線的平均值為零。為了把各IMF分量從數據中提取出來,EMD方法通過逐步的“篩選”將多分量信號分解成多個單分量信號。該方法的分解過程如下。
(1)找出原信號x(t)所有局部極值點,用三次樣條插值函數分別擬合局部極大值和局部極小值,形成數據上下包絡線。x(t)減去上包絡和下包絡的均值m1得到h1:
x(t)-m1=h1
(1)
在理想情況下,h1應為第一個IMF,但實際上,包絡的擬合過沖和欠沖是很普遍的,這樣會產生新的極值點,移位或放大已存在的極值點。“篩”的過程必須多次進行。第二次把第一次的h1看作原數據,求出h1的包絡平均m11,“篩”的過程表示為
h1-m11=h11
(2)
該過程重復進行k次,直到第k次滿足濾波條件得到第一個IMF分量c1。c1表示信號在局部時刻頻率最高的成分。
(2)由“篩”的過程可看出,本征模態函數c1包含了原始數據最小尺度或短周期成分,用x(t)減去第一個本征模態函數c1得到殘余r1:
x(t)-c1=r1
(3)
若r1中還包含一些長周期成分,就對r1重復步驟(1)得到第二個本征模態分量c2。這樣不斷重復便可得
(4)
若殘余ri分解成一個單調函數則停止,若數據有趨勢則殘余rn即為趨勢項,由式(3)和式(4)可得
(5)
這樣就把一個數據分解成本征模態函數組與殘余量之和。
1.2端點效應
在經驗模態分解中,求包絡平均是通過對原始數據中的上極值點和下極值點分別進行樣條插值擬合再平均。樣條插值的過程中,由于不能確定斷點處就是極值點,會在樣條插值的過程中產生數據的擬合誤差。在經驗模態分解“篩”的過程中,由于端點處極值的不確定性,在端點附近沒有端點外信息的約束,每一次樣條插值都產生較大的擬合誤差。在“篩分”過程中,誤差不斷累計,就會由端點處向內擴散,最后在嚴重的條件下使數據的分解失去實際意義。
本文首先通過對數值仿真信號進行經驗模態分解,對出現的端點效應進行分析,仿真信號為
x(t)=2cos8πt+0.5cos4πt+0.5cosπt
(6)
t∈[-0.45,0.45]
信號為三個余弦信號的疊加,未經數據延拓的原信號與信號的上下包絡線如圖1所示,其中虛線為信號上包絡線,點劃線為信號的下包絡線,數據序列比較短,不能包含所有數據,因此包絡線出現了嚴重失真,產生了圖2所示的端點效應。圖2中,點劃線表示信號經EMD分解后的IMF分量,實線代表真實的信號分量,經對比發現經驗模態分解對信號的處理過程會因為端點效應“污染”而出現較大偏差。其中,c3與真實信號的偏差已經很大,EMD分解結果嚴重失真,不能準確反映真實信號的成分。所以在EMD處理前,端點效應成為必須解決的問題,否則EMD分解將失去意義。

圖1 原始信號及其上下包絡線

圖2 端點效應處理前的EMD分解結果
基于神經網絡的數據預測延拓法通過兩步實現。第一步是學習過程。對時間序列延拓是根據信號的具體表現形式和端點處的具體特性來進行的。在數據兩端利用神經網絡延拓出極值點。按照一定規則產生給定數據序列的學習樣本矩陣Pm×k,矩陣學習的目的是確定權重向量Wi和偏移向量bi的值,這些量之間的關系為
(7)
其中,f為傳遞函數,ni為傳遞函數的輸入構成的中間函數。得到的模擬向量al×k與目標向量tl×k會存在偏差。一般用最小二乘法調整權重向量W和偏移向量b的值,使偏差達到最小。由最速下降法得到W和b的值,學習過程結束。第二步為延拓過程。根據學習過程得到的W和b值通過給定的邊界處樣本矩陣,利用式(7)計算延拓值。采用RBF神經網絡對端點外數據進行延拓,把相鄰50個連續數據樣本進行訓練,將得到的訓練樣本輸入網絡中訓練網絡,用訓練過的網絡對原始信號進行預測,圖3所示為對神經網絡延拓后的信號進行經驗模態分解得到的IMF分量,可看出延拓后信號較接近真實信號。但與真實的IMF分量相比還有一定差距,尤其是IMF與真實數據間誤差較大,EMD分解不能完全反映真實數據。

圖3 經RBF神經網絡延拓后的EMD分解結果
3.1基于HMM的預測算法
HMM是重要的統計模型之一,能夠有效解決系統中表層事件可能由底層事件引發而產生的一類問題。一般來說,HMM模型的基本要素包括以下內容。
(1)系統初始狀態概率分布π。π可表示為
πi=P(qt=Si)i=1,2,…,N
(8)
其中,Si屬于隱狀態集合S={S1,S2,…,SN};N為狀態數;用qt=Si表示HMM在時刻t處于隱狀態Si;隱狀態序列Q={q1,q2,…,qN}。
(2)狀態轉移概率分布矩陣A。A可表示為
A={aij}
(9)
aij=P{qt+1=Sj|qt=Si}i,j=1,2,…,N
(3)觀測變量概率分布矩陣B。B可表示為
B={bi(ν),i=1,2,…,N,ν∈V}
(10)
bi(ν)=P{Qt=ν|qt=Si}
其中,V為觀測變量的樣本空間;Ot為t時刻觀測隨機變量。觀測序列記為O={O1,O2,…,Ot}。
可以用λ={A,B,π}完整地描述一個HMM(HMM按輸出類型分為離散型和連續型)。建立一個標準的HMM需要解決模型參訓練、估計隱狀態和似然概率計算三個基本問題。
將經各種數據預測的延拓數據與真實數據的誤差看作預測誤差et。任何時間序列的噪聲都服從特定的概率分布,假設觀測噪聲服從HMM過程,預測算法的實質為通過HMM相關理論對觀測序列E={e1,e2,…,et}進行研究和參數估計,然后進行預測。
將數據延拓方法的預測偏高、偏低或正常3種情況看作HMM的3個隱狀態。根據預測誤差分布情況,將預測誤差分成N類,作為HMM的一系列觀測值,并分析隱狀態與觀測值之間的對應關系。由此建立預測誤差HMM,確定模型參數,利用模型的狀態轉移概率矩陣和觀測值概率矩陣對預測誤差進行預測。最后利用預測誤差對延拓數據進行校正。
對預測誤差建立HMM,首先要進行HMM訓練,具體步驟如下。
(1)利用聚類算法將觀測數據分為5類,大致為偏高值較大、偏高值較小、較接近真實數據、偏低值較大、偏低值較小與偏低值較大5類數據,將誤差序列聚類為5種觀測值后,通過閾值形成新的觀察值序列。即
(11)
其中,Ire為預測誤差與真實數據的百分比。閾值分別取20%、40%、60%、80%,在分析數據時用測試誤差的離散化閾值H=[P0.2P0.4P0.5P0.6P0.8]T進行還原。
(2)得到觀測值序列后,對觀測值進行訓練建立HMM,得到HMM的狀態轉移概率矩陣A與觀測值概率矩陣B。

(12)
3.2基于HMM預測和神經網絡的數據延拓方法
經神經網絡延拓數據后,在計算與真實數據的延拓誤差的基礎上得到誤差序列。然后對誤差序列建立HMM,并預測延拓誤差,校正神經網絡延拓數據,具體流程如圖4所示。

圖4 基于HMM和神經網絡的數據延拓流程

(13)
對神經網絡的預測序列進行校正得到的信號再進行EMD分解,拋棄端點外數據得到圖5所示的分解結果。

圖5 校正后的EMD分解結果
分解精度為
(14)
其中,M表示信號的分量數目,N表示信號采樣點的個數,xi(k)與ci(k)分別表示原信號與分解后的第i個分量。由式(14)可知,E越小,說明EMD的分解效果越好,相應端點效應的抑制效果也就越好。
將文中的仿真信號經過不同的端點效應處理方法進行處理后進行EMD分解,計算不同的端點效應處理方法得到的EMD分解精度,見表1。

表1 各方法精度比較
由表1可以看出,經HMM算法校正后神經網絡延拓數據的EMD分解精度明顯高于未進行端點效應抑制的分解精度,也高于未進行HMM校正而直接進行神經網絡延拓的分解精度。
通過對轉子實驗臺的支撐部件連接松動實驗數據進行分析來驗證基于HMM校正與神經網絡延拓的EMD端點效應抑制方法的有效性。在實驗臺上將固定軸承的螺絲擰松,模擬轉子系統的支撐松動故障,測轉子圓盤的徑向位移的振動信號,轉速為924 r/min,采樣頻率為3 kHz。圓盤的徑向位移信號如圖6所示。

圖6 轉子支撐松動故障信號
對實驗數據直接進行EMD分解,得到圖7所示的分解效果與時頻譜圖。先對信號利用RBF神經網絡延拓抑制端點效應后再進行EMD分解,得到圖8所示的EMD分解結果與時頻譜圖。

(a)EMD分解結果

(b)時頻譜圖7 未延拓EMD分解結果與時頻譜

(a)EMD分解結果

(b)時頻譜圖8 神經網絡延拓后的EMD分解結果與時頻譜
最后利用HMM誤差預測方法對神經網絡延拓后的數據進行校正后再進行EMD分解得到圖9所示的抑制端點效應后的分解效果與時頻譜圖。圖7~圖9中選取的IMF分量為EMD分解后的能量較高的前三個IMF分量。
根據轉子支撐松動故障機理,振動響應除基頻x外還有2x、3x等高頻諧波,一定條件下還會產生1/2、1/4等偶分數次諧波共振現象。對比圖7~圖9發現,未進行延拓的信號的EMD分解端點效應最為明顯,分解效果不理想,2倍頻與3倍頻都不能很好地識別。神經網絡進行延拓后,雖然能夠分離2倍頻與3倍頻,但端點效應沒有得到明顯抑制,給故障診斷帶來了一定的困難。用HMM對神經網絡延拓進行校正后,分解結果較為理想,且故障特征頻率2倍頻與3倍頻分離較好,能夠很好地實現故障識別與診斷。

(a)EMD分解結果

(b)時頻譜圖9 HMM校正后的EMD分解結果與時頻譜圖
(1)本文在分析EMD端點效應的產生原因和端點效應對EMD分解影響的基礎上,將HMM和神經網絡集成延拓方法相結合,提出了一種基于HMM校正與神經網絡延拓的EMD端點效應抑制方法。
(2)利用RBF神經網絡預測估計方法對部分原始數據進行估計,同時對端點外數據進行預測,通過計算估計數據與真實數據的誤差序列,利用HMM建立估計誤差序列模型,用以預測延拓后數據的誤差,得到新的校正后延拓數據。
(3)通過仿真和實驗研究驗證了本方法抑制端點效應的有效性和可行性。
[1]Huang N E,Shen Z,Long S R,et al.The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Non-stationary Time Series Analysis[J].Proceedings of Royal Society of London A, 1998,454:903-995.
[2]Huang W,Shen Z,Huang N E,et al.Nonlinear Indicial Response of Complex Nonstationary Oscillations as Pulmonary Hypertension Responding to Step Hypoxia[J].Proceedings of the National Academy of Science, USA, 1999,96(5):1834-1839.
[3]楊宇,于德介,程軍圣.基于EMD與神經網絡的滾動軸承故障診斷方法[J].振動與沖擊,2005,24(1): 85-88.
Yang Yu,Yu Dejie,Cheng Junsheng.Roller Bearing Fault Diagnosis Method Based on EMD and Neural Network[J].Journal of Vibration and Shock,2005,24(1): 85-88.
[4]程軍圣,于德介,楊宇.基于EMD和分形維數的轉子系統故障診斷[J].中國機械工程,2005,16(12):1088-1091.
Cheng Junsheng,Yu Dejie,Yang Yu.Fault Diagnosis for Rotor System Based on EMD and Fractal Dimension[J].China Mechanical Engineering,2005,16(12):1088-1091.
[5]孟宗,李姍姍.基于小波半軟閾值和EMD的旋轉機械故障診斷[J].中國機械工程, 2013, 24(10): 1279-1283.
Meng Zong,Li Shanshan.Research on Fault Diagnosis for Rotating Machinery Based on Semi-soft Wavelet Threshold and EMD[J].China Mechanical Engineering,2013,24(10): 1279-1283.
[6]陳忠,鄭時雄.EMD信號分析方法邊緣效應分析[J].數據采集與處理, 2003, 18(1): 114-118.
Chen Zhong,Zheng Shixiong.Analysis on End Effects of EMD Method[J].Journal of Data Acquisition & Processing, 2003,18(1):114-118.
[7]杜陳艷,張瑜鋒,楊平.經驗模態分解邊緣效應抑制方法綜述[J].儀器儀表學報,2009,30(1):55-60.
Du Chenyan,Zhang Yufeng,Yang Ping,et al.Approaches for the End Effect Restraint of Empirical Mode Decomposition Algorithm[J].Chinese Journal of Scientific Instrument,2009,30(1):55-60.
[8]胡勁松,楊世錫.EMD方法基于AR模型預測的數據延拓與應用[J].振動、測試與診斷,2007,27(2):116-120.
Hu Jingsong, Yang Shixi.AR Model Prediction-based EMD Method and Its Application to Data Extension[J].Journal of Vibration,Measurement & Diagnosis,2007,27(2):116-120.
[9]韓建平,錢炯,董小軍.采用鏡像延拓和RBF神經網絡處理EMD中端點效應[J].振動、測試與診斷,2010,30(4):414-417.
Han Jianping,Qian Jiong,Dong Xiaojun.Suppression of End-effect in Empirical Mode Decomposition by Mirror Extension and Radial Basis Function Neural Network Prediction[J].Journal of Vibration,Measurement & Diagnosis,2010,30(4):414-417.
[10]程軍圣,于德介,楊宇.基于支持矢量回歸機的Hilbert-Huang變換端點效應問題的處理方法[J].機械工程學報,2006,42(4):23-30.
Cheng Junsheng, Yu Dejie, Yang Yu.Process Method for End Effects of Hilbert-Huang Transform Based on Support Vector Regression Machines[J].Chinese Journal of Mechanical Engineering,2006,42(4):23-30.
[11]孟宗,顧海燕,李姍姍.基于神經網絡集成的B樣條經驗模態分解端點效應抑制方法[J].機械工程學報,2013, 49(9): 106-112.
Meng Zong,Gu Haiyan,Li Shanshan.Restraining Method for End Effect of B-spline Empirical Mode Decomposition Based on Neural Network Ensemble[J].Chinese Journal of Mechanical Engineering,2013,49(9): 106-112.
[12]柳新民,劉冠軍,邱靜.基于HMM-SVM的故障診斷模型及應用[J].儀器儀表學報,2006,27(1):45-48.
Liu Xinmin,Liu Guanjun,Qiu Jing.Hybrid HMM and SVM Approach for Fault Diagnosis[J].Chinese Journal of Scientific Instrument,2006,27(1):45-48.
(編輯陳勇)
Restraining Method of End Effect for EDM Based on Error Calibration by HMM and Neural Network
Meng Zong1,2Yan Xiaoli1Wang Sai3
1.Key Laboratory of Measurement Technology and Instrumentation of Hebei Province,Yanshan University,Qinhuangdao,Hebei,066004 2.National Engineering Research Center for Equipment and Technology of Cold Rolling Strip,Qinhuangdao,Hebei,066004 3.R&D Center of Great Wall Motor Company(Automotive Engineering Technical Center of Hebei),Baoding,Hebei,071000
End effects reduced the precision of EMD greatly, and neural network extension was used to restrain the end effects. However, there were forecast errors in the data forecasted by neural network. Here, a new method, error calibration by HMM was proposed to solve the problem. The radial basis function(RBF) neural network was firstly used to forecast outboard of both ends and estimation part of original signals. Then HMM was used to analyze the forecasting errors and to find the regularity of forecast errors of neural network. According to the analysis, the forecasting errors in next step were analyzed and forecasted to adjust neural network’s forecasting results. Simulation and experiments prove that the method can solve the end effects effectively.
hidden Markov model(HMM); error calibration; neural network; end effect; empirical mode decomposition (EMD)
2014-04-25
國家自然科學基金資助項目(51105323);河北省自然科學基金資助項目(E2015203356);河北省高等學??茖W研究計劃資助重點項目(ZD2015049)
TN911.7;TH165DOI:10.3969/j.issn.1004-132X.2015.14.014
孟宗,男,1977年生。燕山大學電氣工程學院教授。主要研究方向為機械設備監測與故障診斷、動力學建模、信號檢測與處理等。發表論文20余篇。閆曉麗,女,1986年生。燕山大學電氣工程學院碩士研究生。王賽,男,1987年生。長城汽車股份有限公司技術中心(河北省汽車工程技術研究中心)工程師。