別鋒鋒,都騰飛,龐明軍,谷 晟
(江蘇省綠色過程裝備重點實驗室,江蘇 常州 213164)
管道阻塞是一種常見故障狀態,近年來,聲波檢測法被廣泛應用于對管道阻塞的判別。但由于傳感器采集的聲信號具有非線性、非平穩的特征,同時處理多通道信號往往存在分解尺度不同的問題[1-2]。如何從非線性,非平穩的信號中提取故障特征是狀態識別的關鍵。對于聲信號中有用信息的提取,國內外學者進行了大量的研究分析,提出了很多方法。主要有短時傅里葉變換、小波分析、經驗模態分解、局部均值分解[3-5]等。1998年Huang[6-7]等提出的經驗模態分解(EMD,Empirical Mode Decomposition),克服了小波分析小波基的選擇問題,可以根據信號的特征自適應選擇基底來對信號進行多分辨率分析,但該方法不足之處在于分解的固有模態函數(IMF,Intrinsic Mode Function)會產生模態混疊的情況。為降低模態混疊的影響,Wu等[8]又在EMD基礎上提出了集合經驗模態分解(EEMD,Ensemble Empirical Mode Decomposition),該方法利用加入輔助白噪聲來降低模態混疊影響。YEH等[9]又對EEMD做了改進,提出了互補集合經驗分解法(CEEMD,Complete Ensemble Empirical Mode Decomposition),采用正、負成對的形式加入輔助噪聲,通過正、負抵消重構信號中的輔助噪聲,降低模態混疊影響,并且可以減少加入的噪聲集合次數,提高計算效率。完全集合經驗模態分解(CEEMDAN,Complete EEMD with Adaptive Noise)算法[10]克服了EEMD算法存在的不足,該方法將自適應的白噪聲添加到EEMD算法分解的每一階段,各個模態函數分量通過計算唯一的余量信號獲取,使其分解過程既具有完整性,又能抑制噪聲成分。本文采用進一步優化的分解方法[11]ICEEMDAN(Improved Complete EEMD with Adaptive Noise)。該方法極大地抑制了初始分解過程引起的虛假分量和模態混疊問題,具有更好的分解結果。
神經網絡作為一種人工智能的方法,目前已廣泛應用于故障診斷領域。通過自組織和自適應的學習,神經網絡可以達到良好的分類效果。但是神經網絡算法容易造成過擬合的問題,實際訓練過程中需要大量的訓練樣本。極限學習機(ELM)由于其結構簡單,方便使用,近年來已有很大的應用,除了解決了神經網絡易產生過擬合的問題外,ELM只需要設置隱藏層節點的數量、輸入權重和隱藏元素的偏差,便可獲得全局最優解[12]。因此,它在模式識別領域得到了廣泛應用和發展。
本文將ICEEMDAN、聲壓級和ELM算法相結合來分析和識別堵塞管道的聲信號脈沖響應信號。首先,通過ICEEMDAN信號預處理得到若干個IMF分量。其次,綜合相關系數和方差貢獻率作為相關判據,篩選出表征管道阻塞信息的IMF分量,計算IMF分量的聲壓級構造特征向量,然后輸入ELM進行分類與識別。
本文第一部分將介紹ICEEMDAN算法、ELM算法以及IMF的選取原則。第二部分將介紹基于ICEEMDAN聲壓級的特征提取方法和基于ELM的模式識別方法。第三部分是實驗分析,第四部分是結論。
EEMD算法在每次分解的開始階段,都存在一個局部均值和一個IMF分量,而真正模態分量是混合原信號和噪聲信號的平均模態分量,其中包含著一些殘余的噪聲。另一方面,在CEEMDAN算法分解過程中使用上一個模態分量分解后的殘差來計算下一個模態,每一階模態計算都是連續的。而Colominas提出的ICEEMDAN算法在此基礎上進行了改進。
CEEMDAN方法在分解過程中加入的是高斯白噪聲,而ICEEMDAN方法加入的是一種特殊的白噪聲Ek(w(i)),即高斯白噪聲經過EMD分解過后的第k個IMF分量,對每個模態分量計算信號加噪聲的局部均值,并將分解得到的IMF定義為殘差信號與局部均值的差值。ICEEMDAN分解方法大大減少了IMF分量中的殘余噪聲,改進了傳統方法在分解重構的早期階段容易產生虛假分量和模態混疊的不足。
定義操作符Ek(·)表示EMD分解后的第k個模態分量,M(·)表示信號的局部均值。那么E1(x)=x-M(x)。操作符表示取均值,具體的分解過程如下:
第一步:構造x(i)=x+α0E1(w(i)),其中,w(i)表示被添加的第i個白噪聲,α0表示噪聲標準差。計算x(i)的局部均值M(x(i)),取均值得到第一個殘差分量
第二步:計算第一模態分量IMF1值
第三步:計算第二模態分量IMF2值r2,式中
使用極限學習機ELM對管道聲信號進行模式識別。極限學習機ELM是在單隱層前饋網絡SLFN的基礎上發展起來的,而單隱層前饋網絡SLFN是具有一層隱含層的特殊BP神經網絡[13]。ELM的體系結構如圖1所示。

式中:wij和bi是輸入層和隱含層的權重和閾值,g(x)是隱含層神經元的激活函數,文中選用sigmoid函數。βij是隱含層和輸出層間的權值,H表示隱含層的輸出矩陣。對輸入層向量首先進行一個線性化的計算得到wijxi+bi,然后通過激活函數g(x)計算出隱含層的輸出矩陣H,H=g(wijxi+bj),再將H乘以隱含層和輸出層間的權值βij得到輸出向量T。極限學習機在計算過程中具有以下幾個優點:

圖1 極限學習機(ELM)結構圖
(1)隱含層和輸入層間的權值wij和閾值bi是隨機產生的,并在計算過程中保持不變。
(2)隱含層和輸出層間的連接權值βij不是通過迭代計算的方式而是通過解方程組的方式一次計算完成的,因此模型的泛化能力較強,求解速度很快。
其中,誤差函數可由下式得出

上式的解為β^=H+T′。T′是T的轉置矩陣,H+是隱含層輸出矩陣的Moore-Penrose廣義逆。
具體的ELM計算步驟如下:
第一步為隨機產生隱含層和輸入層的連接權值wij和閾值bi;
第二步為選一個無限可微的激活函數g(x),本文用的是sigmoid函數;
第三步為計算隱含層的輸出矩陣H,H=g(wijxi+bj);
第四步為求解隱含層和輸出層的連接權值β^。
信號處理的過程中,相關性[14]是一個非常重要的概念。通過將分解后的固有模態函數與原信號做相關性分析,尋找出與原信號相關程度大的部分,從而將信號的虛假分量剔除,提高對處理后的時頻分析信號特征提取的準確率。相關系數的具體計算方式如下:
首先計算原信號和各個IMF分量的自相關函數,計算公式如下

將自相關函數進行歸一化,求各個IMF分量的自相關函數RIMF1(m)、RIMF2(m)…RIMFn(m)與原信號的自相關函數Rx(m)的相關系數,相關系數的定義為

式中:N為信號采樣點數;j代表第j個IMF分量。
因子分析法的統計意義表明,方差貢獻率可以確定因子的相對重要性[15],高的因子方差貢獻率說明該因子與原信號間的相互影響越大。通過計算各個IMF分量和原信號的方差貢獻率,篩選出影響因子較大的分量。對于采樣時間t內采集的聲信號(含有k個數據點),定義各個IMF分量fi與原始信號的方差貢獻率計算公式如下

相關系數和方差貢獻率都是表示兩組信號相關性的指標,一般來說當指標數值大于0.3時就認為有較強的相關性,IMF分量真實有效,可以予以保留。通過計算相關系數和方差貢獻率,綜合考慮選取包含原始信號特征的IMF分量。
聲壓表示聲波通過某種介質時,由于振動而產生壓強的改變量。定義聲壓p為聲波在媒介中存在于某點的壓強pf與介質在平衡狀靜壓pref的差值

由于某點的實際聲壓p為瞬時聲壓,而有效聲壓的計算公式為[13]

上式中的T表示信號的周期。有效聲壓Pe單位為帕斯卡(Pa),儀器儀表測得的聲壓和我們通常所指的聲壓都是有效聲壓。聲壓級是通過儀表儀器來反映人耳對聲音強弱的主觀判斷,符號為SPL,其定義為

其中:Pe表示有效聲壓,Pref表示參考聲壓,聲壓級的單位是分貝(dB)。
本文提出了一種基于ICEEMDAN分解和聲壓級(SPL)相結合的信號處理方法。針對管道聲信號的特征處理識別方法流程如下:
(1)對多通道采集的聲脈沖響應信號進行ICEEMDAN分解,得到多組不同分解尺度的IMF分量;
(2)計算各IMF分量和原信號的相關系數xg和方差貢獻率mseb,篩選出含有管道特征信息的主要IMF分量;
(3)計算各IMF分量的聲壓級(S1,S2,S3…)并作為管道聲信號檢測的特征值;
(4)構造特征向量T=[S1,S2,S3…] ;
(5)將一部分特征向量用于訓練ELM分類器,然后將剩余的測試數據輸入到ELM以識別阻塞狀態。整個流程如圖2所示。

圖2 聲信號的特征提取與模式識別圖
實驗裝置包括4個拾音器、揚聲器、MARC8聲卡、功率放大器和Win MLS測試軟件。如圖3所示,4個拾音器集成在一個電路板上和揚聲器連接在一起。拾音器的靈敏度為1 V/Pa、1 kHz。揚聲器發出聲信號后被拾音器接收,轉換為電信號。
該實驗裝置如圖4所示,聲卡控制揚聲器輸出大小。MARC8聲卡能夠在50 Hz~18000 Hz的頻率范圍內發射聲能,通過揚聲器系統測試軟件WinMLS產生最大長度為14階的偽隨機序列,拾音器有4個通道接收返回信號。兩者通過采集卡和放大器與計算機相連。實驗時通過一個螺栓將傳感器固定在管道內。

圖3 管道聲信號傳感器裝置圖

圖4 管道聲信號實驗裝置圖
實驗采樣頻率為44100 Hz。管道的材質為黏土,長度為15 m,障礙物設置在距離揚聲器5 m的地方,如圖5所示。

圖5 實驗管道工況設置示意圖
為模擬實際運行中的管道狀態,一共設置4種不同的工況。A、B管道模擬管內有流體運行情況,A管道在距離揚聲器5 m的地方設置了障礙物模擬管道阻塞的情形,管道內通水。將B管道和A管道作對比,通水但不設置障礙物。C、D管道模擬管道內無流體空載時的情形,C管道在距離揚聲器5 m的地方設置障礙物模擬管道阻塞,D管道只為空管。當管道中存在流體和堵塞情況時,拾音器接受到的返回信號會有變化,通過區分比較采集的返回信號可以分析和辨別管道的狀態。
實驗中通過設置A、B、C、D 4類不同狀態的管道,采集相關的原始信號的時域波形如圖6所示。

圖64 類信號時域波形圖
A、C管道內有障礙物模擬管道阻塞情況,A、B管中有水,C、D管中無水。從圖6可以看出,4類工況下的脈沖波形表征極為相似,僅從時域圖上很難做出區分。
基于以上情況,開展對所采集的實驗聲信號特征提取就顯得十分必要,本文提取管道聲信號聲壓級(SPL)進行分析。首先對多通道采集的聲信號進行ICEEMDAN分解,分解得到11個IMF分量和一個殘差余量,圖7展示了A管道聲信號通過ICEEMDAN分解得到的IMF分量(前8階)。
若對IMF直接進行分析,很難得出原信號相關的有效特征。通過綜合比較相關系數和方差貢獻率這兩個參數可以篩選出IMF中的有效分量。將各個IMF分量的相關系數和方差貢獻率繪制成圖8。
圖8反映了各種情況下IMF分量與原信號的相關系數和方差貢獻率的關系,保留數值大于0.3的IMF分量。相關系數分析保留分量IMF4~IMF7。方差貢獻率分量分析中保留分量IMF5~IMF7,綜合考慮選取IMF4~IMF7分量,其余的IMF分量予以剔除。表1展示了4種工況下IMF分量的聲壓級分布。
本文使用極限學習機ELM進行故障分類的識別。實驗所采樣的ABCD 4種工況下的聲脈沖信號每類分為12組數據,共48組數據。在4類數據中每組分別隨機選取8組共32組數據作為訓練樣本,其余16組作為測試樣本。先對隨機選取的訓練樣本數據進行ICEEMDAN分解,根據相干系數和方差貢獻率,篩選出分量IMF4~IMF7,計算各個分類的聲壓級SPL,圖9給出了48組數據的IMF分量的聲壓級特征值分布,將4個IMF分量特征值構成特征向量T=[S1,S2,S3…] ,歸一化后將特征向量T輸入ELM進行訓練,對12組測試樣本同樣計算出特征向量進行驗證。

圖7 管道聲信號的ICEEMDAN分解

表14 類管道聲信號在IMF4~IMF7分量的聲壓級/dB
訓練時,A類管道的信號設置為1,B類管道的信號設置為2,C類管道的信號設置為3,D類管道的信號設置為4。圖10展示了根據單次隨機樣本抽取的測試集識別準確率,識別率為100%。
為了進一步分析ELM的性能,文中隨機采樣了10次樣本數據,同時使用BP神經網絡和SVM進行對比試驗。表2給出了10次預測的準確率和計算時間。
如圖11所示,極限學習機ELM具有較高的預測準確率,SVM次之,BP神經網絡的預測準確率最差。
圖12給出了3種方法的預測計算時間,在計算機性能相同時,BP神經網絡由于要反復迭代需要較長的計算時間。
SVM由于應用核函數,計算時間次之,而ELM由于連接權值w和隱含層閾值b在訓練時是隨機選擇的,并且在訓練過程中可以保持不變,這種方法可以大大減少參數的計算量,因此在3種方法中具有較快的計算速度,再一次證明了ELM在識別準確率和計算時間上的優越性能。

圖8 各階IMF相關系數和方差貢獻率變化趨勢

圖9 4類管道聲信號聲壓級分布

圖10 極限學習機ELM識別圖

表2 基于ELM、SVM、BP的分類結果

圖11 基于ELM、SVM、BP分類準確率識別

圖12 基于ELM、SVM、BP分類計算時間
對不同狀態的管道聲脈沖信號進行特征提取與模式識別,具體結論如下:
(1)基于ICEEMDAN分解的方法由于是基于信號的自適應分解,適用于非平穩和非線性的管道聲信號的處理。
(2)理論和實驗分析證明,本文所提出的基于相干系數和方差貢獻率來判斷IMF分量和原信號相關性,并以聲壓級作為聲信號處理的特征值,從而提取出特征向量的方法切實可行。
(3)給出了一種ELM分類器來對管道阻塞狀態進行模式識別的方法,并通過與BP神經網絡和SVM對比分析,證明了ELM在識別準確性和耗時方面的良好效果,突出了ELM在模式識別中的優勢。