陸百川,張 凱,馬慶祿,鄧 捷,劉權富
(1.重慶交通大學 交通運輸學院,重慶 400074;2.重慶交通大學 重慶山地城市交通系統與安全實驗室,重慶 400074)
近年來,隨著傳感器技術的發展,越來越多的高速、高精度傳感器被應用在交通、土木等諸多領域。采用多傳感器對目標系統進行檢測可以獲得更加豐富的數據,從而可以更精確的對目標進行估計、判斷和控制,但由于自然環境的多變性和前端傳感器軟硬件工作屬性的不一致等原因,導致隨著數據量的迅猛增長,其中包含的隨機噪聲和故障數據也隨之增多,部分故障信息被噪聲掩蓋,然而其分布也愈加多尺度化。因此如何利用已累積的大量離線數據,通過提取數據特征并分析其內在規律,實時并有效的將在線數據中所包含的故障數據進行檢測并完成故障分離,最終達到保證系統安全、減少經濟損失的目的,成為眾多專家與學者關注的熱門話題之一。
數據驅動泛指一類不需要目標系統的精確數學模型,利用系統海量數據便能對其實現故障診斷等目的的技術,該技術的研究包含主元統計類與小波分析類等諸多理論[1-2]。Y.Li[3]給出了基于主元分析法(PCA)的故障診斷模型,該模型是將實際測量數據投影到統計模型的相應子空間,其產生的殘差空間可以用來判斷是否出現故障,但該方法是屬于單一尺度的建模方法,面對故障信息的多尺度特性具有其局限性。B.R.Bakshi[4]提出了多尺度主元分析法(MSPCA),該模型將小波和PCA有機結合,利用小波的多尺度分析特性克服了PCA的缺點,但該模型在實際應用過程中被發現其去噪方面存在明顯缺陷。
筆者設計了一種基于數據驅動的數據故障診斷模型,該模型首先出于故障檢測的目的,加入了一種改進的小波閾值除噪算法,該算法在去除了大部分高頻隨機噪聲的同時,保留故障信息,從而提高信號的置信度。然后將小波包能量分析和PCA相結合,完成了數據故障的檢測和分離。最后,將該模型應用在橋梁撓度監測數據故障診斷中,通過與傳統MSPCA模型進行對比,結果證明了該模型具有較小的錯報率和漏報率,抗噪能力強。
多尺度特性主要由小波分析的方法體現出來,假設一個有限能量信號x(t),該信號的離散小波變換定位為:
(1)
式中:ψa,b為小波變換的母函數或基函數;且:
(2)
式中:a為尺度因子;b為位移因子。
小波變換的實質就是移動這兩個因子,構建出空間組合{ψa,b(t)},使得該組合可以表示空間L2(R)中任何一個信號。因此,對于空間L2(R)中的特定信號 ,在尺度因子a的作用下可以在連續尺度進行塔式分解,這就是經典的Mallat算法。
由Mallat算法可知,在脈沖響應h(n)下有尺度函數和小波函數,如式(3):

(3)
式中:g(n)=(-1)(1-n)h(1-n)。
信號x(t)在尺度j下的近似信號和細節信號分別為:

(4)
信號x(t)分解的過程是從尺度j到(j+1) 逐步分解過程,具體就是將Ajx(t)分解為Aj+1x(t)和Dj+1x,即:
(5)
小波閾值除噪的基本思想是預先設置一個閾值λ,對小波變換后得到的小波高頻細節信號與該閾值進行比較,若小于該閾值,則認為該系數主要由噪聲引起的,需要去除;反之,則認為該處系數是由信號引起的,需要保留。最后通過小波重構計算,得到去噪后的信號[5]。筆者對傳統閾值除噪做了3點修改:噪聲標準方差估計、閾值設定函數和小波系數調整函數。
1.2.1 噪聲標準差估計公式
將信號進行多尺度分析的時候,每一個尺度都會有一個近似部分系數Caj和一個細節部分系數Cdj。噪聲的標準方差可由經驗式(6)計算:
(6)
式中:j為尺度數,有1≤j≤J(J為最大尺度);N為該尺度下小波系數的個數。
1.2.2 閾值設定函數

P=[CDj,1,CDj,2,CDj,3,…,CDj,N]



(7)

1.2.3 小波系數調整函數

(8)
故障檢測是計算正常數據的小波包分量與含故障數據相對應分量的能量差。小波包分解與小波不同的是,小波包分解將小波分解在每一層作為保留的高頻部分亦進行與同層低頻部分一樣的分解,因此小波包比小波變換更精細,可以在任何頻段上對信號進行分析。文獻[7]對小波包理論進行詳細闡述。設輸入信號為x(t)∈L2(R),使用式(3)的脈沖響應h(k)與g(k),有小波包分解公式:
(9)
式中:un(t)為小波包系數;n為小波包分解層數,n= 0,1,…。
小波包能量計算公式定義為:
式中:m為尺度參數;k為時間序列。
在任何一個頻段,當有故障發生的時候,該頻段在故障點及其附近的能量差會發生“突起”,而沒有故障發生的數據點,其能量差較為平緩。因此,小波包能量差對故障信息具有敏感性,可以使用該方法對故障進行多尺度分析及檢測。
基于PCA的故障分離思想就是利用海量歷史正常數據來建立主元子空間和殘差子空間,再將待檢數據投影到該空間內,以此來計算數據是否發生故障。S.Joe Qin[8]提出采用T2來描述故障是否發生,該指標反映的是每個數據采樣點的幅值或變化趨勢相對于其主元子空間原點的距離,文中還介紹了使用SPE來確定故障,該統計量是用來反映第k時刻的觀察數據相對于其主元模型的背離程度。
模型分離線模式與在線檢測兩個模塊,詳細算法流程如圖1。
Step1:輸入正常數據矩陣X,設定數據窗口大小為2n,n為多元變量維數。
Step2:利用小波包變換對數據矩陣X每一行,即每一個變量進行尺度為J的分解,計算該尺度下的各個分量的小波包能量值。
Step3:對各小波包分量進行主元分析,計算各自的主元個數以及該分量的兩個控制限參數。
Step4:輸入在線監測數據,對每個分量進行小波閾值除噪,重構后參照Step2中對應的分量進行相同尺度的小波包分解。
Step5:計算每一個分量的小波包能量。與對應的離線數據小波包能量相減,獲得該分量的小波包能量差曲線。
Step6:選定出現故障的分量或感興趣的分量,進行與Step3中相同參數的主元建模,利用先前得到的T2控制限參數進行故障進行分離。
Step7:重復Step4~Step6。統計每一分量下的數據故障的詳細位置。
Step8:對所有數據進行主元分析,繪制基于SPE的二維貢獻圖。

圖1 故障診斷算法流程Fig.1 Flow chart of the fault diagnosis algorithm
利用重慶馬桑溪大橋的10組撓度檢測數據來進行實驗。每個測點選取前1 000個數據作為模型的正常數據X。在相同原始數據中,選擇傳感器S9和S10,加入隨機高頻故障,傳感器S1,S3,S5,S7,加入周期性漸變故障。再將所有傳感器均加入方差為0.000 1,功率為1 dBm的白噪聲。獲得的新數據矩陣Y,即待檢矩陣。詳細的故障安排情況如表1。

表1 故障安排位置
錯報率 =(理論非故障數據個數-故障錯報數據個數)/理論非故障數據個數;漏報率 =(理論故障數據個數-故障檢測數據個數)/理論故障數據個數。
MATLAB仿真中,小波閾值除噪和小波包分解分別使用DB3小波和DB2小波。除噪過程采用5層分解,故障診斷過程采用3層分解。
仿真實驗過程中,作為效果對比,計算T2控制限參數的時候分別選取置信度為95%和99%。
模型在被歷史正常數據進行預處理后,首先對待檢數據中10個向量分別進行計算,以傳感器S1作為典型示例,圖2為該信號第3層分解的8個向量的能量差,虛線表示各自分量的能量差閾值。可以看出節點[3,0]沒有發現故障信息,而在節點[3,1]~ [3,4]中在200~250附近發生了不同程度的數據故障。圖3是分離故障數據的結果,其中實線表示置信度為99%的T2控制限。

圖2 S1能量差結果Fig.2 Energy difference results of S1

圖3 S1故障分離結果Fig.3 Fault isolation results of S1
為了能將發生故障的傳感器的相對嚴重程度直觀表示,需要通過計算待檢數據的SPE控制限以及基于SPE的二維貢獻圖,如圖4。各傳感器的故障數據診斷結果如表2。


圖4 各故障點的傳感器貢獻Fig.4 Sensor contribution of each fault point

傳感器故障位置錯報率/%漏報率/%S1148~165;200~2502.20.5S2975~9851.00S3300~364;802~8101.60S4000S5700~7300.50S6508~5110.30S7890~9251.00.5S8501~5050.40S9389~4301.60S10486~5291.40.6
由圖4(a)可發現采樣點300~350附近的數據出現較為嚴重的故障,其他采樣點如500、850附近均有不同程度的故障數據出現,對比圖4(b)可得知傳感器S3、S7、S10對故障數據的貢獻最大,其中傳感器S3發生了相對更嚴重的故障。
為了對比筆者提出的模型效果,采用文獻[9]中提到的統MSPCA模型進行了對比實驗。在MATLAB中建立相關程序,設置統計控制限置信度為99%,使用相同實驗數據進行了仿真。結果如圖5。對比表1可發現, MSPCA在多處數據點存在漏報現象,即沒有檢測到傳感器S5、S9和S10的故障。

圖5 傳統MSPCA的T2監控圖Fig.5 T2 monitoring diagram of traditional MSPCA
研究表明,筆者提出的模型可以有效的檢測出故障數據的位置,且待檢信號的高頻噪聲對其故障檢測并沒有帶來顯著影響;利用二維貢獻圖的輔助,直觀的評價出傳感器故障的相對嚴重程度。對比傳統的MSPCA模型,本文模型大大減少了漏報率,提高了故障檢測的正確率,其性能優于傳統MAPCA。
針對噪聲對故障診斷帶來的影響以及故障信息的多尺度性,提出了一種基于數據驅動的故障診斷模型,并給出詳細算法步驟。通過對橋梁撓度監測數據的故障診斷的實驗分析可知,該模型可以有效的分離故障數據并對其故障相對嚴重程度進行評價,故障的分離可以為后期數據修補等工作提供依據,而故障的評價對后期故障決策能夠提供幫助。文中模型與傳統MSPCA模型的對比實驗表明,文中模型的抗噪能力更強,準確率更高。
[1] Qin S J,Badgwell T A.A survey of industrial model predictive control technology [J].Control Engineering Practice,2003,11(7):733-764.
[2] 周東華.數據驅動的工業過程故障診斷技術[M].北京:科學出版社,2011:2-11.
Zhou Donghua.Data-Driven Industrial Process Fault Diagnosis Technology [M].Beijing:Science Press,2011:2-11.
[3] Li Y.Fault detection and isolation based on abnormal sub-region using improved PCA [J].Journal of Chemical Engineering of Japan,2004,37(4):514-522.
[4] Bakshi B R.Multiscale PCA with application to multivariate statistical process monitoring [J].Aiche Journal,1998,44(7):1596-1610.
[5] 趙瑞珍.小波理論及其在圖像、信號處理中的算法研究[D].西安:西安電子科技大學,2001.
Zhao Ruizhen.Study on Wavelet Theory and Its Algorithms for Image and Signal Processing [D].Xi’an:Xidian University,2001.
[6] Donoho D L.De-noising by soft-thresholding [J].IEEE Transactions on Information Theory,1995,41(3):613-627.
[7] Peng C D W.Application of wavelet packet-energy spectrum in extracting the features of pulse signal [J].Electronic Technology,2010,1:19-20.
[8] Joe Qin S.Statistical process monitoring:basics and beyond [J].Journal of Chemometrics,2003,17(8/9):480-502.
[9] 夏陸岳,潘海天,周猛飛,等.基于改進多尺度主元分析的丙烯聚合過程監測與故障診斷[J].化工學報,2011,62(8):2312-2317.
Xia Luyue,Pan Haitian,Zhou Mengfei,et al.Process monitoring and fault diagnosis of propylene polymerization based on improved multiscale principal component analysis [J].Journal of Chemical Industry and Engineering,2011,62(8):2312-2317.