段旺旺,金煒東
(西南交通大學 電氣工程學院,成都 610031)
基于AR功率譜的高速列車轉向架故障信號分析
段旺旺,金煒東
(西南交通大學 電氣工程學院,成都 610031)
高速列車轉向架是否故障及故障種類對列車運行的安全性有重要的影響。為了及時高效的對轉向架關鍵部件進行故障診斷,本文選用高速列車轉向架典型故障振動信號,提出了運用功率譜與主成分分析相結合的方法提取信號特征,先對樣本數據進行功率譜估計,構造包含所有工況的特征頻點數組,將這些頻率點在每個樣本的功率譜中對應的幅值作為特征向量,再通過主成分分析降維處理,去除冗余的特征項,最后經過支持向量機分類判斷出故障種類。用加速度和位移傳感器選取5個測點,取得了滿意的識別結果,準確率在90%以上,驗證了該方法的有效性。
振動與波;故障診斷;高速列車;信號分析;轉向架
隨著我國高速鐵路的快速發展,列車的速度不斷提高,長期服役的安全性態會發生變化,若隱藏的故障不能及時排除,將對列車的安全行駛造成極大的威脅。如何在高速列車的振動數據中有效提取異常特征,并快速準確的估計出高速列車所處的狀態,判斷出列車轉向架的故障種類,對高速列車的行車安全具有重要意義。目前針對列車振動信號的分析方法主要有經驗模態分解[1]、小波分析[2]和分數階傅里葉變換[3]等,求取的特征向量大都缺乏物理意義,而且計算量大,實時性較差。
功率譜反映了隨機信號各頻率成份功率能量的分布情況,可以揭示信號中隱含的周期性等有用信息,對于機械設備各種特征頻率的確定是對設備進行故障診斷的基礎,當機械設備發生故障時,均在某些特征頻率附近出現明顯的峰值,功率譜通過反映各頻率成分能量的分布關系,更容易得到峰值出現位置處所對應的頻率[4]。
本文通過運用現代功率譜估計提取具有物理意義的特征向量,再通過主成分分析對特征向量進行降維優化,去除了冗余的特征對分類的干擾,提高了分類的準確率,也提高了程序運行效率,真正做到快速準確估計出列車的故障種類。
列車在高速行駛中產生的振動信號是由多個振動源一起產生的,如發動機、齒輪間隙以及輪軌關系導致的車體其他部件的非周期振動,當然還有對應于不同車況的一些具有穩定頻率的周期性振動。由于功率譜能突出周期性振動信號,周期振動在功率譜中對應尖鋒,而背景與寬鋒對應各類噪聲,所以列車在不同的工況下得到的功率譜的譜峰,有屬于公共信號造成的,也有屬于每種工況具有特征頻率的振動,即便是公共信號在不同工況的影響下因表現的劇烈程度不同;造成譜峰幅值也不同。譜峰對應的頻率點就是每種故障的特征頻點。由于不同的傳感器位置不一樣,依托車體的部位不同或部件不同,以及檢測方向也不盡相同,決定了不同的傳感器檢測到的是整個振動車體的局部信息,所以在同一種工況下,不同的傳感器檢測到的振動信號是有差別的,同時,列車在不同速度下車體的振動情況是有差異的,導致同一個傳感器在不同速度下檢測到的信號也是不一樣的,這就造成了某一工況的特征頻點會隨列車的速度以及傳感器的不同而不同。列車在行駛中轉向架主要有以下幾種典型工況[5]:正常、空簧失氣、抗蛇行減震器失效、橫向減震器失效三種單故障,以及橫向減震器失效+抗蛇行減震器失效、空簧失氣+橫向減震器失效、空簧失氣+抗蛇行減震器失效三種混合工況,本文將正常工況作為一種單故障,將三種混合故障與之前的四種單故障組成七種故障。
圖1為列車振動信號處理流程圖,對某一速度某一傳感器測到的數據,首先根據先驗的信息獲得每種工況的特征頻點,組成七種工況的特征頻點庫,對待測信號取特征頻點處功率譜的幅值,組成N維特征向量,再對該特征向量進行降維處理[6],最后通過支持向量機學習分類,估計出轉向架故障種類。
功率譜估計是隨機信號處理的重要內容,主要有經典譜估計和現代譜估計,現代功率譜估計較經典譜估計頻率分辨率高,應用更加廣泛。功率譜能較好的突出混合信號中的周期成分,周期振動在功率譜中對應尖鋒,而背景與寬鋒對應各類噪聲,譜的幅值則反映了振動的劇烈程度。
在現代譜估計中,常用模型有自回歸(AR)模型,滑動平均(MA)模型,自回歸滑動平均(ARMA)模型,根據Kolmogorov-Szego定理,只要AR模型的階數p取到足夠大,就可以代替ARMA或MA模型。在實際應用中,因為AR模型參數計算相對簡單,同時有較高的分辨率,因此被研究的最多。AR模型是一個全極點模型,該模型的輸出是當前輸入和過去輸出的加權和,可有下面的差分公式表示[7]

其中p是AR模型的階數,{ak}為AR模型的參數,w(n)為均值為零、方差為σ2的平穩白噪聲序列。將它進行Z變換可得到系統轉移函數為

因此{x(n)}的功率譜密度可表示為

只要求得參數{ak}和σ2就能得到功率譜值。
目前主要有三種求取該參數的方法:Levinson-Durbin算法、Burg算法和Marple算法,本文中采用較為通用的Burg算法來估計信號的模型參數,它的基本思想是利用線性預測器對數據向前和向后進行預測,根據總均方誤差之和最小的原則來估計發射系數,然后在通過Levinson-Durbin算法遞推出AR模型的優化參數[8]。
在AR譜估計中,模型階次p的選擇是一個關鍵問題,階次選擇過低將會導致功率譜曲線過于平滑,頻率分辨率低;而階次選擇過高,又會產生虛假譜峰,干擾正常的譜峰。一般階次選擇有兩個準則,最終預測誤差準則(FPE)和最小信息準則(AIC),一般對于個數為N的樣本,當p/N<0.1時可視為大樣本,對于大樣本FPE與AIC效果幾乎相同,本文采用AIC準則[9]

其中N為被測數據個數,βp為p階AR模型預測誤差的方差,一般使AIC(p)的值取得最小值的p值為最佳階次。
主成分分析(PCA)是將多個變量通過線性變換有效的從多維數據中選出能夠表示全局的主要數據(主成分),去除噪音和冗余,實現對原來復雜的數據降維。設Xm×n為原始數據,m為樣本個數,n為特征維數,其中m>n,PCA處理的步驟為[10,11]
(1)計算原變量的協方差矩陣Sn×n

式中xki,xkj分別為原始數據Xm×n中第k行中第i列和第j列的元素,分別為第i列和第j列的數學期望,sij為所求協方差矩陣Sn×n中的元素。
(2)求出Sn×n的特征值λi及相應的正交化的特征向量ai,由大到小取前q個特征值對應的特征向量,就是前q個主成分,選擇幾個主成分通過特征值貢獻率來確定,貢獻率表示為

一般,當貢獻率大于90%時,就可認為主成分可以反映原變量的信息了。
(3)經上步確定了主成分個數q的值,得到了特征向量An×q,降維后的數據變為

至此,n維數據降到了q維。
本文實驗數據來自西南交通大學牽引動力國家重點實驗室,通過動力學仿真分析的獲得[12]。數據為某型號動車組中動車轉向架振動故障仿真數據,記錄了列車各關鍵部位的振動信號,包括車體、構架、軸箱上各個部位橫向、縱向和垂向三個方向振動加速度和車體、構架、輪對、一系、二系各部位三個方向的振動位移,共計58個通道。不同的通道代表不同位置的傳感器。對數據首先進行預處理,因為故障信號都集中在20 Hz以下,所以首先用巴特沃斯濾波器對信號進行低通濾波,去除高次噪聲。下圖是一組正常工況下車體中部橫向加速度傳感器在速度200 km/h下的采樣數據,分別在濾波前和濾波后的時域和頻域波形。
4.1 基于AR功率譜對振動信號特征的提取
對傳感器采集到的數據以4 s為單位選取40個樣本,下面隨機選取200 km/h時車體中部橫向加速度傳感器采集到的每種工況各一個樣本,對其求功率譜。

圖2 采樣數據濾波結果
由功率譜可以看出,列車每種工況主要的譜峰對應的頻點是不同的。對同一種工況,求取部分樣本的功率譜,基于統計原則,找出出現頻率較高的譜峰對應的頻率點,考慮到每個樣本對某一主要頻點的定位會有較小的偏差,導致不會精確在一個點上,對于這種聚集性的頻點;通過篩選選出具有代表性的一個點。現在對每種工況最多取4個公共譜峰對應的頻點作為特征頻點,正常工況的頻點(單位:Hz,以下同)是:1.186、3.797、7.356、11.153。空簧失氣的頻點是:0.949、4.034、7.594、15.425。抗蛇行減震器失效的頻點是:2.136、7.831、11.628、15.425。橫向減震器失效的頻點是:1.661、4.983、8.543、11.865。橫向減震器失效+抗蛇行減震器失效的頻點是:1.187、7.831、11.39、14.95。空簧失氣+橫向減震器失效的頻點是:1.661、2.61、3.085、15.188。空簧失氣+抗蛇行減震器失效的頻點是:2.373、7.594、11.39、15.425。通過對比發現有的頻點會出現在不同的工況中,如頻點15.425在空簧失氣、抗蛇行減震器失效和空簧失氣+抗蛇行減震器失效三種工況中都有出現,去掉重復的頻點,我們就得到了這組數據中具有代表性的頻點組合,和對每種工況取這組頻點對應的功率值。由于數值的變化范圍很大不便于比較;所以壓縮數據范圍,對所得功率譜值取對數。對于這組數據,若只考慮區分四種單故障可得到15維特征向量,考慮多故障則可得到21維的特征向量。之前提到傳感器的位置不同或車體速度不同,對于同一工況得到的主頻率點會有差別,如還是在車體中部橫向的加速度傳感器,速度變為80 km/h時,正常工況的主頻點變為3.085、4.509、13.526、18.035。速度為200 km/h不變時,選擇車體后部橫向方向的加速度傳感器,則正常工況的主頻點為1.424、5.458、8.78、12.102。這導致不同的傳感器以及在不同速度下采集到的特征維數是不確定的,特征向量是動態變化的。

圖3 七種工況功率譜圖
4.2 PCA對特征向量降維及分類器設計
對于高鐵數據,仍然對200 km/h時,車體中部橫向加速度傳感器采集到的數據進行分析,將對四種單故障進行分類的15維特征經過PCA處理,若取累計貢獻率為98%,則特征降到9維,同樣對用于七種故障分類的21維特征進行PCA處理,特征也降到了9維,如圖4所示,去除了冗余的特征,避免了多余特征的干擾。

圖4 PCA貢獻率
為了驗證本文對故障信號所提特征的有效性,采用支持向量機(SVM)對特征數據進行分類識別。SVM是基于統計學習的VC維理論和結構風險最小化原則的學習機器,它在高維、小樣本、非線性數據空間下,具有很好的泛化能力[13]。基于上述數據的對于四種故障分類的實驗SVM輸入為9維特征向量,對應于運用AR功率譜及PCA對振動信號提取的特征向量,輸出為故障種類及分類準確率。實驗中,每種工況有40個樣本,對4種工況分類有160個樣本,對7種工況分類有280個樣本,隨機選取
其中50%的樣本作為訓練樣本,剩余50%作為測試樣本。
對上述特征向量進行SVM分類,整體分類準確率達到了100%。
由于平面作圖的限制,現只取前三維特征,作出分類效果圖,從圖5中可看出四種單故障已經可以很好的分開了。

圖5 四種故障分類效果圖
將對七種故障同樣經SVM分類,整體分類準確率達到96.43%。
同樣取前三維特征向量作分類效果圖如圖6所示,除抗蛇行減震器失效和空簧失氣+抗蛇行減震器失效兩種工況分離效果較差外,其他五種工況已經很好地分開了。

圖6 七種故障分類效果圖
4.3 仿真結果
下面統計了列車在120 km/h、160 km/h和200km/h時部分傳感器對列車七種工況的分類結果。采用加速度傳感器和位移傳感器,選取五個不同測點,即
(1)是車體中部橫向加速度傳感器;
(2)是車體后部橫向加速度傳感器;
(3)是車體前部橫向位移傳感器;
(4)是車體中部橫向位移傳感器;
(5)是車體后部橫向位移傳感器。表1—表3中記錄了特征向量經過PCA處理之前的維數以及處理后的維數,最后給出了每個傳感器的分類準確率。

表1 速度是120 km/h時的分類結果

表2 速度是160 km/h時的分類結果

表3 速度是200 km/h時的分類結果
通過上面三個表格可以看出,整體分類準確率基本都在90%以上,有的更高達100%,分類結果是比較好的。通過對多個傳感器的決策融合,故障診斷準確率會進一步提高。
高速列車在行駛中產生的振動信號是由多個振動源共同產生的,是多個具有特征頻率的信號和幾個其他頻率的噪聲信號的混合。由于不同故障對車體造成的影不同,導致所含特征信號的頻率和幅值有所不同,表現在功率譜上就是不同故障信號的功率譜譜峰位置和幅值不同。統計每種故障的多個樣本功率譜的譜峰位置,得到能代表該故障的幾個主要頻率點,將求得的每種故障的主要頻率點組成一個向量,將這頻率點對應的幅值在每個樣本功率譜中對應的幅值作為特征向量,再通過主成分分析降維處理,去除冗余的特征項,最后經過支持向量機分類,得到了滿意的識別結果,驗證了該方法的可行性。
[1]秦娜,金煒東,黃進.基于EEMD樣本熵的高速列車轉向架故障特征提取[J].西南交通大學學報,2014,49(1):27-32.
[2]劉林艷.基于小波分析的高速列車安全性態評估數據特征分析[D].成都:西南交通大學,2013.
[3]石晶晶.基于FRFT的高速列車安全性態評估數據特征分析[D].成都:西南交通大學,2013.
[4]王金福,李福才.機械故障診斷的信號處理方法:頻域分析[J].噪聲與振動控制,2013,33(1):173-180.
[5]黃麗湘,張衛華.機車車輛整車滾動振動試驗臺設計[J].
鐵道車輛,2007,45(1):5-9.
[6]梁勝杰,張志華,崔立林.基于PCA方法的機械噪聲數據處理[J].噪聲與振動控制,2010,30(3):118-122.
[7]張賢達.現代信號處理(第二版)[M].北京:清華大學出版社,2002.
[8]羅豐,段沛沛,吳順君.基于Burg算法的短序列譜估計研究[J].西安電子科技大學學報(自然科學版),2005,32 (5):724-728.
[9]曹蘭蘭,許小可,索繼東.AR模型仿真相關高斯序列的階數選擇[J].火力指揮與控制,2009,34(4):142-149.
[10]Jolliffe I.Principal component analysis[M].New York: Springer-Verlag,1986:10-28.
[11]范雪莉,馮海泓,原猛.基于互信息的主成分分析特征選擇算法[J].控制與決策,2013,(26):915-919.
[12]張衛華.機車車輛運行動態模擬研究[M].成都:西南交通大學出版社,2006.
[13]任宇飛.SVM模型改進的若干研究[D].南京:南京郵電大學,2013.
Bogie Fault SignalAnalysis of High-speed Trains Based onAR Power Spectrum
DUAN Wang-wang,JIN Wei-dong
(School of Electrical Engineering,Southwest Jiaotong University,Chengdu 610031,China)
The bogie faults and fault types of high-speed trains have an important impact on the safety of train operation.In order to diagnose the bogie fault efficiently,a novel method for feature extraction was proposed by combination of power spectrum with principal component analysis.First of all,the power spectrum evaluation was done using the sample data of the typical fault signals of the bogie,and an array including feature frequency points of a variety of faults was constructed.Then,the power spectrum amplitudes of these points were used to constitute a feature vector,and the redundant features were removed by principal component analysis.Finally,the fault type was identified by SVM.As an example,5 different test points were selected for the testing and satisfactory recognition results were obtained.The correct recognition rate was up to 90%,which verified the effectiveness of this method.
vibration and wave;fault diagnosis;high speed trains;signal analysis;bogie
TP206+.3;TN911.6
A
10.3969/j.issn.1006-1335.2015.01.013
1006-1355(2015)01-0051-06
2014-07-16
國家自然科學基金重點項目(61134002)
段旺旺(1989-),男,西南交通大學電氣學院,碩士研究生,主要研究方向模式識別、系統仿真。
金煒東(1959-),男,西南交通大學電氣學院,教授博導,主要研究方向模式識別、系統仿真。E-mail:1044211493@qq.com