李城梁, 馬 蕓, 張 銳, 魏 偉
(西安導航技術研究所 西安,710000)
?
基于半監督譜核聚類的轉子系統故障診斷*
李城梁, 馬 蕓, 張 銳, 魏 偉
(西安導航技術研究所 西安,710000)
針對機械系統故障診斷中對先驗知識利用不足和在高維特征空間中診斷難的問題,提出了一種基于成對約束和通過約束準則構造核函數的半監督譜核聚類方法。首先,在訓練集中利用先驗知識建立約束點對,即屬于同一聚類的must-link點對和不屬于同一聚類的cannot-link點對;其次,通過樣本連接圖的結構信息和約束點對信息設計核函數,計算出投影矩陣;最后,在投影空間中使用k-means算法聚類。測試集的每個樣本點找到在對應訓練集中k個近鄰樣本的投影值,計算局部投影矩陣,從而可以在線計算出每個新來樣本的投影值。實驗表明,該算法較相關比對算法聚類準確率更高,可以滿足轉子系統故障診斷的實際需要。
成對約束; 半監督聚類; 故障診斷; 轉子系統
隨著人工智能和計算機技術的飛速發展,基于智能方法的機械故障診斷技術成為研究熱點,諸多智能方法已經被應用到機械故障診斷領域,例如自組織特征映射(SOM)[1]、支持向量機[2]以及聚類算法[3-4]等。但這些方法往往存在對先驗知識利用不足以及在高維特征空間中診斷性能下降的缺陷。
為了克服這些問題,已有學者開展了相關的研究。Jiang等[5]利用訓練集全部樣本數據的標簽信息去引導Laplacian映射算法進行樣本數據的降維,提出了監督型流形學習的機械故障診斷方法。張育林等[6]采用自適應局部線性嵌入對原始樣本數據進行非線性降維, 應用遞歸調用規范切對低維空間數據進行聚類,提出了一種自適應局部線性嵌入與譜聚類融合的故障診斷方法。基于半監督的聚類方法在故障診斷領域中有相關應用,并取得優越的性能。畢錦煙等[7]將基于半監督學習的模糊核聚類方法用于齒輪箱離群故障的檢測。徐超等[8]提出一種將改進半監督模糊C-均值聚類算法應用于發動機磨損故障診斷。在無監督學習中通過圖Laplacian的特征值和特征向量建立起來的核函數矩陣稱之為譜核學習[9]。近年來,譜核學習方法在圖像識別領域[10]和故障診斷領域[11]得到應用。
筆者提出了一種基于成對約束和通過約束準則構造核函數的半監督譜核聚類方法(semi-supervised spectrum kernel clustering,簡稱S3KC)。在訓練集中利用先驗知識建立約束點對,通過樣本連接圖的結構信息和約束點對信息設計核函數,計算出投影矩陣,最后在投影空間中使用k-means算法聚類。測試集的每個樣本點找到在對應訓練集中k個近鄰樣本的投影值,計算局部投影矩陣,從而可以在線計算出每個新來樣本的投影值。用美國凱斯西儲大學電氣工程實驗室的滾動軸承實驗數據對算法與相關比對算法進行了聚類精度比較實驗,結果表明該方法的優越性,在實測數據上進行的實驗也證明該方法可以滿足轉子系統故障診斷的實際需要。

(1)


(2)
傳統的譜聚類方法使用最小的前k個(聚類數量)特征值對應的特征向量去揭示數據的聚類結構,這證明了譜聚類的主要特性:局部近鄰信息被最優的保存,近距離的數據點應該被分到同一聚類。

(3)
(4)

筆者將特征相似性和成對約束信息結合提出一種新的譜核方法以提高聚類精度。

(5)

(6)

(7)
問題轉化為優化式(7)
(8)

(9)

去除c,優化問題式(8)最終轉化為標準的二次規劃問題
(10)



1) 構建稀疏對稱的相似矩陣W=(wij);


測試階段具體步驟包括:


4) 對測試集應用k-means聚類算法在投影空間進行聚類。
由圖1可知,應用本研究方法對轉子系統進行故障診斷。首先,從傳感器采集轉子系統振動信號(振動加速度或位移信號), 將歷史數據作為訓練數據加窗分段并提取特征,構成訓練樣本集合;然后,將訓練集和選取的約束點對輸入該聚類算法中,可以得出訓練樣本的投影結果和聚類結果。在測試階段,新進入樣本找出訓練集中k近鄰點集,計算出局部映射矩陣和新樣本的映射值,最后用k均值聚類算法進行聚類得出最終的故障診斷結果。

圖1 基于半監督譜核聚類算法的轉子系統故障診斷模型Fig.1 The flow chart of fault diagnosis of rotor system base on proposed method
4.1 性能分析
應用對象選擇來自美國凱斯西儲大學電氣工程實驗室的滾動軸承實驗數據[12],滾動軸承型號為6203-2RS JEM SKF,采樣頻率為12 kHz。選擇內環、外環、滾動體的損傷直徑為0.533 4 mm的故障狀態以及正常狀態下的振動數據,每組數據通過建立樣本的特征空間。首先通過滑動時間窗來計算得到每一樣本的特征向量,本實驗中,滑動時間窗中包含2 048個采樣點,滑動步長為半個窗長。通過加窗后每組信號得到的樣本數為64,4組信號共計樣本數為256。筆者用15種無量綱特征來構建特征空間,特征包括均值、中位數、方差、偏斜度、最小值、求和、標準誤差、標準差、峭度、值域、最大值、奇異值熵、EMD能量熵、頻域最大值和均值的比值以及頻域的均方誤差。筆者用方差取1的高斯核函數來計算特征空間中的樣本點之間的權值距離。圖2分別為截取1個滑動窗內4種正常狀態下的信號圖,在投影空間中將原始空間降到4維。

圖2 截取1個Outer fault滑動窗內的信號圖Fig.2 The segmention of signal in one slide window
投影結果和聚類精度分別用樣本距離矩陣灰度圖和聚類誤差率式(11)來表示
(11)

為了可以將投影得到的無量綱的4維數據結果可視化,筆者用3幅三維可視化圖對投影的結果進行顯示,圖3所示為約束點數為16情況下的投影結果。 圖3(a)為在第1,2,3主分量上的投影圖, 圖3(b)為在第1,2,4主分量上的投影圖,圖3(c)為在第2,3,4主分量上的投影圖。從投影結果可以得知,不同類之間距離較遠,同類之間距離較近。將本方法和其他典型的聚類方法如半監督核k均值算法(SSKK)、譜學習(SL)、正則化圖割算法(Ncuts),對比在設置集合M和C約束點對個數變化的情況下的聚類精度。圖4(a)
為原始特征空間樣本距離矩陣灰度圖,其中像素點顏色越深,表示對應的樣本點對距離越近。可以看出,在原始的特征空間中,內圈、外圈、滾動體這3種狀態樣本不同類之間距離近,產生混疊。圖4(b)是應用本研究方法,集合M和C中約束點對數分別在20時的投影空間樣本距離矩陣灰度圖,可以看出4種狀態樣本不同類之間距離遠,同類之間距離近。

圖3 約束點對數為16情況下數據的投影結果Fig.3 The projection in the case which the number of constraint pairs is 16

圖4 距離矩陣灰度圖Fig.4 The grayscale of the distance matrix
由圖5可以得出,筆者提出的方法的聚類誤差率最低。譜聚類方法和本研究方法優于半監督核k均值算法,表明約束點對的應用在這兩種算法上是有效的,正則化圖割算法性能較半監督核k均值算法差。 隨著約束點對數的增加,SSKK, SL和S3KC聚類誤差率都在下降,但S3KC下降最快,并在約束點對數為總樣本點數的12.5%(16對)時聚類誤差為0,再增加約束點對數時聚類誤差保持0不變,充分說明該方法在約束對的信息傳播性能上較前3種方法具有優勢。

圖5 不同數量約束點對時的聚類誤差率Fig.5 Clustering error in different number of constraint pairs
實驗中用到的計算機的微處理器配置為2.14 GHz Inter(R) Core(TM)2 Duo CPU, 2 GB RAM,算法S3KC, SSKK, SL 和Ncuts的運算時間分別為15,18,17和21 s。由于本算法是用二次規劃進行的優化求解,在優化過程中僅用了0.2 s,所以該算法在計算效率上同樣具有優勢。
4.2 兩類突發性故障診斷實驗
通過轉子實驗臺驅動特殊加工過的扇葉來模擬航空發動機扇葉突發性斷裂故障和扇葉異物吸附實驗。實驗之前,通過調整扇葉中的1片葉片的固定松緊程度,使其能在一定的轉速下通過離心力作用將其甩出,從而模擬航空發動機扇葉突發性斷裂的故障。在扇葉轉動過程中,用帶有磁性的金屬塊投向葉片,金屬片通過磁力吸附在轉動的葉片上可以模擬航空發動機扇葉突發性吸附故障。筆者所用的實驗數據是該實驗臺在400,600r/min兩種轉速下采集到的突發性斷裂數據和突發性吸附數據,共6組數據。用電渦流傳感器采集滾軸垂直方向上的振動位移信號,采樣頻率設定為512 Hz,采樣時間為20 s。圖6為兩種轉速下扇葉吸入故障和扇葉斷裂故障信號圖。為了能夠說明本研究方法故障診斷的有效性,所用實驗數據只是截取故障發生后的信號。原始樣本特征空間同樣由上組實驗的15維特征構成。每一種轉速下每一類分別有47個訓練樣本和47個測試樣本,每一組訓練集中集合M和C中約束點對數分別為10。

圖6 兩種轉速下扇葉吸入故障和扇葉斷裂故障信號圖Fig.6 The signal of fan inhalation and fan crack in two speed
如圖7(a),(b)分別表示兩種轉速下訓練集樣本在原始特征空間中的距離矩陣灰度圖, 可以看出,在原始特征空間中扇葉斷裂故障和扇葉吸附故障樣本產生嚴重混疊。

圖7 不同轉速下兩類故障訓練集樣本在原始特征空間中的距離矩陣灰度圖Fig.7 The grayscale of the distance matrix of two class training data set in different speed
從表1的實驗結果可以看出,扇葉斷裂故障樣本和扇葉吸附故障樣本在原始特征空間中產生混疊的情況下,診斷正確率均可以達到90%以上,表明該方法在故障診斷的應用中是有效的。
表1 本研究方法得出的突發故障診斷結果
Tab.1 Fault diagnosis results obtained in proposed method

測試集樣本總數診斷出斷裂故障數診斷出吸附故障數診斷準確率400r/min下的兩類故障9438560.904600r/min下的兩類故障9443510.957
在轉子系統故障診斷的實際應用中容易得到成對約束的先驗知識,充分有效地利用這些先驗知識可以提高聚類的性能。筆者將譜核學習方法引入到轉子系統故障診斷中,提出了一種基于成對約束和通過約束準則構造核函數的半監督譜核聚類方法。在訓練集中利用先驗知識建立約束點對,通過樣本連接圖的結構信息和約束點對信息設計核函數,計算出投影矩陣,然后在投影空間中進行聚類。測試集的每個樣本點找到在對應訓練集中k個近鄰樣本的投影值,計算局部投影矩陣,從而可以在線計算出每個新來樣本的投影值。用美國凱斯西儲大學電氣工程實驗室的滾動軸承試驗數據對算法與相關比對算法進行了聚類精度比較實驗,結果表明該方法的優越性。在實測數據上進行的實驗也證明該方法可以滿足轉子系統故障診斷的實際需要。
[1] Kohonen T,Self-organization and associative memory[M]. Berlin: Springer,1988:95-127.
[2] Yuan Shengfa,Chu Fulei. Fault diagnostics based on particle swarm optimisation and support vector machines[J]. Mechanical Systems and Signal Processing, 2007, 21(4):1787-1798.
[3] 崔寶珍,王澤兵,潘宏俠. 小波分析-模糊聚類法用于滾動軸承故障診斷[J]. 振動、測試與診斷, 2008, 28(2): 151-154.
Cui Baozhen, Wang Zebing, Pan Hongxia. Application of wavelet analysis-cluster fuzzy to fault diagnosis of roller bearings[J]. Journal of Vibration, Measurement & Diagnosis, 2008, 28(2): 151-154.(in Chinese)
[4] 周云龍, 王鎖斌, 趙鵬. 基于改進k-均值聚類算法的風機振動分析[J]. 振動、測試與診斷,2012,32(3):437-440.
Zhou Yunlong, Wang Suobin, Zhao Peng. Fan fault analysis based on time domain features and improved k-means clustering algorithm[J]. Journal of Vibration, Measurement & Diagnosis, 2012,32(3):437-440.(in Chinese)
[5] Jiang Quansheng, Jia Minping, Hu Jianzhong, et al. Machinery fault diagnosis using supervised manifold learning[J]. Mechanical Systems and Signal Processing,2009,23: 2301-2311.
[6] 張育林,莊健. 一種自適應局部線性嵌入與譜聚類融合的故障診斷方法[J]. 西安交通大學學報, 2010, 44(1): 77-82.
Zhang Yulin, Zhuang Jian. Fusion of adaptive local linear embedding and spectral clustering algorithm with
application to fault diagnosis[J]. Journal of Xi′an Jiaotong University, 2010, 44(1): 77-82.(in Chinese).
[7] 畢錦煙,李巍華. 基于半監督模糊核聚類的齒輪箱離群檢測方法[J]. 機械工程學報,2009,45(10): 48-52.
Bi Jinyan, Li Weihua. Semi-supervised kernel-based fuzzy clustering for gear outlier detection[J]. Journal of Mechanical Engineering, 2009,45(10): 48-52.(in Chinese)
[8] 徐超,張培林,任國全,等. 基于改進半監督模糊C-均值聚類的發動機磨損故障診斷[J]. 機械工程學報, 2011,47(17): 55-59.
Xu Chao, Zhang Peilin, Ren Guoquan, et al. Engine wear fault diagnosis based on improved semi-supervised Fuzzy C-means clustering[J]. Journal of Mechanical Enginineering, 2011,47(17): 55-59.(in Chinese)
[9] Zhang Tong, Ando R. Analysis of spectral kernel design based semi-supervised learning. [C]∥ Neural Information Processing Conference.[S.l.]:Springer,2006.
[10]Li Zhenguo,Liu Jianzhuang,Tang Xiaoou. Constrained clustering via spectral regularization. [C]∥IEEE Conference on Computer Vision and Pattern Recognition.[S.l.]:IEEE, 2009.
[11]李志農,王心怡,張新廣, 等. 基于全矢譜核函數主元分析的旋轉機械故障診斷方法研究[J]. 振動與沖擊, 2008,27(7): 55-58.
Li Zhongnong, Wang Xinyi, Zhang Xinguang, et al. Fault diagnosis method for rotating machinery based on full vector spectrum and kernel principle component analysis[J]. Journal of Vibration and Shock, 2008,27(7): 55-58.(in Chinese)
[12]The Case Western Reserve University Bearing Data Center. Bearing data center fault test data[EB/OL]. [2011-01-01]. http:∥www.eecs.cwru.edu/laboratory/ bearing/.

10.16450/j.cnki.issn.1004-6801.2016.03.025
*國家自然科學基金資助項目(51075330, 50975231, 61003137, 61202185)
2015-09-10;
2015-12-10
TP391.4; TH17; TP18
李城梁,男,1987年2月生,博士生。主要研究方向為故障診斷、模式識別。曾發表?Semi-supervised adaptive parzen gentleboost algorithm for fault diagnosis?(?IEEE ICPR?2012)等論文。
E-mail:licous@mail.nwpu.edu.cn