蘇開華,邱 斌,吳 磊
(1.中山火炬職業技術學院裝備制造學院,廣東 中山 528436;2.江西理工大學電氣工程與自動化學院,江西 贛州 341000)
旋轉機械廣泛應用于機械傳動領域,如鐵路車軸、航空發動機、汽車傳動系統等[1?2]。旋轉機械的工作環境往往很惡劣,因此不可避免的會同時發生各種故障[3]。因此故障診斷技術需要解決旋轉機械發生機械故障時所涉及多種故障類型,該問題就稱之為復合故障診斷[4]。
復合故障診斷方法本質上屬于一種多標簽分類問題,針對該問題,貝葉斯規則訓練的成對概率多標簽分類方法在指示被觀測機器的候選故障標簽的發生概率分布方面表現出良好的性能[5]。但是基于概率指標的方法需要代表性的訓練樣本,決策閾值依賴于唯一的驗證數據集。此外秩支持向量機采用最大裕度策略對一組線性分類器進行優化,目的是最小化經驗排序損失,以核技巧處理非線性情況[6]。反向傳播多標簽學習是從反向用一個新的函數替換錯誤函數來捕獲多標簽學習的特征[7]。多標簽徑向基函數通過對來自每個可能類的實例進行k?均值聚類[8]。
總之,這些算法自適應方法的主要目的是使算法與觀測數據相適應。然而,選擇一個最優的算法來擬合觀測數據是困難的。此外,訓練和測試的計算復雜性也不容忽視。
相對于上述方法,極限學習機(Extreme Learning Machine,ELM)由于具有更好的可伸縮性,并且能夠在更快的學習速度條件下,具有更好的自適應能力而得到了廣泛的應用。考慮到復合故障診斷屬于典型的多輸入多輸出問題,因而不能將ELM直接應用于解決復合故障診斷問題[9]。文獻[10]表明復合故障實例可以作為所有工作池中的一個獨立候選對象。然而,由于特定的學習機執行模式無法區分復合故障,所以所有復合故障的實例都必須記錄在案。這意味著需要一個非常全面的故障數據樣本,才能保證較好的診斷效果。另外,相應的計算復雜度也不容忽視。
為解決上述問題,提出了一種基于集成極限學習機(Ensem?ble Extreme Learning Machine,EELM)框架的旋轉機械復合故障診斷方法,并且通過實驗驗證證明了提出方法的有效性。
EELM的結構,如圖1所示。該方法由兩個異構的ELM網絡組成,其中一個ELM用于無監督聚類,另一個則用于多輸出決策來指示潛在的輸出標簽。提出的EELM首先用聚類算法表示目標數據,然后使用每個目標之間的高斯樣式激活函數作為后端分類器的輸入[11]。該算法可以放入一個統一的框架中,即都包括兩個階段:隨機特征映射和輸出權重求解。

拉普拉斯特征映射算法要求丟棄第一特征向量,因為它始終是常數向量。因此,在提出的無監督ELM訓練方法中,也要丟棄第一特征向量。
設γ1,γ2,…,γn0+1是等式(5)的(n0+1)個最小特征值,并保持γ1≤γ2,…,≤γn0+1。設向量v1,v2,…,vn0+1是對應的特征向量。輸出矩陣β可以用一系列歸一化特征向量表示。

其中,第一個ELM的輸出E表示快速k均值聚類的輸入。

心將移動或收斂到聚類平均值的均值。或者,旨在應用E的特征值的維數來確定聚類數。給定輸入矩陣,Em是i個聚類的集合,以最小化索引J(,;P)。讓eci收斂到聚類中心ei:

聚類的過程等效于在等式(14)表示的快速階段將聚類內平方和(Within Cluster Sum of Squares,WCSS)最小化,并且可以用等式(15)表示慢速階段:

在第一個ELM中進行無監督聚類后,將矩陣?j(?)視為第二個ELM的輸入,以進行多標簽分類。
從學習目標的角度來看,二進制分類器旨在回答給定情況為“真”或“假”,而多級分類器則用于解決候選標簽集中的單標簽選擇問題。如圖2所示。ELM多分類器具有多個輸出節點。這意味著只有一個標簽為“真”,其余標簽應指定為“假”。例如,ELM分

圖2 用于多標簽分類的EELMFig.2 EELM for Multi Label Classification

其中,i=1,2,…,m,以及j=1,2,…,N。
從等式(28)~式(29),LD的維數與隱藏節點數的信息無關。
基于EELM的復合故障診斷框架,如圖3所示。它可以分為三個部分。

圖3 基于EELM的復合故障診斷框架Fig.3 Composite Fault Diagnosis Framework Based on EELM
(1)應用傳感器例如,接近探針、速度傳感器或加速度計以將實時振動信號轉換成電壓信號。經過模數轉換過程后,得到的原始振動信號通常是非平穩的、非線性的,并且通常與大量復合背景噪聲混合。
(2)在特征提取子模塊、選擇和信號表示部分中,直接引入文獻[15?16]中提出的基于粒子群優化的變分模態分解(PSO?VMD),將原始振動信號分解為一系列固有模態。在特征選擇階段,實施希爾伯特變換以計算每種模式的平方包絡。此外,為了在每個固有模式下定位故障信號的局部瞬變,計算光譜峰度以評估分解窄帶中的激勵。在信號表示階段,選擇光譜峰度最大的前三個分量,將它們組合并重建一個新信號來替代原始振動。為了提高后端分類器的計算效率,常用的方法是對輸入數據進行降維處理,該過程涉及特征選擇。使用特征選擇,可以大大減小維數,從而提高后端分類器的計算效率。選擇了十組時域指標,即均值、標準差、峰度、峰值、均方根、清除率、波峰因數、形狀因數、偏度和沖動因數和五個頻域統計特征,即均值、相關性、頻譜滾降、頻譜質心、使用快速傅里葉變換的頻譜通量作為后端EELM的輸入狀態空間。十組時域指標可以反映振動信號的振幅和振動信息,而五組頻域信號表示當前轉速下的振動頻率信息。
(3)關于旋轉機械的復合故障診斷,第一個ELM網絡建立輸入目標的關聯矩陣,通過計算拉普拉斯算子確定特征值向量,并生成中間矩陣,即第一個ELM 的最終輸出矩陣E。這樣,快速k均值算法將最終的輸出矩陣E聚類到嵌入式空間中,生成高斯激活函數。一旦已經訓練了第一個ELM網絡,就無需在測試階段對其進行優化,并且可以將其應用于原始輸入空間中的任何顯示數據。這種學習思想為處理新模式提供了一種直接方法,而無需反復重新計算特征向量。換句話說,可以通過無監督學習的方式生成輸入變量的特征向量。在多標簽分類的階段,第二個具有多個輸出節點的ELM網絡被直接用于預測目標ti,其訓練模式與文獻[17]中開發的多類學習算法相同。由于引入內核K(u,v)進行輸出計算,因此無需設置特征空間的L的維數,即隱藏節點個數。
介紹了四種比較完善的多標簽分類器與提出的方法進行比較,即ML?RBF[18],Rank?SVM[19],ELMs?BR[20],BP?MLL[21]。提及的所有方法均使用MATLAB R2018a 實現,并在具有Intel Core i7?930 CPU @ 2.8 GHz 和16 GB RAM 的計算機上執行。ML?RBF,BP?MLL和Rank?SVM的實現可以在MATLAB ∕MLC?tool?box中找到。
引入了兩個數據庫:Yeast和Image,以進行理論驗證。這些數據集包括多樣化的多標簽分類案例,涵蓋了兩個不同的領域:基因和場景。表1說明了所選數據庫的特征。其中,n等于數據點的數量,d表示維數,m表示測試標簽數。此外,引入了文獻[16]中的兩個指標:標簽基數(LC)和標簽密度(LD)來評估目標的特征,相關表達式如下:


表1 數據集統計摘要Tab.1 Statistical Summary of Data Sets
為了與其他可用的多標簽分類網絡進行比較來驗證所提出的EELM的性能,引入了文獻[17]中的六個度量指標,即漢明損失,單一誤差,排名損失,覆蓋距離,訓練時間和平均精度)來量化多標簽分類的能力。

(4)排名損失:評估實例的逆序標簽對的平均比例。


表2 相關算法的參數設置Tab.2 Parameter Setting of Related Algorithms
表3比較了6種相關的多標簽分類算法在Yeast數據上的性能。符號“↓”表示度量的“越小越好”,而“↑”表示平均精度的“越大越好”。具體而言,ML?RBF的漢明損失為最佳評估0.2,而BP?MLL 在排名損失(0.174)、覆蓋距離(6.472)和平均精度(0.753)方面均達到最佳。EELMs在評估訓練時間(0.26 s)方面表現最佳。盡管在其他方面并不是最佳性能,但EELMs在其余六個指標上均獲得了次優的結果,這表明該方法可以實現總體最優結果。

表3 不同算法在Yeast數據集上的性能比較Tab.3 Performance Comparison of Different Algorithms on Yeast Dataset
相比之下,ELMs?BR 在單一誤差(0.025)方面表現最佳,但在漢明損失、排名損失、覆蓋距離和平均精度方面卻表現最差。這主要是由于ELMs?BR 將每個實例劃分為多個單獨的子標簽集,而不考慮各個子標簽之間的相關性。關于訓練階段的耗時,Rank?SVM 和BP?MLL 需要相對較長的時間來完成參數的訓練。
表4說明了在Image數據集上的學習能力。與Yeast數據的結果不同,具體而言,BP?MLL方法在以下兩個方面達到了最佳效果:漢明損失(0.143)和排名損失(0.226)。Rank?SVM 在覆蓋距離(0.724)和平均精度(0.814)方面表現最佳。EELM 的訓練時間最短,為0.16s,單一誤差最小,為0.158,其余四個測度的訓練結果均為次優。根據表4,可以發現所提出的EELM可以在最短的時間內完成網絡參數的配置。綜合來看,EELM 算法整體是最優的。

表4 不同算法在Image數據集上的性能Tab.4 Performance of Different Algorithms on Image Dataset
實驗是在一個試驗裝置上進行的,該裝置包括一個穩壓器,一個原動機,一個多級齒輪箱和可變負載。考慮一個由N個運動的剛性齒輪和軸承組成其運動鏈的兩級齒輪箱。負載和軸的轉速可在兩個級別上調節。在第一級,當輸入轉速為1400rpm時,兩個嚙合齒輪組分別產生1184rpm 和840rpm。NI cDAQ?9174∕9234傳感器用于以10240Hz的采樣頻率記錄振動信號。本研究將采樣持續時間設置為兩秒,這意味著每個采樣都包含40960個數據點,即2個加速度計。總共有1800個樣本數據集,包括一個正常案例和八種單故障案例,每個案例包含200個樣本,另外還有1400個復合故障樣本,包括7組復合故障數據集,每個數據集200個樣本。
八種單故障場景,如表5所示。工作涉及的六種類型的單故障,如圖4 所示。為了清晰地描述單故障和復合故障之間的關系,將“故障”標記為“1”,將“正常”標記為“?1”,并列出了復合故障實例的表示形式。帶有幾個單故障標簽的復合故障的多標簽模式,如表6所示。復合故障在這里稱為“CF”。輸入特征屬性D的數量等于9。

表6 具有單故障的復合故障表示Tab.6 Composite Fault Representation with Single Fault

圖4 單故障類型Fig.4 Single Fault Type

表5 用下標“SF”表示的單故障樣本Tab.5 Single Fault Samples Represented by Subscript "SF"
其中,齒裂故障表示的齒輪發生了脫塊等現象,松動指的是齒輪箱原件安裝存在松動等現象,齒輪裂紋即齒輪表面存在裂紋等,軸承滾子損壞指的是軸承滾子表面存在脫塊裂紋等現象,軸承外圈磨損指的是軸承的外圈表面存在不正常的磨損,缺齒指的是齒輪中有某一齒由于故障完全缺失,機械失調指的是旋轉機械原件不同軸導致的非正常損傷,軸承內圈故障指的是軸承的內圈存在非正常損傷。
由于所獲得的振動數據具有較高的維數,即在EELM中產生更多的隱藏層節點,并導致學習階段的計算負荷更高,因此利用了文獻[18?19]中提出的現有特征提取方法:用于信號分解、原始振動數據重組的PSO?VMD,然后使用時域和頻域統計信息對新提取的信號進行降維。復合故障標簽集的統計量,如表7所示。

表7 復合故障數據的統計量Tab.7 Statistics of Composite Fault Data
第一個ELM網絡建立輸入目標的關聯矩陣,并通過計算拉普拉斯算子搜索特征值向量。然后,快速k均值將數據聚類在嵌入式空間中。一旦訓練了第一個ELM網絡,就無需在測試階段對其進行優化,并且可以將其應用于原始輸入空間中的任何數據。該方法提供了一種處理新模式的簡單方法,而無需重復重新計算特征向量。
在多標簽分類的階段,將第二個具有多輸出的ELM網絡直接用于預測目標ti,并且訓練模式與[20]中的多類學習算法相同。在輸出計算階段使用內核K(u,v),無需設置特征空間的L的隱藏節點數。該過程中的兩個關鍵參數:第一個ELM的隱層神經元數n和聚類數k需要事先優化。首先給出了在隱藏節點范圍內的六種度量的實驗結果,并探討了隱藏層節點與度量組之間的相關性。其次,設置了六種不同分組設置的度量進行聚類驗證。
在不同隱藏層節點的條件下六個度量的曲線,如圖5所示。隱藏層節點的數量以20 為間隔從20 增加到400。如圖5(a)所示,漢明損失的最大值為0.382,最小值為0.372,漢明損失降低并穩定在n=100。與漢明損失相似,圖5(b)中的排名損失下降并且在點n=100處也變得穩定。排名損失的最大值是5.52,最小值是4.71。如圖5(c)所示,當隱藏層節點數為100時,單一誤差的最大值為0.576,最小值為0.02。圖5(d)表示覆蓋距離的變化,其隨著隱藏層節點的增加而減小,并且在n=100 時變得穩定。如圖5(e)所示,平均精度隨著隱藏節點的增加而增加,但是當隱藏層節點的數量為100時,該值幾乎是穩定的。根據圖5(f)所示訓練時間的實驗結果,訓練時間也是隨著隱藏層節點數量增加。

圖5 具有不同數量的隱藏層節點的曲線Fig.5 Curve with Different Number of Hidden Layer Nodes
聚類的具有不同分組設置的六個度量的曲線,如圖6所示。

圖6 具有不同聚類數的六個度量的曲線Fig.6 Curves of Six Measures with Different Cluster Numbers
由于沒有直接的數學推導過程來證明應該選擇幾組進行聚類是最好的。這里應用網格搜索方法對聚類的分組設置進行了優化,該分組的數量以1為間隔,從2連續變化到30。基于已確定的隱藏層節點的優化,可以最終選擇最佳分組設置。如圖6(a)所示,隨著聚類組的增加,漢明損失在(0.29~0.36)之間波動。最小漢明損失出現在k=12的點上。實際上,當聚類的組數為12時,不難發現性能相對較好:盡管在覆蓋距離是屬于次優,但它在漢明損失,單一誤差,覆蓋距離,排名損失和平均精度均是最優的。綜合來看,該點的診斷效果最佳。復合故障數據集上六種方法的多標簽分類能力,如圖8所示。EELM的性能相對較好:分別是漢明損失(0.26),排名損失(0.47),單一誤差(0.166),覆蓋距離(5.661)和平均精度(0.855)。EELM在漢明損失(0.26)和訓練時間(0.026s)方面表現最佳。而BP?MLL 在覆蓋距離方面達到最佳(4.136),在排名損失方面(0.249)和平均精度(0.866)方面達到最佳。Rank?SVM在單一誤差方面達到最佳(0.012)。

表8 復合故障數據的性能比較(平均值)Tab.8 Performance Comparison of Composite Fault Data(Average Value)
整體上,與其他算法相比,EELM的性能更好。需要注意的是,在復合故障分類上,在漢明損失和訓練時間方面,ELMs?BR優于ML?RBF,BP?MLL和Rank?SVM。此外,BP?MLL在訓練階段要花費大量時間,為56.45s。
與文獻[21]中的拉普拉斯特征映射(LE)和文獻[20]中的譜聚類(SC)相似,本研究還基于關聯矩陣的計算進行了改進。但是,在EELM 中獲得的特征向量不用于數據表示,而是用于網絡的參數,即輸出權重。在第一個ELM中,請注意,一旦完成EELM的參數,就可以將其直接用于計算原始輸入空間中任何顯示的數據的特征向量。這樣,EELM 提供了一種直接的方式來處理新模式,而無需像LE和SC中那樣重新計算特征向量。
這里的方法擴展了ELM的應用,并將多類ELM訓練思想遷移到多標簽應用中。不同之處在于,所提出的EELM應用多個輸出節點,而多類ELM 具有單個輸出節點。由于將“RBF”中G(a,b,x)作為隱藏層輸出函數,因此無需優化隱藏層節點的數量。
為了提升傳統分類器在進行復合故障診斷時的診斷性能以及計算效率,提出了一種基于集成極限學習機框架的旋轉機械復合故障診斷方法。通過兩個數據集與復合故障診斷實驗得出如下結論:所提出的EELM在分類綜合性能上相較于其他方法更有優勢,能夠有效的實現旋轉機械復合故障診斷以及多標簽分類問題。另外,三個實驗證明了基于EELM的故障診斷框架需要較少的隱藏層節點,并且可以在相對較短的時間內完成參數設置,降低的計算復雜度,從而極大的降低訓練時間。