劉 鑫 ,任海莉
(太原科技大學電子信息工程學院,太原 030024)
滾動軸承是旋轉機械中最重要的部件,也是一種易損件[1,2]。因此,為了減少部件損壞或設備意外停機帶來的經濟損失,軸承工作狀態的識別變得越來越重要。傳統的專家診斷方法不適用于目前的多傳感監測、大數據量、高集成度的智能診斷條件。智能診斷能夠有效分析海量數據中的關聯特征,自動提供客觀、可靠的診斷結果[3-4]。
傳統的故障診斷方法為淺層網絡結構,若模型輸入特征表示不足,對診斷結果產生較大影響,人工提取特征造成計算復雜度增加以及特征間冗余信息過多的問題。深度學習是人工智能的一個巨大突破,它擺脫了對人工特征提取的依賴,可以自動從原始數據中學習基本特征。自動編碼器[5]是一種無監督的深度學習算法,它可以從輸入數據中自動提取數據的特征,擺脫了對大量標簽的依賴,降低了特征提取的復雜性,提高了分類的準確性。郭亮等[6]采用稀疏自動編碼器對輸入數據進行特征學習,并采用SOFTMAX分類器實現故障分類,驗證了該方法對故障的識別能力。敦泊森等[7]采用稀疏自動編碼器與SVM結合的滾動軸承故障診斷方法,實現了智能、準確分類。稀疏自動編碼器只是簡單地對輸入數據進行重構,學習的特征不具有很好的泛化性能。Vincent P等[8]提出一種堆疊降噪自動編碼器,該算法在輸入數據中加入損傷噪聲,通過從損壞的數據中重構出原始數據,學習到更加具有魯棒性的特征。趙春華等[9]采用堆疊降噪自動編碼器的深度學習方法提取故障特征,并通過WOA-SVM進行故障識別,最后獲得較好的故障識別。Shao Haidong等[10]提出一種基于極限學習機的深度小波自動編碼器的滾動軸承智能故障診斷方法,使用極限學習機進行故障診斷,與支持向量機以及SOFTMAX分類器相比,極限學習機分類效果更優。
由于極限學習機(Extreme Learning Machine ,ELM)[11]是基于經驗風險最小化的原則,因此只考慮了經驗風險而未考慮結構風險,容易出現過擬合,并且當ELM的隱含層數目過多時,也容易出現過擬合現象,從而會導致ELM的泛化性能降低。正則化通常讓權值盡可能的小,構造一個所有參數值比較小的模型,一般參數值小的模型結構簡單,能適應不同的數據集,在一定程度上避免了過擬合的問題。
針對上述問題,本文提出一種基于正則化極限學習機在降噪自動編碼器中實現滾動軸承故障診斷的方法。首先將振動信號進行快速傅里葉變換得出頻域系數作為高維特征數據集,然后將該特征集輸入到三層降噪自動編碼器中進行降維以及特征提取,最后將提取的特征輸入到正則化極限學習中進行故障診斷。針對RELM中仍然存在正則化參數的選擇困難的問題,本文采用QPSO優化算法對RELM參數進行尋優,實驗結果表明,提出的故障診斷方法具有良好的魯棒性和泛化性,能夠獲得更準確的診斷結果。
DAE[12]是一種接收損壞的數據點作為輸入,并經過訓練來預測原始的未損壞的數據點。傳統的自動編碼器的判斷標準是簡單地將輸入復制到輸出,但是,這幾乎不能提取有用的特征。DAE是一種正則化的自編碼器,它通過減少測試誤差、增加訓練誤差來使模型學習有意義的特征。
DAE的訓練過程如下:
(1)原始輸入通過添加一些概率為v(噪聲)和qD分布的隨機噪聲構成含噪聲的輸入信號:
(1)

(2)
式中,fθ為編碼網絡的激活函數,gθ′為解碼網絡的激活函數,θ和θ′分別為編碼與解碼的權值矩陣W和偏置向量b的參數集。
(3)通過梯度下降算法優化下面的損失函數:

(3)

降噪自動編碼器的結構示意圖如圖1所示。

圖1 降噪自動編碼器結構圖
將多個DAE模型疊加成具有N個隱含層的堆疊降噪自動編碼器(SDAE)[13],對于給定的振動信號輸入向量X,輸入節點數為維數M,將第二層隱含層作為第二個DAE,重構前一層數據。同樣,SDAE中的下一層隱含層由前一層初始化,因此這個過程是按照順序進行的,直到第n個DAE被訓練完畢。
ELM與傳統的分類算法相比具有很大的優勢,但是ELM也存在不足。ELM是通過廣義Moore-Penrose逆矩陣來求解輸出的權值矩陣,當隱含層的節點數目過多時容易出現過擬合的現象,就會降低ELM的泛化性能。并且該網絡模型是通過最小二乘損失函數構建的,因此只考慮了經驗風險最小化,未加入結構風險,容易出現過擬合。為了克服以上的缺點,構建RELM[14-15],增強ELM的泛化性能。
RELM的目標函數為:
(4)

(5)
式中,βj代表第j個隱含層與輸出節點的連接權重,αi為非負的拉格朗日乘子,分別對公式(5)中的各個向量求偏導并合并得:
(6)
式中,I為單位矩陣,H為隱含層的輸出矩陣,輸出的權重矩陣β可以計算為:
(7)

(8)
由公式(7)可知,正則化極限學習機只需要確定一個正則化參數C,而且由于輸入參數的隨機泛化,能夠使ELM的波動性能大大降低,因此RELM的泛化性能優于ELM。為了選擇最優的正則化參數,本文采用量子粒子群優化算法進行參數優化。
QPSO[16]是一種新的粒子群算法,它是受量子力學的啟發而產生的。本文將QPSO應用于正則化極限學習中,對正則化參數進行優化。

(9)
(10)


(11)
式中,M為粒子數。
綜上所述,QPSO中只有一個創新參數α設置,一般α的值不大于1,因此解決了PSO設定參數過多的缺點,并且QPSO算法還取消了粒子的移動方向屬性,因此粒子的位置更新與之前的粒子無關,這就增加了粒子位置更新的隨機性,解決了PSO算法因粒子位置變換缺少隨機性,容易陷入局部最優的缺點。
本文采用正則化極限學習機在堆疊降噪自動編碼器中的應用實現故障分類。與傳統的自動編碼器相比,降噪自動編碼器通過從損壞的數據中重構出原始數據,學習到更加具有魯棒性的特征,通過多個降噪自動編碼器可以有效提取到信號中的高維特征,再采用RELM對提取出的特征進行分類識別,與極限學習機相比,正則化極限學習能夠避免出現過擬合問題,并且提高極限學習機的泛化性能。為了選擇最優的正則化參數,采用QPSO進行參數優化,提高分類精度。
QPSO-RELM尋優過程為:首先,在搜索空間中隨機產生N個粒子組成隨機粒子群,將粒子位置賦值給參數C,然后計算RELM平均適應度值,根據適應度值確定粒子當前和全局最優位置,當迭代次數達到設定次數時停止更新,最后輸出最優適應度值和優化的參數C。流程圖如圖2所示。

圖2 QPSO-RELM方法流程圖
基于QPSO-RELM在降噪自動編碼器中狀態識別分類模型如圖3所示。具體步驟表示為:
(1)獲取滾動軸承的振動信號,然后將信號樣本劃分為訓練集及測試集;
(2)將振動信號進行快速傅里葉變換,并獲得頻域系數,使用頻域系數構建高維數據樣本x;
(3)將所有樣本歸一化為[0,1],初始化SDAE中的不同參數,包括數據大小,去噪概率v以及訓練迭代次數;
(4)將高維數據樣本x輸入到N個SDAE中進行訓練,獲得融合后的特征h;
(5)初始化RELM的模型參數,包括隱含層數S,正則化參數C;初始化QPSO中的參數,包括粒子數M,創新參數α;
(6)將融合后的特征輸入到RELM模型中進行訓練;
(7)使用量子粒子群優化算法優化RELM模型中的正則化參數C,獲得最優的診斷模型,得出診斷結果。

圖3 QPSO-RELM在降噪自動編碼器中狀態識別分類模型
本文的實驗數據采用的是美國西儲大學實驗室的滾動軸承實驗室數據[18]進行了滾動軸承實驗研究,該裝置主要由輸入電機、測試軸承以及加載電機組成的。軸承故障是使用電火花加工技術在SKF軸承上布置了單點故障,并且故障直徑分別為0.007 in、0.014 in和0.021 in。數據樣本采用的是轉速為1797 r/min,采樣頻率為12 kHz下收集的振動數據。
數據包含了4種不同健康類型,分別為正常狀態、內圈故障、外圈故障和滾動體故障。除了正常狀態,數據還包含了每種故障類型分別在三種故障程度下的狀態,因此總共有10種不同的狀態類型。每種狀態包含1000 個樣本,每個樣本包含了2048 個數據點,每種狀態隨機抽取800 個樣本進行訓練,其余200 個樣本進行測試,表1展示了所用數據集的信息。
對采樣數據進行預處理后,采用頻域處理方法,利用快速傅里葉變換算法將原始振動信號轉換為頻域信號[11],由于頻譜分析圖是對稱的,每個樣本信號中1024個點足以表示頻域特征,因此輸入模型中的每個樣本為1024 個頻域系數。

表1 滾動軸承狀態描述
將上述的頻域系數組成的向量與相應的故障類別輸入到網絡結構中,采用三層降噪自動編碼器與正則化極限學習機作為模型訓練。經過前期研究以及多次試驗確定降噪自動編碼器模型結構為1024-128-64-32,噪聲系數為0.009,懲罰項系數為10-8,訓練迭代次數為120。采用的量子粒子群優化算法優化RELM模型,并得到的RELM中正則化參數為4.668 6。為了驗證提出方法的有效性,將該方法分別與降噪自動編碼器和SOTEMAX分類器[18]、ELM進行對比,還與未加噪聲的稀疏自動編碼器和SVM[7]進行對比。經過4次試驗,實驗結果對比如圖4和表2所示。

圖4 4次診斷結果圖

表2 診斷平均準確率
對比實驗中,其他模型中的降噪自動編碼器模型的參數與SDAE-RELM中的降噪自動編碼器中的參數設置相同,其中,SDAE-SOFTMAX模型中的訓練迭代次數設為100,SAE-SVM模型中的SAE參數與SDAE中自動編碼器模型參數設置相同,SVM模型采用徑向基核函數進行分類,SDAE-ELM模型中的ELM模型的網絡層數為80。
通過表2和圖4可以得出,SDAE-RELM的4次診斷結果的準確率分別為:98.8%,98.35%,97.55%以及98.15%,平均準確率為98.21%,標準差為0.44%,所提出方法平均準確率高于SDAE-ELM模型的97.52%, SDAE-SOFTMAX深度診斷模型的診斷率只有85.64%,診斷結果遠遠低于所提出的方法。未加噪聲的稀疏自動編碼器與SVM結合的模型與所提出的方法相比,SAE-SVM的平均準確率為97.25%,所提出的方法診斷結果更優。由計算的標準差可以看出SDAE-RELM四次診斷結果的波動性比其他幾種方法要小,穩定性更好。因此,降噪自動編碼器與正則化極限學習機結合可以增加模型的魯棒性和泛化性,得到更好的診斷結果。
為了表示SDAE-RELM網絡對每類故障的具體診斷情況,采用所提出的方法的第1次試驗的混淆矩陣如圖5所示。由圖可知,在實際故障類別0錯分為類別8的比例為0.02,實際故障類別1錯分到類別0的比例為0.01,實際故障類別2錯分到類別4的比例為0.04,實際故障類別4錯分到類別8的比例為0.03,其他類別的分類準確率幾乎為100%,整個測試集的平均分類準確率為98.8%,因此所提出的方法具有很好的分類識別效果。

圖5 SDAE-RELM第一次試驗混淆矩陣圖
為了說明量子粒子群優化算法的尋優能力,本文將量子粒子群優化算法與粒子群優化算法進行對比,選取初始粒子數都為10, 迭代次數為50。量子粒子群算法中創新參數為0.8,粒子群算法中學習因子c1和c2都為2,慣性因子為0.8。RELM的正則化參數優化區間為0.001~50,經過QPSO優化后的RELM中正則化參數為4.668 6,PSO優化后的RELM中正則化參數為11.020 05。分別對此參數進行訓練,經過4次的診斷結果如圖6和表3所示。

圖6 優化算法對比結果圖

表3 改進前后粒子群算法診斷平均準確率
由圖6和表3可知,量子粒子群優化算法4次試驗結果分別為98.8%、98.35%、97.55%和98.15%,平均準確率為98.21%,而粒子群優化算法4次的試驗結果分別為97.05%、97.15%、96.7%和96.65%,平均準確率為96.88%,量子粒子群算法得到的優化參數的診斷準確率要高于粒子群算法所得的參數。由計算的標準差可以看出,雖然粒子群優化算法相對于量子粒子群優化算法的波動較小,但兩者整體穩定性相差不大。因此采用量子粒子群優化算法與粒子群算法相比設定參數少,優化性能更好,可以獲得更準確的診斷結果。
本文提出一種基于QPSO正則化極限學習機在降噪自動編碼器中對滾動軸承進行故障診斷的方法。首先將提取的原始振動信號頻域系數作為網絡輸入,通過SDAE網絡獲得深層次的特征表示,QPSO優化后的RELM根據提取特征進行故障分類識別,主要結論如下:
(1)提出RELM對SDAE融合后的特征進行故障分類,與SOFTMAX、SVM以及ELM相比,能夠獲得更好的分類效果,并且解決了ELM容易出現過擬合的問題。
(2)對于RELM中正則化參數選取困難的問題,提出基于QPSO對RELM網絡參數選取方法,該方法相比于PSO,設定參數少,并且解決了PSO 容易陷入局部最優的問題。通過QPSO優化RELM模型中的待定參數,相比于PSO,能夠獲得更準確的分類結果。