梁敏健, 彭曉軍, 劉德陽
(廣東省特種設備檢測研究院珠海檢測院,廣東 珠海 519002)
近年來,自動扶梯數量逐年攀升,老舊扶梯的安全形勢嚴峻,定期檢驗和監督檢驗往往不容易發現扶梯內部的潛在風險和故障,如梯級滾輪磨損、曳引鏈磨損、減速箱齒輪箱磨損、驅動鏈條過松、減速箱油量不足等。這些故障勢必會影響扶梯乘坐人員的安全,提高扶梯的維護成本,降低扶梯的使用年限。目前上述故障往往借助定期檢驗和維護保養階段扶梯的拆解才得以被發現,且目的性差、效率低下、成本高昂、自動化程度低。
電梯含有大量的振動信號,目前常常采用振動加速度傳感器來監測扶梯部件以反映其運行狀態,進而人工提取故障特征,用于安全隱患的識別。例如,徐金海等[1]利用小波包和經驗模態分解的方法提取故障特征,實現了對扶梯機械部件在不拆機條件下的狀態監測和潛在故障源識別。簡龍藝[2]利用時頻域分析法提取振動信號的頻譜圖,找到電梯異常振動的根本原因。
隨著機器學習算法的發展,研究人員開始應用機器學習的方法進行電梯的故障診斷研究。例如,孟慶宇[3]利用集合經驗模態分解提取自動扶梯主驅動軸軸承的振動信號,并構建支持向量機模型對故障信號進行診斷。易士琳[4]利用時頻域分析法提取反映電梯故障的特征向量,并利用PSO-LSSVM識別故障類型。可見大多數傳統的智能診斷是采用“信號處理的特征提取+機器學習”的方法。雖然識別率有一定的提高,本質上仍然依賴人工設計與選擇特征,難以獲得最接近故障屬性特征的自然表達,導致訓練時間長且誤差率較高,沒有實現真正意義上的智能診斷。
隨著Hilton提出深度學習理論,人工智能技術得到了進一步地發展,最著名的就是卷積神經網絡(Convolutional Neural Network, CNN),它通過引入局部連接、權值共享、最大池化、非線性激活等方法,允許神經網絡從圖像中自動學習特征,避免對圖像進行復雜的邊緣檢測、閾值分割等前期預處理,比傳統機器學習方法具有更強大的特征學習和表達能力,因而在圖像分類、目標檢測等方面得到了越來越廣泛的應用。近年來,越來越多的學者將該種深度學習方法引入到故障診斷領域[5-6],例如,羅鵬等[7]利用AFDCNN算法,無需提取時頻域特征即可實現對齒輪故障的診斷。胡蔦慶等[8]采用經驗模態分解和深度CNN實現了對行星齒輪故障的診斷。邵思羽[9]利深度學習理論同樣實現了對旋轉機械的故障診斷的識別。這類方法在旋轉機械中獲得了較好的效果,但是CNN的提出主要針對的是二維圖像數據,而旋轉機械的故障數據多是一維時域信號,并不能完全應用于深度CNN。因此,本研究擬基于一維深度卷積神經網絡(1DCNN)的自動扶梯機械故障分類模型,以期實現通過直接輸入原始振動信號,便能快速獲得自動扶梯機械故障的分類結果。
由于平時收集故障扶梯的數據比較困難,采用公開的故障數據集和現場收集的數據相融合的方式進行故障數據集的準備。公開的數據集采用凱斯西儲大學軸承數據集和東南大學嚴如強團隊整理的齒輪故障數據集,之所以融合3種故障診斷的數據集是因為,凱斯西儲大學軸承數據集所使用的軸承故障相對損傷比較大,故障特征比較顯著,容易實現診斷,而且其只包含軸承故障,不含齒輪故障,故而為了增加對扶梯齒輪和扶梯梯級滾輪的診斷能力,進一步提高所提出模型的泛化能力,融合了包含軸承、齒輪和扶梯滾輪3種類型的數據。上述數據集提供了豐富的故障類型,涉及齒輪、軸承兩種元件的故障,總共包含齒輪的磨損、斷齒、裂紋故障,軸承的內圈、外圈、滾動體等類型的故障。凱斯西儲大學軸承故障數據集平臺如圖1所示[9],故障數據取自軸承內圈、外圈、滾動體3個位置。每類故障在1730 r/min、1750 r/min、1772 r/min、1797 r/min 4種負載工況下進行數據采集。東南大學齒輪故障數據集的實驗平臺包括齒輪箱、驅動電機、電機控制器和制動器控制器,如圖2所示[10]。實驗設置有五類齒輪故障,每類故障在轉速1200 r/min且空載、1800 r/min低載兩種工況下進行振動信號的采集。仿照該試驗數據的采集方式利用開發出的基于LabVIEW的自動扶梯機械振動數據采集系統采集某市區大型商場的自動扶梯的故障信號,采集現場如圖3所示[11]。

圖1 CWRU滾動軸承數據采集系統

圖2 東南大學齒輪箱數據采集系統

圖3 labVIEW自動扶梯機械振動數據采集系統
選取凱斯西儲大學的正常信號、軸承滾子故障、軸承內圈故障、軸承外圈故障和東南大學齒輪裂紋故障以及采集的某自動扶梯滾輪磨損故障,各類型的振動信號如圖4所示。
樣本的數量和質量直接影響深度神經網絡的檢測精度,為獲得具有更好泛化能力的模型,提高分類的準確率,CNN需要大量的訓練樣本,而目前扶梯故障并沒有諸如ImageNet等龐大的公共圖像數據庫,僅有一些著名的公開旋轉機械數據集,而且未包含扶梯一些特有的故障:如梯級滾輪的磨損、梯級鏈輪的松動。因此為提高模型的泛化能力對試驗數據集進行數據集增強,以擴充數據樣本。
本研究采用現場試驗所收集與東南大學和凱斯西儲大學的機械故障數據集的振動數據作為用于模型訓練和測試的原始數據集,包括正常與齒輪故障、軸承內/外圈/滾動體故障、梯級滾輪磨損故障。圖像增強的方法為幾何變換(包括旋轉、翻轉和平移等)、像素調整(亮度調節、對比度調節和添加噪聲等),通過增加數據樣本來提高模型的魯棒性與泛化能力,仿照圖像增強的方式采取重疊采樣的方法對扶梯振動信號進行如圖5所示的數據增強[12],即用相等長度的窗口對振動信號劃分,得到樣本信號,當窗口移動步長小于單個樣本的信號長度時,樣本之間就會有重疊,長度為Lsignal的振動信號被劃分為Nsample=(Lsignal-Nin)/s個樣本,樣本長度為Nin,切片窗口的移動距離為s。最后按照通用數據集劃分策略,將數據集隨機分配成訓練集(70%)、測試集(10%)和驗證集(20%)。

圖4 各故障類型的振動信號

圖5 數據增強方式示意圖
最終融合每類數據8000個共48000個數據樣本,其中訓練樣本個數為每類5600個共33600個樣本,驗證樣本為每類1600個共9600個樣本,測試樣本為每類800個共4800個樣本。 各類樣本個數和標簽如表1所示。

表1 6種不同故障的樣本個數組成
根據自動扶梯振動信號的特點以及現場檢驗所需的快速高精度要求,本研究采用1DCNN的網絡用于特征提取,構建自動扶梯機械故障診斷系統。該網絡在東南大學和凱斯西儲大學數據集和現場采集的扶梯振動信號融合的數據集上獲得了95%的精度。
CNN是深度學習領域應用最多的網絡類型,其典型的結構如圖6所示。

圖6 典型CNN的結構圖
典型的CNN模型包括:輸入層、卷積和池化層、全連接層和輸出層等。輸入層一般是某一尺寸的二維數據,通常是三通道的彩色圖像或單通道的灰度圖像;卷積層和池化層是CNN的核心層,卷積層通過一系列的卷積核對輸入層的圖像進行卷積從而獲得相應數量的特征圖,即特征提取。池化層對卷積層得到的特征圖進行最大值池化或平均值池化等操作,從而大幅減少卷積層的空間維度,降低計算成本,控制過擬合;經過若干次的卷積和池化層,緊接著將池化操作后的數據展開并輸入到全連接層,全連接層連接一個隱藏層,最后由softmax函數將數據映射到輸出層。
softmax函數的定義如下。
softmax(zi)=yi
(1)

因為振動信號是一維數據,圖像數據是二維數據,常見的二維卷積如圖7所示。常用的VGGNET、ResNet和谷歌的Inception,都是3×3或5×5的較小的卷積核。

圖7 二維卷積示意圖
而CNN是針對二維圖像數據提出來的,所以要將CNN的模型適當改造為一維CNN。如圖8所示將二維卷積核改為一維[13],即卷積核的行數和信號的行數要保持一致,均為一維,且卷積核的移動方向只沿著序列前進的方向。具體卷積層的運算方式如式(2)所示。
(2)


圖8 一維卷積示例圖
另外改進了卷積核的寬度,常規二維卷積核一般均為3×3或5×5的小卷積核,卷積核寬度為20,以獲取較大的感受野,達到提取短時特征的效果,其目的和STFT(短時傅里葉變換)相似。區別在于,STFT的窗函數是sin函數,設計的寬卷積核是通過優化算法獲取的,能自適應學習故障信號的特征。
改造后的1DCNN的結構如圖9所示。

圖9 改造后的1DCNN模型結構
該網絡包括輸入層、特征提取層(卷積和池化)、全連接層、輸出層等部分,輸入層是經過重疊采樣增強處理過的振動信號,每個樣本1024個點,重疊滑移步長設為14。特征提取單元中的卷積層的卷積核的大小為20×1,增大了模型輸入的感受野,增大了輸入的信息量。卷積后進行批歸一化處理,具體參數如表2所示。

表2 1DCNN的網絡參數
1DCNN扶梯機械故障診斷模型使用Python編程語言及Keras深度學習框架實現,模型訓練的硬件環境為Intel i5 CPU,16GB RAM,NVIDIA GTX1050 GPU。
設置模型訓練的超參數學習率為0.0001,批尺寸為128,最大迭代數為40。訓練的損失值及準確率曲線如圖10、圖11所示。

圖10 訓練損失值曲線

圖11 驗證集準確率曲線
從圖10、圖11中可以看出,訓練的損失值在迭代10次之后就已收斂并且毛刺波動較小,經過5輪訓練后準確率也達到了95%,這也進一步證明了該模型能有效提高訓練效率。
為準確分析評級模型的性能,除使用準確率A(Accuracy)作為評價指標外,針對每一類采用精確率P(Precision)、召回率R(Recall)以及F1值對評價結果進行全面評估,具體計算標準如式(3)~式(5)所示,其中F1值是精確率和召回率的調和均值。上述指標的取值范圍均在0%~100%之間,并且越大越好。
(3)
(4)
(5)
式中:TPi為樣本實際屬于第i類且模型將其分到第i類;FPi為樣本實際不屬于第i類但模型錯將其分到第i類;FNi為樣本實際屬于第i類但模型未正確將其分到第i類。
將測試集樣本輸入分類模型,根據分類結果得到混淆矩陣如圖12所示,進而計算出模型處理振動信號的性能指標如表3所示。

圖12 自動扶梯機械故障診斷分類結果的混淆矩陣

表3 自動扶梯機械故障診斷模型的精度性能指標
通過表3可以發現,各類扶梯機械故障的預測精確率在85%以上,召回率在75%之上,整體準確率達到了95%,滿足扶梯故障診斷現場檢測的精度要求。
表4總結了基于相同數據集、本研究方案與傳統機器學習算法SVM、決策樹、K近鄰等算法的試驗對比結果。其中對于傳統機器學習算法,人工提取了平均值、均方根、峰值因子、脈沖因子、裕度因子、峭度因子、波形因子、偏度等14種時域波形特征。其中SVM使用了RBF作為核函數,決策樹的最大深度為3,K近鄰的節點數為3。

表4 提出的方法與SVM/決策樹/K近鄰性能比較結果
可以看出,提出的基于1DCNN的診斷方法明顯優于傳統的機器學習算法。
針對自動扶梯機械故障診斷問題,基于一維卷積卷積神經網絡設計了應用于扶梯振動信號的自動分類模型。借助凱斯西儲大學的軸承數據集和東南大學齒輪箱數據集以及現場采集的扶梯振動數據,建立了自動扶梯機械故障數據集。通過數據增強的方法對數據集進行預處理。采用測試數據集對模型的精度與復雜度進行評價,實驗結果顯示,在僅需2.4 MB內存的情況下,該模型能夠實現自動扶梯機械故障分類的準確率達到95%以上,能夠準確對自動扶梯機械故障進行準確分類。設計的算法比人工提取特征+傳統機器學習方式有著更高的準確率,省去了人工提取特征的過程,降低了扶梯機械故障診斷的專業性,節約了時間和設計成本。在下一步的工作中,將繼續收集扶梯其他部位的故障數據集,提高模型識別準確率,同時將探究如何研制基于移動終端的扶梯機械故障智能診斷系統,提升模型的實用價值。