梁敏健,彭曉軍,劉德陽
(廣東省特種設備檢測研究院 珠海檢測院,廣東 珠海 519002)
近年來,隨著起重機朝著高功率和大型化方向發展,其齒輪箱的工作環境變得復雜惡劣,故障出現概率增大,尤其老舊門座式起重機的安全形勢嚴峻,定期檢驗往往不容易發現起重機減速箱內部潛在的風險和故障。如減速箱齒輪磨損、軸承內外圈故障、軸承滾子損傷等。這些故障勢必降低起重機的使用年限,嚴重影響起重機的可靠性。目前上述故障往往借助定期檢驗和維護保養階段起重機的拆解才得以被發現。目的性差,效率低下,成本高昂,自動化程度低。
起重機運行過程中勢必會產生振動信號,目前常常采用振動加速度傳感器來監測門座式起重機減速箱來了解門座式起重機的工作狀況,進一步人工提取隱患特征,以找到門座式起重機潛在的故障源。例如,王利明提出振動信號的變尺度解調與振動特征提取算法并成功應用于齒輪箱運行狀態在線監測系統[1]。王鵬基于Gabor變換的無鍵相階次跟蹤技術提取故障特征,實現了對旋轉機械部件在不拆機條件下的狀態監測和識別潛在故障源[2]。馮毅提出基于連續峭度與小波瞬時能量特征融合的故障特征提取方法[3]。
隨著模式識別算法的發展,研究人員開始應用模式識別的方法進行旋轉機械的故障診斷研究[4-7]。例如,吳福森提出支持向量機的起重機變速箱故障診斷方法[8],劉俊超提出基于ICA-SVM的起重機旋轉故障診斷方法,實現起重機旋轉故障的自動診斷[9]。楊武幫提出變分模態分解(VMD)改進小波信號預處理和粒子群算法(PSO)算法優化SVM的模型有效準確地實現了對起重機齒輪箱的故障識別和分類[10]??梢姶蠖鄶祩鹘y的智能診斷是采用“信號處理的特征提取+模式識別”的方法。雖然識別率有一定的提高,本質上依然依賴人工設計與選擇特征,難以獲得最接近故障屬性特征的自然表達,導致訓練時間長且誤差率較高,沒有實現真正意義上的智能診斷。
隨著Hilton提出深度學習理論,人工智能技術得到了進一步地發展,最著名的就是卷積神經網絡和循環神經網絡,其中循環神經網絡是一種處理序列數據的遞歸神經網絡,在自然語言處理方面有著廣泛的應用[11-15]。近年來,越來越多的學者將該深度學習方法引入到故障診斷領域,例如,丁頔等人利用RNN算法,無需提取時頻域特征即可實現對軸承故障的診斷[16]。曲星宇等人采用LSTM網絡實現了對磨礦系統故障的診斷[17]。王鑫CNN-LSTM算法同樣實現了對飛機的故障診斷的識別[18]。可見這類方法在大型機械中獲得了較好的效果,但是RNN循環神經網絡的存在梯度爆炸和梯度消失問題。因此,起重機減速箱的一維振動信號有很強的序列性,非常適合用循環神經網絡進行處理,本研究擬建立基于LSTM神經網絡的門座式起重機機械故障診斷分類模型,以期實現通過直接輸入原始振動信號,便能自動快速獲得門座式起重機減速箱機械故障的診斷分類結果。
減速箱是起重機重要的傳動扭矩的部件,某二級齒輪減速箱結構如圖1所示,主要包括齒輪副、軸系、軸承等部件,其可將電機的高轉速傳遞到合適的低轉速。

圖1 起重機減速箱結構原理示意圖
由于起重機工況復雜,尤其是港口門座起重機又常年工作在高濕高鹽的港口環境中,減速箱容易產生運行故障,如齒輪的齒根/齒面磨損、斷齒/缺齒、軸承滾子/內圈/外圈損傷等。上述類型的損傷均會在振動信號中體現出來。對于軸承,如果軸承表面出現故障時,滾子與故障部位接觸就會產生振動信號,該信號是故障頻率和軸承固有頻率的疊加信號。對于齒輪,從動力學方程可知,齒輪平穩運行時,振動信號是嚙合頻率及其高次諧波的疊加,表達式如下:
(1)
式中,Am是幅值,f0是嚙合頻率,m是諧波階次,N是諧波數。但是當齒輪發生故障時,齒間載荷、齒剛度等都隨時間變化,因而振動信號的幅值、相位和頻率均會發生調制現象[19],即
(2)
式中,am(t)是調幅函數,bm(t)是調相函數。由此可見,振動信號往往蘊含著某一類故障的信息。因此,如圖1所示,本文擬在減速箱軸承支座部位放置三軸振動加速度傳感器,以全面反映檢測部位的振動狀態。
在上述診斷原理的基礎上,本文設計了基于labview的起重機減速箱故障診斷系統總體方案,旨在實現對減速箱齒輪、軸承等關鍵部件進行振動數據的采集,數據處理和故障診斷分類。
該方案如圖2所示,該系統包括三軸加速度傳感器、信號調理模塊、數據采集設備和上位機等硬件,軟件包括系統設置、數據采集、數據處理、故障分類、數據存儲、結果回放等模塊。其中數據處理模塊包括濾波,數據增強。故障分類模塊包括LSTM模型訓練和LSTM故障分類。

圖2 基于labview起重機故障診斷系統總體方案
對于硬件部分選取PCB公司的三軸加速度傳感器,其型號為356B18,靈敏度為1 000 mV/g;信號調理和數據采集模塊選取了美國國家儀器公司CompactDAQ便攜式數據記錄儀,該模塊包括NI9234數據采集卡和cDAQ-9174機箱。該模塊最大采樣頻率為51.2 kS/s[20]。
對于軟件部分,本文基于labview完成開發出了起重機故障診斷系統,設計并實現系統設置、數據采集、數據處理、故障分類、數據存儲、結果回放等模塊的功能。
在上述原理和故障診斷系統設計的基礎上,基于LSTM的門座起重機減速箱診斷流程如圖3所示。

圖3 門座起重機減速箱診斷流程示意圖
流程分4個階段:數據采集、信號預處理、模型搭建、模型應用。在數據采集階段,首先將三軸加速度傳感器置于某門座起重機減速箱的軸承支座處,利用本文開發的基于labview的起重機振動數據采集系統進行數據采集。在數據預處理階段,將數據進行常規濾波處理后,對數據進行數據增強操作,并將數據集劃分為訓練數據集和測試數據集。在模型搭建階段,首先建立LSTM模型,通過輸入的訓練和測試數據集對創建模型的參數進行不斷更新,直到達到精度要求,保存更新后的模型參數,完成模型的搭建工作;在模型應用階段,輸入新采集的一維振動信號,運用訓練好的LSTM模型對故障類型進行判斷,從而完成整個故障診斷的工作。
1.3.1 數據采集階段
由于平時收集帶故障的門座式起重機減速箱數據比較困難,本文采用公開的故障數據集和現場收集的數據相融合的方式進行故障數據集的準備。
對于公開的數據集采用東南大學嚴如強團隊整理的齒輪箱故障數據集[21],該數據集包括軸承滾子故障、軸承內圈故障故障、軸承外圈故障、軸承內外圈聯合故障等四類類軸承故障和齒輪斷齒、缺齒、齒面磨損、齒根磨損等4類齒輪故障。對于現場數據集。本文利用開發出的基于Labview的門座式起重機減速箱機械振動數據采集系統采集大型門座式起重機減速箱的振動信號。
融合數據集中各類型故障的典型振動信號如圖4所示。

圖4 各故障類型的振動信號
1.3.2 信號預處理階段
樣本的數量和質量直接影響深度神經網絡的檢測精度,為獲得具有更好泛化能力的模型,提高分類的準確率,卷積神經網絡需要大量的訓練樣本,而目前門座式起重機故障并沒有諸如ImageNet等龐大的公共圖像數據庫,僅僅有一些著名的公開旋轉機械數據集,而且未包含門座式起重機一些特有的故障特點,如低速重載、干擾信號多,因此為增強模型的泛化能力將數據集進行重疊采樣,以增加數據樣本。
圖像增強的方法為幾何變換(包括旋轉、翻轉和平移等)、像素調整(亮度調節、對比度調節和添加噪聲等),通過增加數據樣本來提高模型的魯棒性與泛化能力,本文仿照圖像增強的方式采取重疊采樣的方法對門座式起重機振動信號進行如圖5所示的數據增強[22]。即用等寬的窗口在振動信號上以一定的步長滑動,以獲得樣本信號,當步長比一個樣本長度短時,樣本間即有重疊,長度為L的振動信號被劃分為N=(L-Nin)/s個樣本,樣本長度為Nin,窗口的滑移步長為s。最后根據通用數據集劃分策略,將數據集隨機分配成訓練集(70%)、測試集(30%)。

圖5 數據增強原理示意圖
根據門座式起重機振動信號的特點以及現場檢驗所需的快速高精度要求,本研究采用LSTM的網絡處理振動序列數據,構建門座式起重機機械故障診斷系統結構如圖7所示。
循環神經網絡是深度學習領域應用最多的模型之一,其常用LSTM的結構如圖6所示[23]。

圖6 長短期記憶神經網絡(LSTM)的結構圖
該種網絡當前的輸出與之前的輸入有聯系,即該網絡對前面的信息的記憶且整合到輸出的計算中,隱藏層的單元不再是無連接的,而且隱藏層的輸入既有輸入層的輸出,也有上一時間隱藏層的輸出。

圖7 基于LSTM神經網絡模型預測框架
本文擬采用的LSTM是RNN中的特例,其架構如圖7所示,該結構描述的神經元可類比傳統BP神經網絡中隱藏層的神經元,只是輸入和輸出比BP神經網絡特殊。每個LSTM神經元都有兩個輸入和兩個輸出,兩個輸入值分別是序列值xt和上次的記憶ct-1兩個輸出值分別是被更新的記憶單元ct-1和神經元更新的值ht。上述輸入和輸出值是通過LSTM的3個門機制和一個刷新記憶的結構控制,從而克服傳統循環神經網絡梯度爆炸和梯度消失的問題。
1)遺忘門:遺忘門ft是上一個狀態ht-1和新的輸入xt的函數,即介于0~1之間的sigmoid激活函數作用于ht-1和xt的每一個元素,得到遺忘門ft。遺忘門ft和上次記憶單元ct-1相乘,從而決定著多少百分比的記憶ct-1被下一次使用,遺忘門的表達式如式(3):
ft=σ(Wfxt+Ufht-1+bf)
(3)
式中,Wf和Uf是要估計的參數矩陣,bf是偏置。
xt是LSTM的輸入向量,ht-1是上一個LSTM單元的輸出值。
2)輸入門:輸入門和遺忘門計算方式很類似,計算方式如(4)所示:
it=σ(Wixt+Uiht-1+bi)
(4)
輸入門it同樣也是上一個舊的狀態向量ht-1和新的輸入向量xt的函數,即介于0~1之間的sigmoid激活函數作用于ht-1和xt的每一個元素,得到輸入門it。
(5)
其中:候補記憶單元表達式如式(6)所示:
(6)
式中,tanh是雙曲正切激活函數。
4)輸出門:LSTM的輸出首先通過輸出門進行更新,表達式如(7)所示:
ot=σ(Woxt+Uoht-1+bo)
(7)
接著結合輸出門ot,將內部的信息傳遞給外部狀態ht:
ht=ot°tanh(ct)
(8)
式中,tanh函數是值域介于-1~1之間的雙曲正切函數,該函數作用于更新后的記憶單元ct后和輸出門相乘,從而得到LSTM的輸出。
圖7為基于LSTM神經網絡模型預測框架,該網絡包括輸入層、LSTM層、全連接層、輸出層等部分,輸入層是經過重疊采樣增強處理過的振動信號,每個樣本1 024個點,重疊滑移步長設為14。LSTM層單元大小為32,以增大輸入的信息量。具體參數見表1。

表1 LSTM的網絡參數結構類型
長短期記憶神經網絡門座式起重機機械故障診斷模型使用Python編程語言及Keras深度學習框架實現,模型訓練的硬件環境為Intel i5 CPU,16 G RAM,NVIDIA GTX1050 GPU。
使用融合數據集中70%數據作為訓練集,設模型訓練的超參數學習率為0.000 1,批尺寸為128,最大迭代數(epochs)為40。模型訓練的損失值曲線如圖8所示。經對比,基于LSTM的診斷模型比傳統的基于CNN診斷模型在損失值方面表現出更為優異的性能。

圖8 訓練集損失值曲線
以融合數據集中30%的數據作為實驗數據(測試集),使用基于LSTM的算法模型進行故障診斷識別。為準確分析試驗結果和算法模型的性能,除使用準確率A(Accuracy)作為結果評價指標外,針對每一類故障識別結果分別采用精確率P(Precision)、召回率R(Recall)以及F1值對模型的故障識別結果進行全面評估,具體計算標準如式(9)~(11)所示,其中F1值是精確率和召回率的調和均值。上述指標的取值范圍均在0~100%之間,并且越大越好。
(9)
(10)
(11)
式中,TPi為樣本實際是i類且模型識別為i類的數量;FPi為樣本實際不是i類但模型識別為i類的數量;FNi為樣本實際是i類但模型識別不為i類數量。
將測試集樣本輸入分類模型,根據分類結果得到混淆矩陣如圖9所示,進而計算出模型處理振動信號的性能指標如表2所示。

圖9 門座式起重機機械故障診斷的混淆矩陣

表2 基于LSTM門座式起重機機械故障診斷模型的性能指標
通過表2可以發現,基于LSTM的故障診斷模型對門座式起重機減速箱故障的各種類型故障預測精確率均在87%以上,召回率在88%之上,最終故障診斷整體準確率達到了96.8%,滿足門座式起重機故障診斷現場檢測的精度要求。而從表3可以看出,基于CNN的故障診斷模型對門座式起重機減速箱故障的各種類型故障預測精確率最低在70%左右,召回率最低66%,最終整體準確率只有92.66%,比LSTM低4.1%,從而證明基于LSTM在準確率和穩定性方面的優勢。

表3 基于CNN門座式起重機機械故障診斷模型的性能指標
針對門座式起重機減速箱機械故障智能診斷和分類問題,基于長短期記憶神經網絡設計了應用于門座式起重機減速箱振動信號的自動診斷分類模型。借助東南大學齒輪箱數據集以及現場采集的門座式起重機振動數據,建立了門座式起重機減速箱機械故障數據集。使用數據增強的方式對數據集進行預處理。采用測試數據集對模型的精度與復雜度進行了測試實驗,實驗結果顯示,該模型能夠實現門座式起重機減速箱機械故障分類的整體準確率達96.8%,比傳統的CNN網絡精確性和穩定性更優,結果表明該模型能夠準確地對門座式起重機減速箱機械故障進行準確分類,能初步滿足現場檢驗對快速檢測的要求。在下一步的工作中,將繼續搜集各類門座式起重機減速箱故障數據,擴充數據集,提高模型識別準確率,同時將研發便攜式門座起重機減速箱機械故障智能診斷系統,提升模型的實用價值。