譚東貴, 袁逸萍, 樊盼盼
(新疆大學 智能制造現代產業學院,新疆 烏魯木齊 830017)
礦用電動機因其良好的過載能力、調速性能、單位質量功率大等特點,用于驅動提升機、輸送機和破碎機等礦山裝備。礦山環境惡劣、工況復雜,礦用電動機易受溫度、振動、濕度[1]等因素影響,導致電動機過熱、機械磨損、絕緣降低等問題,加速電動機損壞,影響生產效率和成本。因此,實時準確評估礦用電動機健康狀態對制定合理的維護計劃、保障正常生產有重大現實意義。
傳統的電動機健康狀態評估方法主要依賴單一傳感器來實施[2],即利用單一類型的傳感器(如溫度、電流、振動等傳感器)采集電動機運行數據,通過對數據進行分析和特征提取,評估電動機健康狀態[3]。但該方法存在一定的局限性,如對環境噪聲敏感、特征提取不充分、評估精度不高等。為克服這些問題,多傳感器信息融合技術成為電動機健康狀態評估的研究熱點。單增海等[4]通過同時采集多個傳感器的數據,利用多傳感器信息融合以提供更全面、準確的設備健康狀態信息。該方法可充分利用不同傳感器的優勢,提高監測的覆蓋范圍和準確性。然而,在實際工況中由于運行環境異常、人為因素干擾及采集設備故障等[5],礦用電動機監測數據中混雜大量與健康狀態無關的異常值且存在缺失值,導致數據質量下降,造成評估結果不穩定。此外,多傳感器信息融合也帶來了數據融合和處理的復雜性,需要高效的算法來處理大量和多樣化的數據。為減少上述問題,可結合深度學習技術構建更高效、準確、魯棒的礦用電動機健康狀態評估模型。
近年來,深度學習技術在多領域取得了顯著突破,其中卷積神經網絡(Convolutional Neural Network,CNN)在圖像和空間數據處理中表現出色[6],循環神經網絡(Recurrent Neural Network,RNN)在序列數據建模方面非常強大[7]。Yang Chao等[8]將CNN和RNN結合并提出了卷積循環神經網絡(Convolutional Recurrent Neural Network,CRNN),可更好地捕捉時序性和空間信息。樊盼盼等[9]在缺乏歷史故障數據支撐的場景下,采用長短期記憶網絡(Long Short-Term Memory,LSTM)構建風電動機組有功功率短期預測模型。袁逸萍等[10]采用多尺度卷積神經網絡(Multiscale Convolutional Neural Networks,MCNN)特征提取層和門控制循環單元(Gated Recurrent Unit,GRU)神經網絡時間序列預測層搭建滾動軸承剩余壽命預測模型。上述模型在時間維度上展開計算,能很好地處理具有序列特征的數據,但對于數據質量下降嚴重的情況,上述模型難以有效提取數據特征并更新網絡權重,導致容易出現梯度消失或爆炸等問題,影響模型性能。注意力機制可在一定程度上緩解該問題,被廣泛應用于深度學習中[11-12]。
因此,本文提出了一種基于自適應多尺度注意力機制(Adaptive Multi-Scale Attention Mechanism,AMSA)的CNN-GRU模型(以下簡稱CNN-GRUAMSA),可根據不同的輸入數據自動調整注意力權重,以提高模型對關鍵信息的關注度,從而提高礦用電動機健康狀態評估的準確性。
礦用電動機健康狀態評估總體框架如圖1所示。首先對傳感器采集的數據進行篩選、標準化、工況劃分(根據數據的特征或規律將數據分為若干類別)等預處理;然后依據傳感器參數的特點,選擇能夠有效反映礦用電動機健康狀況的健康評估指標(電動機電流、電動機三相繞組溫度、電動機前端軸承溫度和電動機后端軸承溫度),計算指標的健康指數(Health Index,HI),并對HI進行降噪、平滑、歸一化處理,同時根據指標對礦用電動機的貢獻度設置初始權重系數,對各指標HI加權融合得到礦用電動機HI;最后將AMSA引入CNN-GRU模型,并對模型進行訓練和驗證,由模型輸出電動機健康狀態評估結果。

圖1 礦用電動機健康狀態評估總體框架Fig.1 General framework of health state assessment of mine motor
礦用電動機運行工況復雜、環境惡劣、噪聲大,易造成部分傳感器監測數據異常大或異常小,不能真實反映礦用電動機運行情況。如果將傳感器原始數據作為深度網絡學習的輸入數據,會增加網絡規模和訓練難度[13]。為使網絡獲得更好的預測性能,應先對傳感器原始數據進行預處理。
首先,采用牛頓插值法對缺失的數據進行填補[14];其次,識別并除去異常值,剔除電流、溫度小于0的數據,以及停機時的數據;然后,對不同傳感器測量的數據進行標準化,本文使用常見的Z-Score數據標準化方法對輸入數據進行縮放[15],使所有傳感器數據量綱統一;最后,對傳感器數據與環境溫度按斯皮爾曼相關系數法[16]進行相關性分析,發現環境溫度與礦用電動機三相繞組溫度、軸承溫度具有強相關性,因此,本文依據環境溫度變化對礦用電動機運行數據進行工況劃分。
使用主成分分析(Principal Component Analysis,PCA)算法構建礦用電動機HI[17],具體步驟如下。
1) 根據馬氏距離[18]計算健康評估指標的HI:
式中:fHI為指標HI;φ為變化率;dmd為馬氏距離;dm0為基準值,dmd>dm0。
2) 為選擇高性能的HI,利用PCA算法計算不同指標對礦用電動機的貢獻度,按貢獻度大小給定權重系數,能夠在保證傳感器數據不失真的情況下降低特征維度并去除冗余數據。
3) 由于計算的指標HI包含明顯噪聲,會對后續評估結果造成影響。Savitzky-Golay(S-G)濾波器[19]是一種基于曲線局部特征的有效濾波方法,因此利用S–G濾波器進行擬合降噪。為進一步獲得平滑的HI,使用經驗指數函數擬合去噪數據,其表達式為
式中:λ(·)為隨時間t變化的經驗指數函數;K為函數的初始值;α為函數的增長率;β為時間偏移量;γ為函數的漸近線。
4) 為保持HI的尺度統一,使用最小-最大歸一化方法將HI縮放到[0,1]。
5) 根據權重系數對指標HI進行加權融合,得到礦用電動機HI。
式中:Wk為權重系數;wk為指標k的貢獻度;l為指標個數;FHI為融合后的礦用電動機HI;Ak為指標k對應的全部數據。
CNN-GRU模型是一種結合CNN和GRU的深度學習模型,用于處理時間序列數據。CNN具有出色的分類和回歸能力[20],可提取數據中的空間特征;GRU通過引入重置門和更新門[21],有效解決標準RNN存在的梯度消失和長期依賴問題,可捕捉數據中的時序關系,實現對未來數據的預測或分類。CNN-GRU模型結構如圖2所示。CNN層對輸入數據進行特征提取,將原始數據轉換為更緊湊、更有信息量的表示形式,為后續的GRU層提供輸入;GRU層對CNN層提取的特征進行時序建模,學習序列中的關系和動態變化,為最終的預測提供依據。

圖2 CNN-GRU模型Fig.2 CNN-GRU model
GRU層提取出時間特征后,模型會生成大量的高維時間特征,這些特征很難直觀地區分和理解。注意力機制通過合理改變注意力程度來實現重要信息的提取[22],當注意力機制應用于神經網絡時,可使其從大量信息中快速鎖定目標中的關鍵點,從而剔除無用信息,更高效地完成訓練任務[23]。由于礦用電動機涉及不同類型的傳感器信號,所以采用AMSA,根據輸入特征的尺度和內容動態地調整注意力權重,從而關注最重要的特征。AMSA結構如圖3所示。

圖3 AMSA結構Fig.3 Structure of adaptive multi-scale attention mechanism
本文選取新疆某大型露天煤礦地面生產系統126帶式輸送機的1號礦用電動機的傳感器數據進行分析驗證。第1個時間節點為2021年1月16日17時14分,采樣時間間隔為1 min,最后一個時間節點為2021年12月31日19時12分。對數據進行預處理后,數據記錄共38萬多條,將數據導入PCA模型中,計算出健康評估指標的個體貢獻度與累計貢獻度,見表1。使用S-G濾波器對PCA處理后的主成分1—主成分6的HI進行降噪處理,得到的HI曲線如圖4所示。借鑒文獻[24]的思想,結合得到的HI,本文設置4個健康狀態類別用于評估礦用電動機健康狀態,見表2。

表1 健康評估指標的個體貢獻度與累計貢獻度Table 1 Individual and cumulative contribution degree of health assessment index %

表2 礦用電動機健康狀態評估類別Table 2 Mine motor health state assessment categories

圖4 降噪處理后的HI曲線Fig.4 Health index curve after noise reduction
按式(2)、式(3)對主成分1—主成分6的HI進行加權融合,并使用最小-最大歸一化方法將HI縮放到區間[0,1],得到礦用電動機HI曲線,如圖5所示。

圖5 礦用電動機HI曲線Fig.5 Health index curve of mine motor
由于在驗證過程中存在隨機性,且考慮到環境溫度對溫度類傳感器參數的影響,將數據按環境溫度變化(以每變化5 ℃作為一個區間)劃分為8個工況(即8個子數據集),并分別輸入CNN-GRUAMSA模型進行驗證,每個子數據集選取其樣本數據的80%用于訓練,其余20%作為測試數據,將HI與各傳感器的時間序列數據拼接,形成最終參與模型訓練、預測的數據集。
將輸入變量的初始歷史時間步長設置為1.5 h,即輸入數據由過去1.5 h連續測量的傳感器數據和HI組成。由于在CNN-GRU模型中融入了AMSA,所以模型在訓練過程中會動態調整時間步長與注意力權重,并使用Adam優化器以0.001的學習率訓練模型,用于預測礦用電動機健康狀態。
CNN-GRU-AMSA模型在訓練數據與測試數據上的損失值如圖6所示。可看出訓練損失值隨著迭代次數的增加逐漸減小并趨于平穩,且測試損失值保持在一個較低的水平上,說明CNN-GRU-AMSA模型在訓練過程中能夠有效降低預測誤差,且沒有出現過擬合現象,具有較強的泛化能力。

圖6 CNN-GRU-AMSA模型損失值Fig.6 Loss value of CNN-GRU-AMSA model
各工況下CNN-GRU-AMSA 模型預測結果的混淆矩陣如圖7所示。可看出除了工況5—工況7下出現個別分類誤差相對較大的情況,整體分類結果較理想。

圖7 不同工況下CNN-GRU-AMSA模型預測結果的混淆矩陣Fig.7 Confusion matrix of CNN-GRU-AMSA model prediction results under different working conditions
為進一步驗證CNN-GRU-AMSA模型對礦用電動機健康狀態評估的性能,將其與常用的深度學習模型CNN、CNN-GRU、CNN-LSTM及CNN-LSTMAttention進行對比,結果如圖8所示。根據圖8計算不同工況下各模型的評價指標,包括均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、最大絕對誤差( Maximum Absolute Error,MAX)、準確率(Accuracy,ACC)、Macro F1與Micro F1。不同工況下各模型的評價指標對比結果分別見表3-表10。可看出CNNGRU-AMSA模型相比于其他深度學習模型,其整體性能最優。

表3 工況1下不同模型性能比較Table 3 Performance comparison of different models under working condition 1

表4 工況2下不同模型性能比較Table 4 Performance comparison of different models under working condition 2

表5 工況3下不同模型性能比較Table 5 Performance comparison of different models under working condition 3

表6 工況4下不同模型性能比較Table 6 Performance comparison of different models under working condition 4

表7 工況5下不同模型性能比較Table 7 Performance comparison of different models under working condition 5

表9 工況7下不同模型性能比較Table 9 Performance comparison of different models under working condition 7

表10 工況8下不同模型性能比較Table 10 Performance comparison of different models under working condition 8

圖8 不同模型的HI對比Fig.8 Health index comparison of different models
為了更加直觀地對比CNN-GRU-AMSA模型的與其他深度學習模型,展示8個工況下不同模型預測殘差,如圖9所示。可看出CNN-GRU-AMSA模型預測殘差波動特別小,而其他模型預測殘差存在很大波動,說明CNN-GRU-AMSA模型的穩定性更優。

圖9 不同模型的預測殘差對比Fig.9 Comparison of predicted residuals of different models
1) 在CNN-GRU模型中引入AMSA,從而根據不同尺度特征的重要性動態分配注意力權重,實現對不同尺度特征的加權融合,以提高模型的泛化性和魯棒性。
2) 首先通過多種傳感器采集礦用電動機運行數據并進行預處理;然后根據馬氏距離計算健康評估指標的HI,再利用S-G濾波器對HI進行降噪擬合,結合PCA算法確定的每個指標對礦用電動機的貢獻度,通過加權融合得到礦用電動機HI;最后使用CNN-GRU-AMSA模型對礦用電動機健康狀態進行評估。
3) CNN-GRU-AMSA模型在RMSE,MAE,ACC,Macro F1,Micro F1等評價指標上均優于其他模型,預測殘差的波動范圍更小,穩定性更優。