摘 要:鐵路道岔是鐵路運輸系統中的關鍵組成部分,其工作狀態直接影響著列車運行的安全與效率,鐵路道岔故障的及時診斷與檢修對確保鐵路系統正常運行至關重要。本文提出了一種基于卷積神經網絡(CNN)和長短期記憶網絡(LSTM)混合而成的深度學習故障診斷模型,通過采集鐵路道岔動作電流和功率曲線數據來組成訓練集和測試集,并對模型進行訓練和測試,結果表明,與單一的CNN和LSTM診斷模型相比,本文提出的CNN-LSTM混合模型的故障診斷效果更優。最后設計并開發了一套鐵路道岔故障監測和診斷系統,實現了對鐵路道岔的實時監測和故障診斷。
關鍵詞:鐵路道岔 卷積神經網絡 長短期記憶網絡
0 引言
隨著我國高速鐵路網的快速發展,鐵路運輸的安全性與可靠性日益受到社會各界的關注。鐵路道岔作為鐵路線路中的重要組成部分,其工作性能狀態直接關系到列車的安全運行和鐵路運輸的效率。然而,由于道岔結構的復雜性以及工作環境的惡劣性,道岔故障時有發生,給鐵路安全帶來了極大的隱患。因此,開展鐵路道岔故障診斷的研究,對于保障鐵路運輸安全具有重要的理論意義和實用價值。近年來,深度學習技術的發展為鐵路道岔故障診斷提供了新的解決思路,卷積神經網絡以其在圖像處理領域的卓越性能,被廣泛應用于特征提取和模式識別任務中。而長短期記憶網絡作為一種特殊類型的循環神經網絡,能夠有效處理時間序列數據,并捕捉數據中的長期依賴關系。國內學者運用深度學習的方法對鐵路道岔故障的診斷開展了一系列的相關研究,并取得了許多研究成果,但大部分研究都是使用單一的診斷方法,將多種方法綜合起來使用的研究相對較少。將CNN與LSTM相結合,組合起來使用可以充分發揮兩者的優勢,實現對鐵路道岔故障信號的深度特征學習和時序分析,從而提高故障診斷的準確性和效率。
1 相關原理
1.1 卷積神經網絡(CNN)
在20世紀80年代,受生物神經科學的啟迪,Yann LeCun及其團隊提出了一種基于前饋原理的神經網絡架構模型,該模型廣為人知為卷積神經網絡(CNN)[1],它由五個關鍵層級構成:輸入層、卷積層、池化層、全連接層以及輸出層。特別地,卷積層利用卷積操作作為其核心機制,旨在從輸入的鐵路道岔信號數據中高效地提取出關鍵特征。池化層通過縮小故障預測模型的大小來提高計算速度,在保留鐵路道岔信號數據重要特征的前提下降低特征的維度,提高所提取數據特征的魯棒性。全連接層通過對提取的特征值進行整合并將其轉換為向量輸出。
卷積層的計算表達式如下:
在此公式中,第1個卷積層的第i個特征輸出被表達為,其中j代表了當前層輸出特征的總數,這一數量是基于上一層輸出向量的計算得出的。偏置項以符號表示,而特征圖矩陣則用j表示。卷積核的權重則由符號表示,其中n為卷積核的索引值。此外,卷積層的輸出數量由變量N給出,而激活函數則通過符號表示。
池化層計算公式如下:
其中,表示池化層的輸出結果,T,R分別表示池化層的步長和核的大小,r為池化窗口。
1.2 長短期記憶網絡(LSTM)
在20世紀90年代,Sepp Hochreiter與Jürgen Schmidhuber針對循環神經網絡所存在的局限性,創新性地提出了長短期記憶網絡(LSTM)模型[2]。該模型通過引入獨特的“門控機制”,具體包括輸入門、遺忘門、記憶單元以及輸出門,實現了對歷史信息的精細化更新與保留策略。這一設計顯著增強了網絡處理長時間序列數據時的記憶能力,同時有效解決了梯度消失與梯度爆炸這一長期困擾神經網絡訓練的難題。圖1為長短期記憶網絡的基本單元結構。
LSTM單元的向前計算公式如下[3]:
其中,ft表示遺忘門的激活值,it表示輸入門的激活值,Wf表示遺忘門的權重參數矩陣,Wi表示輸入門的權重參數矩陣,[ht-1,Xt]表示雙向量拼接結果,bf表示遺忘門的偏置值,bi表示輸入門的偏置值,sigmoid函數由表示。表示候選元素的狀態,ct-1表示t-1時刻的狀態,ct表示由當前記憶狀態和長期記憶狀態ct-1組合而成的新單元狀態,ht表示t時刻的輸出。
2 CNN-LSTM故障診斷模型構建
考慮到鐵路道岔轉轍機的動作電流及功率曲線數據具有多維性和時序性的特點,為了能夠從時間和空間兩個方面對數據的特征進行充分提取,本文提出了一種基于CNN-LSTM的混合深度學習的故障診斷模型,CNN提取數據的空間特性,LSTM提取數據的時間特性。模型主要包含三個部分,第一部分為三層一維卷積的結構網絡(CNN),每一層都進行卷積、歸一化和最大池化的操作,選取Re lu激活函數[4]。第二部分為LSTM網絡。第三部分為全連接層,包含兩層全連接。數據輸入模型后,首先經過三層CNN部分進行維度的轉變處理,其次輸入到LSTM部分,完成時間和空間上的特征提取和計算,最后數據進入全連接層后輸出診斷結果。CNN-LSTM混合網絡模型結構如圖2所示。
3 實驗和分析
3.1 數據采集
本文通過高鐵車站信號自動控制CSM-KA型信號集中監測系統采集得到了600組鐵路道岔轉轍機動作電流和功率曲線數據,其中正常工作數據100組,另外五種故障[5](轉轍機無法啟動、轉轍機空轉、無小臺階、小臺階偏高、動作電流波動較大)數據各100組。將數據集中的70%作為訓練集,剩下的30%作為測試集。
3.2 評價指標
為了衡量模型在故障診斷方面的性能,我們選取了準確率(Accuracy)、精確率(Precision)和召回率(Recall)[6]三個指標作為關鍵的評估標準,三個評價指標的計算公式分別如下:
其中,TP表示模型正確地預測為故障的樣本數,TN表示模型正確地預測為正常的樣本數,FP表示模型錯誤地預測為故障的樣本數,FN表示模型錯誤地預測為正常的樣本數。
3.3 實驗與結果分析
首先,實驗階段采用了訓練數據集對卷積神經網絡(CNN)、長短期記憶網絡(LSTM)以及它們的組合模型(CNN-LSTM)進行了充分的訓練。隨后,利用獨立的測試數據集對這三個模型在故障診斷方面的表現進行了驗證,所得到的評估指標包括準確率、精確度和召回率,具體數值已匯總至下表所示。
準確率(Accuracy)是衡量模型整體預測準確性的核心指標,它反映了模型對所有樣本的綜合判斷能力;精確率(Precision)則側重于評估模型在識別異常樣本時的精確度,即模型判斷為異常的樣本中實際異常的比例;而召回率(Recall)則強調模型在篩查異常時的全面性,即模型成功識別出所有實際異常樣本的能力。通過分析CNN、LSTM及CNN-LSTM這三個模型的測試結果,我們可以觀察到CNN-LSTM模型在準確率、精確率及召回率這三項關鍵評價指標上均達到了三個模型中的最高水平,這充分證明了相較于單一的診斷模型,該混合模型在鐵路道岔故障診斷中展現出了更為優越的性能。
4 診斷系統開發
基于上述建立的CNN-LSTM鐵路道岔故障診斷模型,設計并開發了一套鐵路道岔故障監測和診斷系統,以此來對鐵路道岔的工作狀態進行實時監測,對鐵路道岔的故障進行診斷。
4.1 系統開發環境
系統開發和運行的硬件環境:CPU:AMD 銳龍 Threadripper 3990X ,內存:32G,硬盤:128G;系統開發的操作系統和運行平臺:Windows 8 64位 旗艦版;系統開發的環境和工具:IntelliJ IDEA、Eclipse;系統運行的支撐環境和支持軟件:mysql v5.7.19;系統使用的編程語言:Java。
4.2 系統功能架構
系統主要包含兩大模塊:故障診斷管理和數據處理管理,故障診斷管理模塊中包含有診斷首頁、故障診斷報警、故障預測預防和數據可視化四項功能,數據處理管理模塊中包含有數據采集處理、用戶管理權限和故障歷史記錄三項功能。
4.3 系統功能和特點
該系統運用了先進的傳感器技術,并采用了基于CNN-LSTM混合模型的數據處理技術,能夠實時監測鐵路道岔的運行狀態,包括道岔的位置、速度、電流、電壓等參數。通過監測這些參數,可以及時發現道岔的故障,并對其進行診斷。該系統具有以下特點:(1)實時監測:系統能夠實時監測鐵路道岔的運行狀態,及時發現故障,并對其進行診斷。(2)數據處理:系統采用了基于CNN-LSTM混合模型的數據處理技術,對監測到的數據進行處理和分析,提取出有用的信息。(3)故障診斷:系統能夠根據監測到的數據和歷史數據,對道岔的故障進行診斷,并給出相應的解決方案。(4)預警功能:系統能夠根據監測到的數據和歷史數據,對道岔的故障進行預警,及時通知相關人員進行處理。(圖4)
5 結論
本文結合CNN與LSTM兩者的優勢,構建了一種基于CNN-LSTM的混合深度學習的鐵路道岔故障診斷模型,通過對鐵路道岔故障信號進行深度特征學習和時序分析,提升了故障診斷的效果,診斷效果明顯優于單一的CNN和LSTM診斷模型。基于混合模型,設計并開發了一套鐵路道岔故障監測和診斷系統,實現了對鐵路道岔的實時監測和故障診斷,可以及時發現故障并對其進行診斷,并給出相應的解決方案,可為鐵路的安全和高效運輸提供一定的參考意義。
基金項目:2023年廣西高校中青年教師科研基礎能力提升項目“基于CNN-LSTM的鐵路道岔故障診斷系統研究”(立項編號:2023KY1437)、2022年柳州鐵道職業技術學院校級項目“基于深度學習的鐵路道岔故障診斷系統的開發與研究”(立項編號:2022-KJB10)。
參考文獻:
[1] Yann Lecun,Leon Bottou,Y. Bengio, et al. Gradient-Based Learning Applied to Document Recognition[J]. Proceedings of the Ieee, 1988, 86(11): 2278-2324.
[2] Sepp Hochreiter,Jürgen Schmidhuber. Long Short-term Memory[J]. Neural Computation, 1997, 9.
[3]姚競爭,方玉潔,周雪菲.基于CNN-LSTM故障預測模型的客滾船安全評估研究[J].船電技術,2024,44(06):6-10.
[4]何宗博.基于深度學習的鐵路道岔轉轍機故障診斷[D].太原:中北大學,2021.
[5]楊菊花,于苡健,陳光武,司涌波,邢東峰.基于CNN-GRU模型的道岔故障診斷算法研究[J].鐵道學報,2020,42(07):102-109.
[6]王成瀚,蘇沛源,張臣宏,等.基于深度CNN-LSTM神經網絡的加工過程實時異常監測模型[J].機械設計與研究,2021,37(06):128-132.