








摘 要:隨著信息技術發展,鐵路信號系統的復雜性和外界環境的不確定性使故障發生的概率越來越高。為了優化故障預警系統,更好地應用預防維護技術,本文提出了基于局部加權回歸(Locally Weighted Regression,LOESS)和經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)的數據預處理系統,利用主成分分析(Principal Component Analysis,PCA)和自動編碼器提取并優化數據特征,構建基于門控循環單元(Glavnoe Razvedivatelnoe Upravlenie, GRU)的故障預測模型以及基于長短期記憶網絡(Long Short-Term Memory,LSTM)的預測性維護模型。研究結果表明,本文提出的模型能夠提高故障預警的準確性,為鐵路信號系統的穩定運行提供技術支持,保障鐵路交通的安全性,提升了運行效率。
關鍵詞:鐵路信號系統;故障預警;預防維護
中圖分類號:U 284 " " " " 文獻標志碼:A
鐵路交通是現代交通體系的重要組成部分,其安全性和可靠性受到廣泛關注。由于鐵路信號系統具有復雜性,因此故障發生的概率較高,一旦出現故障,就可能導致列車晚點、停運,甚至發生重大安全事故。因此,本文研究鐵路信號系統故障預警技術,優化數據預處理、提取特征、構建故障預測模型以及設計預防維護策略等環節,提高鐵路信號系統的故障診斷準確率和維護效率,保障鐵路交通安全。
1 數據預處理與特征提取技術
1.1 數據預處理與特征提取
采用數據預處理與特征提取技術進行故障檢測。LOESS能夠探索信號數據中的局部結構,以提高故障檢測的準確性。LOESS的核心思想是在給定數據點附近擬合一個簡單模型。對每個預測點Xi來說,LOESS對第i個數據點Yi進行局部擬合,如公式(1)所示。
Yi=β0+β1Xi+εi (1)
式中:εi為誤差項;β0、β1為模型的參數,分別為截距和自變量X的系數。
EEMD是一種處理非線性和非平穩時間序列數據的有效方法,它利用添加白噪聲系列來解決模式混疊問題,在數據中識別固有的振蕩模式[1]。利用希爾伯特黃變換從原始信號中提取EEMD,須滿足2個條件:數據極值點的數目和通過數據零點的數目必須相等或者相差最多1個;在任何點,局部對稱軸的平均值為0。在完成數據預處理后,采用主成分分析(Principal Component Analysis,PCA)和自動編碼器提取并選擇特征。
PCA利用線性變換將數據轉換至新的坐標系中,計算過程如公式(2)所示。
W=argmax|WTXTXW| (2)
式中:W為映射矩陣,包括主成分的方向信息;X為原始數據矩陣,其中,每行代表1個樣本,每列代表1個特征。解決該優化問題,PCA能夠識別最能代表數據集變化的特征向量。
自動編碼器是一種無監督的神經網絡,用于學習數據的有效編碼[2],其目標是最小化輸入和輸出之間的差異。訓練之后,自動編碼器能夠生成數據的簡化版本,可以作為特征輸入后續的故障預測模型中。
LOESS和EEMD的數據預處理可以降低數據噪聲,突出趨勢,采用PCA和自動編碼器提取并選擇特征不僅可以減少數據維度,還能保留最具信息量的特征,為鐵路信號系統的故障預警提供了可靠的數據基礎。
1.2 基于GRU的故障預測模型
在鐵路信號系統故障預警技術領域,構建高效的故障預測模型是提高系統可靠性和安全性的關鍵。由于在處理時間序列數據方面性能優異,因此GRU網絡廣泛應用于構建故障預測模型[3]。GRU的核心為更新門Rt和重置門Zt這2個門控結構,GRU門控結構如圖1所示。更新門決定保留哪些前一個時刻的信號狀態信息,以更好地預測未來可能發生的故障;重置門決定忽略哪些過去的信息,使模型更專注于當前的重要信號,提高預警準確性。
更新門Zt的計算過程如公式(3)所示。
Zt=σ(Wz·[ht-1,xt]+bz) (3)
重置門Rt的計算過程公式(4)所示。
Rt=σ(Wr·[ht-1,xt]+br) (4)
式中:xt為在時間的輸入;ht-1為前一時間步的隱藏狀態;σ為Sigmoid激活函數,用戶將輸入值映射至0~1;bz和br分別為用戶更新門和重置門的偏置向量;Wz和Wr分別為用戶更新門和重置門的權重矩陣。
基于預處理后的列車歷史故障數據集中的運行數據將其劃分為訓練集和測試集。本文采用GRU網絡,該結構由輸入層、數個GRU隱藏層以及輸出層組成。其中,輸入層的維度與所選特征的數量有統計學意義,輸出層的維度對應可能出現的故障類型數目。本文精選了10個關鍵特征進行故障預測,設定輸出為5種主要的故障類型,具體數據見表1。
輸入層采用鐵路信號系統中關鍵的運行參數和環境因素,以浮點數形式表示,保證數據的連續性和多樣性,為GRU網絡提供全面的特征信息。輸出層根據系統中常見的故障類型設計,以每種故障類型的概率作為輸出,為故障預警提供了明確目標。
1.3 故障等級劃分與預警機制
在鐵路信號系統中,劃分故障等級、采用預警機制可以提高系統的可靠性。該過程包括精準地識別故障特征并對其進行適當分類,以便及時采取響應措施。動態時間規整(Dynamic Time Warping,DTW)和時間序列聚類是該過程中2種關鍵的算法[4]。
DTW是一種經典算法,可以比較2段時間序列。DTW利用彈性地拉伸或壓縮時間序列來找到2個序列之間的最佳匹配。時間序列聚類是一種將時間序列數據進行分組,計算時間序列之間的距離的方法,利用K-Means聚類算法將時間序列劃分為不同的類別或簇,使同一組的時間序列相似度高,不同組之間的時間序列相似度低。
本文利用DTW和時間序列聚類對故障信號進行等級劃分。利用DTW計算不同故障信號時間序列之間的相似度,以識別并區分類型不同、嚴重程度不等的故障模式。采用時間序列聚類算法將特征相似的故障信號進行分組,每個組代表一定等級的故障類型。
建立預警機制的關鍵是將故障等級與相應的響應措施進行匹配。對每個故障等級來說,可以設定特定的預警閾值,并根據實時監測的故障信號特征和所屬的故障等級來觸發相應預警[5]。例如,對輕微故障來說,只需進行日常維護;對嚴重故障來說,需要立即采取緊急措施以避免潛在的安全風險。及早發現并處理故障,能夠顯著提升鐵路信號系統的運行安全性和可靠性。
2 鐵路信號系統預防維護技術
2.1 基于LSTM的預測性維護模型
在鐵路信號系統中,采取有效的預防維護策略是提升系統穩定性和降低故障率的關鍵。LSTM在處理時間序列數據方面能力優越,廣泛應用于構建預測性維護模型。LSTM特有的門控機制能夠有效解決傳統循環神經網絡(Recurrent Neural Network,RNN)在長序列數據處理過程中遇到的梯度消失問題,使RNN能夠捕獲時間序列數據中的長期依賴關系。
LSTM單元由遺忘門、輸入門和輸出門3個主要門控結構組成 。遺忘門決定哪些信息應從單元狀態中丟棄,輸入門決定哪些新信息應添加至單元狀態,輸出門決定下一個隱藏狀態的值。LSTM的門控單元結構如圖2所示?;阼F路信號系統的實際運行數據收集的輸入數據維度見表2。
在網絡架構設計階段,構建1個具有2個LSTM層和1個全連接層的網絡。每個LSTM層包括128個單元,采用ReLu激活函數來提高網絡的非線性處理能力。作為網絡輸出層,全連接層生成最終的維護需求預測,采用Sigmoid激活函數輸出預測的維護需求概率。
在訓練過程中,由于預測性維護問題可以看作回歸問題,因此采用均方誤差(Mean Square Error,MSE)作為損失函數。因為Adam優化器能夠自適應調整學習率,適合處理大規模且參數敏感的數據集,所以選擇其作為優化器。為防止過擬合,模型還加入了Dropout網絡層,當在驗證集中的損失不再下降時停止訓練。
2.2 維護決策支持系統
在鐵路信號系統中,采取有效的預防維護措施十分重要。維護決策支持系統結合決策樹和貝葉斯網絡,提供了一種系統化的解決方案,以優化維護策略并預測潛在故障。系統基于歷史數據和實時監測數據為維護團隊提供決策支持,降低系統故障率,提高運行效率。
決策樹廣泛應用于分類和回歸任務,其核心思想利用多次迭代將數據集劃分為2個或多個同質子集,直至達到預設的最大深度或節點內數據點數量低于某個閾值。當選擇最佳分裂屬性時,本文采用信息增益來衡量數據集在特定屬性上分裂前后信息含量的變化,如公式(5)所示。
(5)
式中:Gain(D,a)為信息增益,為原始數據集的熵與加權子集熵總和的差值,差值越大,屬性a在降低數據集不確定性方面越有效,這是決策樹等算法選擇分割屬性的重要依據;|D|為數據集D中樣本的數量,i為數據點個數;|Di|為子集Di中樣本的數量;Ent(D)為數據集D的熵,用于衡量數據的不確定性;m為加權子集熵的總數。其計算過程如公式(6)所示。
(6)
式中:pk為數據集中術語類別k的樣本比例;K為2個時間序列對齊后的最大長度。
在鐵路信號維護決策支持系統中,決策樹可以分析故障類型和原因、維護操作的影響以及可能的維護結果。訓練決策樹模型,基于系統的歷史維護數據和故障記錄識別導致故障的關鍵因素,為維護團隊提供可行的維護建議。
貝葉斯網絡是一種表示條件依賴關系的圖形模型,節點表示隨機變量,邊表示變量間的概率依賴關系。貝葉斯網絡根據已知的故障概率和維護措施的效果預測采取某種維護措施后系統狀態的改變概率。
3 試驗驗證
3.1 試驗設計
試驗數據集包括2021年第一季度至2023年第二季度某鐵路信號系統在實際運行過程中收集的數據以及系統記錄的相關故障與維修數據。將預處理后的數據集劃分為訓練集、驗證集和測試集,其數據比例為6∶2∶2。利用訓練集分別訓練GRU和LSTM網絡模型,使用驗證集對模型進行調優,使用測試集評估模型的性能,驗證模型的預測能力。
3.2 故障預測模型的驗證
本文對GRU故障預測模型進行性能評估,GRU模型與原有系統性能對比如圖3所示。
從圖3中可以看出,與原有系統相比,GRU模型的準確率和召回率更高,說明其在故障預測方面性能更好。F1分數是衡量二分類模型精確度的指標,兼顧分類模型的精確率和召回率,分數提升也表明模型在準確性和召回率之間取得了較好的平衡。
3.3 預防維護模型的驗證
本文對LSTM預防維護模型進行性能評估,本文采用均方根誤差(RMSE)、平均絕對誤差(MAE)以及決定系數(R2)作為評估指標。2023年第一、二季度數據的預防維護模型評估結果見表3。
從表3可以看出,LSTM模型的RMSE與MAE較低,說明模型預測的準確性較高,模型預測值與實際值之間的差異較小。R2反映了模型解釋數據變異的能力,值越接近1,模型越能準確預測數據變動。LSTM模型R2較高,說明其在鐵路信號系統預防維護方面適用性較高。
4 結論
本文研究了鐵路信號系統故障預警與預防維護技術以及應用數據預處理與特征提取技術,有效減少了數據噪聲并突出了趨勢特征。經試驗驗證,本文構建的基于GRU的故障預測模型和基于LSTM的預防維護模型性能良好,能夠為鐵路信號系統的故障預警提供可靠的技術支持。
參考文獻
[1]韓昶.鐵路信號設備的可靠性設計與維護策略研究[J].運輸經理世界,2023(35):166-168.
[2]常懌.如何利用微機監測系統分析和處理鐵路信號設備故障[J].信息系統工程,2023(4):83-85.
[3]邢玉龍.面向預測性維護的軌道電路故障診斷及預測方法研究[D].北京:北京交通大學,2022.
[4]王坤.基于機器學習的鐵路信號設備故障預警系統的設計與實現[D].邯鄲:河北工程大學,2021.
[5]尹航.鐵路信號集中監測系統智能分析及預警方法研究[D].蘭州:蘭州交通大學,2021.