戴明 湯浩 許坤
(1、南京恒星自動化設備有限公司,江蘇 南京 211135 2、中國鐵路上海局集團有限公司 南京供電段,江蘇 南京 210011 3、中國鐵路西安局集團有限公司,陜西 西安 710000)
隨著科技發展和生產力進步,鐵路變壓器日益朝著智能化、復雜化及自動化發展,并且得到廣泛應用。鐵路變壓器一旦發生故障,維修成本高,往往造成不必要的經濟損失,甚至重大事故。因此,為保障鐵路變壓器的安全可靠性,實現對變壓器健康狀態的可靠預測便顯得尤為重要,即實現對鐵路變壓器的剩余使用壽命(Remaining useful life,RUL)預測。基于壽命預測結果提前預測設備的失效時間,進而提前安排鐵路變壓器維護,降低供電設備突然失效而帶來的風險,提升鐵路運行整體可靠性。
目前,許多學者和機構開展了鐵路變壓器剩余壽命預測研究,并取得了許多成果。鐵路變壓器壽命預測方法可分為基于物理失效機制模型和基于數據驅動模型。基于物理失效機制模型通過供電設備退化機制或失效方式構建數學退化模型,如一種基于能量參數的設備損傷缺口的退化評估模型;另一種基于無偏灰色馬爾可夫鏈的設備性能退化。然而隨著鐵路變壓器復雜化的發展趨勢,設備的失效機制越來越復雜,此時難以建立一種明確的數學模型去描述設備的物理退化過程,因此,基于物理失效機制的模型也就很難對設備的剩余壽命做準確預測。
基于數據驅動的壽命預測方法不依賴設備的物理失效機制和專家知識,而是在基于設備性能退化數據的基礎上直接識別設備的故障特征,進而對設備的剩余壽命做出準確預測。如一種基于PCA 和DNN 融合的設備微小故障早期診斷和壽命預測方法;一種基于Wiener 過程及Logistic 概率分布融合方法的設備壽命預測方法;另一種多分類概率ELMs 模型,基于sigmoid 后驗概率映射和Lagrange 成對耦合法,可實現對變壓器剩余壽命的準確預測。
然而上述基于機器學習的數據驅動方法無法從原始數據中直接識別故障特征,依賴信號處理及診斷專家先驗知識,可能造成識別的故障特征僅適用于某些特定場合。此外,機器學習模型通常為淺層架構,僅含一個隱藏層,處理非線性問題能力有限,面臨復雜的變壓器故障時無法做出準確診斷及預測。而深度學習,作為機器學習領域的最新成果,采用深層網絡架構,更強數據表達能力,可直接從原始數據中識別深層次抽象特征表達,為實現鐵路變壓器剩余壽命智能化預測提供了新思路。因此,本文提出了一種基于長短時記憶網絡(LSTM)的鐵路變壓器剩余壽命預測方法,可直接從原始數據中識別故障特征,進而對設備剩余壽命做出準確預測。
鐵路變壓器監測傳感器數據包括油溫、油中烴類氣體類型和含量、振動、油中水質量分數等多種不同類型信息,而LSTM網絡可將輸入的變壓器的傳感器數據進行一系列非線性變換,進而識別變壓器深層次的故障演化趨勢,基于識別的故障演變趨勢對變壓器的剩余壽命做出準確預測。
LSTM 是循環神經網絡的一種變體,在循環神經網絡基礎上多了一個“門控裝置”,LSTM 被提出是解決隨著循環神經網絡中存儲的時間信息增加,而產生的梯度消失或梯度爆炸的長期依賴問題,在傳統的循環神經網絡結構的隱含層中加入了記憶單元來代替隱含層神經元。LSTM 網絡結構圖如圖1 所示。

圖1 LSTM 網絡結構圖
LSTM 的重點是在圖1 中的記憶“傳送帶”部分,即長期記憶單元模塊ct,它一直處于整個LSTM 的鏈式系統中,因為它自身的狀態在不斷更新,能夠長期攜帶記憶信號,因而解決了RNN 中的長期依賴問題,使得時序信息可以很有效的被LSTM網絡利用,使得LSTM 神經網絡在時間序列預測方面有著很大的優勢。
特征縮放是壓縮數據集中差異很大的特征值到較小區間的方法,一般在數據預處理流程期間使用。高鐵變壓器傳感器信息數值范圍差別很大,對LSTM 網絡識別變壓器故障特征產生不利影響。運用特征縮放的前提是原始數據的具體數值間的范圍差異很大,在LSTM 網絡算法中,使用特征縮放可加快模型收斂。
最小-最大規范化也稱為最小-最大縮放,包括重新縮放特征范圍以縮放為[0,1]或[-1,1]中的范圍。選擇目標范圍取決于數據性質。將特征范圍縮小為[0,1]之間的最小-最大縮放公式為:

其中x 為原始特征值,x'為規范化后的特征值。
實驗數據集被劃分為訓練子集和測試子集以及RUL 子集,每個訓練子集和測試子集包含有26 列數據,第1 列ID 代表編號,第2 列cycle 是時間步,是該時間節點處于本運行周期的位置,在訓練集中指整個變壓器的壽命,在測試集中它是隨即停在某一時間步第3-5 列指的是3 種操作設定數據,第6-26 列代表了21 種傳感器數據。RUL 子集則是提供了測試子集的真實剩余壽命,用來與測試集測試結果對比。
實驗數據集數據排列雜亂無序,不利于數據演化特征的識別,因此,需要對數據集預處理,具體過程如下:
3.2.1 刪除常量值特征。數據集21 個傳感器數據中,部分數據在所有時間步都保持不變,表明其對變壓器剩余壽命無影響,故將其刪去。
3.2.2 特征縮放訓練預測變量。將訓練預測變量縮放為具有零均值和單位方差。特征縮放方法采用z-score 標準化方法。
3.2.3 裁剪響應。為使模型更快從序列數據中進行訓練學習,以一定閾值對響應進行裁剪。測試集數據處理完,訓練集數據繼續下一步。
3.2.4 準備填充數據。按照各序列的長度隊訓練數據進行排序,選擇合適的小批量大小盡可能平均劃分,減少劃分訓練數據后的填充量。
本文構造網絡包含兩個LSTM 層,第一個LSTM 層包含有200 個隱藏單元,第二個LSTM 包含50 個隱藏單元;兩個Dropout 層,丟棄率設置為0.5,一個大小為50 的全連接層,一個輸出大小為1 的全連接層作為網絡基本模型,具體網絡結構如表1。

表1 網絡結構描述
實驗采用LSTM 神經網絡搭建訓練模型,平臺為Matlab 中的Deep Learning 工具箱。模型訓練參數的設定如下:Adam 優化算法,學習率0.01,訓練次數60,梯度閾值1,最大迭代次數60。
在模型預測中,采用均方根差評價指標,用來衡量預測值偏差,公式為:

其中,yi代表真實值,y^i代表預測值。
在模型預測中,為防止函數自動填充數據,指定小批量大小為1。利用訓練好的模型對測試集中隨機時間序列,利用每一時間節點特征值進行壽命預測,預測時不斷更新網絡狀態。預測的最后一個元素對應于部分序列的預測RUL 隨機選擇一個變壓器預測,其結果如圖2。

圖2 變壓器RUL 預測結果
在圖2 中,虛線為變壓器隨時間增加剩余壽命變化情況,直線表示處于健康狀態,折線表示逐漸損壞,最后時間點所對應為測試集停止時間節點對應剩余壽命。實線表示用模型預測出的剩余壽命變化曲線。通過對比,可看出該網絡模型效果較好,尤其后期,模型預測剩余壽命與實際基本一致。同時利用直方圖可視化預測的均方根誤差,如圖3。
在圖3 中,橫坐標表示預測剩余壽命與測試實際的差值,縱坐標表示差值分布頻率,觀察可看出預測誤差主要分布在±20%以內,表明預測的壽命誤差較小,該模型取得了良好效果。

圖3 預測誤差分布
本文提出了一種基于長短時記憶網絡的鐵路變壓器壽命預測方法,長短時記憶網絡可從油溫、油中氣體類型和含量、振動、油中水質量分數等不同信息中自動識別變壓器故障特征以及故障演化趨勢,進而對鐵路變壓器壽命做出實時預測,實驗結果表明了本文提出方法的有效性。與傳統的數據驅動方法相比,本方法無須依賴信號技術及診斷專家的先驗知識,更適合于復雜環境下的應用場合。