李 隆,王 瑞,張惟皎
(1. 中國鐵道科學(xué)研究院 研究生部,北京 100081;2. 中國鐵道科學(xué)研究院集團有限公司 電子計算技術(shù)研究所,北京 100081)
目前,我國已在高速鐵路沿線全面布設(shè)了風速風向傳感器,為高鐵列車運行提供實時風速風向監(jiān)測報警數(shù)據(jù)。高鐵防災(zāi)系統(tǒng)具備了大風實時監(jiān)測報警功能[1],但尚不具備預(yù)警功能,災(zāi)害預(yù)警能力不足。如果系統(tǒng)能夠通過當前時刻的風速數(shù)據(jù),預(yù)測未來一段時間的風速值,進而對大風做出預(yù)警,就能讓調(diào)度和工務(wù)人員提前做好應(yīng)急處置準備,更好地保障高鐵運營安全。
近年來,關(guān)于鐵路大風預(yù)警的研究主要以鐵路監(jiān)測的大風數(shù)據(jù)為基礎(chǔ),采用時間序列等方法開展風速預(yù)測,相關(guān)學(xué)者已經(jīng)做了大量工作。其中,劉輝等人開展了基于時間序列的非平穩(wěn)ARIMA 預(yù)測模型、卡爾曼濾波、小波分析與神經(jīng)網(wǎng)絡(luò)結(jié)合等鐵路風速預(yù)測方法[2-3];王瑞等人[4-5]研究了基于RBF 神經(jīng)網(wǎng)絡(luò)的鐵路沿線短時風速預(yù)測方法。鐵路大風預(yù)警的方法還包括氣象學(xué)模式、遙感預(yù)測模式、專家系統(tǒng)預(yù)測模式、時間序列解析預(yù)測模式、神經(jīng)網(wǎng)絡(luò)預(yù)測模式、時間序列與神經(jīng)網(wǎng)絡(luò)結(jié)合、氣象模式與神經(jīng)網(wǎng)絡(luò)結(jié)合等[6-12]。以上研究中,基于ARIMA 和卡爾曼濾波的模型較簡單,但預(yù)測結(jié)果精度一般;小波模型需要預(yù)先選擇小波種類,且對非平穩(wěn)數(shù)據(jù)的處理效果一般;RBF 神經(jīng)網(wǎng)絡(luò)秒級預(yù)測相對誤差較小,分鐘級以上的預(yù)測效果一般。
本文通過建立長短周期記憶(LSTM,Long Short Term Memory)[13]神經(jīng)網(wǎng)絡(luò)模型,利用其擁有長短期記憶的特點,增加風速預(yù)測的時間尺度,并通過數(shù)據(jù)分析、試驗驗證,建立在20 min、30 min 及1 h 的時間尺度下帶有置信度計算的大風預(yù)警模型,可為大風災(zāi)害的應(yīng)急處置工作提供參考。
從安全、便于維護的角度,高鐵防災(zāi)普遍采用非機械式的超聲波風速風向儀(無槳葉或風杯)作為風速采集裝置,與氣象部門普遍采用的機械式傳感器有所區(qū)別。聲音在空氣中的傳播速度會與風向上的氣流速度疊加,超聲波風速風向儀利用超聲波時差法,計算風速,采樣頻率為1 Hz,具體參數(shù)如表1 所示。

表1 超聲波風速風向儀具體參數(shù)
高鐵防災(zāi)系統(tǒng)中風速采集裝置安裝于鐵路沿線,一般間隔5~10 km,現(xiàn)場安裝如圖1 所示。

圖1 高鐵沿線風速采集裝置布設(shè)示意
風速采集裝置面向田野側(cè),固定于鐵路軌旁的接觸網(wǎng)桿4 m 高處,采用雙傳感器冗余配置。傳感器安裝高度及位置有利于更準確的測量風對經(jīng)過列車的影響。由于臨近地表,風速風向受地形地貌影響較大,與高空風數(shù)據(jù)差異明顯,無法直接采用氣象部門的氣象站數(shù)據(jù)作為參考。
風速的時序變化,既受短期內(nèi)湍流因素的影響,又受到中長期溫度、氣壓等因素的影響。LSTM 神經(jīng)網(wǎng)絡(luò)作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),其通過記憶存儲單元的設(shè)計,能夠有效避免梯度消失與爆炸。因此,本文基于LSTM 神經(jīng)網(wǎng)絡(luò)構(gòu)建風速預(yù)測模型,能夠較好地描述風速變化的長短期特征,從而對風速值進行更精準地預(yù)測。LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
其中,xt-1、xt、xt+1為輸入的時間序列;c為變化較為緩慢的傳輸狀態(tài);h為變化較快的傳輸狀態(tài);yt-1、yt、yt+1為輸出的預(yù)測時間序列;zf、zi、zo為遺忘門、輸入門、輸出門的門控狀態(tài),通過Sigmoid 函數(shù)將輸入數(shù)據(jù)轉(zhuǎn)換到(0,1)之間;z將對應(yīng)時刻數(shù)據(jù)通過tanh 激活函數(shù)轉(zhuǎn)換到(?1,1)之間。yt為t時刻歸一化后的預(yù)測結(jié)果,可由W′同ct與ht組成的增廣矩陣的乘積進行Sigmoid 激活求得,其中,W′為參數(shù)矩陣,其參數(shù)值將在訓(xùn)練中迭代更新。具體公式如下:

其中,⊙指將矩陣對應(yīng)元素相乘的運算。
本文采用1 層LSTM、1 層Dropout、1 層Dense全連接作為風速時間序列預(yù)測的網(wǎng)絡(luò)架構(gòu)。采用當前時刻之前的10 個20 min 平均風速記錄作為輸入序列x(xt-9,xt-8,···,xt),預(yù)測未來20 min 的平均風速yt+1。(1)由于神經(jīng)網(wǎng)絡(luò)中模型參數(shù)較多,大風樣本的數(shù)量有限,因此,直接使用風速數(shù)據(jù)訓(xùn)練LSTM 模型容易造成過擬合。雖然在訓(xùn)練模型訓(xùn)練集上,損失函數(shù)小,擬合效果較好,但在測試數(shù)據(jù)上損失較大,預(yù)測準確率下降;(2)Dropout 是深度網(wǎng)絡(luò)中常見的一種正則化技巧,在訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)中添加Dropout層,在每次訓(xùn)練的前向傳播中以一定概率使部分神經(jīng)元停止作用,增強模型的泛化能力;(3)使用Dense 層將多個神經(jīng)元的結(jié)果作為輸入進行加權(quán)和輸出,從而計算出預(yù)測數(shù)據(jù)。
將預(yù)測風速的誤差視為高斯分布,其中,預(yù)測值作為期望,擬合標準差作為該高斯分布的標準差。設(shè)預(yù)警閾值為A,預(yù)測值為H,擬合標準差為σ,則預(yù)測風速為x時,置信度φ計算公式如下:

本文選取了有代表性的某高速鐵路客運專線某日包含大風報警在內(nèi)的12 h 風速數(shù)據(jù)。按1 h、30 min、20 min 時間尺度分組,計算整段時間平均風速,以及序列t時刻對應(yīng)時間尺度的平均風速Xt,進而計算自相關(guān)系數(shù)、偏自相關(guān)系數(shù)。
k階自相關(guān)系數(shù)Rk計算公式:

k階偏自相關(guān)系數(shù)ρk計算公式:

使用Python 進行計算,并調(diào)用Matplotlib 可視化分析結(jié)果。如圖3~圖5 可知,各組不同時間尺度的平均風速在12 h 內(nèi)為非平穩(wěn)數(shù)據(jù),自相關(guān)系數(shù)及偏自相關(guān)系數(shù)均為拖尾。由一階自相關(guān)系數(shù)可知,20 min 時間尺度平均風速的自相關(guān)性較強,30 min時間尺度平均風速的自相關(guān)性中等,1 h 時間尺度平均風速的自相關(guān)性較弱。平均風速的時間間隔越長,相關(guān)性越小。因此,利用歷史平均風速預(yù)測未來平均風速的方法時,采用20 min 的時間尺度效果較好,否則將出現(xiàn)較大偏差。

圖3 1 h 時間尺度平均風速數(shù)據(jù)分析

圖4 30 min 時間尺度平均風速數(shù)據(jù)分析

圖5 20 min 時間尺度平均風速數(shù)據(jù)分析
本文采用某高鐵客運專線鐵路防災(zāi)系統(tǒng)大風時段416 400 s 的歷史數(shù)據(jù)作為樣本,樣本數(shù)據(jù)特征如表2所示。
對每20 min 的樣本數(shù)據(jù)求平均值,共得到347個數(shù)據(jù),作為時間序列。取前200個作為訓(xùn)練數(shù)據(jù)集,后100個作為測試數(shù)據(jù)集,剩余數(shù)據(jù)做為驗證數(shù)據(jù)集。將均方誤差(MSE,Mean Square Error)作為代價函數(shù)的輸出誤差。

表2 樣本數(shù)據(jù)特征
本文使用TensorFlow 搭建預(yù)測模型,并將分組數(shù)據(jù)導(dǎo)入,進行模型訓(xùn)練及結(jié)果驗證。試驗結(jié)果如圖6所示,縱坐標為風速值,橫坐標為20m in 間隔的時間序列;藍色曲線為每20m in 的平均風速序列,綠色曲線為訓(xùn)練數(shù)據(jù)集,黃色為測試結(jié)果,紅色為驗證數(shù)據(jù)集結(jié)果。

圖6 風速預(yù)測結(jié)果
本次測試驗證集MSE 為16.65(m/s)2。多次實驗結(jié)果顯示:在20~30 m/s風速值下,測試集MSE在15~20(m/s)2之間,擬合標準差在3.87~4.47 m/s,風速預(yù)測平均誤差13.4%。如選取大風預(yù)警的閾值為15m/s,擬合標準差采用4.2 m/s,當未來20 m in 的平均風速預(yù)測為16 m/s時,大風預(yù)警的置信度可根據(jù)公式(4)計算得φ ≈0.77,在預(yù)測風速的同時,提供了大風預(yù)警的置信度,使預(yù)測結(jié)果更具參考價值。
本文介紹了現(xiàn)有高鐵防災(zāi)系統(tǒng)中風速數(shù)據(jù)的采集方法,基于歷史大風數(shù)據(jù)進行統(tǒng)計分析,建立LSTM 模型來預(yù)測未來短時間內(nèi)風速平均值,并提供預(yù)警置信度。能較好地預(yù)測未來20m in 平均風速趨勢變化,并且在大風速情況下依然保持較高的準確度,預(yù)測20~30 m/s大風時平均誤差為13.4%。本研究旨在充分利用現(xiàn)有高鐵防災(zāi)系統(tǒng)數(shù)據(jù)基礎(chǔ)上,提供大風預(yù)測并提高預(yù)測模型精度。為更加精準地做好大風災(zāi)害的預(yù)報工作,仍需考慮與氣象大數(shù)據(jù)相結(jié)合,進行多模式融合分析。