王 妍,陳永剛
(蘭州交通大學 自動化與電氣工程學院,蘭州 730070)
在軌道交通系統中,列車位置的確定是列車運行控制系統的重要環節,是確保行車安全和提高運營效率的前提[1]。目前列車定位方法有軌道電路、應答器、慣性導航技術、衛星定位技術等,其中:慣性導航系統定位時不依賴外界輸入信息,但是其因累積誤差會隨時間增大而無法單獨長期定位;衛星定位雖然可以降低列控系統成本,但容易在隧道、峽谷等地方出現信號中斷,甚至會失效[2]。由于2 者均不適合單獨定位,但存在著很強的互補特性,所以本文將全球定位系統(global positioning system, GPS)與捷聯慣性導航系統(strapdown inertial navigation system, SINS)進行組合,實現列車組合定位。
從數據融合技術的角度出發,組合定位的本質是根據一定的估計原則,采用某種統計最優的方法,用直接或間接的方式從不確定的量測值中,對列車的位置、速度等信息進行濾波估計[3]。在國內外列車定位研究中,常用的列車定位數據融合方法分為隨機類濾波算法和人工智能類濾波算法。文獻[4]采用擴展卡爾曼濾波對慣性測量單元和里程計信息進行融合并輸出,利用航位推算來預測位置和方向;文獻[5]使用容積卡爾曼濾波進行列車組合定位的數據融合,并結合加權奇偶矢量法提出新的完好性檢測方法,提高了系統的魯棒性和完好性;文獻[6]以反向傳播神經網絡(back propagation neural network, BPNN)為基礎,通過訓練已有數據來預測數據缺失下系統的位置和速度;文獻[7]使用基于遺傳算法的小波神經網絡來預測GPS 信號失鎖時 SINS 的定位誤差;文獻[8]將裝袋法(bagging)模型引入到BPNN 模型中來提高定位精度。裝袋法是自舉匯聚法(bootstrap aggregating)的簡稱。通過分析文獻可知:①GPS/ SINS 組合定位系統使用卡爾曼濾波器進行數據融合的條件,是必須要能夠正常接收到所有定位傳感器的信息,當衛星信號短暫缺失時,卡爾曼濾波器便無法對GPS/ SINS 數據進行融合;②現有使用智能算法進行列車定位的方法,只考慮了慣導在某一時刻輸入和其位置間的關系,未討論整個信息間的邏輯關系,而且沒有解決梯度反傳過程,由于逐步縮減而產生的消失問題。
鑒于此,本文在GPS/SINS 列車組合定位系統基礎上,結合長短時記憶網絡(long short term memory network, LSTM)的時序性以及能夠解決梯度消失問題的特點[9],以及灰色模型(grey model,GM)可解決“貧信息”“少數據”和“不確定性”的問題且預測效果較好的特點[10],提出了GM(1,1)-LSTM 組合模型,以提高衛星信號失鎖下,GPS/SINS 列車組合定位系統精度。
目前 GPS/SINS 組合是列車組合定位常用的1 種組合方式[11]。本文基于這種組合方式并以列車安全計算機為數據處理的硬件載體,通過GM(1,1)和LSTM 網絡進行數據處理和分析,結構如圖1 所示。圖1 中HMI 表示人機交互界面,ATC 表示列車自動控制系統。

圖1 列車組合定位系統
GM(1,1)是以“部分信息已知,部分信息未知”的不確定性系統為研究對象,與GPS 失鎖下信息缺失的定位系統特點相符,采用其算法對傳感器數據進行粗預測以降低原始數據的誤差,處理過程[10,12]如下:
1)生成累加序列。構建傳感器原始序列為

對傳感器原始序列累加,即

生成1 次累加序列為

2)建立x(1)(k)的 1 階微分方程。對生成序列x(1)(k)進行微分方程擬合得

式中:P為灰系數;Q為灰作用量。
3)求解x(1)(k)的1 階微分方程。若為參數系數,并存在
因此1 階微分方程解得

4)還原數據得到傳感器粗預測序列。經1 次累減得到傳感器的粗預測序列為:

LSTM 是 1 種建立在循環神經網絡基礎上的深度神經網絡,它繼承了傳統循環神經網絡的優點,可以對整個信息間的邏輯進行學習,這樣可以減少輸入和輸出權重的沖突以及擾動。
LSTM 的核心是,通過引入LSTM 特有的遺忘門、輸入門和乘法輸出門,可以獲得更持久的記憶能力[9,13-16]。這一特點也使 LSTM 能夠更加容易地解決梯度消失的問題。LSTM 隱藏層運算圖如圖2。

圖2 LSTM 隱藏層運算圖
具體步驟[14-16]如下:
1)決定丟棄經 GM(1,1)處理后,序列中的無用信息為

式中:ft為遺忘門輸出;Wf 、bf分別為遺忘門的權重矩陣和偏移向量;σ是sigmoid 函數,為隱藏層輸入向量;ht為隱藏層序列向量。圖2 中yt為隱藏層輸出向量。
2)將序列中有用的待更新信息存入當前狀態,即

式中:it為輸入門輸出;Wi 、bi分別為輸入門的權重矩陣和偏移向量;tan h 為雙曲正切激活函數;為經過調整后的新內容。
3)更新當前狀態為

4)狀態輸出為

式中:Ot為輸出門輸出;Wo 、 bo分別為輸出門的權重矩陣和偏移向量。
構建 GM(1,1)-LSTM 模型,輸入層主要完成GM(1,1)粗預測和歸一化處理,隱藏層主要進行數據融合,輸出層主要提供預測結果。基本處理過程如下:將傳感器原始數據輸入給 GM(1,1),利用GM(1,1)進行粗預測處理,并歸一化后形成 LSTM的數據集;其次將歸一化后的訓練集作為LSTM 輸入,經 LSTM 處理后得到預測結果,完成列車定位的目的。列車定位信息處理如圖3 所示。
具體實現步驟:
1)確定模型輸入輸出。假設列車在t時刻的位置特征連續n個時刻的列車位置表征數據作為網絡輸入,將t+1 時刻的位置表征數據A(t+ 1)作為輸出。
2)數據集分割。將傳感器數據集分為訓練集、測試集。

圖3 基于GM(1,1)-LSTM 的定位信息處理
3)GM(1,1)處理。GM(1,1)利用自身特點,處理傳感器原始數據產生規則的序列,這樣可以削弱傳感器自身的物理特性和環境因素造成的非線性誤差。
4)歸一化。對輸入給LSTM 網絡的數據集數據進行歸一化處理,以降低網絡訓練難度和解決數據量綱和數量級的不統一問題。
5)LSTM 網絡的初始化及參數選取。給定均勻分布在[0,1]間隨機數的初始權值矩陣D、學習率η、網絡激活函數、隱含層層數、訓練步長step及優化方法等。
6)網絡訓練。將歸一化處理后的序列作為LSTM 網絡的輸入,用 LSTM 網絡的實際輸出與理論輸出計算出均方誤差,然后采用優化方法來對權值和偏置進行調整,減小網絡誤差,實現網絡的優化。當滿足預設均方誤差值時,模型訓練停止,這樣就可以得到訓練好的網絡。
7)網絡預測。將輸入序列對應的理論輸出序列輸入給 LSTM 網絡,得到下一時刻的預測值,并將該預測值與預測時刻前n-1 個時刻的理論輸出組成新的數據,繼續預測下下一時刻位置特征,依次類推得到預測序列。
8)反歸一化。預測得到的位置特征,經反歸一化得到與測試集相對應的預測結果。
1)確定輸入輸出。將當前t時刻的位置特征和t時刻前n-1 個時刻的位置特征作為網絡輸入,t+1 時刻的位置特征作為網絡輸出,建立t時刻前的位置與t+1 時刻的位置數據間的映射關系,實現對未來時刻列車位置特征的推算和預測。
設在t時刻的列車位置特征為

式中:a、w、llon、llat、titv分別表示列車在t時刻的5 個特征參數,即加速度、角速度、經度、緯度和時間間隔標識。titv指網絡訓練時可以取任意時間間隔的數據進行訓練,打破了傳統模型只能取固定時間間隔數據的限制。
2)數據歸一化處理。為降低LSTM 網絡的訓練難度和減小由于數量級引起的網絡預測誤差,對GM(1,1)處理后的數據作歸一化處理,即

式中:max、min 為 GM(1,1)處理后數據的最大值和最小值;x為 GM(1,1)處理后的數據;X為歸一化數據。
用式(14)對預測的列車位置特征進行反歸一化處理,得到最終預測結果。
3)確定步長(step)。與一般的神經網絡相比,加入了時序step 概念的LSTM 網絡處理單位從向量擴充到了張量。step 的大小會對網絡誤差產生不同程度的影響,它的大小與網絡輸入多少個時刻的列車位置特征對應,也就是輸入n個時刻的列車位置特征,就對應的步長step 為n。
4)隱含層層數確定。LSTM 網絡隱含層層數的多少,會影響訓練速度,因此層數的確定顯得至關重要。本文采用(n為輸入層數,m為輸出層數,a1∈[1,10])計算隱含層層數。隱含層層數不同,網絡訓練誤差也不同,對比選擇訓練誤差較小的隱含層層數[17]。
5)LSTM 網絡激活函數的選取。激活函數的作用是通過給神經網絡模型增加一些非線性因素,使其能夠更好地解決較復雜的非線性問題[18]。LSTM常用的激活函數有3 種:Sigmoid、tan h 和ReLU。由于Sigmoid 函數具有軟飽和性,會導致梯度消失的現象,使得網絡訓練無法收斂;tan h 較Sigmoid收斂得更快些,但并未解決Sigmoid 存在的軟飽和性問題;ReLU 函數在x>0 時可以保持梯度不衰減,解決了Sigmoid 和tanh 因軟飽和性產生的梯度消失問題。因此本文選取ReLU 作為LSTM 網絡的激活函數。
6)LSTM 網絡訓練優化方法。為加快訓練速度,本文采用自適應性矩估計(adaptive moment estimation,ADAM)優化方法,來更新網絡參數,算法步驟如下[12]:
①梯度矩估計計算為:

式中:g t為t時刻的梯度;衰減率μ=0. 9;ν=0. 999。②無偏估計校正為:

③梯度更新為

式中η為學習率。
7)檢驗指標
①均方誤差(mean-square error, MSE)為

式中:observedt為觀測值;predictedt為預測值。
②最大誤差(Maxerr)

③平均絕對誤差(MAD)

列車從 34°22' 39''N、108°56' 01''E 出發,非勻速運行(初始速度為零),列車最高時速163 km/h,平均速度100 km/h,列車實際運行11.66 km,共運行420 s。相關參數設置:加速度計偏置誤差10-4g隨機游走;陀螺儀常值漂移0.1(°)/ h,隨機游走GPS 的水平位置誤差均方差為10 m,速度誤差均方差為0.2 m/s。仿真時,去除列車運行360 s 后的GPS 數據,模擬GPS 信號失鎖,因此將運行過程分為了GPS 信號有效和GPS 信號失鎖2 個部分。本文用0~360 s 間的列車位置數據進行網絡訓練,并利用訓練好的網絡對 360~420 s 的列車位置進行預測。
本文從不同參數對模型預測性能的影響、以及模型輸出對單個特征預測效果 2 個方面進行探討。
利用GM(1,1)對經度、緯度、加速度、角速度等數據進行處理。以前 30 s 的經度、加速度數據為例,數據處理的結果如圖4、圖5 所示。

圖4 GM(1,1)處理經度

圖5 GM(1,1)處理加速度
對處理后的數據進行歸一化處理,設定不同的隱含層層數,將當前時刻之前 5 個時刻的列車位置表征數據作為輸入,將后一時刻的表征數據作為輸出,完成LSTM 網絡各項參數的訓練。
不同神經元個數下的均方誤差不同,圖6 是當給定step 為5,隱含層神經元個數為 5~15 時,對應的網絡均方誤差。由圖 6 可知,神經元個數在10~12 范圍內時,均方誤差都相對較小,尤其為12 時,網絡的均方誤差達到最小,訓練達到最優效果。因此最佳神經元個數為12。

圖6 不同LSTM 神經元個數的均方誤差
不同step 下的均方誤差也不同,圖7 為神經元個數為14 時,step 為3~9 對應的網絡均方誤差圖。

圖7 不同Step 的均方誤差
由圖 7 可知,step 過大或者過小都會影響到LSTM 網絡的訓練效果,從 step 為 3 到 step 為 7均方誤差逐漸減小,在 step 為 7 時,均方誤差達到最小,之后誤差又隨之增大,因此最佳的step 應設置為7。
為了驗證本文提出模型的可行性,采用GM(1,1)-ADAM 優化 LSTM 網絡、GM(1,1)-LSTM網絡、LSTM 網絡和BP 神經網絡分別對數據進行訓練,其訓練結果對比如圖8 所示。
從圖 8 中可以看出:GM(1,1)-ADAM 優化LSTM 網絡、GM(1,1)-LSTM 網絡、LSTM 網絡和BP 神經網絡均方誤差分別在 120、138、154 和176 次時達到精度 1×10-4的要求;LSTM 網絡的均方誤差小于BP 神經網絡;使用GM(1,1)預處理后的 LSTM 比未使用 GM(1,1)預處理的 LSTM 網絡均方誤差小;GM(1,1)-ADAM 優化LSTM 模型后,收斂速度和精度都比GM(1,1)-LSTM 網絡有所提高。
根據上述參數分析,確定合適的網絡結構,將7 個時刻的列車數據作為初始輸入,通過遞歸的方法逐步預測列車在360~420 s 時,各個特征的預測結果,并與測試值進行比對運算,即可得到位置誤差。但是在列車位置預測中,本文采用的經緯度并不能很好地反映空間上的位置誤差,因此按文獻[19]中的轉化方法將其轉化為空間上的誤差,轉化公式為:

本文為了更直觀體現 GM(1,1)-LSTM 網絡性能,將其與 GPS 信號失鎖時,SINS 單獨定位和GM(1,1)-BP 網絡處理結果進行對比。圖9 為SINS定位、GM(1,1)-LSTM 網絡和 GM(1,1)-BP 網絡處理結果的空間位置誤差對比。由圖 9 可得:SINS單獨定位時,隨著時間累積,誤差逐漸增大,而使用神經網絡預測的位置誤差相對較穩定;GM(1,1)-LSTM 網絡的空間位置平均絕對誤差比GM(1,1)-BP 網絡小38.32 %。

圖9 空間位置誤差對比
最后,單獨分析使用神經網絡預測每個特征參數的結果,使之能夠更清晰地看出預測位置與實際位置之間的誤差,由此將 2 種神經網絡單一特征進行預測,結果如表 1 所示。由表 1 可看出:GM(1,1)-LSTM 網絡預測結果誤差在單個特征值上整體比GM(1,1)-BP 神經網絡小,但是2 種網絡預測時間間隔的最大值均比較大;在一般情況下,由 GM(1,1)-LSTM 網絡處理的各個特征預測誤差和精度均可滿足列車定位要求。

表1 單個特征參數的預測結果
實時精準地確定列車位置是保證行車安全的重要前提。本文在GPS/SINS 組合列車定位系統基礎上,針對GPS 信號失鎖下,列車定位精度低的問題,將GM(1,1)與LSTM 網絡相結合來滿足列車定位的需求。該方案采用GM(1,1)對傳感器數據進行粗預測以降低原始數據本身的誤差,再使用LSTM 網絡進行訓練并預測 GPS 失鎖下的列車位置,預測結果證明了該算法的有效性。本文通過設定不同的神經元個數、步長,分析了參數的設定對實驗預測結果帶來的影響;為了更好反映該網絡性能,將其與GM(1,1)-BP 神經網絡進行對比,可以發現 LSTM 在解決梯度消失問題的同時,利用其自身記憶特點更好地學習了傳感器數據間的關系。在最終預測結果上,GM(1,1)-LSTM 網絡的空間位置平均絕對誤差比 GM(1,1)-BP 神經網絡小38.32 %。