胥如迅,馬軍惠,孟建軍,2,3,李德倉,2,3,陳曉強
(1.蘭州交通大學機電技術研究所,蘭州 730070;2.甘肅省物流及運輸裝備信息化工程技術研究中心,蘭州 730070;3.甘肅省物流與運輸裝備行業技術中心,蘭州 730070;4.蘭州交通大學機電工程學院,蘭州 730070)
近年來隨著我國鐵路建設網愈加龐大,列車運行環境也愈加復雜,列車設施設備的復雜性、人的不可預測性以及環境的不確定性,有時會引發嚴重的鐵路交通事故[1].例如,2007年2月,開往阿克蘇的5806次列車途徑新疆戈壁大風地區時遭遇強風襲擊造成11節車廂傾覆、34名旅客死亡的嚴重事故;2020年3月途徑郴州市永興縣的T179次列車與入侵線路的滑塌體相撞,造成嚴重的人員傷亡事故;2021年5月,因大風吹揚地膜致接觸網故障造成部分高鐵晚點,導致成千上萬旅客滯留北京西站;由此可見,監測鐵路沿線環境保證列車運行安全至關重要.鐵路運行環境易受自然環境與人為失誤因素的威脅,自然因素方面,強風致使列車脫軌、雨天致使行車軌道濕滑、大霧干擾行車視線以及山體滑坡入侵線路等;人為失誤因素方面,塑料薄膜等異物入侵鐵路限界、鐵路沿線違章作業以及禁牧區違規放牧等[2].
多傳感器數據融合技術作為一種重要的數據處理手段,在醫療診斷、遙感測繪、環境監測等方面有著廣泛的應用[3],尤其在長距離帶狀區域如鐵路沿線、煤礦內部巷道、高速公路沿線以及電網監測等[4]方面具有顯著優勢.我國高速列車運行環境復雜多變,通過部署多傳感器得到的監測數據,其可靠性和準確度比單一傳感器更能達到要求,數據融合技術既能夠適應環境的動態變化又能降低干擾因素對系統的影響[5].因此,研究適用于高速列車運行場景監測的數據融合算法可為后續鐵路數據融合平臺架構提供重要參考.
數據融合技術是運用單模型算法或多種模型組合算法,對多傳感器采集信息進行融合分析處理,使得決策結果的準確度和可靠度更有利于對實際情況的判斷[6].加權算法是眾多學者研究的算法之一,所謂加權是對測量數據分配以合理的權重,其難點是如何分配最優權重以達到最佳的融合結果.文獻[7]在數據傳輸前,利用Grubbs準則排除測量數據中的過失誤差,自適應加權算法融合之前用算術平均和批量估計進行數據預處理,提高了融合精度;文獻[8]在分批估計的基礎上引入修正因子來調節自適應加權因子,提高了融合精度;文獻[9]為克服提前給定的權重因子不適應環境的變化致使決策結果錯誤,綜合考慮數據的一致性、當前權重以及綜合影響因子,使融合結果更加準確;文獻[10]提出了一種ADAEWF算法,提高了融合精度,但該算法只有監測到足夠多的異常數據才能觸發運行;文獻[11]采用分布圖法找到并淘汰異常數據,采用自適應加權融合算法,并通過關系矩陣尋找支持度最高的測量數據代替淘汰的異常數據,該算法提高了數據的完整性.文獻[12]為克服傳統的自適應加權融合算法中測量值選取的弊端,用數值迭代的思想改進對測量值的選取.
綜上所述,在采用數據融合算法之前需要進行一致性判斷,通過定義距離函數求取一致性矩陣,同時求取各傳感器的綜合支持度,從而判定是否存在異常數據并選擇最佳數據集參與融合過程.一方面,閾值的選取依賴大量的數據處理經驗且過于絕對化,導致數據融合結果受主觀因素影響較大,對實際情況易造成誤判;另一方面,異常數據的剔除減少了精度較低的傳感器參與數據融合的可能性,這有違采用多傳感器數據融合的初衷.
本文提出的數據融合算法基于文獻[13]提出的在線迭代與局部融合思想,以一種新的置信距離和自適應加權估計算法為理論基礎,一方面擴大參與數據融合的傳感器數量,增加精度較低的傳感器參與數據融合的可能性,從而提高數據融合精度;另一方面采用自適應加權融和估計算法,自適應的為各個傳感器分配最優加權因子,從而提高融合結果的可靠性,可應用于測量數據龐大的鐵路運行環境數據級融合過程.
自適應加權融合算法的核心思想是:基于總均方誤差最小的前提,利用各傳感器采集數據及測量精度,自適應的為各傳感器分配最優加權因子[14],加權因子分配的越精確,數據融合結果則越貼近真實值,圖1為自適應加權融和估計模型.

圖1 自適應加權融和估計模型Fig.1 Adaptive weighted fusion and estimation model




本文算法是根據新的置信距離測度將關系矩陣變換成對稱矩陣,依據關系矩陣尋找支持度最大的傳感器組,若通過判定處理將傳感器組的測量數據采用自適應加權算法融合處理,融合結果記為復合傳感器的測量數據,并與剩余傳感器的測量數據建立關系矩陣,重復上述步驟,直至不再具有通過判定處理的數據為止;在線迭代過程中發現某些局部融合結果與其它傳感器的測量數據間具有潛在一致性,可以更充分地發掘多傳感器測量數據的效用,有效地改善多傳感器判定數據一致性后直接剔除異常數據的弊端.具體的算法處理流程如圖2所示.

圖2 算法處理流程Fig.2 Algorithm processing flow chart
本文使用Matlab進行仿真,表1為6個傳感器在7個采樣時刻測量的同一特性參數,特性參數的實際值為50.表2為各傳感器的測量精度.

表1 傳感器采集數據Tab.1 Data collected by sensors

表2 傳感器測量精度Tab.2 Sensor measurement accuracy

可見,r25=1為上三角矩陣中最大值且大于門限值0.01(此例中上限值取0.01),表明傳感器X2和傳感器X5的支持度最大,對這組傳感器采用自適應加權方法融合,得到:

將上式計算結果看作是復合傳感器X(2,5)的一次測量數據,此時變成了一個5傳感器組,表3為5傳感器組的測量數據及其精度.將上式結果看作是復合傳感器X(2,3,5)的一次測量結果,此時還剩4傳感器組,限于篇幅,這里不再贅述關系矩陣的計算結果,僅列出每次得到的上三角矩陣中支持度最大值以及自適應加權融合結果.

表3 5傳感器組采集數據及精度表Tab.3 Data collection and precision table of 5 sensor group

1)進行局部融合后剩余為4傳感器組,計算關系矩陣,得出傳感器X1和傳感器X4支持度(r14=0.478 4)最大且大于門限值0.01,因此將傳感器X1和傳感器X4的監測數據采用自適應加權進行局部融合得到:

2)進行局部融合后剩余為3傳感器組,計算關系矩陣,得出復合傳感器X(1,4)和復合傳感器X(2,3,5)支持度(r=0.082 9)最大且大于門限值0.01,因此將傳感器X(1,4)和傳感器X(2,3,5)的測量數據采用自適應加權進行局部融合得到:

3)進行局部融合后剩余為2傳感器組,計算關系矩陣矩陣,得出復合傳感器X(1,2,3,4,5)和傳感器X6支持度(r=0.004 3)最大但小于門限值0.01,因此不再進行融合,通過比較剩余的2個傳感器組,選取融合精度最高的一個,即復合傳感器X(1,2,3,4,5),最終融合結果為:

為驗證本文算法的有效性,將數據融合結果與算數平均值法(算法1)、傳統自適應加權估計算法(算法2)所得結果進行對比,如表4所示.由表4可以看出本文所提算法極大的提高了估計的參數精度且誤差更小,具有較高的可靠度和準確性.圖3是表4中對應的算法仿真結果對比圖,本文算法在融合結果上更趨于實際值,且更收斂,而使用算法1和算法2得出的融合結果將大打折扣.

表4 各融合算法數據融合結果對比Tab.4 Comparison of data fusion results of each fusion algorithms

圖3 各融合算法數據融合結果對比Fig.3 Comparison of data fusion results of each fusion algorithms
圖4為不同融合算法在各采樣時刻下的絕對誤差與相對誤差變化過程,從絕對誤差變化過程來看:使用算法1仿真后的融合結果與實際相差較大,且絕對誤差變化劇烈;使用算法2對數據進行處理后,系統的絕對誤差顯著降低,但仍然存在較大誤差且變化幅度有所緩和;使用本文算法絕對誤差低于前兩種算法且變化平緩呈收斂趨勢.在時刻精度最低的傳感器測量數據誤差大,使用算法1和算法2得到的融合結果絕對誤差過大,而使用本文算法可以在迭代的過程中有效的避免該數據參與數據融合,在、時刻,傳感器的其測量數據誤差小,在迭代過程中參與了數據融合,有效的證明了本文算法抗干擾能力強,增加了精度較低的傳感器參與數據融合的可能性,因此,本文提出的數據融合算法估計的參數精度明顯提高且誤差小.

圖4 各融合算法的誤差對比Fig.4 Error comparison of each fusion algorithm
本文探討了高速列車運行場景監測數據融合問題,針對現有數據融合方法的缺點,運用在線迭代與局部融合的思想,將支持度高的傳感器組進行局部融合,其結果記為復合傳感器測量數據,以發現更多的潛在數據一致性,既避免異常數據參與融合處理,又提高了融合結果的準確性和可靠度,可應用于測量數據龐大的鐵路運行環境數據級融合過程.需要指出的是雖然本文提出的方法需要付出一定的計算代價,每次局部融合后產生的新的復合傳感器要與其他傳感器進行一致性判定,增加了一定的計算量,但是由于計算機水平的發展,這是可以克服的.