周利萍,郭立網,于世武,趙 飛,王建坤
(1. 中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081;2. 中國國家鐵路集團有限公司 運輸調度指揮中心,北京 100844;3. 北京經緯信息技術有限公司,北京 100081)
鐵路客車輪對踏面硌傷是旅客列車運行途中壓過軌面異物導致輪對踏面異常的一類鐵路客車運用故障[1]。由于輪對踏面發生硌傷后會影響旅客列車的運行品質和旅客乘坐舒適性,超限的踏面硌傷更是影響列車運行安全、平穩和輪對使用壽命的重要因素[2-3]。如何及時高效的排查、找到并處理鋼軌異常點,減少對后續運行列車的影響,是當前鐵路調度部門亟待解決的問題。
目前,鐵路部門對于車輛運行過程中發生的踏面硌傷分析仍采用傳統人工方式,分析結果取決于調度人員工作經驗和技術資料的準確性,分析過程耗時長且分析結果質量不高,導致在故障處理時造成了機輛設備和人力資源的浪費。因此,研究利用信息技術手段構建客車輪對踏面硌傷自動分析系統,精準指導現場人員排查處理鋼軌故障點,最大程度減少對后續運行列車的影響,提高旅客列車的運行品質和旅客乘坐舒適性,就成為了現階段的迫切需要。
本文研究的鐵路客車輪對踏面硌傷自動分析系統(簡稱:系統)利用大數據分析技術對硌傷列車的運行軌跡進行串接和分析比較,計算硌傷列車運行徑路的最小重合區段,分析故障影響范圍,為調度部門排查出鋼軌的故障點提供決策輔助,最大程度減少對后續列車的影響。
系統主要分為應用層、業務邏輯層和數據層,其架構,如圖1 所示。

圖1 系統架構示意
1.2.1 硌傷排查
實現硌傷基礎信息的快速采集、匯總與展示。中國國家鐵路集團有限公司(簡稱:國鐵集團)調度員向各鐵路局集團公司發起硌傷排查的指示,完成管內硌傷車次基本信息的填報、上傳。需要采集的基礎信息包括:硌傷發現日期、輪對數量、列車型/車組號、車次交路等,這些信息將作為硌傷自動分析系統的數據源輸入。
1.2.2 自動分析
(1)數據處理
根據各鐵路局集團公司硌傷排查的結果,系統對其數據關聯處理和計算,完成所需數據源的加載、數據格式統一、基礎字典統一、錯誤數據清洗等多種數據融合計算。根據業務特征對數據進行關聯分析和匹配,包括:對硌傷基礎信息與列車、運行線、編組之間的關聯,列車全息數據的生成,故障列車運行重合區間的計算。
(2)影響范圍分析
結合客車開行日班計劃和列車實際運行圖數據,對將要經過發生硌傷區間的客運列車進行影響范圍分析,提供受影響列車的車次、到發時間、當前到發站、編組信息,便于調度部門根據掌握的故障信息和將要產生的影響程度,對后續列車進行有目的的限速控制或扣停。
1.2.3 故障定位
結合硌傷發生時的所在線路、上下行方向、公里標及鐵路運營網絡圖等基礎信息,利用GIS 技術將硌傷列車運行的重合區段在鐵路網地圖或列車運行圖上進行標記和定位,提供車站的詳細位置及列車的全程運行軌跡。
1.2.4 統計分析
提供硌傷信息的階段統計,分時段從局別、線別、車型車組、設備設施生產、管理單位等各個方面深入分析,集中展示,方便調度員根據歷史數據對重點運行線路和區段進行分析、監控,對多次發生硌傷的線路或區段預警提示,便于調度部門提前發現影響安全環境的潛在因素和薄弱環節,從而提高客運列車運營安全管理水平。
由于系統使用的數據來源眾多,除通過本系統進行硌傷排查所得的硌傷基本信息外,其他數據均來自各個外部系統,如行車調度實際運行圖來自TDCS/CTC,客運編組信息來自客車管理信息系統,客運日班計劃來自綜合調度系統等。
數據處理從既有的生產系統中抽取硌傷自動分析所需的各種生產數據,根據其相關的業務特性分析、匯集形成支撐本系統功能的數據環境。具體包括以下幾方面內容。
(1)數據采集
通過與各外部系統定義的Web Service 接口,采用定時和實時相結合的方式,從相關信息系統采集列車工作日計劃、實際運行圖及列車編組等數據。
(2)硌傷車次與列車運行線信息關聯
以硌傷車次為對象,通過車次與時間識別列車在運行圖上的實際運行徑路信息,建立硌傷車次與實際列車運行線之間的聯系。
(3)客運日計劃與運行圖實際信息關聯
客運日計劃中有車次和列車時刻信息,但只有大的客運站信息。列車實際運行圖有詳細的車站信息,但列車運行信息通常是由多個調度臺的調度信息組合而成,一列列車有多條運行線信息[4]。在本文中,以客運日計劃為基準,通過車次和車站,將實際運行圖的詳細徑路與時間信息補充客運日計劃中各節點,通過計劃與實際的關聯,生成客運列車的完整運行軌跡。
(4)客車對象信息的全息集成
從多個角度對比合成一個完整的實際開行的客運列車對象信息,針對硌傷車次,能夠展示每一列客車的車次、全程時刻、車底交路、編組信息、旅客乘降信息、機車信息、乘務信息等相關信息。
(5)重合區段的分析
根據已生成的所有硌傷車次的完整運行軌跡和列車全息信息,利用大數據技術對徑路集合中的所有車站進行關聯分析,找出其頻繁項集,結合線路、車站基礎字典及車次交路運行規則,剔除頻繁項集中的冗余干擾信息,從而找到硌傷車次的共同運行最短徑路,為調度部門排查找到運行線路異常點,為及時處理提供指導性方案。
故障影響范圍分析可以輔助調度部門掌握軌道故障產生的影響程度,以便進一步制定有效的預案措施。根據系統的自動分析功能模塊計算出列車發生硌傷的故障區段后,從客運日計劃和列車實際運行圖的關聯信息中搜索所有未來一段時間內將經過故障區段的客運列車運行全息信息,包括列車的車次、始發站、終到站、當前所在車站,以及計劃到達所查詢站的時間、列車司機和旅客乘降信息,實時估計出列車晚點時間,以便調度人員根據實際情況和調度規則對后續列車進行有目的的限速控制或扣停。
通過前面的研究,系統根據各鐵路局集團公司要求完成的硌傷排查結果,利用大數據關聯分析方法計算出發生硌傷的列車實際運行軌跡及最小運行重合區段,對故障線路影響的列車范圍進行分析,形成一個指導現場排查方案,以電文或調度命令的形式下發相關鐵路局集團公司調度所,指導現場及時發現故障點進行處置。
由于系統中需要處理的主要數據來源TDCS/CTC 系統的列車運行線信息,而TDCS/CTC 系統中的列車運行線是按照調度臺指揮列車運行的[4],不同調度區段存在跨調度臺運行列車的運行信息無法自動連續記錄和存儲的問題[5]。所以,關聯數據處理要解決客運列車運行線串接問題,只有將多條跨調度臺或跨鐵路局集團公司的列車運行線拼接后,才能為故障車次生成完整連續的列車運行軌跡,而完整的列車運行軌跡對排查故障車次最短共同運行徑路,以及分析故障影響范圍提供直接的決策依據。
為有效地將同屬一列列車的運行線信息串接起來,需要判定在不同列車調度臺的多條運行線信息是否歸屬于同一列列車[6]。本文采用的判定方法如下:
(1)將客運日計劃數據加載到內存,并定期更新同步客運日計劃的數據;
(2)以客運日計劃為依據,用新進入的運行圖數據的車次(可變)、車站分別與日計劃中的車次、車站進行匹配;
(3)如果匹配成功,再匹配列車到達(出發)車站的時間,如果時間在一定的誤差范圍內,就認為是同一列列車。
在處理過程中也遇到一些問題,如:車次命名不規范的問題;行調數據缺失;客運日計劃中的開行數據粒度較粗,客運站與行調站不一致等問題。系統在處理這些問題時會根據調度規則創建相關映射字典,對于字典無法解決的問題,則通過業務功能界面進行問題車次的提示,由用戶人工確認后形成經驗字典庫,為大數據關聯分析奠定基礎。
考慮到系統所使用的數據源如行車調度運行線數據、客運日計劃、鐵路線基礎數據等數據量日益攀升,對于海量數據引發的數據存儲、數據查詢等問題,本系統中引入了海量數據處理技術和大數據處理平臺,如圖2 所示。
Hadoop 是一個基于Java 的分布式密集數據處理和數據分析的軟件框架,如今已在各個領域被廣泛使用,能夠對海量數據進行存儲和計算分析[7]。本系統數據處理是從既有的外部系統中抽取硌傷自動分析相關的各種生產數據。對于列車運行線歷史信息、基本圖信息、線路、車站等基礎信息利用大數據采集工具導入Hadoop 平臺,按照列車運行車次、行車區間等不同的組織方式,存放在數據倉庫中,便于歷史分析。對于列車運行的實時軌跡信息、客車開行日計劃、編組等信息直接存入關鍵值數據庫,便于實時處理和查詢。

圖2 大數據解決方案
Spark 提供了一整套閉環的大數據應用分析解決方案,基于內存的迭代計算框架,適用于需要多次操作特定數據集的應用場合[8]。對于硌傷數據分析,使用Spark 分布式計算技術來實現列車運行軌跡最短共同運行徑路的計算與故障影響范圍分析。最短共同運行徑路的計算涉及上百條列車運行線,成千上萬個行調站點的數據,需要對這些數據進行反復的迭代分析、比對,并利用調度規則將數據中的錯誤信息進行剔除,最后確定這些列車的最短重合運行區段。故障影響范圍分析則利用實時數據分析將經過最短重合區段的所有列車及關聯信息快速提取出來,為調度指揮決策評估提供最直接的行車方案調整依據。
系統已經在國鐵集團和鐵路局集團公司動車和車輛調度崗位得到了廣泛的應用,通過自動分析和計算故障列車的重合運行軌跡和影響范圍,對故障區間進行自動定位,形成一個指導現場排查的方案,及時通知相關鐵路局集團公司調度所,指導現場進行故障排查處置。
根據鐵路部門2019 年的統計數據,普速旅客列車發生10 次輪對踏面硌傷,涉及上百組客車車體,動車組發生13 次,涉及更多的動車組車底。通過本系統的自動分析功能,不僅縮短了調度員進行硌傷分析的時間,降低了調度人員的勞動強度,提高了定位和排查故障的效率,也減少了機輛設備和人力資源的浪費。
隨著客運列車的提速、客車開行數量的急速增加,客車輪對踏面硌傷問題也日益突出,傳統的人工分析方法效率低下且運營成本高,基于大數據處理技術的自動分析系統的建設正好解決鐵路部門的這個問題,未來隨著列車運行圖、客運日班計劃等數據源質量的提高和線路設備基礎數據的統一規范,結合歷史事件記錄庫的積累和修正,將逐步提升故障分析結果的精準性,推動運輸調度工作向高質量高效率發展,提高運輸調度指揮的自動化、智能化水平。