李 竑 上海鐵路局電務處
GSM-R網絡運維數據分析系統的研究
李 竑 上海鐵路局電務處
目前常用的一些GSM-R網絡運維子系統,多偏重于自身環節的故障處理,系統間缺乏聯動,其功能離完整、全面地提供GSM-R系統維護、管理的技術支撐需求還有相當的距離。GSM-R網絡運維數據分析系統主要從大數據技術角度將GSM-R網絡各運維子系統的數據進行整合和深度挖掘,可對C3無線連接超時故障進行自動分析,并對GSM-R網絡運用質量進行趨勢分析,為全面掌控GSM-R網絡運行情況提供有效的技術支撐手段。
GSM-R網絡;C3無線連接超時;自動分析;大數據技術
自GSM-R系統開通運用至今,維護單位已經陸續具備了多種GSM-R系統的運行支持手段,涵蓋了GSM-R網絡管理、接口監測、無線覆蓋等方面。這些系統從GSM-R網絡不同的環節進行數據采集,提供GSM-R系統維護所需的統計、故障排查、性能監測等手段。但普遍存在系統間缺乏聯動、系統缺乏自動分析能力、系統設計偏重于故障處理和性能監測等問題。
為解決上述問題,就需要建立一個綜合的GSM-R網絡運維數據分析系統,該系統應能將各種相對獨立的GSM-R運維系統的數據進行整合,將GSM-R網絡的性能數據、接口監測數據、無線覆蓋數據、基礎數據、地理信息(GIS)數據等進行統一分析處理,最終實現對數據深度挖掘,提高數據利用效率,提供對數據的匯總分析和趨勢分析,在實現C3無線連接超時業務故障快速診斷及原因分析的基礎上,對GSM-R網絡質量變化發展趨勢實現預判,以提升GSM-R網絡運行質量和維護管理水平。
1.1 軟件架構
系統軟件架構主要分為數據采集、數據聚合、數據挖掘、數據呈現等四個功能部分,如圖1所示。
數據采集:系統自身沒有數據錄入的需要,其數據全部來自各類專業子系統,可通過標準接口進行對接采集所需數據。
數據聚合:采集到的數據主要有結構化與非結構化兩種類別。系統可分別對兩種數據進行處理,生成系統可用的數據源。
數據挖掘:系統采用物理存儲與業務邏輯分別處理的方式,運用大數據手段將數據的業務邏輯層單獨處理,處理后的數據可用于系統呈現及輸出。
數據呈現:將最終數據以統計分析、結果輸出等形式實現人機交互。

圖1 GSM-R網絡運維數據分析系統軟件架構
1.2 數據處理架構
GSM-R網絡運維數據分析系統作為GSM-R網絡的綜合運維管理分析系統,可以將現有的GSM-R網絡運維相關數據接入到平臺中,包括GSM-R接口監測系統、動車綜合檢測系統、GSM-R設備網管系統、GSM-R無線路測系統、列控設備動態監測系統等。
因接入的系統較多、數據格式復雜(結構化數據、半結構化數據、非結構化數據)、數據深層次運用及系統智能化分析等因素,所以系統采用了大數據處理技術。數據處理架構如圖2所示。

圖2 GSM-R網絡運維數據分析系統數據處理架構
C3列控車地信息傳送是目前GSM-R網絡承載的最重要一項業務,由于C3無線連接超時可能會引起C3降級,嚴重時會導致列車停車從而對正常的列車運行秩序造成影響,所以C3無線連接超時分析需要及時、快速、準確。上海局是高鐵大局,每天上線運行的動車組非常多,因此,C3無線連接超時分析是目前各級GSM-R維護人員最為重視,也是最為繁重的一項工作。下文主要對GSM-R網絡運維數據分析系統的C3無線連接超時自動分析功能進行重點介紹。
2.1 C3無線連接超時基本概念
C3無線連接超時是指車(ATP)或地(RBC)在規定的時間內沒有接收到對方發送的應用層數據。在C3系統的ATP、RBC中定時器T_NVCONTACT設置了2個C3應用層數據包正確接收的時間參數,目前該定時器設置為20 s。
C3無線連接超時引起的降級故障是指列車采用C3系統控制列車運行時,由于RBC與OBC之間無線連接超時使得列車在速度降低到C2系統允許的運行速度后自動轉換到C2系統運行。
2.2 C3無線連接超時原因分類
C3無線連接超時原因主要分為三類:通信原因、信號原因和不明原因,這三種類型的原因又可根據具體故障原因進行細分,常見的原因分類如表1所示。

表1 常見故障原因分類
2.3 C3無線連接超時自動分析
通過對大量C3降級故障案例的研究分析,同時吸取維護人員積累的分析經驗,在總結C3降級故障類別判斷關鍵點的基礎上,系統確定了C3無線連接超時自動分析的流程(如圖3所示)。

圖3 C3無線連接超時自動分析流程圖
2.3.1 理清拆鏈流程
判斷首先發起拆鏈的單元和網絡連接釋放時的原因值,這是判斷降級故障歸屬和原因的重要參考。比如,若是 BSC 或 MSC首先發起的拆鏈,那么極有可能是通信網絡方面的原因導致的降級;若是 RBC應用層發起的拆鏈,那么降級的主要原因就首先考慮在 RBC方面。
2.3.2 檢查 GSM-R網絡狀態
(1)檢查連接釋放前 Abis接口信令流程和上下行話音質量、電平值。
(2)檢查信令流程以判斷是否有未完成的切換,判斷是否因 T3103超時或 RLT超時引起掉話。
(3)通過讀取降級前的測量報告判斷上下行話音質量和電平值是否發生劣化,判斷是否因無線網絡質量或ATP異常引起掉話。
2.3.3 檢查列控用戶數據傳輸情況
重點查看PRI接口監測數據是否有以下現象:
(1)判斷連接斷開前,PRI接口持續 5 s以上各層均無任何數據交互。
(2)判斷降級發生時的車地通信場景,比如是否處于RBC交權區。
(3)判斷是否有OBU或RBC不響應對端應用層消息的情況。
(4)判斷鏈路層上下行鏈路是否可達,是否有標志通信異常的數據類型。
2.3.4 綜合GSM-R網絡狀態和列控用戶車地通信情況判斷C3降級故障類型
(1)若是因為通信連接質量差導致 RLT超時或切換時T3103超時引起的車地通信中斷,或 MSC/BSC設備故障引起連接異常釋放,判為通信原因。
(2)若通信連接質量良好,由于列控系統用戶層,EuroRadio安全層、傳輸層或鏈路層出現不符合協議規范的異常,從而發起連接釋放,判為信號原因。
(3)對于三個接口均未發現異常,不能確定是列控系統車載端、地面端或GSM-R網絡中某一方原因的情況,在本文的研究中暫時將其歸為“不明原因”類。
除了對C3無線連接超時進行自動分析,GSM-R網絡運維數據分析系統還可根據維護管理需要,通過采集大量的網絡運行數據,進行大數據的分析,進而實現GSM-R網絡運行質量趨勢分析。
該平臺通過采用分層次的評估體系以達到簡化無線通信系統評估復雜度的目的。根據 GSM-R無線通信網絡對C3列控系統影響的不同層面,將評估體系分為系統層評估、業務層評估及資源層評估。其中對 GSM-R無線通信網絡RAMS指標的評估稱為系統層評估,對 GSM-R無線通信網絡對其所承載業務的影響的評估稱為業務層評估,對 GSMR無線通信網絡的基本通信能力的評估稱為資源層評估。
GSM-R網絡綜合質量評價方法由兩部分組成,一部分是基于歷史數據的分析,另一部分是計算基于指標標準值的分析,最后通過加權求處理得到綜合評價的結果。主要算法流程如圖4所示。

圖4 GSM-R網絡綜合質量評價流程圖
GSM-R網絡運維數據分析系統將GSM-R系統的網絡資源、網絡性能數據、接口監測數據、無線覆蓋及干擾數據、用戶數據、地理信息(GIS)數據等進行統一分析處理,建立了GSM-R系統運行數據倉庫和數據間的相互關聯,實現了C3無線連接超時故障快速智能診斷及原因分析,提高GSM-R系統業務運用質量;系統還可對GSM-R網絡綜合質量進行客觀綜合評價。該系統自2016年3月起部署應用以來運行穩定,界面簡潔友好。維護人員通過使用系統的網絡性能分析,C3無線連接超時自動分析,報表生成與管理,接口信令回溯等功能,能有效提升GSM-R網絡的維護和C3無線連接超時分析工作的效率,對加強GSM-R網絡的維護管理工作,提升GSM-R網絡維護管理水平和運行質量有著很好的現實指導意義。
[1]鐵道部科學技術司,鐵道部運輸局.CTCS-3級列控系統總體技術方案. 2008.
[2]鐵道部科學技術司,鐵道部運輸局.2009.CTCS-3級列控系統與GSMR網絡系統接口規范.
[3]鐵路通信技術中心.王買智.《C3通信超時分析方法的研究》
[4]《GSM-R綜合網絡管理系統研究與實現》.
責任編輯:許耀元
來稿日期:2016-11-08