劉 運
(中國鐵道科學研究院集團有限公司,北京 100081)
為了滿足日益增加的客貨運量需求,中國鐵路也逐步向高速、高安全、智能化轉型。高鐵的誕生給鐵路運維系統帶來挑戰。一方面,列車高速運行狀態下,關鍵部件的磨損、消耗、損壞等問題帶來較大的運維壓力。另一方面,2006 年中國“十一五”推行的節能減排號召也限制了鐵路運營維護成本效益。如何進一步提高運維效率、經濟性一直是鐵路運維行業研究重點。
當前,絕大多數鐵路基礎設施均暴露在室外環境中,惡劣天氣以及風雨雪侵蝕進一步加大運營維護工作量。此外全球的絕大多數鐵路已經運營數十年,例如,據統計韓國 42% 的鐵路橋與 47% 的鐵路隧道已經服役超過30 年[1],維護頻率維護難度逐年增加。既有運維系統往往依賴于人工巡檢,并手動將設備狀態信息上傳至運維中心,對于世界各國而言,鐵路運維保養依舊是鐵路公司的一項巨大支出。圖 1 為鐵路系統示意圖,圖中鐵路系統包含車輛、軌道、橋隧、接觸網、軌旁通信信號裝置等多個子系統。鐵路運營公司應當保障各個子系統持續安全、可靠運行,一旦任一子系統出現不安全因素,將危害整條鐵路運營。國際方面,瑞士國家鐵路采用了SAP 公司的資產智能網絡。該網絡進一步提高供應商數據交換的效率,確保機車構型數據和其他設備數據的及時準確完整,將使維護更加容易和高效。國內方面,中國中車股份有限公司提出的基于IoTDB 時序數據庫的智能維修體系架構。該架構可實現毫秒級實時數據接收,TB 級數據存儲,以及設備狀態實時監控。

圖1 鐵路系統示意圖
鑒于鐵路行業運維壓力較大,中國鐵路開始研究如何高效完成運營維護以及延長鐵路基礎設施壽命,提出了基于狀態維修(CBM)的運維概念[2-5]。CBM 強調維修計劃應當根據當前設備狀態制訂。從傳統運維角度出發,無論設備使用頻次、設備當前狀態,均需按時執行運維保養。雖然傳統運維方式可以保障設備正常運行,但可能會替換、修理原本正常的設備,增加不必要的運維成本。如果采用CBM 理念,運維人員可根據當前設備狀態僅維修損壞、磨損的設備,進一步延長鐵路基礎設施壽命。
鐵路運維保養的目的是保證各個關鍵設備時刻保持正常運行狀態。正如前文所述的CBM 概念,運維人員應逐個檢查設備狀態并根據設備狀態進行必要的養護、保養或替換。圖2 為CBM 步驟。首先運維人員根據設備使用說明書,逐個檢查設備狀態。此時,需要運維人員到設備安裝現場并衡量設備的可靠性指標。根據指標情況,確定設備狀態以及設備是否需要維護、維修。隨后根據設備重要性、損壞磨損嚴重程度、運維預算對運維項目劃分優先級。最后根據優先級執行維修、維護以及保養。

圖2 基于狀態維修的運維流程
基于狀態維修的局限性主要體現在以下兩點:
(1)檢查效率。由于傳統CBM 需要檢測人員前往現場測量現場情況后方可決定維護執行順序,如果設備距離車站、工點較遠,人工往返檢測比較耽誤時間。
(2)人力成本。當需要檢查的設備數量過多時,可能需要雇傭更多的檢測人員以在短時間內完成設備檢修,此時人員投入成本便會增加,當運維預算一定的情況下,更多的人力成本意味著分配在設備維修上的預算會進一步減少。
以上兩個局限性可通過將基于狀態維修和物聯網技術結合起來解決,解決方案將在下文分析。
正如前文所述,傳統CBM 方案大多通過人工檢查判定設備狀態,運維成本較高。物聯網技術發展帶來的萬物互聯、萬物智聯等概念重新定義人物交互手段,物聯網終端可實時監測設備自身運行數據、狀態信息,并上傳至物聯網網絡。運維人員可遠程實時查看設備當前情況并制訂運維保養計劃[6-7]。
物聯網終端的設備狀態感知主要分為三個部分:感知、接入和處理。在感知部分,傳感器負責收集鐵路基礎設施、車輛、軌道的信息。接入部分無須人工操作,傳感器自動收集設備狀態數據并通過無線通信鏈路上傳至物聯網。處理階段,物聯網通過結合各專業的傳感器數據進行跨學科計算分析,通過計算結果決定設備是否需要維護保養。
為了能實時掌握系統內各部件的可靠程度,需要在鐵路干線、股道、站場等多種場景下布設物聯網終端以收集信息,同時也要保障物聯網終端設備本身的可靠性。通常鐵路設備的生命周期一般為部署后的5~10 年。設備正常運行主要依賴于設備本身的可靠性以及功耗[8]。
可靠性側面反映了設備在損壞前運行了多長時間,由平均無故障時間(MTBF)表示。通常來說,根據設備重要程度,要求鐵路設備MTBF 介于50 000~100 000 h 之間。對于功耗而言,要求設備在沒有供電條件下依舊可以持續工作較長時間。盡管靠近站場的設備可以通過線纜供電,但是對于地形較為艱險供電線纜故障的情況需要設備靠自身電池繼續運行,因此,物聯網終端應盡量降低功耗。
為了承載數據傳輸,基于物聯網的狀態維修系統需要包含多個子系統(例如LTE/5G 無線通信系統)。但系統復雜度、物聯網終端的功耗將會進一步提升,雖然可采用藍牙設備降低終端功耗,但是通常藍牙設備監測距離較短,為了覆蓋同一區域可能會需要部署更多設備,使用藍牙設備可能并不經濟。此外,系統應能從眾多傳感器傳輸的組合數據中分析出設備狀態,在設計系統架構時,應考慮接入平臺、設備、服務的多樣化問題。
圖3 為基于物聯網與狀態維修的運維系統解決方案的示意圖,系統中,傳感器負責實時監測設備的狀態信息并匯聚到設備平臺,隨后設備平臺向上傳輸至物聯網。狀態信息通過物聯網匯聚到平臺服務器。最后由平臺服務器對設備情況進行排序、處理以及分析,并及時反映給現場的運維管理人員。
設備平臺應能支持傳感器的基本功能并在終端側采用較為靈活的架構設計以應對多種傳感器數據的組合接入。如圖3 所示,設備平臺包含功能模塊(硬件聚合層),功能模塊僅負責硬件層面操作。此模塊僅為多種傳感器提供設備接口,不更改傳感器數據內容,隨后上傳至設備平臺,設備平臺對數據進行分析處理后通過其無線通信模塊上傳至物聯網。
為了保障整個系統的可靠性,要求設備平臺在服役期間保持良好的可靠性。同時也要求設備平臺根據接入通信制式(例如 LTE 或5G-R)采取適當的功耗優化策略。例如在通信方面,物聯網終端的電池續航時間取決于設備喚醒狀態下的工作強度。以LTE 制式為例,設備最初處于空閑(IDLE)狀態,并在每個不連續接收周期(320~2 560 ms)后喚醒開始監聽基站信號。正是因為基于設備狀態維修所產生的數據量較小,數據收發頻次較低,所以LTE 終端設備的電池續航與不連續接收周期成反比。
網關設備應有較強的計算能力以解析各種物聯網協議,但網關設備往往功耗低,不具備遠程傳輸能力。如圖3 所示,鐵路物聯網場景下,有長距離數據傳輸和短距離數據傳輸兩種情況,網關通過短距離無線通信鏈路從設備平臺收集數據并通過長距離通信系統上傳至物聯網。

圖3 基于物聯網與狀態維修的運維系統解決方案示意圖
平臺服務器負責監管數據收集、數據上傳過程,并處理底層設備生成的設備狀態數據,分發給運維管理人員。平臺服務器可遠程配置、管理設備平臺,并根據實際情況需要控制設備平臺采集更多數據。同時應重點關注與行車安全相關的數據完整性,平臺內部應設置相應的服務質量保障機制以保障行車安全相關數據完成無差錯傳輸。為了便于物聯網識別潛在故障設備,第4 章分析了一種基于模型的設備狀態預測方法。
(1)基于設備狀態維修的監測時間點為離散分布,物聯網終端在監測時間點監測設備狀態并傳輸至設備平臺。
(2)在設備發生故障前一般經歷兩個階段,第一階段定義為從設備部署到設備可能發生潛在故障的時間;第二階段為從潛在故障時間到故障發生時間。
(3)只有在第二階段,才能基于設備狀態-設備維修、替換需求進行建模。
(4)兩個階段相互獨立,可靠度分布可通過常用分布模型模擬。
(5)在第二階段的設備狀態為一隨機向量,可使用一個以設備使用壽命為參數的分布函數描述,具體見公式(1):

式中,i——正整數;ti——第二階段中第i個狀態監測時間點;Si——第i時刻時設備壽命。
該節重點關注在物聯網終端獲取狀態信息條件下對設備壽命信息進行建模,求出設備壽命密度函數。根據公式(1)可知設備壽命只有在設備壽命大于兩次監測時間差的時候才有意義。公式(2)為設備壽命密度函數。

式中,yi——時刻i物聯網終端捕獲到的設備狀態信息;Yi——從時刻i以前的歷史設備狀態信息的集合;f(Si/Yi)——時刻i時設備狀態信息。通過貝葉斯定律可知式(2)可進一步展開為:

將上述公式反復迭代后可得出:

通常來說當設備初次部署時設備情況為未知數,即當i=0 時Y0為未知數,可用正態分布、韋布爾分布以及對數正態分布等描述。通常情況下大部分設備服從雙參數韋布爾分布,具體如下:

其概率密度函數為:

式中,β——形狀參數;η——為物體集合參數,并定義θ=ηβ,則設備可靠度為:

因此每個設備可根據公式(8)計算出設備可靠度指數,每個設備可使用軟件仿真計算出β和η的數值,并根據設備具體情況制定設備可靠指數下限值,當設備可靠性指數低于下限值時,須對設備進行維修、替換,否則暫時不用進行維修。
該文研究了一種基于狀態維修的物聯網智能運維系統方案以及設備可靠性的計算方式。物聯網終端實時感知設備狀態并上傳至平臺服務器,服務器通過計算當前設備可靠性指數決定是否需要維修以及維修工作的優先級,最后平臺服務器按優先級將運維工作推送給現場管理人員。該系統可有效減少鐵路運維行業的人員成本投入,使得運維管理人員可實時、遠程查看設備狀態,并在設備出現故障時可根據設備維修業務優先級安排養護維修任務。該文僅采用韋爾布分布方式計算設備可靠度,其他分布形式的可靠度計算研究不在該文研究范圍內,相關問題有待進一步研究。