劉福新
(1.北京全路通信信號研究設計院集團有限公司,北京 100070;2.北京市高速鐵路運行控制系統工程技術研究中心,北京 100070)
基于RCM理論的計算機聯鎖系統維護的探討
劉福新1,2
(1.北京全路通信信號研究設計院集團有限公司,北京 100070;2.北京市高速鐵路運行控制系統工程技術研究中心,北京 100070)
RCM理論對系統維護的主要思路是深入分析系統所具有的各項功能和故障模式,明確系統故障所產生的后果, 在充分利用其固有可靠性的前提下,制定出各故障的預防性措施。將這一理論運用到計算機聯鎖系統維護工作中,優化系統的維護策略,達到系統安全、可靠的運行。
RCM;計算機聯鎖系統;維護;系統故障;安全可靠性
隨著我國高速鐵路的飛速發展,計算機聯鎖系統作為信號設備的核心系統之一,其性能的優劣對鐵路運輸安全起著決定性作用,因此對聯鎖系統的安全性、可靠性提出更高的要求。計算機聯鎖系統在其使用周期內能否安全、穩定的工作,很大程度上取決于合理的維護和科學的管理。因此,建立一套合理有效的維修策略模式,是我們面臨的一項新課題。RCM理論的提出,為我們提供了計算機聯鎖系統新的維護思路。
以可靠性為中心的維護(Reliability Centered Maintenance,RCM)是一種維修的理念、策略和模式;是圍繞可靠性維護這一特征,用以確定設備預防性維護需求的一種系統工程方法,也是優化各種設備維護制度的首選方法。
對于計算機聯鎖系統,RCM也可以定義為:按照以經濟的、最低的維護成本保持設備固有的安全性和可靠性。通過對故障數據進行匯總、分析、建立故障案例庫、專家評審等手段,以提高系統可靠性為目標優化系統的維護策略。
計算機聯鎖系統的故障包含硬件故障和軟件故障兩個方面。硬件故障分為永久性故障、間歇性故障和瞬時故障。
永久性故障一般是由于系統內板卡故障,線纜斷線等因素導致,故障處理前,故障現象會永久存在。間歇性故障指設備故障現象頻繁發生且能夠自動恢復,通常由于元器件的性能發生變化導致工作不穩定,或板卡、線纜接觸不良等原因導致。瞬時故障一般是由于外界干擾導致系統突發性故障。
永久性故障和間歇性故障的處理,通常是先用備件替換故障設備,恢復系統的正常使用,然后對故障現象、故障設備進行分析,找出具體的故障點。對于瞬時故障,一般故障原因很隱蔽,應先恢復系統正常使用,然后再對故障發生前后的外界因素進行匯總、分析,找出引起故障的干擾源。
軟件故障是由于軟件中數據配置錯誤,或軟件邏輯存在的缺陷導致。對于軟件問題,生產廠家要通過電務維修機等方式獲取故障時間段的數據,試驗室進行故障回放、模擬試驗等手段查找軟件中錯誤的地方,然后再按照各個路局、電務段規定的軟件修改流程進行軟件修改。
根據計算機聯鎖系統的故障類型,以可靠性維護理論作為基礎,提出校正性維護、預防性維護、預測性維護3種維護方式。而可靠性維護是將校正性維護、預防性維護和預測性維護幾種維護方式有機相結合而成的。
4.1 校正性維護
校正性維護是一種被動維護方式,因為設備元件的失效性是未知的。設備發生故障的時機存在不確定性,只有造成停機之后才進行維護。校正性維護要求故障發生后,人力、備件等維護資源必須及時到位,維護人員在最短的時間內恢復系統,以達到系統的安全、可靠性。
優良的校正性維護方法能夠對安全性和可用性達到改進。然而這種方式要求維護人員必須快速響應并趕到故障現場,打亂了人員正常的工作計劃,帶有很大的隨機性。校正性維護是花費代價大,資源反應和人力動用困難,并且對于系統的恢復時間也是不可預見的。
從各方面考慮,校正性維護是被動的、落后的維護方式。基于這種情況,計算機聯鎖系統的各個生產廠家采取組建分公司或區域化維護的方式來彌補校正性維護的弊端。
校正性維護適用于下列情況:
1)設備發生故障,但不會影響系統的整體功能和安全、可靠性;
2)故障屬于偶發性且無規律可尋的故障,使用校正性維護方式更為經濟。
4.2 預防性維護
預防性維護是一種有計劃的維護體制,主要是為了防止故障。維護需要在一個設定好的間隔內,如時間間隔、條件間隔等,按照維護標準所描述的盡可能減少設備故障和失效的可能,達到系統穩定運行的目的。聯鎖系統內各部件使用到一定時間,不論其運行狀態如何,安排進行計劃規定的維護工作,以達到系統的安全、穩定地運行為目的。顯然這種維護方式帶有強制性。
預防性維護的主要目的是為了在故障發生之前防止設備故障。維護工作一般安排在行車間隙進行,并且對維護資源、維護內容、人員提前做好充分的準備。在設備發生故障之前,通過以換代修的方式提高設備的可用性。系統維護的次數或間隔周期是生產廠家人員依據設備規格需求和安全分析來加以確定。
預防性維護計劃必須包含必要的資源并且可以加以執行。維護工作的時間安排可以在兩種情況下進行:一種是利用天窗點對設備在線維護,另一種是在充分利用系統關機的情況下進行維護。這樣可以最小程度減少由于維護對行車秩序造成的干擾。
定期維護的關鍵是掌握系統的維護時機。它適用于:
1)故障特征隨時間變化,即設備的穩定性與運行的時間長短相關,設備的故障模式具有一定的規律性;
2)在使用期限內,由于設備元器件老化導致的故障,為保證行車安全,分析出即將發生故障的時間點并進行維護;
3)系統內一些部件沒有檢測手段確定其技術狀態時,采用定期維護是一種有效的方式。
成功的預防性維護相對于被動維護,成本大大減少。定期進行預防性維護,雖然可以降低故障發生的可能性,但也可能造成資源浪費、維護過剩的問題。
4.3 預測性維護
基于狀態預測基礎上的維護簡稱為預測性維護。這種維護方式是通過監測設備狀態,通過分析、判斷其將要出現的故障,估算故障修理時機,以減少設備損壞。監測包括聯鎖系統各個部件的運行狀態、數據分析、趨向預測等項目。按預測得到的狀態實施維護是一種有效的維護方式。
把前面提到的預防維護與預測技術結合起來,根據預測確定適當的維護周期,設備運行到預定的時間后再進行檢查預測,則可避免資源浪費、維護過剩的問題。目前,監測和診斷工具的技術性進步使設備的維護越來越精確、有效。精確的預測維修進程降低了聯鎖系統發生各種故障的可能性。
預測性維護的優點:通過監測等手段可提前知道設備運行的狀態,對可能發生的故障提前準備好備件,以便能盡快恢復系統使用。這種維護方式有利于產品質量的控制,節約維護資源,同時可避免嚴重性故障的發生,提高系統運行的安全可靠性。
預測性維護適用于:
1)屬于耗損故障的部件,且故障隨時間緩慢發展,能估算出發生功能性故障的時間;
2)維護人員憑借經驗和日常巡視很難發現故障,設備使用中又不能對內部進行檢查;
3)有監測手段記錄設備技術狀態的,通過其運行狀態確定是否需要進行維護。
為了達到最經濟、最滿意的維護效果,可靠性維護的理念要求維護活動在校正性維護、預防性維護、預測性維護之間取得平衡,因地制宜、取長補短。
在計算機聯鎖系統整個生命周期內,設備故障率分為3個階段,并呈現出浴盆曲線形態,如圖1所示。根據可靠性維護的策略,對不同階段采取相應合理的維護手段。

圖1 設備故障率浴盆曲線
第一階段是初始故障期:在計算機聯鎖系統開通使用后,由于工程圖紙設計、現場施工質量、設備質量存在問題,導致故障率很高,但隨著系統工作時間的延長,故障率迅速降低。為了縮短這一階段的時間,系統在工廠集成后要進行試運轉、拷機試驗,對不合格產品進行篩查。設備到達現場后要嚴格驗收標準和測試過程,以便及早發現設備隱患并排除故障。
第二階段是偶發故障期:這一階段是系統的最佳工作期,系統運行較穩定,故障率較低,我們說的系統可靠性指標所指的就是這個時期。偶然故障主要原因是設備質量不合格、外界干擾和誤操作等因素引起。為延長產品生命周期,保證系統可靠、穩定地運行,這一階段要加強日常精細檢測和維護。
第三階段是損耗故障期:該階段內,設備隨著運行時間的延長,故障率呈明顯上升趨勢,主要是由于元器件疲勞、老化等因素導致。這一階段面臨系統有效壽命的結束,要加強設備的巡視,發生故障要深入分析原因,提出有針對性的維護措施并建議現場安排適當的大修作業。
根據以可靠性為中心的維護理論,從分析計算機聯鎖系統故障模式出發,根據各種故障模式對系統安全性的影響來確定有針對性的維護措施,即根據設備的實際運行狀態、技術指標制定出最佳的維護方式,保證系統運行狀態達到最穩定且節約設備維護費用的目的。對系統內部設備實行哪種維護方式,首先要對設備進行分級分類,根據設備特點再選擇維護方式,使設備得到合理的維護。設備在計算機聯鎖系統中的重要性、安全性、維修性、經濟性、檢測性等因素都影響維護方式的選擇。
為保證計算機聯鎖系統在其使用周期內穩定、可靠的運行,對于故障隨時間緩慢發展的、可監測的、維護費用高的重要設備采取預測性維護;影響系統安全可靠性的,故障屬于壽命型且無法檢測的設備采用預防性維護,此時對維護內容和維護周期要進行合理優化,使其經濟;故障對系統正常運行影響較小、故障率穩定、故障無法監測的設備實施校正性維護。
在實際工作中,根據故障模式,在充分利用其固有可靠性的前提下,選擇一種或多種維護方式與科學的管理體系相結合,來確定最佳的維護策略。
將RCM理論應用到計算機聯鎖系統維護中,能夠有效地指導維修活動和工程實施,達到優化維護策略,提高維修效率,降低維修成本等重大的現實意義。
[1]秦兆奭.計算機聯鎖的維護和管理[J].鐵路通信信號工程技術,1999(4):1-5.
[2]鐘章隊,謝健驪,李翠然.鐵路物聯網[M].北京:中國鐵道出版社,2014.
The main idea of RCM theory is to analyze the various functions and failure modes of the system, make clear the consequences of the system failure, and to make the preventive measures for the failure. In the maintenance work of computer interlocking systems, the RCM theory can be used to optimize the maintenance strategy of the system, in order to achieve the safe and reliable operation of the system.
RCM; computer interlocking system; maintenance; system failure; safety and reliability
10.3969/j.issn.1673-4440.2016.05.025
(2015-10-20)