曾若辰
(上海大學悉尼工商學院,上海 201800)
近年來,隨著城市經濟的快速發展,城市軌道交通成為破解大城市出行難題的重要途徑,憑借其運量大、效率高、安全舒適、綠色環保等優點備受青睞[1]。截至2022年末,中國內地城市軌道交通運營里程已突破1萬km[2],各地軌道交通發展顯現出網絡化運營、客流量激增、發車密度增大等趨勢。“十四五”期間,我國城市軌道交通進入運營管理快速提升的轉型發展期,行業重心已逐步向管理效能提升、運營可靠度提高、服務質量升級階段過渡[3]。與發達國家相比,我國地鐵建設及運營體量雖位于世界領先地位,但運營維護水平尚存在較大差距。目前國內城市軌道交通行業正在逐漸引入RAMS技術作為一種主動隱患管理工具,保障城市軌道交通系統的安全、可靠、穩定運行。本文將從城市軌道交通RAMS指標體系、工作流程、技術應用等方面分析當前我國RAMS技術發展現狀與展望,對我國城市軌道交通RAMS技術推廣應用具有積極的作用。
為了提高城市軌道交通系統的整體性能和安全性,需要綜合考慮可靠性(reliability)、可用性(availability)、維修性(maintainability)和安全性(safety)這4個要素,即RAMS[4]。RAMS是軌道交通產品的4個重要特性,也是世界先進軌道交通行業普遍采用的關鍵技術。軌道交通RAMS各要素間的相互關系如圖1所示[5]。不同的RAMS要素有不同的側重點和管理方法,例如,RAM管理主要關注故障分析和運營任務的成功實現,而安全管理則重視危險分析和人員安全保障。通過將RAMS結合起來,可以優化系統設計、改進運營管理,從而實現可靠、可用、易維護和安全運營。因此,RAMS技術在城市軌道交通領域中具有重要意義和廣闊的發展前景。

圖1 RAMS相互作用關系模型Fig.1 RAMS interaction relationship model
可靠性是指部件或系統在給定的時間和條件下,執行給定功能的能力[6]。可靠性與其他指標的關系表現在,高可靠性意味著低故障率和少停機時間,從而增加了系統的可用性和安全性。可靠性可以用故障率λ或平均故障間隔時間(MTBF)來衡量,它們互為倒數關系。可靠性函數R(t)是系統在t時間內正常工作的概率[7]。
R(t)=Pr{T≥t}
(1)

(2)
式中:T為系統故障前的正常工作時間,令F(t)=1-R(t),F(t)為故障累計分布函數,f(t)是故障概率密度函數:
(3)
故障概率分布函數f(t)可以通過處理大量歷史故障數據,擬合確定部件故障規律得到故障分布函數[8],如宗志祥[9]采用上海地鐵13號線3年車門故障統計數據驗證了車門故障時間間隔服從指數分布函數。常見的概率密度函數如表1所示[10]。

表1 常見故障概率密度函數Table 1 Common failure probability density functions
維修性是指部件或系統在規定的條件、程序和資源下,從故障狀態維修恢復到正常狀態的能力[11]。它涉及維修時間、維修費用以及維修人員和設備的需求。維修性對可靠性和可用性有直接影響,因為縮短維修時間和降低維修費用可以減少系統的停機損失,提高系統的有效運行和安全保障[12]。維修性通常用維修時間的概率分布來描述,其常用的指標為平均修復時間(MTTR),即從故障發生到故障修復所需的平均時間[13]。

(4)
維修時間的概率密度函數h(t)是維修性分析的基礎,它描述了單位時間內完成維修的可能性。根據每個部件和系統的MTTR和故障次數的預測,可以計算總體平均維修時間的期望值。
(5)
式中:ti為第i次記錄的修復時間;nr為記錄維修次數。
可用性是指部件在規定條件和規定時間內維持規定功能的能力[14]。對于城市軌道交通運營而言,地鐵列車工作時間的延長和非工作時間的減少是一個重要目標,可用性是可靠性和維修性的綜合表征。可用性需要考慮系統的平均故障間隔時間、平均故障修復時間以及設備備件的可獲得性等因素。部件可用度如式(6)所示[8]:
(6)
安全性指標衡量了系統在運行期間保護人身和財產安全的程度,考慮事故發生的概率、事故嚴重程度以及系統應對事故的能力[15]。安全性是RAMS中至關重要的指標,引入了風險概念,改變了傳統安全管理的事后性質,更加強調前瞻性的風險管理[16]。常用的安全性指標是事故發生概率,采用平均事故率λs表示,與平均事故間隔時間MTBF(H)互為倒數[10]。
(7)
式中:ti為第i次記錄的安全運營時間;ns為記錄安全事故次數。
城市軌道交通系統RAMS工作流程包括項目全生命周期對系統的RAMS工作需求,可以分為RAM和安全兩個部分進行[17],如圖2所示[18]。RAM活動側重于通過RAM指標的分配、分析和驗證來實現系統可能發生故障的閉環管理程序,而安全活動側重于系統中可能的運行、操作和環境危害的識別、處理和驗證來閉環管理。

圖2 城市軌道交通系統RAMS管理流程Fig.2 RAMS process of urban rail transit system
2.1.1RAM保證計劃
在城市軌道交通系統規劃設計之初,需制定實現整體系統可靠性、可用性及可維護性(RAM)要求的計劃,制定RAM目標并說明如何在全生命周期保證目的落實。根據《城市軌道交通初期運營前安全評估管理暫行辦法》和《城市軌道交通正式運營前和運營期間安全評估管理暫行辦法》等相關法規,城市軌道交通系統RAM考核指標如表2所示[19]。

表2 RAM考核指標Table 2 RAM assessment indicators
2.1.2RAM分配
可靠性分配是將可靠性的定量指標合理地逐級向下分配給子系統、設備單元、功能模塊和組件等,對組成系統的每個子系統或部件都提出相應RAM指標要求,再進行對系統的RAM權重分配[20]。RAM指標的分配方法主要有等比例分配法、AGREE分配法、比例組合法等。以AGREE分配方法為例,AGREE分配法計算第i個部件的MTBF分配值公式如下:
(8)
(9)
式中:ti為第i個部件工作時間;Wi為重要度因子;ni為部件i的個數;Ri(ti)為第i個部件分配的可靠度值;N為系統包含的部件個數。
2.1.3RAM分析
在獲取城市軌道交通系統的RAM指標分配值后,需要對系統可靠性進行分析預計,將預計值與目標分配值進行比較,若不滿足目標要求,則需要對分析對象的組成部分可靠性進行提升,重新進行預計和分配。RAM分析步驟如下。
1)建立系統結構分解
系統結構分析是進行城市軌道交通系統RAM分析的基礎工作,結構分解可以采用可靠性框圖表示其組成部分間的相互關系,確定功能失效模式的因果關系[21]。可靠性框圖旨在圖形化顯示各種使系統成功運行的串并聯模塊組合,常見的串并聯模型類型如表3所示[15,22],RBD 圖中每個模塊代表1個系統條目或功能。

表3 系統可靠性框圖Table 3 System reliability block
2)故障模式影響及危害性分析
故障模式影響及危害性分析(FMECA)是一種系統化的方法,按照既定的步驟,對分析對象的各層次進行詳細的故障模式識別,評估故障模式對系統各方面性能的潛在影響,并基于故障發生的可能性確定其危害性等級,進一步根據故障的嚴重性、發生頻率和檢測困難程度對每種故障模式進行優先級排序,從而通過消除或降低系統組件的潛在故障,提升城市軌道交通系統的可靠性水平。
FMECA包含故障模式影響分析和危害性分析兩部分,并整合到一張分析表上。FMECA以關鍵故障模式為頂事件建立故障樹進行多因素分析,找出各種故障模式的組合,為改進設計提供依據[23]。危害性分析主要采用風險優先數法(RPN),對每個故障模式進行RPN值排序并采取控制措施,將RPN值控制在可接受的最低水平[13]。FMECA也可以采用故障樹分析、事件樹分析、貝葉斯網絡、人工神經網絡等評估方法[24]。
3)系統可靠性預計
可靠性預計根據城市軌道交通系統架構設計、技術選型等信息,以元器件、零部件的失效率作為依據,分析系統實際可能達到的可靠性活動。可靠性預計驗證了可靠性分配的合理性,可靠性分配為可靠性預計提供目標和要求。通過可靠性預計和分配,可以使產品在設計階段就達到規定的可靠性水平,提高產品的質量和效益。
2.1.4RAM跟蹤
RAM跟蹤管理可采用故障報告分析和糾正措施系統(FRACAS),FRACAS是項目全生命周期實現RAMS閉環管理的必要保證[25]。FRACAS工作流程如圖3所示,FRACAS應用于城市軌道交通系統全生命周期,采用“信息反饋,閉環控制”的理念,運用一套標準化程序上報、追蹤和糾正設備故障,監控系統RAMS性能表現[26],從而提高產品可靠性和維修性的預期要求。

圖3 FRACAS工作流程[27]Fig.3 FRACAS workflow
2.2.1安全保證計劃
安全保證計劃在項目策劃階段產生。在此階段,安全保證計劃包括制定安全目標和目標實現方式的安全管理策略,以及獲取安全需求的安全分析活動的總體描述等內容。安全目標一般通過安全完整性等級(SIL)表示[28](見表4),EN50126,EN50128和EN50129等標準對城市軌道交通系統的安全目標做出了規定[29]。

表4 SIL等級Table 4 SIL level
2.2.2風險識別
風險管理的第1步就是要綜合全面地識別出系統中關于安全與健康的風險源,通過初步危害分析、系統危害分析、子系統危害分析、接口危害分析、操作與支持危害分析等方法分析不同階段的風險源[30]。
2.2.3風險評估
風險評估分為定性分析和定量分析兩類。定性分析主要依靠專家經驗和個人能力,采用風險矩陣進行風評估[5]。如圖4所示,風險矩陣圖中橫坐標表示危害嚴重程度,縱坐標表示危害發生頻率[31]。根據地鐵運營經驗和以往項目經驗對危險源的頻率和后果進行評定確定風險等級,確定消除已識別危險源的方法或將其風險控制在可接受范圍內的措施。

圖4 風險矩陣Fig.4 Risk matrix
針對風險等級高(R1,R2)或導致人員死亡的隱患,還要進行定量分析,一般采用故障樹分析法(FTA)或事件樹分析法(ETA)進行分析評估。FTA是從頂事件開始成樹枝展開狀的分析評估過程,可以分析多項故障之間的相互影響,以及會引起安全風險(如撞車、脫軌等)的組合事件發生頻率[32]。ETA用于找到風險發生的主要原因,通過推演可能產生的風險,將故障風險與各種原因之間的邏輯關系用樹形圖表示,確定風險概率最大的事件路徑[21]。
2.2.4風險控制
風險評估識別出控制城市軌道交通系統達到可接受安全水平所需的措施,同時將這些安全需求或安全應用條件整合形成本專業的危害日志。這些安全需求將被分配給各專業和運營維護單位來實施,并在危害方確認接收證明后方可關閉。在整個生命周期活動中,各專業負責對危害日志進行維護和更新,以確保危害日志能夠及時更新[30]。這樣的風險控制流程可以確保城市軌道交通系統的安全性得到有效的管理和維護,同時保證安全需求落實和危害控制。
傳統RAMS方法主要依賴于統計數據和經驗知識,然而城市軌道交通系統難以在試運營期內產生充分的RAMS數據供分析,統計方法在面對復雜的地鐵系統時可能存在局限性,無法對系統中的關鍵設備和關鍵環節進行準確定位和精確分析,準確評估系統RAMS狀態,導致維修和管理策略的制定缺乏科學性和針對性。此外,傳統方法還難以預測和應對潛在風險和故障,無法滿足地鐵系統快速發展和復雜運營環境下的需求。因此,當前許多研究對于RAMS技術進校了進一步發展,主要有系統關鍵設備識別、RAMS評估與預測、RCM維修策略優化3個方面。
城市軌道交通系統結構組成復雜,影響其安全運行的因素眾多不同組件發生故障時,對系統的可靠性和安全性的影響不同,在多數情況下,組件越關鍵,對系統RAMS特性影響越大,越需要重點考慮。通過深入研究和識別,系統關鍵設備識別在設計階段能夠指導系統RAMS需求分配權重的準確估計,實現資源的合理配置[33];在投入運營后,可以制定有針對地維護和管理策略,提高地鐵系統的可靠性和可用性[34]。系統關鍵設備識別為RAMS評估與預測提供了基礎數據和準確的目標。
層次分析法(AHP)是系統關鍵設備識別最常用的方法,常規層次分析法為3層結構,可以由系統層、子系統和設備層組成。在建立AHP層次結構模型后,通過判斷矩陣可以得到各指標的排序權重,從而識別出系統關鍵設備。但AHP法還存在評價主觀性、一致性檢驗缺陷等問題,吳高華等[7]通過改進危險源模型評價,提出了FCS(事故頻次F、事故嚴重程度C和設備管控程度S)評估指標與AHP相結合,識別出通信信號系統中的關鍵設備。李國正[10]引入三角模糊數改進AHP法,采用蒙特卡洛法分析相關數據,建立了地鐵列車設備關鍵度評估模型。數據粗糙集理論[5]、灰色關聯理論[34]、聚類分析[35]等方法也被用于基于AHP法的關鍵設備識別模型改進中。此外,還有決策擬定網格法、改進FMECA方法[34]等常用于設備重要度評價,王晨曦等[33]應用運維數據構建貝葉斯網絡修正權重排序。這些改進方法的引入豐富系統關鍵設備識別中的應用,提高了評價結果的客觀性和準確性。
RAMS評估與預測的研究能夠全面評估地鐵系統的性能,識別潛在的風險和故障,并為系統的維護和改進提供科學依據。RAMS評估與預測方法有馬爾科夫過程、貝葉斯網絡、Petri網絡模型與威布爾模型等[5]。
馬爾可夫過程常用于建立可修復系統的可用性模型,描述系統各階段狀態轉移隨機過程[36],吳丹[37]采用馬爾可夫鏈對軌道交通計算機聯鎖系統進行仿真分析,預測分析了RAMS指標的時變演化過程。貝葉斯網絡通過分析和學習網絡結構和參數,可以得到不同設備故障發生的概率信息,李松峰等[38]提出了基于貝葉斯網絡的地鐵設備故障診斷算法,將貝葉斯網絡計算的故障概率與該種故障排查時間相結合作為預期故障診斷時間指標,并以該指標值從低到高依序進行故障排查診斷,大幅提高了維修效率。Petri網可以建立系統的模型,并模擬系統在不同條件下的運行特性,王彪[34]利用擴展Petri網理論建立了板式無砟軌道系統的動態可靠性模型,并采用蒙特卡洛模擬實驗法預測系統RAMS穩態特征。威布爾分布是一種常用的可靠性分布模型,可以通過擬合實際的故障數據來描述組件或系統的故障時間分布特性。丁號[39]基于最小二乘法和遺傳算法擬合制動裝置部件的威布爾分布參數,定量評估了制動裝置可靠性。通過RAMS評估與預測技術的研究,可以深入了解城市軌道交通系統RAMS水平,幫助制定合理的運維計劃和調度方案,提高系統的運行效率和服務質量,降低事故風險,保護乘客和工作人員的安全。
以可靠性為中心的維護(RCM)是目前國際上通行的軌道交通維修策略[40]。RCM維修策略優化能夠根據設備的可靠性、故障特征和維修成本等因素,制定出更有效的維修策略,提高設備的可靠性和可用性,減少維修成本和停運時間。傳統的依靠檢修人員經驗的故障診斷和維修方法已經無法有效地應對地鐵系統復雜化、多樣化的故障維修特征[39]。因此,行業迫切需要加強對制定維修策略準確性與合理性的研究,不斷改進優化維修策略。
在識別出系統關鍵設備和設備RAMS指標預計分析的基礎上,維修人員可以按照優先級原則制定檢修計劃[35]。高彥軍[41]采用邏輯決策法分析不同專業設備的維修策略,根據設備重要程度分配維修方案。不同的維修活動、維修方式對組件的可靠性、安全性影響不同,所需要的維修費用也不同,在定期的預防性維修中選擇合理的維修方式,也是優化維修策略的方式之一。為此,許多研究以系統設備平均可靠性與維修費用為優化目標,將系統的可用性和安全性設定為約束條件,建立多目標優化模型[42],莫志剛等[43]在多目標優化模型中應用引入退火機制的粒子群算法尋優計算,制定最有利的信號系統維修計劃;姜源[44]采用MATLAB中的搜索仿真方法尋找可靠性閾值內的最小維護費用和最優維護周期,并建立LMDP維護策略模型優化設備狀態參數決策誤差對維修決策的影響。通過RCM維修策略優化可以合理規劃維修活動,減少系統停機時間和維修周期,提高設備利用率和運營效益。
城市軌道交通RAMS研究與工程應用的開展需要全生命周期的大量RAMS工作數據支持,這是進行RAMS深層次分析和決策的必要條件。尤其是在運營階段,由于運營時間相對較短,缺乏相關故障和維修數據統計,特別是現場結構故障的數量較少[25],導致故障數據統計方法的科學性較差。因此,需要進一步推廣和完善統一的故障數據收集管理機制和支持平臺,加強數據質量控制和驗證,積累長期運營故障數據,在大規模真實可靠的樣本數據支撐下,充分分析和挖掘故障規律[34]。
為了有效支持RAMS分析,可以依托數字孿生技術建立城市軌道交通數字孿生平臺。數字孿生是通過在數字空間中同步構建與物理城市軌道交通工程實時匹配的孿生虛擬實體,能夠精準感知和預測物理實體的RAMS狀態[45]。數字孿生平臺能夠有效收集和利用各種RAMS信息,對RAMS信息進行跟蹤、收集、分析和處理,確保信息的及時性、真實性、完整性和連續性。通過數字孿生技術,可以更好地支持城市軌道交通RAMS工程的設計和改進RAMS工作方法,為決策提供科學依據。
當前維修管理策略主要以故障維修為主,這不僅需要巨大的資源投入,而且不符合高可靠性運營的發展趨勢。未來的運維策略將更加注重預防性維護。為此,地鐵行業已經普遍建立了基于RAMS體系的FRACAS工作流程系統,以增強日常設備檢測和主動維護,從而避免被動的故障維護出現。同時,基于RAMS的城市軌道交通設備運維體系帶來了大量的數據資源。利用人工智能進行數據挖掘和智能分析,智能判斷以及智能處理將成為RAMS技術發展的一大挑戰[46]。AI技術的引入可以充分利用這些數據資源,從中提取有價值的信息和知識,為運維決策提供支持。
AI輔助城市軌道交通運維決策,可以實現以下幾個方面的優勢。首先,基于大數據的分析和挖掘,可以更準確地預測設備的故障概率和維修需求,從而提前進行預防性維護,降低設備故障率和運營風險[47]。其次,AI技術可以幫助進行設備狀態監測和診斷,實時掌握設備的工作狀態,及時發現異常并采取相應的措施。此外,通過智能化的維修計劃和資源優化,可以提高維修效率,減少停運時間,提升運營可用性和服務質量。
RAMS標準體系在我國城市軌道交通行業尚未未建立[48],近年來由于自動運行系統(FAO)在國內的大規模應用以及FAO對于RAMS管理的要求,上海、南寧等城市地鐵建設都開展了RAMS管理[49],然而現行法律法規中并未對城市軌道交通RAMS管理提出明確的要求或者規范。參考鐵路行業,ISO/TS 22163—2017《鐵路應用 質量管理體系》基于鐵路行業管理特點,專門提出了組織實施RAMS的要求,并貫穿到產品全生命周期[50]。城市軌道交通行業的RAMS應用也需要法規規范的引導來提升普及。
城市軌道交通行業的RAMS標準目前有GB/T 21562—2008《軌道交通可靠性、可用性、可維修性和安全性規范及示例》,該標準僅起到綱領性作用,在可操作性上還有待進一步發展,需要面向城市軌道交通行業各專業以及各參與主體全面制定標準體系,特別是各參與主體自身需要建立相應的技術規程文件,才能將RAMS方法系統化、規范化地應用到城市軌道交通系統設計、生產以及運營過程中。因此,針對城市軌道交通RAMS標準體系將成為RAMS技術下一步發展的重要任務[51]。
城市軌道交通RAMS技術是保障軌道交通系統高效運營和安全運輸的關鍵因素。當前,隨著城市軌道交通網絡擴展以及FAO普及,RAMS技術的應用也顯得日益重要。盡管RAMS已在國內取得一定進展,但仍存在一些挑戰和不足之處,RAMS標準體系尚未完全建立導致推廣應用不足,RAMS技術還需要數字孿生支持平臺支撐建立全生命周期數據基礎,推廣和完善故障統計數據和積累大量真實可靠的樣本數據,并且要訓練AI模型揭示故障規律、提升運維效率。通過克服當前的挑戰,城市軌道交通RAMS技術將進一步提升城市軌道交通系統的運營水平,為乘客提供更安全、便捷和舒適的出行體驗。