楊 晨
(中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
故障管理是動車組運用維修中的重要環節,是確保動車組安全穩定運行的重要保障。隨著動車組修程修制的改革、數字化精準維修的推進和現場動車組運維業務的深入,故障數據的采集途徑越來越多,除了傳統的人工錄入方式,還有來自各種自動化設備的檢測和不同信息化系統的診斷。多種多樣的故障數據采集來源,導致故障數據體量大增,且不同來源的故障數據在數據結構、處理流程、存儲位置等方面各不相同,這給動車組故障統一管理和多源故障關聯分析帶來了不少困難。
為了使動車組故障分析水平得到顯著提升,打破故障分析僅停留在單一系統內的割裂局面成為關鍵。本文針對動車組多源故障數據特點,構建動車組多源故障管理平臺,設計提出多源故障數據標準化處理流程,實現對多源故障的統一、閉環管理,為運用維修單位管理人員能夠及時掌握動車組所有故障、合理安排檢修生產活動提供便利。
動車組故障來源主要包括檢修故障、乘務故障、運行設備故障、自動化設備檢測和一些監測系統,多來源故障為故障的統一分析帶來了許多困難,主要原因在以下幾個方面。
動車組故障數據來源涵蓋了人工檢查、各類檢測監測設備、建模分析等各個方面,數據來源廣泛,而且隨著信息化、智能化技術的不斷進步,諸如動車組車載無線傳輸系統(WTDS)、動車組故障預測與健康管理系統(PHM)、動車組運行故障動態圖像檢測系統(TEDS)等一大批信息化系統接連上線,數據體量不斷攀升。
動車組多源故障結構各不相同。(1)行車設備故障強調故障影響,數據包含是否造成停車、停車時間、是否形成事故、責任劃分、是否啟用救援等信息;(2)WTDS 和PHM 系統故障包含大量動車組傳感器參數及外部環境數據;(3)地面安全監測系統故障包含圖像、聲音、探測站等數據。
動車組多源故障的確認流程也不盡相同。(1)檢修故障、乘務日志故障、行車設備故障都是由人工直接確認的故障,不需要復核;(2)自動化設備故障、WTDS 故障、PHM 故障、地面安全監測故障都需要人工復核后才能真正形成一條故障。
動車組多源故障數據分布于全路范圍內的眾多信息系統中。(1)檢修故障、乘務日志故障、行車設備故障都由相關人員錄入至動車組管理信息系統中;(2)自動化設備故障存儲在檢修設備信息系統中;(3)WTDS 故障、PHM 故障、地面安全監測故障分別存儲在各自的管理信息系統中。
檢修故障指動車組檢修過程中的故障,主要包括運用檢修故障、高級檢修故障和委外檢修故障3 類。其中,運用檢修故障和高級檢修故障主要指各修程檢修作業時由人工檢查發現的故障。委外檢修指檢修車間將動車組拆解后的零部件交與第三方單位進行承修,委外檢修故障即為該第三方單位發現的故障。委外檢修故障不含動車組的車組、車廂信息,只含有動車組配件信息。
乘務故障指動車組乘務巡檢過程中的故障,也稱乘務日志故障,是隨車機械師在動車組在出庫?運行?入庫過程中,按照規定進行巡檢填報的“隨車機械師乘務日志”和“動車組故障交接記錄單”中的故障[1]。該部分故障主要包括動車組服務設施發現的異常,如動車組車門、座椅、衛生間等設施的臟污、破損、零件缺失及其他車組結構的異常,如轉向架異音、異響。
當動車組因故障或其它行車設備原因造成列車運行途中停車或晚點時,還將形成行車設備故障。行車設備故障發生后,由故障發生地所在鐵路局集團公司上報至中國國家鐵路集團有限公司(簡稱:國鐵集團),并需要擔當局集團公司和國鐵集團對故障進行分析。
自動化設備檢測的故障指動車運用所和檢修車間的各類檢修檢測設備發現的故障,包括動車組輪對故障動態檢測設備、受電弓檢測系統、車底檢測機器人、空心車軸探傷設備、輪輞輪輻探傷設備等。該部分故障主要是動車組的特定部位的檢測超限、缺陷記錄,如動車組輪對故障動態檢測設備主要檢測輪對各類尺寸、擦傷、探傷缺陷[2],車底檢測機器人主要對動車組車底部位部件進行圖像檢查[3]。隨著修程修制改革和一級修機檢人檢相結合的開展,該來源故障將占有越來越大的比重。
系統通過采集動車組牽引、制動、軸溫等關鍵子系統,以及車門、空調、衛生間等客服設施工作狀態及監控故障報警信息,結合動車組運行過程中產生的運行參數和工作環境參數,為司機、隨車機械師對列車及相關設備工作狀態監控、操作提供服務[4]。隨著PHM 系統的建設與實施,WTDS 數據將越來越多通過模型完成故障診斷。
PHM 匯集了動車組新造、檢修運用、檢測、監測、環境等多元異構數據,通過大數據手段建立模型,實現動車組運行狀態實時監控、故障預警預測、層次化的健康評估、視情維修,修程修制優化等功能[5]。PHM 實時計算的運行參數主要來自WTDS 系統,通過模型預測或規則診斷出動車組的運行異常。
地面安全監測系統主要指動車組運行故障動態圖像檢測系統(TEDS)、動車組滾動軸承故障軌邊聲學診斷系統(TADS)等軌邊設備[6-8]。該類設備通過圖像、聲音等方式對高速運行的動車組運行狀態進行監控,發現的故障多集中在動車組的車底部位。
為了提高動車組故障分析效率,統一分析多源故障,結合動車組多源故障數據來源分析,搭建動車組多源故障管理平臺,如圖1 所示。

圖1 動車組多源故障管理平臺架構示意
(1)基礎設施層
平臺建設的基礎保障,在各動車段和國鐵集團建立運行環境,為整個平臺提供基礎服務。
(2)數據資源層
完成平臺數據資源的規劃設計和分類管理,對動車組多源故障數據按照標準化結構體系進行有效的采集、組織和存儲,采用大數據手段對故障數據進行有效的計算分析。
(3)應用服務層
實現基于動車組多源故障數據的軟件和應用服務。
在動車組多源故障管理平臺的數據資源層,只有通過規范形式對故障數據進行標準化結構體系構建,才能實現故障的統一管理及應用服務層的各項功能。
3.2.1 多源故障數據標準化結構體系設計

圖2 動車組多源故障數據標準化結構體系
本文按照故障處理流程角度將故障相關要素信息進行分層歸類,構建的多源故障數據標準化結構體系,如圖2 所示,分為故障發現層、故障主體層、解決方案層、故障處理層、故障分析層5 個維度。
(1)故障發現層
故障發生時的所有外部信息,是進行故障分析及預測時的重要參考信息。
(2)故障主體層
描述故障發生時的主體對象信息。包括車組級信息、配件級信息和故障現象信息。
(3)解決方案層
故障的建議解決方案,是故障知識庫的累積,也是維修能力的體現。
(4)故障處理層
故障發生后相關人員的應對措施,該層是故障閉環的關鍵。包括故障途中處置與庫內處理信息。
(5)故障分析層
從故障發現到處理結束后對整個故障閉環流程的分析評價以及對故障影響后果的分析。
故障數據標準化結構體系的建立有利于統一動車組多源故障數據,提高數據利用價值,且該標準化結構體系中的各層級信息相對獨立,能更方便地運用各類數學方法與大數據模型對故障數據提取分析,以輔助研究動車組部件的全生命周期管理。
3.2.2 多源故障數據標準化處理關鍵技術
(1)故障合并
由于動車組多源故障的存在,很可能出現同一條故障多次發現的情況,為保證故障分析的有效性,降低故障分析時冗余數據的影響,定義故障主體信息為一條故障數據的唯一判斷依據,即故障主體一致的多條故障才可以被合并為一條故障。故障合并可能發生在故障發現時,也可能發生在故障分析中。
(2)統一故障字典
不同來源的動車組故障數據采用不同的標準對故障現象進行描述,包括各系統、各主機廠乃至各鐵路局集團公司之間的故障字典都不相同,為故障統一分析帶來難度。因此采用標準化結構體系對故障進行管理的前提是建立一套完整并適用于全路和各個主機廠的故障字典。
3.3.1 故障閉環管理
故障閉環管理是動車組故障最基本需求,指一條故障從發現到該故障狀態變為“已處理”的整個流程。故障閉環管理包括故障采集、故障下發分配和故障處理回填3 部分:(1)故障采集實現多源故障數據通過各種方式進入故障管理系統;(2)各檢修單位將故障分配至具體檢修人員進行處理;(3)故障處理回填實現檢修人員對故障處理情況填寫。結果為已處理,該故障閉環;未處理完畢,進入遺留故障等待下一次入庫檢修下發分配后再次處理。
3.3.2 故障統計分析
多源故障查詢和統計分析對動車組檢修故障進行匯總,提供故障詳細信息的查詢、故障多維度統計功能。使管理人員充分了解動車組多源故障的分布情況及變化趨勢,為故障趨勢分析及改進檢修工作提供依據。
3.3.3 故障知識庫管理
建立故障知識庫,對動車組歷史故障實現規范化、專業化管理,提高故障信息的準確度和利用價值,便于通過數據分析掌握動車組故障規律。
3.3.4 重點故障管理
將動車組經常發生的故障或重點部件的故障通過自動和人工篩選成為重點故障,記錄重點故障的模式、原因、處置過程等,以便積累維修知識和總結經驗,指導故障處理和日常檢修。
3.3.5 故障預測與維修決策管理
結合交路、環境等外部因素,通過大數據分析動車組高故障率部件故障發生規律和性能演化趨勢,尋找故障隱患,生成預防性維修方案,排除潛在故障。
本文通過對動車組故障數據來源進行分析,提出了動車組多源故障管理平臺的總體架構設計,通過構建動車組故障數據標準化結構體系,實現動車組多源故障統一管理,以及故障閉環管理、統計分析、故障知識庫管理、重點故障管理、故障預測與維修決策管理等功能。動車組多源故障管理平臺目前還在設計階段,尤其是多源故障數據的匯集,仍需要與各個系統建立完備的接口協議。而且故障預測與維修決策模型建立,仍需要對動車組不同部位的故障數據反復驗證分析,開展更深的研究。