崔世卿, 劉子揚
(1.北京全路通信信號研究設計院集團有限公司,北京 100070;2.北京市高速鐵路運行控制系統工程技術研究中心,北京 100070)
鐵路旅客服務系統是面向旅客服務的信息系統,主要承擔旅客綜合顯示信息發布、車站廣播、視頻監控及火災、門禁監控等功能。近幾年隨著鐵路客運業務的蓬勃發展,旅客服務系統的管理模式不斷發生變化,從最初的各業務獨立運行管理,發展為集成平臺集中化管理。這意味著集成平臺需要對各業務多種類設備進行集中統一監測維護[1]。但旅客服務系統管理體系復雜,業務種類繁多,設備類型各異,給系統設備的實時監測和維護造成一定困難[2]。旅客服務系統直接面向旅客,對出行體驗影響很大,因此,實現各類旅客服務設備狀態數據的統一采集和處理,通過數據分析,實現設備全生命周期信息管理、設備狀態評估、設備故障預警、檢修方案輔助決策,從而有效提高系統維護效率,降低設備故障率,降低系統運營成本,是當前旅客服務系統研究的重要課題。
大數據(big d ata),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,通常具有5V 特征,即:大量(Volume)、高速(Velocity)、多樣(Var iety)、低價值密度(Value)、真實(Veracity)。目前大數據技術已經在互聯網、醫療、通信、電力、物流等諸多領域得以運用[3], 在鐵路運輸設備管理方面也有相應的研究[4]。同時,學術界也圍繞大數據技術和應用進行了大量的研究,促進了大數據相關理論和技術的快速發展。
鐵路旅客服務系統包含綜合顯示信息發布設備、廣播設備、視頻監控設備、火災告警設備、門禁設備、集成平臺設備等多種設備。具體設備類型如表1所示。各類設備狀態數據體量巨大,采集方法不一,數據存儲形式復雜,采集周期間隔差別較大,符合大數據特性。研究基于大數據技術的鐵路旅客服務設備狀態監測系統,能夠更好的對數據進行整合、存儲,并通過數據分析挖掘,充分發揮數據價值,實現設備信息管理、狀態評估、故障預警、檢修方案輔助決策等功能,實現設備故障能夠早預防、早發現、快維修。該系統將成為支撐低成本、高效率、高可靠性的旅服設備管理的有力手段。
基于大數據的鐵路旅客設備狀態監測系統基本設計思路是先通過歷史數據聚類生成設備狀態評判規則,當有新設備狀態信息輸入時,可根據狀態評判規則對設備狀態進行判斷,并提供故障預警或告警。通過歷史維修數據分析出設備狀態與維修方案間的關聯關系,當設備出現故障預警或告警時,能夠實現維修方案的輔助決策。系統設計思路如圖1所示。

表1 旅客服務系統設備按功能模塊分類表Tab.1 Passenger service system devices classification table by function module

圖1 系統設計思路Fig.1 System design idea
基于大數據的鐵路旅客服務設備狀態監測系統總體架構主要分為5 層,分別為:數據源層、數據采集層、數據存儲層、數據分析層、應用展示層。另外,大數據信息安全保障體系負責保障系統中各層級的數據安全。系統總體架構如圖2 所示。

圖2 基于大數據的鐵路旅客服務設備狀態監測系統總體架構Fig.2 Overall architecture of device status monitoring system of railway passenger service system based on big data technology
1)數據源層
數據源層包括集成平臺設備、綜合顯示設備、廣播設備、視頻監控設備、火災告警設備和門禁設備在安裝、運行、檢修過程中產生的所有靜態和動態數據。
2)數據采集層
數據采集層負責數據的采集和清洗。主要采集的數據類型分為結構化數據和非結構化數據。采集方式包括基于ETL 的離線采集和基于Flume 的數據流式實時采集。并采用H iv e 對采集到的數據進行數據清洗。
3)數據存儲層
數據存儲層負責對采集處理后的數據進行存儲。系統采用關系型數據庫My SQL 對結構化數據進行存儲管理,采用非關系型數據庫Hbase 進行非結構化數據存儲管理。
4)數據分析層
數據分析層負責對采集處理后的設備狀態數據進行統計和分析,從而挖掘出設備狀態判斷依據和最優故障檢修方案。設備狀態信息分析主要采用聚類分析中的K-Mean s 算法[5],最優故障檢修方案分析主要依賴于關聯分析中的Apriori 算法[6]。
5)應用展示層
應用顯示層負責將數據分析層的分析結果面向用戶進行展示和應用,包括實時運行狀態展示、設備全生命周期信息查詢、故障預測及告警、設備報廢告警以及相應的設備檢修輔助決策方案等。
6)大數據信息安全保障體系
大數據安全保障體系為各層級數據安全提供保障,包括數據產生和采集環節的元數據安全管理、數據傳輸環節的安全管理、數據存儲環節的安全管理和數據使用環節的安全管理等。
基于大數據的鐵路旅客服務設備狀態監測系統主要功能包括:設備全生命周期信息管理、設備狀態評估、設備故障預警及告警和設備檢修方案輔助決策。
1) 設備全生命周期信息管理
對所有設備信息按照安裝調試、正常運行、故障預警、故障告警、檢修維護、報廢回收,分為6個生命階段進行管理,形成完整的設備全生命周期信息履歷,并提供信息查詢。
2) 設備狀態評估
通過大數據分析技術,確定設備各狀態判定指標,并根據指標對設備當前運行狀態進行評估,對設備使用壽命進行預測。
3) 設備故障預警及告警
系統可對設備故障類型進行預測,并向用戶發出故障預警,提示用戶盡快對設備進行檢查維護。當設備已處于故障狀態時,能夠及時向用戶發出告警,提示用戶及時維修。
4) 設備檢修方案輔助決策
系統可針對設備當前所處運行狀態,為用戶提供相應的可執行檢修方案輔助決策。
1)設備狀態數據分析流程
設備狀態數據采集后,經過數據清洗處理,對處理后有用信息進行數據分析,獲得設備各狀態的數據特征,從而生成相應設備狀態的判定依據。設備狀態分析流程如圖3 所示。

圖3 設備狀態數據分析流程Fig.3 Device status data analysis flow
2)設備檢修維護數據分析流程
設備檢修維護數據經過數據清洗處理后,結合設備維護時相應的設備運行狀態數據,進行關聯關系的分析。并根據關聯分析結果,確定不同設備運行狀態下的設備檢修方案。設備檢修維護數據分析流程如圖4 所示。

圖4 設備檢修維護數據分析流程Fig.4 Device maintenance data analysis flow
3)設備狀態監測檢修管理流程
系統獲取到設備實時狀態數據后,根據大數據分析結果,將設備狀態分為設備狀態正常、設備故障預警、設備狀態告警和設備報廢告警4 種狀態。
當設備判斷為正常狀態時,系統對狀態信息進行存儲,以作為后期設備狀態分析的數據儲備。
當設備處于故障預警狀態時,系統通過數據分析,關聯出當前預警類型所對應的維護方案,并向用戶推送。
當設備發生故障時,系統通過對故障實際情況進行分析,關聯出最優系統維修方案,并將方案推送給用戶。
當用戶完成設備維修后,系統對實際維修方案數據進行采集處理,用于后期設備維修方案的數據支撐。
當設備處于報廢告警狀態時,系統向用戶發出設備報廢告警。用戶根據告警對設備進行處理,并對實際處理結果進行記錄。系統根據采集到的設備報廢處理結果,對設備報廢的判斷標準進行優化,形成信息閉環。
設備狀態監測檢修管理流程如圖5 所示。
業務流程中使用兩個關鍵算法,分別是生成設備狀態判斷規則的聚類算法和將設備故障與檢修方案關聯的輔助決策算法。
1)設備狀態聚類算法

圖5 設備狀態監測檢修管理流程Fig.5 Device status monitoring and maintenance management flow
設備狀態判定的主要算法是K-mean 聚類算法[7]。其主要應用思路為:對采集到的設備各項狀態參數進行聚類,獲得設備狀態判定依據。在聚類初始化時,選取某類狀態的典型參數作為該狀態聚類的初始中心點,并通過多次初始化計算,對中心點位置進行優化,確定損失函數最小的點作為該狀態聚類中心點,即該設備狀態的判斷依據。
損失函數定義為:假定μ1,…,μk為k 個聚類中心,用γnk∈0,1 表示xn是否屬于聚類k,則損失函數的散度為:

假設設備某一狀態聚類的中心點為Z={z1,z2,…,zi,…,zD}(zi為設備的一項狀態參數),設備實際狀態數據為X={x1,x2,…xi,…xD},則實際數據X 與中心點Z 之間的歐式距離為:

設備狀態數據X 距離哪個聚類中心點的歐式距離最短,即可判定為該聚類所代表的設備狀態。
2)檢修方案輔助決策關系算法
檢修方案輔助決策的大數據分析主要基于關聯規則挖掘中的A p r ior i 算法[8]。其主要思路是將設備檢修過程中發現的故障、問題及其相應的處理方案組合為一個項目集,存儲至事務數據庫中。根據指定的最小支持度和最小置信度,對事務數據庫中的頻繁關聯規則進行發掘,找出設備故障類型和處理方案的頻繁相集,確定故障類型和處理方案之間的關聯關系,從而在設備再次出現類似故障時,系統能夠及時給出相應的檢修方案。
在本系統中,支持度(support degree)定義為:

即故障A 和檢修方案a 組成的項目集在設備所有檢修項目集|T|中出現的概率。
置信度(confidence degree)定義為:

即故障A 和檢修方案a 組成的項目集在設備出現故障A 的所有檢修項目集中出現的概率。
當S 和C 均分別滿足最小支持度和最小置信度的設置條件時,檢修方案a 及為與故障A 有強關聯的檢修方案,可作為推薦方案向用戶提供。
進入大數據時代,旅客服務系統設備監測維護業務正進行著從依靠人工的設備監測和依靠經驗的故障判定維修向高效率、高準確性、高標準度的自動化設備監測,智能化檢修輔助方案決策的轉變。本研究提出的系統總體架構、功能設計、業務流程和大數據分析關鍵技術,為基于大數據的鐵路旅客服務設備狀態監測系統的開發和應用提供了理論支持。該系統將成為低成本、高效率、高可靠性的設備管理的有效手段,推動鐵路旅客服務系統智能化的發展進程。