趙曉峰
(上海富欣智能交通控制有限公司,上海 201210)
基于WEKA的信號設備預測性維護信息系統
趙曉峰
(上海富欣智能交通控制有限公司,上海 201210)
信號設備預測性維護信息系統主要是對信號系統的各子系統維護信息進行數據挖掘,結合系統可靠性、可用性、可維護性分析結果,制定預測性維護策略,定義故障信息收集模板,提供基于自由軟件WEKA的預測性維護方法,使用軟件集成的開發方式,建立數據挖掘的分類、聚類、關聯模型。這種方式既有助于縮短開發周期,也能夠有效降低軟件成本。
預測性維護;自由軟件;數據挖掘;分類;聚類;關聯
預測性維護是以狀態為依據的維修,在設備運行時,對其主要部位進行狀態檢測和故障診斷,判定設備所處的狀態,并能預測設備未來的狀態趨勢和可能的故障模式,從而制定出預測性維護計劃。
懷卡托知識分析環境(WEKA)是一款使用Java語言編寫的面向機器學習和數據挖掘的綜合工具平臺,獲得了GNU通用公共許可認證,為自由軟件,包含一系列可視化工具、數據分析算法以及建模技術,支持數據預處理、聚類、分類、回歸、可視化和特征選擇。
應用于城市軌道交通信號系統的預測性維護信息系統是在實時監督和收集運營相關各子系統狀態和報警數據的基礎上,經過大量數據挖掘和知識分析,同時輔以資產管理和辦公自動化等工具,提供更準確的預防性維護計劃和建議,有助于降低和減少糾正性維護發生的概率和造成的危害,并為整個信號系統可靠性、可用性、可維護性(RAM)指標的驗證提供依據。
預測性維護信息系統數據收集的范圍包括計算機聯鎖(CI)、區域控制器(ZC)、車載控制器(VOBC)、列車自動監控(ATS)、數據通信系統(DCS)的內部和外部數據,以及列車位置檢測設備、道岔、信號機、有源信標、站臺屏蔽門、站臺緊急按鈕等軌旁外部設備的狀態和故障信息,車輛、速度計、加速度計、雷達傳感器、信標應答器、司機顯示器等車載外部設備的狀態和故障信息。
預測性維護信息系統經過數據挖掘和知識分析后,會生成糾正性維護和預防性維護的計劃。其中,糾正性維護需要維護人員在預測故障發生前盡快執行;預防性維護主要包括軌旁和車載設備的日檢、周檢、雙周檢、月檢、季檢、半年檢、年檢具體內容的增加或更新。
根據EN50126標準要求,城市軌道交通信號系統應進行RAM評估,提交RAM分析報告和定量安全風險分析報告(QRA),尤其是計算機聯鎖、區域控制器、車載控制器等SIL4的子系統。表1給出了主要信號設備的RAM參考值。

表1 信號設備RAM參考值
預測性維護信息系統主要由數據采集、數據清洗和數據應用3大功能模塊構成,如圖1所示。

圖1 預測性維護信息系統架構
數據采集模塊是對信號系統主要子系統的狀態和報警進行收集,包括ATS、DCS、計算機聯鎖、區域控制器、車載控制器、微機監測等,不同子系統的數據格式可能不同;數據清洗模塊是對不同格式的數據源進行格式化,檢查數據一致性,處理無效值、缺失值和重復值,并存入預測性維護數據庫;數據應用是以維護數據庫為核心,根據故障處理方式的不同,分為3類:(1)基于故障定位的維修工單子模塊,主要輔助解決糾正性維護任務;(2)基于故障統計的RAM管理子模塊,實現長期數據的分析,為軌道交通維護和建設指標提供參考;(3)基于故障預測的維修計劃子模塊,主要輔助持續更新預防性維護任務,并圍繞系統外的維修因素—人員和備件進行綜合管理。
城市軌道交通運營單位一般會在信號系統開通后增設維護支持系統,主要是完成對軌旁信號設備的微機監測和機房環境監測,所以在構建預測性維護信息系統時,應支持獨立工作和軟件集成兩種運行模式。WEKA的Simple CLI和Knowledge Flow功能環境可以很好地實現這兩種方式。其中,Simple CLI提供一個簡單的命令行界面,可以把模型保存下來,這樣有新的待預測數據出現時,不用每次重新建模,直接應用保存好的模型即可。此外,對預測結果給出置信度,用戶可以有選擇地采納預測結果。Knowledge Flow環境提供數據的預處理,數據格式的轉化,各種數據挖掘算法,并提供結果的可視化工具,還可以讓用戶創建、運行、修改和分析算法試驗,比單獨分析各個算法更加方便。
下面從數據挖掘不同模型的角度詳細描述預測性維護信息系統核心功能的實現。
3.1 分類模型
分類是通過分析訓練集中的數據,為每個類別建立分類模型,并用該模型對數據庫中的其他記錄進行分類。常用分類算法有貝葉斯(Bayes)、決策樹(Decision Tree)等。
如圖2所示,左側是各個子系統的維護數據,CBI、ZC、VOBC主要是從診斷維護端口送出的內部狀態和報警,以及各自嵌入式子系統的運行日志;計軸(Axle Counter)主要是內部串口版和并口版的工作狀態信息;ATS主要有數據庫Data Logger存儲的信息,以及計劃和實際時刻表;DCS主要有數據記錄器(Data Recorder)抓取的網絡通信數據包,以及各交換機和防火墻的運行日志。經過數據預處理后,通過類指定器(Class Assigner)標明決定分類的屬性,再使用交叉驗證模塊(Cross Validation Fold Maker)分配訓練集和測試集,然后就可以對數據集進行貝葉斯網絡(Bayes Net)分類器分析。處理結果通過圖形查看器Graph Viewer圖形化顯示到用戶前端,并在通過分類行為評估器(Classifier Performance Evaluator)評估合格后,轉存儲到預測性維護數據庫,同時提供XML擴展接口,便于大數據的二次開發。
信號系統維護信息的分類主要是依據故障發生時間、地點、子系統等進行處理,同時考慮系統外部和內部的接口特性,并在大量數據積累基礎上對故障等級進行細致處理。因此,當發生故障時,須全面記錄從故障發生時刻到設備恢復正常時刻之間的各項信息,以便后續利用預測性維護信息系統進行分析和總結。表2列舉了信號設備故障信息收集模板,其中,每一個數據維度都可以按照不同的分析需要成為數據分類的依據。

圖2 信號設備維護信息分類模型

表2 信號設備故障信息收集模板
3.2 聚類模型
聚類是數據挖掘中用來發現數據分析和隱含模式的一項重要技術,其目的是把大量數據點的集合分成若干類,使得每個類中的數據之間最大程度地相似,而不同類中的數據最大程度地不同。常用聚類算法有K方法(K-means)、基于密度含噪聲的空間聚類應用算法(DBSCAN)、基于斜面的聚類算法(CLOPE)等。
如圖3所示,聚類模型的分析對象主要是經過數據清洗的預測性維護數據庫,通過訓練集生成器(Training Set Maker)的學習,就可以正式使用DBSCAN算法建立預測模型,該算法是基于密度的聚類算法,從數據對象的分布密度出發,將密度足夠大的相鄰區域連接起來,從而發現具有任意形狀的聚類,并能有效處理異常數據。處理結果通過文本查看器(Text Viewer)以表格形式顯示給用戶。

圖3 信號設備維護信息聚類模型
DBSCAN算法主要用于分析通信故障的相關數據。信號系統中影響行車的通信故障主要有兩類:車地無線信號不穩定和定位信標讀取失敗。城市軌道交通領域中目前大量使用符合IEEE 802.11標準的2.4 GHz無線通信,由于是ISM公共頻段,在傳輸信道中存在很多干擾源。經過大量分析發現,無線信號在地下段主要受隧道參數影響,如:曲率半徑、豎曲線半徑等;而在地面和高架段主要受外來環境的干擾,如:繁華地段的商用WIFI信號、雷暴日、太陽風等。信標系統是基于RFID技術的列車絕對定位系統,主要有歐標和美標兩種制式,通信頻段分別是27 MHz和902 MHz。根據現場運行數據分析,信標讀取失敗故障主要與產品批次和工作環境相關,如:金屬異物遮擋信標、道岔區域正線和側線信標安裝位置過近等。
3.3 關聯模型
關聯規則是當前數據挖掘研究的主要方法之一,它反映一個事物與其他事物之間的相互依存性和關聯性。如果兩個或者多個事物之間存在一定的關聯關系,那么其中一個事物就能夠通過其他事物預測到。常用關聯規則算法有挖掘關聯規則的頻繁項集算法(Apriori)、頻繁項增長算法(FPGrowth)、Tertius等。
如圖4所示,關聯模型的分析對象主要是經過數據清洗的預測性維護數據庫,通過訓練集生成器(Training Set Maker)的學習后,就可以正式使用Predictive Apriori算法建立預測模型,該算法基于Apriori算法,其步驟是:(1)通過迭代,檢索出數據庫中的所有頻繁項集,即支持度不低于用戶設定的閾值的項集,利用頻繁項集構造出滿足用戶最小信任度的規則。(2)通過不斷增大規則前項支持度和觀察置信度來逐步逼近獲得最大預測精度,從而返回最好的關聯規則。處理結果通過Text Viewer以表格形式顯示給用戶。
WEKA-based Signalling Equipment Predictive Maintenance Information System
ZHAO Xiaofeng
( Shanghai Fuxin Intelligent Transportation Solutions Co.Ltd.,Shanghai 201210,China)
Signaling Equipment Predictive Maintenance Information System was used to implement data mining for maintenance information of subsystems in signalling system,combine with reliability,availability,and maintenanceability analysis result,set predictive maintenance strategy,defne fault information collection template,provide free software WEKA-based predictive maintenance method,use the method software integrity development,build models of classifers,cluster and association.This method was helpful to shorten development period as well as reduce software cost effectively.
predictive maintenance;free software;data mining;classify;cluster;association
U284.7∶TP39
A
1005-8451(2016)01-0052-04
2015-05-07
趙曉峰,高級工程師。