李 剛,盧佩玲
(1.中國鐵道科學研究院 研究生部,北京 100081;2.中國鐵道科學研究院集團有限公司 通信信號研究所,北京 100081;3.中國鐵道科學研究院集團有限公司 國家鐵路智能運輸系統(tǒng)工程技術研究中心,北京 100081)
近年來,我國高速鐵路快速發(fā)展,大量具有自診斷功能、高技術含量的信號系統(tǒng)應用于鐵路運營線上。與此同時,隨著高速鐵路運用規(guī)模的逐漸擴大、運行速度的不斷提高,高速鐵路信號系統(tǒng)也已經(jīng)從保障高速鐵路安全高效運行,拓展到多層域狀態(tài)智能感知、系統(tǒng)協(xié)同控制、安全態(tài)勢評估、大數(shù)據(jù)融合與智能維護、行程智能引導等前沿技術與應用領域[1-3]。此外,隨著分布式計算、4G/5G 通信、大規(guī)模數(shù)據(jù)并行處理[4]、深度學習[5]、3D 建模、高精度地圖、模擬仿真、虛擬現(xiàn)實、智能控制等計算機通信與智能相關技術的加快集成,建設基于數(shù)據(jù)驅動的信號智能運維系統(tǒng)成為可能。因此,從高速鐵路信號智能運維系統(tǒng)架構、關鍵技術、系統(tǒng)功能等方面對基于數(shù)據(jù)驅動的高速鐵路信號智能運維技術進行研究。
為構建適用于高速鐵路的信號智能運維系統(tǒng),要解決數(shù)據(jù)匯集、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)應用和數(shù)據(jù)展示等問題。信號智能運維系統(tǒng)架構如圖1 所示。

圖 1 信號智能運維系統(tǒng)架構Fig.1 Architecture of the intelligent signal operation and maintenance system
接入信號智能運維系統(tǒng)的數(shù)據(jù)源,主要包括檢測監(jiān)測數(shù)據(jù)、檢修維護數(shù)據(jù)、生產(chǎn)作業(yè)數(shù)據(jù)和公共信息數(shù)據(jù)。檢測監(jiān)測數(shù)據(jù)主要包括計算機聯(lián)鎖、列控中心、信號集中監(jiān)測等信號系統(tǒng)/設備數(shù)據(jù);檢修維護數(shù)據(jù)主要包括信號技術履歷、器材入所檢修和日常維護檢修等數(shù)據(jù);生產(chǎn)作業(yè)數(shù)據(jù)主要包括作業(yè)卡控和調(diào)度生產(chǎn)指揮等數(shù)據(jù);公共信息數(shù)據(jù)主要包括氣象和產(chǎn)品認證等數(shù)據(jù)。
數(shù)據(jù)匯集是對各類數(shù)據(jù)按照接口規(guī)范進行歸并與收斂,確保數(shù)據(jù)格式符合要求,數(shù)據(jù)質(zhì)量可知、可控,并完成數(shù)據(jù)清洗、抽取、轉換及相關的數(shù)據(jù)治理,為后續(xù)數(shù)據(jù)分析提供標準化、規(guī)范化、可解析的數(shù)據(jù)。
數(shù)據(jù)存儲是將經(jīng)過數(shù)據(jù)匯集處理后的數(shù)據(jù),按照關系型數(shù)據(jù)、非關系型數(shù)據(jù)、分布式文件數(shù)據(jù)等類型分類存儲,為后續(xù)數(shù)據(jù)分析奠定基礎,該存儲方式具有橫向擴展能力強及支持快速訪問的特點。
采用大數(shù)據(jù)分析、邏輯分析、聚類分析和回歸分析等分析方法,采用內(nèi)存計算、云計算、流計算和分布式計算等計算方法,對信號設備相關的各類數(shù)據(jù)進行綜合分析和計算,為電務專業(yè)用戶在數(shù)據(jù)分析層面的各項應用提供支撐,可以實現(xiàn)電務專業(yè)定制化數(shù)據(jù)分析。
以數(shù)據(jù)分析為依托,以實現(xiàn)設備狀態(tài)智能化分析、故障處理智能化定位、設備健康智能化管理、檢修維護智能化輔助、應急處理智能化支持和作業(yè)過程智能化卡控為目標[6],為用戶提供設備綜合監(jiān)測、全生命周期管理、智能故障診斷、綜合運維分析、生產(chǎn)作業(yè)管理、應急調(diào)度指揮、設備故障預測與健康管理(Prognostics and Health Management,PHM) 和車地一體化分析等多個應用功能。
數(shù)據(jù)展示是按照用戶的需求對數(shù)據(jù)進行多維度可交互可視化展現(xiàn),能夠以線路、二維/三維圖形、網(wǎng)絡拓撲、地理空間等方式進行可視化呈現(xiàn),能夠適配不同顯示終端,滿足電務專業(yè)各類用戶在展示層面的各項需求。
由圖1 可知,接入到信號智能運維系統(tǒng)中的信號系統(tǒng)有很多,接入的數(shù)據(jù)類型也多種多樣,既有結構化數(shù)據(jù),也有半結構化和非結構化數(shù)據(jù),如何將這些數(shù)據(jù)融合到一起,是信號智能運維系統(tǒng)要解決的首要關鍵問題。
數(shù)據(jù)融合是將帶有一定冗余性質(zhì)的數(shù)據(jù),在一定的理論基礎上進行合并的過程,目的就是用高效率低成本的方式將信息綜合起來,這樣就對接下來的狀態(tài)的態(tài)勢有了預估[7];數(shù)據(jù)融合是針對各信號系統(tǒng)中不同時間(采集間隔)和空間(不同部位) 維度的數(shù)據(jù),分析其多源異構的信息特征,包括廣域空間( 位置) 標識、事件標識、連續(xù)或離散性質(zhì)、傳輸特性等,從各類數(shù)據(jù)中挖掘趨勢信息。在各個時間維度下的數(shù)據(jù)采用去噪、剔冗余、解耦和特征提取等算法;在各個空間維度下的數(shù)據(jù)采用分類、聚類及相關性分析等方法。采用聯(lián)邦數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)倉庫法進行數(shù)據(jù)融合。
道岔是轉換列車運行徑路的重要信號設備,因其頻繁轉換的特點,也是最容易發(fā)生故障的設備。考慮從道岔動作曲線入手,以數(shù)據(jù)為驅動,對標準模板曲線選取和曲線拼接及建模識別2 項技術做重點研究[8]。
2.2.1 自動選取標準模板曲線
首先采用動態(tài)時間歸整(Dynamic Time Warping,DTW) 算法為每臺轉轍機的每個動作方向自動選取一條標準模板曲線,DTW 算法是衡量2 個長度不同的時間序列之間的相似度的一種算法,采用DTW 算法既可以解決歐式距離對數(shù)據(jù)對稱性的要求,又可以避免曲線噪聲對比較結果的影響。DTW 曲線相似度對應點選取過程示意圖如圖2 所示。
圖2 中給出了某個轉轍機的2 條動作曲線,從形態(tài)上來看這2 條動作曲線是相似的,圖中給出的是2 條曲線的最小包絡路徑。用DTW 算法自動選取標準模板曲線過程如下。
從某臺轉轍機的同一個動作方向的歷史動作電流曲線中任取2 條,設其時間序列分別為A= {a1,a2,…,am}和B= {b1,b2,…,bn},則存在一個局部距離矩陣Dm,n,計算公式為

式中:Dm,n中第i行,第j列的元素在下文表示為D(i,j),||ai,bj||表示2 個點之間的歐式距離。經(jīng)典的DTW 算法的核心思想是通過Dm,n找到一個最小的累計包絡距離Dist(i,j),計算公式為

其中,Dist(i,j)表示轉轍機動作曲線的反向包絡距離。算法可以歸結為尋找一條通過轉轍機動作曲線中若干序列點的路徑,路徑通過的序列點即為2 個序列進行計算的對齊的點。對于每臺設備,通過DTW 算法計算出各條動作曲線之間的反向包絡距離,選取其中與其他所有動作曲線包絡距離最小的曲線作為此設備的標準模板曲線。
2.2.2 曲線拼接及建模識別
每次轉轍機動作會產(chǎn)生1 條功率曲線和3 條電流曲線(A,B,C)共4 路數(shù)據(jù),實際應用中,轉轍機動作時間約為5 ~ 10 s,以每秒25 個點的采樣間隔對其采樣,得到大約250 個點數(shù)據(jù)。但是,當轉轍機動作異常或連續(xù)扳動時曲線延續(xù)時間可以達到30 s 之多,為了提高訓練和識別的精確度,對每路數(shù)據(jù),取其前800 個點作為有效數(shù)據(jù),這樣轉轍機每次動作就會得到4×800 個數(shù)據(jù),再與其對應的標準模板曲線數(shù)據(jù)(也是4×800 個數(shù)據(jù))一起轉換成矩陣形式,作為訓練和識別的輸入,曲線拼接示意圖如圖3 所示。
拼接完成后,曲線數(shù)據(jù)就變成80×80 的偽圖片數(shù)據(jù),作為特征被輸入到卷積神經(jīng)網(wǎng)絡中去進行學習,通過深度學習的方法,自適應地學習實時道岔動作曲線與標準模板曲線之間內(nèi)在的聯(lián)系,從而建立分析模型,使用該模型對實時動作曲線進行識別,識別完成后將輸出曲線狀態(tài)(正常或異常),并給出曲線故障概率。此方法可避免傳統(tǒng)的通過人工設置閾值實現(xiàn)故障診斷引起的模型“水土不服”問題,相比于專家系統(tǒng),此模型具有更強的適應性,可以保證算法在不同使用場景下的健壯性。

圖 3 曲線拼接示意圖Fig.3 Curve splicing
軌道電路是保障鐵路運輸安全的重要基礎裝備,其主要承擔列車完整性檢查及列車運行控制信息傳遞等功能,軌道電路一旦故障將會對正常運輸秩序造成影響。軌道電路的類型主要有ZPW-2000移頻軌道電路、交流連續(xù)式軌道電路、25 Hz 相敏軌道電路等,研究以ZPW-2000 移頻軌道電路為例,實時不間斷地分析其主軌、小軌電壓數(shù)據(jù),結合站場信息建立軌道區(qū)段的鏈接關系,分析相鄰軌道區(qū)段的電氣關聯(lián)性(物理位置關系、時間維度關系),通過對軌道電壓曲線的分析,及時發(fā)現(xiàn)故障隱患,減少因軌道電路故障對行車造成的影響,同時也可以減少因判斷錯誤引起的錯誤報警。
設備狀態(tài)是通過各個傳感器的模擬量或開關量值體現(xiàn)出來的,在時間維度上就會形成有規(guī)律的波形,因而波形狀態(tài)的提取是區(qū)分設備狀態(tài)的關鍵步驟,而建立相鄰軌道序列是軌道分析的基礎,也是軌道分析模型的訓練基礎。軌道電壓曲線分析流程如圖4 所示。
從圖4 中可以看出,在分析過程中首先需要有大量的歷史數(shù)據(jù),如果是新開通車站,在初始階段沒有運行數(shù)據(jù),則需要系統(tǒng)運行一段時間累積一定量的數(shù)據(jù)才能進行分析,或者運用相關軌道類型的歷史數(shù)據(jù)訓練好模型,然后使用訓練好的模型進行分析。從大量歷史數(shù)據(jù)中提取特征,建立軌道電路特征庫,隨后對時間相關性進行分析,接下來開展線性回歸測試,進而建立軌道電路的預測模型。有了預測模型之后就可以開展預測工作了,在這過程中可能需要人工干預,以保證模型的準確度,人工干預后還需進行回歸測試。在分析的過程中還需要納入相關設備的數(shù)據(jù),如信號機狀態(tài)數(shù)據(jù)、環(huán)境溫濕度數(shù)據(jù)等,用以幫助改善訓練模型。這是個周而復始循環(huán)的過程,隨著歷史數(shù)據(jù)的增多,模型會隨著分析過程動態(tài)調(diào)整,預測的準確度也會不斷地提高。

圖 4 軌道電壓曲線分析流程Fig.4 Analysis process of the track voltage curve
高速鐵路信號系統(tǒng)采用了許多新技術、新工藝,數(shù)字化、信息化程度很高,具有很好的PHM[9-10]技術應用基礎。應用PHM 技術,不僅能監(jiān)測和診斷信號設備故障,還能提前預測故障的發(fā)生,從而在系統(tǒng)故障之前及時采取安全容錯管控手段或維護措施,進而實現(xiàn)防患于未然。利用各信號系統(tǒng)的自診斷信息、信號集中監(jiān)測采集到的信息,PHM 能夠實現(xiàn)從板卡/ 模塊到部件到設備再到系統(tǒng)的不同層級、不同級別的綜合診斷、預測和健康管理。與傳統(tǒng)的局部信息預測不同,PHM利用獲取到的信息,提取各信號設備/ 系統(tǒng)的特征參數(shù),并對這些特征參數(shù)進行信息關聯(lián),運用算法和模型對特征參數(shù)及關聯(lián)信息進行分析,從而實現(xiàn)系統(tǒng)或設備的工作狀態(tài)管控。PHM 一般具有故障檢測、隔離、診斷、預測、健康管理和壽命追蹤等功能。故障預測與健康管理模型如圖5所示。

圖 5 故障預測與健康管理模型Fig.5 PHM model
2.4.1 關鍵參數(shù)挖掘
信號系統(tǒng)/設備的監(jiān)測數(shù)據(jù)多維度、數(shù)據(jù)量極大,因而為每一設備或系統(tǒng)抽取關鍵評估參數(shù)和指標而排除冗余信息具有重要意義。關鍵參數(shù)和指標的選取應具有代表性、獨立性和可行性,要遵循互補且不相互交叉的原則。
2.4.2 故障識別與診斷
由于在用的信號系統(tǒng)/設備是不能進行老化試驗的,因而進行故障識別依賴于故障歷史數(shù)據(jù)和報警信息的收集,再根據(jù)這些信息構建適用的診斷模型,來給出故障原因分析和維修策略。歷史數(shù)據(jù)充分、模型適當才能得到很好的識別與診斷結果。
2.4.3 維修策略
維修策略的推斷更依賴于智能診斷和歷史數(shù)據(jù),利用智能診斷和FMEA 表單描述已經(jīng)發(fā)生或者可能發(fā)生的故障,類似互聯(lián)網(wǎng)行業(yè)中常常根據(jù)用戶的使用習慣和瀏覽足跡對用戶做“用戶畫像”,需要根據(jù)先驗數(shù)據(jù)對故障做“故障畫像”,之后基于故障識別與分類結果,劣化模型建立結果,利用貝葉斯網(wǎng)絡或隱馬爾可夫鏈等智能算法對故障做推理和診斷。
2.4.4 健康狀態(tài)評估
(1)計算健康偏離程度。設備出廠時都會標注運行時的標準參數(shù),但設備實際運行中由于存在環(huán)境干擾或者設備老化,會出現(xiàn)運行參數(shù)基于出廠標準的上下浮動。為直觀、定性地描述這種浮動,可以依據(jù)歐氏距離、馬氏距離等算法估計運行狀況偏離正常狀態(tài)的程度,從而可以跟蹤描繪設備的退化過程[11]。
(2)建立健康評價指標。健康偏離程度是以定性的方式對系統(tǒng)/設備的運行狀態(tài)進行判斷,有些判斷依據(jù)沒有統(tǒng)一的標準,多以工程人員經(jīng)驗為準。為定量、標準化地描述設備或系統(tǒng)健康狀態(tài),需要建立健康評價指標。
(3)劣化模型建立與剩余壽命預測。信號系統(tǒng)/設備衰退的過程大體上可以分為2 個階段:①常狀態(tài)階段。系統(tǒng)或者設備的性能相對穩(wěn)定,變化幅度在較小的范圍內(nèi)波動。②退狀態(tài)階段。系統(tǒng)的性能加速退化,但尚未失效。劣化模型的建立需要基于設備上述2 種狀態(tài)下的監(jiān)測數(shù)據(jù)收集,并且需要系統(tǒng)判定屬于哪種退化階段。
信號智能運維系統(tǒng)在功能設計上,要考慮日常測試檢修、日常生產(chǎn)作業(yè)和應急搶修3 種應用場景,為此系統(tǒng)設計了設備綜合監(jiān)測、全生命周期管理、智能故障診斷、綜合運維分析、生產(chǎn)作業(yè)管理、應急調(diào)度指揮、設備PHM 和車地一體化分析等功能。根據(jù)運營維護的需要,后續(xù)還可以擴展相應的功能。
實時監(jiān)視車載和地面信號設備的工作狀態(tài),并集中顯示各信號設備狀態(tài)信息、業(yè)務信息和管理信息。可以全線或單站等多種方式展示,對同一設備的不同特征進行關聯(lián)展示。
利用各信號系統(tǒng)上傳的各項數(shù)據(jù)指標實現(xiàn)對信號設備的全生命周期管理,保證設備健康、高效、低成本的運用,創(chuàng)造顯著的能源、備件、人力、時間的節(jié)約效益,實現(xiàn)精細化管理。
智能故障診斷主要實現(xiàn):①對信號各子系統(tǒng)間關鍵數(shù)據(jù)進行比對;②對信號設備進行智能診斷,在設備存在隱患時,提前發(fā)現(xiàn)設備隱患;在設備故障時,能診斷定位故障范圍及原因;③對存在內(nèi)在聯(lián)系的事件進行綜合統(tǒng)計及預測分析,以輔助監(jiān)督電務設備運行正常。
綜合運維分析提供的主要功能如下。①整合分析:對存在因果、從屬和歸并關系的報警信息進行整合,并給出根源性的報警,減少無效報警,便于現(xiàn)場人員快速定位故障點。②質(zhì)量分析:根據(jù)監(jiān)測數(shù)據(jù),可按單個設備、同類設備、車站/線路來生成質(zhì)量評價指標,為設備維護提供參考依據(jù)。③同比環(huán)比分析:在設備報警類別、報警原因、報警數(shù)目及管界范圍等方面,對同比與環(huán)比2 類指標進行對比分析和趨勢分析,并生成可視化圖表供分析人員進行分析。④輔助人工分析:根據(jù)人工設置的波動范圍等分析參數(shù),自動篩選滿足條件的監(jiān)測數(shù)據(jù),為現(xiàn)場用戶提供有針對性的調(diào)閱,提高人工分析效率。
通過系統(tǒng)可以實現(xiàn)作業(yè)任務單自動下達,作業(yè)內(nèi)容自主可查看,作業(yè)結果自動提交,能夠實現(xiàn)對作業(yè)任務全過程的閉環(huán)監(jiān)督。
應急情況下,能夠實現(xiàn)備件、技術資料、人員及交通工具等信息的快速協(xié)同。通過系統(tǒng)能夠快速定位到故障點或故障范圍,通過智能故障診斷分析確定故障原因,通過系統(tǒng)可以快速關聯(lián)相應的應急線路、技術人員、應急保障車輛、備品備件及技術資料等信息,通過系統(tǒng)下發(fā)應急調(diào)度單,并可以通過視頻指揮現(xiàn)場進行應急處理。
采用故障預測與健康管理技術,對信號機、道岔、軌道電路等軌旁基礎設備,對計算機聯(lián)鎖、列控中心等基礎控制設備,進行故障預測和健康狀態(tài)評估。能夠按單個設備、同類設備、車站3 個維度給出健康度,以圖表、曲線等展示方式直觀給出設備所處的健康狀態(tài)及剩余壽命情況。
綜合運用車載和地面信號狀態(tài)、報警等信息,進行實時分析和集中監(jiān)督,對發(fā)生的信號設備故障進行精準定位,對故障所涉及和影響的信號設備工作狀態(tài),進行全程跟蹤和不間斷分析,從而實現(xiàn)車地一體化運維。
智能高速鐵路已成為全球鐵路的前沿發(fā)展方向,以數(shù)據(jù)為驅動,綜合運用智能分析、故障診斷、設備健康狀態(tài)評估等技術,使信號設備時刻處于可監(jiān)督、可管控狀態(tài)下,從而實現(xiàn)高速鐵路信號的智能運維,也是順應了這一發(fā)展方向。隨著高速鐵路建設規(guī)模的不斷擴大,實現(xiàn)信號設備的智能運維已成為電務維護人員的迫切需要。電務部門積累了大量高速鐵路信號監(jiān)測檢測、運營維護等數(shù)據(jù),但數(shù)據(jù)還比較分散,數(shù)據(jù)的綜合效能還沒有發(fā)揮出來。以數(shù)據(jù)為驅動,深入挖掘數(shù)據(jù)的價值,發(fā)現(xiàn)數(shù)據(jù)內(nèi)在規(guī)律,實現(xiàn)信號設備全生命周期管理,提高信號設備的可靠性、可用性,減少信號設備故障對鐵路運營的影響,保證旅客快捷、安全出行,是下一步需要深入研究的方向。