宋大治,王 健,徐鐘全,劉光杰
(1.南京地鐵建設有限公司,南京 210017;2.北京全路通信信號研究設計院集團有限公司,北京 100070;3.南京信息工程大學電子與信息工程學院,南京 210044)
隨著近年來城鎮化的加快發展,城市人口數量在不斷增加,城市規模也在逐步擴大。城市軌道交通以其運輸人數量大、運行速度快、安全程度高的優勢,成為解決城市人口出行的重要手段。城鎮化的趨勢使得城市軌道交通的壓力也在逐漸加大,城市軌道交通如何適應城鎮化的趨勢,利用更前沿的技術解決發展過程中遇到的問題是城市軌道交通建設中的重要挑戰。
國務院印發的《中國制造2025》在大力推動突破發展的重點領域中著重提到了先進軌道交通裝備,指出“加快新材料、新技術和新工藝的應用,重點突破體系化安全保障、節能環保、數字化智能化網絡化技術,研制先進可靠適用的產品和輕量化、模塊化、譜系化產品。”其中數字化智能化網絡化技術的在軌道交通領域的運用和發展是構建世界領先的現代軌道交通產業體系的關鍵因素。
城市軌道交通在運營、運維日常工作中會產生海量的用戶數據、設備數據、日志數據等,這些數據來源眾多,種類各異,累積量大,更新頻繁,這些數據以自動或主被動的形式產生,形式包括非結構化數據、結構化數據和半結構化的數據,城市軌道交通數據是名副其實的大數據。如何利用這些軌道交通大數據從運營、施工、決策、設計等方面來服務軌道交通,通過對軌道交通大數據存儲、加載、結構化、清洗、處理、分析等手段來獲取關鍵指標數據,這是線網指揮中心大數據平臺建設的重要要求。
不同于其他方向的信息領域,城市軌道交通數據有4個明顯的特點。
1)數據生成符合一定的時序規律
城市軌道交通按照既定的計劃和方案來運轉,每天都能產生符合時間規律的數據,這些數據滿足一定的時間特征。
2)數據生成形式多樣
軌道交通數據來源于不同的業務,跨部門多用途,數據產生的方式也各不相同。數據分布的異構性使得非結構化數據占絕大部分。
3)數據相互關聯
雖然數據生成形式多種多樣,但是數據之間相互關聯,其中一個系統中部分數據的變化可能會引起或導致另外一個業務系統的連鎖反應。
4)數據實時動態更新
城市軌道交通在日常運營過程中,不間斷地產生各種數據,數據刷新速度頻繁,更新速度快,累積量大。
通過分析可知,城市軌道交通數據有上述4個主要特點,類似于工業現場數據。城市軌道交通數據符合大數據的主要特征,適用于大數據處理環境。利用大數據技術實現數據的存儲、清洗、加工分析,實現城市軌道交通線網大數據中心的合理建設和有效使用,為業務系統決策提供直接的依據。城市軌道交通線網指揮中心的數據類型如圖1所示。

圖1 線網指揮中心數據分類Fig.1 Data classification of line networking command center
線網指揮中心數據來源廣泛、顆粒眾多、維度不同、關聯性強的特點,使得傳統的數據存儲手段不能有效地發揮線網指揮中心的價值。通過大數據技術,解決海量數據存儲問題、非結構化數據關聯問題、實時數據分析問題等實際困難,有效提高線網指揮中心的數據地位,引導業務系統健康有序發展,進而提升城市軌道交通運行效率和運維安全。當前,在國內的部分城市中已經有一些線網指揮中心引入了大數據技術并指揮城市軌道交通數據中心建設。但是,大數據技術在城市軌道交通中的應用還有待發展,主要表現在以下3個方面。
1)數據統計分析工作缺失
在當前的數據中心存在數據樣本缺失、數據維度不統一,數據分析困難,缺乏對軌道交通數據的基本處理和分析統計工作。
2)數據質量參差不齊
由于在城市軌道交通行業的數據生產缺乏統一的行業標準,各業務系統生成的數據類型、數據格式、數據存儲形式等不一樣,數據規范性較差,數據前期準備工作需要處理的問題較多。
目前,各個業務系統分別運行,業務系統之間缺乏必要的通信接口或數據接口,這使得業務系統相對孤立,各業務系統之間隔離導致信息孤島的情況。
基于自頂而下的數據資源構建思想,城市軌道交通線網數據中心大數據平臺架構主要包括3個部分,分別是基礎平臺、支撐平臺和數據資源UI平臺。其中基礎平臺由3部分組成,分別是數據集市、數據倉庫管理和資源數據庫。支撐平臺包含6個部分,分別是Hadoop大數據處理平臺、資源庫存儲、資源庫安全、資源庫規范、資源庫安全和資源庫目錄。數據資源UI平臺提供用戶接口,提供風險評估、決策支持和預警預測等服務。大數據平臺架構如圖2所示。

圖2 大數據平臺架構Fig.2 Platform architecture of big data
數據資源池包括城市軌道交通運營數據、行業數據和政府數據等,數據形式包括結構化數據和非結構化數據。這些數據經過整理形成主體資源數據庫,以數據模型的形式保存。通過Hadoop大數據平臺的存儲、加載、清洗、轉換等流程來建立數據資源倉庫,進而為業務系統決策、業務系統管理和改進提供依據。
城市軌道交通線網指揮中心大數據平臺建設的基本目的是利用大數據處理技術實現對軌道交通各業務系統的數據整合,并以此海量數據為基礎實現具備預警決策、改進支撐的大數據管理信息系統,更好地促進城市軌道交通健康有序發展。
2.2.1 大數據資源介紹
1)數據分類
按照數據中心的功能和定位,包括指標數據、路網基礎數據、系統配置數據3大類信息資源的數據架構如下。
本文通過實驗表明,為心臟起搏器植入術患者提供綜合護理干預護理效果明顯,能夠有效的降低不良反應的發生率[4],提高患者的治療效果,主要原因有:通過為患者提供術前護理,降低患者在術中出現風險事件,有利于保證患者的生命安全,通過為患者提供術后體位護理,向患者講解生活中注意事項,有利于加快傷口愈合速度,提高患者生活質量[6],通過為患者提供術后心理護理,有利于消除患者不良情緒狀態,增強患者對治療的信心,通過為患者提供術后飲食護理,增強患者營養物質的吸收,在一定程度上降低患者出現便秘的發生率,促進患者舒適度[7]。
第一類是指標數據:是在路網運營數據倉庫基礎上為用戶提供標準的、統一的、具有可擴展性的數據支撐,包含了軌道交通內部信息系統的原始數據、衍生數據、過程數據等。具體包括了運營路網數據、運營設備數據、列車運行數據、列車時刻數據、工作日記與監控數據等。
第二類是路網基礎數據:主要包括軌道交通相關的各類文件數據、基礎路網數據和基本參數數據3個部分。具體包括地理信息數據、法規數據視圖、多媒體數據、設備數據、列車數據、線網數據和站臺廳數據等。
第三類是系統配置數據:主要包括用于支撐業務工具和業務方案的相關配置數據和業務資源數據。其作用是把來自于數據集市中的數據按照指標、模型和算法進行結果加工。最終在展現層中以報表、多維、儀表盤和查詢等方式進行展現。
2)數據的來源
線網指揮平臺(NCC)采集各線路行車數據(ATS)、客流數據(ACC)、供電、風水電等設備及運行數據(ISCS)、能耗數據(EMS)、圖紙文檔及視頻、外部數據(包括氣象信息系統、地理信息系統、互聯網數據、公共服務部門數據)等,大量運行數據日益呈現體量大、類型多、價值高等特征。數據量爆炸式的增長,數據分析處理能力落后與數據快速增長之間的矛盾將更加突出。隨著數據量、數據類型的不斷增多,也出現數據分析性能瓶頸、缺少數據分析挖掘的高級方法、非結構化數據尚缺乏有效利用等問題。在數據豐富性方面,利用信息化技術采集開放平臺、開源數據中心等多種來源的數據庫內容來豐富數據中心資源。在系統建設中,應用主題搜索技術充分挖掘公開互聯網信息資源,充實壯大數據中心數據。
3)數據編排方式
城市軌道交通線網指揮中心大數據平臺數據來源于各不同業務系統,數據的類型決定了數據的文件存儲格式,即為了便于快速檢索數據文件,對數據的存儲編排也不盡相同。根據數據產生的形式不同,數據編排方式包括文本數據、視頻數據、圖片數據、動畫數據、音頻數據和網頁數據等。不同類型的文件以各自的形式存儲于大數據處理平臺。
2.2.2 主題資源數據庫
在建設目的上,主題資源數據庫應滿足數據的完備性、準確性和時效性,且數據內容面向不同的主題要求。數據通過主題資源數據庫實現共享,在主題資源數據庫保存的數據文件可供多種不同類型的業務員系統使用。在建設主題上,根據大數據技術在城市軌道交通中的建設需求,可分為當事人、路網、設備、行車、票務、渠道、起止、客流、清算、事件等主題。主題資源數據庫僅存儲相關主題的數據,其存儲內容不應隨業務系統而改變。主題資源數據庫承擔著各數據集數據共享的橋梁功能,避免了各數據集之間的冗余存儲和數據孤島現象的出現。
2.2.3 數據資源倉庫
在大數據平臺架構中,數據資源倉庫是主題資源數據庫的上層應用,即數據資源倉庫從主題資源數據庫中抽取特定類型、形式、結構的數據文件,根據數據文件所在的主題形成數據資源集市,以便上層業務系統調用。數據資源倉庫具有多種特點,包括基于主題性、定制性、時序性等。數據資源倉庫提供了使用者便捷獲取主題資源數據庫中內容的方式,便于其快速獲取相關數據并實現數據管理和關鍵決策,實現數據的重要價值。數據資源倉庫是主題資源數據庫與上層業務系統之間的橋梁。
為了便于數據倉庫資源高效、便捷的使用,建立城市軌道交通大數據支撐平臺,設計采用Hadoop大數據架構。支撐平臺是大數據架構中不可缺少的組件,利用Hadoop大數據處理技術構建數據資源倉庫并完成數據接口對接,Hadoop將各業務系統中的數據經過數據提取、轉化,實現異構數據的統一管理,異構數據經過數據清洗、數據整合、數據分析、數據挖掘、數據處理,最終形成符合存儲需求的數據結構和形式,保存在數據資源倉庫中。城市軌道交通支撐平臺支持的數據類型包括結構化數據、非結構化數據和半結構化數據。
數據資源UI平臺是城市軌道交通大數據中心的重要組成組件,通過建立統一的數據資源UI平臺,實現用戶對大數據中心的快速友好訪問,提供數據資源發布、數據資源搜索、數據資源聚合等用戶交互功能。數據資源UI平臺的建設實現如下的功能。
1)建設集中式的標準化數據接口,整合業務數據,提供數據關聯方法。
2)實現海量數據資源管理和展示,數據資源包括結構化數據、非結構化數據和半結構化數據,數據資源通過數據資源UI平臺展現給用戶。
3)利用Hadoop大數據技術實現城市軌道交通海量數據資源的數據存儲分析,深入發掘數據的潛在價值。
4)利用訂閱/查詢組件實現城市軌道交通數據資源UI平臺用戶的資源需求,實現數據訂閱、數據分發。
5)為便于決策系統和業務優化系統及時準確地獲取特定類型的數據,數據資源UI平臺根據數據功能規劃提供數據資源訪問接口。
6)為保證數據資源的完整性和準確性,基于最小權限原則,數據資源UI平臺實現用戶角色權限管理功能,根據用戶角色來確定其訪問數據資源的權限,避免數據資源非法訪問。
在城市軌道交通日常運營過程中,大數據技術重點要解決的運營方痛點需求包括服務質量提升、安全運行保障、系統節能、管理決策等。
1)服務乘客的質量是城市軌道交通運營的一個重要關注點,服務質量評價體系的數據來源主要包括乘客評分和車輛客觀狀況。其中乘客以線上或者線下的方式提供乘客主觀乘車體驗,車輛客觀狀況包括車輛的運行時間、擁擠情況、環境情況等因素。大數據技術利用評價數據對乘客服務質量做出客觀評價,基于評價體系對提高服務乘客質量和改進服務標準提供有力的數據支撐。
2)安全運行是城市軌道交通運行中最基本的要求。安全運行主要是跟硬件設備信息和客流信息相關。硬件設備信息是指與硬件設備安全關聯的因素,這是用于判斷軌道交通安全性的重要指標,大數據技術利用設備安全性指數進行綜合分析判定,并對不安全的線路狀態進行預警和判定。客流信息是指影響客流量的關鍵指標,如大型戶外活動、突發緊急事件等可能會帶來巨大的客流量,客流量的激增顯著增加了城市軌道交通運行的風險。利用大數據中心對突發事件進行預判和突發客流預警,依據預警給出突發事件預案,進而避免城市軌道交通在面臨突發事件時不可預知情況的發生,提升城市軌道交通應急運營能力。
3)系統節能指標也是城市軌道交通中一個十分重視的因素。利用Hadoop大數據技術分析系統歷史耗能數據、系統近期耗能數據、系統計劃耗能數據,給出系統耗能數據趨勢,并對數據分析發掘影響系統能耗數據指標是否合理,進而分析城市軌道交通運營中提升系統節能指標的關鍵因素并對可能出現的峰值用能進行提前預判。從數據分析的角度實現節能減排和合理計劃用能。
4)數據資源支撐也是運營方管理決策的主要依據。在管理決策時,運營方以定性數據為依據來給出合理化判定。大數據技術利用數據資源支撐平臺中的數據,通過事先設定的邏輯規則發掘數據內在的關聯關系和關鍵價值指標,為運營方管理決策提供實際數據支持。另外,利用大數據技術的可視化平臺能夠直觀地給出關注事件的趨勢和預警,便于精準快速決策。
目前,大數據技術在一些城市的軌道交通中已經開展應用,其在城市軌道交通運營中發揮著重要的作用。依賴于大數據技術的發展及其在軌道交通領域的應用理解,以及城市軌道交通面臨的痛點需求問題,對大數據技術在城市軌道交通中的以下應用場景開展深入研究。
1)安全運營管理:城市軌道交通運營中,安全是第一要素。為了保證設備、乘客、運行安全,依托于大數據技術在海量軌道交通歷史數據分析處理中的優勢,對系統關鍵指標進行分析和預判,及時發現可能存在的安全隱患,防患于未然。
2)日常運營優化:通過分析關鍵指標、模擬運行情況、預測客流量、指定行車時間路線計劃等手段,以日志數據、支撐平臺為輔助方法,為決策預警提供數據支持。通過對歷史場景的情況演練、分析和驗證,指定應急時間處理方案,提升運營方的應急處理水平。
3)提升經營效益:通過分析能耗數據、資產數據、設備數據等成本因素,以高質量服務和安全高效運營為基礎,以大數據在成本因素中各需求進行綜合評估和判定,進而制定節能減耗的方案。通過不斷優化經營手段,降低運營成本。
4)管控安全建設:利用大數據技術對城市軌道交通中安全建設數據的分析,來改進施工計劃進度、加強施工建設安全,實現安全建設和風險評估,從數據層面指引、管控安全建設。
“云計算” “大數據” “互聯網+”等信息化領域的新興設計理念,在城市軌道交通快速推廣應用。國內眾多城市已開始構建數據采集、數據建模、數據治理、數據安全、數據應用為一體的線網大數據平臺,通過大數據分析技術形成智能決策分析,助力城市軌道線網協同指揮,提供強有力的大數據支撐服務。