翁湦元
(中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
智能交通系統將信息技術、通信技術、計算網絡技術有效集成,有助于綜合交通信息的融合與綜合運用。2001年美國智能交通運輸協會明確了智能交通建設主題,以緩解日益惡化的交通擁擠與基礎設施建設擴張乏力之間的矛盾[1]。美國ADVANCE系統采集車輛信息與地面傳感器信息經過系統處理分析后,將交通引導信息下發至車載設備,引導司機選擇最優路線[2]。日本建立VICS[3]系統,能提供實時路況、停車場實時車位等信息,功能較為完善。我國智能交通信息系統始于90年代,經過20多年探索已進入實用階段[4],北京市交通運行協調指揮中心、杭州智能交通信息系統平臺等均實現了跨區域、跨行業交通信息資源的集成、共享與交換[5],為綜合交通科學管理提供技術保障。目前,城市交通、鐵路、民航、公路、水路等交通行業均在建設與發展本行業智能交通信息系統,由于各領域業務相對獨立[6],交通數據分散在大型交通企業與相關業務部門中,缺乏跨行業交通信息資源的整合和綜合運用。
高速鐵路綜合樞紐車站同時連接鐵路運輸、城市交通、公路、民航等多種交通工具。隨著客流不斷增加,為方便旅客在車站內快速進出,對綜合交通信息與換乘引導服務的需求極為迫切。本文研究高速鐵路綜合樞紐車站旅客換乘引導信息服務平臺(簡稱:平臺)方案,實現車站周邊地面公交、軌道交通、出租車、網約車、停車場、共享單車等多源交通信息融合,建立高效的綜合交通數據發布渠道,為旅客提供換乘引導信息服務;并通過對高速鐵路與城市交通接駁服務需求的預測及運力資源的優化配置,提升高速鐵路綜合樞紐車站內旅客疏解效率,提升旅客出行體驗。
高速鐵路綜合樞紐車站旅客換乘引導信息服務平臺主要由3部分構成:底層基礎軟件、平臺基礎運行環境、大數據分析與應用服務。
底層基礎軟件主要包括操作系統、數據存儲、文件存儲組件,提供高性能的分布式結構化與非結構化數據存儲服務以及高性能的分布式文檔存儲服務;為提高系統穩定性和運行效率,基礎軟件主要以物理裸機結合虛擬化部署為主。
平臺基礎運行環境主要結合當前主流的容器與容器編排技術,部署Docker運行環境,搭建Kubernetes應用集群,為大數據分析與應用服務提供基礎運行環境,具備自動化部署、彈性伸縮的能力。
大數據分析與應用服務運行于Kubernetes環境內,大數據分析基于主流開源數據分析工具進行二次研發,應用服務基于Spring Cloud微服務架構進行定制化開發。
邏輯上,平臺技術架構可劃分為資源層、中間層、應用層、接口層4個層次,如圖1所示。

圖1 平臺技術架構示意
(1)資源層:包括基礎運行環境和資源服務,提供平臺運行所需的環境與數據文件資源,支撐平臺的運行。其中,基礎運行環境主要包含操作系統與虛擬化環境;資源服務主要包含數據庫、文件存儲、數據緩存等與平臺業務無關的資源服務。
(2)中間層:由數據庫連接服務、消息隊列服務、分布式任務調度服務、集群管理服務等組成,是連接應用層與資源層的橋梁;應用層的大數據分析與應用服務統一通過中間層提供的服務訪問資源層的數據資源,保證資源的使用穩定與合理負載。
(3)應用層:由大數據分析與應用服務組成;大數據分析包括非實時分析的離線計算服務與實時分析的流式計算服務;應用服務包含數據接收與采集、數據處理、平臺管理以及數據查詢服務。
(4)接口層:由負載均衡、MQ服務以及Restful接口組成;負載均衡用于將外部請求流量分配給后端Restful接口服務實例;Restful接口用于接收外部請求,并將需要應用層處理的請求傳遞給下層的應用服務;MQ服務負責接口層與應用層間數據通信的緩沖與流量調度。
如圖2所示,平臺離線計算采用Apache Spark[7]作為離線計算引擎,由Apache YARN完成Apache Spark集群的調度管理。數據分析人員通過離線數據分析管理應用提交數據分析需求,生成數據分析任務;任務調度管理根據分析任務,驅動離線分析引擎執行數據分析任務;離線分析引擎利用基于Spark Core的Spark SQL(用于數據處理)、GraphX(用于圖計算)和MLlib(用于機器學習)完成數據分析。

圖2 離線計算框架示意
如圖3所示,平臺流式計算[8]采用Apache Flink[9]作為計算引擎,數據源包括外部數據源及有限數據源2類:外部數據源主要是隨時間推移不斷變化的實時事件數據流,由消息隊列將數據傳輸至數據處理引擎;有限數據源將有限長度的數據集轉換為流的形式,并傳輸至數據處理引擎進行分析處理。數據分析管理應用負責維護數據分析規則,數據處理引擎按照數據分析規則對數據流進行相應處理后,傳遞給后續的數據存儲及數據服務。

圖3 流式計算框架示意
平臺采用集中化部署,從功能構成上劃分為數據接口、數據處理、數據存儲、平臺控制4個區域,從網絡結構上劃分為客服外網、客服內網和客票網3個網絡安全域,不同網絡安全域之間通過安全平臺實現安全防護隔離,如圖4所示。

圖4 平臺結構
2.1.1 數據接口區
數據接口區是平臺的入口,提供數據接收、采集以及數據展示與報表生成功能。數據接收功能完成外部數據的統一接入,主要包括數據路由、隊列服務、流量調度與負載均衡服務;負載均衡服務根據指定策略,將外部數據分配給不同的數據接入應用實例,并由路由服務傳遞到相應的數據處理器進行處理;流量調度與隊列服務將處理后的數據傳輸給數據處理服務,其中,隊列服務完成流量的削峰填谷,避免后端數據處理服務面臨瞬時大數據量處理壓力,并將需要實時處理的數據轉發給實時數據處理服務。
2.1.2 數據處理區
數據處理區提供數據分析、交通預測及數據查詢功能。數據分析功能對所采集的多源交通數據進行統計與綜合分析,生成分析結果,并建立知識庫;交通預測功能通過對歷史數據的綜合分析,利用預測模型提供未來交通狀況指標的預測服務。數據查詢功能提供平臺內數據的綜合查詢服務,可查詢的數據包括:平臺內原始數據、數據分析結果數據及平臺基礎數據。
2.1.3 數據存儲區
數據存儲區跨越客服外網、客服內網、客票網3個網絡安全域。平臺采集的第三方交通運輸數據作為外部數據存儲在客服外網;鐵路內部數據如時刻表、調度數據、旅服數據等存儲在客服內網;余票數據、席位數據、售票數據等鐵路運輸生產數據存儲在客票網。這些數據是平臺數據分析功能的基礎。
2.1.4 平臺管理區
平臺管理區主要提供權限控制與服務管理功能。權限控制功能主要負責管理平臺用戶(包括調用平臺數據查詢服務的外部應用、訪問平臺數據的管理、運營及數據分析人員)對平臺數據查詢服務的使用權限,以及平臺管理人員、數據分析人員對平臺數據采集、數據分析任務的操作權限。服務管理功能主要是監控平臺內部應用服務的運行狀態,采集平臺內部應用服務的運行日志,提供日志檢索服務,對平臺應用服務的運行實施控制,如控制應用的版本、副本數量等。
平臺主要數據處理流程,如圖5所示,外部數據采集由第三方推送,或由平臺主動拉取。消息隊列服務將采集的外部數據復制成2份,1份數據經預處理轉換為標準格式后,存儲在外部數據存儲集群中,另1份數據發送給數據流式實時計算模塊,由該模塊對需要實時分析的數據進行處理,分析結果作為離線分析結果的補充與修正,存儲在外部數據存儲集群中。
根據用戶需求,數據處理模塊從外部、內部數據存儲集群中讀取數據,完成數據分析和預測計算,并將處理結果存儲在數據存儲集群中,供用戶和其它內部系統讀取。日常的數據分析和預測任務均由任務調度模塊完成統一調度和管理。
平臺的內部、外部存儲集群中所存儲的數據與文件,以接口、可視化圖形及報表等形式,統一由數據查詢模塊提供訪問;將數據查詢接口納入平臺權限管理,并設置查詢緩存,以優化查詢性能。

圖5 主要數據處理流程
考慮到平臺接入的外部數據格式多樣、數據接口方式各異以及平臺自身的可擴展性,建立標準化的多源綜合交通數據采集流程,提供靜態、動態數據的高效存儲與查詢,實現高性能的數據離線與在線分析。所采集的綜合交通數據主要包括:
(1)地鐵數據:地鐵車站基本信息、線路基本信息、時刻表信息、地鐵車站進出站旅客人數、火車站周邊地鐵及前后站的進出站人數、地鐵線路區間滿載率等;
(2)公交數據:公交站點基本信息、公交線路基本信息、站點公交首末班時間、線路預計下班車到站時間、公交車輛滿載率、火車站周邊公交站點分時上下車旅客數量等;
(3)網約出租數據:高速鐵路綜合樞紐車站網約出租車打車便利指數、網約車進出站數量等;
(4)道路交通數據:火車站周邊道路和路口交通指數、車速、流量等;
(5)共享單車數據:火車站周邊共享單車數量等。
綜合交通數據的發布包括對外和對內2類渠道。對外發布渠道以開放數據查詢服務的方式,為授權用戶提供數據查詢;對內發布渠道以服務接口的方式,將綜合交通數據提供給鐵路12306網站、12306 App、旅客服務平臺等業務系統,借助鐵路12306網站、12306 App等官方服務平臺將數據呈現給用戶。
鐵路12 306網站目前可提供火車票預定、機票預定、汽車票預定、約車服務等業務,涉及各種主要交通出行方式[10]。利用平臺提供的綜合交通數據,可幫助旅客在行程中提前規劃好到站后的換乘方式與出行路線,實現延伸服務資源的增值,增強鐵路客運服務的市場競爭力。
在高速鐵路綜合樞紐車站等人流密集場所,5G通信高速率、低延時、高可靠、低功率、海量連接的優勢[5]更加突出,基于5G技術的高速鐵路樞紐車站旅客引導信息服務可為旅客帶來更優質的出行體驗。
5G高頻毫米波通信技術具有非常好的方向性,可以實現更高精度的測距和測角。5G大規模天線技術具有更高分辨率的波束,定位精度更高,填補了UWB與藍牙等現有窄帶定位技術在1~3 m范圍內精確定位的空白[11],可實現從室外到室內定位導航的無縫切換,為旅客提供更順暢的定位服務。對于換乘通道較為復雜的大型高速鐵路樞紐車站,利用站內導航與交通接駁換乘地圖數據,可引導旅客快速到達正確的地鐵、出租車、網約車接駁換乘地點,提高站內換乘效率。
在高速鐵路綜合樞紐車站內設置5G基站,利用5G高精度定位技術,根據樞紐站不同進站口的網絡連接數量,估算出不同出站/進站口客流量;旅客可根據站內客流分布,選擇相對不擁擠的進站檢票口、出站口或換乘通道,方便旅客在車站內快速進出,提高站內旅客換乘體驗。
在車站使用設置問路機、智能機器人等設備,通過人臉識別,借助5G網絡和邊緣計算技術,智能識別出重點旅客的身份信息和出行信息,提供咨詢、引導、送餐等服務,協助旅客安全、順利進站。旅客也可以在出站時查詢與樞紐車站接駁的地鐵、公交、網約車等其它交通工具的實時運行情況,選擇出站后的換乘方式;可在出租車候乘點安裝攝像頭,利用 5G網絡傳輸實時采集各候乘點的高清視頻,據此分析出租車排隊人數,引導旅客前往排隊人數較少的候乘點。
面向高速鐵路綜合樞紐車站旅客出行需求,針對當前綜合交通數據相對獨立、缺乏統一管理、未充分發揮價值的問題,研究高速鐵路綜合樞紐車站周邊交通數據融合技術,提出高速鐵路綜合樞紐車站換乘引導信息服務平臺設計方案,對平臺技術架構、平臺結構及功能進行設計,為下一步開發工作奠定基礎。