張心宇,王 喆,郭 歌,任 爽
(1.北京交通大學 計算機與信息技術學院,北京 100044;2.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
近年來,隨著鐵路信息化建設的發展,鐵路信息系統已深入各類復雜的鐵路業務場景。現有的鐵路信息系統管理分散、資源不均衡、響應不及時等問題日益突出,傳統的鐵路信息系統體系架構已不能滿足鐵路各業務領域日益增長的業務處理需求。
目前,一種逐漸成熟的信息技術——云邊協同技術,已在通信、運輸、制造等領域廣泛應用。工業制造領域,建立了邊緣工業設備的數據采集和數據整合流程;通信行業涌現出一批云邊協同計算平臺,探索更加直觀的渠道和商業變現能力;物流領域作為典型的物聯網業務場景,將快遞掃描業務上云,實現了邊緣側掃描校驗、云上綜合調度的協同策略。云邊協同技術結合云計算和邊緣計算各自的優勢,既能應對大數據、長周期業務,又能實現快速響應、自動決策,為鐵路信息系統提供了新的架構方案。
本文初步探索云邊協同在鐵路信息系統中的應用方式,提出鐵路信息系統云邊協同體系架構。
云計算是一種通過網絡按需提供服務的計算范式;邊緣計算將服務能力下沉到網絡邊緣,解決了云計算中延遲響應等問題。云邊協同是實現云計算與邊緣計算的協同聯動,進一步提升服務能力的新興計算范式[1]。
傳統鐵路信息系統架構中,海量的異構數據上傳到中心云進行處理,給云端計算單元帶來日益沉重的工作負荷。云計算全局性、非實時、長周期數據處理能力強的特點,使其在鐵路系統長周期業務、運營數據分析決策等領域發揮優勢[2];邊緣計算局部、實時、短周期數據處理分析能力強的特點,使其更擅長實時任務處理和決策執行[3]。為適應當前鐵路系統低時延、短周期、局部自治的需求[4],亟需結合二者優勢,構建鐵路信息系統云邊協同體系架構。
基于云邊協同的鐵路信息系統以低侵入性、整合Kubernetes生態圈開源技術為主,對現有的鐵路信息系統從架構層面進行重構。鐵路信息系統云邊協同總體架構如圖1所示。

圖1 鐵路信息系統云邊協同總體架構
1.2.1 應用層
應用層整合云邊鐵路信息系統的業務能力,對外提供系統應用的使用接口[5];負責維護鐵路系統內應用的注冊、分發和管理。中心云的系統呈現模塊可視化展示系統整體狀態;各應用實現的具體鐵路業務由中心和邊緣的業務管理模塊統一管理;中心和邊緣的應用管理負責存儲和編排不同需求的鐵路業務,將計算密集應用分發至中心云,低時延應用則交由邊緣云。
1.2.2 服務層
服務層實現可復用的服務,有效解決鐵路信息系統長期以來服務重復開發的問題。服務開發框架是服務開發和運行的必要組件,鐵路信息系統開發的服務和第三方常用服務聚合存儲在服務市場,經服務協同下發到邊緣服務管理模塊,以支撐邊緣應用運行。服務層的實現涉及具體的服務技術,包括MySQL數據庫服務、RabbitMQ消息隊列服務、TensorFlow人工智能服務等[6]。
1.2.3 資源層
針對鐵路信息系統運營中產生的海量異構數據,資源層屏蔽不同業務數據的結構差異,盡可能提高數據利用率。中心云的硬件抽象模塊通過設計頂層數據抽象,采用硬件抽象框架將從邊緣匯集的數據抽象為更通用的數據格式,并交由存儲管理模塊以對象或文件的方式進行存儲。邊緣存儲管理模塊在邊緣云上存儲具體的鐵路數據,解決過去部分數據存儲在非鐵路單位時的數據安全問題??蚣芡ㄟ^邊緣控制器對接入邊緣云的鐵路聯網設備進行集中調度。
1.2.4 安全管理
安全管理貫穿整個云邊協同體系架構,從應用安全、數據安全、網絡安全、邊緣節點安全4方面,全方位保障鐵路信息系統安全。
1.2.5 平臺支撐
平臺支撐通過搭建統一管理平臺,提供整個鐵路信息系統云邊協同體系架構的底層支撐。虛擬化是系統硬件資源復用的基礎,邊緣網絡負責中心云和邊緣云之間的網絡通信,邊緣自治則保證了部署在站點的邊緣云與數據中心的中心云網絡斷開時,站點服務仍能自主完成。
1.3.1 應用協同
應用協同通過中心云應用管理模塊和邊緣應用管理模塊協作,拆分鐵路應用的云邊能力,綜合優化鐵路應用。鐵路信息系統的各個應用以鏡像形式集中存儲在中心鏡像倉庫中,通過應用分發管理,統一決策是否分發到邊緣云;邊緣云上擁有自己的邊緣鏡像庫,負責接收從中心鏡像倉庫下發的應用鏡像,以鏡像分發的形式間接實現應用分發。中心云和邊緣云都可借助各自相應的應用編排管理模塊和生命周期管理模塊,將應用鏡像實例化成容器對象[7],在云和邊同時提供鐵路應用服務。應用協同架構如圖2所示。

圖2 應用協同架構
鐵路各站段自建服務器導致硬件資源差異大,各服務器作為邊緣節點加入邊緣云時,利用平臺支撐層提供的Pod虛擬化、資源共享IP、namespace[8]等特性,屏蔽中心云和邊緣云的硬件環境差異,實現應用親和性分發;采用鏡像分級緩存、邊緣鏡像站點加速、邊緣節點間P2P分發等技術加速應用大規模分發,提高部署速度。
1.3.2 服務協同
服務協同為鐵路應用的構建和運行提供服務支撐??煞譃榉臻_發框架和服務市場兩個模塊。服務開發框架提供服務開發、接入的標準化接口和服務運行環境;服務市場對接第三方服務,整合數據庫、消息隊列、大數據、人工智能等鐵路應用開發所需的通用服務[9]。中心云服務市場根據邊緣云的服務需求,下發到邊緣云的具體邊緣節點上,通過云邊服務發現、邊邊服務發現保障中心云和邊緣云服務間的消息傳遞。服務協同框架如圖3所示。

圖3 服務協同框架
由于鐵路業務特點,列車管理、客流統計等業務會產生海量時序數據,服務協同引入時序數據庫配合傳統的關系型數據庫,解決時序數據的并發問題,提供多維度的聚合分析和趨勢洞察能力;人工智能服務作為邊緣應用的主流,應用增量學習、聯邦學習、聯合推理,賦能邊緣智能,解決鐵路智能模型訓練和推理時的精度、時延、通信量、數據隱私等問題[10];邊邊服務發現、云邊服務發現及各部分流量治理綜合實現服務層面的通信和協同。
1.3.3 資源協同
資源層涉及鐵路站段各種邊緣設備的管理,如智能攝像頭、聯網雷達、車載Wi-Fi等。資源協同提供底層的硬件抽象,降低上層應用開發難度,提供了全域調度和網絡加速能力,使邊緣資源利用率顯著提升。
資源協同主要涉及3類技術:(1)硬件抽象,Docker疊加Kubernetes構建一套標準化邊緣計算平臺,通過插件框架(Device Plugin Framework)的形式,保障如安檢儀、閘機等聯網硬件統一的抽象開發接口;(2)全域調度,應用可靈活定義的策略實現云邊資源的動態調度,保證服務層和應用層性能最優[11];(3)全域加速,構建全域的Overlay網絡,實現各節點的優化尋址和動態加速,為基于服務質量和確定性時延的調度策略打下基礎。
微服務是實現鐵路信息系統云邊協同體系架構的基礎。例如,針對現有的中國鐵路客票發售和預訂系統(簡稱:客票系統),可將其業務功能拆分為認證、購票、支付、進站數據采集等微服務[12],每個微服務采用SpringBoot或其他完全不同的技術棧開發;支付、購票等綜合性服務部署在中心云,而進站數據采集等近用戶端的服務部署在邊緣云;采用Spring Gateway實現服務網關,提供云邊集群的負載均衡和請求轉發能力;中心云部署nacos服務注冊組件,解決云上各個服務的注冊和發現問題[13]。
通過微服務技術重構現有鐵路信息系統的應用,并將其部署在云邊協同體系架構上,既可解決現有應用維護困難的問題,又能提供更及時的數據采集能力,減少中心云的請求壓力。
傳統的鐵路信息系統架構各個應用間的數據難以復用,服務間不能相互調度,資源使用率較低;各應用的運行維護(簡稱:運維)方式差異較大,應用可維護性差。
鐵路信息系統云邊協同體系架構利用以Kubernetes為主的容器編排技術框架,為鐵路應用提供云邊協同的實現和管理方式,以及分布式計算、邊緣自治、負載均衡能力[14]。借助Kubernetes的邊緣自治、邊緣單元化管理、邊緣流量拓撲、邊緣狀態監測等能力,實現不同鐵路應用的數據共享和應用狀態監控等,解決傳統鐵路信息系統架構的數據共享難題和運維難題。
鐵路信息系統云邊協同體系架構依托邊緣計算技術實現邊緣云。邊緣計算將計算能力下沉至數據源一側,在數據產生端提供直接的計算或存儲服務。邊緣計算技術涵蓋多個專業領域,包括硬件抽象框架、邊緣網絡、計算卸載等多個方面[15],為云邊協同的鐵路信息系統架構提供了低時延、高保密的優勢。
鐵路運營中涉及諸多對低時延需求較高、對生產作業過程中的數據安全和隱私要求較高的場景。例如,在鐵路站場場景中,涉及到物流中心、編組站、機務段、車輛段、動車所等鐵路作業區域,通信作業范圍為面狀區域,作業人員和車輛密集且業務量大。利用邊緣計算分流策略將站場應用業務分流到站場應用服務器,滿足調車控制、自動駕駛、無線售票、機器人控制等站場業務對低時延的需求。
典型的“工電供”運維場景中,需要對車站重點區域進行安全監控,并保證視頻業務的實時處理[16]。邊緣節點篩選出監控視頻或圖像中變化的部分,并向中心云回傳,把價值不高的監控視頻或圖像就地緩存在邊緣計算中心的服務器中,避免無用信息耗費網絡資源,提高了邊緣側準確識別和快速響應的能力,降低了邊緣計算中心視頻、圖片上傳所占用的數據帶寬。
邊緣云的智能監控設備可實時監測鐵路沿線重點路段,在邊緣端識別入侵異物,截取有爭議視頻片段并進行初步處理后回傳中心云進行進一步數據分析。既保證了重點區域的實時檢測,又保存了重要數據以備詳細測算。
當前,鐵路部門采用的安檢設備部分內置有人工智能輔助判圖算法,能夠智能判別移動物品種類。但安檢設備計算能力有限,存在算法識別幀率低于物品安檢速率的情況,且由于鐵路實際監管需要,違禁品種類可能有更新和變動,將輔助算法內置于安檢設備的方式不利于算法的動態更新。如果簡單地將檢測算法上云,將檢測模型的訓練和預測都在云數據中心實現,又存在數據傳輸延遲較大的問題,難以應對快速安檢的需求。
借助鐵路信息系統云邊協同體系架構的算力分離優勢,在邊緣云部署安檢模型預測應用,安檢設備實時上傳的X光圖像在邊緣云進行預測。中心云定期收集新的安檢圖像,經過分析、標注后進行高算力需求的人工智能模型訓練,更新模型參數;模型更新后下發到邊緣云,利用邊緣服務器的延遲和算力優勢,在邊緣側進行安檢模型的預測[17],計算結果供給車站安檢系統使用,滿足智能安檢需求。
數字列車的數據處理,電務設備智能感知、狀態采集和智能分析等場景,都符合上述應用場景的特征[18]。
云邊協同技術在鐵路信息系統的應用,對于動態拓展業務、適應市場變化、實時決策發布、提升安全水平都有重要意義。為推動云邊協同技術在我國鐵路行業應用實施,提升鐵路信息系統服務水平,應借鑒其他行業云邊協同應用的經驗,結合鐵路業務自身特點,總結適應鐵路系統的云邊協同應用方案。