李媛翯 張健欽,2 趙 明
( 1、北京建筑大學 測繪與城市空間信息學院,北京100044 2、城市空間信息自然資源部重點實驗室,北京100044)
近年來,交通數據來源越來越廣,數據類型也日益豐富,而不同交通信息系統之間相互獨立,易出現各自為政、條塊分割、大量重復建設和業務無法協調等問題,建立一個兼具大數據分析和各部門協同功能的平臺迫在眉睫。混合云兼具彈性資源和安全保障,有存儲數據量大、計算能力強、信息融合可共享等優點。因此本文設計了一個基于混合云的交通大數據協同工作平臺的系統框架和多用戶協同分析機制,并進行了研發和應用實驗。
結合混合云計算技術,本文從全局的視角出發,考慮到資源集成、業務互聯和數據互通等方面后,進行了系統總體框架的設計,如圖1。
本系統一共分為六層,其中數據資源層包含數據采集層和數據層。數據采集是指通過設備獲取交通相關數據的過程。數據層是對采集到的數據進行初步篩選、整理、格式轉換等預處理,方便后續的存儲、調用、分析和封裝工作。數據邏輯層包含數據存儲和數據分析計算兩種功能,為數據服務層提供數據支撐。數據邏輯層即混合云,由本地數據庫、私有云和公有云組成,其中私有云僅限內網可以登錄。數據服務層負責不同模塊之間的數據交換和傳輸。數據表現層負責web 前端界面用戶交互操作、數據挖掘結果的展示。協同層是指通過視頻會議和云文檔的方式輔助用戶協同。用戶層包括數據管理員、專家、公眾和決策者。

圖1 系統架構

圖2 系統協同機制(灰色表示異地登陸平臺)
本文中的協同分析主要是指來自不同地理位置和背景的用戶根據各自的領域共同解決某些交通問題的過程,貫穿于從數據收集、存儲、分析到決策的全過程。城市交通大數據協同分析平臺的協同機制如圖2。其中,數據管理員負責確定數據的敏感性,并清理上載的數據,以確保數據的安全和質量。專家負責算法模型的研究和實現,以及對計算結果的分析。決策者負責根據專家的分析和公眾反映的實際情況制定政策。

圖3 原型系統架構
本文通過建立防火墻將內網與互聯網或其他外部網絡隔離開來,并通過限制網絡訪問來保護內網,從而確保云中數據傳輸的安全。同時在混合云中部署SSL VPN 設備和虛擬映像,建立私有的加密傳輸通道,避免數據盜竊和非法攻擊等安全威脅。用戶通過安裝VPN 客戶端建立SSL VPN 連接,遠程訪問虛擬私有云進入系統登錄界面。在確認用戶的身份信息之后,系統將自動跳轉到為內網用戶服務的數據分析界面。
此外,系統設有用戶操作記錄功能,所有操作信息都記錄在日志文件中,并定期上傳到云中。
以北京為例,每天會產生數億條動態交通運行數據,其中大部分具有位置和時間屬性信息。依據北京市交通數據結構和用戶可視化分析需求,本文基于上述系統架構和協同機制研發了北京市交通大數據可視化系統。目前,該系統已成功在阿里云服務器上部署并運行。北京市交通大數據可視化系統架構如圖3。
根據出行數據的來源,系統分為出租車、共享單車、公交車、停車和地鐵五大模塊模塊。系統支持內網用戶在web 端進行固定格式數據上傳、數據查詢、可視化服務調取等操作;其他用戶可查看可視化分析結果,且支持在討論區對結果進行評價和反饋。
為有效管理多源異構的交通大數據,并實現數據的高效協同利用和分析,本文設計了基于混合云計算技術的交通大數據協同分析平臺的系統架構和多用戶協同分析機制,并介紹了基于該系統架構下原型系統的實現。當前,為萬物互聯網提供技術支持的5G 已正式投入使用,進一步推動了數字雙城的建設。如何繼續提高海量數據下的計算效率,保證計算的實時性和穩定性將成為未來研究的主要方向。