楊星浩 王瀛 趙記偉 朱桑 李志敏

摘 要:隨著城市規模的不斷發展,智慧交通也是城市化進程不斷向前推進的產物,是城市交通問題日益嚴峻和土地資源短缺狀況共同作用下的必然結果。[1]因此,本文希望能夠搭建智慧交通時空大數據分析系統,以手機信令數據為對象,現有的大數據體系架構和大數據服務組織為基礎,為規劃和管理的預測分析和決策提供準確的數據基礎,促進城市宏觀交通規劃和微觀交通設施建設以及土地利用規劃的科學有效,減少道路規劃不合理導致的交通問題,方便居民的出行。
關鍵詞:智慧交通;手機信令數據;數據分析
引 言
隨著我國經濟狀況的高速發展,城際之間的交通越來越繁忙,交通管理和交通參與對交通信息需求也越來越高,發展基于互聯網和大數據技術的智慧交通系統的建設是交通領域深化政府體系,提高政府有效治理能力,順應新一代信息技術和互聯網發展趨勢的重要手段。
同時隨著蜂窩網絡的全面密集覆蓋和手機的普及,手機信令數據、POI興趣點數據、地圖定位數據來獲取交通信息參數在目前以及成為一種有效可行的方式。其中,手機信令數據因其實時性、完整性、時空全覆蓋性等優點,成為近年來智慧交通體系建設的最主要的數據源,為城市交通規劃管理等領域提供了有力的數據基礎。
因此,本平臺在調查分析現有的智慧交通體系的基礎上,對手機信令數據進行全面清洗,深入分析,挖掘潛在價值,建立交通時空大數據分析平臺,實現人口分布分析,駐留出行分析,交通態勢監測預警,個性化出行推薦等功能,以充分利用城市大數據,改善人們便捷順暢出行的需求,滿足政府對交通數據科學監管的需求以及輔助科學決策的要求。
一、系統架構設計
交通時空大數據分析平臺總體框架設計(如圖1所示)具有擴展性,適應處理業務的拓展,采用分層設計思路,實現數據接入、數據存儲資源管理、計算處理、應用展示等功能。
數據層主要是實現對手機信令數據、地圖定位數據、規劃指標數據的采集、存儲、接入和建庫。
計算層主要是實現對于原始手機信令數據的數據清洗、匹配、分析、挖掘,是整個平臺系統建設的核心。
應用層主要是實現對手機信令數據處理與分析成果在交通領域的應用方案,提供數據基礎,輔助決策。
展示層主要是實現對應用層手機信令數據處理與分析成果的前端可視化展示。
二、功能設計
交通時空大數據分析平臺包含數據開放接口、人口分布分析、城市出行分析、交通態勢預警和個性化出行推薦等功能。
數據導入與條件選擇:按照指定格式導入手機信令數據文件后,可以進行省份、城市、時間、粒度等多維度條件進行篩選。
人口分布分析:按照所選擇的粒度,以熱力圖的方式顯示各個區域各個時段的人口分布狀況,并提供時間軸對熱力圖進行歷史回溯。
城市出行分析:通過對人口出行方式等特征進行統計分析,展示不同出行方式所占比例,以及各個出行方式與出行距離的關系,動態監測城際之間人流遷入遷出情況。
區域洞察分析:選擇需要查看的區域,將顯示對應區域各時段的交通狀況、高峰時段及實時擁擠指數,并實現短時人流預測,給出熱點景區排行榜。
交通態勢預警:展示實時擁堵指數,各時段人流與車流走勢、熱門站點,并針對異常擁堵進行研判和智能預警,提升緊急情況應急能力。
個性化出行推薦:根據出行的起止點及實際,結合用戶標簽畫像以及交通狀況,給出最短出行路線和出行成本的建議。
三、關鍵技術實現
多步數據清洗提高數據準確性
在數據清洗階段,由于手機數據產生的無規律性,導致信令數據采樣頻率不均,軌跡點時間間隔非常不規則,軌跡點密度分布不均,且易受手機信令工作機制的影響,用戶身處的實際位置所連接的基站可能與其自身位置相差較遠,因此直接進行軌跡點的識別是不合理的。并且由于某些區域的基站密度較大,某一地理位置可能同時被幾個基站所覆蓋,因此在此區域內的手機信令會隨著基站信號強度的變化而不斷切換基站,從而產生乒乓切換現象。一般來說基站有負荷優化機制,當鄰近的基站用戶負荷過大,會自動切換到更遠的基站從而產生了信號漂移。
針對以上提到的乒乓切換、漂移數據,重復數據問題,本文結合了多種清洗思路,使用Hadoop平臺作為數據處理平臺,Spark作為計算框架,從速度、距離、加速度、重復值等角度進行清洗數據,通過對原始數據進行無效數據清洗、乒乓現象消除、數據降噪、算法優化,形成可靠、可用的數據。
高效的交通分析模型精準實現駐留出行分析
在信令數據挖掘階段,傳統駐留點識別通過速度和距離特征對用戶軌跡點進行距離,得到用戶駐留區域和 出行軌跡,經試驗我們發現數據容易出現 1001,101 等,多個小駐留點簇情況,經過計算發現部分小簇駐留區域前后兩個區域距離較小,而區域間的出行段卻較大,這種情況可能是因為噪聲消除不完全導致,噪聲干擾駐留點識別。
本文根據信令數據的時間性,在 DBSCAN 聚類算法的基礎上定義時間維度,找出用戶信令數據中的駐留點和出行點。根據用戶出行軌跡結合高德地圖 API 得到用戶單次出行軌跡的 OD 和各種出行方式的方案軌跡點,再結合時空匹配度算法得到用戶單次出行的出行方式等數據。
智能化態勢監測及時預警異常情況
在交通態勢監測預警階段,本文根據信令數據 OD 明確、時間連續的特點,定義交通擁堵指數,將交通擁擠指數定義為用戶單次運動的實際在途時間與暢通在途時間的比值,擁擠指數越大代表交通越擁堵,計算出當天車流擁堵指數。根據軌跡點網格化思想,將沈陽市劃分成n*n個網格使得每個網格的邊長處于100~400m范圍,將用戶信令數據歸入網格中,以網格序號作為橫縱坐標代替經緯度,計算每個網格區的時刻人流量。并通過小波神經網絡實現短期的人流預測,采用對于非線性和隨機性的時間序列預測方面具有優勢的神經網絡并加入小波分析建立了基于小波神經網絡的短時交通預測模型,根據現有交通流量數據對未來幾小時的人流量情況進行預測。再結合四分位數展布法對人流進行異常監測,實現智能預警。
根據用戶標簽化提供個性化出行推薦服務
在個性化出行推薦階段,本文根據用戶出行的出行時長、出行目的、出行距離或用戶駐留的駐留區域、駐留時長等時空軌跡行為的一系列標簽對信令數據進行標簽化,通過TF-IDF算法根據這些標簽的發生時間、行為次數、 行為類型能夠統計出用戶與某些標簽之間聯系的緊密程度。對用戶標簽加權得到用戶偏好標簽,獲得個體用戶用戶畫像和群體用戶畫像,調用高德API并結合協同過濾算法,精準定位用戶畫像,掌握用戶時空軌跡偏好,為用戶提供個性化出行推薦服務。
多維度細粒度的可視化數據展示
在數據可視化階段,本文采用vue.js、ECharts、DataV等開源組件開發完成前端可視化平臺,提供直觀、多維度、細粒度、可交換、個性化的數據可視化圖表,多種數據展示模型配合數據混搭解決方案,實現交通時空狀況及預測結果的展示,提供對外數據導入通用接口,以及便捷的交互式查詢,增強用戶體驗,滿足用戶需求。
結 語
智慧交通的建設是城市發展的抓手,是緩解交通壓力、助力智慧城市發展的重要手段。本文開發的交通時空大數據分析平臺,以國家政策以及系列指導為依托,進行指揮交通頂層規劃,充分復用現有數據資源,深度挖掘手機信令大數據的價值,構建優化模型,實現了人口分布分析、駐留出行分析、交通態勢監測預警分析、人流分析、個性出行建議等等,提供數據通用接口并輔以直觀友好的展示。抓住痛點,讓提升居民獲得感體驗的公共交通出行服務為實施策略,打造智慧化的公眾出行服務,用大數據等技術充分挖掘和利用信令數據的價值,為交通治理提供科技,數據數據,提升緊急狀況應急能力,實現交通規劃決策智能化。
參考文獻
[1] 吳為強. 基于大數據挖掘的智能交通決策分析系統[J]. 機電工程技術, 2017(S2).
(第一作者)作者簡介:楊星浩(1999-07-),男,漢族,浙江溫州,本科生,數據處理與分析。
通訊作者:李志敏(1975-02-),女,湖北,研究生,副教授,醫學數據處理與分析。