楊奎軍 李玉寶 陳翠嬌






摘 要:通過神經網絡模型對固定檢測器采集的地點車速數據、交通流量數據和手機切換技術提取的路段行程時間數據進行時間、空間和語義的一致化處理,最后用路段平均車速對道路交通狀態進行評估,以山東省濟樂高速南延段為例,采用該多源數據融合模型相較于固定檢測數據融合模型,得出的路段平均車速誤差值減小。
關鍵詞:交通狀態;神經網絡;異構數據
中圖分類號:U491 文獻標識碼:A
0 引言
行駛在高速公路的車輛受車輛速度、時間占有率、車流量以及天氣狀況等客觀條件的影響,極易造成高速公路的交通擁堵以及二次事故的引發,目前高速公路交通狀態預測所使用的微波檢測器雖然固定,但在路網分布上相對稀疏。史巖[1]采用神經網絡模型對微波檢測器、牌照識別檢測器采集的交通流速度數據和浮動車數據進行融合。姚午開選用收費站刷卡數據和浮動車數據進行數據融合,采用極限學習機算法對高度公路交通狀態進行評估。
出行者對于規劃路線的選擇比較注重行程時間,而行程時間的長短受多種因素的影響,手機活動數據覆蓋的時空范圍相對較廣,可以彌補固定檢測數據的不足,基于固定檢測器采集的數據和手機活動數據,提出基于神經網絡的高速公路異構數據融合方法。
1 數據獲取及預處理
1.1 原始數據獲取
以山東省濟樂高速南延段的固定檢測數據、手機活動數據作為研究對象。
1.2 微波檢測數據預處理
1.2.1 剔除錯誤數據
(1)閾值法。1)地點速度為一瞬時值,是指車輛通過道路某一個斷面的行駛速度,瞬時值不確定性較大,需要對速度區間加以彈性系數如式1所示:
式中:表示點速度;表示道路速度上限;視為彈性系數,一般取1.3~1.5之間。
濟樂高速南延段的最高設計速度為100 km/h,所以超過150 km/h的數據即可視為錯誤數據。
2)交通量是對所經過車輛進行統計的最終結果,統計時間將會影響統計結果,所以加入彈性系數為,如式2所示:
式中:表示交通量;視為彈性系數,一般取1.3~1.5之間;表示道路通行能力;表示數據采集時間。
濟樂高速南延段單車道道路通行能力2 400 h,彈性系數為1.5,統計時間間隔為5 min,那么在時間間隔內最大值為300輛。
(2)交通流邏輯判別法。閾值法剔除的錯誤數據是區間外的,但是不缺乏區間內的數據存在錯誤,這是由于數據傳輸等多方面原因造成的,這些數據也會影響道路交通狀態的判斷,所以需要將這些數據刪除。當地點車速和交通量出現兩者不同時為0,可視為錯誤數據,應將其剔除。
1.2.2 修補缺失數據
(1)時間序列插補法。本文選用三組歷史數據,利用時間序列法進行缺失數據的插補,方法如3所示:
(3)
式中:表示缺失數據值;表示第一組歷史數據值;表示第二組歷史數據值;表示第三組歷史數據值。
(2)空間位置插補法。空間位置插補法是依據檢測器數據在空間特征上具備關聯關系,具體如下:
式中,是在第個時間間隔內的時間平均車速;是第個時間間隔內的時間平均車速;是第個時間間隔內時間平均車速的方差。
1.3 手機活動數據
通行車輛載有的持卡手機,在行駛過程中經過的相鄰基站可視為道路的固定檢測區域,當行駛的車輛從一個切換小區行駛到下一個切換小區時,通信運營商后臺能夠顯示車輛經過兩個切換小區的時間及位置。通過標定好的切換路段長度L和時間差,對經過固定檢測區域的車輛進行路段平均速度的計算。
1.4 空間匹配
選取固定檢測器采集的數據與手機活動數據作為數據源,數據融合過程中數據需要對應于同一空間,數據要保證是同一路段的高速數據,否則融合達不到目的。選擇山東省濟樂南延高速路段的兩類數據進行空間匹配。
1.5 時間匹配
不同檢測器采集數據的時間間隔不同,需要將采集的數據變換成一致的時間周期,并將同一時刻的數據進行匹配。手機活動數據的傳輸間隔可自由設定,固定檢測器采集的數據上傳間隔為5 min。
2 基于神經網絡的數據融合
論文以建立異構數據為輸入和路段車速為輸出的三層前饋BP神經網絡融合模型。輸入層主要負責接收不同的輸入信息,隱藏層的神經元數目不固定,但數量與模型的強健性呈正相關,但同時也會增加模型訓練的迭代次數。輸出層是前兩層經過傳輸、分析后形成的輸出結果,即路段平均車速。
通常,輸入層至隱藏層的隱節點采用函數激活,隱藏層至輸出層選用線性函數激活。表達式如下:
3 模型結果對比
將周三下午15:40-16:00的行程時間作為預測對象,選用之前十周每周三的行程時間作為神經網絡的訓練數據,將訓練數據分為事故發生事故不發生兩類分別訓練,將周三下午15:40-16:00的實際數據作為驗證數據。選擇均方根誤差RMSE作為數據融合模型的評價指標,公式如下:
式中,是第k個時間間隔的融合平均速度;是第k個時間間隔的真實平均速度;N是總的時間間隔數量。
4 結論
基于神經網絡的固定檢測數據和手機活動數據的多源融合模型,相比較于單源數據,多源數據融合后選取的行程時間指數TTI增加了評估的穩定性以及準確性,評估結果更能反應目前的道路交通狀況。在以后的研究中,可考慮更多的影響因素,提高預判系統的整體性能。
參考文獻:
[1]史巖,董宏輝,張瑜,等.多源檢測器的交通數據融合研究[J].道路交通與安全,2015,15(03):35-40.