曲 鑫, 林賜云,2, 楊兆升,2, 商 強, 程澤陽
(1. 吉林大學 交通學院,長春130022;2. 汽車動態模擬國家重點實驗室(吉林大學),長春130022)
?
采用低頻浮動車數據的行程時間估計
曲鑫1, 林賜云1,2, 楊兆升1,2, 商強1, 程澤陽1
(1. 吉林大學 交通學院,長春130022;2. 汽車動態模擬國家重點實驗室(吉林大學),長春130022)
為解決利用低頻浮動車數據進行路徑行程時間估計時精度不高的問題,從分析浮動車數據特征的角度出發進行行程時間分布的估計,提出并討論利用浮動車數據估計行程時間的潛在誤差,針對每種潛在誤差提出修正模型,并選取上海市長壽路部分路段進行實證分析,利用1 500輛出租車數據,對各種修正方法下的行程時間進行估計,與改進內插值估計方法進行對比,并與車牌識別裝置提供的直接行程時間估計結果進行相似性分析. 結果表明:所有誤差均修正的行程時間估計與改進內插值方法相比,平均估計精度提高9.5%,且估計的中位數、25%分位數和75%分位數與車牌識別方法有較高的匹配度. 考慮低頻浮動車數據誤差修正的行程時間估計可以改善估計的精度,可提供有效的行程時間信息.
交通工程與交通管理;低頻浮動車數據;誤差修正模型;車牌識別;行程時間估計
如今城市道路交通系統越發擁擠,不僅影響人們出行的可達性,同時威脅到了城市經濟與生態的可持續發展. 行程時間作為表征交通運行狀況的一項重要指標,準確地估計能夠為交通管理人員及出行者帶來極大的便利. 有許多方法可用來采集行程時間數據,如線圈檢測器、自動車輛識別技術等. 但是,路網中這些檢測器的數量是有限的,因此不能代表整個網絡的運行狀態[1]. 利用浮動車數據(簡稱FCD)進行行程時間估計是近些年的研究熱點. 浮動車數據覆蓋面廣,采樣時間間隔較長(30~120 s),兩探測點間相距較遠,這對行程時間的準確估計是較大的挑戰. 目前低頻FCD的研究大多是基于路段的行程時間估計[2-5]. 所提出的方法主要分兩步進行:第1步每個FCD觀測被分解到各個遍歷路段上[3-4];第2步是行程時間計算,可以是平均行程時間的經驗算法[2],也可以是基于概率分布估計的復雜模型算法[3,6]. 實證研究表明行程時間與路段有很大的關系[7-8],然而大多數的研究都假設路段行程時間是互相獨立的[9-10]. 這會導致路徑水平上的行程時間估計有所偏差. 鑒于以上研究的不足,本文提出一種利用低頻FCD數據直接進行路徑行程時間估計的方法,能夠有效提高估計精度.
路徑定義為起終點之間的一系列路段及交叉口. 浮動車數據的探測點通常與路段或路徑的起終點不吻合,因此,在使用FCD進行行程時間估計時存在一些潛在誤差. 本文所述的一個觀測由兩個探測點所確定. 圖1為幾種產生誤差的FCD觀測示例.

圖1 地圖匹配后的FCD觀測示例
以下是幾種常見的誤差:1)路徑上浮動車觀測的不完整覆蓋. FCD的觀測可能只覆蓋路徑的一部分[11]. 路徑上的行程時間不可知,需要進行推測,由此導致誤差的產生; 2)基于時間的抽樣. 車輛軌跡的樣本通常是由時間觸發的,如果車速很低,連續探測點之間的距離就很短,該部分的FCD探測點也較多[12]. 在行程時間估計的過程中需要考慮這個因素以減少誤差; 3)鄰接路網的影響. FCD的觀測可能一部分覆蓋到路徑上面,其余部分在鄰接路段上[13],例如圖1的觀測1和4~6,此時行程時間T不能夠進行準確地分配,誤差也由此產生; 4)路徑上探測點的非均勻覆蓋. 車輛可能經由支路進入或離開街道[14],如果行車速度在路徑上不均勻,當所有觀測賦予一樣的權重時,行程時間估計就會產生誤差; 5)路徑進入時間未知. FCD觀測的起始點與路徑的起始點不吻合,確切的進入時間就不可知[15-16],如果推測不準確就會有相應的誤差.
2.1路徑行程時間估計方法
路徑行程時間可通過兩種方法估計:路段行程時間的聚合估計或對路徑的直接估計. 無論采用哪種方法,都必須進行FCD數據的預處理. 經過地圖匹配和路徑選擇,車輛每一對連續的探測點數據都會返回路段序列,以及車輛在第一個路段和最后一個路段上投影探測點的偏差. 本文定義τi為第i個行程時間觀測值;si為第i個觀測值的時間戳;ρik為觀測i的長度與路段k的長度的比值;αk為路徑覆蓋路段k的長度與路段k的長度的比值;βik為路徑上觀測i的長度與路段k的長度的比值;lk為路段k的長度. 其中:ρ1=r1/l1,ρ2=r2/l2,ρ3=r3/l3,ρ4=r4/l4,α1=0,α2=a1/l2,α3=a2/l3,α4=a3/l4,β1=0,β2=a1/l2,β3=r3/l3,β4=r4/l4. 變量說明見圖2.

圖2 變量r、a和l的說明圖示
2.1.1基于路段的行程時間估計
基于路段的行程時間估計主要有兩步:將行程時間分配到路段上; 估計每個路段的行程時間.
1)行程時間分配. 觀測的行程時間τi按距離成比例地分配到所遍歷的路段上,計算公式為
(1)

2)聚合. 對于一些觀測來說,它們與路段并不是完全重疊,τik要通過系數1/ρik比例擴大到路段上去,計算公式為
(2)
式中tik為第i個行程時間觀測值成比例擴大到路段k上的行程時間. 這種比例擴大假設行車速度沿著路段是均勻的.

(3)
3)路徑平均行程時間. 為了估計路徑平均行程時間,將路徑上路段的平均行程時間加和,且路段行程時間根據重疊長度成比例地分配,計算公式為
(4)

2.1.2基于路徑的基線行程時間估計
本文基線行程時間指基于路徑的且未經修正的行程時間. 基于路段的行程時間方法產生一個單值,而基于路徑行程的時間具有分布特性,本文將路徑作為一個虛擬路段,直接估計路徑行程時間. 類比基于路段的行程時間估計方法,觀測的行程時間首先在鄰接路網和路徑之間進行分割,即
(5)

(6)
(7)
式中Ti為比例放大后的路徑行程時間.
每個觀測都根據覆蓋路徑的分數1/ωi賦予相應的權重. 路徑行程時間分布的統計特性可由加權的觀測得到. 例如,平均路徑行程時間為
(8)
2.2路徑行程時間修正模型
(9)
(10)
(11)
(12)
通過這個修正可以減少路徑不完整覆蓋的影響(誤差1). 如果車輛的行駛軌跡是根據時間采樣,探測點之間的短距離表明速度低. 因此,用1/ωi對觀測賦權重會使行程時間估計的值變小(誤差2). 為了減少這個誤差,這里用1/ηi對觀測賦權重,即重疊部分的行程時間與整個路徑行程時間的比率. 估計的平均路徑行程時間為
(13)
2)鄰接網絡覆蓋閾值. 為了減少支路對路徑行程時間的影響,這里采用φi,即路徑上的行程時間與覆蓋觀測的總行程時間的比率. φi小于定義的閾值φmin(比如0.75)的觀測被排除(誤差3).
3)FCD的串聯估計. 車輛沿著路徑報告一系列的探測點(例如:圖1的觀測1~4). 考慮車輛在路徑上的幾個觀測作為一個片段進行行程時間的估計更為合理. 用這個方法對行程時間進行串聯降低了幾種誤差的影響:改善了路徑覆蓋率(誤差1),減少了基于時間采樣時在低速部分產生較多探測點帶來的影響(誤差2),并且能夠使路徑進入時間的推測更加合理(誤差5).
串聯遵循以下步驟:1)將同一個路線的觀測組織在一起作為一個軌跡;2)令軌跡匹配路徑,即選擇一組軌跡子集來覆蓋路徑;3)將子集的觀測進行合并,即子集的第1個(最后1個)時間戳成為觀測的第1個(最后一個)時間戳;子集的第1個(最后1個)偏差成為觀測的第1個(最后1個)偏差.
4)路徑進入時間外推法. 為了推測(假想的)路徑進入時間,減少誤差5,觀測i的第1個時間戳si外推si′為
(14)
式中ti(1)為第1個探測點與觀測進入路徑時的點之間的距離,ti(2)為路徑進入點和觀測加入點之間假想的行程時間,如見圖3所示.

圖3 進入時間外推法示意
ti(1)和ti(2)可以基于路段行程時間或基于觀測本身進行估計,計算公式為
(15)
(16)

(17)
5)基于路段數的權重賦值. 路徑的不均勻覆蓋(誤差4)意味著FCD不能成為路徑行程時間有代表性的樣本. 為了減少此誤差,每個觀測應根據覆蓋路段平均觀測數的倒數賦予相應的權重,即
(18)
式中Ck為(部分或全部)覆蓋路段k上的觀測數.
權重λi乘以1/ηi得到每個觀測的最終權重. 因此,平均路徑行程時間為
(19)
3.1方案設計
選取上海市長壽路的部分路段(記為路徑A)進行行程時間估計. 路徑A長2.4 km,限速50 km/h,共有10個交叉口, 圖4為實驗路段示意圖.

圖4 實驗路段示意
FCD數據來自1 500輛出租車,每個出租車每隔2 min都報告其位置(經度和緯度)、時間戳及車輛的ID.
路徑A上裝有車牌識別(簡稱LPR)裝置,LPR數據可以用來提供直接的行程時間估計,用作本文路徑行程時間估計的對比項. 數據收集于2015年5—7月份周一至周四的6:00—20:00時.
3.2結果分析
利用上文提到的估計方法和修正方法對行程時間進行估計與修正. 為了驗證所提出方法的有效性,選擇一種已有且適用低頻浮動車的改進內插值算法進行對比分析[11]. 表1為所有誤差均修正了的行程時間估計方法和改進內插值估計方法的平均絕對相對誤差EMAR、平均絕對誤差EMR和標準差DS的統計.

表1 兩種方法的行程時間估計誤差統計
從表1可以看出:相對于改進內插值方法,本文所提出的方法估計值更接近實際,具有較高的估計精度. 各誤差提高精度的平均值為9.5%. 為了驗證所提出方法的適應性,由FCD方法估計的路段行程時間與LPR方法進行相似性分析. 由LPR和FCD以15 min的間隔分組(從6:00—20:00時共N=36個間隔),從而計算每個時間間隔的行程時間數據. 并且利用均方根差(簡稱RMSE)計算LPR和FCD之間的相似性,RMSE計算公式為
(20)

表2為使用不同的估計方法和誤差修正方法所得不同分位數的RMSE值,最后一行展示了所有誤差均被修正的基于路徑的RMSE結果. 所有方法的RMSE在0.23~0.29之間變化.

表2 FCD與LPR的RMSE結果
圖5展示了路徑A一天中各個方法下的平均行程時間示意圖,包括基于LPR的行程時間估計,基于路段的行程時間估計以及各種誤差修正下基于FCD的路徑行程時間估計. 可以看出,各種方法估計的行程時間有著相似的趨勢,一天之中的早晚高峰行程時間均高于其他時間,這與城市道路交通一天之內的變化情況是相符的. 中午和傍晚FCD估計方法與LPR行程時間數據有較好的匹配度,然而在其余時間有著過高的估計.

圖5 基于FCD和LPR的平均路徑行程時間對比
Fig.5Mean route travel time contrast based on FCD estimation and LPR data
基于路徑的行程時間估計方法的平均值與基于路段的估計方法有著相似的效果,而基于路徑方法的主要優勢在于有著估計其他統計量的能力. 圖6展示了一天之中行程時間分布的中位數,25%分位數和75%分位數.

圖6 FCD和LPR各統計量對比曲線
Fig.6Statistical variables comparison curve of route travel time according to FCD estimation and LPR data
從表2的RMSE結果可以看出基于FCD的方法較好地估計了各個百分位數. 這些百分位數RMSE值表明考慮時間分配和FCD串聯是改善行程時間估計精度最大的兩個影響因素. 因此在條件有限的情況下,可優先用這兩種方法對行程時間進行估計.
1)針對低頻浮動車數據不完整覆蓋、不均勻覆蓋、鄰接網絡部分覆蓋、樣本代表性差等誤差來源進行分析,并提出了5個模型來減少這些誤差的影響.
2)選取上海市長壽路部分路段進行實例分析,分別使用FCD和LPR對平均行程時間及其分布的中位數、25%分位數及75%分位數進行估計,與改進內插值方法對比并利用RMSE進行相似性分析,結果表明平均估計精度提高了9.5%,所有誤差均修正了的行程時間估計的均方根誤差較小,且估計的各百分位數與車牌識別方法有較高的匹配度,RMSE分別為0.24、0.15、0.15和0.26,等于或優于其他方法的RMSE.
3)利用低頻浮動車數據進行行程時間估計可以輔助固定檢測器在更大的路網上完成交通狀態的監測,并且可以在更大范圍上評估擁擠水平和行程時間的可變性,還可以直接利用估計的行程時間,進行擁擠系數的計算,從而制定有效的擁擠收費策略.
[1] 李慧兵,楊曉光,羅莉華.路段行程時間估計的浮動車數據挖掘方法[J].交通運輸工程學報,2014,14(6): 100-109,116.
LI Huibing, YANG Xiaoguang, LUO Lihua.Mining method of floating car data based on link travel time estimation[J].Journal of Traffic and Transportation Engineering,2014,14(6):100-109,116.
[2] QUDDUS M,WASHINGTON S. Shortest path and vehicle trajectory aided map-matching for low frequency GPS data[J].Transportation Research Part C:Emerging Technologies,2015,55:328-339.DOI: 10.1016/j.trc.2015.02.017.
[3] HOFLEITNER A,HERRING R,ABBEEL P,et al. Learning the dynamics of arterial traffic from probe data using a dynamic Bayesian network[J].IEEE Transactions on Intelligent Transportation Systems, 2012,13(4):1679-1693.
[4] GONG Q,ADAMS T M,WANG X B,et al.Estimating link travel time with sparse GPS data on highway corridors[J].Transportation Research Record, 2015, 2477: 7-17.
[5] HELLINGA B, IZADPANAH P, TAKADA H,et al.Decomposing travel times measured by probe-based traffic monitoring systems to individual road segments[J].Transportation Research Part C,2008,16(6):768-782.
[6] WESTGATE B S,WOODARD D B,MATTESON D S,et al.Travel time estimation for ambulances using Bayesian data augmentation[J].Annals of Applied Statistics,2013,7(2):1139-1161.
[7] ZHENG F F,ZUYLEN H V.Urban link travel time estimation based on sparse probe data[J].Transportation Research Part C,2013,31:145-157.
[8] YUAN Y,VAN LINT H,VAN WAGENINGEN-KESSELS F,et al.Network-wide traffic state estimation using loop detector and floating car data[J].Journal of Intelligent Transportation Systems,2014,18(1):41-50.
[9] RAMEZANI M,GEROLIMINIS N.On the estimation of arterial route travel time distribution with Markov chains[J].Transportation Research Part B,2012,46(10):1576-1590.
[10]JENELIUS E,KOUTSOPOULOS H N.Travel time estimation for urban road networks using low frequency probe vehicle data[J].Transportation Research Part B:Methodological,2013,53:64-81.DOI: 10.3969/j.issn.1000-565X.2015.10.005.
[11]王志建,馬超鋒,李梁.低頻GPS數據和交叉口延誤下的行程時間估計[J].西南交通大學學報,2015,50(2):361-367.
WANG Zhijian,MA Chaofeng,LI Liang. Link travel time estimation for urban roads using low frequency GPS data and intersection delay[J].Journal of Southwest Jiaotong University,2015,50(2):361-367.
[12]姜桂艷,常安德,牛世峰.基于車牌識別數據的交通擁堵識別方法[J].哈爾濱工業大學學報,2011,43(4):131-135.
JIANG Guiyan,CHANG Ande,NIU Shifeng.Traffic congestion identification method based on license plate recognition data[J].Journal of Harbin Institute of Technology,2011,43(4):131-135.
[13]JENELIUS E,KOUTSOPOULOS H N.Probe vehicle data sampled by time or space:consistent travel time allocation and estimation[J].Transportation Research Part B:Methodological,2015,71:120-137.
[14]李宇光.海量低頻浮動車數據道路匹配及行程時間估算[D].武漢:武漢大學,2013.
LI Yuguang.Huge-volume low-frequency floating car date map-matching and travel time estimation[D].Wuhan:Wuhan University,2013.
[15]GUESSOUS Y,ARON M,BHOURI N,et al.Estimating travel time distribution under different traffic conditions[J].Transportation Research Procedia,2014,3:339-348.
[16]ZHAN X Y,HASAN S,UKKUSURI S V,et al.Urban link travel time estimation using large-scale taxi data with partial information[J].Transportation Research Part C:Emerging Technologies,2013,33:37-49.
(編輯魏希柱)
Travel time estimation using low-frequency floating car data
QU Xin1, LIN Ciyun1,2, YANG Zhaosheng1,2, SHANG Qiang1, CHENG Zeyang1
(1.College of Transportation, Jilin University, Changchun 130022, China;2.State Key Laboratory of Automotive Simulation and Control (Jilin University),Changchun 130022, China)
In order to solve the low accuracy problem of route travel time estimation when using low-frequency floating car data, the characteristics of low-frequency floating car data are analyzed from the perspective of travel time distribution estimation. Potential errors are presented and discussed, each of them has an error correction model. Selecting Changshou Road of Shanghai for empirical analysis using floating car data from 1 500 taxies. Travel time under various correction methods would be directly estimated, which compares with estimation results provided by the vehicle license plate recognition device. The results reveal that travel time with all errors corrected improves the average estimation accuracy by 9.5%, and median, 25th and 75th percentile have higher matching with the license plate recognition method. The low-frequency floating car data error correction model can improve the accuracy of the travel time estimation, and provide an effective travel time information.
traffic engineering and traffic management; low-frequency floating car data; error correction model; license plate recognition; travel time estimation
10.11918/j.issn.0367-6234.2016.09.006
2016-01-07
國家自然科學基金青年基金(51308248)
曲鑫(1992—),女,碩士研究生;
楊兆升(1941—),男,教授,博士生導師
林賜云,linciyun@jlu.edu.cn
U491
A
0367-6234(2016)09-0030-05