郭瑞軍,于景,孫曉亮,牛樹云
(1.交通運輸部公路科學研究院 ITS技術研究中心,北京 100088; 2.大連交通大學 交通運輸工程學院,遼寧 大連 116028)
隨著我國高速公路事業的高速發展,電子收費系統也大量應用在高速公路中.原來“一路一公司”,相鄰路段連接處都設主線收費站的管理模式帶來了收費站過多過密、停車次數多的問題,嚴重制約了高速公路的通行能力,且增加了高速公路營運部門的建設和營運成本.而電子收費系統利用車輛自動識別技術完成車輛與收費站之間的無線數據通訊,進行車輛自動識別和有關收費數據的交換,并能記錄下包括出入口匝道、時間、車型、行車方向、車牌號等在內的數據,如何有效快速地利用這些交通信息、進行數據的統計和挖掘,對其所呈現出的交通特性進行深度分析并有效應用,成為亟需解決的問題.
目前,國內外學者對電子收費系統進行了相應研究.Karsaman等人[1]以印尼多個地區為例,介紹了高速公路電子收費系統的原理.陳家炎[2]利用高速公路聯網收費數據,分析交通流參數特征,即研究在不同片區、不同高速公路、不同區段間、不同斷面、不同工作日、不同時段情況下的流量、速度、密度的時空特征和參數間的兩兩關系特征模型.萬金鵬[3]通過對聯網收費數據進行知識挖掘,提出了一種基于聯網收費數據估算任意斷面交通流量的方法,并通過構建交通流量數據倉庫進行交通流量多維分析.謝中清等人[4]利用基于PDF417的收費系統,研究在SQL Server數據庫平臺進行高速公路OD調查、車速調查和斷面流量調查的方法.于曉樺[5]利用山東省高速公路聯網收費數據,對高速公路網中的車輛行程里程、行程時間分布進行了研究,分析了車輛行程速度的時間-空間概率密度聯合分布,并用二維正態分布進行了擬合.盛鵬[6]以四川省高速公路聯網收費系統采集到的2010年~2012年數據為基礎,結合國家長假和路網區域分布等信息,分析路段車流的時空特征,研究了四川省高速公路路網交通流量的變化規律.孫德強[7]分析交通流量的日變特性、周變特性,分車型交通流量時變特性,車型比例變化特性和方向系數變化特性,通過數據擬合方法得到高速公路交通流量周變特性的模型和分車型行程速度概率密度分布模型.于曉樺等人[8]借助高速公路收費系統中的交通流數據,提出了時空相關性判別法.
通過國內外學者對高速公路電子收費系統數據分析的研究可看出,目前對于基于電子收費數據的處理過程中,關于交通參數關系分析、時空相關性判別以及交通流量的多維分析研究較多,但對于高速公路交通流基本特性研究還不夠全面、深入.本文選取某高速公路電子收費數據,對該區域高速公路交通流特性做了充分分析,通過建立數據倉庫,識別車輛到達、離開時刻和日期,車型標志,車牌號信息等,分析交通流參數特性及并總結了計算方法.
高速公路電子收費數據通常由業務流水數據、參數數據、基礎數據、財務數據和其他統計數據等組成,研究對象為2012年西部某高速公路電子收費業務流水數據中的收費站數據,含出口和入口收費數據,包括車輛進出收費站日期、時刻、車牌號、客貨車標志、車型標志等信息.格式及內容如表1所示,根據交通運輸部頒布的車型分類標準,客車劃分為四類,貨車劃分為五類.從而可對電子收費數據進行分車型的流量統計.

表1 收費站入口的源數據
選取SQL Server數據管理平臺,將日常收費流水數據導入SQL Server,利用SQL語句構建相關的交通流參數計算模型.利用SQL Server 中“導入數據”功能導入原始收費數據的文本文件到數據庫之前,需要對字段的類型、名稱、長度進行定義.
收費數據有時是殘缺的,有的數據存在明顯異常.數據統計分析前需要進行預處理,剔除異常數據,提高整體數據質量.結合高速收費數據實際情況,通過對原始數據庫車輛行程時間計算,剔除異常數據,進而結合時間閾值懲罰算法得到有效數據.
所研究高速收費站間最短距離為2.3 km,最長距離為63.9 km,基于高速公路的限速規定,理論行程時間應介于(69 s,3 834 s)范圍之間,且據相關的交通安全統計資料,所研究時期該高速公路并無交通事故和交通管制發生.因此可以設定異常數據為行程時間小于60 s或大于4 000 s的情況.
原始數據經過數據清理、過濾、存儲可作為數據分析的基礎數據庫.采用正態分布的置信區間來對異常數據進行過濾,根據參數估計方法,可信數據的時間取值范圍為:

(1)

對基礎數據進行分日期、分時段、分車型的OD行程速度計算.需要建立以下模塊:①OD存儲表;②數據中轉表;③存儲表;④交通流參數計算;⑤寫入參數.
將平均行程時間轉化為區間平均速度,可由以下公式進行計算,并存儲到交通主題數據倉庫中.
(2)
其中,V為平均行程速度,L為行程距離,統計車輛數為n輛.
通過建立的交通主題數據倉庫,對高速公路交通流量特性進行分析,包括交通流量的日變特性、周變特性、時變特性、車型比例和行程方向分布特性;通過數據擬合方法建立交通流的周變特性模型和車輛行程速度概率密度分布模型,并統計以收費站作為交通小區的交通發生吸引量及分布量;通過收費站間距離和車輛的行程時間,可計算車輛的行程速度并進行概率分布統計.
(1)交通量的時變特性
圖1是對非節假日一周內的小時交通流量統計結果,高速公路主要以一類車為主.可看出總交通流量和一類車交通流量呈現出類似的周期性變化,二類車、三類車、四類車和五類車也體現出一定的周期變化規律.交通流量總量與一類車流量在交通流時變特性中表現為雙峰的特性,其中凌晨1:00~6:00 為全天交通流量的波谷;10:00~12:00 為交通流量時變圖的第一個波峰; 16:00~17:00 為第二個波峰,總體而言,凌晨為高速公路出行的低谷,晝間10:00~17:00高速公路出行量較大,圖中顯示的出行規律也符合人們的出行習慣.

圖1 交通流時變特性圖
(2)分車型交通流量時變特性及車型比例變化特征
對不同車型流量以1 h為時間單位進行統計,可得交通流量的時變圖,一類車交通流量的時變特性如圖2所示.

圖2 一類車交通流量的時變特性圖
一、二、三類車的出行特點符合人們的工作活動特點,在數據上體現為由兩個波峰,高峰期集中在11:00~13:00 和 17:00~19:00;而在凌晨 1:00~7:00 的交通流量僅占全天流量的10%左右.四類車和五類車為一些中大型客貨車,其交通流量時變特性與一類車相反,在凌晨2:00~6:00期間三、四、五類車車流量較大,其余時間均較小.
各種車型按比例的時變系數曲線如圖3所示,在4:00~6:00一類車所占比例達到最小,時變系數增加至8:00左右達到最大值,并保持基本穩定,在23:00開始下降直至最小.三、四、五類車的車型比例變化特點與一類車相反,約5:00時車型所占比例達到最大,8:00時下降至基本穩定狀態,并于23:00開始呈上升趨勢,直到車型比例上升至最大.二類車流量較小,其變化規律不明顯.

圖3 車型比例的時變系數曲線
(3)本地/外地車輛交通量時變特性
將不同日期分為節假日、非工作日和工作日的類型,并標定出節假日的首日和末日,根據數據庫中車輛的通行日期和牌照屬性,得出不同日期類型的交通流量時變特性,如圖4所示,可知,工作日、非工作日、節假日首日和末日的小時交通量分布呈 “駝峰狀”,外地車輛在四種類型的小時交通量分布中所占比例較小,絕大多數都分布在白天(6:00~18:00),而在節假日首日上午(8:00~11:00),外地車輛的小時交通量增長較多,但所占比重仍比較小,高速公路路段的運行車輛以本地車為主.

圖4 四種日期類型交通流量時變特性
對2012年3~4月連續4周的高速公路分車型的日交通量做了統計如圖5所示,其中,4月2日(周一)~4月4日(周三)為清明節假期,其車流量在假期有明顯的波峰,假期開始首日即達到最大,第二日稍有回落,第三日返程車流增多.

圖5 分車型的日交通流量統計圖
從非節假日的高速公路車流量統計可看出,高速公路交通流量呈現出周期性變化,周五交通流量最大,周日交通流量最小,從周一至周四的流量較為穩定.
以該高速公路的各收費站作為交通小區,將高速公路外圍看作一個交通小區,則該研究對象可以看作一個較特殊的交通規劃區域,相鄰收費站間的路段流量即為兩收費站間的交通分布量,從而利用路段流量和進出收費站流量得到各收費站的發生吸引量.按行車方向的最末端收費站的出口流量即為該收費站與高速公路外圍小區的交通分布量,其余收費站間的交通分布量可以按照逆行車方向順序依次算出.
統計所選高速公路在某日的電子收費用戶進、出站車數,可得出分不同日期類型的交通分布量,如表2、表3所示.

表2 節假日首日OD流量表 pcu/d

表3 節假日末日OD流量表 pcu/d
可知交通發生、吸引量較高的收費站分別是北碚(2520)、合川(2507)和興山(2605)收費站.東陽(2505)收費站在節假日首日發生量明顯大于吸引量,而節假日末日正好相反,反映了節假日出行及返程的特點,而在工作日和非工作日,發生量和吸引量差別不大.興山收費站(2605)也有類似特點.
由各收費站的OD分布流量表2、3可以看到,北碚收費站2520-合川收費站2507的交通分布量最大,其次是北碚收費站2520-興山收費站2605之間的交通分布量,節假日首日,由合川收費站2507-北碚收費站2520方向的交通分布量最大,即出城方向交通需求較大.而節假日末日,由北碚收費站2520-合川收費站2507方向,即入城方向的交通分布最大.而在工作日和非工作日,這兩個方向的交通分布量差別不大.
從節假日首日末日的OD分布均可以看出,北碚收費站2520的發送車輛數量和到達量車輛數量均為最大,北碚收費站是該高速公路段最繁忙的收費站,且其節假日首日的到達量和發送量分別與節假日末日的發送量和到達量數值相近,呈現出明顯的節假日流量的潮汐特性.
基于交通主題數據倉庫,由該高速公路的各收費站進出流量,可以依次按照行車方向計算出各路段(相鄰收費站之間)的交通流量如圖6、7所示,按行車方向第一條路段的流量即為進入該路段收費站的流量,其余路段流量可以在考慮進出收費站流量后順次計算得出.
由四種日期類型的路段流量圖可以看出,北碚收費站至東陽收費站路段(2520~2505),東陽收費站至草街收費站路段(2505~2509),草街收費站至鹽井收費站路段(2509~2506),鹽井收費站至合川收費站路段(2506~2507)等四條路段流量較大,在四種日期類型的路段流量統計中,北碚收費站至東陽收費站(2520~2505)的路段流量都是最大的,圖中線段寬度表示了路段流量的大小.

圖6節假日首日路段流量圖7節假日末日路段流量
利用收費站間距離和車輛的行程時間,可計算車輛的行程速度,對車流速度進行正態分布擬合并采取Kolmogorov-Smirnov檢驗方法對其進行分布檢驗,6 組車速分布數據均接受了檢驗假設,可知交通主題數據倉庫中各類車型(混合車型和車型1-5)的6組行程速度數據都呈現出不同特征的正態分布特性,該高速公路混合車流及各類車型的行程速度密度分布函數可以用正態分布表示.
車輛行程速度的正態分布如式(3)所示,各車流正態分布的均值和標準差如表4所示.
(3)
其中,v表示車輛的行程速度;s表示車輛行程速度值的標準差;u表示車輛行程速度的均值.混合流車輛行程速度分布如圖8所示.

表4 行程速度特性參數表

圖8 混合車流正態分布擬合效果圖
高速公路電子收費系統中存儲了海量的車輛運行管理數據,包括車輛信息、行駛路徑、收費數據等,這些數據的充分挖掘,將有助于充分掌握高速公路運行性能,有利于交通管理部門制定更加科學、有效的交通管理和規劃措施,通過對西部某高速公路的電子收費數據分析,可得出以下結論:
(1)高速公路交通流時變特性中,流量主要以一類車為主,總交通流量和一類車交通流量呈現出類似的周期性變化;
(2)高速公路交通流時變特性中,總交通流量與一類車流量表現為雙峰的特性,三、四、五類車的車型比例變化特點與一類車相反;
(3)高速公路交通流周變特性中,高速公路交通流量呈現出周期性變化,周五交通流量最大,周日交通流量最小,從周一至周四的流量較為穩定;
(4)在高速公路收費站的OD流量統計中,節假日首日,出城方向交通需求較大;而節假日末日,入城方向的交通分布最大;而在工作日和非工作日,這兩個方向的交通分布量差別不大;
(5)高速公路車輛的速度統計中,各類車型的行程速度數據均符合正態分布.
基于電子收費數據,構建交通主題數據倉庫,并進行交通流特性的分析和應用,為交通數據的直觀表達提供了案例.交通流特性分析也有助于該高速公路的運行管理,如交通流量時變的雙峰特性、節假日期間首末日的潮汐特性等,可為交通流預測、可變信息提示甚至交通應急等管理手段提供了依據.當然,對高速公路交通流特性的全面深入了解,仍需結合實時、大量的交通調查及數據統計,從而能夠了解高速公路的車流運行特點,并進行有效地交通管理.
[1]KARSAMAN R H,MAHENDRA Y,RAHMAN H,et al. Measuring the Capacity and Transaction Time of Cash and Electronic Toll Collection Systems[J].Journal of Engineering & Technological Sciences,2014,46(2):180- 194.
[2]陳家炎.基于聯網收費數據的高速公路交通流特征分析[D].廣州:華南理工大學,2014.
[3]萬金鵬.基于聯網收費數據的交通流量多維分析技術研究[D].重慶:重慶大學,2012.
[4]謝中清,鄢勇飛,王一雯,等. 基于PDF417收費系統的高速公路OD分析[J]. 武漢理工大學學報(信息與管理工程版),2009, 3(4):562- 565.
[5]于曉樺.高速公路交通流時空特性分析[D]. 青島:山東科技大學,2009.
[6]盛鵬,戴元,陳犁,等.基于聯網收費數據的四川省高速公路交通流量研究[J].中國交通信息化,2013(7):62- 64.
[7]孫德強.基于聯網收費數據的交通流特性分析及應用[D].廣州:華南理工大學,2014.
[8]于曉樺.高速公路交通流時空特性分析[J].山東科技大學學報,2009, 6(9):231- 235.