














基金項目:2022年橫向課題“廣西高速公路交通擁堵防治智能決策系統”(編號:GXHS-2022-016);2021年廣西交通職業技術學院重點科研項目“廣西高速公路交通擁堵防治的研究與應用”(編號:JZY2021KAZ05);廣西高校中青年教師科研基礎能力提升項目“大數據背景下道路運輸安全風險預警平臺研究與應用”(編號:2022KY1122);“基于‘AI視覺+機器學習’的交通場景應用研究”(編號:2023KY1157)
作者簡介:林立春(1974—),碩士,副教授,研究方向:計算機應用技術和大數據技術。
摘要:基于門架和收費站大數據的特征維數不高、數據量大、擁堵預測為模糊預測等特點,文章選擇支持向量回歸(SVR)方法作為交通擁堵預測算法并加以優化研究。通過研究和實踐表明,利用ETC門架和收費站數據能夠準確地獲取高速公路區間平均車速、交通流量等信息,利用合適的模型能夠較為準確地預測未來的擁堵狀態。
關鍵詞:高速公路;交通擁堵;預測;門架;SVR
中圖分類號:U491.1+4
0 引言
隨著我國高速公路里程、機動車保有量和交通運輸業務的增加,高速公路的交通擁堵也越來越嚴重。而全國高速公路ETC門架(以下簡稱門架)系統早在2019年底已完成23 974個,占比99.99%。門架產生的監測數據以及眾多的收費站數據,將其脫敏后,利用大數據分析等算法,可以科學地預測道路的擁堵程度。出行者可據此合理安排時間和路線,提高出行效率和經濟效益,降低安全事故隱患,減少污染,節約寶貴的時間[1]。
基于門架和收費站大數據的特征維數不高、數據量大、擁堵預測為模糊預測等特點,文章選擇支持向量回歸(Support vector regression,簡稱SVR)方法作為交通擁堵預測算法并加以優化。
1 支持向量回歸理論
SVR方法認為預測值與實際值偏差不大即認為預測正確,不用計算損失,只有當超出范圍時才計算損失,這極大地減少了數據的計算,尤其是復雜數據的計算,正符合交通擁堵預測的需求。
回歸預測模型SVR的預測輸出值f(x)的一般公式如式(1)所示。
f(x)=wTx+b""" (1)
式中:w——法向量;
b——位移項。
僅當預測值與實測值yi偏差大于ε時,即|f(xi)-yi|gt;ε時才計算損失,ε的計算如式(2)所示。
s.t.f(xi)-yi≤ε+ξiyi-f(xi)≤ε+ξ*iξigt;0,ξ*igt;0,i=1,2,…,N
式中:ξi和ξ*i——松弛變量,即允許少數樣本不落在以yi為中心兩側ε寬的間隔帶內;
C——懲罰函數。
定義拉格朗日函數如式(3)所示。
式中,μi≥0,μ^i≥0,αi≥0,α^i≥0為拉格朗日乘子。根據拉格朗日對偶性得到:
假如解為α*=(α*1,α*2,…,α*N),在α^*=(α^*1,α^*2,…,α^*N)T中找出α*j∈α*且滿足Cgt;α*jgt;0,則有:
由此得出模型輸出的預測值f(x)為:
式中,K(x,xi)為核函數,通過試驗對比,選擇了徑向基核函數,如公式(7)所示。
σ為核帶寬參數,取值對預測效果有一定的影響。
2 擁堵預測模型
依據高速公路基本服務水平分析指標與分級標準,文章將區間平均車速作為擁堵判斷指標,共劃分6個交通擁堵狀況等級[2],如表1所示。
2.1 預測模型整體架構
建立SVR交通擁堵預測模型,整體架構如圖1所示。先抽取特征,對特征數據降噪,并進行歸一化處理,將歸一化后的數據集分為訓練樣本集和預測樣本集,利用式(1)中的SVR算法進行預測,根據上一預測周期的預測數據與實測數據的誤差,進行修正計算本輪預測結果,評估模型,優化參數,同時更新樣本集,逆歸一化,輸出結果。
2.2 抽取特征
目前,ETC門架、交調站、高清卡口、視頻監控和浮動車數據等已覆蓋全國90%以上高速公路,廣西已全區覆蓋。將門架數據、收費站數據等多源數據進行數據融合與清洗,脫敏后即可為高速路擁堵預防使用。例如對門架數據抽取如表2所示的特征。
2.3 降噪
如果某個特征中包含了大量的噪聲數據,結果會在一定程度上影響預測模型的魯棒性。基于現實中高速公路上有個別車輛在服務區停車、路上拋錨、事故、數據缺失、識別異常等情況,表現為趨于分散、能量較小的噪聲,采用陳淑燕等[3]等利用小波變換的方法可達到較滿意的降噪效果。
2.4 歸一化
交通流時間序列數據是隨機序列,若未歸一化,一來學習率大,二來收斂速度慢。對數據采用極差標準化歸一方法,將特征映射到[0,1]區間內,如式(8)所示。
式中: x*i——第i個數據xi的歸一化數據;
xmax和xmin——最大和最小值[4]。
2.5 預測模型優化
2.5.1 預測結果的修正計算
設時間窗步長為S,當預測出t+1時刻的值之后,要增減一個修正量。修正量δt+1的計算如式(9)所示。
即取距離預測時刻t+1最近的t-S+1,t-S+2,…,t等時刻的實測值與預測值差值的平均值為修正量。目的是使預測值的曲線更加貼近或圍繞實測值的曲線發展,使預測值進一步逼近實測值,提高預測準確度。實測值獲取方法見2.5.2。
2.5.2 平均車速實測值的計算
通過研究表2的數據內容可發現,利用“vehicleSpeed”、“transTime”等多個數據可獲取統計周期內(15 min、0.5 h、1 h……)每輛車的行駛速度,進而得出統計周期(時間窗)內的門架附近的平均車速vs,如式(10)所示。
式中:vi——第i輛車行駛速度;
n——統計周期內通過門架的車輛總數,即交通流量。
收費站附近的交通流量Q通過收費數據很容易統計,但是統計收費站附近的平均車速vs較難。為計算收費站附近的vs,可以根據公式Q=Kvs計算得出。Q為交通流量由收費數據得出,K為平均車流密度。因為K的采集難度較大,一般用時間占有率近似地表示K,計算公式如式(11)所示。
Occupancy=∑Δti/T""" (11)
式中:occupancy——時間占有率(%);
Δti——第i輛車占用檢測器的時間(s);
T——觀測時間段的長度(s)。
得出K后,通過Q=Kvs近似地計算出收費站附近的平均車速。
在得出統計周期內門架和收費站平均車速之后,結合門架數據“gantryId”的GPS位置可知高速公路各個區間段的實時平均車速vs和交通流量Q。
2.5.3 SVR參數的優化
SVR預測中,影響預測結果的參數有C、ε和σ三個。針對于式(6)、式(7)所示的預測函數,主要是調整核帶寬參數σ,以期達到預測的最優解。
在試驗中,閾值范圍為0.01~0.618,初始為0.1。實際應用時可在每日凌晨3:00-5:00(也可設置為每周、每月優化一次SVR參數)服務器負載最低的時段將前一天或前一周的歷史數據,通過差分灰狼優化(Differential Evolution-Grey Wolf Optimizer,DE-GWO)算法[5]計算出每條高速公路的K個認為比較理想的SVR參數,并記錄每個參數對應的均方根誤差(RMSE),作為接下來預測時使用的備選SVR參數。
在新的預測中,例如預測t+1時間的擁堵情況時,t時間的實測值已經計算得出,計算t時間的預測值和實測值之間的RMSE,如果RMSE小于或等于該參數的最小誤差,更新最小誤差,且繼續使用該參數,并將該參數的使用次數+1;如果RMSE在允許范圍內,仍繼續使用該參數,并將該參數的使用次數+1;如果RMSE誤差較大超過允許范圍,繼續判斷預測值偏大還是偏小。如果偏大,從備選參數中選擇當前參數的近鄰參數,該近鄰參數應該同樣使得產生的預測值比實測值偏大,且使用次數是最大的;如果偏小,從另一側選擇使用次數最大的近鄰參數。循環往復下去,目的是選擇“最優”參數。
2.5.4 循環滾動更新樣本集
循環滾動預測的原理是在數據長度保持不變的情況下,對訓練樣本集、預測樣本集循環滾動地加入新的數據,剔除舊的數據。這種不斷向前更新數據集建立的數據序列能更好地反映出高速公路狀態的最新特征,體現出訓練樣本集、預測樣本集的動態變化。因更改了樣本集,故動態數據集還在一定程度上解決了過擬合的問題。實施過程為:
設定時間窗步長為S,則輸入數據為X={X1,X2,…,XS},這里Xi={di,di+1,…,dN-S+p-1},1≤i≤S;i,S∈N。實測對比數據為Y={Y1,Y2,…,YS},Yi={di+1,di+2,…,dN-S+p}。下一個時間窗Xi從di+1開始,Yi則從di+2開始,循環向前滾動,不停地預測下一時段的交通狀態。
2.6 輸出預測結果
在預測得出區間平均車速vs后,即可建立每個門架以及收費站所處區域的速度演變趨勢圖。當vs連續兩個周期低于65 km/h時,可通過相關管控平臺軟件進行擁堵預警(管控平臺面向管理者,還可通過公眾號或App面向出行者),并提醒管理者及時介入,主動預防可能出現的更大擁堵[6]。
3 結果表征
基于上述預測算法,選擇南寧東至六景西樞紐高速公路段進行預測與實測,得到預測的平均車速與實測的平均車速,如圖2所示,表3為對應的預測與后來計算得出的實測數據。此實驗數據統計周期為60 min,即預測未來1 h內的擁堵情況。圖2中虛線為實測值,實線為預測值。當出現交通流突變時,誤差略微增大。總體情況是預測值圍繞實測值上下波動,預測精度較為理想。
在誤差分析中采用常見的重要指標有:平均絕對誤差(MAE)和均方根誤差(RMSE)。和常見的支持向量機(SVM)、長短期記憶神經網絡(LSTM)進行對比,發現本文經過優化后的SVR預測精度最高。預測誤差對比如表4所示。
4 結語
通過研究和實踐表明,利用ETC門架和收費站數據能夠準確地獲取高速公路區間平均車速、交通流量等信息,利用合適的模型能夠較為準確地預測未來的擁堵狀態。
非門架附近的區域,在具有方便獲取浮動車相關GPS數據的情況下,同樣適用于本研究方法。
上述預測算法主要針對常發性擁堵,當遇到交通事故等不可預測的偶發性擁堵時,算法具有較大的滯后性。解決辦法是車主第一時間報警,交警及時把數據反饋給平臺、公眾號、APP或高速公路管理部門,做出下一步擁堵預防措施。例如,全國已有部分高速公路交警支隊和百度地圖、高德地圖等相關方合作,及時反饋交通擁堵情況,以防止更嚴重、更大范圍的交通擁堵。此法已試行較長一段時間,效果較好。而且,隨著北斗衛星精確定位的普及,還可以通過浮動車數據獲取偶發性擁堵情況。
其他諸如極端天氣、泥石流、塌方等自然災害,或者臨時養護、交通稽查等造成的偶發性擁堵,需要管理者通過天氣預報、作業申請和管理部門的通知等信息及時地預警及管控。重大節假日亦應通過算法預測和人工介入進行擁堵預防,以實現較好的擁堵防治效果。
擁堵預防不僅從微觀上能夠帶來減少用時、節約經濟、綠色環保等好處;從宏觀上來看,還可深度融入“一帶一路”,加快城鎮化進程,構建智能、平安、綠色、共享的現代化綜合交通體系,協助相關部門實現道路智能化管理,提高交通科學治理和服務水平,助力建設交通強國。
參考文獻
[1]林立春,洪 東,劉 華.基于大數據分析和多模融合的交通擁堵高效預測技術[J].西部交通科技,2021(7):151-155.
[2]黃承鋒.基于改進GA算法的高速公路交通擁堵狀況預測[J].吉林大學學報(信息科學版),2022(3):198-205.
[3]陳淑燕,王 煒,李文勇.實時交通數據的噪聲識別和消噪方法[J].東南大學學報(自然科學版),2006(3):322-325.
[4]Lichun Lin,Shi Tong. Automatic Spatial Annotation of Image Based on Object Recognition [J].Journal of Informationamp;Computational Science. 2013,10(18):5 829-5 847.
[5]鄭曉亮,陳華亮,來文豪.參數優化的SVR移動網絡流量預測[J].計算機應用與軟件,2022(9):278-284.
[6]王 健.基于ETC系統數據的高速公路主動管控建設探討[J].中國交通信息化,2020,251(12):99-101.
收稿日期:2023-03-30