











基金項目:中央引導地方科技發展專項“廣西智慧道路機電系統新科技綜合平臺建設”(編號:桂科ZY20111015)
作者簡介:陳鷙翱(1987—),碩士,工程師,研究方向:智能交通系統研發。
摘要:文章以西安繞城高速公路為例,應用構建的預測模型,預測路網交通運行態勢,并評估預測結果,對比HMM、自回歸移動平均模型和灰色馬爾可夫模型三種預測方法的準確率和誤差,所提出的HMM預測模型不僅能從整體上預測路網交通運行態勢的態勢值,且準確率更高、誤差更小。
關鍵詞:HMM;隨機森林;交通態勢;風險預測
中圖分類號:U491.1+4A491694
0 引言
獲取準確和及時的交通信息數據是合理交通決策的重要前提條件。交通運行態勢評估及預測能夠實時判斷道路交通運行風險的發生,從而能夠為交管部門的決策、主動干預等提供支持[1-3]。近年來,安全領域的許多學者研究了態勢評估的關鍵技術,包括貝葉斯網絡、層次分析法、人工神經網絡、遺傳算法、D-S證據理論和模糊綜合評估方法等[4-6]?,F階段已有的態勢預測方法主要包括自回歸移動平均模型ARMA、灰色馬爾可夫模型GM和支持向量機SVM。但是,經過大量實踐后發現,上述預測方法均存在自身的缺點:ARMA模型假定時間序列是平穩和線性的,但是網絡安全態勢時間序列是非線性的[7];GM模型應用了單調變化的時間序列,難以預測波動較大的時間序列[8];SVM對于大數據收斂速度過慢,應用方面受到很大限制[9]。這些方法只能對態勢進行整體預測,得到特定的態勢值,無法觀測到詳細的內部結構狀態。因此,本文采用隱馬爾可夫模型HMM來達到預測目的。
1 交通運行態勢分析
交通運行態勢從宏觀和整體的角度描述交通運行狀況。交通運行狀況的風險主要包括道路風險、交通風險和環境風險。因此,在交通運行態勢分析中,建立交通運行狀況的態勢感知模型,從道路風險、交通風險和環境風險三個方面分析其影響因素。
用于感知交通運行態勢的模型就像一臺具有三個組件的機器:(1)提取交通運行態勢的關鍵影響因素;(2)評估風險水平;(3)對態勢的未來發展情況進行假設。如圖1所示。第二部分基于第一個部分運行,第二個部分又是第三個部分的基礎,這意味著第三個部分是基于現在和以前的態勢值進行的。
2 交通運行態勢評估
基于交通運行狀況的關鍵影響因素,研究交通運行狀況的評估技術,初步建立層次結構,然后掌握FAHP分析方法,建立具有層次結構的交通運行狀況評估模型,并量化交通運行態勢值和每個關鍵影響因素。最后,評估每個關鍵影響因素的風險,為政府和交通管理部門提供管控和決策依據。
2.1 層次化交通運行態勢
根據獲取的關鍵影響因素,交通系統的運行態勢層次關系可以從道路風險、交通風險和環境風險三個方面來建立,從上到下逐層傳遞,最終對交通運行態勢進行評估,見下頁圖2。
2.2 特征重要度計算
特征重要性(權重)是衡量一個因素或指標相對于另一個因素的重要性的度量,不僅是一個因素或指標的百分比,還包括相對重要性,甚至是貢獻或重要性。
評估路段從道路風險、交通風險及環境風險三個方面進行數據的匯總、清洗、篩分和組合。然后采用Python語言結合隨機森林模型,進行特征權重的計算。
本文采用隨機森林平均不純度的減少(mean decrease impurity)中平均gini指數為評價指標[10]。
基于HMM的交通運行態勢評估及預測方法/陳鷙翱
2.3 態勢值計算
交通運行態勢值是將反映交通運行狀況的因素綜合為一組有意義的值,其表征交通運行狀態,是交通運行狀況的定量表示,見式(1):
式中:I——態勢值;
wi——關鍵影響因素i對應的權重;
ni——關鍵影響因素i的值。
定義態勢值和各特征序列的等級劃分結果見表1。
2.4 交通運行態勢關鍵影響因素風險評估
2.4.1 風險評估方法
2.4.1.1 Fine Kinney方法
Fine Kinney方法是1976年由Kinney和Wiruth開發的《系統安全軍用標準》(MIL-STD-882E)中的一種定量風險評估方法[11]。在這種方法中,每個檢測到的危害都考慮了三個參數(可能性、曝光因子和可能的后果),然后,通過乘以這些參數獲得“風險評分”:
RS=L×E×P(2)
式中:RS——風險評分;
L——危險事件的可能性;
E——曝光因子;
P——可能的結果。
2.4.1.2 隨機森林、FAHP和Fine Kinney的結合
隨機森林被用于確定特征向量的重要度及是否存在共線性;FAHP經常被用于確定危害的重要程度;而Fine Kinney是一種風險評估方法,可以評估風險水平和提出一些政策建議。結合使用幾種方法可以對危害進行優先級劃分和分類,評估其風險并提供實質性的決策建議,以更好地規避風險[12]。
2.4.2 風險評估結果
由于交通運行態勢已歸一化為0~1,Fine Kinney分數由事件的可能性、曝光因子和可能的后果共同耦合得出。為了對FAHP和Fine Kinney分數進行歸一化處理,兩者同時除以1 000。
然后采用KNN聚類方法,進行運行態勢的聚類分析。結果表明:通過迭代最優聚類運算,兩種方式最佳均為5類,且分類區間的特征類型相同。這也表明FAHP和Fine Kinney分數差異較小,并且在0和1之間分布相同,因此Fine Kinney風險等級可以作為FAHP風險等級。表2為根據FAHP聚類結果得出的風險分級。
3 基于隱馬爾可夫模型的交通運行態勢預測模型
交通是一個動態系統,在運行過程中,會以不同的態勢動態呈現,不可避免地會與理論上的理想狀態存在一些差異。每個運行態勢的表現狀態可以看作是交通運行態勢的特征表示參數,即觀測值的順序;情況級別1、情況級別2和情況級別3則是無法直接獲得或觀察到的隱藏狀態,兩者之間相互轉換的概率就是隱含狀態之間轉換的概率。隱含狀態可以通過觀測序列來推測或估計,并且觀測序列和隱藏狀態序列是隨機的,這滿足了隱馬爾可夫過程的四個基本特征,也表明了本文研究的交通運行狀況具有隱馬爾可夫性質。
本文選取10個關鍵影響因素作為表征參數,包括運行速度協調性、線形連續性、視距、流量、速度差、車頭間距、擁擠度、大型車比例、交通事故和天氣,表征交通運行態勢等級1、交通運行態勢等級2和交通運行態勢等級3等三種運行態勢。一個完整的HMM模型可以用一個五元組{N,M,π,A,B}表示。
交通運行態勢預測整體設計流程如圖3所示。
4 交通運行態勢分析——實證分析
本文在收集西安繞城高速公路某段道路幾何指標基礎數據(包括運行速度協調性、線形連續性、視距等)、線圈交通流觀測數據(包括流量、密度、速度、車頭時距、飽和度、擁擠度等)及交通事故、天氣等特征序列的基礎上,采用2019-07-01至2019-07-10的10組數據進行測試。如圖4所示。
由圖4可以看出:
(1)交通運行態勢值的大小或等級與影響其權重較大的因素有關,因子的權重越高,態勢等級越高。
(2)狀況等級為1的交通運行態勢主要受天氣、交通事故等因素的影響。
(3)即使權重較小的影響因子為1,只要權重較大的影響因子較低,交通運行態勢也不會為1。
通過以上規律可以發現,當影響交通運行態勢的因素有多個時,在優化過程中應優先權重較大的因素。當只有一個影響因子時,即使權重很小,也必須及時處理,以提高整體交通運營效率和服務水平。
4.1 參數學習
根據獲取的交通運行狀況的基本數據,訓練并保存模型。本文利用Matlab軟件進行模型的構建,將數據轉換為實際工程問題,通過使用K個樣本序列χ={Ok}Kk=1來學習隱馬爾可夫模型,直到達到收斂條件并計算似然模型參數λ,即可確定這三個參數。學習曲線如圖5所示。
4.2 預測結果
使用MATLAB軟件分析2019-07-01到2019-07-10的10組測試樣本(態勢等級為1的有1組,等級為2的有7組,等級為3的有2組)。將數據替換為前文訓練的三個HMM模型,并計算對應于這10個測試樣本的三個模型的Log(P|λi)值,該值最大者即為預測模型,對應的數值即為對應的態勢等級(見表3)。對比預測值和實際值可判斷模型是否有效、方法是否可行。交通運行態勢等級預測結果以及下一時間對應的最可能狀態序列見下頁表4。由表4可知,該預測方法是可行的。
在此基礎上,對模型使用過程中的準確率Accuracy,平均絕對誤差MAPE,均方根誤差RMSE和相對均方誤差RE進行了測試,并且與傳統的態勢預測方法自回歸移動平均模型ARMA、灰色馬爾可夫模型GM進行對比分析,可以發現預測值(如下頁圖6所示),準確度和誤差結果如下頁表5所示。表明HMM模型可以更好地描述流量的運行狀況,進一步驗證了HMM模型的正確性。
5 結語
本文以交通運行態勢為研究對象,針對各種交通事件引起的效率低和服務水平差等問題,采用隨機森林法提取交通運行狀況的關鍵影響因素和優先次序,并通過層次分析法和Fine Kinne組合方法評估每個關鍵影響因素的風險,得出風險分級指標。
在分析現有態勢預測方法優缺點的基礎上,本研究克服了整體態勢預測的弊端,并引入了隱馬爾可夫預測模型。該模型不僅可以整體預測態勢,還可以通過了解內部結構來對交通運行態勢進行預測。本研究構建了基于HMM的交通運行態勢預測模型,應用HMM模型中的Baum-Welch和Viterbi算法來解釋預測原理并驗證模型,并計算了預測結果的準確性和誤差。
收集某繞城高速公路某段的數據,整理成模型訓練所需的數據序列,輸入到HMM預測模型中進行訓練和預測分析。結果表明,與傳統的態勢預測方法中自回歸移動平均模型ARMA和灰色馬爾可夫模型GM相比,HMM預測方法具有更高的準確度和更小的誤差,HMM模型可以較好地描述交通狀況。
通過交通運行態勢的科學評估和預測,能夠為區域路網如高速公路和平行干線公路的誘導分流和交通組織提供基礎支撐。
參考文獻
[1]張敖木翰,張 平,曹劍東.基于物聯網的公路交通運行狀態評估與預測[J].公路,2015,60(9):178-183.
[2]Xu C,Liu P,Wang W,et al.Evaluation of the impacts of traffic states on crash risks on freeways[J].Accident Analysis amp; Prevention,2012(47):162-171.
[3]楊 陽.滬寧高速公路運行狀態評價及通行能力提升策略[J].北方交通,2021(6):60-63,67.
[4]郭 淼,趙曉華,姚 瑩,等.基于駕駛行為和交通運行狀態的事故風險研究[J].華南理工大學學報(自然科學版),2022,50(9):29-38.
[5]Song J J,Ghosh M,Miaou S,et al.Bayesian multivariate spatial models for roadway traffic crash mapping[J].Journal of multivariate analysis,2006,97(1):246-273.
[6]曹 波,林 文.高速公路路網運行指數評估模型應用研究[J].公路,2021,66(2):224-228.
[7]王博文,王景升,朱 茵,等.基于ARMA-SVR的短時交通流量預測模型研究[J].公路交通科技,2021,38(11):126-133.
[8]林立春,劉 華,洪 東.基于大數據分析的交通擁堵預測技術[J].西部交通科技,2020(9):138-141.
[9]Yan L,Zhang Y,He Y,et al.Hazardous traffic event detection using Markov Blanket and sequential minimal optimization(MB-SMO)[J].Sensors,2016,16(7):1 084.
[10]羅預欣,張 兵,薛運強.基于變量分析和粒子群優化加權隨機森林的交通事件檢測方法[J].科學技術與工程,2021,21(14):6 044-6 049.
[11]李艷昆,劉 晗.基于系統因素作用理論的軌道加氫站Fine Kinney風險評估方法[J].科學技術與工程,2021,21(8):3 304-3 309.