





















摘 要:為了提高異常事件常發地段中智能車輛行駛的效率和安全性,以提升車流參數預測的準確度為出發點,該文設計了一種基于動態節點自注意力的車流參數預測方法, 在多個時間步中利用空間注意力聚合鄰域節點的特征,沿著時間維度通過時間注意力機制預測交通參數。結果表明:該文設計的動態圖自注意力(DGSA)模型的1 h預測結果平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分誤差(MAPE)指標分別下降了3.75%、3.45%、11.63%;測算的路段平均碰撞時間(TTC)更長,達到2.8 s。該方法能夠在異常事件情況下有效預測車流演化態勢并提升車輛的安全性。
關鍵詞:智能車輛;車流參數預測;異常事件;動態圖;深度學習
Traffic flow parameter prediction method based on dynamic graphs self-attention
Abstract: In order to improve the driving efficiency and safety of intelligent vehicles in the areas with frequent abnormal events, a traffic flow parameter prediction method was designed based on dynamic node self-attention to improve the accuracy of traffic flow parameter prediction. The spatial attention was used to aggregate the features of neighborhood nodes in multiple time steps, and then the traffic parameters were predicted by the temporal attention mechanism along the time dimension. The results show that the Mean absolute error (MAE), root mean square error (RMSE) and mean absolute percentage error (MAPE) of the one-hour prediction of Dynamic Picture Self-Attention (DGSA) model decrease by 3.75%, 3.45% and 11.63%, respectively. The simulated road average collision time (TTC) is longer, reaching 2.8 s. The proposed method can effectively predict the evolution trend of traffic flow and improve the safety of vehicles under abnormal events.
Key words: intelligent vehicles; traffic flow parameter prediction; abnormal events; dynamic graphs; deep learning
隨著國民經濟的飛速發展,汽車保有量不斷增長,給交通帶來了較重的負荷,嚴重妨礙了人們的出行效率和生活品質。在此背景下,車路云一體化技術的應用逐漸成為緩解交通壓力的新方向 [1]。通過整合車輛、道路和云端信息,提升車輛行駛的安全性和運行效率[2],而準確的車流參數預測在這個過程中起著至關重要的作用。它能夠輔助交通管理機構進行有效的交通調度和規劃[3],同時幫助個體車輛在復雜路況下做出更為明智的出行決策,例如路線規劃及出行時間的建議、預警系統以及停車位的動態信息。所有這些服務的核心,都依賴于對交通流動態的準確把握和預測,因此,車流參數預測受到廣泛關注。
對于車流運行參數預測,國內外的研究主要提出了交通流建模法和數據驅動法。交通流建模法是在數學模型的基礎上進行仿真分析,可以對車流展開詳細的敏感性影響研究。如耿彥斌 [4] 建立了應急交通需求時空分布預測模型,提出了一套可行的應急交通疏散動態分析方法。秦嚴嚴等 [5] 研究了在智能網聯環境下混合有協同自適應巡航控制(cooperative adaptive cruise control,CACC) 車輛的交通流 LWR(Lighthill- Whitham-Richards) 模型,提供了理論工具用于分析混合交通流的宏觀動力學特性,并通過數值仿真試驗驗證了模型的準確性。梁海軍等 [6] 構建了基于元胞傳輸模型(cell transmission model,CTM) 的宏觀交通流模型,利用該模型揭示了終端區交通流的時空演變規律和擁堵機理,通過仿真平臺驗證了模型的準確性,并進行了敏感性分析。此類方法主要基于傳統的交通流相關理論,采用計算機模擬的方法,呈現單條路段或交通流匯合處的排隊激波等微觀的擁堵形成及消散現象,但因約束條件多,通常無法在復雜路網中對交通擁堵和消散情況進行準確建模,導致泛化性能較差 [7]。因此,一些學者提出了基于時空數據驅動的車流擁堵與消散的傳播態勢研究方法。
數據驅動法可以從歷史數據中識別經常出現的擁堵傳播模式,主要包含基于傳統算法的預測模型和基于智能算法的預測模型。其中,傳統算法通過統計交通歷史數據的規律預測未來的變化趨勢,自回歸差分移動平均模型 (autoregressive integrated moving average model,ARIMA) 及其變體 [8] 的建模方法是其典型代表,但是,此類方法主要應用于線性的數學模型,不能有效地學習時空數據中的非線性特征。智能算法中主要有機器學習和深度學習算法,其中 K 最鄰近 (K-nearest neighbor,KNN) [9]、支持向量機 (suport vector machine,SVM) [10] 等機器學習方法可以處理非線性問題,然而,這些方法只從時間域上構建數學模型, 沒有將路網結構中天然存在的空間關系聯系起來。近年來,深度學習在預測任務中能夠自動提取有效特征,處理大樣本和高維數據,并實現高精度的預測。如 ZHAO Zheng 等 [11] 提出了基于長短時記憶 (long short-term memory,LSTM) 網絡的交通預測模型,可以兼顧短時和長時跨度的時間序列數據的特征,達到更好的預測效果。王體迎等 [12] 提出了利用門控循環單元 (gate recurrent unit,GRU) 進行短時交通流量預測的方法,通過數據間的”序列信息”建模,以提高交通流量預測的準確度。YU Bing 等 [3] 提出了時空圖卷積網絡 (spatial-temporal graph convolutional networks,ST-GCN) 解決交通流參數預測問題, 利用多尺度網絡模型能夠有效捕捉到區域間的時空相關性。WU Zonghan 等 [13] 提出了新型圖神經網絡架構 Graph WaveNet,用于時空圖建模,通過自適應依賴矩陣和堆疊的擴張一維卷積組件,能夠準確捕獲數據中的空間依賴關系,并處理非常長的序列。此外,一些學者為了在車流運行參數預測問題上對不規則路網上的非歐幾里得相關性進行建模,將圖卷積網絡 (graph convolution networks,GCNs) 與遞歸神經網絡 (recursive neural networks,RNNs) [14]、卷積神經網絡 (convolutional neural networks,CNNs) [3] 和注意力機制 [15-17] 相結合,在城市路網中取得了比較好的效果。
盡管最新的研究已經在車流狀況預測鄰域取得了令人滿意的結果,但少有研究關注異常情況下的車流變化情況。如進藏通道區域異常事件頻發,此類事件對車流參數的影響通常表現為擁堵,這種擁堵在時間和空間領域往往嚴重偏離正常情況。以車流量參數為例,在發生異常事件后,短時間內通過某斷面的車流量會驟減,經過一段時間的疏解調度后漸漸恢復正常范圍內的波動。然而,大多數現有方法沒有明確區分數據的正常和異常情況,從而導致在異常場景下的性能下降。此外,現有方法中節點多設置在傳感器布設位置,這些位置通常選在觀測條件良好的路段,無法細粒度地捕捉到異常事件給車流參數帶來的時空影響。因此,如何在異常情況下對車流狀況預測依然是一項重要而富有挑戰性的任務。
本文針對異常事件的突發性,在事故點引入動態節點,設計了基于動態圖算法的時空自注意力方法,在多個時間快照中提取鄰域節點的特征,再通過時間自注意力模塊推演未來的變化趨勢,能夠有效分析異常條件下的車流數據分布情況。
1"" 車流參數預測問題描述
交通流預測問題可以將非歐式空間的路網數據抽象為一個圖數據,道路上的關鍵位置看成節點,根據節點之間路段的連通關系構建邊信息,如圖1 所示,交通路網的車流參數變化就可以看成時空序列下的圖數據演變。其中,tp、tp+ ω、tp-τ +1 分別為當前時刻、未來 ω個時間步的時刻、過去 τ - 1 個時間步的時刻。
1.1"" 交通流預測
1.2"" 動態圖建模
動態圖指的是圖的拓撲結構、節點或邊的屬性會隨著時間的推移而發生變化,這意味著圖中的節點和邊會發生增減或特征變化。動態圖主要分為以快照為代表的離散時間動態圖(discrete time dynamic graph,DTDG)和以事件為代表的連續時間動態圖(continuous time dynamic graph,CTDG) [18]。此外,根據動態圖中節點集和邊集是否具有不變性可以將其分為4種情況:1) 節點集V和邊集E都是不變的,記為?xV,E,這種情況稱為時空圖(spatial-temporal graphs,STGs);2) 節點集V不變,但邊集E是變化的,記為fixV;3) 節點集V和邊集E都是變化的,記為Vary;4) 邊的集合E是不變的,但是節點的集合V是變化的。由于邊是基于一對節點存在的,所以這種情況是沒有意義的。
大多數針對城市路網的車流參數預測問題可以看成動態圖中較簡單的離散時空圖,即 V 和 E 不變,但節點的特征 ( 如流量、平均車速等 ) 會隨著時間變化,此類問題多聚焦于城市中的常發性交通擁堵情況 ( 如早晚高峰時的車輛擁堵 )。然而,在觀測條件不佳的區域,由于受到傳感器布設情況的限制,無法及時地感知偶發性擁堵情況,突發的異常事件發生地帶通常伴隨著信息的缺失、不準確等問題,因而無法及時得到正確的車流參數數據,導致了人員和車輛的滯留,疏解調度也存在一定的難度。
針對上述問題,可以在異常事件發生期間加入動態節點,這樣能夠細粒度地捕捉車流參數的變化趨勢,這些動態節點能夠通過無人機設備動態采集數據或經過相關的節點推演預測方法獲得。本文將關注事件發生后的車流參數時空變化情況,即以動態圖的拓撲結構變化為基礎,對時空范圍內的影響進行分析,故可將此類問題看成如圖 2 所示的節點集 V 和邊集 E 均變化的 Vary 類動態圖情況。
此類動態圖定義為一組在時間步 T 下的快照,如式(2) 所示:
其中:G = (V, E , A )是一組快照數據;V 表示共有節點集;Et表示t 時刻下的邊集;At表示t 時刻下的鄰接矩陣。
2"" 基于動態圖自注意力的預測方法
本文采用了動態圖表示學習的時空自注意力方法,如圖3所示,整個模型主要由空間注意力、時間注意力、圖節點預測3個部分組成。該模型以某個t時刻的前τ個時間步的快照作為輸入,輸出為下一個時間步的節點預測流量值??臻g注意力模塊由多個堆疊的空間自注意力層組成,在不同快照上獨立應用每一層,提取出節點的高階局部鄰域特征,計算中間節點,表示為
2.1"" 空間注意力模塊
為了在不同的快照中有效計算周圍節點的空間影響情況,本文基于圖注意力神經網絡 (graph attention networks,GAT) [20] 的思路,設計了空間注意力模塊。在傳統圖神經網絡模型中融入圖注意力機制,能夠依據節點與其周圍鄰居的相似度動態分配注意力分數,從而增加空間結構上的影響力。
上述計算過程如圖4所示,其中的系數αuv是先通過 LeakyRELU非線性激活函數,再對v中每個鄰居節點進行softmax計算得到的,體現了節點u在當前快照中對節點v的貢獻,最后利用指數線性單元(exponential linear units,ELU)激活輸出節點表示。
因此,應用在快照 Gi 上的結構注意力層能夠根據鄰域節點的相似性計算相應的權重系數,有效提取非歐式空間中的相關特征。
2.2"" 時間注意力模塊
本文設計的時間注意力模塊能夠在多個時間步下捕捉圖類數據結構的時序信息演化情況。與處理時序數據的傳統方法不同,深度學習中的注意力機制 [21] 能夠學習到復雜時間序列的特征。其實質是加權求和,通過評分函數計算查詢(Query) 和鍵 (Key) 之間的注意力分數,然后利用softmax 函數計算注意力權重,將權重與值進行加權求和以求得注意力輸出。通過為不同的鍵分配不同的權重,實現了對值 (Value) 的選擇偏好,從而有效地整合上下文信息,有助于神經網絡的特征提取。
因此,當 Mij = ?∞ 時,再經過 softmax 計算后會讓注意力權重變為 0。
時序注意力完全依賴于每個節點的時序歷史,從而促進了節點間的高效并行,將每個節點的局部鄰域和時序歷史解耦成獨立的層是提高模型效率的關鍵因素之一。
2.3"" 多頭自注意力
采用多頭注意力的機制,可以對節點的表示使用多個通道疊加,在空間和時間自注意層中分別使用多個注意頭,將其拼接后能夠有效提高計算結果的可靠性??臻g多頭自注意力應用于單個快照上,具體計算如式 (10) 所示:
時間多頭自注意力與空間多頭注意力不同,是在多個時間步中進行,其計算方式如 (11) 式:
實驗結果與討論
本文實驗主要從兩方面展開:一方面利用交通流數據集驗證預測方法的準確性;另一方面搭建了相似的仿真場景,在異常事件常發區域利用車流參數的預測結果為車輛分配車流參數,驗證車輛安全性能的提升。
數據集
本文選取交通速度數據集PeMS-bay作為實驗數據,PeMS-bay是由加州交通運輸機構(CalTrans)性能測量系統(PeMS)采集的公共交通速度數據集,因此,本文以平均車速為例說明異常事件下的預測方法,其他車流參數(如流量、占有率等)也可以按照相似的處理得到預測結果。圖5展示了數據集中傳感器的分布情況,共有 325個斷面傳感器,該數據集在時間上包含了2017年1月
1日—2017年5月31日內采集到的長達6個月的車流數據,以5 min為周期,記錄1次平均車速信息,共有 52 116 個時間步,該數據集還包含了異常事件的信息,事件數據主要包括事件ID、時間戳、緯度、經度、嚴重級別(分為4個級別)和持續時間(結束時間減去開始時間),事件類型主要包括交通事故、道路封鎖、天氣等。
此外,LI Yaguang 等[14] 已經針對交通數據進行了預處理,將發生的交通事件與最近的傳感器做了對應。本文將數據集中有異常事件標志的節點按照第 2 節中的預測方法作為動態節點引入,只在發生交通事件的時間段添加相應的節點,模擬未設置固定傳感器位置發生事件時的場景。然而,在其他基線模型中,不考慮異常事件的突發性 ( 即不包含動態節點 ),只將固定節點作為圖節點輸入。
3.2" 實驗設置
本文將動態圖自注意力(dynamic picture self- attention,DGSA)模型與一些針對車流參數數據預測的方法進行了比較?;€模型有:1) 自回歸差分移動平均模型(ARIMA) [8];2) 長短期記憶(LSTM) [22];3) 門控循環單元(GRU) [23];4) 時空圖卷積網絡(ST-GCN) [3];5) 圖WaveNet模型(WaveNet) [13]。
實驗設置參數如下:輸入數據的長度為 12,預測未來 12 個時間步 (60 min) 的車流參數,學習率為 0.001,權重超參數 λ 為 0.7,前 36 481 個時間步為訓練集,后 15 635 個時間步為測試集。本文采用了交通流預測鄰域中常用MAE [24]、RMSE [25]、MAPE [26] 3 種評價指標來衡量不同方法的預測性能,其計算式分別如式 (12)—式(14) 所示:
3.3"" 結果分析
如表1所示,比較DGSA模型和5種基線模型預測未來15 min(3個時間步)、30 min(6個時間步)、60 min(12個時間步)的平均車速結果,此外,如圖6所示,比較了不同方法在PeMS-bay數據集上MAE、RMSE、MAPE的指標性能。實驗結果表明,DGSA模型在上述的各項指標上優于基線模型。
從上述結果可知:1) 深度學習的相關算法( 如 LSTM、GRU、ST-GCN、WaveNet)明顯優于傳統的時間序列模型,例如1 h預測實驗中,WaveNet比LSTM在 MAE、RMSE、MAPE指標上下降了4.17%、11.89%、 15.54%,說明深度學習的算法能夠更有效地捕捉到交通信息上的非線性相關性;2) 時序模型(如LSTM、GRU)只關注到非線性時間依賴關系,未加入空間影響情況,導致性能提升比較有限;3) 基于圖的模型(如ST-GCN、 WaveNet)總體上優于時序模型,如1 h預測實驗中,ST- GCN模型比GRU在MAE、RMSE、MAPE指標上下降了 3.38%、9.23%、12.40%,這表明在空間上建模非歐幾里距離的相關性可以學習到相鄰傳感器之間數據的相似性。其中,ST-GCN忽略了實際情況下的復雜動力學,只能學習到靜態圖上的特征,而WaveNet雖然設計了自適應鄰接矩陣來學習動態空間相關性,但是仍然只用一個鄰接矩陣來表征關系。
然而,上述方法與 DGSA 模型相比,由于缺乏考慮異常事件對車流參數數據的影響,預測性能不足。
DGSA 模型能夠針對偶然發生的交通擁堵節點,引入動態圖的處理方法,更接近異常事件下的數據結果。在引入異常事件后的 PeMS-bay 數據集上進行 1 h 預測,DGSA 模型較 WaveNet 模型在 MAE、RMSE 和MAPE 指標上分別下降了3.75%、3.45%、11.63%。
3.4"" 仿真驗證
本文在 SUMO 仿真軟件中模擬了數據集中的部分場景( 如圖 7 所示),選取了異常事件常發地段附近的一段長直通道,依照 PeMS-bay 的傳感器布設位置和路段等參數構建仿真路段,其車流量如圖 8 所示,在發生異常事件后道路會發生擁堵,經過一段時間的交通疏解后會慢慢恢復正常。實驗假定真實數據集的車速是最合適且符合安全的,因此,在該路段上可以選擇歷史數據中的擁堵時段,利用數據集中的車流參數給仿真路段分配流量數據,然后根據模型中預測的平均車速提前調整車輛的車速,讓車輛按照預測值通過節點。此過程是將預測結果在車端做應用驗證的環節,一方面可以反映出在異常事件下模型捕捉參數突變的效果,另一方面,通過對車速的有效預測,能夠為行駛車輛提供駕駛決策依據,有助于提高行駛的安全性。因此,本文在仿真軟件中以路段上所有車輛的平均碰撞時間 (time to collision,TTC) 作為安全性的評價指標,單車的 TTC 計算如式 (15) 所示:
其中:d 為當前車輛與前車的距離,vrel 為當前車速。
實驗結果如表 2 所示,與其他基線模型相比,車輛根據 DGSA 模型預測車速行駛情況下路段測算的 TTC 時間更長,說明本模型能夠在異常情況下更準確地捕捉車速變化趨勢,提高車輛行駛的安全性,優化服務質量。
4"" 結""" 論
本文提出了一種用于車流參數預測的動態圖注意力時空網絡方法,引入動態節點增強了對異常事件區域的特征提取,并在公開數據集 PeMS-bay 和SUMO 仿真平臺上證明了算法的優越性。實驗結果表明:動態圖自注意力 (DGSA) 模型的 1 h 預測效果較次優模型在平均絕對誤差 (MAE)、均方根誤差 (RMSE) 和平均絕對百分誤差 (MAPE) 指標分別下降了3.75%、3.45%、 11.63%;在仿真場景中,車輛以動態圖自注意力 (DGSA)模型預測車速行駛,測算的路段平均碰撞時間(TTC)更長,達到 2.8 s。該方法能夠在復雜的交通路網下有效預測車流演化態勢并提升行駛車輛的安全性。
上述基于條件感知的車流狀況預測更有利于實際應用,可以為聯網車輛提供更佳的環境信息[27],也可以在未來的自動駕駛時代給智能車輛提供車流參數的預測數據,幫助服務車輛避開交通擁堵、優化行駛路線、提高運輸效率和安全性。