


摘要:高速公路交通流量的復雜性和波動性對通行效率與安全性提出了更高的要求。為精確預測高速公路通行時間分布,文章結合貴陽至黃果樹高速公路段連續門架系統采集的交通流數據,提出了一種基于注意力機制的長短期記憶網絡(Long ShortTerm MemoryAttention,LSTMAttention)組合模型。該模型通過LSTM捕捉時間序列中的長期與短期依賴關系,利用注意力機制動態聚焦于關鍵時間步,顯著提升了通行時間分布的預測精度。研究結果表明,LSTMAttention模型在節假日與非節假日2種場景下均表現出較高的預測精度,能夠有效捕捉交通流量的時變特性和波動模式,尤其在節假日期間復雜交通場景下表現出顯著優勢。相比傳統模型,LSTMAttention模型在平均絕對誤差(Mean Absolute Error,MAE)和均方誤差(Mean Squared Error, MSE)上均實現了顯著優化,為動態路徑規劃、交通管理優化和應急響應提供了重要的技術支持。文章研究成果不僅驗證了深度學習技術在交通預測中的有效性,也為復雜交通場景的通行時間分布預測提供了新的研究思路。
關鍵詞:高速公路通行時間;深度學習;注意力機制;LSTM;交通流量預測
中圖分類號:U4911文獻標志碼:A
0引言
隨著城市化的推進與機動車數量的持續增長,高速公路面臨前所未有的交通壓力:車輛增多造成擁堵頻發、事故風險上升,而節假日與高峰期的流量波動則使交通預測難度進一步加劇。在此背景下,高速公路通行時間分布預測的價值日益凸顯。與單一的期望通行時間相比,通行時間分布預測通過分析歷史數據,為路徑規劃和交通管理提供更精細的決策支持[1]。
從研究趨勢看,通行時間分布預測方法經歷了從參數模型到無參數模型、再到組合模型的逐步演變。參數模型多依賴于統計和物理過程,如卡爾曼濾波器和自回歸移動平均模型,這些方法在面對復雜的交通環境和非線性交通流量特征時,表現出一定的局限性。朱征宇等[2]提出了一種基于卡爾曼濾波器和支持向量機的混合短期交通流預測方法。該研究通過結合卡爾曼濾波器的狀態估計能力和支持向量機的強大非線性映射能力,提高了交通流預測的準確性。隨著數據驅動方法的興起,無參數模型逐漸成為通行時間分布預測領域的主流。Vlahogianni[3] 研究了優化的BP神經網絡在短期交通流預測中的應用,展示了無參數模型在捕捉復雜交通流模式中的優勢。然而,單一的無參數模型在面對交通流的多變性和不確定性時仍存在一定的局限。近年來,組合模型逐漸成為研究熱點。Wu等[4] 提出了一種混合深度學習框架,融合了時空相關性,用于短期交通流量預測。該研究探討了深度學習與傳統預測方法的組合在交通預測中的前沿應用。
通行時間分布預測盡管已取得了長足進展,但仍面臨關鍵挑戰,對節假日等異常流量缺乏有效捕捉機制、預測模型的實時性不足以及神經網絡超參數調整煩瑣等問題依然存在。為應對上述挑戰,本文基于高速公路門架系統采集的數據,提出了一種融合注意力機制的LSTMAttention模型并與傳統LSTM模型進行對比,驗證其在節假日與非節假日場景下對核心輸入特征具有更精準的動態聚焦能力。
1數據來源與預處理
11數據來源
本研究的數據來自貴陽至黃果樹高速公路的某段連續門架系統,采集時間范圍為2024年5月1日至5月14日,共計14天的所有車輛通行數據。數據總量約為1000 MB,涵蓋節假日和普通工作日的交通情況。
12數據預處理
在對原始數據進行分析和建模之前,須對數據進行預處理,以確保數據的質量和模型的有效性。數據預處理步驟主要包括數據清洗、特征選擇、數據轉換和數據分割等。首先,對原始數據進行完整性和一致性檢查。(1)缺失值處理:檢測各字段是否存在缺失值。對于少量缺失的數據記錄,予以刪除;對于關鍵字段缺失的數據,考慮利用線性插值方法或其他統計方法進行填補。(2)異常值處理:針對通行時間、累計里程等數值型字段,采用箱線圖(Box Plot)方法檢測異常值。對于明顯異常的數據,分析其產生原因并根據需要進行修正或剔除。(3)重復數據檢測:檢查是否存在重復的通行記錄,避免同一車輛通行被多次記錄的情況。如有重復記錄,保留時間最早或最完整的一條數據。
其次,通過對原始數據的處理,繪制每天上行和下行不同道路的車流通行時間分布,為后續模型的構建提供了數據支持。如圖1所示,研究特別關注了數據集中假期與日常車流量的顯著差異,假期的車流量幾乎在全天各時段均明顯高于日常水平且在高峰時段車流量的增長尤為顯著,遠遠超出了日常的車流量水平。假期的交通流量模式不僅具有更高的流量峰值,還呈現了更復雜的波動特性。
2模型設計
21長短期記憶網絡(Long ShortTerm Memory,LSTM)
在處理時間序列數據時,循環神經網絡(Recurrent Neural Network,RNN)因其能夠利用序列數據的時間依賴性,成為常用的模型。然而,傳統的RNN在處理長序列時,容易出現梯度消失和梯度爆炸問題,導致模型難以捕捉長期依賴關系。為解決這一問題,Hochreiter等[5]提出了LSTM,通過引入門控機制,有效地緩解了梯度消失問題。
LSTM的核心是引入了細胞狀態和3個門控機制:輸入門、遺忘門和輸出門。這些門控機制通過控制信息的流動,選擇性地記憶或遺忘信息,從而捕捉長期依賴關系。
22注意力機制
LSTM在捕捉長期依賴方面有所改進,但在處理長序列時仍易出現信息壓縮、遠端信息可能被忽視。注意力機制最初在機器翻譯領域提出[6],通過為輸入序列的不同部分分配不同的權重,從而更精準地聚焦于當前任務相關的信息。注意力機制的核心思想是,根據當前的解碼狀態,對編碼器輸出的隱含狀態進行加權求和,得到上下文向量Ct,然后用于生成輸出。通用的注意力計算過程如下:
(1)計算注意力權重。
(3)計算上下文向量。
上下文向量ct表示模型在時刻t對輸入序列的加權關注。通過引入注意力機制,模型能夠動態地選擇重要的輸入信息,緩解長序列信息壓縮的問題,提高模型性能。
23LSTMAttention 模型在通行時間分布預測中的應用
本文提出的LSTMAttention模型結合LSTM對時間序列的建模優勢與注意力機制的動態加權特性,能更有效地捕捉交通流量的時變模式與關鍵特征。模型架構如下:
(1)輸入層。輸入特征包括經過預處理的時間特征、空間特征和車輛特征,組成時間序列輸入X={x1,x2,…,xT},其中,xT為時刻t的輸入特征向量,T為時間序列長度。
(2)LSTM編碼層。將輸入序列X輸入LSTM層,得到每個時刻的隱藏狀態序列H={h1,h2,…,hT},其中,hT包含了從時間1到t的歷史信息。
(3)注意力層。引入注意力機制,對LSTM的隱藏狀態序列H進行加權求和,得到上下文向量c,用于捕捉與當前預測任務最相關的時間步的信息。注意力權重的計算公式如下:
3實驗設置與結果分析
31模型設置
實驗設置模型由2部分組成:第一部分是LSTM層,用于處理輸入的時間序列數據。LSTM能夠通過其門控機制捕捉長期和短期的時間依賴性。第二部分是注意力機制層,能夠為LSTM輸出的隱藏狀態分配不同的權重,進而重點關注與當前預測最相關的時間步。模型通過全連接層輸出預測的通行時間分布。
32結果分析
預測結果可以看出,LSTMAttention模型能夠有效捕捉節假日期間復雜的交通流特性,對交通高峰時段的通行時間分布預測尤為精準。特別是在早晨和下午的高峰時段,模型的預測值緊密貼合真實值,表明引入注意力機制后,模型能夠動態聚焦于關鍵時間點,提高對高峰期交通波動的響應能力。同時,從整體趨勢來看,模型成功反映了節假日期間通行時間的波動模式,較好地避免了傳統LSTM模型可能出現的高峰時段誤差偏大或低谷時段預測不足的問題。
非節假日期間交通流量相對穩定,通行時間的分布也更加平緩。在這種情況下,LSTMAttention模型同樣能夠準確預測通行時間的變化趨勢且在低流量時段預測誤差較小。與節假日期間的預測相比,非節假日期間模型的預測值與真實值之間的差異進一步減小,表明LSTMAttention模型在應對穩定交通模式時具有較強的泛化能力。
通過對比LSTMAttention和LSTM模型在相同數據集上的表現,可以看出,LSTMAttention模型在節假日和非節假日的交通流量預測中都表現出更優越的性能,尤其是在節假日的復雜交通流量下,其預測誤差顯著低于其他模型。實驗結果如表1所示。
從表1中可以看出,LSTMAttention 模型在節假日和非節假日的場景下均表現出最優的預測性能。節假日期間交通流量波動顯著,LSTMAttention模型的MAE和MSE分別為 645和978,顯著優于LSTM(MAE=934,MSE=1456)。這表明注意力機制能夠有效捕捉節假日期間復雜的交通流量波動并動態聚焦關鍵時間步,提升預測精度。非節假日期間交通流量相對平穩,LSTMAttention模型的MAE和MSE分別為512和689,在對比模型中表現最佳。盡管非節假日交通流量的波動性較低,注意力機制仍然能夠通過動態加權的方式捕捉細微的時間序列特征,減少預測誤差。
4結語
通過引入注意力機制,LSTMAttention模型能夠動態聚焦關鍵時間段的交通流變化[7],尤其在節假日和高峰期表現出更高的預測精度。結合實驗結果,注意力機制的引入顯著提升了模型對關鍵時間步的關注能力,尤其是在交通流量波動較大的時段(如節假日高峰期),能夠動態調整對歷史數據的權重分配,避免重要信息的丟失。消融實驗進一步驗證了注意力機制的重要性,其單獨移除會導致模型性能大幅下降,表明注意力機制是提升預測精度的關鍵因素。
結合實驗結果與實際應用需求,未來研究可從以下幾個方面進一步拓展:(1)引入其他高速公路或區域的多源交通數據,構建更大范圍、更全面的通行時間分布預測模型,以驗證模型的通用性和適用性。(2)結合擴展長短期記憶(Extended Long ShortTerm Memory,xLSTM)或時空混合密度網絡(SpatialTemporal Mixture Density Network,STMDN),進一步捕捉交通流的空間依賴性,從而提升預測精度[8]。(3)深度學習模型通常需要較高的計算成本,尤其是在大規模數據集上進行預測時。未來研究可嘗試引入輕量化模型(如 TinyML)或模型壓縮技術,在保證預測精度的同時顯著降低計算開銷,提升模型的實用性。
參考文獻
[1]WANG Q,XU C,ZHANG W,et al.GraphTTE:travel time estimation based on attentionspatiotemporal graphs[J].IEEE Signal Processing Letters,2021(1):1.
[2]朱征宇,劉琳,崔明.一種結合SVM與卡爾曼濾波的短時交通流預測模型[J].計算機科學,2013(10):248-251,278.
[3]VLAHOGIANNI E I,KARLAFTIS M G,GOLIAS J C.Optimized and metaoptimized neural networks for shortterm traffic flow prediction:a genetic approach[J].Transportation Research Part C:Emerging Technologies,2005(3):211-234.
[4]WU Y,TAN H.Shortterm traffic flow forecasting with spatialtemporal correlation in a hybrid deep learning framework[J].Neurocomputing,2016,205:22-32.
[5]HOCHREITER S,SCHMIDHUBER J.Long ShortTerm Memory[J].Neural Computation,1997(8):1735-1780.
[6]BAHDANAU D,CHO K,BENGIO Y.Neural machine translation by jointly learning to align and translate[J].CoRR,2014,abs/14090473.
[7]LI Y G,YU R,SHAHABI C,et al.Diffusion convolutional recurrent neural network:datadriven traffic forecasting[EB/OL].(2018-02-22)[2025-01-20].https://arxiv.org/abs/170701926.
[8]杜漸,段洪琳,王振華,等.面向高速公路通行時間分布預測的時空混合密度神經網絡[J].計算機系統應用,2023(4):308-316.
(編輯王雪芬)