



















摘要:針對智能交通系統中的實時交通流量預測問題,傳統的時間卷積網絡雖然能夠通過擴張卷積技術捕捉時間序列數據中的長期依賴關系,但其在處理任意長度的流量序列時存在局限性。為解決這一問題,筆者采用連續函數表示卷積核,并通過多層感知網絡進行參數化,從而擴展了模型的感受野,使其能夠并行處理任意長度的交通流量序列,而不依賴于遞歸結構。此外,該模型還綜合考慮了交通流的內在特性和外部環境因素,通過數據預處理進行特征提取和選擇,構建了適用于短時交通流量預測的模型。基于真實世界交通流量數據集上的實驗結果表明,所提出的連續時間卷積網絡模型在預測精度上顯著優于傳統時間卷積網絡,平均絕對誤差有顯著降低,驗證了該模型的有效性和優越性。
關鍵詞:交通流預測;時間卷積網絡;連續核函數
中圖分類號:U491.1 """""""文獻標識碼:A""""""""""""文章編號:1672-4437(2024)04-0041-07
0 引言
隨著城市化進程的加速,車輛數量激增,導致交通擁堵成本上升,引發時間損失、燃料浪費和空氣污染等問題。因此,城市交通流量預測對于提升交通網絡效率、實現智能交通管理具有非常重要的意義[1]。
近年來,由深度學習驅動的神經網絡,以其處理多維數據的能力和出色的靈活性、泛化及預測性能,被廣泛應用于提升交通流預測的準確性[2]。Fu 等[3]首次通過應用GRU網絡進行短時交通流預測,分析前半小時數據來預測接下來5分鐘的交通流。蒲悅逸等[4]提出了一種基于CNN-ResNet-LSTM的模型,通過集成卷積神經網絡、殘差神經單元和長短期記憶循環神經網絡,有效捕獲交通流量的空間和時間特征,并融合外部因素,提高了城市短時交通流量預測的準確性和效率。劉銘[5]等提出改進的MVF-LSTM模型,通過算術平均濾波和參數調整,提升短時交通流量預測的精度與泛化性。張璽君[6]等提出ACBiGRU模型,融合注意力卷積網絡和雙向門控循環單元,提高短時交通流預測的準確性與優越性。郝俊等[7]提出EEMD-BiGRU模型,利用EEMD去噪結合BiGRU訓練,顯著優化短時交通流量預測精度。李剛等[8]提出一種基于ACLN的模型,利用深度ConvLSTM提取船舶交通流量數據的時空特征,并通過注意力機制關注重要特征,結合多層ConvLSTM和CNN進行預測,顯著提高了港口船舶交通流量預測的準確性和實用價值。鐘林嵐等[9]提出PGCN-MAGRU模型,通過周期圖卷積和多頭注意力門控循環單元的組合,有效捕獲交通流量數據的時空動態和周期性特征,顯著提高了預測精度并減少了誤差累積效應。
由此可以看出,研究人員在交通流預測領域廣泛利用深層網絡結構,特別是LSTM和GRU等RNN變體,來捕捉序列數據中的非線性關系。盡管這些循環網絡在序列建模方面表現出色,但它們依然面臨梯度彌散和爆炸的問題,且其計算方式導致訓練效率受限,難以實現高效的并行處理,尤其是在GPU加速方面存在挑戰。
Bai等[10]提出結合RNN的記憶能力和CNN的高計算效率的TCN,通過因果卷積、膨脹卷積和殘差塊的設計,不僅能夠關聯當前和歷史時間信息,還保持了CNN的并行計算優勢,從而處理序列信息時既提升了速度又確保了訓練質量。
本研究基于TCN的基本思想,保留因果卷積和殘差結構,剔除擴展卷積,將傳統的卷積核用連續函數表示,提出連續時間卷積網絡(Continuous Temporal Convolution Networks,CTCN)。交通流量預測中,連續時間卷積網絡相較于時間卷積網絡和循環神經網絡,能夠獲得更廣的全局感受野并完整保留歷史時間信息,從而為時間序列問題提供更優的建模,有效提升預測準確率。本研究使用CTCN網絡模型,結合交通流其他參數和天氣節假日因素對交通流量進行預測,實驗證明其在交通流量預測任務上優于LSTM、GRU和TCN的效果。
1 交通流特征向量分析與構建
城市道路交通流量受多種因素影響,包括人口密度、路網面積、車輛數量、天氣和節假日等。本研究選擇特征變量的三個關鍵方面:一是直觀的交通流參數,如速度和占有率;二是需定量轉換的環境因素,如天氣;三是與地區習俗相關的社會因素,如節假日。這些都需要進行歸一化處理以納入模型。
1.1.1 交通流量
交通流量是公路機動車流量的關鍵指標,用于評估擁堵并采取疏導措施。計算公式為:
其中
是流量,
是車輛數,
是時間。
1.1.2 交通速度
交通速度通過時間平均速度來衡量,即在一定時間內所有車輛速度的算術平均值。具體計算公式為:
其中
是車輛總數,
是第
輛車的瞬時速度。
1.1.3 占有率
車道占有率,特指時間占有率,用符號
表示,反映車輛通過特定路段的總時間與觀測期總時間的比值。計算公式為:
其中
是觀測時段總時長,
是第
輛車通過時間,
是通過車輛總數。高
值表示交通擁堵,低
值則表示道路通暢。
天氣狀況對交通狀況有顯著影響,惡劣天氣如雨雪可能導致交通擁堵,而良好天氣可能因增加出行量同樣造成擁堵。為量化天氣對交通的影響,依據《氣象災害預警信號發布與傳播辦法》的分類標準[11],將天氣狀況按災害嚴重程度分為五級,包括特別嚴重、嚴重、較重、一般和無異常,從而為交通流量預測提供天氣因素的量化方法,具體劃分如下:
根據經驗篩選出4種對交通流影響最大且可量化的天氣狀況,用于標識嚴重程度(見表1)。
1.3 節假日因素的處理
節假日對交通流量的影響尤為顯著,其影響程度與假期長度相關。為了量化這種影響,本文采用歸一化方法,通過分段函數
實現:
其中,
為一年中最長的假期天數,周末假期即可量化為
,非周末假期可量化為
,其中
是第
個假期的天數。
綜合上述討論,本研究將考慮的多個因素和相應的特征變量進行詳細梳理,并將其作為輸入數據集的一部分(見表2)。該表提供了一個清晰的框架,列出了每個變量的名稱、含義以及它們是如何被量化和處理的,旨在為后續的模型構建、數據分析和預測結果提供堅實的數據基礎和透明度,確保研究的嚴謹性和可靠性。
假設有一個訓練集D,其中包含的樣本總數為n,表示為n=|D|。如果從表2中挑選出m個特征變量,就可以據此構建一個新的訓練集:
2 基于連續時間卷積網絡的交通流量預測方法
將卷積核
表述為由小型神經網絡
參數化的連續函數[12]。
接收相對位置
作為輸入,并輸出該位置
的卷積核的值。可以通過提供相對位置
到
的同樣大的序列來構造任意大的卷積核
。其中
為序列長度,即可以對一個與輸入序列
大小相等的卷積核進行采樣。換句話說,可在不修改網絡結構或增加更多參數的情況下構建全局存儲層。連續核卷積由下式給出:
連續核卷積過程(如圖1)包含獲取相對位置、生成卷積核、快速傅里葉卷積三個步驟。根據輸入序列的長度生成包含相對位置信息的卷積核序列,初始化后進入卷積核網絡進行訓練。卷積核網絡使用最簡單的三層感知機結構,用非線性激活函數Sine[13]代替常用的ReLU函數[14],使卷積核能建模為連續函數,用全卷積層代替全連接層以減少計算量。最后用快速傅里葉[15]卷積來代替空間卷積,加快計算速度。
2.2 基于CTCN的交通流量預測模型
本研究以連續卷積方式替代時間卷積網絡中擴展卷積的功能,使得感受野可以做到任意大小,更靈活地提取時間序列歷史數據信息,保留了時間卷積網絡的因果卷積與殘差結構,構建了連續時間卷積網絡,并應用于交通流量預測領域。模型主要是以車道斷面流量為預測目標,通過殘差塊結構來充分提取交通流量的時間特性。
給定時間步長為T的流量輸入序列
,以預測步長為
的交通流量序列
,即輸出序列
。此時,時間步長T也就是連續卷積核的長度。模型架構如圖2所示。

圖2 基于CTCN的交通流量預測模型
該神經網絡模型由輸入層、連續核卷積層、全連接層和輸出層構成,專門處理交通流量時間序列,該序列是一個M×N的二維矩陣,M代表時間長度,N代表特征變量數量。
為使數據適合神經網絡處理,原始的時間序列X需轉換為三維矩陣。采用滑動窗口技術[16],以時間步長T為單位進行滑動,每次生成一個N×T的矩陣,這些矩陣按時間順序排列。當模型的分批大小設定為P時,每次處理的輸入數據大小為P×N×T,確保了數據的完整性并充分利用了時間序列的關聯性。
神經網絡的三維輸入矩陣通過輸入層進入連續核卷積層,該層由n個串聯的殘差塊組成,每個殘差塊內部通過殘差連接和跳躍機制進行線性疊加,形成下一個殘差塊的輸入。卷積操作完成后,輸出一個N×T大小的二維矩陣。最后,這個N×T的二維矩陣進入全連接層,執行線性降維運算,最后由輸出層產生預測序列
,其維度為T。
CTCN交通流量預測模型訓練,主要目標是最小化經驗誤差(訓練誤差)和泛化誤差(測試誤差),以獲得最佳模型。模型的目標函數
由預測流量值與
實際流量值
的平方差之和,加上范數正則化項
組成,目的是防止模型過擬合。公式表達為:
3 實驗與結果分析
為驗證模型,本研究采用美國加利福尼亞州PeMSD4高速公路數據集,該數據集覆蓋舊金山灣區29條道路上的3848個檢測器,以5分鐘間隔匯總了基于30秒采樣頻率的原始交通流數據,包括車流量、平均速度和占有率,從中選取2018年1月至2月的數據作為實驗數據,同時考慮相關天氣狀況和全年節假日,將其分為前50天的訓練集和后9天的測試集,其中訓練集和測試集的輸入特征包括交通速度和時間占有率。
對交通流數據和天氣數據進行歸一化處理后,可以縮短訓練時間,防止陷入局部最小值,優化訓練過程。本研究對數據進行離差標準化處理,這是一種線性變換方法,目的是將原始數據的值調整到0到1的范圍內,具體轉換公式:
上述公式中,x代表原始數據點,y表示經過處理后的數據點,x-max為原始數據集中的最大值,而x-min則是該數據集中的最小值。
為評估交通流量預測模型,本研究采用三個關鍵評價指標[17]:平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)。指標的定義如下:
上述公式中,n代表交通流量時間序列的長度,
表示預測的交通流量,而
表示實際的交通流量。MAE、RMSE和MAPE三個評價指標的數值越低,說明預測模型的準確度越高。
本研究提出基于連續時間卷積網絡(CTCN)的交通流量預測模型完全采用Python語言編寫,并借助Pytorch這一深度學習框架進行實現。實驗所采用的硬件環境包括配備有Intel Core i5-9300H的四核處理器、8GB內存以及NVIDIA GeForce GTX 1650 GPU,確保了模型訓練和預測的高效性。
其中CTCN模型的訓練迭代次數設為500,批大小設置為64;采用學習率衰減策略和Adam算法優化;CTCN的連續卷積層包含2個殘差塊;padding采用因果卷積策略,卷積核的尺寸和數量為待定參數,dropout參數設置為0.5。
卷積核尺寸和數量需要結合多次參數調整后,根據模型的預測效果選取最優值。本研究通過改變卷積核尺寸,測驗不同的卷積核數量下CTCN模型的預測效果(如圖3)。
由圖3可知,卷積核大小參數的選取與卷積核數量存在緊密聯系。當卷積核大小一定時,CTCN模型預測的RMSE隨卷積核數量的增加先降低后升高。當卷積核數量為64,卷積核大小為100時,RMSE最低,模型精度最高,所以選擇這組數據作為模型參數。
為驗證CTCN模型的預測精度及適用性,本研究選取時序預測領域常用的LSTM[18]、GRU[19]和TCN模型。將這三種模型與CTCN模型進行實驗效果對比,對比模型的參數設置如下:
(1)LSTM使用三層結構,隱藏層單元數為64;
(2)GRU使用三層結構,隱藏層單元數為64;
(3)TCN使用三個殘差塊結構,擴張系數為[1,2,4],每層卷積核個數均為32,卷積核大小為3。
本研究對數據集中的所有檢測器分別進行交通流預測實驗,然后取平均值,結果見表3。
由表3可以看出,相比其他模型,CTCN模型的整體預測誤差最低,效果最好,三種誤差指標均為最小。與TCN模型相比,CTCN模型的MAE、RMSE、MAPE分別提升了13.2%,13.8%,11.1%,這表明CTCN延續了TCN模型的優點,且進一步擴大了TCN的感受野。
為直觀說明各模型的擬合效果,選取編號為400255的檢測器對2018年2月20日部分時段的預測結果進行展示,LSTM、GRU、TCN、CTCN四個模型的預測效果如圖4。
由圖4可以看出,CTCN模型的擬合效果最佳,LSTM與GRU模型對峰值的預測效果較差,TCN與CTCN模型的預測曲線趨勢相近。CTCN模型總體預測效果不錯,但在個別峰值上呈現預測滯后的現象,還有待提升。
最后,為進一步說明天氣和節假日因素對交通流量預測的影響[20],將特征[x3,x4]也輸入到模型中,構建CTCN-E預測模型,與CTCN模型預測結果進行對比,結果見表4。
從表4數據可知,將天氣和節假日因素融入交通流量預測模型可以顯著降低預測誤差,從而提升預測的準確性。這一結果表明,天氣和節假日因素對交通流量的變化有實際影響,進而證實了包含這些因素的預測模型的有效性和可行性。
4 結語
本研究提出了一種新穎的交通流量預測模型,稱為連續時間卷積網絡(CTCN)。該模型將連續核卷積的思想與時間卷積網絡相結合,以構建具有超長記憶能力的網絡結構。CTCN由兩個連續卷積殘差塊組成,這些殘差塊不僅增強了模型對時間序列數據的捕捉能力,而且通過殘差連接顯著提升了模型的學習能力和預測精度。選用真實的高速公路流量數據集對CTCN模型進行評估,并將其性能與現有的幾種先進預測模型進行比較,實驗結果表明,CTCN在多項評價指標上均取得領先,驗證了本研究模型設計的有效性。盡管CTCN模型在時間序列預測方面取得了顯著成果,但該模型尚未充分考慮空間特征的影響。因此,未來研究將探索如何將圖卷積結構集成到CTCN模型中,以增強模型對空間特征的捕捉能力,進一步提升交通流量預測的準確性和魯棒性。
參考文獻:
[1]VLAHOGIANNI E I , KARLAFTIS M G , GOLIAS J C. Short-term traffic forecasting: Where we are and where we're going[J].Transportation Research Part C Emerging Technologies,2014,43(1).
[2]KARLAFTIS M G , VLAHOGIANNI E I.Statistical methods versus neural networks in transportation research: Differences, similarities and some insights[J]. Transportation Research Part C Emerging Technologies,2011,19(3):387-399.
[3]FU R, ZHANG Z, LI L.Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation.IEEE,2016.
[4]蒲悅逸,王文涵,朱強,等.基于CNN-ResNet-LSTM模型的城市短時交通流量預測算法[J].北京郵電大學學報,2020,43(05):9-14.
[5]劉銘,魚昕.基于改進LSTM算法的短時交通流量預測[J].桂林理工大學學報,2021,41(02):409-414.
[6]張璽君,張冠男,張紅,等.基于ACBiGRU模型的短時交通流量預測[J].華中科技大學學報(自然科學版),2023, 51(05):88-93.
[7]張璽君,郝俊.EEMD+BiGRU組合模型在短時交通流量預測中的應用[J].國防科技大學學報,2023,45(02):73-80.
[8]李剛,宋文,陳致遠.基于注意力機制和ConvLSTM的船舶交通流量預測算法[J].計算機科學,2023,50(S2):698-704.
[9]鐘林嵐,張安勤,田秀霞.基于周期圖卷積與多頭注意力GRU組合的交通流量預測模型[J].計算機應用研究,2024,41(04):1041-1046.
[10]BAI S,KOLTER J Z,KOLTUN V. An Empirical Evalu-
ation of Generic Convolutional and Recurrent
Networks for Sequence Modeling[J/OL].(2018-03-01)[2024-04-22]https://arxiv.org/pdf/1803.01271v2.
[11]中國氣象局.氣象災害預警信號發布與傳播辦法[EB/OL].(2012-08-03)[2024-04-22].https://www.cma.gov.cn/2011zwxx/2011zflfg/2011zgfxwj/201208/t20120803_180761.html.
[12]WU W X, QI Z G, FUXIN L.PointConv: Deep Convolutional
Networks on 3D Point Clouds[J].2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition,2019.
[13]BALESTRIERO R, BARANIUK R G.Mad Max: Affine Spline Insights Into Deep Learning[J].Proceedings of the IEEE,2021(5):704-727.
[14]SITZMANN V, MARTEL J, BERGMAN A, et al.Implicit Neural Representations with Periodic Activation Functions[J/OL].(2020-09-17)[2024-04-22].https://arxiv.org/abs/2006.09661.
[15]NUSSBAUMER H J.Fast Fourier Transform and Convolution Algorithms[M].Berlin:Springer
-Verlag,1982.
[16]GUO S, LIN Y, FENG N, et al.Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting[C]//National Conference on Artificial Intelligence.Associati-
on for the Advancement of Artificial Intelligence,2019.
[17]TIAN C,CHAN W.Spatial‐temporal attention wavenet:A deep learning framework for traffic prediction considering spatial‐temporal dependencies[J].IET Intelligent Transport Systems,2021,15(4):549-561.
[18] D "Kang, "Lv Y , Chen Y Y.Short-term traffic flow prediction with LSTM recurrent neural network[C]//2017 IEEE 20th International Conference on Intelligent Transportation Systems (ITSC).IEEE,2017.
[19]DAI G W, MA C X, XU X C.Short-term Traffic Flow Prediction Method for Urban Road Sections Based on Space-time Analysis and GRU[J].IEEE Access, 2019(7):143025-143035..
[20]ZHU J W, WANG Q J, TAO C, et al.AST-GCN: Attribute-Augmented Spatiotemporal Graph Convolutional Network for Traffic Forecasting[J]. IEEE Access,2021(9):35973-35983.
[21]魏夢媛.基于時間卷積網絡的城市快速路交通流量預測方法研究[D].北京:北京交通大學,2020.