主題詞:智能車輛軌跡預測生成式對抗網絡社交池化機制自注意力機制中圖分類號:TP183;U461.91 文獻標志碼:A DOI: 10.19620/j.cnki.1000-3703.20240867
Vehicle Trajectory Prediction Method Based on Social GAN Network and Self-Attention Mechanism
ZhuLangqian’,Ma Shijun',Liu Mingjian12,LiMuyang',Hao Changsheng1 (1.Collegeof Information Engineering,DalianOcean University,Dalian16023;2.KeyLaboratoryofEnvironment ControlledAquaculture,Ministryof Education,DalianOcean University,Dalian116023)
【Abstract】Toaddresstheissue thattemporalfeaturesand spatialfactors ofthe trafcenvironment affcttheaccuracyof vehicletrajectorypredictioninvehicledriving,thispaperproposesavehicletrajectorypredictionmethodintegratingtemporal multi-headself-attentionandsocial pooling basedonthe Social GenerativeAdversarial Network (SMA-GAN).Firstly,the historicaltrajectoryfeaturesareextractedbythetemporalcorelationofthetargetvehicle'sowntrajectorydatausingthemultiheadself-atentionmechanism.Then,thespatialdimensionalfeaturesofthetargetvehicleareextractedbythesocialpoling mechanismbasedonthespatialpositionalrelationshipbetweenthetargetvehicleandthesuroundingvehicles.Finalythe predictedtrajectoryofthetargetvehicleisobtainedbytheencoder-decoder.Modeltrainingandcomparisontestsare conducted using the NGSIM dataset,and theresultsshow that theSMA-GAN model has higher predictionaccuracy and efficiency in the highway scene.
KeyWords:Intelligent vehicle,Trajectory prediction,Generative Adversarial Network(GAN). Social pooling mechanism,Self-attention mechanism
【引用格式】祝朗千,馬時俊,劉明劍,等.基于Social GAN網絡與自注意力機制的車輛軌跡預測方法[J].汽車技術,2025(6):8-14.ZHULQ,MASJ,LIUMJ,etal.VehicleTrajectoryPredictionMethodBasedonSocialGANNetworkandSelf-AtentionMechanism[J]. Automobile Technology,2025(6): 8-14.
1前言
隨著智能交通系統的迅速發展,車輛軌跡預測技術能夠感知復雜交通環境中的潛在風險因素,結合駕駛輔助系統的應用,對于提升行車安全具有重要意義。
目前,多數研究根據車輛特征和駕駛員意圖預測未來車輛軌跡,主要分為傳統機器學習方法與深度學習方法。對于傳統機器學習方法方面,Abbas等2將道路車輛劃分為5種運動狀態并預測車輛軌跡,文獻[3]\~文獻[5]使用無監督聚類算法對不同駕駛風格進行識別,并通過模型生成特定車輛的駕駛風格。但對于復雜的交通場景,模型難以分辨車輛行為,容易影響模型分類的準確性。
對于深度學習方面,長短時記憶(LongShort-TermMemory,LSTM)網絡可有效捕捉特征間長期依賴關系而被廣泛應用。文獻[6]\~文獻[9]將LSTM與卷積神經網絡結合,充分提取多輛車間歷史軌跡的交互信息;朱云鶴等[0]利用編解碼器和滑動窗口,提取行駛車輛的歷史特征向量;季學武等[11使用LSTM模型識別駕駛員意圖,利用解碼器輸出預測軌跡。為了描述不同行人對目標車輛的作用,Alahi等利于社交池化(SocialPooling)層將空間位置網格化,網格內行人軌跡的隱藏狀態視為空間的社交影響。Gupta等3]基于生成對抗網絡(GenerativeAdversarialNetwork,GAN)4提出了Social-GAN模型,根據多個行人的相對距離和隱藏狀態提取最顯著的特征,生成符合行人運動規律的軌跡。Qin等5使用網格地圖描述其空間和時間的流動性分布。上述方法雖能提取車輛間空間關系,但車輛歷史軌跡中關鍵時序特征的表征仍顯不足。
為了進一步分析車輛特征,可通過注意力機制捕捉車輛交互關系與關鍵時序特征。文獻[16]\~文獻[19]將LSTM網絡結合注意力機制,提高了軌跡預測精度;季文禮等2通過構建車輛間影響力場函數,利用軌跡間的時空特征實現車輛軌跡預測;Yang等2分析道路線形對車輛換道意圖的影響,提出了意圖卷積混合注意網絡;Sun 等[22]利用Transformer模型[23]的多頭注意力(Multi-HeadAttention,MHA)提取融合車輛與環境特征,提高了預測精度。雖然注意力機制能夠提升對車輛特征的建模能力,但難以量化周圍車輛對自標車輛的影響關系與歷史軌跡特征,容易導致預測精度下降。
通過結合周圍車輛數據的時空關聯性,提高較長時域中車輛軌跡的預測精度,本文提出了一種基于生成對抗網絡融合時間多頭自注意力與社交池化(SocialpoolingandMulti-head Self-Attention Generative AdversarialNetworks,SMA-GAN)的車輛軌跡預測模型。采用時間自注意力模塊,提取目標車輛的歷史軌跡特征;構建社交池化模塊,捕捉周圍車輛的影響關系;融合時空特征,利用編碼器-解碼器結構生成目標車輛的未來軌跡。同時,通過消融試驗和對比試驗,驗證本文模型的有效性。
2基于時空融合的軌跡預測模型
2.1車輛軌跡預測形式化定義
在城市道路行駛過程中,車輛根據周車和行人動態修正前進的方向和速度,進而改變車輛行駛軌跡。在一段時間內,當前時刻的車輛位置變化與上一時刻的車輛位置、環境存在較強關聯性。因此,本文將車輛軌跡預測問題視為時間序列問題,探究車輛軌跡的時間、空間的關聯性。
以當前場景假定為平面坐標系,對于各場景的目標車輛,定義各時刻的所有車輛坐標,目標車輛集合為:

式中: ci 為第 i 個目標車輛。
車輛在 χt 時刻的狀態向量為:
ci=(ti,xi,yi,vi,ai,θi)
式中: xi,yi 分別為車輛所在坐標系的橫、縱坐標, vi 為車輛行駛速度, ai 為車輛加速度, θi 為車輛的轉向角。
將預測過程的時間集合分為歷史時間集合和未來軌跡預測時間集合,目標車輛的時間集合為:



式中: Ti 為車輛所有時間集合, tj 為第 j 時刻, Tihis,Tipre 分別為歷史時間集合和預測時間集合,
分別為歷史軌跡的起始時間和終止時間, tobs,tend 分別為預測軌跡的起始時間和終止時間。
在訓練過程中,目標車輛狀態集合、歷史軌跡狀態集合、預測軌跡狀態集合分別為:



2.2模型框架
基于生成對抗網絡,結合自注意力機制與社交池化機制,本文提出一種基于時間與空間特征融合的車輛軌跡預測方法,模型的總架構如圖1所示。
首先,考慮目標車輛行駛軌跡的時間相關性,將車輛歷史軌跡信息輸入軌跡生成器,經編碼器處理后,傳輸至自注意力模塊,生成車輛時間維度的特征向量;其次,量化周車對目標車輛的影響,將歷史特征向量輸入社交池化模塊,得到空間維度的特征向量;然后,將時間特征向量與空間特征向量融合輸入解碼器,循環生成未來預測軌跡;最后,將車輛預測軌跡與真實軌跡輸入軌跡判別器,生成判斷概率,使生成軌跡分布更加接近車輛真實軌跡,令生成器與判別器共同進步。
2.2.1 軌跡生成器
軌跡生成器包含編碼器模塊、時間多頭注意力層、社交池化層以及解碼器模塊。編碼器模塊利用LSTM對每輛車的歷史軌跡序列建模,根據上一時刻的隱藏層狀態和當前時刻的輸入,輸出車輛行駛歷史軌跡的特征向量:


式中: We 為LSTM層的可學習權重。
由于當前時刻車輛狀態與過去時刻狀態高度相關,為了使模型更好地學習車輛軌跡的時間特征,采用多頭注意力模塊,提取每輛車在時間維度的關聯性,模塊架構如圖2所示。

使用自注意力機制處理序列數據,能夠考慮序列中所有位置,有效地捕捉車輛行駛數據特征。通過時間多頭注意力機制,提取車輛歷史軌跡數據的隱藏狀態。將第i輛車的車輛行駛歷史軌跡特征向量 hit 傳輸至時間多頭注意力模塊,相關過程為:

式中: Wq?Wk?Wv 分別為自注意力中對應查詢矩陣 qi. 關鍵矩陣 ki 和數值矩陣 vi 的權重參數。
計算當前時刻 n 個注意力頭的車輛注意力值,并進行拼接,得到時間相關特征向量:

式中: hn 為車輛 i 在任意時刻 Φt 的第 n 個自注意力特征值, dk 為關鍵矩陣的維度, hitep 為任意時刻拼接車輛 n 個注意力頭的車輛時間特征向量集合。
為了量化車輛間的社交關系,利用社交池化層提取行駛車輛與周車的空間特征,如圖3所示。以目標車輛為中心,選擇當前時刻目標車輛所在車道及其左、右兩側車道中,與起始坐標位置相距不超過 60m 的車輛,并提取其軌跡信息,將編碼后的隱藏狀態特征融合為全新的狀態特征,作為車輛社交池化特征。

在解碼器階段,編碼器隱藏態與該時刻社交池化向量混合初始化解碼器,由前一刻社交匯集向量和自注意力模塊提取的特征共同組成匯聚向量,作為隱藏態傳遞。首先,通過位置信息進行車輛觀測序列的社交分類,將同一時刻 m 個車輛狀態向量 hit 依次輸入社交池化層,得到社交池化向量 si°t 然后,將 sit 與 hitep 融合輸入多層感知機(Multi-LayerPerceptron,MLP),再與隨機高斯分布噪聲向量 z 連接,作為解碼器LSTM網絡層的初始隱藏狀態。解碼器在 χt 時刻預測軌跡時,利用前一刻的映射向量初始化LSTM,得到后一刻車輛的預測點 
解碼器循環見式(12),將車輛所有時刻預測軌跡數據更新至預測軌跡狀態集合 Pipre 。

式中: sit 為 hit 經過處理的社交池化向量, eit 為使用多層感知機融合 eit 與 sit 的特征向量, WMLP 為多層感知機的權重參數, hip 為車輛 i 在 χt 時刻的解碼器LSTM隱藏狀態向量,
為解碼器LSTM權重參數, Wpre 為輸出層網絡參數,
為車輛的預測位置。
2.2.2 軌跡判別器
軌跡判別器由一個單獨的編碼器以及MLP層組成,用于對輸入軌跡進行真偽判斷,以促進軌跡生成器更好地學習真實軌跡分布,其結構如圖4所示。

編碼器將輸人的真實軌跡數據和軌跡生成器生成的虛假軌跡數據,通過多個LSTM編碼映射為高維特征向量 Hd, 再將其輸入到MLP層,得到輸入軌跡的真實性概率:

式中: Wd 為軌跡判別器中編碼器LSTM權重參數, Wm 為多層感知機權重參數 ?,p 為判定輸人軌跡為真實軌跡的概率。
2.2.3 損失函數
本文的損失函數 L 主要由2部分構成:一是軌跡生成器需要生成更加真實的車輛軌跡,采用L2范式構建軌跡生成器的損失函數 LL2 ;二是軌跡判別器需要更準確地判定輸入軌跡的真偽,采用交叉熵損失函數LGAN○

式中:
分別為軌跡生成器和軌跡判別器的輸出, r 為輸入真實軌跡數據,為輸入滿足高斯分布的噪聲向量,E 為期望值,k為生成器的采樣次數, (xi,yi) 為車輛的真實位置。
3試驗環境設置
將車輛歷史行駛軌跡數據在SMA-GAN和其他先進軌跡預測模型中進行迭代預訓練。在輸入前3s的歷史軌跡數據,分別輸出1\~5s預測結果的情況下,通過對比試驗以及消融試驗,驗證本文模型的有效性。
3.1數據集與參數
本文試驗使用公開數據集NGSIM(NextGenerationSimulation)中IUS-101數據集,通過提取車輛ID、車輛局部坐標、車輛速度、加速度和車輛轉向角信息作為模型的輸入。本文數據集共包含4680輛車的軌跡數據,按照8:1:1分為訓練集、驗證集和測試集。其中,訓練集包含3744輛車的軌跡數據,模型訓練迭代200次。
在Windows10操作系統下進行試驗,圖像處理器采用英偉達RTX3090Ti,顯存容量為24GB,將Python作為編程語言。模型的編碼器維度設置為64,批大小為32,采用自適應矩估計(Adam)優化器,生成器與鑒別器的學習率分別設置為0.0005和0.001。
3.2評價指標
為了評估模型性能,選擇均方根誤差(RootMeanSquare Error,RMSE)、平均位移誤差(AverageDisplace-mentError,ADE)、最終位移誤差(FinalDisplacementError,FDE)作為性能評價指標。其中,RMSE反映整體預測軌跡與真實軌跡間偏離程度;ADE衡量整個預測過程中各預測點與對應真實點間歐氏距離的平均值,體現軌跡的整體預測精度;FDE僅關注預測終點與真實終點間歐氏距離,用于評估最終位置的預測準確性。

式中: T 為預測時間步數,
分別為真實軌跡和預測軌跡的終點位置。
4試驗與結果分析
4.1消融試驗
為了驗證本文模型中各模塊的有效性,對SMA-GAN模型進行消融試驗,時域 te 內模型預測結果如表1所示。

由表1可知,以GAN網絡為基線,由于社交池化模塊考慮時間動態特征,MHA捕捉車輛間的空間交互信息,使模型預測精度均有所提升。融合時間和空間特征后,模型的預測性能表現優異,證明了綜合考慮時空特征的重要性。
4.2 對比試驗
在NGSIM數據集上,將本文提出的SMA-GAN模型與其他主流的車輛軌跡預測模型進行對比試驗,對比模型包括社交池化與長短時記憶(SocialLongShort-TermMemory,S-LSTM)模型[2]、卷積社交池化與長短時記憶(Long Short-Term Memory with Convolutional Socialpooling,CS-LSTM)模型、社交池化與生成對抗網絡(Social Generative Adversarial Network,S-GAN)模型[13]、非局部社交池化與長短時記憶(Non-Local SocialLongShort-TermMemory,NLS-LSTM)模型[24],結果如表2和表3所示。


由表2可知,與CS-LSTM、S-LSTM、S-GAN和NLS-LSTM模型相比,SMA-GAN、NLS-LSTM模型在短預測時域(1s)內的RMSE均為最低且預測效果接近;在中長預測時域(2\~5s,SMA-GAN的RMSE最低;在5s的預測時域中,相較于NLS-LSTM,SMA-GAN的RMSE降低了 13.8% ,說明本文模型的時間多頭自注意力模塊能夠有效提取車輛行駛過程中的時間相關性,更精準地預測車輛的軌跡位置。
由表3可知,SMA-GAN模型在短預測時域(1s)的預測時域中的ADE指標和FDE指標略低于S-GAN模型。而在中長時間預測(4\~5s中,SMA-GAN模型的ADE指標和FDE指標明顯優于其他模型。在5s的預測時域中,SMA-GAN模型和S-GAN模型的ADE指標低于 4m ,且SMA-GAN模型比S-GAN精準度提升了6.5% ,表現出更高的預測精度,進一步說明社交池化模塊與時間多頭自注意力模塊融合,提取周圍行駛車輛的時空特征,比僅考慮提取車輛的空間特征更具優勢。
為了進一步驗證本文模型性能,對比CS-LSTM、S-LSTM、S-GAN與SMA-GAN的運行時間,各模型運行結果分別為 1 8 . 1 6 m s".、1 2 . 3 0" m s、"1 1 . 7 9m s 、 1 4 . 0 8m s "。僅采用社會池化的S-GAN模型表現最優,引人時間多頭自注意力模塊的SMA-GAN模型,雖然其運行速度相較于S-GAN有所下降,但仍然保持著良好的運行效率。
因此,SMA-GAN車輛軌跡預測方法相較于其他主流車輛軌跡預測模型,在均方根誤差、最小平均位移誤差和最小終點位移誤差指標上總體為最優,預測出的車輛行駛軌跡準確性最高。
4.3 預測軌跡可視化
在測試數據集中,選取4種駕駛場景,分別為直線行駛、左換道行駛、右換道行駛和多換道行駛。將本文預測結果進行可視化,分析不同駕駛場景下模型的性能,如圖5所示。


由圖5可知,本文模型能夠在復雜的車路環境中,相對準確地預測行駛車輛對周車的行駛軌跡,保證車輛的安全行駛。車輛直行時,模型預測度與實際軌跡貼合度較高,能夠為智能汽車的決策提供依據。但當車輛出現轉向、變道等轉變方向的行駛條件下,特別在車輛行駛途中發生多次轉向換道的情況下,模型無法準確預測到轉向點。盡管模型預測效果在車輛發生轉向的情況下略有下降,但仍然保持了較好的預測能力。
5結束語
本文基于時空多頭注意力的社交生成對抗網絡(SMA-GAN)的車輛軌跡預測方法,充分挖掘目標車輛歷史軌跡的時間依賴性,量化周圍車輛的空間交互影響,增強了軌跡預測的準確性。通過生成器與判別器的對抗訓練機制,使預測軌跡在保持連貫性的同時,更貼近真實交通行為的分布。
鑒于道路交通行駛場景復雜多變,本文模型訓練軌跡數據多為高速公路行車場景,后續將重點關注模型的泛化性,以適應更多典型的交通場景。
參考文獻
[1] ZHANGJN,WEIZW,LIUBX,et al.Cloud-EdgeTerminal Collaborative AIGC for Autonomous Driving[J]. IEEEWirelessCommunications,2024,31(4):40-47.
[2]ABBASM T,JIBRANMA,AFAQM,etal.An Adaptive ApproachtoVehicleTrajectoryPredictionUsingMultimodel Kalman Filter[J].Transactions on Emerging Telecommunications Technologies,2020,31(5).
[3]XING Y,LV C,CAO D.Personalized Vehicle Trajectory Prediction Based on Joint Time-Series Modeling for Connected Vehicles[J]. IEEE Transactions on Vehicular Technology,2019,69(2):1341-1352.
[4]JIANGYD,ZHUB,YANG SY,et al.Vehicle Trajectory Prediction Considering Driver Uncertainty andVehicle Dynamics Based on Dynamic Bayesian Network[J]. IEEE Transactionson Systems,Man,and Cybernetics,2023, 53(2): 689-703.
[5] SUJY,LI M Y,ZHU L Q,et al.Vehicle TrajectoryPrediction Method Based on Driver Behavior-Classification and Informer Models[J].World Electric Vehicle Journal, 2024,15(6).
[6] DEO N,TRIVEDI M M. Convolutional Social Pooling for Vehicle Trajectory Prediction[C]//Proceedingsof the IEEE Conference on Computer Vision and Pattern Recognition Workshops. Salt Lake City,UT,USA: IEEE,2018:1468- 1476.
[7] MUKHERJEE S,WANG S,WALLACE A. Interacting Vehicle Trajectory Prediction with Convolutional Recurrent Neural Networks[Cl// 2O2O IEEE International Conference on Robotics and Automation (ICRA).Paris,France: IEEE, 2020:4336-4342.
[8] XU D W,SHANG X T,LIU YW Z,et al. Group Vehicle Trajectory Prediction with Global Spatio-Temporal Graph[J]. IEEE Transactions on Intelligent Vehicles,2022,8(2): 1219-1229.
[9] SHI J, SUN D X, GUO B C. Vehicle Trajectory Prediction Basedon Graph Convolutional Networks in Connected Vehicle Environment[J]. Applied Sciences,2023,13(24): 13192-13192.
[10]朱云鶴,劉明劍,祝朗千,等.SW-SAN:基于 Seq2Seq結 合注意力機制與滑動窗口的車輛軌跡預測模型[J].現代 電子技術,2024,47(11):175-180. ZHU Y H,LIU M J, ZHU L Q,et al. SW-SAN: Vehicle Trajectory Prediction Model Based on Seq2Seq Combined with Attention Mechanism and Sliding Window[J]. Modern Electronics Technique,2024,47(11): 175-180.
[11]季學武,費聰,何祥坤,等.基于LSTM網絡的駕駛意圖 識別及車輛軌跡預測[J].中國公路學報,2019,32(6):34- 42. JI XW, FEI C,HE X K,et al. Intention Recognition and Trajectory Prediction for Vehicles Using LSTM Network[J]. China Journal of Highway and Transport, 2019, 32(6): 34- 43.
[12]ALAHI A,GOEL K,RAMANATHAN V,et al.Social LSTM:Human Trajectory Prediction in Crowded Spaces[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.Las Vegas,NV,USA:IEEE, 2016: 961-971.
[13] GUPTA A, JOHNSON J, FEI-FEI L,et al. Social GAN: SociallyAcceptableTrajectorieswithGenerative Adversarial Networks[Cl//Proceedingsof theIEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City,UT,USA: IEEE,2018:2255-2264.
[14] CRESWELL A,WHITE T,DUMOULIN V,etal. Generative Adversarial Networks:An Overview[J]. IEEE Signal Processing Magazine,2018,35(1): 53-65.
[15] QIN Y,GUAN Y L, YUEN C. Spatiotemporal Capsule Neural Network for Vehicle Trajectory Prediction[J]. IEEE Transactions on Vehicular Technology,2023,72(8): 9746- 9756.
[16]LINL,LIWZ,BIHK,etal.Vehicle Trajectory Prediction UsingLSTMs with Spatial-Temporal Attention Mechanisms[J]. IEEE Intelligent Transportation Systems Magazine,2022,14(2): 197-208.
[17] CHENXB, ZHANGHJ, ZHAOF, et al. Intention-Aware Vehicle Trajectory Prediction Based on Spatial-Temporal Dynamic Attention Network for Internet of Vehicles[J]. IEEE Transactions on Intelligent Transportation Systems, 2022,23(10): 19471-19483.
[18] MESSAOUD K, YAHIAOUI I, VERROUST-BLONDET A, et al.Atention Based Vehicle Trajectory Prediction[J]. IEEE Transactions on Inteligent Vehicles,2020,6(1): 175-185.
[19] GUO H Y, MENG Q Y, CAO D P, et al. Vehicle Trajectory Prediction Method Coupled withEgo Vehicle Motion Trend under Dual Attention Mechanism[J]. IEEE Transactions on Instrumentation and Measurement,2022,71: 1-16.
[20]李文禮,韓迪,石曉輝,等.基于時-空注意力機制的車輛 軌跡預測[J].中國公路學報,2023,36(1):226-239. LI WL,HAN D,SHI X H,et al.Vehicle Trajectory Prediction BasedonSpatial-TemporalAttention Mechanism[J]. China Journal of Highway and Transport, 2023,36(1): 226-239.
[21]YANG M X,ZHANGBL,WANG TT,et al.Vehicle Interactive DynamicGraph Neural Network Based Trajectory Prediction for Internet of Vehicles[J].IEEE Internet of ThingsJournal,2024,22(11): 35777-35790.
[22] SUN D X, GUO H L, WANG W H. Vehicle Trajectory Prediction Based on Multivariate Interaction Modeling[J]. IEEEAccess,2023,11:131639-131650.
[23] VASWANI A, SHAZEER N,PARMAR N, et al. Attention IsAll You Need[EB/OL]. (2023-08-02) [2025-01-16]. https://arxiv.org/abs/1706.03762.
[24] MESSAOUD K, YAHIAOUI I, VERROUST-BLONDET A, et al.Non-Local Social Pooling for Vehicle Trajectory Prediction[C]// 2019 IEEE Intelligent Vehicles Symposium (IV).Paris,France: IEEE,2019: 975-980. (責任編輯瑞秋) 1口17