王 哲,韓銀輝,蔣明智,袁 征,張 琳
(北京郵電大學 人工智能學院,北京 100876)
自動駕駛技術能夠有效提升交通安全和交通效率,近年來受到了廣泛關注。然而,由于復雜的交通系統和仍不完善的地方法律法規的限制,未來很長一段時間,自動駕駛車輛和手動駕駛車輛并存的混合交通場景會在高速公路中占據主要地位[1]。為了解決自動駕駛車輛算法面對實時動態變化真實交通場景失效的問題,尋找一種有效可靠的方法預測手動駕駛車輛的軌跡變化成為如今學者們亟待解決的問題[2]。早期研究應用理論和數學公式開發了微觀車輛軌跡變化模型,用于在各種復雜交通場景下預測自動駕駛車輛的軌跡[3],然而,此類模型無法在所有的車流量密度場景中取得很好的效果。Lin等人[4]使用模擬技術來估算車輛軌跡。該方法并沒有在實際場景中進行測試,由于模擬環境中的車道變換頻率與過程與實際交通場景情況不同,因此結果并不準確。袁娜等人[5]計算了車輛在車道變化的軌跡中引發的車身震動和周圍車流量變化,使用一種改進的人工魚群模型分析了車輛變道對交通安全的影響。然而,該研究并未充分考慮車道變化前后的微觀交通參數,沒有同時考慮碰撞風險和道路流量的影響。此外,許多研究只進行了目標車道上的車輛軌跡預測,而忽略了周圍其他車道上車輛的影響[6]。
5G車聯網和邊緣計算技術的出現,車聯網和傳感器的快速發展為車車協同、車路協同系統提供了保障[7]。例如,龍銀江等人[8]使用一種基于網絡切片的聯合資源分配算法實現了車聯網場景下的低時延通信。車聯網的發展使得學者們嘗試分析并使用車車協同、車路協同系統中的關鍵技術優化城市中車輛通行安全和效率低下的問題[9],并且證明了多智能體集群學習能夠更快速可靠地實現車聯網場景下的深度學習任務。Jiang等人[10]在車聯網場景中,基于邊霧云架構,提出了一種多交叉口協同控制算法提升車輛通行效率。然而,現有車聯網中多智能體研究并沒有考慮車輛隱私數據保護,通信技術的不恰當使用極有可能造成電信詐騙等用戶財產損失問題[11]。因此對于用戶數據的保護也開始得到工業界和學術界的關注。學者們嘗試使用聯邦學習和區塊鏈技術解決這一問題[12-13],基于聯邦學習和區塊鏈技術,Warnat等人提出了去中心化的集群智能學習框架Swarm Learning(SL)框架[14],并在醫療領域取得了卓越的效果。集群智能學習框架無需中央服務器,通過區塊鏈網絡共享參數,并在各個站點的私有數據上獨立構建模型。然而,上述工作只在醫療影響場景下進行了測試,并沒有在車聯網中進行嘗試與應用,同時,集群智能算法沒有考慮車聯網場景下車輛的移動性、不可靠的通信連接以及動態變化的駕駛環境。這些因素將給車聯網場景下的模型訓練帶來一些新的挑戰。本文中的混合交通下基于車聯網的集群智能軌跡預測算法主要貢獻點如下:
(1) 提出一種車聯網場景下的集群智能軌跡預測(Swarm Learning-based Trajectory Prediction,SLTP)算法。使用去中心化的集群智能通信框架保障用戶隱私數據的同時,獲取周圍手動駕駛車輛的歷史軌跡信息并預測周圍手動駕駛車輛的軌跡變化。
(2) 設計了基于Beta概率函數的權重預測策略并應用于集群學習的模型融合過程,解決車聯網場景中因傳輸冗余數據導致的模型預測精度不高的問題。
(3) 使用美國高速公路行車數據集NGSIM (Next Generation Simulation)驗證SLTP算法的有效性,與現有的基于長短時記憶(Long Short-Term Memory,LSTM)網絡的軌跡預測方法相比較,驗證SLTP算法的有效性。
假設在混合交通場景如圖1所示,場景中存在編號個數為N的自動駕駛車輛。

圖1 混合交通場景Fig.1 Mixed traffic scenario
由于車載GPS、雷達、攝像頭和其他車載傳感器可以獲得環境周邊手動駕駛車輛實時車輛軌跡數據,每輛自動駕駛車輛都可以建模為三維數組G=(V,P,E),其中:
(1)V={vi∣i∈{1,2,…}}表示所有車輛,vi表示道路上的編號為i的自動駕駛車輛。N=|V|表示道路上的所有自動駕駛車輛數目。
(2)P={pi∣vi∈V} 表示每輛自動駕駛車輛的軌跡數據,通過車載傳感器獲得,包括速度、加速度、方向和位置。
(3)E={ei∣vi∈V}表示環境矩陣,用于存儲車輛周圍的道路環境信息,即前后左右四個方向的車輛信息。道路環境矩陣中車輛vi的信息ei定義為:
(1)
式中,d(vi,vj)表示車輛vi和vj之間的歐式距離;R表示每輛車的可視范圍。深度神經網絡模型中的損失函數量化了算法對訓練數據的建模效果是機器學習需要解決的根本問題。訓練的目標是找到使損失函數最小化的最佳模型參數。機器學習中的損失函數大致可分為分類損失和回歸損失。其中包括對數損失、聚焦損失、Kullback-Leibler散度、指數損失、鉸鏈損失等,實驗中使用均方誤差作為車載模型的損失函數。車輛vi的損失函數fi(w)的表達式如下:
(2)

(3)
式中,Rm(i)是第i輛車的車載模型參數;Lm(k)是第k輛車的模型參數;γ是模型權重。集群學習過程中全局模型的損失函數被作為整個算法的目標函數:
(4)
編號為i的自動駕駛車輛本地模型的可信值Ci,為了表示模型的有效性,使用編號為i-1的車輛節點傳輸模型作為參考模型計算當前車載模型的有效性預測P(ei)。車輛i根據模型有效性觀測結果B計算和預測模型的有效性P(ei∣B),可推導為:
(5)
為了便于有效性值的表達和更新,使用Beta分布表示每個車載模型的有效性的概率,定義如下:
(6)
式中,p>0,q>0,p和q分別表示接收模型優于車載模型的次數和車載模型優于接收模型的次數,Γ(x)是伽馬函數,其表達式為:

(7)
例如,假設ai和bi代表當前的積極和消極行為,而p和q代表初始的積極和消極行為。要更新可信度,相當于更新兩個參數p和q,如下:
(8)
在沒有先驗知識的情況下初始化節點時,節點的可信度可以表示為(0,1)上的均勻分布,定義為:
P(x)=uni(0,1)=Beta(1,1)。
(9)
通過比較接收模型和車載模型的有效性,每輛自動駕駛車輛可以將接收到模型的有效性進行評估,即轉化為有效模型次數和無效模型次數。假設在n輪通信中,每輛自動駕駛車輛進行模型訓練和融合(p+q)次。通過比較模型的有效性,這些相互作用被描述為p次積極行為和q次消極行為。有了這些信息,每輛車可以在預測下一次模型融合時接收到模型的有效性。模型的有效概率定義為:
(10)
通過歸一化接受模型和本地模型的權重系數,編號為i的自動駕駛車輛模型融合過程的權重定義為:
λ1∶λ2=Ce∶1。
(11)
模型聚合過程中使用去中心化的集群學習框架保障用戶數據安全。路側單元作為模型聚合過程的參與者,均勻分布在道路兩側用于模型緩存。通過以下三個步驟的循環,多輛自動駕駛車輛協同通信,進行模型訓練任務:
(1) 每輛自動駕駛車輛通過V2V通信以及傳感器感知的方式收集周邊環境中手動駕駛車輛的軌跡數據(如地理位置、速度、方向角等)并進行軌跡預測訓練任務訓練車載模型。
(2) 行駛過程中,彼此接近的自動駕駛車輛通過區塊鏈技術通信,傳遞模型參數,預測接收模型和車載訓練模型的權重系數,并進行模型聚合。
(3) 模型聚合后,頭節點車輛將模型參數發送到路側單元進行緩存處理。
一般來說,由于道路上車輛的快速流動性和駕駛目的的不確定性,不同自動駕駛車輛收集的周邊手動駕駛車輛軌跡數據截然不同。通過評估并比較接收模型和車載模型的有效性,計算融合權重可以提升聚合模型效果,消除冗余用戶數據造成的模型過擬合問題。算法1給出了基于集群學習的模型訓練的全過程。

本節將介紹模擬設置,使用基于LSTM網絡的軌跡預測方法作為基線方案[15]進行對比,對模型的預測效果,模型收斂速度進行比較。使用32 GB內存,i7-10700的CPU硬件測試平臺,測試環境基于PyTorch3.9框架構建并在Ubuntu18.04系統中部署。自動駕駛車輛中的車載LSTM網絡模型能夠預測周圍環境中手動駕駛車輛在5 s內的軌跡。完整的模型參數如表1所示。LSTM網絡訓練過程中時間步長設置為10。使用Adam優化器作為神經網絡優化器。實驗涉及的算法源碼,以及相關訓練和測試數據文件已經開源至GitHub平臺。

表1 算法和環境參數
對于車聯網中的集群學習,實驗模擬定義了兩種交通流密度:高交通流密度和低交通流密度。自動駕駛車輛數為16輛和5輛。使用NGSIM數據集驗證SLTP算法的有效性。美國聯邦公路管理局使用視頻中目標檢測的方式捕捉真實世界的交通信息制作NGSIM數據集,包括車輛速度、位置、加速度、車道等。作為高分辨率的真實世界車輛軌跡數據,NGSIM廣泛用于探索軌跡預測過程的特征,并校準和驗證軌跡預測模型[16]。
目前還沒有集群學習框架在車聯網場景中的應用,對比方案使用基于LSTM網絡對車輛進行軌跡預測的方法[15],以更好地評估SLTP算法的性能,實驗中的軌跡預測誤差結果和模型Loss函數下降曲線如圖2和圖3所示。

圖2 軌跡預測誤差Fig.2 Trajectory Prediction Error

圖3 模型Loss函數下降曲線Fig.3 Descending curve of Model Loss function
為了驗證軌跡預測的準確性,實驗設置了智能體數量為5,16的2種情況,來展示集群軌跡預測算法在不同智能體數目情況下的性能,為了進行相互比較,開展了2組對照訓練實驗。圖2是訓練過程中軌跡預測誤差值情況,具體的實驗數據如表2所示。從實驗結果來看,隨著智能體數量增加,SLTP算法可以表現出更好的性能,而LSTM網絡的軌跡預測方法隨著自動駕駛車輛數目的增加面對的大量冗余數據,模型收斂速度較慢,出現預測結果精度不高的情況。綜上,體現了SLTP算法在軌跡預測準確性方面更具有優越性。
對于模型的收斂速度,實驗同樣使用上述兩種交通流密度進行試驗,以展示集群軌跡預測算法在不同智能體數目的情況下模型的收斂速度,圖3展示的Loss值的變化情況,具體的實驗數據如表2所示。從實驗結果來看,隨著智能體數量增加,SLTP算法可以有更快的收斂速度,這是因為通過文中提出的基于Beta概率函數的權重預測算法,對于效果不好的模型在集群模型聚合過程中給予更小的權重以抵消冗余經驗數據的影響,從而實現同樣計算開銷情況下模型更快地收斂。綜上,體現了SLTP算法在模型收斂速度上更具有優越性。

表2 綜合預測性能數據
本文基于LSTM網絡針對城市道路的混合交通場景提出了一種SLTP算法。自動駕駛車輛之間通過去中心化的集群學習保障用戶數據安全。此外,為了解決車聯網場景中的高移動性和數據冗余的問題,設計了模型聚合過程中的可信度權重預測算法,使得LSTM模型能夠更快收斂。仿真結果表明,與基于LSTM網絡對軌跡預測的方法相比,SLTP算法在同樣的訓練時間和通信開銷內能夠擁有更高的模型預測準確性和魯棒性。未來的工作中將擴大集群學習實驗規模,驗證所提出算法在車聯網場景中存在蓄意攻擊車輛的情況下如何保護車輛隱私數據。