邱昱 陳彩霞
摘要:自動駕駛汽車的預測模塊基于歷史及當前環境狀態,預測附近交通參與者的未來狀態,以降低風險,減小傷害。本文簡要介紹了自動駕駛領域預測算法的重要性、問題定義與各種類型。對于預測算法的兩個大類:基于模型的方法和數據驅動的方法,本文對各類具體算法的意義、相關參數、區別與優缺點等進行了簡要介紹。
關鍵詞:自動駕駛,預測算法,卷積神經網絡,循環神經網絡,變形器,圖神經網絡
引言
近年來,智能駕駛技術發展迅速,安全是重中之重。一方面,安全性是智能駕駛和自動駕駛技術的基石;另一方面,人們期望未來自動駕駛汽車的應用可以降低道路事故發生率,提高道路安全【1】。安全,也就意味著事前盡量降低相關交通參與者遭受傷害的可能性與嚴重度。要實現這一點,對交通參與者的預測就極為必要。
問題定義
要執行自動駕駛預測任務,前提條件是能夠得到安裝在自動駕駛汽車上激光雷達、雷達或攝像頭等傳感器的實時數據流并且存在實時檢測和跟蹤交通參與者信息的系統。這些交通參與者的信息可以是邊界框、位置、速度、加速度、朝向角和朝向角變化率等。此外還需包括自車所行駛區域的地圖信息,如道路和人行橫道的位置,車道方向。這些地圖信息可以用特定方式建模描述:如道路多邊形用來描述可通行區域、人行橫道多邊形描述用于行人橫穿的道路區域、車道信息描述行駛路徑。
未來軌跡是過去軌跡的后續,那么預測就是基于對過去軌跡的觀測提供未來軌跡合理的可能輸出【2】。如果對于第 個交通參與者在觀測時刻 的歷史軌跡,我們用 來表示,其中 , 表示觀測序列中的當前時間,則第 個交通參與者的歷史軌跡是一個序列 。所有交通參與者的未來軌跡則可以表示為 。
算法介紹
目前,對于軌跡預測的方法,主要分為基于模型和數據驅動的方法兩大類【3】。
基于模型的方法
基于模型的方法假設交通參與者按照某種預先定義好的模式運動,根據觀測到的歷史信息計算模型參數,并進一步預測交通參與者未來的軌跡?;谀P偷姆椒ㄓ挚梢约毞譃椋夯谖锢硖卣鞯哪P汀⒒谛蛄袆幼鞯哪P秃突诮换ビX察的模型【4】。
基于物理特征的模型
基于物理特征的模型將車輛視作遵守物理規則的運動實體,基于控制輸入、車輛參數與外部狀態等對其未來運動進行預測。又可分為基于動力學的模型和基于運動學的模型【5】。
基于動力學的模型要考慮車輛的動力學特征,模型復雜且必要性不高,較少應用。
基于運動學的模型不考慮影響運動的力,基于運動參數(如位置、速度和加速度)間的數學關系描述車輛的運動。包含恒速模型、恒加速度模型、定轉彎速率恒速模型和定轉彎速率恒加速模型等。
基于物理特征的模型可通過不同方法用于軌跡預測:如單軌跡模擬、高斯噪聲模擬和蒙特卡羅模擬。
單軌跡模擬方法直接將模型應用于車輛的當前狀態,計算未來軌跡。其優點是計算效率高。缺點是沒有考慮不確定情況及模型缺點,因此不適合做長期預測。
高斯噪聲模擬方法將車輛的不確定性描述為高斯模型,通過卡爾曼濾波器對車的狀態進行預測。較之單軌跡模擬方法,高斯噪聲模擬方法能表達預測軌跡的不確定性。
蒙特卡洛模擬方法,對模型輸入如速度、方向盤轉角進行隨機采樣,生成預測路徑,既可用于當前狀態完全確定的情況,也可用于當前狀態有不確定性的情況。
基于物理特征的模型依賴于運動的低層級特征,因此僅能用于短于1s的預測。特別是其缺乏對交通規則的理解,沒有和其它車輛的交互,無法預測車輛任何運動狀態的變化。
基于序列動作的模型
基于序列動作的模型將車輛視作獨立的動作實體?;谛蛄袆幼髂P偷能壽E預測基于對駕駛員傾向執行的動作的先期識別,預估與其匹配的車輛其未來運動。較之基于物理特征的模型,基于序列動作模型預測的軌跡更準確可靠。
基于序列動作的模型有兩種軌跡預測方法:原型軌跡和動作意圖估計。
原型軌跡方法中,車的軌跡可以劃分為一系列的簇,每一簇對應一個典型的運動模式。運動模式采用訓練階段學習而來的原型軌跡進行表達。在預測階段,將車輛實際的待完成的部分軌跡與原型軌跡進行比較,取最相似的原型軌跡用于預測未來的運動。其缺點是對不同道路布局適應性不強。
基于意圖的模型主要是分為2部分,一是對意圖進行評估,然后再執行。其首先估計駕駛員的動作意圖,如停止線等待、跟車和左轉等,然后預測后續的相匹配的物理狀態。與原型軌跡相比,它不需要將部分軌跡與原型軌跡匹配,而只需要抽取高級特征用于識別動作,從而更容易在任意類型道路布局生成學習模型。
動作執行階段按匹配的動作將軌跡預測出來,其輸入為車輛狀態、道路信息和駕駛員行為等。常用方法有多層感知機、邏輯回歸、相關向量機、支持向量機和隱馬爾科夫模型等。它的輸出可以是判定式預測的一條軌跡,也可以是生成式提供的多條軌跡及其概率。
基于動作序列的模型假設車輛之間相互獨立運動,沒考慮車間交互的影響。而實際車輛是與其它車輛共享道路,一輛車的動作會影響其它車的動作。這種假設會導致對環境信息理解的錯誤,并影響風險評估。
基于交互覺察的模型
基于交互察覺的模型仍然采用動作序列實體,但將車間交互也進行建模。這使得其對車輛的行為有了更好的解釋,對情況有更好的理解并對風險有更可靠的評估。交互察覺模型通常是基于軌跡原型與動態貝葉斯網絡。
基于軌跡原型的交互察覺模型在訓練階段并不能將車間影響納入,但在匹配階段可通過假設駕駛員有避免碰撞的傾向納入車間的相互影響。
大多數交互察覺動作模型是基于動態貝葉斯網絡。多物體間的兩兩依賴關系可用耦合隱馬爾科夫模型建模。
基于交互覺察的模型比物理模型預測的時間更久,比基于意圖的預測更加穩定,計算多個汽車之間的關系計算量比較大,不適用實時風險評估。
數據驅動方法
這類方法通常指的就是深度學習方法,其使用大量數據訓練一個黑盒子模型(通常是一個神經網絡)。之后將訓練好的模型應用于觀測到的數據進行預測。模型訓練過程通常是離線計算,要消耗較多計算資源。而模型應用于預測時,則非??焖佟?/p>
深度學習方法應用于自動駕駛的預測時,通常是以多幀相關環境信息為輸入,目標交通參與者的未來行為、軌跡、軌跡概率等為輸出。主要有四大類方法:卷積神經網絡(Convolutional Neural Network,CNN)、循環神經網絡(Recurrent Neural Network,RNN)、變形器(Transformer)及圖神經網絡模型(Graph Neural Network,GNN)。
卷積神經網絡
卷積神經網絡被廣泛應用于提取圖片數據特征,并在計算機視覺領域取得了成功,也被應用于自動駕駛預測方面。有不同的卷積神經網絡模型應用于預測環境車輛的意圖、提取相關性特征、輸出圖形上未來時刻的占據情況和預測車輛軌跡等。但卷積神經網絡受限于其卷積核感受野,長距離特征提取能力一般,影響了其應用于預測的效果。
循環神經網絡
較之卷積神經網絡,循環神經網絡具有較好的長距離特征捕獲能力?;镜难h神經網絡能逼近任何序列對的映射【6】。但由于梯度消失或爆炸,難以學習到長序列。門控循環神經網絡被引進用于解決這個問題【7】。長短期記憶網絡(Long short-term memory,LSTM)和門控循環單元 (Gated recurrent unit, GRU)是最常用的門控循環神經網絡。在車輛行為預測方面,長短期記憶網絡是常用的深度模型。循環神經網絡擅長處理序列輸入,但并行計算能力較差,限制了其在預測領域的應用。
變形器
與卷積神經網絡及循環神經網絡相比,變形器 (Transformer)并行計算能力與卷積神經網絡差不多強,長距離特征捕獲能力與循環神經網絡差不多強,而語義特征提取能力和任務綜合特征抽取能力顯著強于卷積神經網絡與循環神經網絡。其基于注意力(attention)機制,采用編碼器-解碼器(Encoder-Decoder)框架。最近,其在自動駕駛預測領域的應用較之卷積神經網絡、循環神經網絡有明顯的性能提升,取得了較好的成果。
圖神經網絡
圖神經網絡的基本思想是基于節點的局部鄰近信息通過神經網絡來聚合每個節點及其周圍節點的信息。常用的圖神經網絡有圖卷積神經網絡(Graph Convolutional Network, GCN)與圖注意力神經網絡(Graph Attention Network, GAT),分別是將圖模型與卷積神經網絡及注意力模型相結合。圖神經網絡可以用節點表示汽車,節點間的連線(邊)表示車輛間的關系,適合于包含車間交互信息的預測。近兩年,圖神經網絡發展迅速,其應用于自動駕駛預測領域也取得了較好的效果。
總結
整體來看,自動駕駛預測算法中,數據驅動方法性能優于基于模型的方法。但目前,自動駕駛預測領域還沒有形成統一的評估指標、接口定義和框架結構,各個方向都有相關探索,其中,變形器(transformer)和圖神經網絡(Graph Neural Network)近期性能表現較好。
參考文獻:
[1] “Research on the impacts of connected and autonomousvehicles(cavs) on traffic flow: Summary report,” UK Departmentfor Transport, Tech. Rep., May 2016. [Online].
Available:https://assets:publishing:service:gov:uk/government/uploads/system/uploads/attachment data/file/530091/impacts-of-connected-andautonomous-vehicles-on-traffic-flow-summary-report:pdf
[2] LEE, N., CHOI, W., VERNAZA, P., CHOY, C. B., TORR, P. H. S., AND CHANDRAKER,M. K. DESIRE: distant future prediction in dynamic scenes with interacting agents. CoRRabs/1704.04394 (2017).
[3] SINGH, A. Prediction in autonomous vehicle - all you need to know, 2018.
[4] LEFèVRE, S., VASQUEZ, D., AND LAUGIER, C. A survey on motion prediction and risk assessment for intelligent vehicles. Robomech Journal (2014).
[5] Lefèvre, S., Vasquez, D. & Laugier, C. A survey on motion prediction and risk assessment for intelligent vehicles. Robomech J 1, 1 (2014). https://doi.org/10.1186/s40648-014-0001-z
[6] B. Hammer, “On the approximation capability of recurrent neuralnetworks,” Neurocomputing, vol. 31, no. 1-4, pp. 107–123, 2000.
[7] A. Graves, Long Short-Term Memory. Berlin, Heidelberg: SpringerBerlin Heidelberg, 2012, pp. 37–45. [Online]. Available: https://doi:org/10:1007/978-3-642-24797-2 4
基金項目:國家重點研發計劃資助(2018YFB1802405)