楊 威, 周義棚
(上海工程技術大學機械與汽車工程學院, 上海 201620)
現如今,研究可知大多數情況下,在車輛超車或變道避障的過程中更可能發生事故[1]。 對于自動駕駛汽車來說,為了保障道路中的安全高效行駛,自動駕駛汽車就必須了解周圍車輛的意圖,再基于此來調整自身行為。 通常,有經驗的駕駛員就可以判斷出未來幾秒鐘周圍車輛的運動。 但當前大多數高級駕駛輔助系統(ADAS) 卻仍無法進行此類預測[2]。 隨著大數據的發展,越來越多的研究者正嘗試從歷史軌跡數據入手來對車輛軌跡進行預測。 在各類研究中,最常見到的就是基于循環神經網絡(RNN)的車輛軌跡預測,這也是該領域的基礎研究課題。 遞歸神經網絡(RNN)具有根據反饋連接節點存儲擴展時間間隔的歷史信息的能力,可以訓練并應用于預測[3]。 然而傳統RNN 的梯度消失及梯度爆炸問題限制了其應用和發展,LSTM 網絡的出現很好地解決了這一問題[4]。 Wang 等學者[5]使用High D 數據集對長短時記憶(LSTM)網絡進行訓練用于預測周圍車輛的軌跡。 根據周圍車輛的預測軌跡信息,提出了基于風險評估和風險緩解的路徑規劃算法。 黃玲等學者[6]為了提升網絡模型的遷移性,引入道路橫向偏移量信息,可將LSTM-LC 模型精度和遷移性提升約10%。 黃蘊麒[7]將歷史軌跡中的特征信息速度差、車頭時距引入到LSTM 網絡模型中,能夠明顯增強軌跡預測的效果,并對加入不同車輛狀態信息的網絡模型進行對比。 曾德全等學者[8]在LSTM 網絡輸出中加入混合密度層,使用Softmax函數計算概率分布來表示車輛未來位置,而非僅僅預測一條確定的軌跡,以提高預測結果的可靠性和模型的魯棒性。
對于車輛換道軌跡擬合,現有模型主要包括樣條插值模型[8]、多次多項式模型[9]、正余弦模型[10]等。 由此取得的研究成果有:張穎達等學者[11]通過NGSIM 數據集對換道數據進行提取,分析換道行為的圍觀特征,并使用多項式對軌跡進行擬合,得出車輛換道橫向軌跡由5 次多項式擬合效果最佳。 Zeng等學者[12]應用了含參數的三次B 樣條曲線規劃換道軌跡,基于提前選定的控制點,考慮與周邊車輛的防碰撞約束,規劃出曲率連續的軌跡。 黃晶等學者[13]通過問卷調查的方式得到駕駛風格的數據,通過建立不同風格駕駛人的行車安全區域,進而使用五次多項式規劃出適應駕駛人風格的換道軌跡。 趙樹恩等學者[14]提出遺傳算法-BP 神經網絡理論對換道終止時刻及目標位置進行預測,六次多項式用于描述車輛換道軌跡簇,運用鯨魚優化算法對軌跡簇進行優化,從而得到最優路徑。
上述研究大多依賴于NGSIM 數據集來進行預測,但數據集存在噪聲干擾、換道數據缺失或車輛ID 重復使用等問題,所以本文對于換道數據的提取規則進行改進,對其提取出的數據進行平滑處理,避免路徑出現尖峰等現象。 同時,利用LSTM 網絡模型對變道終點位置進行預測。 根據預測終點的結果,圍繞其生成多個等間距的點,使用準均勻三次B樣條曲線來對變道的軌跡進行擬合,最后綜合考慮變道安全性及舒適性選取最優變道路徑。
本文預測的數據集采用美國高速公路行車NGSIM 數據集,包括US-101 在內的道路上所有途徑的車輛在一個時間段內的行駛狀態。 通過7 個不同位置的攝像頭獲取到數據集,然后利用軟件加工成軌跡點進行記錄。 本文選取US-101 路段的數據集作為預測軌跡的研究數據,US-101 高速公路研究區域長640 m,包括5 條主車道及1 個出入口。本文只考慮主車道上的換道軌跡數據,即車道標號1~5 的數據。 研究區域及道路如圖1 所示。

圖1 數據研究區域Fig. 1 Data study area
由于NGSIM 數據集中會存在車輛的ID 被重復使用的情況,所以用同一車輛ID 的全局時間作為索引建立切割列表,而后對同一車輛的數據按列表進行切割,由此判斷每一輛車是否產生了變道的行為。同時,車輛存在連續多次變道行為及變道前后產生波動,難以識別其單次變道的起點和終點,如圖2 所示。 影響換道軌跡數據的有車道線位置附近的波動導致換道起點識別錯誤、識別起點與實際起點不一致、變道終點難以識別等問題。 所以根據本文需要的數據重新定義變道規則為:

圖2 車輛軌跡圖Fig. 2 Vehicle trajectory diagram
(1)在一定時間內只進行一次向快車道變道,不存在連續多次變道的情況。
(2)96.8%的車輛換道的持續時間在10 s 以內,所以本文對車輛的變道時間進行篩選,取變道點前后5 s 左右時間內的數據為完整的單次換道數據,整個換道過程時間在10 s 左右,包含100 條軌跡數據。
(3)變道路徑的起點、終點位置都在陰影中,對此可表示為:
其中,x1、x2分別表示在車道ID 改變前后時刻車輛的橫向位置;為2 條車道的分界線;xs與xe分別為換道起終點的橫向位置;l為車道寬度。 車輛換道起終點位置約束如圖3 所示。

圖3 車輛換道起終點位置約束圖Fig. 3 Restriction diagram of starting and ending positions of vehicle lane changing
(4)考慮到實際駕駛的舒適性,對變道過程的最大橫向加速度約束可用如下公式進行描述:
其中,af為變道實際終點位置的加速度,as為變道實際開始位置的加速度。
同時,原始數據由視頻處理軟件獲取會存在系統誤差和檢測誤差,導致符合變道規則的路徑會出現尖峰、平滑性較差。 為獲取符合正常運行車輛的參數,采用指數加權移動平均(EWMA)對軌跡數據的橫縱坐標進行平滑處理,即:
其中,為換道車輛在t時刻的擬合值;a為權重系數;xt為t時刻的真實值。 綜上得到的變道數據為有效樣本數據。 車輛軌跡平滑處理如圖4 所示。

圖4 車輛軌跡平滑處理圖Fig. 4 Vehicle path smoothing diagram
車輛軌跡預測問題本質上是根據車輛的歷史狀態來預估車輛未來的狀態。 輸入歷史時刻的車輛位置、速度、加速度等信息,輸出未來時刻的車輛狀態信息位置。 長短時記憶網絡(LSTM)模型可以解決RNN 模型在處理時間序列較長時容易出現梯度消失的問題。 本文選用LSTM 網絡模型對車輛換道的終點位置進行預測,基本結構如圖5 所示。 首先,遺忘門會讀取上一個產生的輸入Ht-1和當前時刻的輸入Xt,經過遺忘門后輸出Ft為:

圖5 LSTM 網絡結構示意圖Fig. 5 LSTM network structure diagram
其中,σ采用Sigmoid函數作為激活函數;Wf為權重矩陣;bf為偏置向量。 經過輸入層門后輸出It為:
接下來,tan 層會創建新的候選向量,將舊的向量ct-1更新為新的ct:
輸出門利用Sigmoid函數確定哪個部分的數據會被輸出,數學公式具體如下:
最終的輸出Ht為:
LSTM 網絡模型的評價指標選擇均方根誤差(RMSE),可用來衡量觀測值與真實值間的偏差,能更直觀地體現模型的誤差。 均方根誤差值越大,說明模型的誤差越大。RMSE可由如下公式來求值:
LSTM 網絡模型的參數設置如下:預測時間序列為10,迭代次數為500,學習率為0.001, 學習率下降系數取0.9,使用Adam 優化算法更新模型參數。 模型的評價指標為6.064 1,要好于文獻[7]中XY-LSTM 模型的7.701 66,提升約14.25%。 說明本文提出的換道軌跡數據篩選方法及平滑策略對軌跡預測有更好的效果。
車輛在變道過程中潛在的碰撞場景如圖6 所示,車輛1 為目標車道后車,車輛2 為本車道的前車,P1和P2分別為自主車輛與其他車輛的潛在臨界碰撞點,s1與s2分別表示在碰撞點時自主車輛的位置。 以車輛的運行方向為x軸,垂直方向為y軸,自主車輛變道起始時刻車輛前方平行于車道的位置為坐標原點建立坐標系。 同時,將車輛模型簡化為橢圓模型[15],以車輛中心為橢圓的原點,則長軸LX為:

圖6 換道安全區域圖Fig. 6 The diagram of lane change safety area
其中,v1為后車車速;v2為前車車速;Td為駕駛員風格因子,取常規0.5;在P1和P2碰撞點不發生碰撞的最小安全距離的計算公式見如下:
若車輛s的速度小于車輛2 的速度,隨著時間的增加,兩車的距離被不斷拉大,這時車輛s在換道過程中不會與前車2 發生碰撞。 只有當車輛s的速度小于車輛2 時,隨著換道過程時間的增加,兩車的相對距離縮小,當小于最小的換道安全距離時將會出現碰撞的現象。 所以認為此時的碰撞點為P2,碰撞時刻為tp2(ts <tp2<tf),則P2點的坐標(xp2,yp2) 表示為:
若目標車道后車車速過快,自主車輛在換道前未與后車保持足夠的安全距離,則換道會產生碰撞點P1,碰撞時刻為tp1(ts <tp1<tf),則P1點的坐標(xp1,yp1) 表示為:
根據式(11)~(15)即可求得換道車輛與當前車道前車及目標車道后車的潛在碰撞點的坐標,從而確定車輛換道安全域范圍。
軌跡的數學模型采用準均勻三次B 樣條曲線,保留了貝塞爾曲線在2 個端點處的性質:端點處的切線即為最后2 個端點的連線。 同時,曲線的次數越高,將會有很多零點存在,較多的導數零點會導致曲線存在較多的極值,使曲線出現較多的峰谷值。選擇三次B 樣條曲線生成幾何路徑,即用6 個控制點生成一個路徑片段,然后通過片段的拼接就可以實現從初始狀態到目標狀態的路徑規劃。 樣條曲線控制點如圖7 所示。 由圖7 可知,P0點為規劃的起始點,定義為P5為預測得到的換道終止點為在變道避障過程中,第一個控制點及最后一個控制點是已知的,其余的控制點未知。 為了方便計算,假設變道前后的路徑曲線滿足中心對稱,P1點與P4點分別在中點處。 在變道的起點與終點處車輛的航向角始終與車道的中心線平行。 那么有P0,P2與P3,P5的連線均為直線且大小為L。所以全部的控制點可得出:

圖7 樣條曲線控制點Fig. 7 Spline control points
由于不同的駕駛員有不同的駕駛習慣會導致在實際行車中變道時間長短及變道路徑長度的不同,這部分問題是神經網絡模型無法預測的。 所以根據預測終點的結果,圍繞預測終點生成多個等間距的點作為軌跡簇的終點,同時對L的大小進行約束,使控制點的自由度降為2,就可以得到一系列變道的曲線簇。 這里涉及用到的數學公式為:
其中,Δx表示自主車輛與前車的距離;tL表示車輛走過L所用的時間;Ls表示縱向安全距離。
綜合考慮舒適性及安全性選擇一條最優路徑作為變道的最終路徑。 在最優路徑點篩選上選擇線性加權法、即多目標轉單目標的方法。 總代價函數表示為:
其中,wc和ws分別為舒適性和變道效率的代價函數權重值;fc(i) 為第i條路徑的舒適度代價函數;fs(i) 為第i條路徑的安全性的代價函數。
將換道起點與終點處自主車輛與前后車的距離作為安全性的代價函數,距離越大、越不容易發生碰撞,安全性越好。 因為代價函數需要最小的代價,所以取倒數作為安全性的代價函數:
路徑的舒適性也是路徑規劃的重要代價指標之一。 路徑曲率過大不僅會降低乘坐舒適性,也會增加路徑跟蹤控制的難度,進而導致車輛行駛穩定性下降。 由于曲率與路徑的平滑性高度相關,路徑的曲率變化越小,則路徑越平滑;反之,曲率變化越大,則路徑變化越劇烈。 所以,影響舒適性的因素主要是路徑的平滑性,規劃的軌跡越平滑,相應地、舒適性就好。 舒適性代價函數的數學定義式為:
同時,為了平衡安全性與舒適性之間的數量級差異,需要分別對其進行標準化處理,數學計算公式具體如下:
其中,fn(i) 為安全性或舒適性的代價函數,maxfn為所有路徑中代價函數最大的代價值。
為了驗證所提出規劃方法的可行性,利用Carsim 與Matlab 聯合仿真對所提出的路徑規劃算法進行仿真驗證。 同時,采用基于預瞄點的滑模控制算法對規劃的軌跡進行跟蹤驗證,仿真場景為同向雙車道,自主車輛距本車道前車的距離為60 m,距目標車道車輛距離為20 m。 車輛及其他參數見表1。

表1 仿真參數Tab. 1 Simulation parameters
根據2.1 節劃分的變道安全區域,碰撞時刻tp1和tp2分別為5.88 s 與9 s,由式(11)可得出長軸LX為2.979 5 m,碰撞點P1的坐標可由式(12) 和式(15) 得出為(44.78,5.1),碰撞點P2的坐標通過式(13)、式(14) 得到,得到的結果值為(151.131 2,2.8)。
根據2.2 節軌跡的數學模型可以得到預測路徑的換道中心點為(149,4),在所定義的換道安全區間內,與前后車都不會產生碰撞,也就是說根據預測的終點位置及約束生成6 條具有不同終點位置的變道路徑都是無碰撞的路徑,變道路徑規劃起點的橫坐標為104 m,預測到的路徑終點橫坐標為192 m,向預測終點前后各取等距離的間隔長度作為其余路徑的終點如圖8 所示。 所有變道路徑的安全性及舒適性的代價圖如圖9 所示,代價值最小的為第一條路徑0.96,最大的為第6 條路徑、0.999 3,代價值最小的第1 條路徑即為變道的最優路徑。 采用基于預瞄點的滑模控制算法對最優路徑進行跟蹤如圖10所示,在變道的起點及終點處跟蹤誤差較大,橫向跟蹤誤差最大為0.1 m,發生在變道完成、即將直行的時刻。 仿真結果表明,規劃的算法在安全區域內可以為自主車輛提供一條無碰撞的最優路徑。

圖8 不同終點變道路徑圖Fig. 8 Path diagram of lane change at different end points

圖9 路徑代價圖Fig. 9 Path cost diagram

圖10 最優路徑跟蹤Fig. 10 Optimal path tracking
本文使用LSTM 網絡對換道終點位置進行預測。 首先,通過NGSIM 數據集對單次換道數據的提取進行重新定義。 其次,對于部分軌跡存在的尖峰及波動等現象,采用指數加權移動平均(EWMA)對軌跡數據的橫縱坐標進行平滑處理,使得網絡模型的精度提高了14.25%。 建立了行車的安全區域模型,分析與前后車發生碰撞點的坐標及不發生碰撞的最小安全距離,同時對預測結果進行驗證。 最后,使用樣條曲線對軌跡進行擬合,在安全性與舒適性的評價指標下綜合篩選出最優路徑。 仿真結果表明本文所提出的路徑規劃方法可以為自主車輛提供安全無碰撞的最優路徑。