孫博華,鄧偉文,朱 冰,吳 堅,王姍姍
(吉林大學 汽車仿真與控制國家重點實驗室, 長春 130022)
當無人駕駛智能汽車在結構化道路上行駛時,交通車輛運動意圖不確定性作為交通環境主要不確定源之一,對控制系統決策規劃提出了巨大挑戰,已成為影響智能汽車安全性的重要問題。因此,日益受到各國學者的廣泛關注[1-3]。
目前典型的車輛運動意圖辨識方法,主要在彎道、直線或坡道等特定工況下,通過辨識車輛的轉向、油門、制動等操縱意圖,來表征車輛的運動意圖,如基于多維高斯的轉向意圖辨識方法[4]、基于Hilbert-Huang的制動意圖辨識方法[5]和基于雙層隱馬爾科夫的轉向加速意圖辨識[6]等。上述方法在解決交通車輛運動意圖不確定性辨識問題時,會出現由于各種道路拓撲結構下車輛耦合區域數量趨于無限大,導致交通車輛運動意圖辨識模型無上界的問題,使得辨識模型精度不足,模型普適性和模型規模可控性較差,在部分工況下甚至無法為智能汽車控制系統提供有效解[7]。
本文提出一種基于反應式行為的車輛運動意圖辨識策略。通過對車輛運動意圖進行描述與分類,建立基于多維高斯隱馬爾科夫過程的反應式車輛運動意圖模型;搭建車輛運動意圖信息采集系統,分別在T形路、環島、直線路3種典型工況下進行數據采集;利用采集數據對反應式車輛運動意圖模型進行訓練和辨識測試,并通過正交試驗對模型關鍵參數進行優化。該方法辨識過程不依賴于特定工況,可在全工況條件下為智能汽車決策與規劃提供準確、可靠的交通車輛運動意圖信息,辨識方法具有普適性和規??煽匦浴?/p>
傳統的車輛運動意圖辨識策略將車輛的運動意圖定義為車輛運動意圖子模型的集合:
Im={i1,i2,…,im}
(1)
式中:Im為車輛運動意圖子模型集合,下角標m代表車輛運動意圖子模型數目。
每一個子模型分別對應一個車輛的隱目的地:
Hg={h1,h2,…,hg}
(2)
式中:Hg為車輛運動隱目的地集合,下角標g代表在主車與交通車輛的特定行為耦合區域中,交通車輛運動隱目的地數目。
設在全部道路拓撲結構上主車與交通車輛產生行為耦合的區域集合為:
RA,j={RA,k,k=1,2,…,j}
(3)
式中:RA,k為行為耦合區域集合,下角標k代表行為耦合區域數目。則主車與交通車輛在任意RA,k上,均對應一組交通車輛的隱目的地集合,記為RA,k→Hg,k。
可得所有道路拓撲結構上交通車輛的運動意圖模型集合為:
(4)
顯然,在所有道路拓撲結構上,主車與交通車輛行為耦合區域的個數j趨近于無窮,則RA,j是無上界變量,對應Hg,k→,即當j→時,Im→。傳統車輛運動意圖辨識模型會出現隨耦合區域數量的增加而無限延展的情況。
為提高辨識模型的普適性和模型規模的可控性,本文通過判斷RA,j集合中交通車輛的反應行為建立車輛運動意圖模型。如圖1所示,當主車和交通車輛沿T形路行駛時,交通車輛會受到主車運動態勢的影響,產生避讓、猶豫、保持等反應行為,可以通過辨識這些反應行為來辨識交通車輛的運動意圖。
在空間演化上,主車與交通車輛的運動均可看作其在特定道路拓撲結構上的平面運動,即存在縱向和側向兩個方向的相對運動意圖;在時間演化上,交通車輛的反應行為可以看作是本車狀態s0及其與主車相對狀態ds0相互作用的響應結果。
因此,交通車輛的運動意圖可以表示為:
Im={Ilon,Ilat}=
{f(s0,lon,ds0,lon),f(s0,lat,ds0,lat)}
(5)
式中:Ilon和Ilat分別為交通車輛的縱向和側向運動意圖集合。
由于s0與ds0均不受道路拓撲結構約束,所以總可以找到一個有界的反應式運動意圖集合建立車輛運動意圖模型。這種通過辨識交通車輛的反應來描述車輛運動意圖的方式更具有普適性。
在任意道路拓撲結構行為耦合區域RA,k中,在主車刺激作用下,交通車輛會通過感知、推理和判斷等內在狀態產生外在反應式運動意圖,通過聚類,交通車輛的縱向和側向反應行為意圖均可以歸納為:
(1)漸遠意圖:交通車輛的運動意圖受到主車影響,產生躲避主車的反應行為。
(2)猶豫意圖:交通車輛的運動意圖受到主車影響,產生猶豫判斷和動態微調的反應行為。
(3)保持意圖:交通車輛的運動意圖不受主車影響,保持運動趨勢不變的反應行為。
(4)漸近意圖:交通車輛的運動意圖受到主車影響,產生具有侵略性的漸近反應行為,試圖對主車運動進行抑制。
因此,反應式車輛運動意圖可以表示為:
(6)
式中:下角標FA、HT、NM、CI分別代表漸遠、猶豫、保持和漸近運動意圖。
交通車輛在特定運動意圖下的自身狀態s0及與主車的相對狀態ds0為一組時間連續的觀測序列,且具有影響下一時刻內在狀態的作用,故可以采用隱馬爾科夫過程(Hidden Markov process, HMP)對交通車輛的反應式運動意圖進行辨識。
本文采用多維高斯模型表示觀察量的概率密度函數[8],應用多維高斯隱馬爾科夫過程(Multi-dimension Gaussian hidden Markov process, MGHMP)建立反應式車輛運動意圖模型(Reaction motion intention model, RMIM),如圖2所示。

圖2反應式車輛運動意圖模型
Fig.2Reactionmotionintentionmodelofobstaclevehicle
模型包含車輛縱向反應行為運動意圖RMIMlon,r和側向反應行為運動意圖RMIMlat,s兩個模塊,其中下角標r=1,2,3,4;s=1,2,3,4分別代表縱向和側向的漸遠、猶豫、保持和漸近等4個運動意圖子模型,每一個交通車輛運動意圖子模型均等價于一個MGHMP。
RMIM模型的輸入數據應能夠表達交通車輛反應式運動意圖的激勵特征,同時還應考慮數據維度對計算時間的影響。因此,車輛縱向反應行為運動意圖模塊選取縱向速度Vx,縱向加速度Ax,縱向相對位移DDlon和縱向相對速度DVlon等4維輸入。車輛側向反應行為運動意圖模塊選取橫擺角速度AVz,側向速度Vy,側向加速度Ay,側向相對位移DDlat和側向相對速度DVlat等5維輸入。
RMIM模型中的各個子模型均等價于MGHMP過程。MGHMP過程包含一組N維隱狀態qt及每一狀態下κ組可能的觀察值輸出[9]。RMIM模型精度隨MGHMP階數的增加而提高,但階數過高會大大降低計算速度。考慮到主車與交通車輛運動模式的時間序列,其下一時刻的運動狀態主要受到上一時刻運動狀態的影響,故RMIM子模型采用從左至右結構的一階馬爾科夫過程。
初始狀態分布定義為:
π={πi}
(7)
其中:
πi=P[q1=i]
(8)
1≤i≤N
狀態轉移概率矩陣定義為:
A={aij}
(9)
其中:
aij=P[qt+1=j|qt=i]
(10)
1≤i,j≤N
式中:qt表示t時刻的狀態。
O為一組可觀測序列集合,O={V1,V2,…,Vκ},V代表可能的觀察值,下角標κ為每一狀態對應的可能觀察值數目。
設狀態j的觀察概率矩陣為B={bj(O)},由于在連續觀測序列中κ→+,故B={bj(O)}為狀態j輸出的觀察值概率密度函數[4],表達式如下:
(11)
1≤j≤N
式中:cjk為第j個狀態第k次混合的混合權重系數;M表示高斯混合數;N(O|μjk,Σjk)表示均值為μ、協方差為Σ的高斯分布概率密度函數。
權重系數cjk滿足:
(12)
cjk≥0,1≤j≤N,1≤k≤M

(13)
1≤j≤N
故RMIM的子模型可以由N個隱狀態通過一個元組λ定義:
λ=(π,A,c,μ,Σ)
(14)
辨識過程中,RMIM子模型分別輸出交通車輛反應式運動意圖模型概率,采用對數似然率表示所得結果:
Loglik(θ)=ln[P(O|λ)]
(15)
分別選取縱、側向子模型中最大似然函數值對應的反應行為意圖作為當前時刻交通車輛的縱、側向運動意圖。
為采集用于反應式車輛運動意圖模型訓練的數據,同時保證試驗的可操作性和可重復性,基于dSPACE Simulator實時仿真系統和PanoSim汽車智能駕駛仿真平臺建立了駕駛人在環車輛運動意圖數據采集系統,原理如圖3所示[10]。

圖3 車輛運動意圖數據采集系統Fig.3 Data acquisition platform for vehiclemotion intention
PanoSim汽車智能駕駛仿真平臺是本團隊自主研發的集車輛動力學、三維行駛環境、交通和車載環境傳感模型等于一體的大型汽車模擬仿真軟件平臺,具有試驗設置主界面、車輛編輯器、場景編輯器、相機雷達安裝器、畫圖與動畫工具和模型自動生成工具等6大功能模塊,可實現高精度的車輛動力學模擬、道路與場景模擬、交通車輛模擬、雷達與相機模擬、無線通信模擬、天氣模擬等,可簡便、直觀地構建交通場景,并能提供各種視角的動畫顯示,支持純軟件仿真、硬件在環仿真和駕駛員在環仿真,便于進行車輛運動意圖數據采集。
選用dSPACE DS1006系統作為實時仿真模型處理器,并實時接收由真實油門踏板、制動踏板和SensoWheel力矩方向盤輸入的真實駕駛員操縱信息,據此實時運行PanoSim軟件模型,可以得到交通車輛狀態信息以及與主車的相對狀態信息。
綜合考慮道路拓撲結構的多樣性、主車和交通車輛空間相對位置等因素,選取道路軸線夾角α為銳角的T形路、環島、α角為零的直線路等3種典型工況進行車輛運動意圖數據采集試驗,如圖4所示。試驗時,在PanoSim軟件中預先設定工況環境,令主車采用恒定速度沿圖4中實線路徑行駛。

圖4 車輛運動意圖數據采集工況Fig.4 Test scenarios for vehicle motionintention data collection
選取5名駕齡為2~8年的駕駛員進行車輛運動意圖數據采集,每名駕駛員在圖4所示的3種典型工況下分別完成主車與交通車輛行為互不影響和主車與交通車輛行為相互影響兩種情況的駕駛,如圖4中虛線所示,每種工況分別測試10次。記錄RMIM模型所需的本車狀態信息以及與主車相對狀態信息,共計得到300組數據樣本。
所采數據量綱不同會導致數值數量級存在較大差異,易影響RMIM模型訓練時參數矩陣的非奇異性,故將各輸入參數進行歸一化處理,在直線路、環島和T形路下分別選取典型數據,如圖5所示。


圖5 典型的歸一化后的試驗采集數據Fig.5 Normalized input data of the test data
反應式車輛運動意圖模型訓練及辨識流程如圖6所示。

圖6 RMIM模型訓練及辨識流程圖Fig.6 Training and identification processfor RMIM model
采用Baum-Welch方法[11]對RMIM模型進行訓練,獲取交通車輛縱、側向運動意圖模型參數。用于訓練的樣本數共180組,為采集數據量的3/5。訓練時,首先將試驗數據進行篩選和分類,交通車輛縱向和側向反應行為意圖分類原則如表1所示,其中,當1.9 s內模型中縱、側向加速度的波形出現至少兩次周期性變化時被視為小波動情況。由表1可見,交通車輛運動意圖的分類與道路拓撲結構及特定道路拓撲結構下的任意行為耦合區域均無關,僅與當前時刻交通車輛狀態及主車與交通車輛相對狀態有關。

表1 模型訓練數據分類原則Table 1 Classification principles of model training data
給定模型的隱狀態維數、訓練時間長度和高斯混合數,對交通車輛的縱、側向運動意圖分別進行訓練,即可得到RMIM各子模型對應的模型參數:
λlon,r=(πr,Ar,cr,μr,Σr)
(16)
r=1,2,3,4
λlat,s=(πs,As,cs,μs,Σs)
(17)
s=1,2,3,4
利用訓練得到的模型參數,采用滾動時間窗方法進行交通車輛運動意圖的辨識。將辨識數據輸入RMIM模型,分別計算各子模型對數似然率,選取當前窗口縱、側向子模型中最大似然函數值對應的反應行為意圖作為當前時刻交通車輛的縱、側向運動意圖。將每次窗體計算的結果與實際情況進行對比,累加所有正確的窗體數,即可得出辨識準確率。
模型辨識過程中,多維高斯混合數M、MGHMP過程對應的隱狀態維數N、模型訓練時間長度以及辨識時采用的滾動窗體長度是影響辨識結果的4個主要因素,采用正交試驗方法對這4個因素進行優化分析,建立L9(34)標準正交表,如表2所示。

表2 正交試驗因素水平表Table 2 Factor level table of orthogonal experiment

(18)
由正交試驗結果可知,在交通車輛縱側向運動意圖的辨識結果中,主次因素順序均為A、B、C、D;分別選擇縱向辨識情況下的A3B3C2D1組合,及側向辨識時情況下的A3B3C3D3組合時,車輛運動意圖辨識準確率最高。綜上可知,A和B的最優組合均為A3B3組合;作為次要因素的C和D,其最優組合應為訓練時間C大于窗體長度D的組合,選擇C2D1或C3D3組合均可,最終選擇A3B3C2D1作為交通車輛縱側向運動意圖辨識的正交優化參數組合。

表3 縱向運動意圖辨識結果Table 3 Longitudinal motion intention identification results

表4 側向運動意圖辨識結果Table 4 Lateral motion intention identification results
利用選定的參數組合,對T形路工況交通車輛運動意圖進行辨識,場景如圖7所示,主車與交通車輛均沿T形路行駛,在T形路口后,交通車輛駛入主車車道并在主車前同向直線行駛,窗體滾動速度為0.1s/次。

圖7 T形路工況交通車輛運動意圖辨識場景Fig.7 Test scenario of obstacle vehicle motionintention identification in T-junction
交通車輛縱向運動意圖辨識結果如圖8所示。如圖8可見,開始的10個時間窗內,交通車輛沿T形路向前行駛,交通車輛與主車分別處在不同道路上,交通車輛呈現縱向保持運動意圖;在10~48個時間窗內,在T形路口交通車輛轉向并超過主車的過程中,交通車輛呈現縱向漸近運動意圖。當交通車輛超過主車后的48~230個時間窗內,交通車輛超過主車并依次呈現縱向漸遠、猶豫和保持運動意圖。經計算,該T形路工況下對應的交通車輛縱向運動意圖的辨識準確率為99.4%。



圖8 交通車輛縱向運動意圖辨識結果Fig.8 Identification results of obstacle vehiclelongitudinal motion intention
交通車輛側向運動意圖辨識結果如圖9所示。



圖9 交通車輛側向運動意圖辨識結果Fig.9 Identification results of obstacle vehiclelateral motion intention
由圖9可見,開始的10個時間窗內,交通車輛沿T形路向前行駛,交通車輛與主車分別處在不同道路上,交通車輛呈現側向漸近運動意圖。在10~48個時間窗內,在T形路口交通車輛轉向并超過主車的過程中,交通車輛呈現側向漸近和保持運動意圖,且以側向漸近反應運動意圖為主。當交通車輛超過主車后的48~230個時間窗內,交通車輛呈現側向漸遠運動意圖。經計算,該T形路工況下對應的交通車輛側向運動意圖的辨識準確率為99.5%。
綜上,基于RMIM模型的交通車輛運動意圖辨識方法不依賴于特定工況,可在較大距離范圍內為主車提供準確的交通車輛運動意圖信息,可有效提高智能汽車的安全性,該辨識方法具有普適性和規??煽匦?。
交通車輛運動意圖不確定性是交通環境的主要不確定源,對無人駕駛智能汽車的安全決策規劃提出了巨大挑戰。本文提出了一種基于反應式行為的車輛縱、側向運動意圖辨識策略,建立了基于多維高斯隱馬爾科夫過程的反應式車輛運動意圖模型,搭建了駕駛人在環的車輛運動意圖信息采集系統,分別在T形路、環島、直線路3種典型工況下進行了數據采集,利用采集的試驗數據對RMIM模型進行了訓練和辨識測試,通過正交試驗對模型關鍵參數進行了優化匹配分析。辨識結果表明,通過合理選擇參數組合,辨識準確率可以達到99%以上。同時,該方法辨識過程不依賴于特定工況,可在全工況條件下為智能汽車決策與規劃提供準確、可靠的交通車輛運動意圖信息,辨識方法具有普適性和規??煽匦?。
[1] Brechtel S, Gindele T, Dillmann R. Probabilistic decision making under uncertainty for autonomous driving using continuous pomdps[C]∥The 17th International IEEE Conference on Intelligent Transportation Systems (ITSC), IEEE, 2014: 392-399.
[2] Bai H, Cai S, Ye N, et al. Intention-aware online POMDP planning for autonomous driving in a crowd[C]∥The IEEE International Conference on Robotics and Automation (ICRA), Seattle,Washington, 2015: 454-460.
[3] Cai Shao-jun. Online pomdp planning for vehicle navigation in densely populated area[D]. Guangzhou: South China University of Technology, 2014 .
[4] 呂岸, 胡振程, 陳慧. 基于高斯混合隱馬爾科夫的高速公路超車行為辨識與分析[J]. 汽車工程, 2010, 32(7): 630-634.
Lv An, Hu Zhen-cheng, Chen Hui. Recognition and analysis on highway overtaking behavior based on Gaussian mixture-hidden Markov model [J]. Automotive Engineering, 2010, 32(7): 630-634.
[5] 唐先智, 王波, 楊樹軍, 等. 基于Hilbert-Huang變換的制動意圖聚類識別[J]. 汽車工程, 2016, 38(5): 580-586.
Tang Xian-zhi, Wang Bo, Yang Shu-jun, et al. Cluster identification of braking intention based on Hilbert-Huang transform [J]. Automotive Engineering, 2016, 38(5): 580-586.
[6] 王暢. 基于隱形馬爾科夫模型的駕駛員意圖辨識方法研究[D]. 長春: 吉林大學汽車工程學院, 2011.
Wang Chang. Research on driving intention identification based on hidden Markov model [D]. Changchun: College of Automotive Engineering, Jilin University, 2011.
[7] Urmson C, Anhalt J, Bagnell D, et al. Autonomous driving in urban environments: boss and the urban challenge [J]. Journal of Field Robotics, 2008, 25(8): 425-466.
[8] Rabiner Lawrence R. A tutorial on hidden Markov models and selected applications in speech recognition [J]. Proceeding of the IEEE, 1989, 77(2):257-286.
[9] Reynolds D A, Rose R C. Robust text-independent speaker identification using Gaussian mixture speaker models [J]. IEEE Transaction on Speech and Audio Processing, 1995, 3(1):72-83.
[10] 朱冰, 賈曉峰, 王御, 等. 基于雙dSPACE的汽車動力學集成控制快速原型試驗[J]. 吉林大學學報:工學版, 2016, 46(1): 8-14.
Zhu Bing, Jia Xiao-feng, Wang Yu, et al. Rapid prototype test for integrated vehicle dynamic control using tow dSPACE simulators [J]. Journal of Jilin University (Engineering and Technology Edition), 2016, 46(1): 8-14.
[11] Baum L E, Petrie T. Statistical inference for probabilistic functions of finite state Markov chains [J]. The Annals of Mathematical Statistics, 1966, 37: 1554-1563.