黑凱先, 曲大義, 郭海兵, 賈彥峰, 韓樂濰
(青島理工大學機械與汽車工程學院, 青島 266520)
智能網(wǎng)聯(lián)車和人工駕駛車交互滲透組成的新型混合車流中,行駛車輛具有獨立性、制約性和傳遞性;智能自動駕駛、網(wǎng)聯(lián)通信等技術使網(wǎng)聯(lián)汽車具備高精度感知、高速度通信和超快速反應的特性,相較于傳統(tǒng)人工駕駛車輛其感知和反應時間均大幅縮減。智能網(wǎng)聯(lián)技術一直是智能交通領域研究的重點。近幾年來,隨著城市污染、交通擁堵、交通事故等問題的日益凸顯,智能網(wǎng)聯(lián)技術的研究變得尤為重要。英國汽車工程師學會根據(jù)車輛智能程度,將智能車輛劃分為無自動化、駕駛支持、部分自動化、有條件自動化、高度自動化、完全自動化6個等級[1]。雖然對智能網(wǎng)聯(lián)自主車輛的研究從20世紀就已經(jīng)開始,其間也攻克了無數(shù)的難關,但是距真正完全自動化的自主車輛的普及還需要經(jīng)歷很長的研究實驗過程,人類駕駛的傳統(tǒng)車輛還是會存在。因此,在未來很長一段時間內,將會存在傳統(tǒng)人工駕駛車輛和智能網(wǎng)聯(lián)自動駕駛車輛并存的混合交通環(huán)境。智能網(wǎng)聯(lián)車輛行為研究尚需充分考慮信息實時可靠和駕駛輔助可控等要求更高的城市環(huán)境與交通場景。現(xiàn)有微觀車流模型體系中跟馳模型和換道模型的分離度較高,且換道場景中多車交互影響較為明顯,而多數(shù)模型參數(shù)反映的是單一駕駛員的行為特征;因此從微觀車輛間交互行為探討換道行為特性更符合內在特征規(guī)律。
智能網(wǎng)聯(lián)技術的研究目的和意義在于減少日常交通中因人為因素引起的事故,提高車輛在行駛過程中的效率。因此車輛之間的協(xié)作能力尤為重要,換道行為是車輛行駛過程中的基本行為,車輛在行駛過程中需要獲取更好的行駛環(huán)境產(chǎn)生換道的意圖從而進行換道。
隨著智能網(wǎng)聯(lián)技術的發(fā)展和普及,中外學者相繼建立了大量的車輛換道模型。其中Gipps[2]提出的基于間隙接受閾值的車輛換道模型為車輛換道的研究和發(fā)展開辟了道路。Peter[3]根據(jù)車輛換道時的相互作用將車輛的換道行為劃分為自由換道、強制換道和協(xié)作換道。Worrall等[4]根據(jù)車輛系統(tǒng)動力學對車輛的換道軌跡進行分析,將換道行為劃分為準備換道、執(zhí)行換道和持續(xù)換道3個階段:從車輛開始轉向至到達目標車道線為準備階段,至車輛整體穿過車道線為執(zhí)行階段,自車輛穿過車道線至車輛在目標車道上平穩(wěn)行駛為持續(xù)換道階段。Toledo等[5]將強制換道和自由換道統(tǒng)一考慮,建立了整合模型。Langar等[6]基于博弈論思想建立車輛的自適應巡航系統(tǒng)和換道系統(tǒng)的決策模型,該模型以車輛虛擬碰撞區(qū)域為博弈收益,具有較高的安全性。曲大義等[7]基于分層Logit模型對車輛換道行為進行研究,將車道的效用進行定性定量分析評定,為分析車輛間的行為交互特性提供理論基礎。Ahmed等[8]采用三步法描述換道行為:首先具有換道動機的車輛做出換道決策,然后尋找可能并入的車道,最后等待時機執(zhí)行換道,這是1種典型的基于規(guī)則的換道模型。
目前中外學者對車輛換道模型的研究多體現(xiàn)在車輛換道軌跡的預測以及車輛換道的最小間隙模型,缺乏對換道動機及換道行為對交通流影響的研究。智能網(wǎng)聯(lián)環(huán)境下的車輛換道行為在滿足安全的前提下,更應該考慮駕駛風格的多樣化以及對公路的利用效率?,F(xiàn)將從車輛的駕駛風格考慮,不同的駕駛風格存在不同的換道需求,以決策后車輛的速度為研究對象,建立在安全的基礎上,提高公路利用效率的模型。
傳統(tǒng)意義上根據(jù)車輛換道的動機將車輛的換道行為劃為分為自由換道和強制換道。自由換道是駕駛員實施的非必要換道行為,具有較強的主觀性和隨意性,大多在決策過程中受到環(huán)境的影響而放棄。自由換道的場景如圖1所示,在1條單向4車道中,3車道上的車輛VS的行駛速度受到前車的限制,達不到駕駛員的期望速度,從而產(chǎn)生換道意圖。但是在換道過程中存在與2車道上的滯后車輛VF發(fā)生碰撞的風險從而取消換道行為。因此自由換道行為是非必要性的?,F(xiàn)主要研究自由換道。

圖1 車輛自由換道Fig.1 Vehicles’ discretionary lane-changing
作為1種決策方式,博弈論為含有競爭傾向的問題提供了解決方法和分析手段,被廣泛應用于各個領域中。近幾年來,中外研究人員建立眾多在博弈論思想下的車輛換道模型。Kita[9]提出將博弈論與車輛的換道行為結合。Talebpour等[10]將混合車流下的換道行為看作是非合作博弈行為。Bell[11]利用博弈論對高速公路交通進行建模來研究車輛換道對交通流運行的影響。
每1個博弈的主要構成要素包括參與者、每個參與者所采取的策略以及參與者采取相應的策略所帶來的收益函數(shù)。根據(jù)博弈雙方的期望收益,可以將博弈劃分為合作博弈與非合作博弈。在合作博弈的情況下,博弈雙方組成聯(lián)盟,在合作的基礎上共享信息;在非合作博弈下各參與者的策略為自身利益出發(fā),博弈雙方不存在交流。非合作博弈下根據(jù)參與者行動順序的可見性和參與者信息的完整性可分為完全信息動態(tài)博弈、完全信息靜態(tài)博弈、不完全信息動態(tài)博弈和不完全信息靜態(tài)博弈4種類型。
當1個博弈在進行時,每個參與者都有不同的策略合集,策略合集的表達式為
S={S1,S2,…,Sn}
(1)
表1所示為一個二人非合作博弈的收益矩陣,假設每個參與者都有1組可用的策略,參與者1的策略合集為S1={r1,r2},參與者2的策略合集為S2={t1,t2}。記兩個參與者使用不同的決策時產(chǎn)生的收益函數(shù)為u,例u1(r1,t1)為參與者1使用r1策略和參與者2使用t1策略時對參與者1產(chǎn)生的收益函數(shù)。

表1 博弈收益矩陣Table 1 Payoff matrix
如果矩陣中存在純策略(rn,tn)使式(2)成立,則稱純策略(rn,tn)為博弈的純策略納什均衡,即
(2)
當一個非合作博弈不存在純策略納什均衡時,根據(jù)納什均衡[12]定義可知,任何1個給定的二人博弈一定存在混合策略納什均衡。混合策略納什均衡是純策略結合概率論所得出的結果。表2給出的是1個二人非合作混合策略博弈。參與者1的策略合集為S3={s1,s2};參與者2的策略合集為S4={c1,c2}。其中參與者1對選擇策略s1的概率為p,則選擇s2的概率為1-p。同理假設參與者2選擇策略c1的概率為q,則選擇c2的概率為1-q??梢缘玫饺绫?所示的收益矩陣。

表2 混合策略博弈收益矩陣Table 2 Mix strategy payoff matrix
表2中參與者1和參與者2的期望收益可分別表示為
(3)
通過對式(3)中參與人1的收益函數(shù)對p求導并令其導數(shù)為0可得p為
(4)
同理參與人2的收益函數(shù)對p求導并令其導數(shù)為0,得q為
(5)
當博弈中不存在純策略納什均衡時,參與者1和參與者2必須分別遵循上述概率p和q進行隨機選擇才能得到混合策略博弈的納什均衡。
不同駕駛風格下的車輛最優(yōu)行駛速度存在差異,目前關于駕駛風格的研究有: Langari等[13]基于車輛行駛狀態(tài)下的加速度的平均值與標準差的比值對車輛行駛風格進行劃分;Murphey等[14]對車輛行駛中車體的沖擊度進行分析實現(xiàn)對車輛行駛風格高精度的劃分;李經(jīng)緯等[15]提出基于K-means聚類的駕駛風格識別方法,對于將駕駛風格分為3類的情況具有良好的分類效果。
NGSIM(next generation simulation)是當今最大的自然車輛軌跡數(shù)據(jù)集,被廣泛用于駕駛員模型和交通流的研究。選用NGSIM數(shù)據(jù)集中的US101交通數(shù)據(jù)[16]研究車輛的駕駛風格。
應用文獻[14]的方法對US101數(shù)據(jù)集中的行駛風格劃分為激進型、標準型和平靜型。文獻[14]對車輛行駛過程中的沖擊度進行分析,提出了駕駛風格識別系數(shù)Rdriver,并驗證了該方法的可靠性和準確性。沖擊度J(t)的定義為
(6)
式(6)中:v(t)代表車輛的行駛速度,駕駛風格識別系數(shù)Rdriver的定義為
(7)

圖2 標準型駕駛風格車輛速度、加速度和沖擊度Fig.2 Comparison of speed, acceleration and jerk of standard driving styles
根據(jù)Rdriver對US101數(shù)據(jù)集中的1 914條車輛軌跡數(shù)據(jù)進行駕駛風格的劃分,得到激進型駕駛風格593份、標準型駕駛風格827份、平靜型駕駛風格494份。
對3組不同風格的數(shù)據(jù)進行統(tǒng)計分析,觀察車輛在不同駕駛風格下的速度特點。各個駕駛風格下的速度分布如圖3所示,整體看來每個駕駛風格下的最優(yōu)速度近似服從正態(tài)分布。

圖3 3種駕駛風格下的最優(yōu)速度分布Fig.3 Optimal speed distribution for three driving styles
最終取平靜型駕駛風格的最優(yōu)速度為vb1=12 m/s;標準型駕駛風格的最優(yōu)速度為vb2=15 m/s;激進型駕駛風格的最優(yōu)速度為vb3=18 m/s。
考慮到智能網(wǎng)聯(lián)技術的發(fā)展現(xiàn)狀以及自主車輛的普及程度,分別針對自主車輛與混合車輛以及自主車輛之間的換道行為進行建模。由于自主車輛與人類駕駛員駕駛的傳統(tǒng)車輛之間不存在車輛行為交互作用,即無法構成換道時的博弈,根據(jù)車輛換道時的最小距離模型對其進行換道行為建模;自主車輛之間存在行為交互作用,對其采用博弈論的思想進行建模。
車輛在行駛過程中,若前方出現(xiàn)大型車輛、障礙物、或前方車輛行駛過慢達不到自己的期望速度時,會產(chǎn)生換道的意圖,此種換道類型屬于自由換道。如圖4所示,單向雙車道環(huán)境,車輛VS在1車道行駛時識別到前方車輛VL速度達不到自己的期望速度,于是以2車道為目標車道產(chǎn)生換道意圖。

圖4 車輛換道過程示意圖Fig.4 Schematic diagram of vehicle lane changing process
假設車輛以決策時的瞬時速度和加速度做勻加速或勻減速運動,經(jīng)過時間Δt后車輛VS到達t1時刻位置。此時車輛VS與其前導車輛VL之間的距離為SLead,與目標車道上的滯后車輛VT的距離為SLag。其中SLead和SLag為
(8)
(9)
式中:vS、vL、vT分別為受試車輛、前導車輛和滯后車輛的速度;aT、aL分別代表前導車輛和滯后車輛的加速度;aS代表受試車輛的最大加速度;S1、S2分別為決策時受試車輛與前導車輛和滯后車輛的距離;LS和LLead分別為受試車輛和前導車輛的長度。
如圖5所示,受試車輛VS的安全區(qū)域由SLead、SLag、LS和道路的寬度W決定。
圖5中車輛后方安全面積ALag、前方安全面積ALead和側面安全面積AS計算式為

XLag為車輛的后方最小安全距離;XLead為車輛的前方最小縱向安全距離;ALag為車輛后方安全面積;AS為側面安全面積;ALead為前方安全面積圖5 車輛安全區(qū)域模型Fig.5 Vehicles’ safety area model
(10)
根據(jù)車輛在執(zhí)行換道行為時的速度、加速度和轉向角可確定車輛換道所需要的最小安全距離。車輛在執(zhí)行換道行為時的狀態(tài)如圖6所示。

t為執(zhí)行換道所需時間;θ為車輛的最大轉角圖6 換道狀態(tài)示意圖Fig.6 Schematic diagram of lane-changing status
車輛的前方最小縱向安全距離XLead為
XLead=t(v0+ΔtaS)cosθ
(11)
車輛的后方最小安全距離XLag為
(12)
車輛的最小安全區(qū)域為
(13)
當滿足式(14)時,車輛執(zhí)行換道。
(14)
在智能網(wǎng)聯(lián)技術下,自主車輛之間存在行為交互作用,自主車輛之間的換道也稱為協(xié)作換道?;诓┺恼撍枷脒M行建模,車輛換道決策流程如圖7所示?;诓┺恼撍枷脒M行建模,當車輛產(chǎn)生換道意圖后,首先選擇效益最高的目標車道。然后受試車輛獲取目標車道上的車輛信息,確定博弈對象組成博弈。以決策后的速度與最優(yōu)速度的擬合度作為收益函數(shù),從而得到該博弈的混合策略納什均衡,如果受試車輛的策略為換道,則計算執(zhí)行換道時的安全區(qū)域。在受試車輛的安全區(qū)域不小于最小安全區(qū)域情況下,受試車輛執(zhí)行換道。

圖7 車輛換道決策流程Fig.7 Flow chart of vehicle lane changing decision
本模型中受試車輛擁有S1={換道,不換道}策略集,“換道”策略的選擇概率為p;目標車道上的車輛具有S2={接受換道,不接受換道}的策略集,“接受換道”策略的選擇概率為q。
收益函數(shù)是博弈中不可或缺的成分。近年來,研究者多采用車輛的安全系數(shù)為收益函數(shù)進行博弈,但是車輛安全系數(shù)的量化具有一定的局限性。所以將博弈決策后車輛的速度與該駕駛風格下最優(yōu)速度的擬合度作為收益函數(shù),并且加入車輛安全區(qū)域模型以保證車輛的行駛安全。
博弈的收益矩陣如表3所示,其中s1、s2分別代表受試車輛的“換道”和“不換道”策略;c1、c2分別代表滯后車輛的“接受換道”和“不接受換道”策略;u1(s1,c1)代表受試車輛選擇“換道”策略,滯后車輛選擇“接受換道”時受試車輛的收益函數(shù)。

表3 模型博弈收益矩陣Table 3 Game payoff matrix of model
受試車輛的收益函數(shù)共有u1(s1,c1)、u1(s1,c2)、u1(s2,c1)和u1(s2,c2)4種情況。當受試車輛采取“換道”策略且滯后車輛采取“接受換道”策略時,受試車輛的速度變化為執(zhí)行換道后的速度與決策前速度的差值;當受試車輛采取“換道”策略但滯后車輛采取“不接受換道”策略時,受試車輛加速準備換道,滯后車輛以一定加速度行駛,阻止換道行為的執(zhí)行。為避免出現(xiàn)純策略納什均衡導致事故的發(fā)生,需對u1(s1,c2)、u2(s1,c2)的值進行權衡。當受試車輛采取“換道”策略且滯后車輛采取“接受換道”策略時,為使滯后車輛的速度損失最小化,引入車輛的安全距離模型。根據(jù)各個車輛的距離、速度和加速度等可觀測信息,滯后車輛的加速度可由式(15)求出。
(15)
博弈中受試車和滯后車各策略下的收益函數(shù)為
(16)
式(16)中:vbS為受試車所屬駕駛風格的最優(yōu)行駛速度;vfS為受試車在該執(zhí)行該策略所能達到的最終速度;vbT為滯后車所屬駕駛風格的最優(yōu)行駛速度;vfT為滯后車在執(zhí)行該策略所能達到的最終速度。
本文中模型的博弈類型屬于混合策略博弈,根據(jù)式(4)、式(5)得到各參與者對策略的選擇概率,從而得到該博弈的混合策略納什均衡。得到博弈的納什均衡后,計算該策略下的車輛安全區(qū)域,如果符合式(14),受試車輛執(zhí)行換道行為。
使用SUMO軟件對模型的性能進行仿真實驗。作為交通仿真軟件,SUMO軟件得益于它的開源性從而引得廣大交通領域學者的使用。為避免目的地、信號燈以及行人等因素的影響,仿真的場景為1條限速120 km/h、長度為2 000 m的單向4車道路段。根據(jù)前文中對US101數(shù)據(jù)集分析的結果將平靜型、標準型和激進型3種駕駛風格的車輛數(shù)量以26∶43∶31的比例劃分,根據(jù)車流的組成及車輛換道策略模型分為A、B、C 3個實驗組,其中A組車流使用傳統(tǒng)換道模型,B組車流使用最小安全區(qū)域模型,C組車流使用博弈換道模型。再根據(jù)密度區(qū)間為2 000~4 000 m對每1組車流進行9組實驗,每組實驗持續(xù)6 min。傳統(tǒng)車輛和自主車輛的參數(shù)如表4所示。

表4 仿真車輛參數(shù)Table 4 Parameters of Simulation vehicle
本次實驗以車輛的平均速度、事故數(shù)以及6 min內的車輛通過數(shù)作為評定目標,分析模型的性能。仿真實驗如圖8所示,藍色車輛為傳統(tǒng)車輛,粉色車輛為自主車輛。對3種模型平均速度的仿真結果如圖9所示,車輛的通過數(shù)仿真結果和事故量分別如圖10、表5所示。實驗結果顯示:當車流密度小于3 250 veh/h時,博弈換道模型的車輛平均速度和最小安全距離模型的車輛平均速度均要明顯高于傳統(tǒng)換道模型,其中博弈換道模型更具優(yōu)勢。隨著車流密度的升高,車輛間的換道次數(shù)減小,博弈模型的優(yōu)勢變得不那么明顯,3個模型的平均速度趨于相同水平;從車輛通過數(shù)分析,在車流密度為2 250 veh/h以上時,博弈換道模型的優(yōu)勢變得明顯,隨著車流密度的提高,博弈換道模型的通過數(shù)始終高于前兩種模型,說明博弈換道模型對道路有更高的利用效率;隨著車流密度的提高,傳統(tǒng)模型的事故數(shù)有上升趨勢,最小安全區(qū)域模型的事故數(shù)保持較低的狀態(tài),而博弈模型事故數(shù)始終為0,說明博弈模型具有更好的安全穩(wěn)定性。

圖8 仿真實驗Fig.8 Simulation experiment

圖10 3種模型下的車輛通過數(shù)對比Fig.10 Comparison of vehicle passing numbers under three models

表5 3種模型下事故數(shù)對比Table 5 Comparison of accident number under three models
利用博弈論的思想對車輛的換道行為進行建模,根據(jù)車輛的當前狀態(tài)和預期效果求得車輛的預期安全區(qū)域和最小安全區(qū)域。通過SUMO軟件對模型進行仿真實驗,得到以下結論。
(1)基于混合車流和自主車流建模的方法適用于將來的研究情況。
(2)博弈模型在車道的利用率和安全性都要高于傳統(tǒng)的間隙閾值接受模型。
將結合車輛動力學對車輛換道時的參數(shù)進行更進一步的細化,提高模型的準確性,從而結合智能網(wǎng)聯(lián)技術制定更符合實際換道場景的車輛換道模型。