孫曼曼,陳珍萍*,李海峰,付保川
(蘇州科技大學電子與信息工程學院,江蘇 蘇州 215009)
隨著現代自動控制技術、通信技術以及傳感技術的飛速發展,網聯自動駕駛車輛已成為當今智能交通系統的研究熱點[1]?;谧灾魇脚c網聯式,網聯自動駕駛車輛實現對周圍交通環境與鄰近車輛的監測[2],旨在降低交通事故,提升城市交通效率。通過車載傳感器,自主式感知能夠監測自身及周邊車輛的行駛狀態;而網聯式感知則依靠現代通信技術,完成自身與周邊車輛、道路交通設施之間的信息交互[3]。因此,網聯自動駕駛車輛能夠獲得實時的周圍交通環境信息,并通過數據分析處理,自主地提前做出決策規劃,指導駕駛行為[4]。
車輛運行過程中主要存在跟馳、換道兩種駕駛行為。對比兩種行為,車輛換道考慮的周邊因素更多,決策執行過程相對更復雜。根據相關統計,由車輛換道引起的交通安全事故約占總交通事故的5%,且近年來呈上升趨勢[5]。針對網聯自動駕駛車輛的協同換道研究已得到國內外專家學者的廣泛關注。
在文獻[6]中,Jula等人制定了車輛換道時的安全準則,以此來判斷換道的可行性;Kanaris等人在文獻[7]中針對突發情況,研究出一種新型換道安全判斷標準;譚云龍在道路合流區換道過程中分析車輛協作的影響現狀,給出了換道間隙接受模型[8];丁云潔等人以周圍交通環境為輸入變量,闡明換道決策行為的影響因素,構建基于隱馬爾可夫理論的多車換道預測模型[9];在文獻[10]中,徐遠新等人根據隱馬爾科夫理論,考慮前車狀態,建立了前車換道預測模型。
綜上,對網聯自動駕駛車輛協同換道研究中,大都致力于換道穩定性、安全性等基本性能的分析,但對行車舒適性研究較少,往往忽略了舒適性在交通流速度波動上的體現。而且,對多車因同時換道產生干擾的研究也尚未成熟。因此,本文選取車輛的換道行為為研究內容,對車輛進行博弈分析,建立面向網聯自動駕駛車輛的多車協同換道策略,在現有的交通流運行安全性與穩定性的基礎上,增加舒適性,以避免發生頻繁、不合理的換道行為,提升行車舒適感。
網聯自動駕駛車輛制定駕駛策略的過程和人腦作出駕駛的過程必然不同[11]。因此,本文對運行車輛作出如下假設:
假設1:忽略橫向速度與橫向加速度;
假設2:不考慮通信延遲和信息傳輸誤差。
網聯自動駕駛車輛換道涉及到的車輛及車道包含有:當前車道(Current Lane,CL)的主車(Subject Vehicle,SV)、前車(Preceding Vehicle,PV)和后車(Following Vehicle,FV);目標車道(Target Lane,TL)的前車(Putative Leading Vehicle,PLV)和后車(Putative Following Vehicle,PFV)。換道場景如圖1。
圖1中,SV的通信距離內,假設在CL上有有nc輛后車,記為集合NCT;TL上有nT輛后車,記為集合NTL。這些車輛與SV的相對縱向位置滿足下式

圖1 換道場景圖

(1)
式中,L為SV的通信距離;xSV為SV的當前位置;xFVi和xPFVi分別為FVi和PFVi的當前位置,其中i取1、2、3……
環境感知單元、車載決策單元、底層控制單元和網絡通信單元構成網聯自動駕駛車輛系統。其換道步驟可總結如下,換道流程如圖2。
1)為防止頻繁換道,首先判斷SV在30s內是否有換道行為,若有,則SV不換道,跳轉至步驟五,若沒有,則進入步驟2);

圖2 換道系統流程圖
2)依據初始輸入狀態信息,SV執行單車期望換道策略。若該決策為不換道,跳轉至步驟五,若決策為換道,則進入步驟3);
3)判斷SV與周圍車輛的換道決策間是否存在沖突,若不存在,則期望換道策略為最終策略,跳轉至步驟五,若存在,則進入步驟4);
4)由相互沖突的換道決策,建立協同換道策略,并將其作為最終換道策略,進入步驟5);
5)最終換道策略由車載決策單元傳遞給周邊車輛,同時發送給底層控制單元。
為分析主車換道后周邊車輛的加速度,以智能駕駛員模型(Intelligent Driver Model,IDM)為車輛跟隨模型[13]。IDM表達式如下


(2)
式中,aSV為SV的加速度;a為最大加速度;vSV為SV的速度;δ是加速度指數;sSV是SV的實際跟車距離;T是安全車頭時距;v0為期望速度;ΔvSV為SV與其前車的速度差;so為靜止安全距離;b為舒適減速度。
分別將車輛SV-1與其前車SV-2的車間距、相對速度差記為sSV-1、ΔvSV-1。以此類推,sSV-j、ΔvSV-j分別為SV前j輛車與前j+1輛車的車間距及相對速度差。在原模型的基礎上,Treiber將IDM擴展為多車模式[14],考慮三輛前車對SV跟隨行為的影響,SV加速度按照下式估計

(3)
式中,mj=ρjTj,mj為權重系數,ρj和Tj分別代表車輛SV-j與其前車的運動相近程度和信息可靠度,由假設2可知,Tj=1。
3.2.1 速度收益
本文在激勵模型中定義速度收益函數,以判斷換道的收益標準。速度收益函數定義如下[15]

(4)

3.2.2 舒適性收益
本文以相鄰步長間加速度的變化來衡量車輛行駛的舒適性收益,以描述加速度變化幅度,其表達式如下
m′SV(TL)=|aSV(t)-aSV(t-1)|

(5)
式中,m′SV(TL)是SV換道到TL的舒適性收益,aSV(t-1)為上一步長SV的加速度,aFVi(t-1)和aPFVi(t-1)分別為上一步長FVi和PFVi的加速度。
3.2.3 總收益
確定了SV在換道下的速度收益和舒適性收益之后,對兩收益函數歸一化處理,計算出總收益,進而確定最終換道策略。總收益定義如下
USV=αfacc(mSV(TL))+βfcom(m′SV(TL))
(6)
式中,USV是總收益,facc(mSV(TL))和fcom(m′SV(TL))分別為對加速度和舒適性的歸一化函數,α、β分別是SV在速度收益、舒適性收益之間的權重系數。最優目標車道的確定即轉化為以下優化求解問題
TL*=arg maxTL∈N(SV)USV
(7)

(8)
USV>Δath
(9)
式中,bsafe為最大安全減速度,取bsafe=2m/s2;Δath是給定的收益閾值,當SV的收益大于Δath且滿足安全準則時才換道。在優化問題(7)中,優化解TL*對應最優目標車道的換道行為。
協同換道是為消除主車和周邊車輛的單車期望換道決策之間的沖突而作出的策略,以避免多車因換道進入同一個目標間隙而發生碰撞事故。但協同換道不應僅關注車于車之間的換道沖突,還應最大化提高交通流運行效率。因此,需對同時換道的車輛進行協調。本文采用博弈論的方法對車輛間的競爭與協作關系探究分析,從而對協同換道的車輛分類與建模。
本文只關注兩車之間的協同換道博弈,其情形主要分為三類:(a)SV和原車道前車目標車道、目標間隙相同;(b)SV和原車道前車目標車道相同、目標間隙相鄰;(c)SV和目標車道前車交叉換道。協同換道博弈情形如圖3。

圖3 協同換道博弈情形
根據3.1節描述的協同換道分類,該協同換道是一個靜態博弈的策略問題[16],可用參與人、策略和支付來描述。參與車輛的策略集合均為{換道,不換道},換道記為1,不換道記為0。為方便描述,對下文涉及到的相關變量定義如下:

Case1:SV與PV的目標車道、目標間隙相同
該博弈中基本元素如下分析。
1) 參與人:SV和原車道前車PV;
2) 策略:{換道,不換道};
3)支付:用SV和周邊車輛的加速度變化值表示兩車在不同策略下的總收益。

表1 SV和PV的協同換道博弈矩陣
策略組合1:SV和PV同時換道


(10)
若式(10)成立,則由式(9)和(15)判斷兩車同時換道時,SV和PV的換道總收益是否均大于Δath。其過程如下。令

(11)
g′(TL)=aSV(t)-aSV(t-1)
(12)


(13)

+|g′(TL)|
(14)
則有:

(15)

策略組合2:SV換道、PV不換道

策略組合3:SV不換道、PV換道

策略組合4:SV和PV均不換道
兩車均不換道,SV和PV的收益函數如下:

(16)

(17)
Case2:SV與PV的目標車道相同、目標間隙相鄰
Case2中的參與人、策略、支付、博弈矩陣及策略組合同Case1,這里不再贅述。
策略組合1:SV和PV同時換道
組合1中,對于SV,其目標間隙可能改變,需重新對安全性分析。然后分別根據式(9)和(20)判斷SV和PV的換道總收益是否均大于Δath。令

+ηg(TL)
(18)

+|g′(TL)|
(19)
則有

(20)

Case2的策略組合2、3和4參考Case1。
Case3:SV和PLV交叉協同換道


表2 SV和PLV的協同換道博弈矩陣
策略組合1:SV和PLV同時換道
組合1中SV和PLV的目標間隙會增大,兩車換道的安全性不需重新判斷。根據式(9)和(23)分別判斷SV和PLV的換道總收益是否均大于Δath。令

+ηg(TL)
(21)

+|g′(TL)|
(22)
則有

(23)

Case3中策略組合2、3和4參考Case1。
網聯自動駕駛車輛能夠根據換道策略預估自身和周邊車輛下一時刻的駕駛信息。因此,雙矩陣中的元素都能計算得出。考慮到其中元素的值隨時間變化,需探究一種使車輛在任何狀況下都能選擇最優策略的方法[17]。
其步驟可總結如下:
1)對博弈中參與車輛i=1、2分別構建支付矩陣Ui;

(24)

(25)
在矩陣U1和U2中,U1k和U2k分別表示第一、二個參與車輛在第k個換道策略下的收益。
2)忽略矩陣U1中的前兩行,得到矩陣B1;刪除矩陣U2中的第一、三行,獲得矩陣B2。

(26)

(27)
3)將Bi的最小列標號對應的策略組合選取到Ri。
4)根據式(28)獲得R中的策略組合,即為最優策略。

(28)
仿真場景為單向三車道的基本路段。實驗設置基于兩組跟馳與換道策略組合模擬的車輛交通流場景。模型組合見表3。

表3 換道模型組合
初始輸入交通流量為300Veh/h-2000Veh/h依次變化。當初始道路密度小于20Veh/km時,初始輸入車速為v0。當初始道路密度不小于20Veh/km時,初始輸入車速為17m/s。每次仿真時長為250s,仿真中涉及到的參數見表4。

表4 模型參數
本節基于Matlab對組合1、2進行數值仿真對比,從交通流舒適性、穩定性及安全性等方面驗證所提策略的有效性。
在換道策略中,禮貌系數是換道率的影響因素之一,反映了主車的利他主義程度。若取η=0時,表示主車只考慮自身收益;若取0<η<1,表示主車既兼顧自身收益又注意對后車的影響;若取η>1,表示完全利他主義。設置不同的禮貌系數,同時用不同的顏色區分速度大小,圖中顏色值越大,車輛速度越快。發現禮貌系數η=0.1時的時空軌跡圖均質性最好,其次是η=1時,η=0時最差。并且η=0.1和η=1時,兩組合都未出現車速為零的現象,但η=0時明顯出現了停車現象。表明η=0.1時,車輛既能獲得更快更平穩的駕駛速度,又能保證自身和周邊車輛的舒適安全行駛。時空軌跡如圖4、圖5和圖6。
對比圖4,組合1以車速5m/s運行的時間達70s,組合2只有40s,組合2中的車輛以較高速度行駛的情況比例明顯高于組合1,且交通流穩定性較好;圖5中,組合2的低速運行時間大約比組合1少30s,擁堵范圍更小,交通流整體制動幅度不大;圖6中,兩組合都出現了停車現象,但組合1擁堵更為嚴重,尤其是第100秒開始,出現大范圍停車現象,而組合2仍能以5m/s的車速小范圍內移動。表明本文所提的換道策略能夠提升道路通行能力,同時使車速保持較好的平穩性,有效降低車輛整體制動幅度,提升行車舒適感。

圖4 η=0.1時車輛時空軌跡圖

圖5 η=1時車輛時空軌跡圖
道路密度和平均速度分析中,紅色折線和綠色折線分別為組合1和組合2的道路密度相對應的車輛平均速度。對比發現,當道路密度小于0.025Veh/m時,兩種組合的平均速度差異很小,隨著道路密度的逐漸增大,組合2的平均速度開始顯著大于并一直大于組合1,且速度變化率更為緩慢。當道路密度在0.025Veh/m-0.040Veh/m時,組合1的平均車速大幅下降。當道路密度高于0.177Veh/m時,因密度過高導致交通處于致密堵塞狀態,兩種組合下的平均速度均處于較低水平。因此,本文提出的換道策略,在提高交通通行效率的同時能夠有效減少車輛運行的整體制動幅度,提高行車舒適感。平均速度-交通密度圖如圖7。

圖6 η=0時車輛時空軌跡圖
碰撞時間(Time to Collision,TTC)是指車輛在某行駛中,主車用于調整自身速度以避免和前車碰撞的時間。當TTC-1≤0時,表示沒有碰撞危險,當TTC-1>0時,碰撞的危險性隨TTC-1的増大而增加。仿真結果顯示,組合2的碰撞危險性明顯低于組合1。說明本文提出的換道策略能夠提高車輛換道的安全性。兩模型組合下的車輛碰撞時間倒數曲線如圖8。

圖7 平均速度-交通密度分布圖

圖8 車輛碰撞時間倒數
針對現有車輛協同換道存在運行制動幅度大、安全性差、擁堵嚴重等問題,本文在舒適安全換道需求驅動下,提出了一種基于博弈論的網聯自動駕駛協同換道策略。將舒適性收益引入速度收益中,形成綜合考慮兩收益函數的單車換道策略;采用雙矩陣算法研究協同換道運行方式,探究基于博弈論的多車協同換道策略。仿真結果表明,所提策略在保證車輛安全穩定換道的前提下,提供了更為舒適的行車體驗。但外界干擾會增加車輛決策分析的不確定性和隨機性,在未來的研究中,將對模型進行完善,進一步改進車輛行駛狀態。