楊 達 ,楊 果 ,羅 旭 ,唐顏東 ,3,徐利華 ,蒲 云
(1. 西南交通大學交通運輸與物流學院, 四川 成都 610031;2. 公安部交通管理科學研究所, 江蘇 無錫 214151;3. 四川智慧高速科技有限公司, 四川 成都610041)
行為決策是智能網聯汽車實現自動控制的重要組成[1-6],也是該領域的研究熱點. 車輛通過信號交叉口時,其行為會受到信號燈和周圍車輛的影響,如果不能準確預判通行條件,得到的決策結果會導致通行效率低、闖紅燈甚至引發交通事故.
目前,智能網聯汽車領域有關車輛通過信號交叉口的研究,主要關注簡單交通環境下的輔助駕駛速度規劃,研究目的大多為降低排放和燃油消耗[7-12],或者提高通行效率[13-16],涉及到的車輛行為是一些基本規則. 在行為決策層面,現有的智能網聯汽車將一般道路場景的決策方法應用到信號交叉口,也有少部分學者專門研究在信號交叉口這種特殊復雜場景下的行為決策,只考慮信號燈影響時,Park等[17]根據信號、車速、交叉口大小和車輛與停車線的距離構建了簡單的停止/通過決策算法;Zhou等[18]提出了基于強化學習的跟馳模型來獲取合適的駕駛行為;Liu等[19]基于行駛規則,在各種轉向條件下構建了不同信號燈色時的決策流程圖;蘇沖等[20]將動作序列劃分為不同的行為狀態,建立了各種工況下的狀態遷移圖. 考慮周圍車輛影響時,學者們主要解決各方向車輛之間的沖突,在機器學習、運籌優化等方面進行探索,Gadepally等[21]利用隱馬爾可夫模型從連續的濾波中觀測中估計駕駛員行為,為行為決策提供有效依據;Beaucorps等[22]根據人類駕駛員的錄音數據建立有其他車輛存在場景下的無信號交叉口和環形路決策算法;杜明博[23]提出基于有限狀態機的駕駛場景轉換模型,構建基于ID3決策樹的駕駛行為決策模型;de Campos等[24]量化每輛車為避免潛在碰撞而配置的自由度,用成本函數和局部約束條件解決車輛之間的協調問題;Alonso等[25]根據靠近交叉口車輛的狀態信息構建車輛優先通行圖結構,以此來解決不同方向車輛之間的沖突;宋威龍等[26]設計了基于模糊邏輯的駕駛員類型判別模型,根據其他車輛的行駛意圖和駕駛員激進程度建立了決策規則;Makarem等[27]提出了一種分散式模型預測控制方法,對具有預定路徑的車輛引入線性二次最優控制器,加入線性約束來避免碰撞.
從以上回顧可以發現,無論是否在車聯網環境下,現有智能車輛在信號交叉口的控制研究主要集中在速度控制層面,在行為決策層面只有很少的研究,鮮有對通行決策策略的研究,考慮的行駛環境也非常單一,沒有把周圍車輛的干擾納入考慮范圍,特別是前車對智能網聯汽車的行駛空間有顯著影響[28-29]. 如果不考慮前車狀態,只考慮自身狀態和信號燈,會使車輛在判斷通過/不通過問題上有局限性,容易產生兩難區. 鑒于此,本文關注的是車聯網環境下智能網聯汽車在信號交叉口的行為決策問題,為了讓車輛準確控制運動,從微觀交通流的本質出發,基于信號時間信息,利用Gipps跟馳理論預測前方車輛的狀態和判斷自身通過條件,同時加入換道行為來尋求更優的決策結果,從而構建一種智能網聯汽車直行通過信號交叉口的決策模型.
當前車路協同技術還未成熟,本文研究的交通環境是非協同控制的車聯網環境,通過交叉口的智能網聯主車輛SV (subject vehicle)只能通過車聯網獲取信號信息和其他車輛的位置、速度等,并根據信號燈色和時間、前車行駛意圖做出相應的決策. 考慮一般情況,將信號燈情況分為綠燈(倒計時未出現)、黃燈、紅燈、綠燈倒計時,只要車輛在可識別到信號燈范圍內,就啟動決策;當識別到的是紅燈或黃燈,則做出停車的決策;當識別到的是綠燈(倒計時未出現),則繼續按照跟馳狀態行駛;當識別到的是綠燈倒計時,則識別自身在當前車道是領頭車還是跟隨車,并結合前車行駛意圖判斷能否在綠燈結束前通過停止線,若不能通過,則根據換道時間模型判斷換道后能否通過,再做出相應的決策. 車輛的行為決策流程如圖1所示.

圖1 信號交叉口行為決策流程Fig. 1 Behavior decision process at signalized intersection
預測前方車輛未來的狀態,本質就是判斷車輛是否能夠在綠燈倒計時間內通過停止線,這取決于車輛在倒計時間內走過的距離和倒計時間結束時的位置. 在交叉口,車輛為了追求高效行駛,都保持在跟馳狀態,本文采用Gipps跟馳模型[30]來表征前后車行駛狀態的相互影響.
1.2.1 Gipps跟馳模型
Gipps跟馳模型屬于安全距離模型,其基本思想是尋找一個特定的跟馳距離,當前車緊急剎車時,如果后車與前車的跟馳距離小于該特定距離,就有可能發生碰撞. 在交叉口,根據為避免與其前車(車輛n-1)發生追尾所需保證的安全距離,可以得到跟馳車(車輛n)行駛的安全速度,如式(1).

式中:T為車輛n的反應時間;bn為車輛n的最大制動減速度;sn車輛n的效用尺寸,其值等于車身長度;vn(t)為車輛n的速度;xn(t)為車輛n沿行駛方向的位置;t為時間.
Gipps跟馳模型根據運動學推導,具有明確的物理意義,能較好地體現出行駛速度因素在跟馳過程中的影響,可以真實地模擬車輛之間的跟隨行為,在交通仿真中有著廣泛應用,如英國交通部的SISTM模型、美國的CARSIM模型等,是交通流理論的核心內容之一.
1.2.2 車輛狀態預測
以反應時間作為車輛決策間隔,領頭車是位置最靠近交叉口停止線的車輛,將領頭車編號為PV1,其行為不受其他車輛的影響. 通過Gipps跟馳模型,可以計算出跟馳車輛在反應時間后的速度,再結合初始的速度和位置可以得到車輛在反應時間后的位置. 求得領頭車經過每個反應時間后的速度和位置后,則可以通過遞推方法依次求得其后的所有跟隨車輛在每個反應時間后的速度和位置.
按照與交叉口距離從小到大的順序對所有車輛進行編號,依次為PV1,PV2, ···,PVn, 用vP,1,vP,2, ···,vP,n分別表示其速度,xP,1,xP,2, ···,xP,n分別表示其沿行駛方向的位置. 設所有車輛在初始時刻t0的位置為xP,1(t0),xP,2(t0), ···,xP,n(t0),速 度 為vP,1(t0),vP,2(t0), ···,vP,n(t0),從初始時刻開始的第k(k= 1, 2, ···)個反應時間后的車輛狀態如下:
1) 當n= 1時,

2) 當n> 1時,

車輛SV通過車聯網獲取到信號燈信息后,首先需要判斷能否在當前車道通過交叉口,根據其前方是否有車輛,可將SV分為領頭車和跟隨車.
1.3.1 SV為領頭車
當SV為領頭車,其行駛行為不受其他車輛的影響,設SV在當前位置為xP,S(t0),速度為vP,S(t0),可以計算出SV先勻加速行駛,后勻速行駛到綠燈結束時刻的位置:

式中:等號右邊第2項為車輛SV勻加速行駛的距離;第3項為按最大限速值勻速行駛的距離;tg(t0)為當前綠燈剩余時長;vlim為道路最大限速值;amax為車輛的最大舒適加速度.
設xstop為停止線位置,可得到車輛SV在綠燈結束時刻與停止線的位置差為

1.3.2 SV為跟隨車
當SV為跟隨車,其行為決策結果受到前方車輛行為的影響,假設SV在未來按照Gipps跟馳模型行駛,那么可以用該模型描述其行駛狀態并進行預測. 車輛SV每隔一個反應時間進行一次決策,可以得到車輛走完剩余綠燈時間需要進行h次決策,如式(6).

根據式(2)和式(3),可以得到當前車道中車輛SV之前的每輛車在綠燈信號結束時刻的位置為xP,n(t0+hT),車輛SV在綠燈信號結束時刻的位置為xP,S(t0+hT),如圖2 (圖中x、y分別為車輛的縱向、橫向位置),根據車輛位置和交叉口停止線位置,可以判斷每輛車是否能夠在綠燈結束時通過停止線.

圖2 車輛位置Fig. 2 Position of vehicles

式中:ΔxP,n為第n輛車在綠燈結束時刻與停止線的位置差.
SV在綠燈結束時刻與停止線的位置差 ΔxP,S也可由式(7)計算得出. 根據SV為領頭車和跟隨車的兩種情況分別判斷,若 ΔxP,S>0,則SV在綠燈結束時刻不能通過停止線;如果 ΔxP,S≤0,則SV在綠燈結束時刻能夠通過停止線.
1.4.1 SV換道時間模型
當SV不能在當前車道通過時,可以尋求相鄰車道的換道通行方案,在對換道策略進行評估時,最主要的考慮因素就是換道帶來的時間損失,故以下分析換道過程的時間計算方法,SV換道的運動過程如圖3所示.
參考Yang等[31]的研究,將車輛的換道軌跡描述為多項式曲線,假設車輛換道開始時的橫縱向位置均為0、導航角處于水平狀態、車輛在換道結束時的縱橫向位置分別為xf和yf,以此來計算SV換道執行時間. SV換道執行時間為換道行駛的路程與平均速度的比值,如式(8).

式中:

1.4.2 目標車道前車通過條件判斷
若目標車道的前車數量太多,會導致:1) SV沒有換道空間,即車輛不能從當前位置開始換道;2) SV換道后通過停止線的概率減小. 所以,本文認為如果目標車道上遠離交叉口的最后一輛車位置在與SV平行的道路橫向截面之后,則目標車道前車不能通過停止線;如果該車在與SV平行的道路橫向截面之前,則目標車道有前車;如果目標車道上與SV平行的的道路橫向截面之前沒有車輛,則目標車道無前車.
在換道過程中,目標車道前車保持為跟馳行駛狀態,對其進行編號,依次為LV1,LV2, ···,LVm. 與前述計算當前車道的車輛狀態相同的思路,可以得到目標車道前面的車輛在綠燈結束時刻與停止線的位置差為

式中:xL,m(t0+hT)為目標車道前面的車輛LVm在綠燈結束時刻的位置.
1.4.3 SV換道后通過條件判斷
有了換道時間后,可以計算出換道過程經歷的反應時間個數為h1=tS/T,從而得到SV在換道結束時刻的速度和位置如式(14).

SV換道結束后,后續階段的通過條件判斷和前述在當前車道的方法類似,從SV換道結束后的狀態開始計算,如果目標車道沒有前車,SV可以加速行駛,可以根據式(4)計算其在綠燈結束時刻的位置;如果目標車道有前車,SV只能跟隨前車行駛,可以根據式(3)計算其在綠燈結束時刻的位置,最后得到SV在綠燈結束時刻與停止線的位置差ΔxL,S. 如果 ΔxL,S>0,則SV換道后在綠燈結束時刻不能通過停止線;如果 ΔxL,S≤0,則SV換道后在綠燈結束時刻可以通過停止線.
給定所有車輛當前的狀態數據(車輛位置、速度)、車輛固定屬性(最大舒適加速度、最大制動減速度)、道路屬性(最大限速值、車道寬度、交叉口停止線位置、綠燈倒計時間),可以模擬出SV在剩余綠燈時間內的行駛過程. 本文考慮一般情況,場景設置為SV前方有車輛,相鄰車道前方有車輛,通過配置車輛位置和當前綠燈剩余時間參數來構建不同的交通環境,以此來評估模型的決策能力,分析車輛的行為決策過程和速度變化.
搭建不同的場景來評價模型的決策能力,設置兩個不同綠燈倒計時間10.0 s和14.0 s的場景,分別為場景1和場景2,在兩個場景中道路限速值為60 km/h,停車線位置為300 m,最大舒適加速度為2 m/s2,最大制動減速度為3 m/s2. 在其他設置都相同的條件下,使用基于規則的現有決策模型和本文決策模型分別仿真車輛的運行,得到車輛行駛過程中的決策結果,兩個場景如圖4、圖5所示.

圖4 場景1決策過程對比Fig. 4 Comparison of decision-making process for scenario 1

圖5 場景2決策過程對比Fig. 5 Comparison of decision-making process for scenario 2
在場景1下,由對比可知:在車輛靠近信號交叉口的前階段,現有模型和本文模型都做出減速停車的決策,說明本文模型具有和現有模型一致的基本決策能力,在后階段越來越靠近停止線時,在現有模型做出減速停車決策的情況下,本文模型做出直行跟馳的決策,即前者決策出不能通過交叉口,而后者預測出可以通過,說明本文模型能捕獲到微小的交通狀態變化,有使得決策結果更加精確的優勢,從而提高車輛的通過效率. 在場景2中,增加了綠燈倒計時間長度,車輛使用本文模型的決策結果就一直為直行跟馳,這也符合綠燈時間越長,車輛通過交叉口概率越大的交通規律,說明本文模型能應用到實際的車輛運行控制中.
2.3.1 當前綠燈剩余時間
將當前綠燈剩余時間作為變化量,分別以20.0,19.0,···,1.0 s的剩余時間來構建場景,場景的主要參數設置見表1.

表1 不同綠燈剩余時間的場景輸入Tab. 1 Scene input information for different green lightcountdown time
選取3個典型決策過程和速度變化結果如圖6所示,當前綠燈剩余時間較短時,SV既不能在當前車道通過也不能換道,每次決策只能是停車;當前綠燈剩余時間在10.0 s和13.0 s之間時,SV在前階段計算出不能在當前車道通過停止線,故做出了換道決策,換道之后的階段做出了直行加速決策;當前綠燈剩余時間較長時,SV就一直做出直行跟馳決策.綜合以上分析,綠燈剩余時間每增加一個單位,SV在當前綠燈周期通過交叉口的概率可提升20%,車輛面對不同的當前綠燈剩余時間時做出的決策有較大差異.

圖6 不同綠燈剩余時間的決策過程和速度變化Fig. 6 Decision-making process and speed change of different remaining time of green light
2.3.2 當前車道車輛位置
將當前車道車輛位置作為變化量,設置當前車道前車和車輛SV的不同位置來構建場景,場景的主要參數設置見表2.

表2 不同當前車道車輛位置的場景輸入Tab. 2 Scene input information for different vehicle positions in current lane
選取3個典型決策過程和速度變化結果如圖7所示,當前車道車輛與停止線的距離大于220 m時,SV不能在綠燈倒計時間內通過,故一直做出減速停車的決策;當頭車位置在160~220 m時,SV在前階段有換道的決策,換道之后的階段做出了直行加速的決策;當前車道車輛與停止線的距離小于160 m時,SV可以在當前車道通過停止線,故一直做出直行跟馳的決策. 由此可知,不同的前車和SV自身位置得到的決策結果有較大差異.

圖7 不同當前車道車輛位置的決策過程和速度變化Fig. 7 Decision process and speed change of different vehicle positions in current lane
1) 本文以周圍車輛對智能網聯汽車的影響為研究重點,以行駛時間和行駛路程作為通行條件計算依據,建立智能網聯汽車在信號交叉口的行為決策方法,讓其利用前車狀態對執行各種行為的條件進行了超前判斷,并得到準確的決策結果.
2) 仿真結果表明,決策模型可以使車輛根據車聯網獲取的信號倒計時間、車輛位置和速度狀態,對交叉口停止線附近車輛的通過、停車和換道行為之間做出準確的選擇,解決了前車不確定行為帶來的決策困難問題,對智能網聯汽車的實際控制具有指導意義.
3) 本研究考慮了車輛直行時的情況,當車輛有轉向需求時,不同車道上車輛的狀態和其他進口道車輛的沖突對決策也具有不可忽略的影響,未來研究關注的是車輛在交叉口有不同轉向需求時的行為決策問題.