劉 志
(蘇交科集團股份有限公司 南京 210017)
近年來無人駕駛系統(tǒng)在乘用車上已得到初步應(yīng)用,但在客運公交車上的應(yīng)用較少。現(xiàn)有研究多針對單車智能相關(guān)控制技術(shù)展開,未能綜合應(yīng)用車路協(xié)同環(huán)境,缺乏對車路協(xié)同條件下綜合交通信息的利用,對多路口、多交通約束條件的考慮不足;此外,所設(shè)計的控制方法難以直接移植到公交車上。因此,完成智慧公交自動駕駛及車路協(xié)同的目標還需要更加深化的研究。本文從風(fēng)險感知、駕駛決策、速度優(yōu)化、公交編隊的角度出發(fā),對智慧公交車輛進行深入研究,以期實現(xiàn)安全、節(jié)能、高效的智慧公交自動駕駛與編隊控制系統(tǒng),開展車路協(xié)同自動駕駛智慧公交技術(shù)實踐探索,可促進自動駕駛技術(shù)在城市公交運營場景下的快速落地,為城市交通出行提供便捷、安全、高效的出行服務(wù)。
在公共路權(quán)的復(fù)雜交通環(huán)境下,為實現(xiàn)公交系統(tǒng)風(fēng)險識別,建立智慧公交潛在風(fēng)險的辨識提取模型,設(shè)計智慧公交風(fēng)險辨識及預(yù)警子系統(tǒng)。該子系統(tǒng)可實現(xiàn):①利用深度學(xué)習(xí)算法實現(xiàn)多源信息(包括車載傳感器信息如,攝像頭、GPS、雷達等,V2X數(shù)據(jù)信息如,天氣信息、道路狀況、人流量等)的深度融合;②建立行人-車輛多智能體的狀態(tài)空間動力學(xué)模型,采用長短期記憶遞歸神經(jīng)網(wǎng)絡(luò)與高階容積卡爾曼濾波結(jié)合實現(xiàn)對行人-車輛運動狀態(tài)的精準估計,基于貝葉斯網(wǎng)絡(luò)實現(xiàn)智慧公交潛在風(fēng)險分類機制。系統(tǒng)的行人-車輛群集運動狀態(tài)感知與風(fēng)險辨識的技術(shù)路線見圖1。

圖1 行人-車輛群集運動狀態(tài)感知與風(fēng)險辨識技術(shù)路線
為全方位準確感知智慧公交周圍環(huán)境,考慮車載傳感器提取周圍信息的不完備性,結(jié)合V2X獲取的行人、車輛等道路全局信息,采用分層深度融合算法,將傳統(tǒng)的依賴高成本多傳感器的感知方法轉(zhuǎn)變?yōu)橐蕾嚫哧P(guān)聯(lián)多源信息。采用超像素分割和立體光流法實時構(gòu)建行人-車輛的三維形態(tài)與動態(tài)特征,提出一種基于Mask R-CNN與多源信息特征融合的深度學(xué)習(xí)模型,構(gòu)建多層卷積層對車載傳感器信息進行特征提取,并構(gòu)建1×1的卷積網(wǎng)絡(luò)用于對車載傳感器和V2X信息的特征融合,實現(xiàn)復(fù)雜城市環(huán)境下的多源信息融合。
為精確估計行人-車輛多智能體的狀態(tài)信息,考慮行人-車輛系統(tǒng)的非線性、不確定性和時滯性等特性,分析系統(tǒng)在時間維度上的時空關(guān)聯(lián)性,利用LSTM的數(shù)據(jù)記憶特征,本文提出長短期記憶遞歸神經(jīng)網(wǎng)絡(luò)與高階容積卡爾曼濾波結(jié)合的運動狀態(tài)估計方法,將多源融合信息輸入到深度長短期記憶神經(jīng)網(wǎng)絡(luò),建立行人-車輛非線性系統(tǒng)狀態(tài)空間動力學(xué)模型。使用高階容積卡爾曼濾波對神經(jīng)網(wǎng)絡(luò)的輸出和系統(tǒng)的狀態(tài)變量進行實時更新,實現(xiàn)對行人-車輛多智能體非線性系統(tǒng)模型的真實逼近,以及對運動狀態(tài)值的精確估計。
針對智慧公交在公共路權(quán)環(huán)境下的安全運行問題,借助融合的多源信息[1],考慮環(huán)境感知與狀態(tài)估計之間的互聯(lián)關(guān)系,建立智慧公交運行潛在風(fēng)險的辨識提取模型,提出基于貝葉斯網(wǎng)絡(luò)的智慧公交運行潛在風(fēng)險分類推理機制,結(jié)合時空配準法,設(shè)計智慧公交的風(fēng)險辨識及預(yù)警系統(tǒng),實時預(yù)測智慧公交多維風(fēng)險態(tài)勢。
智慧公交安全駕駛決策系統(tǒng),借助單車智能感知與車路協(xié)同技術(shù)獲取動態(tài)交通環(huán)境中的行人、車輛異構(gòu)多智能體信息,揭示智慧公交與動態(tài)或靜態(tài)障礙物沖突消解機制,采用強化學(xué)習(xí)方法設(shè)計多智能體協(xié)同避撞駕駛決策算法,以及人工勢場法設(shè)計面向動態(tài)交通環(huán)境場景的局部路徑快速規(guī)劃方法,基于強魯棒模型預(yù)測控制設(shè)計城區(qū)不確定環(huán)境下智慧公交路徑跟蹤控制器。智慧公交自適應(yīng)路徑規(guī)劃及駕駛決策系統(tǒng)研發(fā)技術(shù)路線見圖2。

圖2 智慧公交自適應(yīng)路徑規(guī)劃及駕駛決策系統(tǒng)技術(shù)路線
根據(jù)統(tǒng)計分析交通數(shù)據(jù)顯示,大部分的交通事故均是由于車輛避障不及時,車輛碰撞導(dǎo)致的,城市交通環(huán)境中的障礙物主要有行人、車輛等,由于分析行人、駕駛員行為需要考慮心理學(xué)、交通環(huán)境、自我控制能力等[2]。因此,基于強化學(xué)習(xí)的多智能體協(xié)同避撞駕駛決策見圖3。

圖3 基于強化學(xué)習(xí)的多智能體協(xié)同避撞駕駛決策
根據(jù)多智能體一致性控制理論將行人-車輛看作是具有高度智慧與行為能力的智能體,研究異構(gòu)多智能體避撞行為心理與行為機理,基于計劃行為理論并采用統(tǒng)計方法量化環(huán)境因素對車輛避障行為的影響,構(gòu)建基于強化學(xué)習(xí)的智慧公交駕駛決策模型,使用局部馬爾可夫決策及分布式馬爾可夫決策聯(lián)合優(yōu)化決策的方法使得強化學(xué)習(xí)回報函數(shù)最大化,分析得出智慧公交避障駕駛決策的最優(yōu)結(jié)構(gòu)路徑圖。
智慧公交在做避障決策時,還要實時做出合理高效節(jié)能的局部路徑規(guī)劃。考慮到局部路徑規(guī)劃的實時性及車載處理器的計算能力,本項目基于車載傳感器獲取的局部環(huán)境信息及V2X通信得到全局環(huán)境信息,再對多源信息進行深度融合,提出一種基于人工勢場的局部路徑規(guī)劃方法,對智慧公交周圍環(huán)境構(gòu)建包含引力場(車輛向目標點運動)和斥力場(車輛能夠避開各種障礙物)的勢場模型,并對2種勢場疊加,規(guī)劃出合理高效的局部路徑,智慧公交由當前點逐漸向目標點駛?cè)ァ?/p>
智慧公交在得到規(guī)劃路徑后,周圍環(huán)境具有動態(tài)變化特性,針對交通要素、局部期望路徑、周邊實時駕駛態(tài)勢及公交駕駛模式切換的不確定性,本項目基于群集動力學(xué)理論設(shè)計車輛動力學(xué)、車聯(lián)網(wǎng)信息交互的強魯棒MPC容錯循跡控制策略,使得智慧公交擺脫參數(shù)變化和環(huán)境干擾因子的影響,獲得更快的控制響應(yīng)速度、更高的系統(tǒng)魯棒性和更好的路徑跟蹤性能。
首先,需完成智慧公交縱向動力學(xué)建模,主要包括驅(qū)動電機、動力電池、液壓制動系統(tǒng)等。電機是動力系統(tǒng)核心,驅(qū)動時將電能轉(zhuǎn)化為車輛動能,制動時將汽車動能轉(zhuǎn)化成電能,基于電機試驗數(shù)據(jù),采用查表法建立包含功率-轉(zhuǎn)矩-效率的驅(qū)動電機模型。動力電池模型采用等效電路Rint模型,忽略溫度等對內(nèi)阻的影響,電池荷電狀態(tài)采用安時累積法計算。另外延長電池使用壽命是智慧公交控制的目標之一,采用基于實驗數(shù)據(jù)的半經(jīng)驗?zāi)P蛠砉烙嬰姵貕勖乃p情況,利用電池容量損失Qloss表示電池壽命衰減情況。液壓制動過程中受油液壓力、摩擦系數(shù)、溫度等影響,所以建立一階慣性環(huán)節(jié)模型,表示液壓制動系統(tǒng)延遲特性。
城市道路環(huán)境中智慧公交準時高效通行速度優(yōu)化問題需要處理的約束條件較多,如道路附著、交通限速、車輛性能等,上述約束還存在時變特性。另外需要達成的優(yōu)化目標也較多,如能量最優(yōu)、高效通行、安全行駛等。所以,最優(yōu)運動速度優(yōu)化屬于復(fù)雜的協(xié)同優(yōu)化問題。基于車載傳感器采集的車輛運動狀態(tài)、V2X獲取的交通和道路環(huán)境信息作為控制參考或約束,并考慮到動態(tài)規(guī)劃算法在處理多約束條件和多目標優(yōu)化問題方面的優(yōu)勢,以驅(qū)動消耗和制動回收能量之和Qe為能量優(yōu)化評價指標,以電池容量損失Qloss為電池壽命評價指標,設(shè)計多約束條件下的,兼顧能耗、電池壽命特性、車輛行駛平順性與通行效率的純電動汽車運行狀態(tài)下安全節(jié)能最優(yōu)運動速度多目標優(yōu)化方法,采用動態(tài)規(guī)劃算法(DP)計算最優(yōu)的車速軌跡。定義車速、距離和時間為系統(tǒng)狀態(tài)x={v,d,t},系統(tǒng)控制量定義為驅(qū)動/制動力u=F將狀態(tài)量偏差(實際軌跡和參考軌跡之差)Δx、驅(qū)動/制動力變化量Δu、通行時間t設(shè)置為軟約束,路面附著系數(shù)、車輛穩(wěn)定性、驅(qū)動/制動平順性等決定的最大驅(qū)動/制動力及變化率定義為硬約束,道路限速、電池工作狀態(tài)、電機工作狀態(tài)等設(shè)置為硬約束。定義的優(yōu)化目標函數(shù)為
約束條件為:vmin(k)≤v(k)≤vmax(k)、Fmin(k)≤abs[F(k)]≤Fφ(k)、Fmin(k)≤abs[F(k)]≤Fs(k)、Fmin(k)≤Fd(k)≤Fmax(k)、SOCmin(k)≤SOC(k)≤SOCmax(k)。其中:R、E為能量和電池損耗權(quán)重因子;vmin和vmax分別為交通限制的最低和最高車速;Fmin為由行駛阻力限制的最小制動力/驅(qū)動力;Fφ為由道路附著限制產(chǎn)生的最大制動力/驅(qū)動力;Fd為電動汽車驅(qū)動力;Fmax為由電機決定的最大驅(qū)動/制動力;SOCmin和SOCmax分別電池工作時最小和最大荷電狀態(tài)約束。
智慧公交在多交叉口處的通行節(jié)能與高效通行問題可轉(zhuǎn)化為單車與多信號燈協(xié)同優(yōu)化問題。設(shè)計基于V2X獲取信息、智慧公交模型,多采用Agent智慧公交和信號燈協(xié)同控制架構(gòu),基于動態(tài)博弈算法的車輛-多交通信號燈協(xié)同控制方法[3],多Agent的智慧公交和信號燈協(xié)同控制,架構(gòu)見圖4。該系統(tǒng)框架分為外部信息層、決策規(guī)劃層、底層協(xié)調(diào)控制層和執(zhí)行層4個層級。依據(jù)網(wǎng)聯(lián)車輛與信號燈控制特點,底層控制層設(shè)計為網(wǎng)聯(lián)車輛Agent、信號燈Agent等子系統(tǒng)Agent,利用V2X實現(xiàn)各Agent主體的信息交互共享。網(wǎng)聯(lián)車輛在道路交叉口行駛時,多Agent框架能夠根據(jù)車輛信息、道路環(huán)境和交通信號等外部信息,通過上層決策規(guī)劃機制(智慧公交和信號燈協(xié)同控制優(yōu)化),提高車輛能量效率和交通效率。動態(tài)博弈算法在處理多約束條件、多目標優(yōu)化協(xié)調(diào)等方面的優(yōu)勢顯著,用來協(xié)調(diào)決策滿足控制需求的多路口通行方法。

圖4 多Agent的智慧公交和信號燈協(xié)同控制架構(gòu)
車路協(xié)同環(huán)境下,異質(zhì)交通要素之間可以通過車-車、車-路及車-云通訊組成多車編隊系統(tǒng),實現(xiàn)多車間感知、決策和控制的群智協(xié)同。首先在成員車端搭建車載無線通訊系統(tǒng),將多輛跟馳公交通過物理連接形成智慧公交虛擬編隊;其次擬采用仿真模擬、隊列微縮平臺開發(fā)及實車實驗的方式,建立智慧公交虛擬編隊的通用型數(shù)學(xué)模型,采用李雅普諾夫-克拉索夫斯基穩(wěn)定理論和魯棒控制研究異質(zhì)隊列中穩(wěn)定性、魯棒性和可擴展性,基于自適應(yīng)動態(tài)規(guī)劃和分布式模型預(yù)測控制,優(yōu)化面向敏捷節(jié)能高效的交叉口異質(zhì)隊列速度譜,實現(xiàn)非線性異質(zhì)公交隊列的分布式協(xié)同優(yōu)化[4],智慧公交虛擬編隊及群智控制系統(tǒng)研發(fā)技術(shù)路線見圖5。

圖5 智慧公交虛擬編隊及群智控制系統(tǒng)研發(fā)技術(shù)路線
為了將多輛跟馳公交通過物理連接形成智慧公交虛擬編隊,在每一成員車端搭建車載5G無線通訊系統(tǒng),主要由上位系統(tǒng)、下位系統(tǒng)、傳感系統(tǒng)及無線通訊設(shè)備組成[5]。無線通訊設(shè)備主要負責(zé)在保證通訊實時性和魯棒性的同時,將上位系統(tǒng)提供的感知信息發(fā)送給隊列中的其他成員車,并接收其他成員車傳遞的狀態(tài)信息。下位系統(tǒng)包括下位控制器和執(zhí)行器,依據(jù)傳來的控制期望實時改變行車狀態(tài)。傳感系統(tǒng)主要包括GPS/慣導(dǎo)設(shè)備和自主式傳感器,實時感知自車狀態(tài)和周圍環(huán)境信息。
為了實現(xiàn)隊列信息拓撲結(jié)構(gòu)、隊列幾何結(jié)構(gòu)對智慧公交隊列的影響,首先建立了表征公交隊列信息交互和動力學(xué)特性的分層式協(xié)同控制模型,解析車節(jié)點動力學(xué)、隊列信息拓撲結(jié)構(gòu)、隊列幾何結(jié)構(gòu)耦合機理。車輛隊列是由車輛節(jié)點通過信息拓撲結(jié)構(gòu)相互連接起來形成的復(fù)雜非線性系統(tǒng),而隊列的期望幾何結(jié)構(gòu)作為隊列穩(wěn)定性控制的強約束條件,在系統(tǒng)中起到至關(guān)重要的作用。為此可以將車輛隊列的信息拓撲結(jié)構(gòu)抽象為分層式協(xié)同控制模型的結(jié)構(gòu),采用虛擬編隊及群智控制系統(tǒng)表示跟隨車輛之間的信息傳遞、鄰接矩陣表示可獲取車輛的狀態(tài)信息、牽引矩陣表述車輛隊列中跟隨車輛是否能夠獲取領(lǐng)航車輛信息的矩陣,進而采用拉普拉斯有向路徑序列集表征多車編隊行駛軌跡。
為了保證公交隊列在多時滯及多干擾下的隊列穩(wěn)定和內(nèi)穩(wěn)定,基于車輛非線性動力學(xué)模型,將車輛的控制分為上、下兩層,下層采用反饋線性化技術(shù)將車輛模型簡化為線性積分器模型,上層控制器基于此線性化車輛模型,采用李雅普諾夫-克拉索夫斯基穩(wěn)定理論和魯棒控制方法,分析多車隊列系統(tǒng)在多時滯及多干擾下保持內(nèi)穩(wěn)定的條件判據(jù),設(shè)計一種弱保守性多車隊列分布式魯棒控制器;在內(nèi)穩(wěn)定的基礎(chǔ)上,借助多輸入系統(tǒng)H∞范數(shù)(魯棒性控制方法)的幾何含義,提出在多參數(shù)攝動及通信時滯情況下的隊列穩(wěn)定性條件,進而得到控制器魯棒增益的穩(wěn)定性區(qū)域。
針對車路協(xié)同環(huán)境下智慧公交多交叉口群體通行效率低下的問題,借助多交叉口信號配時信息,探究智慧公交隊列通行速度軌跡與能量消耗的高維耦合互聯(lián)關(guān)系,建立公交隊列群體通行與能量模型。基于自適應(yīng)動態(tài)規(guī)劃和分布式模型預(yù)測控制,優(yōu)化面向敏捷節(jié)能高效的交叉口隊列同步起步與高效通行統(tǒng)一速度譜,通過公交隊列縱、橫耦合動力學(xué)模型,將統(tǒng)一速度譜轉(zhuǎn)化為多車隊列最優(yōu)位置軌線和最優(yōu)車速譜,實現(xiàn)全局意義上的隊列閉環(huán)穩(wěn)定性、交通流通行效率和能量消耗率的自平衡最優(yōu)。
車路協(xié)同自動駕駛智慧公交系統(tǒng)通過上述4個子系統(tǒng),在公共路權(quán)環(huán)境下全方位實施車-車、車-路和人-車動態(tài)實時信息交互;在全時空動態(tài)交通信息采集與融合的基礎(chǔ)上,實現(xiàn)智慧公交自動駕駛風(fēng)險感知與編隊控制系統(tǒng),開展智慧公交安全與高效運行控制,充分實現(xiàn)人車路的有效協(xié)同,實現(xiàn)自動駕駛公交安全、高效和環(huán)保運營。本文研究提出的系統(tǒng)方案可提升城市公交系統(tǒng)乘坐體驗及行駛安全性,有助于優(yōu)化公交車在復(fù)雜環(huán)境中的適應(yīng)性,提高公交車輛的準時到達率,并最終實現(xiàn)公共交通安全、效率的大幅提高推動我國汽車智能化與網(wǎng)聯(lián)化進程。