田大新,黃米琪,李嘉煒,段續(xù)庭
(北京航空航天大學,北京 100191)
車聯(lián)網技術的蓬勃發(fā)展為無人車輛編隊的發(fā)展奠定了堅實的基礎,并且車輛編隊相關技術的研究也在一些領域逐漸開始發(fā)展,如民用物流產業(yè)的無人卡車編隊或是軍用的無人戰(zhàn)車編隊等[1]。車輛編隊的隊形控制問題是研究實現(xiàn)車輛編隊的重要研究內容,而無人車作為智能體的一種,研究車輛編隊隊形控制問題也就類似于研究多智能體的隊形控制策略問題。隊形控制問題即是對多智能體群體的幾何形態(tài)進行控制,當其在向預定的目標或方向前進時,能夠使群體保持設定的隊形,并且避免撞到障礙物和環(huán)境限界[2]。本文將主要介紹近些年車輛編隊隊形控制的主要研究問題,從多智能體角度出發(fā)總結一些適用于車輛編隊分布式隊形控制的方法并簡要分析每種方法的特點,舉例介紹兩種隊形控制應用場景,最后總結未來隊形控制問題的一些研究方向。
多智能體技術經歷了十幾年的發(fā)展,在隊形控制方面的研究也日漸成熟,隊形的形成、保持和變換過程是隊形控制方面的主要研究點[3-4]。
智能車輛在還未開始編隊時在隨機的位置,如何使車輛快速穩(wěn)定的組織形成編隊是首先要考慮的問題。隊形形成過程的主要目標是讓多智能體自主形成目標隊形。
隊形成形過程示意圖如圖1 所示:

圖1 隊形成形過程示意圖
隊形保持指的是形成目標隊形后,車輛根據(jù)需求按指定隊形穩(wěn)定快速到達目標位置。隊形保持要研究的問題是在多智能體形成預定的幾何形態(tài)后,群體如何保持不變的隊形來進行后續(xù)的運動和作業(yè)的完成。
隊形保持過程示意圖如圖2 所示:

圖2 隊形保持過程示意圖
在實現(xiàn)一些作業(yè)需求時編隊的隊形需要切換,有時需要變換隊形來避免障礙物。隊形變換的兩種形式分別為主動變換和被動變換:主動變換一般發(fā)生在編隊群體為了完成目標任務要求時,變換后的隊形更有利于作業(yè)的進行或者可以提高作業(yè)的完成度。而被動變換是指編隊群體被迫采取隊形變換策略來保證作業(yè)的順利進行,這往往是由于環(huán)境改變導致的,例如多智能體遇到了障礙物需要躲避。
隊形切換過程示意圖如圖3 所示:

圖3 隊形切換過程示意圖
車輛編隊控制策略可分為三種:集中式、主從式和分布式控制策略。結合智能車輛的特點,主要采用的是分布式控制策略[5]。本文將選取以分布式控制策略為背景的幾種較為經典且應用比較廣泛的控制方法進行主要的介紹。
很早人們就注意到自然界的諸多群體行為,并對其展開了研究并將其應用[6]。最初行動選擇法是通過研究動物的行動,如鳥類、魚類的聚集行動,并將其應用于計算機仿真,后逐漸被推廣應用到其他領域[7]。采用行動選擇法對編隊群體進行控制即是通過設定智能體的局部控制策略以及智能體的行動方式,來達到對群體整體運行的控制[8]。受控的基本動作根據(jù)預定目標的不同被分為了隊形的保持與切換、障礙物的規(guī)避和碰撞的避免,這些行動都被設置了特定的觸發(fā)條件,當編隊車輛自身的傳感器接收到的環(huán)境信號滿足觸發(fā)條件時,車輛會根據(jù)輸入的刺激信號做出期望反應即產生輸出信號,常見的輸出信號為方向和運動速度向量[9]。
對于智能車輛行動選擇方案的設計,需要考慮以下兩點因素:一是考慮編隊車輛在執(zhí)行任務的過程中會遇到的一般情況和特殊情況;二是考慮將智能車輛能否執(zhí)行相應任務作為方案限制。對于智能群體行動選擇機制的研究主要包括三種方法:行動抑制法、加權平均法和模糊邏輯法[10]。盡管各個行動之間是彼此獨立的,但有時不同行動的發(fā)生時間會發(fā)生沖突,行動抑制法則旨在按照設定的規(guī)則對不同的行動編排優(yōu)先級以解決沖突問題,當沖突發(fā)生時優(yōu)先級高的行動抑制優(yōu)先級低的行動。加權平均法是一種通過計算行動的重要性來決定行動選擇的方法,得到的選擇結果與預期匹配度較高,其作用機制則是給不同行動的矢量輸出乘以一定的權重并將其求和,得到的權值大小代表了相對應行動的重要程度,再經過正則化后作為編隊群體的輸出。模糊邏輯法則是加權平均法的進一步演變,在不同的場景下為行動的輸出賦予不同的權重大小,并且根據(jù)規(guī)則構建模糊判別函數(shù),根據(jù)判別規(guī)則綜合不同行動的輸出,最終確定編隊群體的行動。行動選擇法是一種分布式控制策略,具有可擴展規(guī)模的特性,智能體向其他智能體傳輸信息,根據(jù)獲取的信息進行行動的抉擇,編隊群體的隊形控制具有明顯的反饋特征。但是基于行動選擇法的行動控制難以量化,導致其在穩(wěn)定性等性質分析上難以進行。
人工勢場法來源于物理學中的電子在電場中運動,該方法假設構造一個虛擬力場,力場中包含的主要要素有智能體、目標點和障礙物,其中力的產生和強弱規(guī)則的制定如下:虛擬力場中的目標點對智能體產生吸引力,智能體離目標點越近吸引力越弱;而力場中的障礙物則對智能體產生排斥力,并且智能體離障礙物越近排斥力越強。智能體同時受到吸引力和排斥力的作用而將沿著勢能最小的方向運動[11],在勢場力的控制作用下多智能體形成編隊。但是不同的編隊隊形對勢場函數(shù)的定義要求是不同的,勢場函數(shù)的設計也較為復雜[13]。
人工勢場受力示意圖如圖4 所示:

圖4 人工勢場受力示意圖
比如有學者提出引力勢場函數(shù)為[12]:

其中參數(shù)Ka為引力勢場常量,qi為位置矢量,qgoal為目標位置。
斥力勢能函數(shù)定義為:

其中常數(shù)Kr為斥力勢能場常量,函數(shù)斥力勢能場影響的范圍有距離閥值r0控制。
當編隊在隊形保持的情況下進行整體移動時,關鍵是保持每個車輛的相對位置不變。為解決這個問題,引入了虛擬結構(Virtual Structure)的概念[14-16],將每輛車看作是一個剛體結構上相對位置固定的點,將整個隊形看做是虛擬的剛性結構,車輛跟蹤虛擬的結構點運動。剛性結構體的特點是整體的位置在其運動的過程中會發(fā)生變化,但是結構體上每一個點的相對位置并不會改變。若將編隊隊形的保持問題用虛擬結構體來模擬,即將剛體上的若干點看作是智能體,即剛體在空間中運動時,盡管智能體群的位置發(fā)生了變化,但是在以剛體作為參考的坐標系下智能體群的位置是沒有改變的,多智能體保持不變的幾何形態(tài)運動,構成了一個假想的剛性結構,即虛擬結構。虛擬結構法將多智能體的編隊問題轉換成了跟蹤問題,智能體群將跟蹤虛擬結構上經過對隊形計算分析得到的相應期望點,來實現(xiàn)隊形的保持。但是虛擬結構法實現(xiàn)的跟蹤軌跡是通過對隊形進行分析得到的,并且軌跡的獲取需要參考其余智能體的位置信息。虛擬結構法具有較高的控制精度和對隊形進行反饋的特點,能夠較好地控制編隊群體地整體行為,但是其對系統(tǒng)的通信質量和計算能力有較高的要求。
拉普拉斯算法已經從實數(shù)域擴展到了復數(shù)域,目前的研究在二維以及更高維的編隊控制領域取得了豐碩的成果。
將多智能體系統(tǒng)看作一個圖G(如圖5 是一個有5個節(jié)點的圖),每個智能體對應圖的一個節(jié)點[17]。對于一個有n個節(jié)點的圖G,拉普拉斯矩陣是一個n×n維的實矩陣,復拉普拉斯矩陣的定義沿用了實拉普拉斯矩陣的定義方式,在此基礎上加入了復數(shù):


圖5 有5個節(jié)點的圖
將實拉普拉斯法應用于一維的編隊場景中,智能體群能實現(xiàn)編隊的前提條件有兩種:第一種是當且僅當該拉普拉斯矩陣有一個零特征根;或者是存在一個根位于編隊隊形關系圖中,并且可以從該根到達所有其他節(jié)點。
林志贄教授所帶領的團隊不僅對實數(shù)拉普拉斯矩陣進行了相關研究,該團隊還利用復數(shù)拉普拉斯矩陣在多智能體編隊領域進行了研究,引入了無向和有向的拓撲結構,并且提出了相似編隊的概念[18],當且僅當在拉普拉斯矩陣L有一個關于特征向量的零特征值的條件下,所描述的框架是相似的。基于前期研究,林志贄教授所帶領的團隊還將多智能體的隊形控制問題應用到了切換拓撲網絡結構中[19]。該團隊將無向拓撲結構引入后,利用復拉普拉斯矩陣和空間拓撲結構對編隊隊形控制問題進行了刻畫。該團隊的另一項研究成果是基于復拉普拉斯矩陣設計了以相對位置信息為基礎的隊形分布式控制方法。由于編隊群體傳感能力受限、環(huán)境復雜度等問題,該團隊還將研究擴展到了基于有向拓撲結構的多智能體隊形控制問題。
領航跟隨者法中的領航者是編隊中被指定的某一智能體,其他智能體通過獲取領航者的運動信息(位置和方向等)來設計自身的運動軌跡從而達到追蹤領航者的目的。目前領航跟隨者法主要被分為以下三類:令領航者和跟隨者保持相應的距離和角度的方法被叫做l-φ控制方法;設定兩個領航者,并且設定跟隨者以一定的距離關系跟隨領航者的方法被叫做l-l控制方法;一種更為靈活的控制策略叫做l-φ-l混合控制方法,基于該控制方法跟隨者既可以以l-φ控制方法追蹤領航者,也可以按照l-l控制方法來設定兩個領航者[20]。
以美國賓夕法尼亞大學的Kumar 教授領導的GRASP團隊對領航跟隨者法進行了大量深入的理論研究以及實驗驗證[21],實現(xiàn)了多智能體任意隊形的切換。該團隊提出了使跟隨者不僅受領航者的引導,而且還與編隊中其余智能體進行信息交互并協(xié)同運動的控制策略,即合作跟隨領航者法[22-23]。后期又有學者基于領航跟隨法提出了虛擬領航者方法,即設置與編隊成員運動狀況完全相同的虛擬領航者作為編隊的領航者,防止發(fā)生因領航者失能編隊隊形失控的現(xiàn)象。
多種隊形控制方法的結合也是一種很好的隊形控制策略。目前有許多的學者進行了這方面的研究。如結合領航跟隨法和人工勢場法的結合[24],領航跟隨法和虛擬結構法的結合[25],基于行為的領航跟隨者法[26]等。多種方法的結合可以互相彌補不同方法的缺點,使控制策略更加的完美。
根據(jù)車輛的行駛環(huán)境,可以將編隊控制的背景分為兩大類,一類是有道路限制,就是車輛需要按照已有的道路軌跡行駛,在進行隊形的控制時需要考慮道路限制對編隊的影響;第二類是無道路限制,此時編隊的行駛軌跡和編隊中每個車輛在隊形變換的過程中的行駛軌跡是不受道路限制的,但需要考慮路面障礙物對編隊整體及編隊內車輛的影響。下面將詳細介紹兩種應用場景。
如圖6 所示,公路卡車編隊是一種典型的有道路限制的編隊控制應用場景。公路卡車編隊運行可以降低駕駛員的勞動強度,降低車輛油耗,減少卡車安全事故,降低運輸企業(yè)的成本。卡車編隊一般控制目標是盡可能縮短車輛之間的跟車距離,使跟隨卡車以最小的行駛風阻以達到省油的目的。國內外目前多家企業(yè)開展了卡車編隊的研發(fā),沃爾沃公司率先研發(fā)列隊行駛;大陸集團與克諾爾合作進行商用車編隊行駛項目測試;2018 年豐田通商、日野、五十鈴等日本四家卡車公司做了約15 km的編隊行駛實證實驗;2019 年戴姆勒開始自動卡車高速公路測試工作;一汽解放青島港展示了國內首個卡車智能編隊行駛運營。

圖6 卡車編隊
以俄羅斯、美國、中國為代表的國家在發(fā)展無人戰(zhàn)車技術上有了一定的成果[27-28],并且俄羅斯也已經在敘利亞戰(zhàn)場上開始應用無人戰(zhàn)車作戰(zhàn);同時未來戰(zhàn)場作戰(zhàn)環(huán)境發(fā)展趨勢將是信息化和非接觸的,而集群協(xié)同作戰(zhàn)可顯著提升探測、突防、打擊等效能,是未來體系化、網絡化協(xié)同作戰(zhàn)的制高點技術。綜合以上所述,多無人戰(zhàn)車集群控制將是車輛編隊控制的熱點研究內容,也是一種典型的無道路限制智能車編隊應用場景。未來無人戰(zhàn)車編隊集群與無人機的異構編隊控制將是重要的研究方向,也將在未來戰(zhàn)場上發(fā)揮重要作用。

圖7 無人戰(zhàn)車及無人集群作戰(zhàn)
編隊隊形控制問題的相關理論研究取得了豐碩的成果,但實際應用尚有欠缺,控制相關理論和實際的結合和應用差距還較大。目前大部分的理論研究都是基于線性模型展開,但是車輛作為一個復雜的非線性系統(tǒng),基于線性模型得到的理論成果并不能直接應用于智能車,如何利用已有研究成果探索編隊控制問題也面臨挑戰(zhàn)。目前的理論成果對于小規(guī)模系統(tǒng)控制有著很好的效果,但是如何解決大規(guī)模系統(tǒng)的編隊控制也是值得研究的問題。分布式的控制策略對于解決大規(guī)模編隊控制有著很好的效果,但是針對小規(guī)模系統(tǒng)的編隊控制應如何懸著集中式還是分布式控制策略,什么樣的場景應該如何選擇控制方法和控制策略也是需要考慮的問題。