武梅麗文,王曉東,宋勛,陳燕飛
(1.北京電子工程總體研究所,北京 100854;2.空軍裝備部駐北京地區第一軍事代表室,北京 100854)
隨著時代的推進,戰爭的形式在逐漸轉變,作戰理念從“空海地一體戰”、“拒止戰”發展到“分布式作戰”、“馬賽克戰”等,對抗的矛頭逐步從裝備較量、技能較量轉向智能較量,未來戰場變得愈發復雜。面對高度對抗、高度不確定的戰場環境,集群作戰理念應運而生。集群作戰旨在弱化高水平單平臺的裝備實力,強調小型大量單一功能平臺的力量匯聚,注重發展體系戰作戰概念。無人集群系統可包含無人機集群、無人車集群及他們的異構重組,若考慮更大空間尺度上的應用,還涉及協同導彈彈群等等。除應對集群作戰場景,無人集群編隊還可應用于森林防火救援、城市物流、環境監測、攝影攝像等諸多民用領域,具有廣闊的應用前景。編隊控制作為無人集群應用技術的核心,有以下主要研究內容,如編隊控制律設計、隊形設計、隊形保持、隊形切換、編隊避障等,構建出較為復雜的綜合研究網。
為了實現無人集群的編隊控制,考慮以下主要控制策略:一是跟隨領航者法,即在隊形中選取某一個智能體為領航者,而其他智能體跟隨領航者運動。將編隊轉化成領航/跟航策略,即可利用標準控制理論進行穩定跟蹤誤差設計[1];二是虛擬結構法,相比領航者法,虛擬結構法不需要設置真實的領航者,只需要設定虛擬參考編隊點來實現控制[2]。這種方法可以擺脫因領航者故障而帶來的編隊癱瘓問題。為了實現虛擬結構,除了利用點對點軌跡跟蹤方法以外,還可以引入相似一致性方法,保持隊形的穩定,增強隊形抗干擾性。如文獻[3],Ren等人利用相鄰節點信息構建相似一致編隊框架,在非時變的編隊問題中達到隊形快速收斂的效果。后Dong等人將相似一致性方法應用到多無人機時變編隊問題中,并在試驗中驗證了控制算法的高效性[4];三是基于行為法,這種方法將控制邏輯提取為一系列行為的組合,其核心在于設計并選擇合適有效的基本行為序列,實現控制的最終目的。近些年借著交叉學科發展的契機,從生物界汲取靈感,探究例如“狼群”“蜂群”“魚群”的行為機制,發展基于群體智能的集群控制方法,已有很多理論積累[5-6]。
除了上層的編隊控制架構以外,為實現理想的運動軌跡,底層的編隊控制律設計也尤為重要。在工程應用中,常用的控制方法有PID、最優控制線性二次型調節器(LQR)[7]及見長于軌跡跟蹤、障礙規避的模型預測控制(MPC)[8-10]等。編隊個體數量龐大,編隊控制優化問題復雜,需要借助優化控制的方法來減輕實現編隊隊形及軌跡的難度。因此本文聚焦于2種優化控制方法,LQR和MPC的控制效果。LQR主要通過加權矩陣Q和R的選取來影響控制性能,如控制強度、收斂速度等。MPC則主要借助于未來窗口長度,對軌跡跟蹤的效果在未來幾步做綜合推演,以確定當前時刻控制量的大小。MPC可利用二次規劃(QP)等方法在線求解線性約束,獲得多約束條件下的優化控制量,滿足無人平臺行進的物理限制[11-12],應用于無人駕駛車輛軌跡跟蹤避障[13-15]、航天器交互對接中都表現出很好的控制效果。
本文基于相似一致性編隊算法,利用圓形編隊場景,對線性二次型控制及模型預測控制進行控制效果研究。智能體的編隊行進軌跡都可以拆解成直線和圓弧線兩種跟蹤模式,且任何曲線軌跡其實都可以近似由這兩種軌跡拼接組合,而智能體在圓形編隊場景中,隨著轉彎半徑的縮小,行駛速度的增大,對于軌跡跟蹤的效果往往不盡人意。因此本文選擇這兩種優化算法對其在編隊轉彎中的應用進行對比分析,得出結論。
考慮N個無人機智能體編隊飛行,采用二維運動學模型,則每一智能體模型表示如下:

(1)
式中:x(t)為位置;v(t)為線速度;u(t)為控制量。
定義單智能體的狀態變量為xi(i∈IN),控制變量為ui(i∈IN),則
xi=(xix,vix,xiy,viy)T,
(2)
ui=(uix,uiy)T,
(3)
式中:下標x和y代表二維平面的2個坐標方向。
那么多智能體系統的狀態變量為
x=(x1,x2,…,xN)T.
(4)
控制變量為
u=(u1,u2,…,uN)T,i∈IN.
預先定義時變編隊構型H為
H=(h1,h2,…,hN)T,
(5)
式中:hi=(hiposition,hivelocity),i∈IN。
基于相似一致性編隊控制原理,有:
定義1:對多智能體系統(1),在任意給定的有限初始狀態下,當

(6)
則稱(1)實現了時變編隊。
式(6)中c(t)代表編隊中心的狀態,編隊中心是時變的,若考慮統一編隊中心,則代表虛擬中心方法,若考慮相鄰點狀態量,則是利用相似一致性原則。基于相似一致性原理,推導定義1可得定義2。
定義2:對多智能體系統(1),在任意給定的有限初始狀態下,當有
(7)
則稱(1)實現了時變編隊。
若分析圓形編隊構型,有
(8)
式中:Rc為軌跡半徑;Vc為編隊線速度。
首先分析單智能體動力學模型。定義模型為
(9)
(10)
根據LQR方法,定義代價函數JLQR為
(11)
式中:Q為反饋狀態變量的權重;R用于限制控制力強度。
獲取使代價函數最小的控制量u*為LQR的最優控制結果。推導最優控制反饋KLQR為
(12)
在最優控制反饋KLQR的作用下,最優控制量u*的解析表達式為
(13)
式中:P可由黎卡提方程求解:
(14)

LQR算法應用于單智能體系統的控制邏輯圖見圖1。

圖1 LQR算法邏輯圖Fig.1 LQR logic diagram
為了進行模型預測控制MPC的設計,首先要理解方法的原理。MPC和PID,LQR控制都屬于線性控制方法,運用線性化動力學模型進行計算。對比MPC和PID,兩者區別:一是MPC引入優化方法,通過優化算法獲取最優控制量,而PID只是單步反饋,控制量是恒定的;二是,MPC考慮多步模型預測進行優化控制,視野窗向前推進多步。其中第一方面,MPC運用優化方法,就可以方便的引入多變量約束;第二方面多步優化,能夠對未來有更好的預測,實現軌跡快速收斂或簡單避障。這些優點可以減輕PID方法控制延遲、魯棒性低、易受干擾、單步反饋控制存在穩態誤差等諸多弊端。而LQR方法雖然也是通過代價函數取優的,但是對比MPC和LQR方法可發現,LQR的代價函數是由當下時間到時間無窮大的區間進行推導的,目的是確保控制最終結果的穩定性,而不是針對控制過程的優劣性進行設計;而MPC的優化考慮的是每一個步運算向前推進幾步的窗口范圍內的優化結果,更加關注視野范圍內的控制效果,對于過程的優化效果更加顯著。
為了實現模型預測控制MPC,第一步需要定義單智能體的代價函數JMPC:

(15)
式中:Nu代表控制量的個數,對于本文單智能體動力學模型來說,Nu為2;p為未來窗口長度;NK為單智能體狀態變量個數;wi為加權函數。
為了在MPC優化中加入對于控制力強度的約束,更新式(15)為
(16)
式中:λ為限制控制量變化率的算子。
為了求解JiMPC的最小值,應用二次規劃QP。QP求解器的形式為

(17)

MPC算法應用于單智能體系統的控制邏輯圖如圖2所示。

圖2 MPC算法邏輯圖Fig.2 MPC logic diagram
基于上文介紹的2種編隊控制方法,設計圓形編隊軌跡半徑為10 m,編隊線速度為10 m/s,編隊個數為4,實現編隊仿真。編隊參考點在圓上均布排列,繞圓心旋轉。編隊控制的期望效果是4個無人機個體(或其他智能體)協同追蹤參考軌跡圓上的4個期望位置,實現最小位置偏差。計算時間間隔為0.01 s,MPC未來窗口長度為25步。


圖3 編隊控制算法側向誤差對比Fig.3 Comparison of lateral errors of formation control algorithms

圖4 LQR方法控制仿真結果Fig.4 LQR simulation results

圖5 MPC方法控制仿真結果Fig.5 MPC simulation results
本文選擇LQR和MPC兩種最優控制方法,探究應用于圓形軌跡工況的編隊控制效果。基于相似一致性原則,搭建時變編隊控制模型,利用二階動力學模型,分析二維運動的編隊規律,得到以下結論:
(1) 相比LQR算法,MPC算法控制編隊更為穩定,收斂迅速,側向控制誤差減少60%。
(2) 增加側向加速度補償之后,MPC方法側向控制誤差減少90% 以上,并保持原有編隊穩定性。
考慮MPC方法的快速收斂性、穩定性及其用于編隊控制中障礙規避的潛力,MPC有著廣闊的應用前景,值得在編隊試驗中進行更為深入的研究。