史小平,林曉涵,李師輪,王子才
(1.哈爾濱工業大學 控制與仿真中心,哈爾濱 150080; 2.哈爾濱工業大學 航天學院,哈爾濱 150001)
近年來,考慮避免碰撞的編隊飛行航天器系統協同控制受到了廣泛的研究和關注[1-7]. 與魯棒性較差的單個航天器系統相比較[8],多航天器編隊飛行系統具有通信成本低、魯棒性強、效率高等優點[9],可以突破單個航天器編隊系統的局限,對探測所需要的控制目標有更廣闊的前景和更有意義的研究價值.
在航天器編隊飛行系統協同控制的實際應用中,要求航天器能獲得相互信息以實現對期望狀態的跟蹤. 然而在信息獲取的過程中由于距離和傳輸設備的約束,通常存在通信延遲[10]、信息無法實時準確獲取[11]、航天器之間存在碰撞等情況. 在編隊飛行過程中,由于存在燃料損耗,航天器質量等信息無法精確實時獲取,且在信息傳遞時會受到各種外部擾動的影響. 根據上述分析的問題,為了提高編隊航天器間協同控制的性能和精度,設計相應的自適應協同避碰控制算法具有重要的研究意義. 文獻[12]中對航天器編隊協同控制進行分析,同時考慮避免碰撞提出了3種不同的編隊跟蹤控制方法. 在文獻[13]中基于編隊衛星姿態動力學模型方程,通過引入速度濾波器設計了能夠保證速度誤差漸近收斂的自適應協同控制器. 文獻[14]進一步考慮推力校正和系統增益存在不確定性的情況下,提出了自適應跟蹤控制算法.在上述分析的協同控制律中均為全狀態反饋,而在實際的航天器編隊飛行任務應用中,為節約燃料消耗、防止航天器之間的相對速度測量裝置發生故障導致整個系統不穩定,需要保證編隊系統在無速度測量情況下的有效協同作用. 文獻[15]提出了一種僅利用領航-跟蹤航天器編隊中的相對姿態反饋跟蹤相對轉動的控制器. 文獻[16]考慮輸入受限的情況下,針對多Euler-Lagrange系統提出了一種無速度測量的分布式有限時間跟蹤控制算法.
在編隊飛行過程中,航天器之間避免碰撞是實現多航天器編隊跟蹤控制目標的重要保證. 近年來,在多無人機協同控制、機械系統同步控制、多無人車協同控制等方面引起了國內外廣泛的研究和關注. 碰撞規避的主要研究方法可以分為:博弈論、碰撞概率分析、數學規劃、半定規劃[17]和勢函數法[18].而勢函數因其簡單直觀的物理意義成為解決避免碰撞的一種重要方法[19-20]. 文獻[21]基于勢函數的方法對模型不確定的編隊飛行衛星系統設計了避免碰撞的自適應協同控制器,同時考慮了參考軌跡作用的問題. 文獻[22]設計了能保證Lagrange系統協同避碰的控制律,并考慮輸入擾動的影響. 在此基礎上,文獻[23]分析了Lagrange系統同時存在外部干擾和參數不確定的情況下的穩定性,并利用勢函數的方法設計相應的魯棒自適應控制算法.
受上述文獻的啟發,本文針對航天器質量未知和存在通信時延的情況,考慮反饋狀態對航天器編隊飛行系統的影響,分別對于全狀態反饋和無速度測量設計兩種自適應協同避碰控制律.首先,本文考慮了存在通信時延的航天器編隊飛行系統的自適應協同避碰控制問題,在設計相應控制律時,選取合理滿足系統的勢函數,實現避免碰撞的控制目標;其次,考慮航天器編隊反饋狀態的角度,分別提出了全狀態反饋和無速度測量的自適應協同避碰控制律,并同時考慮了航天器質量不確定性和通信時延,對于參數不確定有較好的自適應性; 最后通過仿真分析證明了所設計控制律的有效性.
在本文中每個航天器均假設為剛體結構,則n個航天器繞參考航天器編隊飛行情況示意圖,如圖1所示.其中FI{OIXIYIZI}為赤道慣性坐標系,其原點OI代表地球的中心.Fl{olxlylzl}為參考航天器軌道坐標系,用來描述編隊航天器間的相互運動,其原點ol位于參考航天器的質心,xl軸沿著地球質心指向參考航天器的矢量方向,yl軸垂直于xl軸并位于參考航天器軌道平面,zl軸通過右手定則獲得.rl為參考航天器相對于地球質心的位置矢量[24].

圖1 編隊航天器飛行系統坐標系
Fig.1 Coordinate frame for the formation spacecraft flying system
在不考慮參考航天器所受主動力控制的作用下,假設參考航天器在橢圓軌道上運行.ri、vi分別為第i個航天器相對與參考航天器的在編隊飛行系統中的位置和速度,則第i個航天器非線性動力學模型的相對運動方程為:
(1)
ni(rfi,rl)+di+fi,
(2)
其中:
(3)
(4)
(5)
(6)
式中:dl、dfi分別為參考航天器和第i個航天器所受到的外部干擾總和;θc為參考航天器的真近點角;rl、rfi分別為參考航天器和第i個航天器到地球中心的距離;I3×3為適當維數的單位矩陣,μ為地球引力常數.
為能夠更好地設計本文所提出的自適應協同避碰控制律,利用Euler-Lagrange方程來描述編隊飛行航天器系統的相對運動[25]:
(7)
式中:
本文中用加權無向圖G=(V,E,A)來描述編隊航天器之間的信息傳遞[26]:V={v1,…,vn}為節點集,E?V×V為連接節點的邊集,A=[aij]∈Rn×n為加權鄰接矩陣.若(j,i)∈E,且(i,j)∈E,則稱G為無向圖. 如果第j個節點有指向第i個節點的路徑且存在信息傳遞,則第j個節點就有一條邊指向第i個節點,記為(j,i)∈E.在無向圖中,如果任意兩點之間存在路徑連接,則無向圖具有連通性[26].
1.3.1 勢函數設計
本文利用勢函數的方法來完成多航天器編隊飛行避免碰撞的控制目標,使系統達到期望的控制狀態. 勢函數的主要優點在于:在期望的狀態下具有全局最小值,且具有較高勢函數值的區域代表障礙碰撞等限制情況. 受文獻[27]啟發,設計勢函數的主要思想如下:首先,定義一個反映系統約束條件的標量勢函數. 其次,利用勢函數的梯度值表示施加在航天器編隊上避免碰撞的控制力. 最后,設計適當的控制律使系統勢函數的值具有減小的趨勢,并且應用Lyapunov穩定性理論,保證編隊系統的位置和速度均同時收斂于期望狀態,滿足避免碰撞的控制目標.
Rij、rij分別為編隊系統通信和最小安全區域的距離,選取如下的避免碰撞勢函數:
式中,Vij(ri,rj)為一個非負連續的可微函數.
Vij沿向量ri的梯度表示為
1.3.2 控制目標設定


在本文中,為實現編隊航天器飛行系統的自適應協同避免碰撞控制,分別對于全狀態反饋和無速度測量情況,設計相應的控制律. 在設計控制律時,為實現編隊系統的穩定性應考慮:1)編隊航天器對期望位置和期望速度的跟蹤;2)編隊航天器的協同控制作用使其狀態趨于穩定;3)保證編隊航天器之間不發生碰撞.
將輔助變量定義如下:
通過利用滑模變結構理論,第i個航天器可以表示為
式中η為正常數.
定理1考慮航天器編隊相對運動模型(1)~(6),如果通信拓撲結構為無向圖,假設第i個航天器所受到的外部擾動di=0,在存在航天器質量參數不確定性、通信時延的情況下,同時考慮避免碰撞的控制目標,將航天器編隊飛行系統控制律設計如下:
(8)
(9)
(10)

定義第i個航天器的質量估計誤差為

根據勢函數設計與控制目標設定提出的勢函數方法和文獻[27]所提出的相關內容,本文對勢函數作如下假設.
假設1若拓撲結構為無向圖且Vij(‖ri-rj‖)對稱,則可以得到▽riVij(‖ri-rj‖)=-▽rjVij(‖ri-rj‖).

在本文中,假設航天器所受到外部擾動di=0,將控制律(8)~(10)代入式(2), 則閉環系統可以寫為
證明1定義如下Lyapunov函數:
(11)
將式(11)對時間求導,可以得到:
(12)
在對式(12)推導過程中,需要分析如下幾點:

2)若航天器編隊系統的通信拓撲結構為無向圖,則aij=aji,進一步可以得到如下等式成立:
3)若通信拓撲結構為無向圖且▽riVij=-▽rjVij,則
4)時間延遲滿足如下不等式:
根據上述分析,式(12)可以寫為


受文獻[29]啟發,考慮到通信時延的情況,設計一種無源濾波器:
(13)
(14)
式中:i=1,…,n,Θ∈R3是Hurwitz矩陣.Λ=ΛT∈R3×3為正定矩陣滿足如下Lyapunov等式:
ΘTΛ+ΛΘ=-Q,
式中,Λ、Q均為對稱正定陣.
定理2考慮航天器編隊相對運動模型(7),如果通信拓撲結構為無向圖,假設第i個航天器所受到的外部擾動di=0,在存在航天器質量參數不確定性、通信時延及速度無法測量的情況下,同時考慮避免碰撞的控制目標,將航天器編隊飛行系統控制律設計如下:
(15)
(16)
式中,ξi為自適應更新律的正常數量. 則有
引理1文獻[30]假設M∈Qp×p,N∈Qq×q,則下式成立:
1)(M?N)(A?B)=MA?NB.
2)假設M和N為可逆矩陣,則滿足(M?N)-1=M-1?N-1.
3)如果M和N是對稱正定的,則M?N同樣也為對陣矩陣.
與設計全狀態反饋控制律相似,假設航天器編隊受到的外部干擾為零,則閉環系統方程可寫為
證明定義如下Lyapunov函數:
(17)
將式(17)對時間求導,可以得到:

(18)
在對式(18)推導過程中,需要分析如下幾點:
1)根據式(13)可以得到如下:
(19)
2)如果編隊航天器之間相互作用的通信拓撲結構是無向的,且拓撲圖的邊指向航天器,則矩陣Ξ=LA+diag(a10,…,an0)是對陣正定的.
3)根據引理1可知,等式(Ξ?I3)-1(In?Λ)=Ξ-1?Λ是對稱正定的.
根據上述分析,式(18)可以重新寫為

為了驗證本文所設計控制律的有效性,以3個航天器編隊飛行系統為例,分別對全狀態反饋和無速度測量自適應協同控制進行相應的仿真.

將避免碰撞的最小安全距離設置為cij=10 m,選取勢函數為
首先,設置全狀態反饋自適應協同控制律(14)~(16)中的參數如下:λi=50,γi=50,α=1,通信拓撲圖為無向圖,則aij=0.5,反之aij=0.
在全狀態反饋自適應協同避碰控制律(8)~(10)的作用下,圖2、3分別為航天器編隊相對位置誤差曲線和相對速度誤差曲線.由圖2、3可以看出,在跟蹤到期望位置的過程中,編隊航天器相對于參考航天器速度收斂于零附近,同時編隊航天器相對距離在100 s后基本保持不變,在任意時刻相對距離均不小于c=10 m,避免碰撞的發生.

圖2 全狀態反饋相對位置誤差曲線

圖3 全狀態反饋相對速度誤差曲線
其次,設置無速度測量自適應協同避碰控制律(15)~(16)中的參數如下:β=1,ξi=0.1通信拓撲圖為無向圖,則aij=0.3,反之aij=0.
在無速度測量自適應協同避碰控制律(15)~(16)的作用下,圖4、5分別為航天器編隊相對位置誤差曲線和相對速度誤差曲線.由圖4、5可以看出,位置跟蹤誤差曲線和速度跟蹤誤差曲線均能收斂到零附近,且收斂時間具有同步性并保持編隊飛行系統穩定,在圖4中,相對位置跟蹤誤差以穩態誤差約為10-3m,而在圖5中相對速度跟蹤的穩態誤差約為10-5m/s.

圖4 無速度測量相對位置誤差曲線

圖5 無速度測量相對速度誤差曲線
圖6、圖7分別給出了全狀態反饋和無速度測量控制力曲線圖. 在圖6、圖7中可以看出,在仿真的初始階段由于存在通信延遲會產生較大的抖振,但隨著時間的變化曲線均達到收斂.與全狀態反饋自適應協同避碰控制律相比,編隊航天器在無速度測量自適應協同避碰控制律作用下,相對振幅較大,是由于航天器質量估計值在自適應更新律中穩態控制不能為零.因此,根據設計的控制律(8)~(10)、(15)~(16)可以看出,當輔助變量收斂到零附近時,控制變量不能達到零.

圖6 全狀態反饋控制力曲線

圖7 無速度測量控制力曲線
編隊航天器避免碰撞的相對位置變化軌跡如圖8所示,在航天器編隊飛行時假設各航天器為剛體結構,但是在實際應用運行過程中會受到姿態展開等因素的影響,這些干擾因素仍然是無法忽略的. 由圖8可以看出,各航天器均能到達期望軌跡且不發生碰撞. 根據上述分析可知,航天器編隊飛行閉環系統穩定性,并完成編隊跟蹤、避免碰撞、自適應協同控制的控制目標.

圖8 編隊航天器避免碰撞相對運動軌跡
Fig.8 Relative motion trajectories of formation spacecraft for collision avoidance
1)在航天器編隊飛行控制系統存在通信時延、質量參數不確定的情況下,考慮反饋狀態信息的不同狀態,提出了兩種具有較強魯棒性的自適應協同避碰控制律.
2)選取合理的勢函數包含在自適應協同避碰控制律中,實現編隊飛行系統避免碰撞的發生,具有較高的控制精度.
3)利用Lyapunov穩定性理論對所設計的兩種控制律進行理論分析證明,證明航天器編隊飛行閉環系統的漸近穩定性. 仿真結果進一步驗證了所設計控制律的有效性.