馬廣富,孫延超,凌惠祥,李傳江
(哈爾濱工業大學 航天學院,哈爾濱150001)
近距離跟蹤指向空間非合作目標有限時間控制
馬廣富,孫延超,凌惠祥,李傳江
(哈爾濱工業大學 航天學院,哈爾濱150001)
追蹤航天器在對空間非合作目標進行近距離跟蹤與監視時,需要接近非合作目標并從特定方位保持對目標的指向與觀測.針對非合作目標存在姿態翻滾以及未知軌道機動時追蹤航天器保持近距離跟蹤與指向的問題,在視線坐標系和體坐標系下分別建立了相對軌道和姿態的動力學方程,并構建了對軌道與姿態同步控制的六自由度模型,利用RBF神經網絡對系統不確定性及未知的目標運動參數進行自適應估計和補償,采用反步法思想設計控制器使追蹤航天器在有限時間內收斂到期望的相對軌道和姿態并維持保持狀態.進一步考慮控制輸入飽和、死區等非線性特性,對控制律進行改進.改進后的控制算法可以有效地提高控制精度,仿真結果驗證了控制對象模型和控制算法的有效性.
空間非合作目標;視線坐標系;有限時間控制;RBF神經網絡;反步法;輸入受限
隨著航天事業的快速發展,空間技術逐漸從最初的空間利用提升為空間控制[1],空間打擊、跟蹤監視、交會對接等問題的研究越來越受到航天大國的關注和重視,其中對空間非合作目標的接近和近距離跟蹤監視問題已經成為當今航天領域的一個非常重要的研究熱點.
經典的相對軌道動力學模型中,無論是只適用于近圓軌道的C-W方程還是考慮了軌道偏心率非零情況的Lawden方程[2-3],當針對非合作目標時,由于對目標的一些運動參數難以精確測量而無法有效使用.從接近非合作目標時的實際測量情況出發,文獻[4-6]提到了一種在以追蹤航天器質心為原點的視線坐標系下建立的相對運動模型,具有不限制目標軌道偏心率,解算方程不受目標未知參數影響,可在任意初始位置進行逼近和視線跟蹤等優點.文獻[5]還綜合考慮體坐標系下由相對誤差四元數描述的相對姿態方程,從而建立了六自由度的動力學模型.相對軌道與姿態的控制耦合問題主要有兩方面原因,一種是由期望控制指令引起的,另一種則是因為推力與姿態有關導致的[7].對于姿態軌道耦合控制,許多學者都進行了研究,其中文獻[8-9]從HJB方程中導出了魯棒性較好且使用方便的狀態依賴黎卡提方程法(state-dependent riccati equation,SDRE),可以用來解決一些含有不確定性的魯棒控制問題,但在線求解黎卡提方程使計算負擔增大.文獻[5,10-11]在進行姿軌耦合控制時,以能量消耗以及誤差最小為指標,引入中間變量,將SDRE方程轉化為迭代方程,有效降低了計算負擔,但這種控制方法在非合作目標同時存在軌道和姿態機動時,控制誤差較大.值得說明的是,上述研究主要都還是集中在合作目標的情況,而對于接近和跟蹤非合作目標的研究則較少.除了普遍存在模型不確定性和外部干擾外,對于追蹤航天器,非合作目標的一些運動信息無法精確已知.RBF神經網絡對未知非線性函數具有良好的逼近能力[12],因此可以對模型不確定性及外部干擾等進行逼近與補償.目前對于接近并跟蹤空間目標的研究大多都是實現控制誤差漸近穩定的控制結果,并且理論上系統狀態收斂到期望值的時間無窮大.有限時間控制[12]能夠使閉環系統的狀態在有限時間內收斂到平衡點,相比于非有限時間的控制方法不僅收斂更快,而且具有更好的魯棒性.許多有限時間控制方法采用反步法的思想來設計控制律[13],使用遞推的設計,使許多復雜、高階非線性系統的控制律設計變得簡便.對于實際的航天器控制,一定存在控制輸入飽和、死區等非線性特性[14-15],因此在進行姿態、軌道控制律設計時有必要考慮這些非線性特性對系統的影響.
本文針對非合作目標存在姿態翻滾以及未知軌道機動時,追蹤航天器對其保持近距離跟蹤與指向的問題,建立了姿態與軌道同步控制模型.考慮到系統不確定性、非合作目標運動參數部分未知等情況,利用RBF神經網絡方法進行自適應估計和補償,采用反步法思想設計控制律使追蹤航天器在有限時間內收斂到期望的相對軌道和姿態.然后,進一步考慮控制輸入飽和、死區等非線性特性,對控制律進行改進.通過在相同仿真參數條件下對本文所提出的兩種控制律進行仿真,驗證了兩種控制律的有效性,并且改進后的控制律在燃料消耗略微增加的情況下明顯地提高了控制精度.
1.1 視線坐標系
圖1中下標i表示慣性坐標系,l表示視線坐標系.慣性系Oixiyizi與視線系Olxlylzl及其關系如圖1所示,Ol為視線系的原點,位于追蹤航天器質心,xl軸與視線重合,yl軸位于由xl軸和yi軸組成的平面內且與xl軸垂直,zl軸由右手定則確定.qε和qβ分別稱為視線傾角和視線偏角,ρ為目標相對于追蹤航天器的位置矢量[5].

圖1 地心慣性坐標系與視線坐標系的位置關系
1.2 相對軌道動力學模型
相對軌道的動力學方程在視線系的投影為[5]
(1)
式中:×為反對稱矩陣;Δg=[Δgx,Δgy,Δgz]T為目標和追蹤航天器間的引力差(在對目標進行近距離接近和跟蹤時,該項可以忽略);f=[fx,fy, fz]T為目標的加速度,且對于追蹤航天器是未知的;uc=[ucx,ucy,ucz]T為追蹤航天器的控制加速度,其中下標c為追蹤航天器.將式(1)寫成分量的形式:
(2)
1.3 姿態動力學模型與運動學模型
追蹤航天器的姿態動力學方程為
(3)
式中:Jc=diag(Jc1,Jc2,Jc3)為轉動慣量矩陣;下標b為航天器體坐標系;ωbc=[ωx,ωy,ωz]T為相對慣性系的姿態角速度;Tc為控制力矩.
定義追蹤航天器按zxy轉序繞本體x、y、z軸的轉角分別為φ、θ、ψ,則追蹤航天器角速度可以表示為
(4)
為了表達式的簡便,定義矩陣R為

(5)
則有
(6)
1.4 期望軌道解算
當非合作目標存在姿態翻滾時,在視線系下特征點的相對位置會改變,從而導致追蹤航天器的期望軌道變化.設目標的特征點在其體坐標系下的單位矢量為nb,則追蹤航天器視線的期望方向為-nb.所以追蹤航天器期望視線方向在慣性系下的投影為[5]
(7)

(8)

1.5 期望姿態解算
在近距離跟蹤非合作目標過程中,追蹤航天器將實時對目標觀測.假設觀測裝置中心線沿追蹤航天器體坐標系的期望xbcf軸方向,要求xbc軸保持沿視線軸方向,則追蹤航天器體坐標系三軸期望的單位矢量為[5]
(9)

即可求解期望姿態角φf、θf、ψf,對式(9)求導并利用式(4)即可求解期望姿態角速度.
1.6 控制模型狀態空間表達式
針對本文所研究的問題,由于非合作目標的軌道機動未知,因此對于追蹤航天器,在任務初始時刻是偏離期望軌道的,從而需要調整相對軌道以達到對目標跟蹤監視的要求.然后進行跟蹤保持控制,而目標的姿態信息是能夠獲取的,所以追蹤航天器在初始時刻的姿態是接近期望姿態的,則式(10)是近似成立的.
(10)

(11)
本文將結合式(11)所示的非合作目標相對運動模型進行控制律設計,實現對空間非合作目標的接近、跟蹤以及指向等控制需求.
2.1 自適應神經網絡有限時間控制律設計
引理1[16]對于非線性系統:
(12)



對于近距離跟蹤指向空間非合作機動目標的問題,由式(11)所組成的非合作目標相對運動模型可以寫成如下不確定非線性動態系統形式:
(13)


(14)
式中:ci∈Rn,σi>0分別為第i個基函數的中心和寬度.
根據RBF神經網絡逼近非線性函數的原理,根據文獻[12],一般存在如下假設條件.
假設1 對于任意給定的足夠小的正數εN,總能找到最優加權矩陣θ*使逼近誤差滿足.
假設2 最優加權矩陣θ*是有界的,即存在一個正常數λ,滿足‖θ*‖≤λ.
因此非線性不確定函數w可以表示成
為了后續設計非合作目標控制律的需要,定義向量sig(·)α∈Rn的形式如下:
給出輔助控制器ν(e1)=-A-1(x1)K1sig(e1)α,其中K1=diag(k11,…,k1n)>0,0<α<1.定義誤差變量為
(15)
將式(15)代入系統(13)得到:
(16)
對于系統(13),給出如下自適應控制律:

(17)

(18)
式中:K2=diag(k21,…,k2n)>0,K3>0,Γ為一個正定對角矩陣.

式中:λ、Δi分別為小的正常數;e1i為向量e1的第i個元素;ηi(e1i)為向量η(e1)的第i個元素.
定理1 對于非合作目標控制系統(13),假設1和2均成立,則在控制律(17)~(18)作用下,閉環系統是全局有限時間穩定的.
證 將控制律(17)代入式(16)可得
(19)
首先, 證明閉環系統(19)是全局漸近穩定的.

(20)
選取K3>εN>‖ε‖,對式(20)求導,并由式(19)可得

(21)

然后,證明閉環系統(19)是全局有限時間穩定的.
由式(14)可知高斯函數0<φi(e)≤1,則‖φ(e)‖有界,根據范數的基本放縮性質,可以得到:

(22)


(23)

因此,根據引理1,對于給定的初始狀態e(0)=e0,e1和z將在有限時間內收斂到0.由ν(e1)和z的定義可知,當e1=0,z=0時,e2=0,因此閉環系統(19)是全局有限時間穩定的.
2.2 考慮輸入非線性有限時間控制律設計
對于近距離跟蹤指向非合作機動目標的問題,進一步考慮實際系統普遍存在的控制輸入飽和、死區等非線性特性.因此將系統(13)改寫成如下形式:
(24)
式中,D(u)為控制器的實際輸出,與理想控制輸出u、控制偏差Δu之間滿足如下關系式:

為了達到更好的控制效果,采用RBF神經網絡逼近g(x)Δu,可以得到:

對于不確定非線性動態系統(24),給出如下自適應控制律:

(25)
(26)
式中,ΓΔ為正定對角矩陣.
定理2 對于非合作目標控制系統(24),假設1和2均成立,則在控制律(25)~(26)作用下,閉環系統是全局有限時間穩定的.
證 將控制律(25)代入系統(24)可得
(27)
首先, 證明閉環系統(27)是全局漸近穩定的.

(28)
選取K3>εN+εΔN>‖ε‖+‖εΔ‖,對式(28)求導,并由系統(27)及式(25)可得

所以閉環系統(24)是全局漸近穩定的.
然后, 證明閉環系統(27)全局有限時間穩定.


因此,類似式(23)的處理過程,同理可以得到x1、z和x2在有限時間內收斂到0,因此閉環系統(27)是全局有限時間穩定的.
分別應用定理1,2的有限時間控制算法來解決近距離跟蹤指向非合作機動目標的問題,其中目標的加速度矢量在本文提出的兩種控制算法中未直接使用,而是采用RBF神經網絡來估計.對于由式(12)構成的系統,分別按照式(17)和式(25)設計控制器,按照式(18)和式(26)設計神經網絡加權矩陣更新律進行仿真,并加入控制飽和、死區等特性.
3.1 仿真參數
設追蹤航天器相對目標的初始距離為260 m,首先接近到距目標100 m處,然后再進行視線跟蹤.


控制律參數選取為K1=diag(0.28,0.05,0.10,1.00,1.00,4.00), K2=diag(6.50,2.00,2.60,0.80,0.36,0.40),K3=1×10-7,α= 0.8,λ=0.01,Δi=0.01.仿真時間為1 000s.
3.2 仿真結果及分析
圖2為追蹤航天器在近距離跟蹤指向非合作目標過程中相對軌道參數隨時間變化的曲線,包括相對距離、視線傾角和視線偏角.結合局部放大圖可以看出,在算法(17)或算法(25)作用下,都可以使追蹤航天器在22.9 s內從相距目標260 m接近到100 m,并保持對期望軌道的跟蹤.
圖3為追蹤航天器姿態角隨時間變化曲線,結合局部放大圖可以看出,在算法(17)或算法(25)作用下,都可以使姿態角在5.7 s內快速趨近于期望值,并保持在期望值附近,實現對非合作目標的指向觀測.

圖2 軌道相關參數隨時間變化曲線

圖3 追蹤航天器姿態角隨時間變化曲線


圖4 神經網絡的估計曲線


表1 全過程的燃料消耗對比情況

表2 控制精度對比情況
1)在視線坐標系和體坐標系下分別建立了相對軌道和姿態的動力學方程,構建了姿態軌道同步控制的六自由度模型.
2)利用RBF神經網絡對系統不確定性及未知的目標運動參數進行自適應估計和補償,采用反步法思想設計控制器使追蹤航天器在有限時間內收斂到期望的相對軌道和姿態并保持.
3)進一步考慮控制輸入飽和、死區等非線性特性,對控制律進行改進,在燃料消耗略有增加的情況下明顯地提高了控制精度.
[1] 蘇晏, 李克行, 黎康. 非合作目標追蹤與相對狀態保持控制技術研究[J]. 空間控制技術與應用, 2010, 36(6): 51-55. DOI: 10.3969/j.issn.1674-1579.2010.06. 011. SU Yan, LI Kehang, LI Kang. Control technology for relative states tracking and holding to uncooperative spacecraft[J]. Aerospace Contrd and Application, 2010, 36(6): 51-55. DOI: 10.3969/j.issn.1674-1579.2010.06. 011.
[2] CLOHESSY W H, WILTSHIRE R S. Terminal guidance gystem for satellite rendezvous[J]. Journal of the Astronautical Sciences, 1960, 27(9):653-658, 674. DOI: 10.2514/8.8704.
[3] LAWDEND F. Optimal trajectories for space navigation [M]. London: Butterworths, 1963.
[4] 張大偉, 宋申民, 裴潤, 等. 非合作目標自主交會對接的橢圓蔓葉線勢函數制導[J]. 宇航學報, 2010, 31(10): 2259-2268. DOI: 10.3873/j.issn.1000-1328.2010.10. 005. ZHANG Dawei, SONG Shenmin, PEI Run, et al. Ellipse cissoid-based potential function guidance for autonomous rendezvous and docking with non-cooperative target[J]. Journal of Astronautics, 2010,31(10): 2259-2268. DOI: 10.3873/j.issn.1000-1328.2010.10. 005.
[5] 高登巍, 羅建軍, 馬衛華, 等. 接近和跟蹤非合作機動目標的非線性最優控制[J]. 宇航學報, 2013, 34(6): 773-781. DOI: 10.3873/j.issn.1000-1328.2013.06.005. GAO Dengwei, LUO Jianjun, MA Weihua, et al. Nonlinear Optimal control of spacecraft approaching and tracking a non-cooperative maneuvering object[J]. Journal of Astronautics, 2013, 34(6): 773-781. DOI: 10.3873/j.issn.1000-1328.2013.06.005.
[6] 崔乃剛, 張立佳. 微型航天器與空間非合作目標交會制導方法[J]. 航空學報, 2009, 30(8): 1466-1471. DOI: 10.3321/j.issn:1000-6893.2009.08.017. CUI Naigang, ZHANG Lijia. Guidance of micro-spacecraft for rendezvous with noncooperative target[J]. ACTA Aeronautica ET Astronautica Sinica, 2009, 30(8): 1466-1471. DOI: 10.3321/j.issn:1000-6893.2009.08. 017.
[7] 盧偉, 耿云海, 陳雪芹, 等. 在軌服務航天器對目標的相對位置和姿態耦合控制[J]. 航空學報, 2011, 32(5): 857-865. LU Wei, GENG Yunhai, CHEN Xueqin, et al. Coupled control of relative position and attitude for on-orbit servicing spacecraft with respect to target[J]. ACTA Aeronautica ET Astronautica Sinica, 2011, 32(5): 857-865.
[8] STANSBERYD T, CLOUTIER J R. Position and attitude control of a spacecraft using the state-dependent riccati equation technique[C]//Proceedings of the American Control Conference. Chicago, IL: IEEE, 2000, 3: 1867-1871. DOI: 10.1109/ACC.2000.879525.
[9] XIN Ming, BALAKRISHNAN S N. State dependent Riccati equation based spacecraft attitude control [C]//Proceedings of the 40th AIAA Aerospace Sciences Meeting and Exhibit. Reno, NV: AIAA, 2002: 14-17.DOI: 10.2514/6.2002-1071.
[10] XIN Ming, PAN Hejia. Nonlinear optimal control of spacecraft approaching a tumbling target [J]. Aerospace Science and Technology, 2011, 15(2):79-89.DOI: 10.1016/j.ast.2010.05.009.
[11] XIN Ming, BALAKRISHNAN S N, STANSBERY D T. Spacecraft position and attitude control withθ-Dtechnique [C]//Proceedings of the 42nd AIAA Aerospace Sciences Meeting and Exhibit Renosn. Reno, Nevada: AIAA, 2004. DOI: 10.2514/6.2004-540.
[12] LIU Haitao, ZHANG Tie. Adaptive neural network finite-time control for uncertain robotic manipulators [J]. Journal of Intelligent & Robotic Systems, 2014, 75(3/4): 363-377. DOI: 10.1007/s10846-013-9888-5.
[13] GUO Yong, SONG Shenmin. Adaptive finite-time backstepping control for attitude tracking of spacecraft based on rotation matrix[J]. Chinese Journal of Aeronautics, 2014, 27(2): 375-382. DOI: 10.1016/j.cja.2014.02.017.
[14] LU Kunfeng, XIA Yuanqing, FU Mengyin. Controller design for rigid spacecraft attitude tracking with actuator saturation[J]. Information Sciences, 2013, 220: 343-366.DOI: 10.1016/j.ins.2012.07.039.
[15] JASIM N F, JASIM I F. Robustadaptive control of spacecraft attitude systems with unknown dead zones of unknown bounds[J]. Proceedings of the Institution of Mechanical Engineers, Part I: Journal of Systems and Control Engineering, 2012, 226(7): 947-955. DOI :10.1177/0959651812443926.
[16] BHATS P, BERNSTEIN D S. Finite-time stability of continuous autonomous systems [J]. SIAM Journal on Control and Optimization, 2000, 38(3): 751-766. DOI: 10.1137/S0363012997321358.
(編輯 張 紅)
封面圖片說明
封面圖片來自本期論文“集群航天器網絡發展現狀及關鍵技術”,是哈爾濱工業大學航天學院所研究的集群航天器示意圖.集群航天器是一種通過無線鏈路進行信息交互的,多航天器間協同工作的新型航天器構架,服務于未來日益復雜多樣的空間探索任務.如左圖中所示,空間信息網絡作為一個以多種空間平臺(如同步衛星或中、低軌道衛星、平流層氣球等)為載體,實時獲取、傳輸和處理空間信息的網絡系統,而集群航天器網絡則是構成該信息網絡的一類子網絡系統,承擔著空間信息采集與傳輸的任務.右上圖為多個集群航天器在軌協同工作的示意圖,如集群航天器A、D之間通過星間無線鏈路協同完成空間任務.同時,該圖也說明了集群航天器是一類由多個近距離相伴飛行的航天器構成的分布式系統.右下圖為集群航天器網絡內各航天器在一定范圍內相互繞飛,其網絡拓撲結構隨時間變化,且變化規律具有周期性和可預測性.
(圖文提供:陳慶,張錦繡,曹喜濱.哈爾濱工業大學 航天學院)
Finite-time control of spacecraft closely tracking and pointing non-cooperative space target
MA Guangfu, SUN Yanchao, LING Huixiang, LI Chuanjiang
(School of Astronautics, Harbin Institute of Technology, Harbin 150001, China)
When the chaser spacecraft closely tracks and observes the non-cooperative target in space, it should approach to and keep pointing to the non-cooperative target from the particular direction. For the problem that the chaser spacecraft keeps closely tracking and pointing to the non-cooperative target, in the case of the target with the attitude motion and the unknown orbit maneuver, based on the relative orbit dynamics and the attitude dynamics which are described in the line-of-sight coordinate frame and the body coordinate frame, respectively, the six-degree-of-freedom model of orbit and attitude simultaneously control is proposed. The RBF neural network is employed to adaptively estimate and compensate the system uncertainties and the unknown motion parameters of the target. Using the backstepping method, a controller which can control the chaser spacecraft to converge to the desired relative orbit and attitude in finite time is proposed. Considering the nonlinearity of the control input, such as saturation and dead zone, an improved control algorithm is developed. The simulation results are provided to show the effectiveness of the control model and the control algorithms. Moreover, the improved control method has higher control accuracy.
non-cooperative target; line-of-sight coordinate frame; finite-time control; RBF neural network; backstepping; input constraint
10.11918/j.issn.0367-6234.201511076
2015-11-20
國家自然科學基金(61304005, 61174200);高等學校博士學科點專項科研基金 (20102302110031)
馬廣富(1963—),男,教授,博士生導師
孫延超, sunyanchao@hit.edu.cn
V448.2
A
0367-6234(2017)04-0008-08