周 洋,閆 野,黃 煦
(國防科學技術大學 航天科學與工程學院,湖南 長沙 410073)
解決有限推力航天器最優交會問題主要有間接法和直接法[1]。直接法是將連續的最優控制問題離散并參數化,直接用數值方法尋優,由于計算機技術進展獲得了很大的發展[2]。間接法是基于Pontryagin極大值原理將最優控制問題轉化為一個邊值問題,但協態變量的初值難以選取。直接配點法將控制變量和狀態變量同時離散,也稱作直接配點非線性規劃(DCNLP)[3]。文獻[4]用非線性規劃法研究了共面航天器的最優交會問題,但其設計變量多達159個。文獻[5]先求取變軌問題的雙脈沖最優解,再用Gauss偽譜法求解有限推力解。文獻[6]用高階多項式以獲得更高的精度,但增加了非線性規劃(NLP)問題求解的難度。文獻[7]用五階多項式擬合狀態量解決了最小時間攔截等簡單問題,具較高的精度。
本文基于改進配點法,對有限推力航天器最省燃料交會進行了研究。
航天器交會過程中若目標航天器運行于圓軌道,且相對距離遠小于目標軌道半徑時,則可由CW方程近似描述兩個航天器的相對運動。C-W方程建立在目標軌道坐標系中,坐標原點O位于目標質心,Ox軸沿目標的地心矢徑方向,Oz軸與目標軌道角動量方向重合,Oy軸由右手法則確定。C-W方程具體形式為

式中:x,y,z別為追蹤航天器的位置狀態;aTx,aTy,aTz分別為3個方向的推力加速度;n為目標軌道角速度。


優化性能指標為

由于采用有限推力,推力加速度aT滿足約束

DCNLP中最常見是三階Simpson法。具體為:先將系統整個時間過程分為N段,每段的兩個端點為節點,在兩節點間用三次Hermite多項式代表狀態變量隨時間的變化關系,并假定控制量變化為線性[3]。
每一段區間為[ti,ti+1],記

節點間狀態量用三次Hermite多項式表示

則多項式的系數矩陣

形成由

缺陷向量構成等式約束。此處:

文獻[7]指出,用更高階Gauss-Lobatto多項式表示節點間的狀態量時有更高的精度,但會加大求解NLP問題的難度。但如系統方程有

形式,就可用五階多項式擬合狀態量的變化,同樣假設控制量的變化為線性,能在不增加約束條件的情況下提高精度。對C-W方程,有

式中:X1,X2分別為位置和速度狀態,且X1=[xyz]T,X2= [vxvyvz]T;A,B為系數矩陣,且

狀態量X1用五階多項式表示為

則五階多項式的系數為


與三階直接配點法類似,形成缺陷向量

其中,中間狀態量X1(tc1),X1(tc2),X2(tc1),X2(tc2)滿足

用SQP算法優化時直接將缺陷向量作為約束條件,效率非常低。將約束改寫為

的線性形式后,優化效率可明顯提高。此處:

為需優化的狀態量和控制量;

beq= [(X0)TQ1Q1…Q1(Xtf)T]T.此處:Z1=(X11)T;Z2=(X21)T;Z3=(U1)T;Z4=(X12)T;ZN+1= (X1N+1)T;Z2N+1= (X2N+1)T;Z2N+2= (U2N+1)T;C= [I6×606×3];CL=[C1C2C3]3×9;CU=[C4C5C6]3×9;Q1=03×4。其中:C1~C6分別為X1a,X2a,Ua,X1b,X2b,Ub的系數矩陣。
本文算例是初始狀態和終端狀態固定的非共面時間自由交會,驗證改進配點法的有效性。設追蹤航天器的最大推力加速度0.8m/s2,目標航天器處于軌道高度500km的圓軌道。初始相對狀態和終端相對狀態分別為

式中:x0=1 000m;y0=2 000m;z0=1 500m;v0x=-10m/s;v0y=-20m/s;v0z=-15m/s;xtf=ytf=ztf=0m;vtfx=vtfy=vtfz=0m/s。將整個過程分為N=10段,用改進配點法將問題轉為NLP問題,再用SQP算法進行參數優化。優化結果為:整個交會時間229.82s,消耗速度增量27.26m/s。交會過程中推力加速度如圖1所示,狀態量如圖2所示。

圖1 推力加速度Fig.1 Thrust acceleration

圖2 狀態量Fig.2 State
為分析改進配點法的優化精度,用優化的推力加速度對C-W方程進行數值積分,結果如圖3所示。由圖可知:最終交會的精度很高,位置精度10-3m,速度精度10-7m/s,均較直接配點法高出1個量級。
本文基于C-W方程,用改進配點法求解最省燃料交會問題。給出了最優控制問題的數學模型,并基于C-W方程推導了五階多項式擬合時的缺陷向量及內點的表達式。然后將缺陷向量的等式約束改寫成線性約束的形式,利于用SQP進行參數優化。五階多項式擬合狀態變量能在不增加約束的前提下提高精度。用SQP算法時將約束寫成線性約束的形式可顯著提高優化效率。需指出的是,改進配點法適于一類具有特殊形式的方程,而并不局限于CW方程。改進配點法能用于絕對軌道轉移、橢圓軌道交會等問題。

圖3 狀態量數值積分變化曲線Fig.3 State components vs.time via numerical integration
[1] CONWAY B A.A Survey of methods available for the numerical optimization of continuous dynamic systems[J].J Optim Theory Appl,2012(152):271-306.
[2] 唐國金,羅亞中,雍恩米.航天器軌跡優化理論、方法及應用[M].北京:科學出版社,2012.
[3] 雍恩米,陳 磊,唐國金.飛行器軌跡優化數值方法綜述[J].宇航學報,2009,29(2):397-406.
[4] 王 華,唐國金.用非線性規劃求解有限推力最優交會[J].國防科技大學學報,2003,25(5):9-13.
[5] 桑 艷,周 進.基于偽譜方法的有限推力變軌策略研究[J].飛行力學,2010,28(2):71-74.
[6] HERMAN A L,CONWAY B A.Direct optimization using collocation based on high-order Gauss-Lobatto quadrature rules[J].J Guid Control Dyna,1996,19:592-599.
[7] HU G S,ONG C J,TEO C L.An enhanced transcribing scheme for the numerical solution of a class of optimal control problems[J].Engineering Optimization,2002,34(2):155-173.