畢顯婷, 史小平
(哈爾濱工業大學 控制與仿真中心,黑龍江 哈爾濱150080)
帶有輸入時延的剛性航天器反最優姿態控制
畢顯婷, 史小平
(哈爾濱工業大學 控制與仿真中心,黑龍江 哈爾濱150080)
針對帶有輸入時延的剛性航天器提出一種姿態穩定性控制方法,首先利用反步法構造李雅普諾夫控制函數,由此得到使系統全局漸近穩定的時延補償控制器。由于航天器系統為強耦合非線性系統,基于反最優理論,對非線性時延系統構造關于系統狀態量和控制力矩的目標函數,該目標函數體現了能耗的重要性,并得到相應的最優控制器。將無優化指標考慮的控制器與最優控制器進行性能比較,非最優控制器所需能量消耗較大,仿真中給出了定量分析結果。仿真結果顯示,不同時延情況下,該控制器均可以有效控制航天器姿態穩定,并且對于時延估計偏差具有魯棒性。
時延;反步法;反最優;全局漸近穩定
航天器姿態控制系統主要包括敏感器、控制器和執行器,其中敏感器和執行器都會引入時延。例如,星敏感器中姿態估計算法消耗的時間一般為1~10 s[1];推力器在執行過程中,受電磁閥開啟時延的影響[2]。姿態敏感器和推力器的動態時延會降低航天器性能,引起航天器的振顫和抖動現象[3],嚴重情況下甚至導致系統失穩。本文對具有執行器時延的剛性航天器進行姿態穩定控制器設計。
航天器作為強耦合非線性系統,時延的引入導致模型從非線性常微分方程變成非線性時延微分方程,確定系統每一時刻的狀態所需初始條件從初始值擴展到初始函數。已有文獻設計的姿態穩定控制器主要包括兩類:基于構造完全型Lyapunov-Krasovskii(L-K)泛函方法設計線性常增益狀態反饋控制器;基于補償思想的非線性狀態反饋控制器。
為了分析線性時延系統的穩定性,文獻[4]提出了一種構造二次型L-K泛函的方法,由于該L-K泛函中包含了系統過去時刻的狀態,因此可以用于分析時延參數不確定時系統的穩定性,即具有時延魯棒性。在此基礎上,文獻[5]將該方法擴展到非線性系統,以執行器帶有時間延遲的航天器模型為背景,采用修正羅德里格斯參數集(modified rodrigues parameter set,MRPs)對航天器建模,以避免在非線性項中出現時延,進而將其視為干擾,設計了使系統姿態穩定的線性狀態反饋控制律,穩定性在吸引域內成立。文獻[6]繼續對此方法進行改進,利用線性矩陣不等式獲得控制器增益系數,進一步減小了收斂域的保守性。文獻[7]將時延下限信息用于構造L-K泛函,文獻[8]在L-K泛函中增加三重積分項,文獻[9]應用保守性更小的不等式,文獻[3]設計了無需姿態角速度信息的狀態反饋控制器。上述研究思路的優點是控制器容易實現,但只能達到局部穩定,并且對吸引域和時延上限的估計比較保守,系統穩定性條件受時延上限和狀態初值限制。
為達到全局穩定性,需要設計非線性控制器,反步法是較為常見的控制方法。文獻[10-11]為將反步法應用在非線性時延系統提供了理論基礎,分析了非線性時延系統在具有時延補償的反步控制器作用下的穩定性。文獻[12]將此方法應用到受輸入時延影響的剛性航天器姿態穩定控制,設計了具有全局穩定性的控制器。該文獻中提到了控制器的最優性質,但所滿足的最優指標只是系統狀態的函數,并未體現對控制力矩的約束。
本文研究具有輸入時延的剛性航天器的最優控制問題。由于Hamilton-Jacobi方程較難求解,本文應用反最優理論,設計全局穩定的最優反饋控制器。首先,基于MRPs建立系統模型,利用反步法設計李雅普諾夫函數并得到具有全局穩定性的反饋控制器,然后構造目標函數,最終得到最優指標意義下的最優控制器。
1.1系統運動學模型及虛擬控制律設計
對于剛性航天器,其運動學方程可以用MRPs表示為
(2)
(3)
將式(1)中的ω(t)視為輸入,控制σbi(t)從初始值收斂到姿態原點,設計所需姿態角速度軌跡ωd(t)為
ωd(t)=-kσbi(t)。
(4)
其中k>0。
構造李雅普諾夫候選函數v(σbi(t)),有
v(σbi(t))=2ln(1+σbi(t)2)≥0。
(5)
其關于狀態軌跡(1)導數為
(6)
根據李雅普諾夫穩定性理論知,在虛擬輸入(4)的作用下,系統(1)全局漸近穩定。
1.2 系統動力學模型
執行器輸入受時延情況下,不考慮外部噪聲干擾,航天器動力學模型為:
(7)
u(φ)=0,φ∈[-τ,0]。
(8)
其中:J∈3×3是剛體的慣量矩陣;u(t-τ)∈3為時延后的控制輸入,τ∈(0,τmax]為時延量;ω×(t)∈3×3為ω(t)的斜對稱矩陣。
定義誤差姿態角速度ωr(t)?ω(t)-ωd(t),系統閉環模型表示成:
(9)
(10)
u(φ)=0,φ∈[-τ,0]。
(11)
引理1[13]考慮系統

(12)
其中x∈n為系統狀態向量,u∈m為控制輸入,f:n→n和g:n→n×m為平滑函數。
如果存在如下形式的反饋控制律u使得系統(12)穩定,有
(13)
其中R:n→n×n為對稱正定矩陣。
則有控制律
u=κ*(x):=βκ(x),β≥2。
(14)
對于目標函數J最優
(15)
其中
(16)
定理1對于目標函數
(17)
其中
(18)
其最優控制律為
(19)
證明:
對t≥τ時的閉環系統(9)和系統(10)構造李雅普諾夫泛函
(20)
其導數為
(21)
由于:
(22)
(23)
將式(22)和式(23)帶入式(21)得到
(24)
由于
(25)
帶入式(24)并進行整理,得到
(26)
取
(27)
方程(26)可重新寫為
(28)
因此當控制律為式(29)時,系統穩定,有
(29)
根據引理1可知,當目標函數為
(30)
其中
(31)
最優控制律為
(32)

與最優二次型問題相一致。因此,本文所構造目標函數具有明確的物理意義。
證畢。
取航天器轉動慣量J=diag[1 000,500,700]kg·m2,姿態角初值σbi(0)=[-0.2;-0.1;0.2],姿態角速度初值ω0=[0.01;-0.02;0.02],時延1s,k=0.1,應用反最優控制器(32)進行仿真。由于MRPs不具有物理意義,為便于理解,按照3-2-1轉序將姿態參數從MRPs轉化成歐拉角形式。仿真結果如圖1所示。
從圖1可以看出,在執行器引入1 s時延情況下,航天器在本文所設計的控制律作用下,姿態角和姿態角速度在200 s內達到穩定。
為說明本文所設計控制器的最優性質,下面與無優化指標考慮的控制器性能進行比較。同樣利用反步法,一種使閉環系統(9)和系統(10)達到漸近穩定的直接時延補償控制器為
u(t-τ)=ω×Jω-k1Jωr(t)-
(33)
取k1=0.2;k2=0.1;k3=0.1。在相同初始條件下,非最優控制器(33)所得到的仿真結果如圖2所示。

圖1 時延1 s時,系統狀態軌跡Fig.1 System state trajectories,τ=1 s
與圖1相比,非最優控制器系統雖然可以保證狀態漸近穩定,但控制力矩的峰值大于反最優控制器。為對兩者進行定量分析比較,下面定義能量函數為
(34)
通過對該函數的計算比較兩種控制器能量消耗上的差異。仿真結果如圖3所示。

圖2 時延1 s時,非最優控制器的系統狀態軌跡Fig.2 System state trajectories with non-optimal controller,τ=1 s
從圖3可以看到,航天器姿態達到穩定時,反最優控制器的能量消耗為100,而非最優控制器能量消耗為2 300,兩者差異顯著。
下面給出存在輸入長時延情況下,系統的狀態曲線。當執行器引入10s時延時,系統其它參數不變,進行仿真。仿真結果如圖4所示。

圖3 能量函數比較Fig.3 Energy function comparison

圖4 時延10 s時,系統狀態軌跡Fig.4 System state trajectories,τ=10 s
圖4顯示,時延10s情況下,系統狀態軌跡仍然漸近收斂,與圖1對比,所需控制力矩變大。
考慮到實際應用中,標稱時延和時延真值之間存在偏差,對此情況進行仿真。設置系統標稱時延0.8s,時延真值1s,仿真結果如圖5所示。

圖5 實際時延0.8 s,估計時延1 s時,系統狀態軌跡Fig.5 System state trajectories,τ=0.8 s with 0.2 s deviation
圖5的結果表明,在存在時延參數估計偏差的情況下,狀態量仍然能夠很好的收斂,并且狀態軌跡和控制力矩曲線與圖1相比,并沒有明顯的變化,這說明本文所設計的控制律具有一定的魯棒性。
本文對帶有執行器時延的剛性航天器進行姿態穩定性控制,利用反步法得到具有全局穩定性的時延補償控制器,根據反最優理論,構造關于系統狀態和控制力矩的目標函數,得到最優控制器。仿真結果分別驗證了在存在執行器短時延、長時延以及時延參數偏差等情況下反最優控制器的有效性和對時延參數的魯棒性,利用能量函數對能量消耗的定量分析也表明了反最優控制器的優越性。
[1] BAHRAMI S,NAMVAR M.Rigid body attitude control with delayed attitude measurement[J].IEEE Transactions on Control Systems Technology,2015,23(5): 1961-1968.
[2] 屠善澄.衛星姿態動力學與控制[M].北京:宇航出版社,2001:426-427.
[3] AILON A,SEGEV R,AROGETI S.A simple velocity-free controller for attitude regulation of a spacecraft with delayed feedback[J].IEEE Transactions on Automatic Control,2004,49(1):125-130.
[4] KHARITONOV V L,ZHABKO A P.Lyapunov-Krasovskii approach to the robust stability analysis of time-delay systems[J].Automatica,2003,39(1): 15-20.
[5] CHUNODKAR A A,AKELLA M R.Attitude stabilization with unknown bounded delay in feedback control implementation[J].Journal of Guidance,Control,and Dynamics,2011,34(2): 533-542.
[6] SAMIEI E,BUTCHER E A.Suboptimal delayed feedback attitude stabilization of rigid spacecraft with stochastic input torques and unknown time-varying delays[C]//In AAS/AIAA Astrodynamics Specialist Conference,2013,Hilton Head Island,SC,USA.2013:13-837.
[7] SHAO H Y.New delay-dependent stability criteria for systems with intervaldelay[J].Automatica,2009,45(3):744-749.
[8] SUN J,LIU G P,CHEN J,et al.Improved delay-range-dependent stability criteria for linear systems with time-varying delays[J].Automatica,2010,46(2): 466-470.
[9] EMHARUETHAI C,NIAMSUP P.H∞ control for nonlinear systems with time-varying delay using matrix-based quadratic quadratic convex approach[J].Mathematical Problems in Engineering,2015: 1-12.
[10] KRSTIC M.Delay compensation for nonlinear,adaptive,and PED systems[M].Boston: Birkhauser,2009:153-169.
[11] MAZENC F,BLIMAN P A.Backstepping design for time-delay nonlinear systems[J].IEEE Trans.Autom.Control,2006,51(1): 149-154.
[12] SAFA A,BARADARANNIA M,KHARRATI H,et al.Global attitude stabilization of rigid spacecraft with unknown input delay[J].Nonlinear Dynamics,2015,82(4): 1623-1640.
[13] KRSTIC M,TSIOTRAS P.Inverse optimal stabilization of a rigid spacecraft[J].IEEE Trans.Autom.Control,1999,44(5): 1042-1049.
(編輯:劉琳琳)
Inverse optimal stabilization of rigid spacecraft in presence of input delay
BI Xian-ting, SHI Xiao-ping
(Control and Simulation Center,Harbin Institute of Technology,Harbin 150080,China)
An attitude stabilization controller of the rigid spacecraft in the presence of input delay was proposed.Firstly,a Lyapunov function was constructed after backstepping transformation of the original spacecraft model,and a time delay compensated controller that can guarantee global asymptotic stability was obtained.Considering the strong coupling nonlinearity of spacecraft system,the inverse optimal theory was then utilized to construct a cost functional with penalty on both system states and control torque,which reflects the importance of energy cost,and the optimal controller was consequently obtained.Compared with the optimal controller,the controller without optimal consideration costs more energy,quantitative analysis was given in simulation.Simulation results show the proposed controller is effective on attitude stabilization with different time delay,moreover,it is robust with delay uncertainty.
time-delay; backstepping; inverse optimal; global asymptotic stability
2016-04-10
國家自然科學基金(61074127)
畢顯婷(1988—),女,博士,研究方向為非線性時延系統、航天器智能控制; 史小平(1965—),男,教授,博士生導師,研究方向為飛行器智能控制、復雜系統仿真。
畢顯婷
10.15938/j.emc.2017.03.012
TP 13
A
1007-449X(2017)03-0083-06