崔乃剛,吳 榮,韋常柱,徐大富
(1.哈爾濱工業大學 航天學院,哈爾濱 150001; 2.上海宇航系統工程研究所,上海 201109)
垂直起降(vertical takeoff vertical landing,VTVL)可重復使用運載器(reusable launch vehicle,RLV)相較于其他起降方案具有僅需對傳統火箭進行小幅改動,著陸場地需求弱、技術跨度小、研發成本相對較低等優點[1-2].隨著SpaceX等多次成功實現垂直起降可重復使用火箭(VTVL-RLV)的子級垂直回收并復用,VTVL-RLV逐漸顯現其在商業航天發射市場的競爭力[2].
典型的VTVL-RLV在火箭一二級分離后,一子級經過6個飛行段后垂直軟著陸于預定著陸場(如圖1所示),返回飛行空域廣、速域大,發動機多次開關機、不同飛行段執行機構切換工作,結構、氣動、風干擾等不確定性和內外擾動強[2].在返回飛行時其姿態控制呈現出強非線性和高動態的特點.

圖1 典型垂直起降火箭飛行剖面
對于復雜干擾和大不確定性下的非線性控制問題,滑模控制(sliding mode control,SMC)由于具有對匹配擾動和不確定性的不變性而被廣泛應用[3].但由于實際應用中系統慣性和采樣頻率有限等原因,滑模控制中的不連續控制項將會引起系統的抖振(chattering).對于滑模抖振問題,一種可行的解決途徑為自適應滑模控制方法[4-9],即通過增益的自適應調整以匹配擾動變化,但自適應滑模方法的收斂速度將受限于增益的自適應調整過程.另一種可行的解決途徑為基于觀測器的控制方法(disturbance-observer-based control,DOBC),即利用擾動觀測器估計擾動進而補償其影響[10],其關鍵過程為對擾動觀測器的合理設計.Zhang等[11]針對RLV返回的姿態控制問題,設計了基于四元數的自抗擾控制器(ADRC),通過擴張狀態觀測器(ESO)來實現擾動觀測.Hall等[12-13]基于有限時間收斂滑模觀測器估計擾動進而補償.Su等[14]設計了RLV非奇異終端滑模(non-singular terminal sliding mode control,NTSMC)姿態控制器,模型不確定性和外部擾動采用有限時間收斂擾動觀測器進行估計.針對VTVL-RLV,錢默抒等[15]設計了自適應滑模觀測器用于估計擾動和不確定性,進而設計了基于觀測器的滑模動態面控制方法.在觀測器的設計中需要權衡收斂速度、精度和魯棒性,上述有限時間收斂觀測器能夠在有限時間內收斂,但其收斂時間取決于初始偏差并隨著初始偏差范數趨近于無窮而趨于無窮[16],而觀測器的調節過程過長將對控制系統性能造成不利影響.為降低觀測器的調節過程對系統的影響,可以采用收斂時間有常值上界且與初始偏差無關的固定時間收斂觀測器[17-18].
考慮到VTVL-RLV返回飛行姿態跟蹤控制的強非線性和高動態特性,以及氣動減速段的制導機動需求,在控制器的設計中要求能夠快速高精度跟蹤制導指令姿態角,以避免控制動態過程和控制誤差對制導系統造成影響.傳統的有限時間收斂滑模控制方法由于其收斂時間隨著初始偏差范數趨近于無窮而趨于無窮[16],因此本文將進一步研究對初始偏差具有不變性的固定時間收斂方法設計滑模控制器.
本文針對復雜擾動影響下的VTVL-RLV返回飛行快速姿態跟蹤控制問題進行研究,首先建立垂直起降火箭返回飛行的動力學模型,并考慮擾動和不確定性構建氣動減速段姿態跟蹤控制狀態方程;進而設計基于固定時間收斂擾動觀測器(fixed-time convergence disturbance observer,FxTDO)的快速姿態跟蹤控制器,其中控制指令通過雙冪次固定時間收斂滑模方法(double-order power fixed-time convergence sliding mode control,DPFxTSMC)生成,并采用FxTDO快速高精度的估計擾動以補償擾動影響,從而去除不連續控制項以抑制抖振影響;最后通過氣動減速段的仿真對固定時間收斂擾動觀測器和基于觀測器的雙冪次固定時間收斂滑模控制器的性能進行了分析和討論.
VTVL-RLV一子級的返回全程可采用的執行機構為變推力可搖擺火箭發動機、柵格舵(grid fin)和反推力控制系統(RCS),各段執行機構見表1.

表1 返回全程各段執行機構
返回飛行中的火箭一子級的執行機構具體如圖2所示.本文研究的火箭一子級在返回過程中僅中間一臺發動機點火工作,為雙向“十”字形擺動;4個柵格舵為“×”字布局,安裝在一子級頭部,發射時收起緊貼箭體,在進入大氣前柵格舵展開工作;8個RCS安裝在一子級頭部,分別負責俯仰、偏航和滾轉通道.定義發動機的俯仰等效擺角為δφ、偏航等效擺角為δψ,則發動機等效擺角與實際擺角的關系可寫為:
δφ=-δp1,δψ=δp2.
一子級進入大氣后自尾部來流,定義δz,δy,δx分別為柵格舵的等效俯仰舵偏角、等效偏航舵偏角、等效滾轉舵偏角,δz,δy,δx可表示為:
δz=(δ3+δ4-δ1-δ2)/4,
δy=(δ3+δ2-δ1-δ4)/4,
δx=(δ1+δ2+δ3+δ4)/4.

圖2 一子級返回飛行執行機構示意圖(后視圖)
因此建立VTVL-RLV一子級返回飛行動力學模型,其中式(1)為發射坐標系下質心動力學方程,式(2)為箭體坐標系下繞質心動力學方程,各坐標系和坐標系轉換關系詳見文獻[19].
(1)
(2)

對于軸對稱的VTVL-RLV一子級,一般認為箭體坐標系為慣性主軸系,可認為火箭一子級對箭體坐標系各軸的慣量積為零.因此轉動慣量矩陣可簡化為
VTVL-RLV一子級在進入大氣后的氣動減速段采用柵格舵進行氣動力控制,且該段面臨的擾動特性在返回全程中較為突出,因此本文將主要建立氣動減速段控制系統模型并以氣動減速段為基礎開展VTVL-RLV姿態跟蹤控制方法研究.
基于火箭一子級繞質心動力學模型(2)建立如下的非線性系統模型:
式中:ω=[ωxωyωz]T為箭體轉動角速度矢量;Ω=[φψγ]T為姿態角向量;Δf、Δd分別為系統各階未建模的不確定性及內外干擾;其中,ω×和R分別為:

在氣動減速段,控制矩陣B1和控制向量U分別為:
U=[δxδyδz]T.

由火箭姿態動力學方程式可得:
(3)



若VTVL-RLV一子級返回飛行的制導指令為ΩC=[φcψcγc]T,那么控制系統的目標是使火箭一子級的實際姿態快速穩定的跟蹤制導指令,即:
式中,tF為有限的時間小量.

(4)


針對式(4)所示的姿態控制系統,本文將三通道進行解耦設計各通道獨立的單輸入單輸出(single input single output,SISO)控制器,各通道之間耦合量視作各通道總擾動的一部分,顯然各通道的擾動均滿足假設1,各通道(俯仰/偏航/滾轉)的狀態方程均可寫為:
(5)

針對式(5)所示的二階SISO系統,經典的滑模控制設計的滑模面為
s=kx1+x2,
(6)
式中,滑模面增益k>0.對應的滑模控制律為
u(t)=-b-1(kx2+λsign (s)),
(7)
式中,λsign (s)是用于補償未知匹配擾動的不連續控制項,增益λ為設計參數. 在工程中,由于擾動邊界值未知增益λ的取值較為保守,進而導致抖振.
考慮如下非線性動態系統:
(8)
式中,x=[x1,x2,…,xn]T∈n為系統狀態向量;u=[u1,u2,…,um]T∈m為系統輸入控制向量,假設原點是系統的一個穩定平衡點.
引理1[20]假設系統(8)存在連續可微正定函數V(x)∶n→+∪{0},當且僅當V(0)=0.若存在正實數c>0和a∈(0,1),在包含原點的開鄰域N?n內滿足:
則系統(8)在原點處有限時間收斂,且系統從初始狀態x0收斂到原點的收斂時間T(x0)滿足:

(9)
式中:z=[z1,z2,z3]T∈3為觀測器的狀態向量;ε為待設計的誤差放大因子,滿足ε∈(0,1);ki(i=1,2,3)為觀測器設計增益,定義的矩陣A和Ar均滿足Hurwitz條件,具體表示為:
式中:τ∈(0,1];φi(·)(i=1,2,3)為設計的修正項,具體形式為:
φi(x)=「x」αi+「x」βi,i=1,2,3
αi=iα-(i-1),α∈(0.5,1.0)
βi=iβ-(i-1),β∈(1.0,1.5).
式中,函數「·」m=|·|msign(·),其中sign(·)為符號函數.觀測器輸出的估計誤差變量為:
ei(t)=xi(t)-zi(t),i=1,2
e3(t)=x3(t)-z3(t)=h(t)-z3(t).

注1[21-22]定理1所示FxTDO在確定ki,α和β后,主要可通過調節ε得到滿意的估計值.
針對式(5)所示的二階SISO系統,為補償系統擾動影響并消除抖振,考慮雙冪次修正項的特性,本文給出了一種雙冪次固定時間收斂滑模面(double-order power fixed-time convergence sliding mode surface)[23]為:

(10)
其中,指數γi(i=1,2)和χi(i=1,2)均滿足:
0<γi<1,i=1,2
γ∈(1-ε1,1),γ3=1,γ2=γ,γ1=γ2γ3/(2γ3-γ2),
χi>1,i=1,2
χ∈(1,1+ε2),χ3=1,χ2=χ,χ1=χ2χ3/(2χ3-χ2).
式中,ε1>0,ε2>0,均為充分小的正數.由增益κi(i=1,2)可定義矩陣A1,增益Ki(i=1,2)可定義矩陣A2,均滿足Hurwitz條件,具體表示為:
定理2[23]如果系統(5)達到式(10)所示的雙冪次滑模面即s=0,則系統將沿著滑模面固定時間內收斂到原點.參考文獻[23]給出如下證明.
證明令s=0,由式(10)可得:
(11)
將式(11)代入式(5),有:
K1「x1」χ1-K2「x2」χ2.
(12)
這里將式(12)所示系統的低階冪次和高階冪次兩部分進行分別討論.
Step1考慮如下低階冪次系統:
(13)
由于矩陣A1滿足Hurwitz條件,因此滿足如下Lyapunov方程:
式中:P1為正定對稱矩陣,Q1為正定矩陣.
構造關于系統(13)的Lyapunov函數:
V1(γ,x)=V1(ζ)=ζTP1ζ,
(14)


V1(1,x)=xTP1x,
求V1(1,x)的全導數為


成立,式中0<(1+d1)<1.
Step2考慮如下高階冪次系統:
(15)
由于矩陣A2滿足Hurwitz條件,因此滿足如下Lyapunov方程:
式中:P2為正定對稱矩陣,Q2為正定矩陣.
構造關于系統(15)的Lyapunov函數:
V2(χ,x)=V2(ψ)=ψTP2ψ,


成立,式中d2=(χ-1)/χ>0,(1+d2)>1.
由于P2和P1為正定對稱矩陣,根據關于二次型的Rayleigh不等式可得:
λmin(P2)‖ψ‖2≤V2≤λmax(P2)‖ψ‖2,
(16)
λmin(P1)‖ζ‖2≤V1≤λmax(P1)‖ψ‖2.
(17)


(18)
考慮到存在常數Θ滿足0<Θ≤λmin(P2),由式(18)可知,當初值V2|t=t0>Θ時,V2將從初始狀態固定時間Ts2內收斂到Θ,收斂時間Ts2滿足:
Ts2≤1/c2d2Θd2,
由于Θ≤λmin(P2),根據式(16),可知當t>Ts2時:
‖ψ‖2≤V2/λmin(P2)≤Θ/λmin(P2)≤1.
考慮到χi>1和0<γi<1,i=1,2,根據ψ和ζ的定義可知,當系統狀態x滿足‖ψ‖2≤1時,‖x‖一致有界,則對應的‖ψ‖2≤Ξ(常數Ξ≥1).根據式(17)可得:
V1≤λmax(P1)‖ζ‖2≤λmax(P1),
(19)
由式(19)可知,V1將從V1=Ξ·λmax(P1)固定時間Ts1內收斂到原點,收斂時間Ts1滿足:
Ts1≤|λmax(P1)||d1|/c1|d1|,
綜上所述,式(12)所示系統狀態x將固定時間Tf內收斂到原點,收斂時間Tf滿足:
即系統(5)達到式(10)所示的雙冪次滑模面后,系統將沿著滑模面固定時間內收斂到原點.
針對二階SISO系統(5),結合式(9)所示固定時間收斂擾動觀測器(FxTDO)和式(10)所示雙冪次固定時間收斂滑模面,設計的基于FxTDO的雙冪次固定時間收斂滑模控制律(FxTDO-based double-order power fixed-time convergence sliding mode control,FxTDOB-DPFxTSMC)為
(20)
定理3對于式(5)所示系統,設計式(9)所示固定時間收斂擾動觀測器、式(10)所示固定時間收斂雙冪次滑模面以及相應的控制器(20),系統(5)將固定時間內收斂到原點的鄰域內.
證明對滑模面(10)求時間導數并沿系統(5)展開后將式(20)代入,有
(21)
定義如下Lyapunov函數:
當前僅當s=0時V=0;當s→∞時V→∞.
對V求時間導數并將式(21)代入,有
(22)
(23)
結合式(22)、(23),當t>tf時,有
(24)
式(24)可分別表示為:
(25)
(26)
令:
則有:
V≥2-1(N/ζ)2/υ1V1,
(27)
V≥2-1(N/ζ)2/υ2V2.
(28)
Step1假設N/ζ≥1時,這種情況下V1≥V2,根據式(25)有:
由引理1可得,V從初值V0收斂到V1的收斂時間T1滿足:
Step2假設N/ζ≤1時,這種情況下V1≤V2≤1,有
由引理1可得,V從初值V0收斂到V2的收斂時間T2滿足:
因此,系統將在時間Ts內收斂到滑模面s=0的鄰域Es內,具體可表示為:
Es={s∈|V(s)≤Vf},
進一步結合定理2及文獻[22,26]可以認為,當系統到達滑模面s=0的鄰域內后,系統將在固定時間內收斂到原點的鄰域內.
注2由式(27)、(28)可知無不連續控制項的控制器的收斂域邊界主要取決于觀測器估計精度上界N,因此采用高精度觀測器能夠提高控制精度.
考慮到針對火箭一子級返回過程中飛行段及制導律切換等因素造成的姿態角指令突變,本文引入了如下跟蹤微分器(tracking differentiator,TD)對參考輸入(姿態角指令)安排過渡過程[27],具體為:




圖3 FxTDOB-DPFxTSMC的框圖
考慮軸向氣動力系數偏差15%,法力/側向力系數偏差-15%,大氣密度偏差15%,質量偏差800 kg,質心縱向偏差50 mm,轉動慣量偏差10%,存在風干擾,姿態角(γ,ψ,φ)初始偏差(1°,3°,-3°),考慮柵格舵的實際物理特性和偏差,且等效舵偏角限幅20°,仿真步長為0.001 s,仿真5 s的參數見表2.
表2 氣動減速段仿真參數設定
Tab.2 Settings of simulation parameters of aerodynamic deceleration flight phase

參數數值參數數值質量/kg5 438特征長度/m20.0Jx/(kg·m2)5 290質心縱軸位置/m14.75Jy,Jz/(kg·m2)139 000mδyy,mδzz-0.245 0特征面積/m23.976mδxx-0.016 3
為了驗證本文給出的固定時間收斂擾動觀測器(FxTDO),引入基于跟蹤微分器拓展的經典擴張狀態觀測器(ESO)[27]進行比較,具體為:

仿真中,各通道ESO的各參數均為ρ=25,β01=1,β02=2,β03=4;觀測器FxTDO的各通道增益均為k1=3,k2=3,k3=1,α=0.8,β=1.2,ε=0.1.通過進行零控(控制量為零)仿真對比觀測器的一階輸出(以俯仰角為例),結果如圖4和表3所示.

圖4 觀測器估計值
表3 觀測器估計俯仰角偏差的統計特征(3-4 s)
Tab.3 Statistic characteristics of pitch angle deviations estimated by observers (3-4 s)

參數均值標準差ESO0.021 96.155 8×10-4FxTDO8.183 9×10-132.102 9×10-12
由圖4可得,在初始偏差條件下,固定時間收斂擾動觀測器(FxTDO)相較于擴張狀態觀測器(ESO)具有更快的收斂速度和更小的超調;如表3所示,在穩態條件下FxTDO具有更高的收斂精度.因而,在有限的1 000 Hz采樣頻率下,FxTDO能夠實現對狀態和擾動的高精度估計.
為了驗證本文給出的FxTDOB-DPFxTSMC,本文引入如式(6)、(7)不帶觀測器的經典滑模控制方法(SMC)和基于類super-twisting方法的雙冪次固定時間收斂滑模控制方法(super-twisting based DPFxTSMC,STB-DPFxTSMC),STB-DPFxTSMC采用的滑模面與本文給出的FxTDOB-DPFxTSMC相同,采用類高階滑模super-twisting方法替換觀測器輸出,對應的控制律[28]為:

式中:η>0,λ1,λ2>0,p>1,增益α>0需要大于對應系統擾動的Lipschitz常數,即α>h1.
仿真中的參數選取具體為:SMC的三通道滑模面增益均為k=2.8,三通道不連續控制增益均為λ=0.05;STB-DPFxTSMC和FxTDOB-DPFxTSMC的滑模面參數中俯仰/偏航通道均為κ1=1,κ2=2.2,K1=K2=1,γ=0.6,χ=1.1,滾轉通道為к1=0.3,к2=0.55,K1=K2=0.1,γ=0.6,χ=1.1;STB-DPFxTSMC的控制律參數中俯仰/偏航通道均為η=λ1=λ2=0.5,p=1.2,α=0.05,滾轉通道為η=0.1,λ1=λ2=0.1,p=1.2,α=0.05;FxTDOB-DPFxTSMC的控制律參數中俯仰/偏航通道均為η=0.5,ζ=0.5,υ1=0.5,υ2=1.2,滾轉通道為η=0.1,ζ=0.1,υ1=0.5,υ2=1.2;觀測器FxTDO的各通道增益同觀測器對比一致;各通道TD的參數均為R=25,β1=1,β2=2,β3=4.通過跟蹤標稱軌跡程序角仿真對比上述各控制器,結果如圖5、6所示.

由圖5、6可知,FxTDOB-DPFxTSMC的控制指令較為光滑,分析可知該方法雖然無不連續控制項,但通過FxTDO估計擾動以補償擾動影響,降低了觀測器動態過程對控制系統的影響并有效抑制了抖振.如圖5的局部放大圖,FxTDOB-DPFxTSMC的系統狀態量并不能保證完全收斂于零,這正是由于通過去除不連續控制項抑制抖振造成的控制精度損失.理論分析可知去除了不連續控制項后的控制精度主要取決于觀測器估計精度,由于FxTDO對擾動的高精度估計,系統的收斂精度仍能得到保證.通過權衡系統的收斂速度、精度和魯棒性可以判斷,為消除抖振損失一定的精度是可以容許的,并且通過合理設計觀測器能夠有效降低控制精度的損失.

圖5 姿態角偏差響應曲線

圖6 舵偏角響應曲線
1)本文針對垂直起降火箭(VTVL-RLV)返回飛行的姿態跟蹤控制問題設計了基于固定時間收斂擾動觀測器(FxTDO)的雙冪次固定時間收斂滑模控制方法(FxTDOB-DPFxTSMC).在有限的采樣頻率下,引入的FxTDO能夠實現對擾動的快速高精度估計,進而在無不連續控制項的情況下利用雙冪次修正項實現了固定時間收斂并有效抑制滑模抖振;同時,通過合理設計觀測器參數,能夠有效降低去除不連續控制項后的控制精度損失.
2)本文設計的FxTDOB-DPFxTSMC方法的設計參數較多,控制器參數整定難度較大;此外,固定時間收斂方法在保證快速收斂性時不可避免的帶來的控制飽和問題,因此后續可進一步研究便于參數整定或參數自適應的控制方法和開展固定時間收斂方法的抗飽和控制研究.