王長青, 付立春, 扎波羅特諾夫·尤里, 李愛軍
(1. 西北工業大學 自動化學院, 西安 710072; 2. 西北工業大學 中俄國際空間系繩系統研究中心, 西安 710072;3. 俄羅斯薩馬拉國家研究型大學, 薩馬拉 443086)
隨著人類航天事業的不斷發展,越來越多的航天器被不斷發射到太空,因此近地空間已逐漸變成十分擁擠的場所。與此同時,由于復雜的太空擾動導致航天器軌道高度發生不同程度的變化,進而引起不同航天器之間的碰撞,產生大量空間碎片。因此,安全、高效地捕獲空間碎片對于航天任務的安全完成具有重要意義。利用空間系繩系統(STS)進行捕獲是一種新型捕獲方式,具有安全性、位置容錯性、經濟性等優點。
利用空間系繩系統執行碎片在軌捕獲任務時一般可以分為捕獲前系繩的展開、交會捕獲以及捕獲后系統回穩、回收、拖拽等不同階段。捕獲前系繩展開到平衡位置、交會捕獲以及捕獲后系統回穩是后續回收、拖拽任務的前提。然而,由于太空環境復雜,展開結束后可能存在一定的長度及擺角誤差;而捕獲完成后由于目標物與捕獲機構構成統一整體,質量突變、捕獲位置不理想等問題,系統不可避免地會出現擺動。因此,需要對上述情況進行控制使其回到穩定狀態即平衡位置。
目前,國內外學者對系繩平衡位置附近的穩定性問題進行了大量研究。Pasca[1]研究了系繩衛星系統在狀態保持階段的運動,并提出了利用子星推力來控制系繩的面內振蕩。Williams等[2]提出了通過電動力和偏置控制來控制系繩的振蕩。Mankala和Agrawal[3]設計了一套邊界控制器將系統控制到了徑向相對平衡的位置。Larsen和Blanke[4]設計了一套非線性控制器,并利用電動力系繩注入阻尼的方法將系繩衛星系統控制到一個漸進穩定的平衡位置。余本嵩等[5]通過雅可比矩陣對處于平衡位置的繩系衛星的穩定性進行了研究,提出了通過在子星一端安裝噴氣力控制裝置的含約束條件的PID控制律[6]。龐兆君[7]針對位于圓軌道上和橢圓軌道上的系繩衛星的混沌運動進行了分析,并通過Melnikov方法給出圓軌道下含阻尼系統的混沌域,采用延遲反饋控制,將欠驅動系繩衛星系統的混沌運動穩定到周期運動。
而對于系繩系統,捕獲后系統穩定控制問題則更為復雜。孫亮等[8-9]針對空間系繩系統面內轉移過程中的系統的擺振特性及穩定性進行了研究,指出面內軌道轉移過程中面內角會以固定的頻率繞平衡位置往返擺動,并且這種擺動受軌道高度、系繩長度、推力加速度等影響,提出了連續常值推力系繩系統的軌道轉移策略和基于系繩張力系統的擺振抑制策略。張帆和黃攀峰[10]針對非合作目標抓捕后保持階段的振動特性參數辨識方法,提出了非合作目標被系繩系統抓捕后處于保持階段的姿態運動振動特性參數辨識方法。趙國偉等[11]在考慮捕獲平臺與目標物的姿態運動基礎上,提出了留位和阻尼控制相結合的張力復合控制方法。張宇靖和鐘睿[12]以模型預測控制方法為基礎設計了穩定系繩擺動的非線性模型預測控制算法。
上述文獻在設計控制器時,多采用施加外力矩的方式(如電動力、噴管推力等),或通過輸入外部能量來控制系統的面內運動。施加外力矩的方式能夠快速抑制面內運動,且精度較高,這對于要求定繩長的高精度任務場合尤其重要[13]。然而,電動力系繩在地磁場中由于洛倫茲力的作用會使得系統軌道能量減少,軌道高度降低,對于狀態保持階段并不適用;噴管能夠有效產生交會捕獲時目標逼近、跟蹤所需要的擺動,但要不斷消耗燃料,然而系統在軌時間較長,若從始至終一直通過噴管來控制子星的運動需要消耗大量燃料,十分不經濟。
對于本文所研究的展開后狀態保持以及捕獲結束后回穩的過程,由于軌道周期較長,對任務的時間要求并不強烈,則通過張力控制使系統緩慢回到穩態也是可行的。例如,王班等[14]針對捕獲完成后提出了一種在最大擺角處收緊系繩、平衡位置處釋放系繩的面內擺動抑制控制方法,但僅在面內角速率大于零的條件下有效。李超等[15]針對圓軌道下系繩系統的狀態保持階段提出了基于標準系繩法的穩定控制方法。但上述方法對系繩張力機構提出了系繩面內、面外角姿態可測、繩長可測和系繩張力可控可測等要求。
系繩系統測量姿態角的主要方式是GPS干涉法[16],對姿態測量系統提出了較高要求。通過張力對系統進行控制時,一旦角度和角速率反饋失效,將會對系統造成嚴重影響。例如1988年發射的ECHO-7、2003年發射的DTUsat-1、2006年發射的CUTE-1.7以及2007年發射的YES-2衛星都出現了傳感器及控制器故障,對任務造成了不同程度的影響[17-18]。因此,設計在角度和角速率反饋失效時仍能夠使用的控制器,對于系繩展開后的面內保持以及捕獲后系統的回穩具有重要意義。此外,面內運動反饋被證明對系統穩定性沒有本質影響[19],因此在僅反饋長度和速率信號的情況下設計控制律同樣可行。
針對狀態反饋不完全問題,目前較為常用的方法為線性二次調節器(LQR)+降維觀測器方法,除此之外,矩陣分解也為控制律的設計提供了一種良好的選擇,其思想為:針對線性系統,通過配置反饋矩陣使其閉環特征方程配置到指定位置,從而使特征方程與具有較好性能的指定標準特征多項式具有相同的系數。本文在設計控制律時,結合標準系數法將系統特征多項式設計為確定形式,在矩陣分解基礎上利用相容性原理解決由不完全狀態反饋所帶來的相容性問題,從而將控制器參數計算出來,此時由于系統特征多項式確定,故其閉環特性也將比較理想,控制效果可預期。
基于上述考慮,本文針對系繩展開后狀態保持階段以及捕獲后系統的回穩任務,設計僅反饋長度和速率信號的張力控制律,從而對系統的繩長、面內角誤差以及面內擺動進行有效控制。在設計不完全狀態反饋的控制律時,本文基于矩陣分解方法,結合標準系數法通過簡單的代數運算計算出控制器參數,控制律結構簡單,無需復雜的參數調整。
考慮系繩系統為有質量彈性桿模型。有以下4點假設:①捕獲平臺(母星)和捕獲前/后的捕獲機構(子星)通過彈性系繩連接,系統質心在未受擾動的開普勒圓軌道上運行。②將母星和子星視為質點,且母星質量遠大于子星,即系統質心位于母星上。系繩未釋放前卷軸位于母星內。③系繩視為質量分布均勻的彈性桿,只考慮沿其自身的縱向振動,不計入系繩的扭轉剛性及各向異性等。④所有影響系統的外部作用力中,只考慮重力的影響,忽略太陽光壓、大氣阻力、日月引力等擾動的影響。
定義地心軌道坐標系和繩系坐標系如圖1所示。其中,地心軌道坐標系OXYZ為慣性坐標系,OXY平面與軌道平面一致,OX軸指向軌道近地點(對于圓軌道,沿地心指向軌道升交點方向),OZ軸與軌道平面正交并沿航天器的動量矩方向,OY軸按右手坐標系原則確定。軌道運動坐標系CXoYoZo與系統質心C固聯,CXo軸沿航天器矢徑方向,CZo軸和OZ軸平行。坐標系CXoYoZo相對于坐標系OXYZ以軌道角速率Ω旋轉。繩系坐標系坐標原點C位于航天器質心處,CXt軸沿著衛星拉緊繩系的反方向,CYt軸和CZt軸的位置由相對于坐標系CXoYoZo的面內角θ和面外角φ確定。空間系繩系統所在軌道與目標物所在軌道在同一平面內,慣性系下目標物的真近點角為η。

圖1 系繩系統捕獲過程示意圖Fig.1 Schematic of capture process with tether system
空間系繩系統的狀態可以用5個廣義坐標描述:系繩系統質心距地心距離rc、系統質心的真近點角?、面內角θ、面外角φ和系繩彈性應變ε。根據拉格朗日方程,推導出有質量系繩的空間系繩系統的微分方程為
(1)
式中:“·”表示對時間t求導;mA和mB分別為母星和子星的質量,mA?mB;mt=ρl0為系繩質量,ρ為系繩線密度,l0為系繩原長,系繩當前長度為l=l0(1+ε);T為系繩張力;μ為地球引力常量;φ1、φ2、φ3、φ4為質量項。
φ1=m*/m
φ2=mA(mB+mt/2)/(mm*)
φ3=(2mA-m)mt/[2mA(mB+mt)]
φ4=(mB+mt/2)/(mB+mt)
m=mA+mB+mt
m*=(mA+mt/2)(mB+mt/2)/m-mt/6


(2)
式中:“′”表示對無量綱時間τ=Ωt求導。
對于系繩系統,穩定的平衡位置沿軌道的徑向方向,即θ1,2=0,π。將方程式(2)在平衡點附近線性化,并引入無量綱長度,忽略高階小量可得
(3)
式中:ε0=l/lc為系繩無量綱長度,lc為系繩展開的最終長度即標稱長度。
因此,平衡點附近系統的狀態空間方程為

(4)
式中:
B=[0 1 0 0]T

經計算可知,線性化系統式(4)可觀可控。
由式(3)可得系統面內角運動的特征方程為
s2+2sφ2l′/l+3=0
(5)
該特征方程的解為
(6)

系統展開完成后被控處于平衡位置,而當捕獲機構與目標物即將交會對接時,將通過噴管使系繩擺動從而實現捕獲機構對目標物的跟蹤。文獻[20]指出,理想捕獲位置(近地點或遠地點)交會時,空間碎片與捕獲機構的速度大小和方向完全一致。
然而,出于捕獲安全性考慮,通常設計理想捕獲時刻附近數十秒的捕獲窗口,此時空間碎片和捕獲機構仍在理想捕獲位置附近運動。捕獲機構速度矢量已不再沿OY軸互相平行,故此時執行捕獲任務會對系統的相對運動產生擾動,因此被稱為非理想捕獲。本文欲針對捕獲后系繩的面內擺動進行控制,故首先需對非理想捕獲所帶來的擾動情況進行計算分析。
由于本文假設捕獲前后捕獲平臺的軌道運動不受空間碎片和系繩質量的影響,即其質心變化忽略不計。此外,忽略空間碎片對系繩縱向振蕩所產生的擾動,僅考慮系繩的面內擺動。且為了簡化捕獲過程,將其視為恒定速率運動[13],利用剛體動量守恒原理對非理想位置進行擾動分析,并計算捕獲后捕獲機構與空間碎片構成的統一整體繞地垂線運動的角速率。
捕獲平臺在慣性坐標系下的矢徑和速度分別為
(7)
目標物的軌道運動可表示為
(8)

慣性坐標系下目標物相對捕獲平臺的矢徑和運動速度為
(9)
則繩系坐標系下目標物相對捕獲平臺的相對矢徑和相對速度為
(10)

系統動量守恒過程如下:
(11)
式中:mp和Ip分別為目標物的質量和角動量;Ibefore、Iafter分別為捕獲前、后系統的角動量;Jbefore=mBlc2、Jafter=(mB+mp)lc2分別為捕獲前、后捕獲機構轉動慣量;ωbefore、ωafter分別為捕獲前、后系繩擺動角速度;Jt=mtlc2/3為系繩的轉動慣量。
定義捕獲機構能夠允許的距離誤差Rcap為
|rp-rB|≤Rcap
(12)
式中:rB為捕獲機構(子星)矢徑。
此外,由式(1)可得,系繩完全展開后其面內擺動方程為
(13)
積分可得面內自由擺動最大擺角應為
(14)
可通過式(7)~式(14)計算并分析捕獲過程剛體碰撞所帶來的系繩面內運動情況,進而確定控制器所要克服的擾動大小。
對于線性系統式(4),其開環傳遞函數可表示為
(15)
式中:F(s)=det(sI-A),I為n階單位矩陣;M(s)=[m11+…+m1nsn-1,…,mr1+…+mrn·sn-1]T,n為矩陣A的維數。
系統閉環傳遞函數為
(16)
式中:P為不完全不狀態反饋下反饋矩陣,P∈R1×r,r為反饋狀態量的個數。
系統閉環特征方程為
H(s)=det(sI-A+BPC)=
sn+ansn-1+…+a1
(17)
因此,通過配置反饋矩陣,理論上可將系統閉環特征方程的根配置在任意位置上,全狀態反饋下一般配置方法參見文獻[15]。
由閉環特征多項式可得
PM(s)=H(s)-F(s)
(18)
比較方程兩端相同階次s的系數,可得
MTPT=f-j
(19)
式中:f和j分別為多項式H(s)和F(s)的系數,且f,j∈Rn×1。此外,
對于式(19),可列出具有r個未知數的n個方程。對完全反饋的系統(r=n),式(19)有唯一解;對不完全反饋的系統(r 將式(18)中M(s)分解為 M(s)=Cg(s) (20) 式中:g(s)=[1,s,…,sn-1]T。 將式(19)代入式(18),可得 LTCTPT=f-j (21) (22) (23) 解方程式(22)并將結果代入式(23)中,得到相容性條件為 αf=β (24) 式中:α=S(LT)-1,β=αj,S∈R(n-r)×n,僅與矩陣C有關,β∈R(n-r)×1。對于單輸入對象來說,矩陣CB可逆,即矩陣C中元素不全為0。 達到相容性條件后,計算矩陣P使特征根達到事先選定的值,得到期望配置的特征根系數。以期望的特征方程(包含未知量ω的系數矩陣)代入相容性方程,解出ω,從而確定系數矩陣。以空間系繩系統為例選取四階標準型: f=[k1ω4k2ω3k3ω2k4ω]T (25) 此處ω的值可以根據相容性條件αf=αj得出,這樣既確定了ω的范圍,又滿足了相容性條件的要求。通過相容性條件解出ω的值以后,一般得到不同的值,當ω的取值范圍為0.5~2.5時,系統的性能最理想。 如果式(24)中向量f的約束能夠滿足,那么反饋矩陣P為 PT=K(LT)-1(f-j) (26) 計算系統的反饋矩陣P時,本文的期望特征方程以ITAE標準型為參考,當狀態方程為四階時,可得期望的特征根系數表示為[15]:f=[ω42.7ω33.4ω22.1ω]T。 代入相容性條件可得ω為±1.527、±3.19 i和0。選擇ω在0.5~2.5附近的值(ω=1.527)代入到ITAE的標準傳遞系數中,得到期望的系數值。 由式(26)計算可得反饋矩陣為:P=[4.8123.207 0 0]T,將其代入式(17)得 H(s)=det(sI-A+BPC)= s4+3.207s3+8.81s2+9.62s+5.436 (27) 值得注意的是,二次項與標準型系數有一定出入。當設計的系統各階次系數與標準型完全一致時,控制效果最好,但高階情況下很難全部成立,因此應使各系數盡可能相近。在設計計算時,當(Z′/Z)≥0.8同時成立時就可滿足要求,Z′和Z分別為設計系統和標準型的各階系數。因此,設計的反饋矩陣P滿足相容性要求,且滿足ITAE標準型設計要求,反饋系數矩陣設計成功。 由于空間碎片所處的高度越高,在地球軌道中存在的時間越長。高度大于800 km的空間碎片需要幾百年的時間方可回到地球空間銷毀,且大部分空間碎片凝聚在800~850 km的高度上,尤其是傾角在71°~74°和81°~83°的低軌道和太陽同步軌道上。 此外,為檢驗本文設計控制律是否具有預期的控制效果,首先在線性化模型中進行驗證,同時設計了LQR+降維觀測器作為對比。其中,LQR控制器的Q矩陣選取為[2,2,1,1],降維觀測器的特征根為[-0.5,-3.3]。仿真均采用無量綱形式。 在利用矩陣分解方法設計控制參數時,所使用的系統狀態方程是在空間系繩系統有質量彈性桿模型歸一化處理、平衡點附近線性化處理的基礎上得到的。因此,所得到的控制參數是在線性化模型條件下忽略了系統各部分質量變化。為進一步驗證矩陣分解方法所設計的控制器的有效性,采用實際的非線性模型式(1)來驗證線性化條件下得出的控制參數的控制效果。 利用傳統的LQR+降維觀測器對線性化系統進行控制,同時分別在線性化模型式(4)和非線性模型式(1)下對比,檢驗所設計的控制律的有效性,仿真結果如圖2所示,相應的控制力(系繩張力)變化曲線如圖3所示。 如圖2所示,利用矩陣分解方法設計的控制器對線性化模型和非線性模型進行控制,其仿真曲線基本重合。非線性模型下,4個狀態量的超調量略高于線性化模型,這是由于線性化過程中忽略了系繩長度、質量以及面內擺動運動等因素的影響,因此,后續針對捕獲后面內擺動問題采用非線性模型式(1)進行仿真驗證。此外,由圖3可以看出,3種情況下系繩張力變化均相對平穩,張力保持在十幾牛的大小附近(遠小于極限張力T*=σ*S=54×109×2×10-7=10 800 N)。 圖2 系繩展開后各狀態量受控變化曲線Fig.2 Changing curves of state variables under control after tether deployment 圖3 系繩展開后系繩張力變化曲線Fig.3 Variation curves of tether tension after tether deployment 線性化模型下,根據矩陣分解方法設計的控制器與LQR+降維觀測器對比可知,2種方法都能夠有效控制系統的長度和角度誤差,且調節時間相差不大,系統的4個狀態量在5個無量綱時間(約0.8個軌道周期)時間前后全部回到了穩態值。然而,利用LQR+降維觀測器方法時,繩長、速率、面內角及面內角速率的超調量均遠高于基于矩陣分解方法設計的控制器,即基于矩陣分解方法的模態控制器不僅能有效抑制系統展開后所出現的非標稱行為,使系統回到平衡位置,同時,與常用的LQR+降維觀測器相比,其平穩性和靜差消除都更為理想,能夠滿足空間系繩系統穩態保持控制的要求。 以軌道高度H=900 km、捕獲窗口30 s為例,捕獲后瞬間系統以5.786 5×10-4rad/s的角速率擺動,則由式(14)計算可知,系繩不受控下最大擺角θmax可達到0.33 rad(約18.9°),故利用本文設計的控制律針對捕獲任務完成后系統出現的面內擺動,對其進行控制使其回到穩定狀態即平衡位置。根據式(11)計算非理想情況下捕獲后面內角速率,根據計算結果結合式(14)計算捕獲后面內最大擺角,并將其轉換為無量綱形式,可得仿真初始條件為:ε=1,ε′=0,θ=8.68×10-3,θ′=5.786 5×10-4/Ω。與各模型、控制律相對應的控制力變化曲線如圖4所示,仿真結果如圖5所示。 由圖5可以看出,線性化系統初始時刻存在面內擺動時,基于矩陣分解的模態控制和LQR+降維觀測器作用下速率、面內角和面內角速率的變化趨勢大致相近,LQR+降維觀測器對面內角和面內角速率的控制略優于基于矩陣分解設計的控制器,但繩長和速率的變化差異較大?;诰仃嚪纸饽B控制器下繩長、速率最終全部回到穩態值1和0(無靜差),系統回復到了平衡位置,快速性和平穩性較好;而LQR+降維觀測器對繩長和速率控制的平穩性較差,控制效果并不理想。繩長超調量達到了21.59%,是基于矩陣分解控制方法的2倍;峰值速率為0.44(13.442 m/s),對系繩機構的要求更為嚴苛。 圖4 捕獲后系繩張力變化曲線Fig.4 Variation curves of tether tension after capture 圖5 捕獲后各狀態量受控變化曲線Fig.5 Changing curves of state variables under control after capture 基于矩陣分解方法設計的控制器對線性化模型和非線性模型的控制曲線基本重合。故基于線性化模型設計的模態控制律在實際非線性模型下也具有標稱的控制效果,其對非線性模型的控制效果與對線性化模型控制的效果基本相同,繩長、速率、面內角及面內角速率最終都在有限時間內回到平衡位置附近,過渡過程相對平穩,沒有對控制機構提出額外的要求,從而表明利用矩陣分解方法設計的控制律對于捕獲后系統的面內擺動抑制是有效的。 由式(11)可知,捕獲完成后系繩的面內擺動角速率的大小直接或間接受到目標物的質量以及捕獲瞬間二者的距離(即繩長)的影響;與此同時,系統各部分質量變化會直接改變非線性模型中參數φ1、φ2、φ3、φ4。因此,需計算目標物、系繩質量不同時捕獲后系統的角速率,并在新的初始條件下進行仿真對比,進一步檢驗本文設計的控制器對系統的控制效果。 質量mA=1 600 kg捕獲平臺利用lc=30 km的系繩對不同質量的目標物進行捕獲時,利用式(11)計算捕獲前后角速率以及捕獲窗口結束時系繩的面內角的大小,并將捕獲后角速率化為無量綱形式作為仿真初始條件進行仿真,系統各狀態量變化曲線如圖6所示。盡管仿真初始條件根據目標物質量變化而有所改變,但系統的過渡過程平穩,4個狀態量出現波峰和波谷的時間相差無幾,且長度、速率、面內角的超調量均隨目標物質量的增加而微弱增加。 質量mA=1 600 kg捕獲平臺利用不同的長度系繩對質量mp=100 kg的目標物進行捕獲時,系統各狀態量變化曲線如圖7所示。與捕獲平臺和目標物的質量變化相比,繩長變化對仿真初始條件的影響更為明顯,而對系統控制效果的影響也更為劇烈。系統狀態量的波峰/波谷都會隨系繩長度增加而更高/低,即在一定程度上系繩長度越長,系統平穩性越好。 圖6 捕獲不同目標物后各狀態量受控變化曲線Fig.6 Changing curves of state variables under control with different captured debris 綜合上述分析可以看出,相比LQR控制器繁瑣的調參工作,以及降維觀測器設計中觀測器矩陣特征值復雜的選定工作,矩陣分解方法根據較為理想的參考傳遞函數,直接設計出了控制效果較為理想的控制器,省去了相應的調參工作。本文設計的控制律能夠有效解決捕獲后系繩面內擺動的抑制任務,過渡過程平穩,其狀態量出現波峰波谷的時間相近,大小變化不大,控制效果良好,任務適應性強。因此,基于矩陣分解方法設計的控制器能夠有效地將空間系繩系統控制在期望的穩定狀態,同時設計簡便,沒有繁瑣的調參環節。 圖7 不同長度系繩完成捕獲后各狀態量受控變化曲線Fig.7 Changing curves of state variables under control with different length of tether after capture 1) 基于矩陣分解設計的控制律能夠有效控制系繩展開非標稱行為及捕獲后面內擾動,超調量較小,過渡過程平穩且調節時間相對較短;此外,該控制律在模型質量參數存在大范圍不確定性的情況下同樣具有較好的控制效果和抗干擾能力。 2) 本文設計的控制律相比于常見的LQR+降維觀測器方法,具有更好的控制效果,且將閉合特征方程設計為標準系數法中指定形式,其控制效果可預期。此外,設計過程簡單,避免了繁瑣的調參工作。 3) 仿真表明,本文設計的控制律對于目標物以及系繩質量(長度)大范圍變化的系統同樣適用,故可以適用于一大類大質量捕獲平臺捕獲小質量目標物的系繩系統狀態保持和擺動抑制的問題,為利用空間系繩系統進行捕獲的回穩控制提供了有用參考。


5 仿真分析

5.1 系繩展開后非標稱行為抑制



5.2 捕獲后系繩面內擺動抑制




6 結 論