田栢苓,李智禹,吳思元,宗群
天津大學 電氣自動化與信息工程學院,天津 300072
可重復使用運載器(Reusable Launch Vehicle, RLV)是指能夠快速穿越大氣層、自由往返于地球表面與太空之間的多用途可重復使用飛行器。它既可以快速、便利地向空間運送有效載荷,也可以較長時間在軌停留或機動,完成任務后又可安全、準確地降落在地面。隨著空間利用在國家安全和經濟社會中作用的日益凸顯,航空航天技術高度結合的新一代可重復使用運載器正逐漸成為當今世界軍事強國重點關注的戰略發展方向,研究與之相關的科學問題具有前瞻性、戰略性和帶動性。
與傳統飛行器不同,RLV的再入返回利用大氣層使飛行器在飛行中消耗能量、減速下降,是整個飛行過程中環境最為惡劣,飛行特性最為復雜的階段。RLV整個再入過程可劃分為再入段、終端能量管理段和進場著陸段,如圖1所示。在再入返回過程中,飛行器經歷了從高超聲速到超聲速再到亞聲速的過渡,導致飛行器在再入過程中呈現出異常復雜的飛行特性,主要體現在以下方面:
1) 耦合特性嚴重。由于其大空域、寬速域、高機動的飛行特性,RLV軌跡與姿態變化劇烈,飛行器模型除受到非線性特性影響外,亦呈現出強烈的姿軌耦合、橫縱交叉耦合及通道耦合特性[1-3]。
2) 不確定程度高。飛行器再入過程氣動環境惡劣,飛行器受到大量外界干擾和氣動參數不確定的影響,導致飛行器模型表現為強不確定的特性,例如,X-33可重復使用飛行器在俯仰方向上的氣動力矩不確定和俯仰方向上的阻尼不確定分別高達43%和80%[4]。
3) 約束條件苛刻。受飛行器自身結構的限制,RLV再入過程必須嚴格滿足熱流、動壓、過載及可能存在的路徑點和禁飛區約束,加之擬平衡滑翔條件(確保飛行器的平穩飛行)的引入,導致RLV的再入飛行走廊被限制在非常狹小的飛行區域[5-7]。
4) 安全面臨挑戰。為了獲得更高的機動性能和操縱性,提高飛行器應對復雜飛行環境的能力,RLV在布局設計時往往采用除傳統副翼、方向舵和升降舵以外更多的操縱面,如升降副翼和機身襟翼等。由于飛行環境和自身結構的復雜特性,執行機構的冗余也使得執行器發生潛在故障(如卡死、部分失效和完全失效等)的可能性顯著增加,給飛行安全帶來巨大挑戰。

圖1 RLV再入飛行示意圖Fig.1 RLV reentry flight diagram
綜上所述,RLV是一個集多變量、強耦合、非線性、不確定、多約束及潛在執行器故障影響的復雜被控對象,其高自主性、高可靠性、高安全性和高靈活性的制導控制系統設計面臨巨大挑戰,相關技術的研究已經成為當今航空航天領域最為前沿的研究課題之一。本文系統地對RLV再入段軌跡優化、制導控制及制導控制一體化方法進行了綜述性分析,在對每類方法特點深入分析的基礎上對其發展趨勢進行了展望,研究結果可為從事相關工作的科研工作者提供有益參考。
RLV再入軌跡優化的主要任務是通過優化求解獲得滿足各種路徑約束(動壓、熱流密度和過載約束)、狀態量和控制量及邊值約束的可行再入飛行軌跡,并使得某一性能指標優。就其科學問題而言,RLV再入軌跡優化問題是一個復雜的、高度非線性的、多變量、多約束的最優控制問題,對該問題的求解最早可追溯到1696年Johann Bernoulli提出的最速降線問題[8],航空航天領域對飛行器軌跡優化問題的研究,發展至今已經有60多年的歷史,國內外許多學者基于上述理論以及非線性優化理論,在飛行器軌跡優化的求解上進行了大量的研究工作,取得了豐碩的研究成果[9-10]。接下來將按照軌跡優化問題求解的分類方法:間接法、直接法、偽譜法、凸優化方法以及智能優化方法,對RLV的軌跡優化求解方法進行綜述。
間接法是早期求解飛行器軌跡優化問題的常用方法,該方法基于變分理論和Pontryagin極小值原理,通過引入Hamiltonian函數,來推導最優控制問題的一階必要條件[11],最終將飛行器軌跡優化問題的求解,歸結為對Hamiltonian邊值問題的求解。早期飛行器軌跡優化中常用的間接法為間接打靶法(Indirect Shooting Method)[12],從20世紀70年代開始,美國密西根大學的Vinh[13-14],基于間接打靶法開始對高超聲速及星際航天器的再入軌跡優化問題進行研究,然而該方法求解時,對初值較為敏感。為了減弱其對初值的高敏感特性,20世紀80年代,間接多重打靶法(Indirect Multiple-Shooting Method)開始逐漸受到重視。近年來,在利用間接法對軌跡優化問題的求解中,更多的關注點放在協態變量的初值估計上,如基于Trim-reference函數的間接法[15-16],該函數的引入有效地保證了協態變量估計的穩定性,提高了軌跡優化問題求解的快速性。西班牙馬德里理工大學的Gomez-Tierno等[17]在獲得Hamiltonian邊值問題的前提下,利用伴隨控制變換(Adjoint-Control Transformation)[18-20]將協態變量的初值映射到一個有界球空間內,并基于對協態變量初值的估計,利用信賴域算法對邊值問題進行求解,獲得了系統的最優軌跡,該方法體現了較好的實際應用價值。
隨著計算機技術的不斷發展,從20世紀70年代開始,基于非線性規劃理論的直接法,由于無需推導最優控制問題的一階必要條件,因而,在軌跡優化問題的求解中受到了更多的關注。20世紀70年代初,學者Brusch[21-22]和Hull[23]等將直接打靶法引入到最優控制問題的求解中。隨后,Dickmanns和Well[24]提出了配點法的思想,該方法相比于直接打靶法能夠更好的處理終端時間自由的最優控制問題。20世紀90年代,波音公司的Betts等[25]為了改進多重打靶法計算速度上的缺陷,研究了具有并行計算能力的多重打靶法,并將其應用到軌跡優化問題的求解中。與直接打靶法相比,基于同時離散控制變量和狀態變量的配點法,由于對初值不敏感[26],因此,在飛行器的軌跡優化中得到了更多的應用。隨后,Standford的軌道專家Conway等[27]利用直接配點法和非線性規劃技術研究了有限推力航天器的軌跡設計問題,文章首先對軌跡優化問題進行離散處理,然后基于序列二次規劃(Sequntial Quadratic Programming,SQP)算法對離散后的非線性規劃(NLP)問題進行求解,獲得最優飛行軌跡。基于直接法的飛行器軌跡優化求解策略中,除了利用SQP算法對離散后NLP問題求解外,內點(Interior Point,IP)法是另一種被經常采用的非線性優化求解方法[28-29]。雖然SQP算法和IP算法是目前求解NLP問題最為有效的2種非線性優化方法,但是由于RLV再入軌跡優化問題自身的復雜性,經過直接配點離散處理的軌跡優化問題是一個大規模的NLP問題。對該問題的求解依賴于對其初值的有效估計,不恰當的初值猜測往往會導致問題的解無法收斂,或是陷入局部極小。
偽譜法起源于求解流體力學的譜方法[30]。1995年,美國海軍研究生院的Banks和Fahroo[31]首次將Legendre偽譜法引入到最優控制問題的求解中,隨后,該方法被廣泛應用到對最優控制問題的研究中,研究的重點圍繞算法的收斂性以及其協態映射定理的等價性證明上[32-39]。由于該方法在求解精度和速度上的優勢,已經被廣泛應用到航天器的軌跡優化[40-42]和實時制導[43-45]領域。雖然,Legendre偽譜法在理論上和實踐上被證明是一種求解復雜飛行器軌跡優化問題的有效方法,但經該方法離散化得到的NLP問題的KKT(Karush-Kuhn-Tucker)條件,與離散的最優控制問題的一階必要條件之間的等價性,一直沒有得到完全證明。2004年,麻省理工的Benson[46]在其博士論文中,針對Legendre偽譜法存在的不足,提出了Gauss偽譜法,并證明了上述等價性在有路徑約束的情況下成立。隨后,Huntington[47]對方法進行了改進,將上述結論進一步推廣,證明了這種等價性在同時存在路徑和一般動力學微分方程約束的情況下仍然成立,并對Gauss偽譜法、Legendre偽譜法和Radau偽譜法進行了仿真比較,驗證了Gauss偽譜法在求解最優控制問題時往往具有更高的求解精度和更快的收斂速度。上述特點使得Gauss偽譜法成為目前求解復雜最優控制問題最有效的方法之一,該方法在航天器軌跡設計中的應用可參考文獻[48-50]。近幾年,為了提高飛行器軌跡優化問題的求解速度,改進偽譜法離散點的配置效率,一些自適應偽譜策略開始受到關注,該策略能夠根據軌跡自身特性,自主確定軌跡優化求解所需的網格數及離散節點數,有效提高了求解的精度和靈活性[51-54]。
與求解NLP問題相比,利用凸優化求解RLV再入軌跡優化問題在求解速度上具有較大的優勢,且具備全局收斂性,使得其在RLV 軌跡在線求解上的應用成為可能。2015年,北京航空航天大學的劉新福和愛荷華州立大學的Lu等[55]將凸優化方法中的二階錐規劃方法應用于多約束再入軌跡優化問題,并對其全局收斂性進行了證明,仿真結果表明二階錐規劃方法的求解速度遠遠快于采用直接配點法的PSOPT軟件。然而文章中對飛行速度采用近似化的能量函數進行逼近,軌跡求解的精確性可能因此受到影響。因此,在此基礎上,普渡大學的Wang和Grant[56]提出將序列凸規劃(Sequential Convex Programming,SCP)方法用于求解帶有約束的行星再入軌跡優化問題,該方法具備良好的收斂速度,具有用于實時軌跡規劃的潛力。序列凸規劃化的主要思想是通過求解序列近似凸子問題,實現子問題的解向原問題的收斂。2019年,Wang和Grant[57]提出了一種基于信賴域更新策略的序列凸規劃方法,該算法相較于傳統的序列凸規劃算法,通過實時對信賴域進行更新,使算法具備提升收斂性能的可能,軌跡求解的實時性得到了進一步的提升。
基于間接法的軌跡優化求解方法具備以下特點:① 基于間接法獲得的軌跡具有較高的精度;② 對于復雜的飛行器軌跡優化問題,基于Pontryagin極小值原理推導其一階必要條件過程非常繁瑣,且當問題存在路徑約束時,需要事先知道約束弧段的先驗信息;③ 問題求解對系統狀態和協狀態變量的初值非常敏感,最優解的收斂域很小,且協態變量本身毫無物理意義,進一步增加了問題的求解難度。
基于直接法的軌跡優化求解方法具備以下特點:① 不需要推導軌跡優化問題的一階必要條件,避免了對毫無物理意義的協態變量初值進行猜測;② 與間接法相比,直接法的收斂空間更大,更適合求解復雜的飛行器軌跡優化問題;③ 直接法無法對軌跡優化問題的一階必要條件進行驗證,軌跡的最優性難以保證;④ 直接法離散后的NLP問題的求解依賴于其優化參數的初值,不恰當的初值猜測,將導致NLP問題的解難以收斂或陷入局部最小。
基于偽譜法的軌跡優化求解方法具備以下特點:① 偽譜法既避免了間接法求解軌跡優化問題對協態變量的估計,又通過協態映射定理確保了軌跡求解的最優性;② 能以較少的離散點獲得較高的軌跡求解精度; ③ 偽譜法需要認為飛行軌跡要足夠光滑,否則偽譜法的譜收斂特性將喪失。
基于凸優化方法的軌跡優化求解方法則具備較快的軌跡求解速度,但是其需要通過近似凸優化問題向原軌跡優化問題逼近,因此軌跡的最優性欠缺。
間接法、直接法、偽譜法以及凸優化方法的求解軌跡優化問題特點的歸納總結如表1所示。

表1 再入軌跡優化方法匯總及特點分析Table 1 Summary and characteristic analysis of reentry trajectory optimization methods
RLV再入軌跡優化是一個復雜的、高度非線性的、多變量、多約束的最優控制問題。多年來,經過國內外學者的不斷努力和大量的工程實踐經驗,目前滿足RLV再入軌跡離線設計的優化算法已相對成熟,并開發了較為成熟的軟件工具包,如:GPOPS[58]、OPTY[59]、DIDO[60]、TOMLAB/PROPT[61]等。此外,基于前述方法進行在線軌跡設計的文章也有公開發表,具體可參見文獻[62],目前在線軌跡優化算法主要是前述方法在應用上的推廣,軌跡求解實時性往往難以滿足RLV高速飛行的要求。隨著RLV任務復雜性的不斷提高,為了滿足新一代RLV自主性(Autonomy)、可靠性(Reliability)、安全性(Safety)和靈活性(Flexibility)的目的,RLV軌跡必須具備在線軌跡快速規劃能力。因此,探索收斂速度快,求解精度高,適用范圍廣的新型軌跡優化算法將成為未來RLV實時再入軌跡優化領域研究的重要方向。
RLV再入制導律設計的主要目的是構建制導指令與飛行軌跡之間的閉環反饋關系,確保在滿足再入飛行走廊的前提下,引導RLV從初始再入點向目標點安全過渡,并為姿態控制系統提供可行的再入制導指令[63-64]。20世紀60年代初,再入制導方法開始受到廣泛研究,文獻[65]對60年代之前的再入制導理論進行了綜述。經過30多年的發展,90年代初,國內外研究者進行了大量的再入制導研究工作,再入制導技術取得了突破性的進展。隨后,美國的馬歇爾航天中心、美國空軍實驗室和歐洲宇航局相繼提出了先進制導控制(Advanced Guidance and Control)[66]、集成自適應制導控制一體化(Integrated Adaptive Guidance & Control)[67]和面向可持續飛行制導控制故障診斷(Advanced Diagnosis for Sustainable Flight Guidance and Control)[68]的研究規劃,推動了再入制導技術的進一步發展。從制導策略的角度而言,RLV再入制導可以分為標稱軌跡制導和預測校正制導,其中標稱軌跡制導又可分為離線標稱軌跡制導及在線軌跡重構制導。下面結合國內外的研究發展現狀對其分別進行綜述,并對RLV再入制導方法進行展望。
標準軌跡制導是一種基于偏差進行控制的再入制導方法,該方法首先在計算機內存入離線計算的再入軌跡參數,當飛行器再入大氣層后,由導航系統獲得飛行器的實際飛行軌跡參數,并與事先存入計算機的標準軌跡進行對比,獲得誤差信號。然后基于獲得的誤差,依據設計的制導方法,獲得相應的制導律。標稱軌跡制導已經在航天飛機再入返回領域中得到了成功應用,是X-33、X-37等許多再入飛行器的基準方法,在RLV再入制導方法中具有重要的工程應用價值。
2.1.1 離線二維標稱軌跡制導
1979 年,離線二維標稱軌跡制導方法首先應用于航天飛機的再入返回滑翔段中[69]。該制導方法基于給定的攻角-速度剖面,并將約束條件表示成飛行走廊的形式;在此基礎上,通過迭代算法得到傾側角及傾側翻轉策略。通常,離線二維標稱軌跡制導采用縱向制導和橫向制導分開設計的原則。縱向制導主要通過對給定的飛行剖面跟蹤來實現;而在橫向制導中,通過設計橫向反轉走廊并通過橫向反轉邏輯進而確定側傾角的符號,最終實現對RLV縱向和橫向軌跡的有效控制。縱向制導常用的飛行剖面包括:阻力加速度-速度(Drag Acceleration-Velocity) 剖面[69]、阻力加速度-能量(Drag Acceleration-Energy) 剖面[70]和動壓-高度(Dynamic-Altitude)剖面[71]等;在此基礎上,大量的飛行剖面跟蹤方法,包括線性反饋制導方法[72-74]、基于預測控制的跟蹤制導方法[75-77]和改進的加速度再入制導方法[78-80]被提出并應用于RLV再入制導中。通常上述制導方法從2個方面提升再入制導精度:在縱向制導中,設計攻角在給定的剖面附近進行微調,并通過設計傾側角大小,實現對預測航程誤差的消除。
2.1.2 離線三維標稱軌跡制導
考慮到2.1.1節中的二維制導方法存在橫向機動上的諸多限制,標稱軌跡制導方法逐漸向三維制導發展。文獻[81-83]基于標稱二維剖面,得到RLV軌跡的長度和曲率并通過迭代過程產生三維剖面,進一步生成制導指令,最終通過RLV再入飛行實驗驗證了所提出方法的有效性。文獻[84] 提出了一種三維約束軌跡生成算法,基于約束條件設計高度-速度剖面,同時考慮側向運動,解析地計算飛行航跡角和傾側角。上述制導方法采用給定的攻角剖面,僅依賴于傾斜角的變化來滿足橫向機動性的要求,限制了實際飛行中飛行器的高機動性能。因此,基于離線最優軌跡的三維標稱軌跡制導方法被提出。常見的最優軌跡求解方法在前文中已進行了介紹。對于所求得的三維離線軌跡,文獻[85]基于RLV狀態量偏差,將再入軌跡跟蹤問題轉化為線性時變(Linear Time-Varying, LTV)系統的狀態調節問題,并根據獲得的LTV系統,設計了一種基于滾動時域預測算法的再入制導律。此外,基于線性二次調節器(Linear Quadratic Regulator, LQR)方法對轉化后的LTV系統設計制導增益,也是飛行器再入過程中一種常用的制導策略[86]。在此基礎上,文獻[87]提出了基于間接Legendre偽譜法的RLV再入制導方法,該方法相比于LQR方法,可在線實時計算不同飛行狀態下的制導增益,無需事先存儲大量的增益預值表。
2.1.3 特點分析
離線二維標稱軌跡制導將制導分為橫向與縱向分別進行設計,降低了計算復雜度,計算實時性較好。然而,該類制導方法主要依靠側傾角來進行飛行控制,導致給定飛行剖面往往并不能被精確跟蹤,航向角和航程會產生一定程度的偏差。此外,給定二維飛行剖面未考慮RLV的橫向機動,不能滿足RLV高橫向機動任務中的再入制導要求[81]。
基于離線最優軌跡的三維標稱軌跡制導方法,可以滿足再入飛行軌跡的最優性、高機動性及對最優軌跡的跟蹤精度等需求。然而。該類制導方法僅能實現對預先設計的離線軌跡進行跟蹤,當RLV面臨未知的突發事件時,如飛行器故障或飛行任務變更等,離線軌跡將不再滿足再入需求,制導性能往往大幅下降甚至失效。圖2給出了2種離線標稱軌跡制導方法的特點對比。

圖2 RLV離線標稱軌跡制導方法特點Fig.2 Characteristics of RLV off-line nominal trajectory guidance method
2.2.1 在線軌跡重構制導方法
考慮RLV再入過程,當突發事件發生時,離線軌跡不再滿足飛行任務需求,需要在線對軌跡進行調整,設計出新的軌跡作為跟蹤制導的目標,即在線軌跡重構制導方法。圖3給出了在線軌跡重構制導的流程圖。文獻[62]提出了一種基于在線軌跡優化的實時最優反饋再入制導策略,該方法基于偽譜法,通過連續的實時軌跡優化達到實時閉環最優反饋制導的目的,直至再入過程結束。然而,該方法對系統的實時性帶來了巨大的挑戰。因此,考慮到凸優化方法的計算效率較高,實時性較好,其在解決航空航天制導問題方面的效用正在迅速提高,并具有機載實時應用的潛力。文獻[88] 對凸優化在航空航天中制導方向上的應用進行了綜述性研究,并對問題凸化方法及凸化過程的有效性進行了討論。文獻[89]提出了一種基于凸規劃的在線軌跡重構制導方法,該方法將非線性軌跡優化問題轉變為凸優化問題,進而在每個制導周期內通過求解生成的二階錐規劃問題生成新的參考軌跡,并使用二次規劃方法設計最優反饋制導律以跟蹤生成的參考軌跡。文獻[90]提出了一種基于序列凸規劃的在線軌跡重構制導方法,利用序列凸規劃方法逼近原非線性軌跡優化問題,并在每個制導周期內對序列凸規劃信賴域進行調整,以進一步優化軌跡求解速度。進一步的,文獻[91]通過引入指令反解步驟,從而獲得原問題在每個離散點處相應的攻角和傾側角指令。該類凸優化方法雖然在實時性上有所保證,但是系統的最優性能仍有待進一步增強。此外針對RLV再入返回過程中存在禁飛區的問題,文獻[92]提出在側向制導上采用速度方位角誤差閾值和人工勢場法來減小航向誤差并避開禁飛區。文獻[93]則提出基于改進的A*算法實現實時軌跡規劃過程,并基于考慮禁飛區的飛行器模型,建立了動態優化制導律,使飛行器具備自主避開禁飛區的能力。

圖3 RLV在線軌跡重構制導流程圖Fig.3 Flow chart of RLV online trajectory reconstruction guidance
2.2.2 在線軌跡重構制導特點分析
RLV在線軌跡重構制導方法特點總結如下:① 在線軌跡重構制導方法能夠根據當前RLV的實際飛行狀態快速生成滿足所有約束條件的可行飛行軌跡,大大提高了再入制導系統的自適應能力;② 在線軌跡重構制導依賴于在線軌跡求解算法的實時性,若求解最優軌跡過程出現如初值猜測離最優軌跡過遠或陷入局部最優解等情況,則軌跡重構實時性難以保證,此時系統的制導性能將下降甚至失效。
與標稱軌跡制導不同,預測校正制導方法不依賴于參考軌跡,而是在飛行過程中不斷對飛行終點進行預測,并根據預測落點與期望終點的偏差來調整控制量。相較于標稱軌跡制導,預測校正制導靈活性更好。按照預測方法的不同,預測校正制導可分為解析預測校正制導和數值預測校正制導。解析預測校正制導的基本原理為:通過將軌跡調制到特定形式而獲得軌跡的近似解析解,在每一制導周期中對飛行器終端狀態進行解析預測,根據預測的終端狀態偏差校正控制量。然而由于解析預測計算需要的特有的解析形式以及RLV動力學模型的復雜性,解析預測校正制導方法在求解時往往只能求取近似解析解,預測誤差較大,制導精度較低,且參數擾動情況會加劇預測誤差,增加了制導控制的難度,因此本文重點對對數值預測校正制導方法進行綜述。
2.3.1 數值預測校正制導
數值預測校正制導的基本原理為:通過設定RLV整個再入飛行過程中的控制量參數序列,在飛行過程中不斷利用運動方程進行數值積分,以此對終端狀態進行預測,并根據預測落點與期望終點的偏差來調整控制參數。圖4給出了數值預測校正制導方法流程圖。
在預測校正制導方法中,通常設計攻角剖面,而不將攻角作為主要控制量進行設計,即使通過攻角對軌跡進行調整,其調整范圍也會受到限制,僅作為控制軌跡的輔助手段[94]。因此,通常將攻角剖面設計為常值[95],或設計為有關馬赫數的函數[96],此外,攻角剖面的設計還取決于縱向控制和可能的熱保護因素[94]。文獻[97]基于剩余能量的多少,對攻角剖面進行微調,以增加飛行器的控制能力。文獻[98]則考慮航路點約束,使用基于大腦情緒學習的智能控制器實現了對攻角剖面的調整。文獻[99]針對低升阻比RLV,提出了一種數值預測校正制導方法,該方法在確定的攻角剖面下,通過設計側傾角,對動力學方程進行積分得到預測航程,并基于預測航程與期望終點的差值,利用高斯牛頓法迭代更新傾側角,確保預測軌跡滿足終端約束。該文獻提出了一種基礎的預測校正方法,然而其傾側角反饋補償方式、初值設計及校正策略等都尚不完善。為此,文獻[100]提出了一種適用于不同RLV的統一預測校正制導方法,該方法引入高度變化率反饋,有效消除了高升阻比RLV再入軌跡的振蕩,當需要嚴格滿足軌跡再入約束條件時,高度變化率則基于非線性預測控制方法得到,對預測校正方法的傾側角反饋補償方式進行了補充。進一步,文獻[101]則針對多約束下的預測校正制導問題,設計了復合走廊,并基于狀態預測和反饋理論,設計約束執行算子,通過側傾角補償解決再入約束背離問題。文獻[102] 采用鴿群啟發算法與高斯牛頓法結合的制導方法對傾側角進行迭代求解,充分結合了鴿群啟發算法不需要初值猜測且具備全局收斂性的優點及高斯牛頓法可以在初始猜測的情況下具有高精度全局收斂的優點,為預測校正方法提供了一個合適傾側角初值設計策略。文獻[103]提出了一種基于模糊邏輯的預測校正制導方法,基于模糊邏輯設計調節器,同步校正縱向和橫向運動,在一次制導周期內只需進行一次軌跡預測,有效降低了計算負荷,增強了預測校正系統的實時性。文獻[96]對目前所提出的數值預測校正制導方法進行了匯總,并從側傾角剖面設計方法、再入方式選擇(跳躍式或直接式)、考慮再入約束的校正方法、無可行解時的解決方法等多個角度對數值預測校正制導進行了改進。最終在NASA Johnson Space Center高保真系統下驗證了數值預測校正制導方法的魯棒性及可行性。文獻[95]從橫向和縱向兩個角度,在實時性上做出了較大的提升。在縱向軌跡控制上,從數值積分的角度提出了改進方法,例如切換Runge-Kutta積分規則、使用自適應積分步長、經驗性地減少安全系數等,以節省再入軌跡預測時間;在橫向軌跡控制上,不在積分預測期間考慮側傾角反轉,而是設計可變的傾側角閾值,并使用最終的預測航程來確定何時進行傾側角反轉,以進一步節省軌跡預測時間。文獻[104]提出了一種改進的帶有混合橫向邏輯的預測校正算法,以提高RLV再入過程中的機動性,使RLV具備避開禁飛區的能力。

圖4 RLV數值預測校正制導方法流程圖Fig.4 Flow chart of RLV numerical predictor-corrector guidance method
2.3.2 數值預測校正制導特點分析
RLV數值預測校正制導方法特點總結如下:① 預測校正算法具備靈活性好、不依賴于再入初始狀態、自適應能力和魯棒性強等優點;② 預測校正制導方法往往采用橫向制導與縱向制導分開設計的原則,而橫向制導中的傾側角反轉策略要求傾側角瞬間符號翻轉,加劇了后續姿態控制系統設計的難度;③ 在側傾角迭代過程中若某個周期未得到最優解而采用近似最優解,可能導致之后的制導周期內,預測誤差無法消除甚至逐漸增大的情況;④ 數值預測校正由于存在著不斷數值積分預測與迭代校正的過程,對于機載計算機性能要求很高。
從制導研究現狀來看,采用標稱軌跡制導方法對參考軌跡的跟蹤,具有計算速度快,易于工程實現等優點,但是存在著對外界擾動適應性低的不足;預測校正制導方法能夠處理RLV再入過程中的突發事件,魯棒性較好,但對機載計算機的運算能力要求較高,實時性較差。兩者各有利弊,因此,結合標稱軌跡制導與預測校正制導兩者優點的混合制導,有望成為未來制導方法發展的主流方向。文獻[105]提出了一種LQR方法與數值預測校正方法交替作用的混合制導方法,利用LQR對參考軌跡進行跟蹤,并在必要時利用預測校正制導方法對軌跡進行更新,在有效提高制導精度和自適應能力的前提下,顯著降低了機載計算機的計算負荷。
從制導策略來看,混合制導方法與在線軌跡重構制導在本質上是類似的,具備較好的魯棒性與自適應性。該類方法未來的研究方向包括:① 軌跡在線更新算法實時性的改進。不論是自適應偽譜法、凸優化方法還是基于預測校正方法的軌跡規劃,考慮到RLV再入過程高速高動態的飛行特性,實時性都略顯不足。獲得一種實時性好的在線軌跡規劃方法,是當前在線軌跡重構制導方法發展的當務之急;② 軌跡在線更新時機的選擇。合適的軌跡更新時機選擇,不但可以降低機載計算機的負擔,減少不必要的計算負擔,同時也能更好地提高RLV的魯棒性。如何合理選擇軌跡重構的時機,是未來基于在線軌跡重構制導方法發展過程中需要解決的重要問題;③ RLV最優軌跡與可行軌跡的抉擇。在RLV再入離線參考軌跡的設計過程中,通常軌跡設計為使得某一性能指標最優,在線軌跡重構則繼承了這一點。而基于預測校正的在線軌跡更新,往往只為求解得到一條可行軌跡。如何在最優軌跡和可行軌跡中進行有效抉擇,有效提高軌跡生成的實時性,是未來基于在線軌跡的制導策略中需要重點考慮的問題。④ 基于人工智能技術的制導方法研究,如面向大數據及面向智能規劃決策的制導技術等[106]。使RLV具備自主任務規劃以及智能決策制導能力。
RLV 再入飛行階段是整個飛行過程中環境最為惡劣,飛行特性最為復雜的階段,相比傳統飛行器,RLV 模型的耦合特性更嚴重、氣動不確定程度更高,其再入飛行安全面臨巨大挑戰。因此,RLV再入姿態控制的主要任務是通過設計姿態控制器使系統在受到模型不確定和外部擾動影響的情形下,仍能實現對再入制導指令的快速穩定跟蹤控制。接下來,將分別從線性控制、非線性控制及智能控制的角度對RLV再入姿態控制方法進行綜述,并對未來RLV姿態控制方法進行展望。
線性系統控制理論發展相對比較成熟,基于線性化手段將非線性RLV模型轉換為平衡點附件的線性模型, 再基于線性控制方法對轉換后的線性系統進行控制器設計,是飛行控制系統設計早期最為常用技術手段。接下來,重點對基于增益調度和線性參變的RLV姿態控制方法進行綜述。
3.1.1 增益調度控制
增益調度控制是飛行控制系統設計中經常采用的一種經典控制方法,其核心思想是將非線性模型分解成一系列不同特征點上的線性模型,然后利用成熟的線性控制方法在特征點附近設計一系列的線性控制器,飛行器實際飛行過程中通過參數調度實現不同控制器之間的有效切換。PID控制是目前工程上應用最為廣泛的一種控制方法,它的優點在于結構簡單、不依賴于被控對象模型、控制所需的信息量少、易于工程實現等。針對X-33飛行器姿態控制問題,文獻[107]在參考軌跡附近,基于小擾動理論,結合增益調度,提出了變結構的PID控制方法。文獻[108]在不考慮RLV通道間耦合的情況下,以飛行馬赫數為調度參數,設計了單通道調度控制器并開發了協調增益調度控制器。文獻[109]則通過設計增益調度故障檢測和隔離濾波器來實現RLV的姿態控制,并基于H∞理論設計了調度參數,實現了RLV對姿態的穩定跟蹤控制。盡管,基于增益調度的控制方法在RLV姿態控制中得到了一定程度的應用,然而,當飛行器在大范圍飛行時,為了達到較好的跟蹤效果,該方法需要通過計算大量的增益預置表,增加了計算的復雜度,且該控制器往往只能在預設軌跡附近才能有效,當系統不確定和外界干擾較大,導致飛行狀態偏離平衡點較大時,往往不能獲得理想的跟蹤效果。
3.1.2 線性參變控制
基于線性參變控制方法的主要思想是在參數空間內利用所選擇調度參數的連續函數表示非線性系統的狀態空間矩陣,從而將非線性模型近似成線性參變模型,最后使用線性系統控制方法設計控制器。文獻[110]提出了一種基于速度的RLV線性參變模型與控制框架,并與增益調度控制方法結合實現了不確定影響下RLV速度與高度的穩定跟蹤控制,然而該方法對系統的計算負擔較大。文獻[111]提出了一種用于RLV系統的降階線性參變控制器,該方法基于H∞標準問題,通過對加速度靈敏度函數進行加權以考慮性能指標,將控制問題轉換為基于線性變模型表示的控制問題,并使用基于線性矩陣不等式的方法來設計魯棒靜態反饋控制器,對控制器形式進行了簡化。進一步,文獻[112]考慮再入過程中RLV的強不確定性和耦合特性,使用線性參變方法來設計姿態控制器,通過分析各通道之間的耦合程度,選擇線性模型關鍵參數,實現了線性參變控制器的簡化設計,增強了控制器的工程實用性。
3.1.3 線性控制特點分析
上述線性控制方法中,增益調度應用于RLV再入姿態控制時在標稱軌跡附件能獲得比較好的控制性能,但當RLV的飛行軌跡偏離標稱軌跡時,基于增益調度設計的控制器的控制性能將顯著降低,此外,為了獲得較好的控制性能和提高增益調度方法的適應性,增益調度表需要存儲大量的增益值,例如文獻[107]為了確保RLV在發動機故障模式下的飛行控制性能,要在增益預值表中事先存儲7 800個增益值。除此之外,控制器增益在切換過程中,容易出現參數突變問題,影響控制性能,無法保證閉環增益調度系統的魯棒性和穩定性[113]。線性參變控制方法設計相對簡單,受控系統穩定性和動態性能可以得到有效保證,但是當飛行器的動態特性和擾動特性過于顯著時,控制效果較差,飛行器大機動飛行時的魯棒性有待提高。此外,由于RLV非線性、不確定、強耦合及快時變的特點,當RLV在做大范圍機動飛行時,基于線性控制方法設計的控制器,在對RLV進行控制時,往往難以取的很好的閉環控制性能[114],不同線性控制方法的特點分析見表2。

表2 常用線性RLV再入姿態控制方法匯總及特點分析Table 2 Summary and characteristic analysis of common linear RLV reentry attitude control methods
為了改善RLV控制系統的性能,提高系統的自適應能力,近年來,基于非線性控制的方法在RLV的姿態控制中得到了廣泛應用。接下來將重點對基于反步控制、軌跡線性化控制、滑模控制以及預設性能控制的RLV姿態控制方法進行綜述。
3.2.1 反步控制
反步控制的主要思想是將非線性系統控制問題分解為若干不超過系統階次的子系統,再分別設計使得各個子系統穩定的虛擬控制器,然后依次逐步反推控制器和李雅普諾夫函數,最后獲得原系統的控制律以實現對系統的全局穩定跟蹤控制[115-116]。文獻[117]針對非線性系統的有限時間跟蹤控制問題,利用輔助控制信號和修正后的誤差補償信號,提出了一種新的有限時間指令濾波反步方法。此外,反步控制與其他控制方法相結合可以更好地提高系統的自適應和魯棒性,例如滑模控制[118-119]、預設性能控制[120]、魯棒自適應控制[121]、神經網絡控制[122]等。針對不確定影響下的高超聲速飛行器的穩定跟蹤控制問題,文獻[118]基于非線性擾動觀測器在線估計非匹配擾動,提出了一種自適應滑模控制器設計方法,實現飛行器對給定參考軌跡的魯棒跟蹤控制。綜合考慮外界干擾及輸入約束對RLV姿態控制性能的影響,文獻[119]將快速終端滑模控制引入反步控制中,提出了一種帶約束的自適應反步快速終端滑模控制方案,該方法確保了系統的有限時間收斂,實現了RLV在受限條件下對制導指令的有限時間穩定跟蹤控制。文獻[120]將反步控制與預設性能控制相結合,提出了一種基于預設性能的RLV姿態控制方法,該方法在確保系統魯棒性的同時,能夠同時保證系統的動態性能和穩態性能。然而,上述文章由于存在虛擬控制輸入的重復微分,存在微分爆炸問題。為此,文獻[121] 提出了一種魯棒自適應反步控制方法,方法將虛擬控制輸入的時間導數看作不確定的一部分,并利用魯棒自適應律估計不確定項的上界,從而避免了傳統反步中存在的微分爆炸問題。文獻[122]研究了一種基于神經網絡逼近非仿射模型的反步控制方法,利用神經網絡對未知的非仿射動力學模型進行在線估計,通過構造兩個基于模型轉換的低通濾波器來處理非仿射問題,并將虛擬控制器作為中間變量處理,從而減少反步設計的計算量。文獻[123]提出了一種基于輔助誤差補償策略的魯棒反演控制方法,反步法與神經網絡的結合,有效削弱了傳統反步法對模型精確性的依賴。
3.2.2 軌跡線性化控制
軌跡線性化控制(Trajectory Linearization Control, TLC)是一種常用的再入姿態控制方法。TLC是20世紀90年代中后期,由俄亥俄大學的Zhu等[124-126]逐步建立并發展起來的一種新型非線性控制方法。該方法可以求得參考軌跡上任意一點的控制增益,通常可理解為一種不需要插值計算的增益調度控制器。且該方法中時變帶寬技術的引入,使得控制器能夠通過在線調整閉環系統帶寬來增強系統的魯棒性,改善系統的控制性能。文獻[127]首次將TLC應用到X-33上升段的姿態控制中。隨后,該方法又被應用到X-33飛行器再入段的姿態控制中[128]。進一步,文獻[129-130] 在軌跡線性化設計過程中,通過引入改進的時變帶寬算法,在實現對姿態控制的同時,提高了系統在執行器飽和及高動壓飛行等極限狀態下的控制性能。然而,雖然軌跡線性化控制策略能夠通過時變帶寬技術來增強系統的控制性能改善其魯棒性,但在實際工程應用中,由于系統自身的限制,閉環系統的帶寬不能任意配置,只能限定在一定的范圍之內。因此,為了進一步提高系統的魯棒性,改善其控制性能,近幾年學者們從干擾觀測器的角度出發,在基于TLC的空天飛行器姿態控制領域做了大量的研究工作。文獻[131-133]將干擾觀測器和軌跡線性化控制方法相結合,通過設計干擾觀測器來估計和補償不確定對系統性能的影響。然而,上述基于TLC的設計方法中,由于非線性時變反饋調節律的設計理論尚未成熟,導致閉環系統的誤差調節器通常基于線性時變系統的狀態反饋控制律來實現。這樣雖然可以獲得沿標稱狀態的指數穩定,但結果卻是局部穩定的。文獻[134]中還指出,當控制系統存在較大的不確定時,TLC的控制性能將大幅度降低甚至失效。
3.2.3 滑模控制
滑模控制是一種特殊的非線性控制方法,其區別于其他非線性控制方法之處在于其系統的“結構”是根據系統狀態按照期望“滑模動態”的狀態軌跡運動。這種滑動模態不僅對系統不確定具有很強的魯棒性,而且可以通過設計系統的滑動模態使系統獲得期望的動態性能[135]。
20世紀90年代末,文獻[136-137]針對RLV的姿態控制問題,設計了基于內外環的滑模控制策略,在內環中設計滑模控制器,實現對期望姿態角速率的跟蹤,在外環中采用則傳統的PI控制器,對外環控制偏差進行校正。此后,文獻[138-140]考慮外界干擾、模型不確定、飛行器部分操縱面失效可能導致的執行器飽和對姿態控制性能等的影響,在雙環滑模控制結構的基礎上,基于時變滑模方法,對RLV姿態跟蹤控制問題進行了研究,成功地將滑模控制方法應用到RLV再入姿態控制中。為了提升系統的收斂速度,文獻[141]基于多時間尺度特性,將RLV模型劃分為快-慢雙回路,然后為每個回路設計終端滑模控制器,以確保RLV的穩定飛行。在此基礎上,文獻[142]基于相同的雙回路結構,將終端滑模的二階動態引入到每個回路,在保證系統快速收斂特性的同時,有效地減弱了系統抖振。文獻[143]結合干擾觀測器,提出了一種多變量非奇異終端滑模控制策略,首先設計有限時間干擾觀測器,以估計模型的不確定和外部干擾,然后基于擾動估計,設計了一種結合了多變量非奇異終端滑模的復合控制器,使姿態跟蹤誤差在有限時間內收斂到零。進一步,為了優化終端滑模狀態收斂速度,文獻[144] 提出了一種基于非奇異終端滑模的固定時間RLV再入姿態控制方法,以保證制導指令可以在固定時間內被跟蹤,且收斂時間不依賴于RLV的初始狀態。進一步,考慮系統部分狀態未知對RLV姿態控制性能的影響,文獻[145]在輸出反饋框架內,基于雙極限齊次性理論的設計了固定時間滑模再入姿態觀測器-控制器,基于該方法設計的控制策略,在確保對RLV綜合干擾及未知狀態在線估計的同時,能實現對給定制導指令的高精度快速穩定跟蹤控制。此外,考慮RLV外界干擾邊界不可知的情況,文獻[146]提出了一種結合多變量干擾觀測器和模糊快速終端滑模控制的新型有限時間收斂控制方法,該方法實現了模糊邏輯與終端滑模的有效結合,同時可根據外界擾動自適應動態調節逼近律的增益系數,能夠有效解決不確定邊界未知情形下的RLV穩定跟蹤控制問題。
傳統滑模控制中的抖振問題一直是影響其實際工程應用的主要障礙,高階滑模在保持傳統滑模控制強魯棒性的同時,能有效削弱控制抖振,提高系統的跟蹤精度。文獻[147]針對RLV姿態控制問題,提出了一種基于時變高階滑模的RLV再入姿態控制策略,通過設計時變滑模面,使系統狀態在初始時刻就位于滑模面上,該方法在確保了系統全局魯棒性的同時,保證了系統在事先給定的時間內對給定制導指令的穩定跟蹤。文獻[148] 提出了一種基于擬連續高階滑模的RLV再入姿態控制策略,將控制輸入的導數作為虛擬控制進行控制器設計,從而有效地削弱抖振,同時能夠保持控制信號的連續性。文獻[149]提出了一種基于輸入輸出線性化和連續高階滑模的飛行控制器設計策略,通過構建了高度和速度相關的輸入輸出線性化模型,然后設計基于有限時間的連續高階滑模控制器。文獻[150-151]針對高超聲速飛行器的穩定跟蹤控問題,提出了一種自適應高階滑模的控制器設計方法,該方法將自適應策略引入高階滑模當中,可在外界干擾邊界未知的情況下,通過自適應調整控制增益,從而實現對參考指令的穩定跟蹤控制。
由于超螺旋滑模控制對模型的匹配不確定具有完全魯棒性,且能提供絕對連續的控制信號等諸多優點,該方法在RLV的姿態控制系統設計中得到廣泛關注[152-153]。文獻[62,154]將超螺旋滑模和有限時間干擾觀測器結合,提出了一種基于干擾補償的超螺旋滑模再入姿態控制策略,基于該方法設計的控制策略,在確保對外界干擾在線觀測的同時,可實現對給定制導指令的快速穩定跟蹤。文獻[155]考慮RLV再入過程中乘性力矩擾動影響且模型不確定及擾動上界均未知的情況,基于內-外雙環控制結構,設計了一種增益自適應的多變量超螺旋滑模控制器,該方法能夠確保控制器增益非過估計的同時,實現了跟蹤誤差的有限時間收斂。文獻[156]提出了一種基于固定時間多變量超螺旋滑模的RLV再入姿態控制器設計方法,設計了具有固定收斂特性的超螺旋滑模干擾觀測器和控制器,以確保姿態角跟蹤誤差在固定時間內收斂到零。
3.2.4 預設性能控制
傳統的非線性RLV姿態控制方法雖然能較好地保證飛行器姿態控制的穩定性和魯棒性,但往往忽略了RLV姿態控制系統的動態品質。隨著飛行器對控制精度和控制品質要求的不斷提升,近年來,預設性能控制在RLV姿態控制領域得到了廣泛關注,其核心思想是對受控系統的狀態人為設定性能包絡線,通過性能包絡函數的收斂特性來刻畫受控系統的動態和穩態性能[157];其內容包括:最大超調小于一個足夠小的預先設定的常數、收斂速度不小于一個預先的指定值,跟蹤誤差收斂到任意小的殘差集。預設性能控制方法在控制系統的動態性和穩態性上均表現出了良好的性能優勢[158]。預設性能控制方法并沒有固定的控制器設計形式,往往可以與其他控制,如滑模控制[159]、反步控制[160-162]等方法的結合來設計相應的預設性能控制器。
文獻[159]將預設性能控制方法與終端滑模控制相結合,利用切線函數提出了一種具有預設性能的自適應抗飽和終端滑模控制策略,解決了RLV在外界干擾、輸入飽和、模型參數不確定等綜合影響下的姿態跟蹤控制問題。文獻[160]針對不確定影響下,嚴格反饋非線性系統的有限時間跟蹤控制問題,提出了有限時間性能函數的概念,并綜合利用預設性能技術和反步方法設計了狀態反饋控制器,該方法能夠保證系統跟蹤誤差在有限時間內滿足期望的動態和穩態性能。文獻[161] 基于反步控制方法,在反步設計的每一步中,構造預設性能函數使飛行器的跟蹤誤差在規定的邊界內,在此基礎上保證了速度和高度控制子系統所需的動態性能和穩態性能。文獻[162]在執行器故障和空氣動力學不確定情況下,研究了飛行器預設性能穩定跟蹤控制問題,分別為速度和高度子系統設計動態反步控制器和魯棒自適應反步控制器,解決了執行器故障情況下,以跟蹤誤差動態性能約束為特征的穩定跟蹤控制問題。
3.2.5 非線性控制特點分析
在上述非線性控制方法中,反步控制方法對飛行器控制系統中存在的非匹配不確定有著良好的抑制能力。然而,反步控制由于存在虛擬控制輸入的重復微分,容易出現“微分爆炸”問題,從而增加了RLV控制系統設計的復雜性。軌跡線性化控制方法是一種基于微分代數譜理論的非線性控制方法,在NASA先進制導控制項目中被成功應用于X-33的上升段姿控系統設計中,該方法不依賴于參考軌跡,參數調整簡單,易于工程實現,但只能獲得沿標稱狀態的指數穩定。滑模控制方法具有收斂速度快、對參數變化及外部擾動不敏感、無需系統在線辨識參數等優點,眾多形式的滑模控制方法為RLV再入姿態控制問題帶來了多種解決途徑,但滑模控制中的抖振無法完全消除,只能在一定程度上削弱,且隨時有可能激發被控對象未建模動態的風險。預設性能控制在控制器設計過程中,同時兼顧了系統的動態性能和穩態性能,控制精度往往可事先設定,預設性能控制方法沒有限制控制器的具體設計形式,通常與其他形式的控制器混合使用。不同控制方法的特點分析見表3。

表3 常用非線性再入姿態控制方法匯總及特點分析Table 3 Summary and characteristic analysis of common nonlinear RLV reentry attitude control methods
隨著計算機性能及智能控制的發展,智能控制方法逐漸開始被應用于RLV再入姿態控制當中。目前智能控制在RLV上的應用主要包括模糊控制以及神經網絡控制,接下來分別對其進行綜述。
3.3.1 模糊控制
模糊控制因其對模型不確定和未建模動態的良好逼近特性被應用于RLV的姿態控制系統設計中。文獻[163]提出了一種基于可調結構的自適應模糊滑模控制RLV姿態控制器設計方法,其中引入可調結構主要目的是為設計隸屬函數使其包含模糊輸入的所有變化,并設計了與航跡角相關的滑模面,通過引入高度和速度的誤差以提高控制性能,最終結合可調結構和滑模控制方法,設計了可以針對姿態跟蹤誤差的變化進行靈活調整的模糊控制器。進一步,考慮執行器故障對RLV姿態控制性能的影響,文獻[164]基于Takagi-Sugeno(T-S)模糊模型,研究了執行器故障下的RLV姿態容錯控制問題。文獻[165-168]針對RLV自適應模糊姿態控制問題展開了相關研究,在確保系統穩定的前提下,提高了姿態跟蹤系統的抗干擾能力。其中,文獻[165]將模糊邏輯系統與自適應技術相結合,設計了一種基于自適應模糊控制策略的姿態跟蹤控制器,對系統不確定進行在線估計及補償,并在控制策略中引入了補償控制器,該方法可以有效減小模糊建模誤差對控制性能和系統穩定性的不利影響。文獻[166]采用復合自適應模糊H∞控制策略,研究了參數不確定和外部干擾條件下RLV再入姿態控制問題,該策略采用自適應模糊H∞控制方法結合辨識模型設計姿態跟蹤控制器,有效提高了在模糊逼近區域內,系統的跟蹤性能。為了進一步提高系統的抗干擾能力,文獻[169]研究了一種基于擾動觀測器的混合H2-H∞魯棒模糊跟蹤控制策略,該方法通過實時在線補償綜合干擾,實現了對飛行控制抗干擾能力的提升。文獻[170]提出了一種基于模糊擾動觀測器的自適應滑模控制方法,在建立考慮綜合擾動的氣動彈性模型的基礎上,利用模糊估計誤差和觀測誤差進行擾動估計,構造了一種基于模糊邏輯系統的擾動觀測器,并結合自適應滑模控制算法,有效提高了再入姿態的魯棒跟蹤控制能力。
3.3.2 神經網絡控制
神經網絡控制是20世紀80年代末期發展起來的控制方法,該方法為解決復雜的非線性、不確定系統的控制問題開辟了新思路。文獻[171]設計了RLV離散時間自適應神經網絡控制器,基于一階泰勒展開得到離散時間模型,并設計了基于標稱反饋和神經網絡逼近的虛擬控制器,該方法具備較好的自適應性和自學習能力,可以有效提高系統的抗干擾能力。文獻[172]提出了一種針對飛行器縱向模型的非奇異神經網絡控制系統設計方法,對于速度子系統,直接設計神經網絡控制器,對于轉換為嚴反饋形式的高度子系統,則使用兩層神經網絡和反步控制策略進行高度控制器的設計。文獻[173]在考慮推力和俯仰力矩之間耦合關系的前提下,提出了一種基于反演控制和奇異攝動系統方法的控制策略,并采用RBF神經網絡對未知的RLV動力學模型進行逼近,由于RBF神經網絡良好的逼近性能,有效提高了系統對外界干擾的抑制能力。文獻[174]針對一類具有隨機不確定和全狀態約束影響下的姿態跟蹤控制問題,提出了一種基于RBF神經網絡的非過估計自適應控制策略,并上設計了基于神經網絡的自適應飛行控制器,該方法通過神經網絡逼近器對系統非線性未知項進行在線估計與補償,有效解決了飛行器在隨機不確定和全狀態約束下的穩定跟蹤控制問題。文獻[175]將具有學習功能的神經網絡動態面控制與非線性擾動觀測器相結合,解決了飛行器在不確定和時變擾動影響下的穩定跟蹤控制問題。文獻[176]提出了軌跡規劃和姿態控制的協同框架,并設計了非敏感的軌跡優化和基于深度神經網絡的姿態控制的雙層結構。其中,上層負責生成包含最優軌跡與最優控制的數據集,下層控制系統中,基于預生成的數據集,構建深度神經網絡并對其進行訓練,然后,基于訓練完成的深度神經網絡,在線生成最優反饋指令,并通過六自由度的仿真驗證對算法的實時性及可靠性進行了驗證。
3.3.3 智能控制特點分析
模糊控制不需要被控對象的精確數學模型即可實現較好的控制,利用模糊控制系統設計的逼近器能對飛行器的綜合干擾進行實時估計與補償,起到了類似干擾觀測器的作用。相較于傳統的干擾觀測器,基于模糊控制系統設計的逼近器,可基于隸屬度函數進行靈活調節,往往具備對干擾更好的估計能力。然而,模糊控制的跟蹤效果會因隸屬度函數選擇而不同,因此在調控的時候的需進行多次試湊。此外,若模糊控制選擇不佳,會產生一個模糊系統跟蹤誤差,進而影響飛行器的跟蹤性能。神經網絡控制由于其強大的自適應性和自學習能力,可對RLV未建模動態和綜合干擾進行很好的逼近,有效提高系統的抗干擾能力。然而,由于神經網絡控制系統不能很好的解釋自身推理過程和推理依據的邏輯,因此在訓練可用于RLV控制的神經網絡系統是比較耗時的。此外,不同類型的神經網絡系統具有不同的跟蹤精度和網絡結構復雜度,例如RBF神經網絡與BP神經網絡,前者的逼近精度要高于后者,但后者的網絡結構復雜度相對低。因此,對RLV飛行控制系統進行設計時,高逼近精度的神經網絡系統往往會帶來飛行控制器更大的復雜度,從而降低了RLV系統的計算效率[177]。模糊控制和神經網絡控制特點匯總見表4。

表4 常用智能再入姿態控制方法匯總及特點分析Table 4 Summary and characteristic analysis of common intelligent RLV reentry attitude control methods
基于上述對RLV控制研究現狀的分析,對未來RLV姿態控制的發展趨勢進行展望:① RLV 大空域、寬速域及高機動的飛行特性,使得RLV自身模型的耦合程度、未建模動態及外界干擾在不同飛行狀態下差異明顯,如何設計抗擾能力強、適用范圍廣、控制形式及參數調整簡單的新型控制算法,是RLV姿態控制領域需要重點關注的研究方向;② 近年來,國內外學者針對基于干擾觀測器的RLV擾動補償控制開展了大量研究工作,并取得了豐富的研究成果,如TLC干擾觀測器[131-133]、滑模干擾觀測器[145-146]、模糊控制干擾觀測器[169-170]等。該方法通過設計干擾觀測器在完成對模型不確定及外界干擾在線觀測的同時,可實現對給定制導指令的魯棒跟蹤控制,顯著增強系統的抗干擾能力[178-179]。鑒于基于干擾補償控制方法在抑制模型不確定及外界干擾上的顯著優勢,基于該方法的RLV姿態控制研究將是未來RLV姿態控制領域的重要研究方向之一;③ RLV的軌跡跟蹤效果直接受到內環姿態控制性能的影響,為了確保軌跡跟蹤的高效性,在滿足執行器物理約束的前提下,需要盡可能的提高姿態跟蹤的收斂速度,盡管目前已有固定時間控制文獻公開發表[156],但其設計形式較為復雜,難以在實際系統進行應用,如何設計更為簡潔實用的具有固定時間收斂特性的飛行控制算法,是未來RLV姿態控制領域需要重點研究的課題。
制導控制一體化(Integrated guidance and control, IGC)設計在20世紀80年代被提出[180-181],旨在將制導系統與控制系統視為一個整體系統,然后直接針對這個整體系統的模型進行制導控制算法的設計,提高制導系統與控制系統的協調匹配程度, 進而改善飛行器的控制品質[182]。當前主要的IGC設計思路為:建立包含制導與控制的六自由度耦合模型,采用小增益控制[183]、反步控制[184]、動態面控制[185]和全狀態反饋[186]等完成高階非線性模型的控制器設計[187]。文獻[188]提出了一種考慮輸入飽和約束的制導控制一體化設計方法,基于干擾觀測器對系統不確定性進行補償,然后結合加冪積分方法與嵌套飽和方法對控制律進行了設計。文獻[189]通過降階處理,得到飛行器制導控制系統低階解析模型,將IGC問題轉化為低階非線性系統進行求解,為解決IGC問題提供了新思路。然而,該方法依賴于解析模型的精度,實際過程中往往難以實現。文獻[190]通過建立包含質心運動方程和繞質心姿態控制方程的全耦合IGC高階非線性模型,在此基礎上,基于反步控制設計控制器完成姿態控制任務。為了避免反步控制中的微分爆炸,文獻[191]利用動態面控制(Dynamic Surface Control, DSC)技術對IGC系統進行設計。此外,滑模控制方法[192-193]和自適應控制方法[194-198]在IGC系統中的應用也得到了廣泛的研究。在IGC系統中,考慮模型不確定和外界干擾對系統性能的影響,往往可以通過引入干擾觀測器[199]、擴展狀態觀測器(Extended State Observer, ESO)[200]、神經網絡[201]等方法來提高系統的抗干擾能力。例如,文獻[200]中利用ESO估計反步控制每個循環中存在的不確定和干擾,以減少IGC系統對模型精度的依賴。
目前IGC的研究主要還是采用一種分環遞推的設計形式,而沒有真正意義上將RLV六自由度模型統一到一個環里進行設計,文獻[202]指出這種人為分環的設計方式將有可能對RLV安全可達區域的計算產生影響,導致飛行安全隱患。文獻[203]提出了一種直接針對RLV六自由度運模型進行軌跡優化的方法,通過該方法能夠直接獲得飛行軌跡和執行器之間的映射關系,避免了對制導控制系統的分環設計,但這種方法對機載計算機的計算能力要求非常高。基于類似的思路,文獻[202]將RLV六自由度模型放在一個環進行設計,基于偽譜法對RLV再入末端的六自由度實時軌跡優化問題進行研究,通過實時軌跡規劃直接獲得了RLV舵面與飛行軌跡之間的關系,且系統表現出很好抗干擾能力。這種單環的設計思路,近年來也出現在基于強化學習的著陸飛行器制導控制系統設計中,例如文獻[204]提出了一種基于強化學習的IGC算法,使用強化學習方法將系統的狀態直接映射到執行器層面。文獻[205] 則基于深度強化學習理論,直接建立了飛行器軌跡與引擎推力間的映射關系,實現了單環框架下的集成制導控制一體化設計。這種設計思路為單環的RLV制導控制一體化設計提供了很好的借鑒。隨著計算機和人工智能技術的不斷發展,從提高RLV飛行安全的角度考慮,將RLV的六自由度模型在單環的框架內進行IGC設計具有重要的研究意義,是未來RLV制導控制一體化設計需要重點關注的研究方向。
航空航天技術高度結合的RLV在維護國家安全、應對潛在空間沖突、獲取太空戰略資源等方面具有極其重要的戰略地位,正成為各個軍事強國重點關注的研究方向。本文在深入分析RLV再入飛行特性的基礎上,較為系統地從RLV再入軌跡優化、再入制導、再入姿態控制及制導控制一體化角度對當前已有的研究工作進行了綜述,基于對每類方法深入分析的基礎上,對其未來發展趨勢進行了展望。希望本文的研究工作可對從事相關研究的科技工作者提供有益參考。