李惠峰,張 冉,王嘉煒
北京航空航天大學宇航學院,北京 100191
火箭制導的任務是控制火箭的質心運動,即根據導航提供的飛行時間和飛行狀態產生推力和姿態控制指令,使火箭達到期望的終端狀態?,F有文獻中的制導一詞可從2種角度理解:從狹義角度,其特指火箭控制系統中的制導律,即實現期望飛行軌跡的控制規律和策略;從廣義角度,制導涵蓋了火箭任務軌跡和飛行策略的設計,是一門研究如何“管理”軌跡的學科。本文從狹義角度出發,介紹液體火箭上升段制導方法的發展歷程,并展望其未來的發展方向。
運載火箭上升段制導是一門歷史悠久的學科。第二次世界大戰期間,德國“V-2”火箭就搭載了慣性導航器件,通過調整火箭姿態和發動機關機時間控制火箭的飛行軌跡,初步形成了制導的概念。第二次世界大戰后,各國的航天計劃進一步推動了上升段制導的發展,逐漸形成了大氣層內攝動制導、大氣層外顯式制導的飛行策略,這一策略迄今為止仍被廣泛使用[1]。21 世紀以來,深空探測和載人航天等任務對制導方法的智能自主性、任務適應性和故障適應性提出了更高的要求。而控制理論、數值計算、機器學習等領域的突破和箭載計算能力的增強為制導方法的進一步發展提供了堅實的基礎。智能制導、計算制導等概念已吸引了國內外研究人員的廣泛關注[2-7]?;跀抵狄巹澓蛷娀瘜W習的上升段制導方法可能迎來新的突破。
然而,上升段制導亦是一門對可靠性要求極高的學科。經過多次飛行試驗的成熟制導方法一般得到長期沿用。上世紀60至70年代提出的迭代制導和動力顯式制導至今仍是主要的大氣層外制導方法[1,6,8]。例如,美國正在開發的空間發射系統(SLS)就使用了航天飛機的動力顯式制導方法,并復用了部分程序代碼[9-10]。事實上,當現有制導方法的功能和性能可以滿足任務要求時,新的制導方法一般難以得到應用。在這樣的學科背景下,上升段制導的幾次變革顯得尤為突出,一般帶來了制導功能或性能上的突破。為分析變革原因,并展望未來潛在的突破方向,本文整理了上升段制導發展的背景和驅動力。一般來說,上升段制導的發展離不開3個因素:飛行任務需求、控制計算理論、箭載計算平臺。
首先,讓火箭的運載能力更強、飛行更安全、成本更低是火箭總體設計的一項主要目標[4]。在控制系統層面,這構成了上升段制導發展的主驅動力。近年來,總體設計對上升段制導的性能(特別是故障適應性)提出了越來越高的要求[11-13]。而火箭設計亦受益于上升段制導功能上的突破。例如,具有主動減載能力的制導方法能夠降低火箭所受的氣動載荷,進而降低結構質量;具有終端姿態調節能力的制導方法能夠省去火箭末級的調姿系統。先進的制導方法不僅是實現標稱飛行軌跡的工具,還能夠在一定程度上緩和火箭任務設計中的矛盾,直接或間接地增強火箭各項指標。
其次,上升段制導上游學科(包括控制理論和數值計算)的發展提供了新的理論工具。以最優控制理論為例,它一方面為大氣層內攝動制導提供了標稱軌跡的離線優化算法,另一方面為分析火箭最優軌跡性質提供了理論基礎,支撐了大氣層外顯式制導的設計和性能評估。而火箭軌跡規劃問題的數值求解方法,從早期的梯度法到上世紀末的序列二次規劃和凸內點法,亦取得了長足的進步[14-15]。數值方法能夠在越來越短的時間內求解越來越復雜的火箭軌跡規劃問題,為在線軌跡規劃[16-21],和基于閉環軌跡優化的制導方法提供了基礎[22-25]。
最后,箭載計算平臺的運算能力大幅上升。運算能力曾是過去制約制導方法復雜度的一項因素,如今已成為應用先進制導技術的驅動力。隨著箭載計算機的核心數量、浮點計算效率的提升,以及并行處理單元、現場可編程門陣列(FPGA)等硬件計算設備規模的擴大,箭載計算平臺能夠提供的算力已經遠遠超出了經典制導方法的需要。如何充分應用這些算力增強制導的智能自主性成為了一項研究熱點,特別是推動了機器學習在制導中的應用[7,26-30]。
考慮到大氣層內外火箭質心運動特性和制導的主要設計目標存在差異,而大氣層內外的制導策略亦存在較大差異,本文將分別介紹大氣層外和大氣層內制導方法的發展歷程。
運載火箭的制導技術發展自上世紀50年代的彈道導彈制導技術,如“阿特拉斯”導彈采用的Delta制導方法和“雷神”導彈采用的Q制導方法[31]。這些制導方法依賴于離線規劃的標稱軌跡。早期的運載火箭,如“紅石”運載火箭,亦采用了依賴標稱軌跡的Delta最小化制導方法,通過不斷修正火箭軌跡和標稱軌跡的偏差來控制火箭飛行[32]。這些制導方法的計算公式簡單,可應用當時的模擬計算機實現。需要指出的是,模擬計算機的計算精度對制導精度有著直接影響。以“雷神”導彈為例,關鍵參數每百分之一的偏差都可能導致約6.4 km的落點偏差。因此,“雷神”導彈對于3 km的精度要求直接決定了模擬計算精度的要求。此外,對標稱軌跡的依賴性使得這些制導方法難以適應強大氣擾動和推力故障,其控制精度和燃料最優性未能滿足載人航天任務的要求。
上世紀60年代出現的顯式制導概念提供了另一種制導思路。顯式制導建立了制導指令和終端目標間的顯式關系,根據火箭當前的飛行狀態,規劃火箭未來的飛行軌跡以生成制導指令[33-34]。顯式制導的開發受益于箭載數字計算機的應用,一方面導航系統對完整飛行狀態(位置和速度)的解算更加容易,另一方面解除了制導設計中對代數運算和迭代計算的限制。基于顯式制導概念的大氣層外制導方法如圖1 所示。

圖1 大氣層外制導方法的發展
迭代制導模式 (Iterative Guidance Mode,IGM) 是 NASA 于上世紀 60 年代為運載火箭開發的一系列制導方法,其中包括“土星五號”運載火箭采用的迭代制導方法[35-36]。迭代制導是一種路徑自適應動力制導方法:不是去跟蹤離線規劃的標稱軌跡,而是時刻根據當前位置和速度規劃一條新的最優軌跡?;诰€性程序角和平均重力場假設,最優軌跡的生成和制導指令的反解具有解析或半解析的形式,因此能夠應用當時的箭載計算機實現。此外,迭代制導采用的線性程序角具有近似最優的性質,制導的燃料消耗接近最優軌跡[37]。在“土星”系列運載火箭上的數值實驗顯示,與最優參考相比,迭代制導多消耗的燃料通常不超過4%;在地月轉移任務的多類單項偏差作用下中,近地點誤差的平均值約為10 km,軌道傾角誤差的平均值約為0.5°。迭代制導的燃料最優性和高制導精度為“阿波羅”系列任務的執行提供了支持,并使迭代制導成為了一種常見的上升段制導方法[38]。
迭代制導的一個主要公式是對程序角指令的分解,以俯仰通道為例:
(1)

葡萄籽原花青素對阿爾茨海默病模型大鼠學習記憶能力的改善作用及其機制研究 ……………………… 陳 偉等(13):1760
從計算角度考慮,迭代制導的計算過程具有內外層結構:內層迭代搜索飛行時間;外層迭代搜索入軌點。內外環迭代一般均可在較少次數內收斂,而每次迭代只涉及到顯式公式的計算,因此迭代制導具有較高的計算效率。考慮迭代制導的收斂性,內環迭代的收斂性與火箭推重比相關,而外環迭代的完整收斂性分析尚未見公開報道。盡管如此,迭代制導在數值算例中表現出了非常好的收斂性,并且迭代初值因具有明確的物理意義而容易設置,因此在工程中得到了廣泛的應用。
國內亦展開了迭代制導的相關研究,研究成果見文獻[40-43]。我國在“長征二號F”運載火箭遙八任務中首次使用了迭代制導方法,滿足了空間交會對接任務對入軌精度的高要求[44-45]。隨后,迭代制導應用到我國多款運載火箭上,驗證了制導效果。國內研究團隊對迭代制導提出了多種改進策略。例如,文獻[46-50]研究了含有入軌姿態約束的制導問題,提出了同時控制入軌位置、速度和姿態的迭代制導方法。文獻[51-53]研究了迭代制導在月面上升段和空間變軌任務中的擴展應用。文獻[54]研究了多段接力迭代制導的應用方法。
在迭代制導的設計過程中,所做的另一個關鍵假設是重力加速度為常數,一般取為當前位置和預測入軌點處重力加速度的均值[36,39]。在火箭推重比較大而推進弧較短時,這一假設對燃料最優性的影響很小。然而,在火箭推重比較小且推進弧較長時,迭代制導的性能會下降,甚至出現迭代發散的現象。此時可通過設置中間目標軌道的方式實現制導,但這可能導致制導指令的跳變和燃料最優性的損失。此問題在后續開發的動力顯式制導中得到了改進。
動力顯式制導 (Powered Explicit Guidance,PEG)是NASA在上世紀70年代為航天飛機開發的顯式制導方法,歷經多次改進后,在SLS上亦得到應用[8,55]。航天飛機的任務樣式較土星五號更為多樣,且部分任務中火箭推重比很低,可能導致迭代制導的性能下降甚至迭代發散。例如,在航天飛機的入軌和離軌過程中,推重比可能低至0.02~0.06,推進時間可能長達20 min,給迭代制導的收斂帶來嚴峻的挑戰。為此,NASA開展了多種制導算法的論證工作,在與最優制導(OPGUID)、偽最優軌跡分析(QUOTA)等制導方法的對比中,線性正切制導(Linear Tangent Guidance,LTG)受到了關注[56]。后來,Draper實驗室基于LTG概念實現的一種制導方法被命名為動力顯式制導,成為了航天飛機大氣層外飛行的統一制導方法。
動力顯式制導的一個主要公式是推力方向的線性正切變化:
(2)


圖2 動力顯式制導的線性正切規律
動力顯式制導的一個特點是算法流程的模塊化:與計算公式緊密耦合的迭代制導不同,動力顯式制導可劃分為多個功能具體的模塊。通過改變各個模塊的實現,動力顯式制導可更好地適應具體的飛行任務[57]。例如,在推重比較低導致制導性能不佳時,可通過設計推力作用的預測模塊予以修正[58]。此外,在航天飛機應用的動力顯式制導中探索了數值方法的箭載應用:重力作用的預測采用了一種定步數數值積分方法[55]。與只使用解析公式的迭代制導不同,部分使用數值技術的動力顯式制導具有更好的任務適應性[56]。
最優制導是以某種最優規律產生推力和姿態指令的制導方法。閉環軌跡優化是一種較容易實現的最優制導策略:不斷應用當前的飛行狀態計算最優軌跡,再應用最優軌跡解中的控制量作為制導指令。盡管最優控制量的應用形式可為開環,最優軌跡的不斷更新形成了一個閉環,使此類制導方法能夠較好地適應飛行中的干擾和故障。另一種最優制導策略是鄰近最優控制,應用最優軌跡上的敏感度矩陣直接形成反饋控制[59]。最優軌跡的計算一般依賴數值技術。
最優制導(OPGUID)是早期的一種最優制導方法,它實現了最優控制中的間接打靶法,通過猜測協態初值、計算最優軌跡、校正終端偏差的策略求解燃料最優軌跡規劃問題[60]。OPGUID開發了一種最優軌跡的解析積分方法和一種定制化的牛頓法,在數值實驗中表現出了良好的收斂性和收斂速度,長期作為候選制導方法與動力顯式制導競爭[8]。然而,OPGUID的計算效率低于動力顯式制導:在當時的地面大型機(IBM 7094)上,OPGUID的每次迭代需要0.5 s,而軌跡收斂一般需3~6次迭代。這限制了OPGUID在航天飛機上的實時應用。OPGUID后來發展形成了SWITCH制導方法,可對多推進弧、多滑行弧的火箭軌跡進行實時規劃,然而多弧段的SWITCH制導方法存在收斂性問題[61]。為增強此類方法的收斂性,文獻[62]提出了一種基于多重打靶法的制導方法,通過將火箭軌跡劃分為多個階段,降低了迭代對初值的敏感性。限制此類制導方法實際應用的一個主要原因是:與迭代制導和動力顯式制導不同,迭代初值中的協態量缺乏物理意義,取值范圍較大且難以設計系統的生成方法。
近年來,出現了應用最優控制中直接法的最優制導方法。直接法是指應用離散化方法將火箭軌跡規劃問題轉化為非線性規劃問題并求解。此類方法形成的非線性規劃問題一般具有中大規模(數百至數千個規劃變量)和問題矩陣稀疏的特點。隨著能夠利用稀疏性的非線性規劃方法(如序列二次規劃方法和序列凸規劃方法)發展和箭載浮點計算能力的進步,直接法已應用在各種火箭軌跡規劃問題中[63]。例如,文獻[64]提出了一種應用偽譜法實現閉環軌跡優化的制導方法。文獻[65-66]提出了一種面向火箭上升段軌跡規劃的牛頓-康托維奇方法。文獻[67]提出了火箭動力故障下的救援軌道生成方法。文獻[68]提出了一種能夠處理階段時長約束的多階段軌跡規劃方法。與OPGUID等基于間接打靶法的方法相比,直接法的一個優勢是迭代初值的選擇均具有物理意義,而協態量等對偶變量由底層的數學規劃方法自行處理?;谥苯臃ǖ拈]環軌跡優化是一種很有前景的制導策略,但仍有收斂性、穩定性、解的存在性等問題需要進一步的分析。
運載火箭在稠密大氣中飛行時,箭體結構、姿態控制、伺服系統均面臨著較大的壓力。作為細長體的火箭對氣動載荷(如動壓攻角積)非常敏感,在穿越大風區時,飛行控制系統的首要任務是降低箭體結構承受的載荷,而非控制軌跡誤差。其次,姿態控制系統的設計和分析一般也是沿標稱軌跡開展,大幅改變火箭飛行剖面可能帶來不必要的風險。再次,大氣層外的閉環制導方法對初始狀態偏差具有較強的適應能力,使得大氣層內的飛行對終端入軌精度的影響較小。上述特點在一定程度上限制了顯式制導在大氣層內的應用。目前大氣層內的主要制導方法是基于標稱軌跡的攝動制導方法,有時還輔以減載策略來進一步降低氣動載荷。
運載火箭在大氣層內飛行時,常應用攝動制導方法[69]。攝動制導方法的姿態角指令分為2部分:標稱項和導引項。標稱項來自離線規劃的標稱軌跡,選擇1個自變量(如時間、高度、速度或馬赫數)應用離線設計的插值表計算得到。以高度或速度作為自變量時,產生的軌跡散布可能較以時間為自變量時更小[1]。攝動制導的導引項則是根據攝動方程得到,通過在標稱軌跡處線性化火箭運動方程形成反饋,控制火箭在標稱軌跡附近飛行。
為降低火箭在跨聲速段和最大動壓段所受的氣動載荷,大氣層內制導中可加入減載策略。減載策略主要分為2類:離線減載和在線減載。離線減載通過在標稱軌跡設計中考慮風場影響,從而降低火箭在跨聲速段和最大動壓段的氣流攻角。文獻[70]提出了一種高空風彈道修正方法,根據運載火箭發射前氣象部門預測的風場信息修正飛行彈道,有效降低了“長征二號 E”運載火箭在幾次飛行任務中的氣動載荷。在線減載是根據火箭飛行中實時量測估計得到的過載或攻角進行反饋控制。文獻[71-72]介紹了我國運載火箭使用的幾種在線減載方法,包括基于攻角反饋、過載反饋和自抗擾控制的減載方法。此類方法的一個研究重點是如何取舍減載效果和軌跡精度。
部分任務對大氣層內上升段制導的性能提出了更高的要求:一方面,這些任務對大氣層內箭體分離時的飛行狀態提出了約束,而攝動制導產生的狀態散布可能不滿足任務要求[73];另一方面,這些任務對火箭能量利用的最優性提出了較高要求,若應用反饋方法跟蹤標稱任務剖面,在強大氣擾動下分離點的速度可能不滿足任務要求。閉環軌跡規劃為解決此類火箭的制導問題提供了一條可行的技術路線,通過在線規劃推力和氣動力復合作用下的飛行軌跡實現制導。例如,文獻[74-75]提出了一種鄰近-牛頓-康托維奇方法,能夠實時規劃火箭大氣層內的軌跡,進而實現運載火箭上升段的終端速度最優制導。
可見,運載火箭大氣層內的上升段制導問題具有強約束、強擾動的特征[76-77]。考慮到非線性氣動力的作用,顯式制導方法的設計具有一定的挑戰性。然而在現有箭載計算能力的支持下,閉環軌跡優化和強化學習在此問題上均具有較好的應用潛力,有望進一步增強運載火箭對強大氣擾動和故障的適應能力[3,78-81]。
介紹了運載火箭大氣層內外制導方法的發展歷程。上世紀提出的迭代制導、動力顯式制導和大氣層內的攝動制導目前仍是主要的制導方法。但近年來,火箭任務設計要求制導方法具有更強的智能自主性,從而更好地處理飛行中的強大氣擾動和各類故障。這些要求為先進控制和數值計算方法在運載火箭上的應用提供了機遇。未來的上升段制導方法可能具有以下特點:
1)走向智能化。隨著火箭設計(特別是動力系統和伺服系統)愈加復雜,在上升段制導系統中枚舉所有可能故障并作相應處理愈發困難。亟需一種兼具感知、理解、決策、學習、適應能力的上升段制導方法,從而充分發揮火箭能力。
2)應用可靠的數值計算方法。隨著數學規劃求解器的數值穩定性提升,以及迭代求解火箭軌跡規劃問題的理論進步,在箭載環境中使用甚至依賴數值計算進行上升段制導的條件逐漸成熟。若閉環軌跡優化的計算時間能夠降低至毫秒量級,并且具有明確的收斂性保障,則有望成為一種系統且可靠的閉環制導策略,實現大氣層外乃至大氣層內的閉環最優制導。
3)與箭載計算設備深度融合?,F有的制導方法一般未能充分利用箭載的異構計算資源,例如并行處理器與FPGA。充分應用箭載計算能力的制導方法可能在制導性能和計算效率上具有顯著優勢。
4)對未知干擾的估計和抑制能力。火箭上升段飛行中遇到的干擾,例如風干擾,常具有一定的結構特征,依高度的變化存在一定規律。根據干擾的結構特征對干擾進行估計甚至預測是改善上升段制導性能的一項關鍵手段。
綜上所述,先進制導方法和箭載計算能力的結合有望進一步推動火箭控制系統的智能化、自主化,為下一代運載火箭保駕護航。