王 丁, 羅文波, 吳 瓊, 趙震波, 王云鋒
(1.北京空間飛行器總體設計部, 北京 100094; 2.中機生產力促進中心, 北京100044)
對于高精度測繪衛星來說,各測量載荷之間需要配合使用,并保持相對位置穩定。因此除測量載荷本身的精度外, 航天器結構尺寸穩定性對測量數據精度的影響也越來越不可忽略。目前,在國內外高精度和科學探測衛星中廣泛應用的較為成熟的航天器結構熱變形分析技術是基于在軌仿真分析溫度場計算熱變形。 游思梁等通過直接計算得到的溫度場計算得到天線在軌熱變形[1];Stephen 等在針對LISA 衛星開展的光機熱建模與分析中通過I-IDEAS 軟件仿真得到熱變形分析的溫度場[2];劉振宇等利用I-IDEAS 軟件分析得到的在軌溫度場完成了對空間太陽翼的變工況在軌熱變形分析[3];潘騰、張也馳等利用普通克里格法對溫度實測點進行插值并以此計算了載荷結構熱變形[4];帥永等采用自適應算法和加權算法求解航天器熱平衡試驗中多熱源非線性溫度場反演問題[5];羅文波等建立了一種基于模型和在軌測量數據的溫度場反演方法,并以此分析了結構穩定性指標[6]。 但是目前方法均利用完整溫度場對航天器熱變形進行計算,計算量大、資源需求多。 工程需求的航天器在軌熱變形分析一方面僅關注關鍵部位的變形情況; 另一方面衛星上可利用的資源和可測量的數據十分有限。 因此,由部分已知信息獲取關鍵部位的變形情況具有重要的工程應用價值。 本文利用航天器上有限個測量點的溫度測量數據, 通過長短期記憶網絡 (Long Short-Term Memory,LSTM)對其熱變形進行預測,并對結果進行了分析。
本文采用神經網絡的方法, 通過有限個測量點的溫度測量數據對航天器結構熱變形進行預測。 首先選取有限個航天器有限元模型節點的溫度數據與變形數據作為神經網絡訓練的樣本集; 然后采用貝葉斯優化算法對神經網絡超參數進行優化; 最后對比選擇優化后的神經網絡用作航天器熱變形預測。 具體流程如圖1 所示。

圖1 熱變形預測方法流程
高分七號是我國首顆亞微米級高分辨率光學傳輸型立體測繪衛星, 配置雙線陣相機和2 束激光測高儀, 能獲取高空間分辨率立體測繪遙感數據和高精度激光測高數據。本文采用文獻[6]中方法,基于在軌溫度測量數據反演出衛星結構在軌溫度場。 輸入數據為高分七號有限元模型節點溫度,在本文中作為精確值;輸出數據為高分七號兩個相機與激光測高儀安裝面擬合平面法線矢量之間的夾角,該夾角通過在有限元模型上施加完整溫度場計算而得,變形計算采用的有限元模型根據地面熱變形試驗已完成模型修正, 在本文中作為精確值。用于神經網絡訓練的樣本集記為:式中:xi—輸入數據,組成輸入空間X;yi—輸出數據,組成輸出空間Y。

為了使用較少的作為輸入數據的節點, 即降低輸入數據維度,需要對衛星有限元模型節點進行選擇。高分七號完整有限元模型如圖2 所示, 其中載荷模型及其安裝結構認為是恒溫,需人工篩去,只保留部分結構模型,如圖3 所示。然后識別出與輸入數據相關性高的節點,本文采 用 最 大 信 息 系 數[7](Maximal Information Coefficient,MIC)作為相關性度量。

直接作為本文輸出數據的是衛星載荷安裝面法線矢量間的夾角, 需要對有限元方法計算得到的安裝節點位移進行轉化,轉換方法為文獻[8]中提出的點云數據平面擬合方法。 衛星三個載荷安裝面法線矢量之間的夾角分別定義為O1、O2、O3。
為了消除數據數量級對神經網絡訓練精度的影響,需要對數據進行歸一化。 設原始輸入數據為:
同理,輸出數據也在對原始數據進行歸一化得到,并與輸入數據組成樣本集D。

圖2 高分七號完整有限元模型

圖3 高分七號部分結構有限元模型
衛星于軌道空間呈周期性運動, 其熱環境具有一定的周期性, 因此其溫度及熱變形數據是與時間相關的時間序列。 循環神經網絡(Recurrent Neural Network,RNN)將時序的概念引入到網絡結構的設計中, 是一類具有短期記憶能力的神經網絡。 循環神經網絡的參數學習可以通過隨時間反向傳播算法(Backpropagation Through Time,BPTT)[9]來學習。 但是當輸入序列比較長時,會存在梯度消失和梯度爆炸問題[10],即長程依賴問題。 在眾多RNN 的變體中,長短期記憶(Long Short-Term Memory,LSTM)模型引入了輸入門、 遺忘門和輸出門的門控機制[13], 彌補了RNN 的長程依賴問題和長期記憶能力不足等問題,使得循環神經網絡能夠真正有效地利用長距離的時序信息。
設一個給定的輸入序列為x1:T=(x1,x2,…,xt,…,xT),則LSTM 網絡前向計算公式可以表示為:

式中:ht、it、ft、ot、ct分別為t 時刻隱含層活性值、輸入門、遺忘門、 輸出門和細胞狀態;W、U、b 為網絡參數;σ 和tanh 分別為sigmoid 函數和雙曲正切激活函數。
LSTM 網絡參數學習采用的是與經典反向傳播(Back Propagation,BP) 算法原理類似的BPTT 算法,其步驟為:①式(4)~式(9)計算LSTM 細胞的輸出值;②反向計算每個LSTM 細胞的誤差項; ③根據相應的誤差項計算每個權重矩陣的梯度; ④應用基于梯度的優化算法更新權重矩陣。
目前, 深度神經網絡的參數學習主要是通過梯度下降法來尋找一組最小化結構風險的參數, 可以分為批量梯度下降、 隨機梯度下降和小批量梯度下降三種形式。 本文選用的是適應性動量估計(Adaptive moment estimation,Adam)算法[14]。 Adam 算法不但使用動量作為參數更新的方向,而且可以自適應調整學習率。 LSTM 網絡模型訓練過程中使用的損失函數為常用于回歸問題的平方損失函數,其定義為:

式中:f(xi)為LSTM 網絡模型預測值。
LSTM 網絡結構包括輸入層、隱含層和輸出層。 本文對比兩種不同隱含層的LSTM 網絡模型,分別記為neta和netb,兩種模型結構分別如圖4、5 所示。 neta為單隱含層;netb兩層LSTM 層中間加一層丟棄層。

圖4 LSTM 網絡結構neta

圖5 LSTM 網絡結構netb
LSTM 網絡訓練收斂判據為:①驗證集最小均方誤差連續6 次不更新;②訓練集最小均方誤差連續10 次不更新;③訓練集均方誤差減小幅度連續10 次小于ε,本文中令ε=10-5。 三個收斂判據滿足其一,即停止網絡訓練并認為其收斂。
在神經網絡中,除了可學習參數外,還存在不能直接通過訓練學習的超參數需優化。 常用的超參數優化方法有網格搜索、隨機搜索、遺傳算法、粒子群算法和貝葉斯優化等。 其中貝葉斯優化是一種以貝葉斯定理為理論基礎的自適應的超參數優化算法[15-16],其根據當前已經試驗的超參數組合來預測下一個可能的最大收益組合,只需要較少次數的目標函數評估即可獲得理想解,非常適用于求解目標函數未知、非凸、多峰和評價代價高的復雜優化問題[17-18]。 本文采用貝葉斯優化算法對LSTM 網絡模型的超參數進行優化,待優化的變量及其約束條件如表1 所示。

表1 待優化參數約束條件
通過貝葉斯優化算法對LSTM 網絡模型超參數進行優化, 優化過程中以測試集均方根誤差 (Root Mean Square Error,RMSE)作為待優化目標函數。 RMSE 計算公式為:

式中:f(xi)、yi分別為觀測值和目標輸出值,n 為樣本數量。優化過程中, 滿足優化次數大于50 次且15 次沒有更新最小目標值的條件,即認為達到最優解。
RMSE 不僅可以作為優化超參數的目標函數, 而且可以對LSTM 網絡模型的整體預測精度進行量化評價。除此之外,本文還分別選擇平均絕對誤差(MAE)、平均相對誤差(MAPE)和最大絕對誤差(MaxAE)從多角度對LSTM 網絡模型進行精度量化評價,其計算公式分別如式(13)~式(15)所示。

式中:由于樣本變化范圍僅為其目標值10-6量級,因此在計算MAPE 時, 選取樣本目標值的峰峰值P 作為計算時的分母,P= max(yi)-min(yi),i=1,2,…,n。
結合高分七號溫度測量在軌數據, 應用貝葉斯算法優化LSTM 網絡模型并展開分析。樣本原始數據來自高分七號在軌測量數據及有限元仿真分析熱變形, 共20 軌,每軌包括190 個測量時刻,即共3800 組數據。將樣本集D按70%、15%、15%的時序比例分為訓練集、驗證集和測試集,其中訓練集用于LSTM 網絡模型的參數學習,驗證集用于防止訓練過擬合,測試集用于模型預測結果檢驗。
為探究不同影響因素對預測精度的影響, 設計了變量包括輸入數據選取方法、輸入維度、輸出維度和LSTM網絡結構的對照實驗組,如表2 所示。其中輸入數據選取方法為1.2 節中提到的MIC 方法,記mki為第i 個節點與第k 個夾角之間的MIC 值,其矩陣形式為:

MIC 值越大,相關性越高。 本文中根據MIC 系數選取輸入數據方法分為兩類:一類是矩陣M 每列取均值并降序排列,按輸入維度選取MIC 均值大的節點, 節點溫度即為輸入數據,記為方法M;另一類矩陣M 每行分別降序排列,分別選取每行MIC 系數大的節點,記為方法I。同時,由于有限元模型及溫度場自身特性,相鄰節點的MIC 值可能非常接近,因此從溫度測點分布的角度考慮, 需要對選出的節點再進行一次相關性篩選。
為比較輸出維度對預測精度影響,設置了輸出維度分別為1 和3 的對照組, 相應需要訓練的LSTM 網絡模型數量分別為3 和1。

表2 實驗組設置

圖6 實驗組A1-A8 及B1-B8 貝葉斯優化結果

圖7 實驗組C1-C4 貝葉斯優化結果
貝葉斯優化算法對LSTM 網絡模型超參數優化結果如圖6-圖8 所示。 圖中所示橫坐標為選取作為輸入數據的節點數量,即輸入維度;縱坐標為測試集RMSE,其值越小表示對測試集整體的預測精度越高。 根據結果進行分析可以得出如下結論:①整體上來說,RMSE 隨輸入維度增加呈下降趨勢,其中實驗組B4 輸入維度為12,預測精度最高,RMSE值為0.0634。實驗組B4 的LSTM 網絡模型測試集預測結果與目標值對比情況, 見圖9; ②對比輸入數據選取方法M 和I, 方法M 在輸入維度為3 和6 時,預測效果優于方法I; 但當輸入維度較大, 即為9 和12時,方法I 預測效果優于方法M;③輸入維度對多層結構網絡netb預測精度的影響小于單層結構網絡neta, 這與netb具有更好的泛化能力有關; ④實驗組C1-C4 和C5-C8 整體隨輸入維度增加變化趨勢相似, 其中對輸出O3的預測精度隨輸入維度增加而更高的趨勢最大, 變化幅值分別為0.0602 和0.1055, 這與衛星自身熱變形有關,即沿某一方向變化較明顯,其余兩個方向變化較弱。

圖8 實驗組C5-C8 貝葉斯優化結果

圖9 實驗組B4 貝葉斯優化結果
各實驗組LSTM 網絡模型測試集預測結果的MAE、MAPE 和MaxAE 如表3 所示。MAE 和MAPE 最小值均為實驗組C2 和C3, 其中MAE 最小值分別為7.956×10-6、8.609×10-6和7.177×10-6,MAPE 最小值分別為2.60%、2.63%和2.45%,但兩個實驗組都出現對某一維度預測效果較差的現象,這與C 實驗組采用三個獨立的LSTM 網絡模型分別對三個維度輸出進行預測有關,即對三個維度輸出的預測各自獨立; 實驗組A6 雖然對三維輸出的預測效果在對比實驗組中不是最小值,但是對三維輸出整體預測效果較好。 MAPE 給出了LSTM 網絡模型預測的最大絕對誤差,其工程意義在于一定程度上給出了誤差變化范圍。

表3 LSTM 網絡模型預測MAE、MAPE 和MaxAE
本文針對高精度測繪衛星結構尺寸穩定性問題,提出了基于較少在軌溫度測點和LSTM 網絡模型的航天器熱變形預測方法, 包括訓練數據選取與處理、LSTM 網絡模型預測以及超參數優化等內容。 原始在軌測量數據經過選取和預處理,提高了計算精度。設計了包含多個對照實驗組的LSTM 網絡模型預測實驗。 采用貝葉斯優化算法對LSTM 網絡模型超參數進行優化, 得到超參數的最優解。 實驗驗證表明:①單層結構LSTM 網絡模型與多層結構相比, 單層結構網絡對航天器熱變形問題預測更準確,但是其受輸入維度影響更大,預測精度隨輸入維度增大而更高;②輸入數據選取方法根據不同維度輸出分別選取,以達到更高的預測精度;③對不同維度輸出分別做各自獨立的LSTM 網絡模型訓練可以達到更高的精度,但資源占用更多。
本文探索了LSTM 網絡模型在航天器熱變形預測領域中的適用性,擴展了深度學習技術的應用范疇;分析了該方法在航天器熱變形預測問題中的結果,驗證了該方法的有效性。