景羿銘,王 融,熊 智,趙 耀,劉建業
(南京航空航天大學自動化學院,南京211106)
空天飛行器高速再入大氣層時,存在黑障區通信中斷的情況。而單獨的慣性導航元件存在誤差累計的缺點,若無輔助導航系統修正,慣性導航系統(Inertial Navigation System,INS)的精度會隨著時間而下降[1-2]。當輔助導航系統信號具備可用性時,通過信息融合可以進行導航信息的誤差修正。而在黑障區,即信號中斷期間,此時飛行器速度仍然較快,不斷的誤差累計不僅會對飛行器的飛行安全造成威脅,也會增加飛行器出黑障區后的捕捉難度以及著陸的不確定性。同時,跳躍式返回的飛行器會兩次進入黑障區[3],這對導航系統的可靠性提出了更嚴格的要求。為保證導航系統在黑障區的可靠性,文獻[4]針對黑障區通信失效的問題,根據頭重尾弱的特點,在飛行器頭尾分別安裝兩個全球定位系統(Global Positioning System,GPS)天線,以此測量姿態并進行修正,但該方法并無可靠的實際證明。為此,考慮在進入黑障區前,利用星敏感器對姿態信息進行修正以保證姿態的精確性,防止黑障區導航信息的過分發散。文獻[5]針對黑障等惡劣情況設計了一種快速補償的修正算法,但該算法僅在較短時間內有較好的效果。文獻[6]提出了一種基于徑向基函數(Radial Basis Function,RBF)神經網絡預測的誤差反饋校正方法,在GPS信號中斷時用訓練好的神經網絡預測導航誤差并進行修正,但RBF神經網絡仍是反饋型神經網絡,無法滿足飛行器高速返回時的實時性。而極限學習機(Extreme Learning Machine,ELM)具備動態記憶且只有一層隱藏層,學習速度快,泛化能力強,可用于快速學習。ELM在許多領域都有應用,已成功用于低分辨率至高分辨率圖像的轉化,也可實現對蛋白質交互作用的預測,因其良好的泛化能力已成功應用于對日河流徑流量、風速和干旱指數的預測[7-10]。該機器學習算法適合在需要高實時性的空天飛行器中使用,通過學習正常工作時的GPS數據,在GPS失鎖時對慣性導航系統進行誤差修正。
本文針對空天飛行器在黑障區失鎖的問題,提出了一種基于極限學習機的黑障區智能導航算法。該算法利用ELM對GPS數據進行訓練,在GPS失鎖時仍可提供輔助導航信息。相比于傳統的神經網絡,該算法具有學習速度快、實時性高的優點,保證了飛行器在高速返回時導航系統的可靠性。
極限學習機是黃廣斌等基于單隱藏層前饋神經網絡提出的一種新的機器學習算法,可用于一般單隱藏層的前饋神經網絡,其中的結點不一定是像神經元的結點[11],其結構示意圖如圖1所示。

圖1 極限學習機神經元示意圖Fig.1 Schematic diagram of extreme learning machine neurons
給定具有M個隱層結點的極限學習機模型,其輸出函數定義為

式(1)中,G(·)為激活函數;ωi為輸入層與隱藏層之間的連接權重,bi為隱藏層的閾值,是隨機選取且預先設定的參數;βi為輸出層與隱藏層之間的連接權重,該值不需要迭代調整。與BP神經網 絡 (Back Propagation Neural Network,BPNN)、RBF神經網絡(Radial Basis Function Neural Network,RBFNN)的輸出函數相比,ELM輸出函數的參數均不需要反饋修正,這大幅提高了學習與計算效率。而H為輸入樣本情況下隱藏層的輸出矢量,實際上將N維的輸入樣本映射到M維的ELM特征空間。
與反饋式神經網絡不同,極限學習機算法只要激活函數能夠滿足無窮可微的條件,則預設參數可以不進行迭代調整。為符合計算習慣與計算機語言,對式(1)進行矢量化,那么對于固定輸入的隱藏層參數來說,訓練極限學習機就等價于求取線性系統Hβ=T的最小二乘值,即

為了能夠具備良好的泛化性能,既要使極限學習機達到最小的訓練誤差,又要使其具有最小的輸出權重方差。因此,極小范數解準則滿足

由文獻[11]可知,當隱層神經元個數與訓練樣本個數一致時,可直接求逆。然而在大多數情況下,隱層神經元個數是遠小于訓練樣本個數的,這時需要利用損失函數求解最小值

式(4)中,H+為隱層響應矩陣H的Moore-Penrose增廣逆。在極限學習機中,通常選擇正交法對H+進行計算:
1)HTH非奇異時,HH+=(HTH)-1HT;
2)HHT非奇異時,H+=HT(HHT)-1。

需要穿過黑障區的飛行器通常均是超高速飛行器,這類飛行器本身對導航系統的可靠性要求就極高,黑障區的長時間無修正飛行給飛行器的再次捕捉與安全著陸都帶來了很大的風險。因此,本文提出一種基于極限學習機的黑障區智能導航算法,在GPS正常工作的時候利用極限學習機進行快速學習,當GPS修正時利用極限學習機回歸預測輔助進行慣性導航系統的誤差修正,保證黑障區導航系統的可靠性。
天文導航系統(Celestial Navigation System,CNS)獨立工作,星敏感器敏感天體方位信息,測得的姿態信息精度高且誤差不隨時間累積。但是,星敏感器測得的姿態信息是載體系相對于地心慣性系的數據,該數據需要進行坐標轉換為需要的導航坐標系下的姿態信息,轉換過程中會引入計算誤差,同時也會耦合到位置誤差,故導致了天文導航系統可靠性的下降[12]。又因為天文導航系統在大氣層內易受天氣的影響,且進入黑障區后工作條件難以滿足,所以為保證導航系統的可靠性,在進入黑障區前利用天文導航信息對陀螺輸出信息進行開環修正,不影響GPS的閉環系統工作,其整體設計方案如圖2所示。陀螺的誤差估計修正要根據陀螺的原始輸出信息解出載體相對于慣性坐標系的姿態信息,同天文定姿量測信息相結合,經由Kalman濾波器對陀螺的漂移誤差進行估計和跟蹤,為黑障區的導航系統可靠性提供保證。

圖2 基于陀螺誤差估計修正的導航系統方案示意圖Fig.2 Schematic diagram of navigation system scheme based on gyroscope error estimation and correction
為有效利用高精度天文定姿信息,首先需要推導建立地心慣性坐標系下的系統狀態方程。記載體相對于地心慣性坐標系的真實姿態四元數為Q,則

對式(6)求導, 可得

根據四元數運動學微分方程,可得載體真實姿態四元數微分方程和估計四元數的微分方程,分別為

將式(6)、 式(8)、 式(9)代入式(7), 根據四元數運算規則,化簡可得

根據四元數乘法運算規律及在姿態誤差為小量的情況下,誤差四元數δQ可近似為[13]

式(11)中,δq13為誤差四元數矢量部分。
將式(11)代入式(10), 忽略二階小量, 同時對其進行線性化,可得

則狀態變量定義如下

結合式(12)、 式(13), 可得

式(14)中,F(t)為系統狀態系數矩陣,G(t)為系統噪聲矩陣,W(t)為系統噪聲。
(1)GPS失鎖下的組合導航系統設計
導航系統通過輔助導航系統對捷聯慣導誤差進行最優估計,并對其進行誤差校正,通常選擇GPS測量信號。當GPS失鎖時,導航系統變為純慣性導航模式,解算結果無法修正,導致誤差累計甚至發散,造成嚴重后果。如果在GPS失鎖時仍能提供Kalman濾波觀測值,組合導航系統相當于 “正常工作”,能繼續對慣性導航解算結果進行修正。
根據上述原由,選擇ELM進行擬合學習非線性系統模型。該系統的工作狀態有兩種方式:1)GPS有效時的ELM網絡訓練方式;2)GPS失鎖時的神經網絡預測方式。當GPS正常工作時,系統如圖3所示。利用傳統的INS/GPS組合導航系統進行誤差修正(實線部分),同時ELM利用正常數據在線學習(虛線部分)。當GPS失鎖時,系統如圖4所示,由ELM預測的觀測值繼續進行誤差修正。

圖3 GPS正常工作時的導航系統方案示意圖Fig.3 Schematic diagram of navigation system scheme when GPS works normally

圖4 GPS失鎖時的導航系統方案示意圖Fig.4 Schematic diagram of navigation system scheme when GPS loses lock
本文選取ELM的待預測信息為Kalman濾波的量測值,即慣導解算輸出的位置和速度信息與GPS接收機測量的位置和速度的差值,該量測值必然與慣導系統的解算結果有關系,而慣導解算的速度和位置信息由加速度計和陀螺的輸出計算而來。因此,二者存在某種數學關系,可以作為輸入輸出關系進行處理。
(2)極限學習機的訓練方法
在實時變化的系統中應用時,需要網絡具有最新的系統特征,此時需要持續對樣本集進行更新,以此保證網絡的預測能力。而若一直將新的樣本納入,會導致計算量不斷增加,造成計算復雜度爆炸,導致網絡性能的降低。考慮到上述問題,選擇合適的時間窗對數據量進行限制,保證訓練樣本數合理且具備最新的系統特征。
待系統工作穩定后,將IMU量測數據和GPS的位置數據與速度數據保存至ELM樣本集中,達到一定數量時開始神經網絡的訓練。在下一時刻,將新的樣本值加入到現有樣本集中,并將樣本集中距離當前時刻最遠的樣本刪除,保證樣本數量恒定且具備系統的最新特征。
(3)極限學習機的預測方法
當GPS失鎖時,導航系統工作于如圖4所示的工作方式下。此時,由極限學習機預測的輸出值取代原先的觀測值計算過程。令系統繼續工作,正常對慣導系統進行誤差修正,防止系統發散。
當GPS信息恢復可用時,極限學習機再次工作于訓練模式,重新開始訓練。
為較好地體現效果,本文模擬航天飛機再入段15km~120km階段,黑障區為30km~80km階段(時間間隔為39s~489s)。初始速度為7800m/s,逐漸減速至300m/s。
總仿真時間為1213s,慣導解算周期為0.02s,濾波周期為1s;陀螺常值漂移為0.1(°)/h,陀螺白噪聲為 0.05(°)/h; 加速度計常值誤差為0.0001g,加速度計白噪聲為0.00005g;衛星導航定位誤差為20m,速度誤差為0.2m/s,再入段的三維航跡如圖5所示。

圖5 再入段的三維航跡圖Fig.5 Three dimensional trajectory of re-entry section
為比較GPS失鎖時ELM的工作情況,分別采用GPS失效不補償與基于ELM的智能導航算法兩種方法在上述航跡下進行仿真實驗,誤差曲線對比如圖6~圖8所示。未進行修正的慣性系統會因在黑障區長時間得不到修正,即使出黑障區后得到正確的GPS數據仍無法阻止其發散。為更清晰地比較兩種不同濾波方法的收斂精度,取圖6~圖8中的誤差數據進行RMS統計,其統計誤差如表1所示。

圖6 位置誤差曲線Fig.6 Curves of position error

圖7 速度誤差曲線Fig.7 Curves of velocity error

圖8 姿態誤差曲線Fig.8 Curves of attitude error

表1 導航信息誤差精度對比Table 1 Comparison of navigation information error accuracy
由圖6~圖8、表1可知,基于ELM的黑障區智能導航算法對于慣性系統有良好的收斂作用。傳統算法隨著仿真時間的增長,誤差呈發散趨勢,而基于ELM的黑障區智能導航算法能保證導航系統處于收斂狀態,說明該算法對黑障區具有良好的估計和跟蹤效果。
神經網絡有助于實時性與非線性強的模型學習,本文提出了先利用天文導航系統在進入黑障區前進行陀螺誤差修正,之后采用基于ELM的智能導航算法實現GPS失效時的慣導解算誤差修正。仿真結果表明,基于ELM的黑障區智能導航算法為保證黑障區導航系統的可靠性提供了一種新的有效方法,具備一定的工程應用價值。