王 珂 王宏波 莊志洪
(南京理工大學電子工程與光電技術學院,江蘇 南京 210094)
空中對準一般分為粗對準和精對準,先進行粗對準,求得初始姿態矩陣,精對準是在粗對準的基礎上進一步修正姿態角,提高姿態矩陣的精度[1]。卡爾曼濾波器作為最優估計中應用最廣泛的一種濾波器,常用于精對準過程中,卡爾曼濾波是以確切的數學模型和已知噪聲的統計特性為前提條件的,但是在實際應用中,往往存在不能準確獲得系統的數學模型和噪聲統計特性未知的問題[2]。基于以上研究背景,該文提出了基于神經網絡輔助卡爾曼濾波的空中對準方案。利用神經網絡的非線性映射能力,將卡爾曼濾波過程產生的信息作為樣本輸入RBF神經網絡,輸出相關補償量,以校正卡爾曼濾波,在一定程度上對卡爾曼濾波算法進行改進[3]。
首先,利用GPS提供初始的位置和速度信息確定制導炮彈的偏航角和俯仰角[4]。假設GPS輸出的速度矢量為[VE0VN0VU0]T,利用公式(1)粗略計算得到初始時刻的俯仰角和航向角。

式中:VE0、VN0和VU0分別為初始時刻GPS輸出的東向、北向和天向的速度;ψ0為初始時刻的航向角;θ0為初始時刻的俯仰角。
考慮計算的復雜度,在粗對準過程中一般采用隨機取值的方法求取滾轉角。其次,利用卡爾曼濾波算法進行精對準,重點在于設計狀態方程和量測方程。通過速度誤差方程、位置誤差方程、姿態誤差方程、加速度計零偏以及陀螺儀常值漂移得到系統的狀態方程,如公式(2)所示。

式中:X(t)為系統誤差向量;F(t)為系統的狀態轉移矩陣;G(t)為系統噪聲驅動矩陣;W(t)為系統噪聲向量。
利用捷聯慣性導航系統(Strap-down Inertial Navigation System,SINS)解算得到的位置和速度與GPS測得的位置和速度的差值設計量測方程,如公式(3)所示。

式中:Z(t)為量測向量;H(t)為測量矩陣;V(t)為觀測噪聲向量。
徑向基神經網絡是一種具有3層結構的前向型神經網絡。第一層是輸入層,由信號源節點組成,輸入層的節點數根據輸入樣本矢量的維度來確定。第二層是隱含層,隱含層中神經元的變換函數為徑向基函數,徑向基函數的一般表達式如公式(4)所示。公式(4)是一種對中心點徑向對稱且衰減的非負非線性函數,因此又被稱為徑向基層,它的節點數由徑向基函數中心確定算法進行求解。第三層是輸出層,輸出層采用線性激活函數,直接對隱含層輸出結果進行線性加權求和,其節點數取決于輸出矢量的維度[5]。

式中:‖dist‖為輸入矢量與中心向量間的歐式距離。
徑向基神經網絡結構如圖1所示。

圖1 徑向基神經網絡結構
當制導炮彈在空中飛行時,可能會面臨各種復雜的空中環境,導致模型噪聲特性發生變化[6],為了增強空中對準算法的自適應能力,該文采用徑向基神經網絡輔助卡爾曼濾波器的方案,利用神經網絡強大的學習和預測能力對卡爾曼濾波的輸出狀態估計進行實時調整,提高在系統模型參數變化情況下的濾波精度。RBF神經網絡輔助空中對準算法的結構框圖如圖2所示。將當前狀態估計值和狀態一步預測的差值xk-xk/k-1、觀測向量實際值與估計值的差zk-zk/k-1以及濾波增益矩陣Kk作為神經網絡的輸入,將真實狀態和估計狀態誤差值作為神經網絡的輸出,當前時刻的最優估計值即為卡爾曼濾波的輸出值與RBF神經網絡的輸出值的和[7]。

圖2 RBF神經網絡輔助空中對準算法框圖
在確定神經網絡的訓練樣本后,就可以確定輸入層節點和輸出層節點的數量,之后還需要設置函數的最大迭代次數和估計精度,利用徑向基函數中心確定算法訓練RBF神經網絡的隱含層節點數、各個徑向基函數的數據中心以及隱含層與輸出層之間的權值等,以確定最合理的網絡結構。因此,該文做了以下處理:1) 數據預處理。對原始數據進行歸一化處理,即將原始數據處理為[-1,1]的數據,提高網絡訓練效率和泛化能力。2) 神經網絡類型選擇。RBF神經網絡可以分為正則化RBF網絡和廣義RBF網絡,分別對應newrbe和newrb函數。正則化RBF網絡的隱節點數與輸入樣本數相同,且徑向基函數中心就是所有的輸入樣本。正則化RBF網絡每個訓練樣本都對應一個隱含層神經元,存在計算量大、對樣本偏差敏感等問題。廣義RBF網絡的徑向基函數的個數往往遠小于樣本個數,徑向基函數的中心也不再限制在數據點上,而是由訓練算法確定,可以在保證精度的前提下,盡可能減少隱節點數目。基于上述原理,采用廣義RBF網絡進行設計。3) 擴展速度spread的選擇。神經網絡訓練的關鍵是需要確定spread的取值,該值應該足夠大,使神經元對輸入向量所覆蓋的區間都能夠產生響應,但過大的spread值又會導致神經元增加,加大計算難度。因此,參數spread的取值影響模型的精度,但是對該值的選取需要具體問題具體分析并進行多次試驗,以選取合適的spread值。
設置炮彈初始位置的經度為118.85°,緯度為32.02 °,高度為25 m,初始速度為0 m/s,初始角度為俯仰角52°,偏航角0 °,滾轉角0 °,仿真時間為110.99 s。設計軌跡發生器模擬炮彈從出膛口發射、飛行及墜落的全部階段,其炮彈飛行軌跡如圖3所示。

圖3 炮彈飛行軌跡圖
為了驗證基于神經網絡輔助空中對準方法,對制導炮彈空中對準進行仿真驗證。仿真驗證主要從以下2個方面進行分析:1) 對基于卡爾曼濾波的空中對準算法和基于神經網絡輔助的空中對準算法的性能進行對比。2) 當系統噪聲特性發生改變時,對基于神經網絡輔助的空中對準算法的適應性進行驗證。設置傳感器參數見表1。

表1 傳感器參數設置
利用卡爾曼濾波算法和神經網絡輔助卡爾曼濾波算法分別進行解算,得到的角度誤差曲線如圖4和圖5所示。由圖4和圖5可知,利用卡爾曼濾波進行組合導航解算,最終俯仰角φ1誤差小于-5',橫滾角φ2誤差小于-20',方位角φ3誤差小于200',但是收斂速度較慢。利用神經網絡輔助卡爾曼濾波算法最終俯仰角誤差維持在-10',滾轉角誤差維持在-40',偏航角誤差維持在130',與卡爾曼濾波的結果相比,角度誤差精度差別不大,但是收斂速度加快。

圖4 卡爾曼濾波算法的姿態誤差

圖5 神經網絡輔助空中對準的姿態誤差
為了驗證神經網絡輔助空中對準算法對不同情況的適應能力,將系統噪聲方差陣Q增至原來的5倍,利用卡爾曼濾波算法和神經網絡輔助空中對準算法分別進行解算,得到的角度誤差曲線如圖6和圖7所示。

圖6 卡爾曼濾波算法的姿態誤差

圖7 神經網絡輔助空中對準的姿態誤差
由圖6和圖7可知,當系統噪聲不發生變化時,卡爾曼濾波可以正常工作,這時卡爾曼濾波器和神經網絡輔助的空中對準算法解算的失準角誤差值相差不大。當噪聲發生明顯變化時,卡爾曼濾波器受噪聲變化的影響,誤差逐步增大,但是神經網絡卡爾曼濾波器可以保證工作狀態平穩,計算誤差值沒有大幅度改變。由此可見,神經網絡的濾波方法能夠根據噪聲統計特征的變化實時調整噪聲模型,保證導航的定位精度。
該文研究了RBF神經網絡的原理和結構,針對當系統噪聲統計特性不確定時,卡爾曼濾波器可能會產生大的偏差甚至發散的問題,使用RBF神經網絡進行輔助,以改善該問題,即通過神經網絡的反饋控制在線實時調整卡爾曼濾波器的參數,保證濾波精度。從仿真結果來看,采用RBF網絡輔助的空中對準算法可以提高算法的收斂速度,當噪聲特性不確定時,也有較強的適應能力。