唐一鳴
(中國民用航空飛行學院空中交通管理學院,廣漢 618300)
隨著民航業的發展,越來越多的人選擇乘坐飛機作為自己的出行方式,有限的空域資源和日漸增加的航班量需求的沖突日益增加,空域資源不足和空中交通擁擠的現象日漸嚴重,以飛行計劃和雷達監視目標管理為基礎,基于扇區運行的空中交通管理體系逐漸難以滿足未來的航班量增長。對此,美國發布了NextGen計劃,歐洲提出來SESAR 計劃,國際民航組織(ICAO)提出了ASBU 計劃,基于航跡運行(Trajectory-based operation,TBO)的理念隨之被提出,為實現TBO,四維航跡被作為重點研究對象。
自航跡運行模式被提出后,國內外開始對四維航跡預測開展了研究。國際方面,1986年,Erzberger 率先在民用航空領域提出了航跡預測技術。依托此航跡預測技術,美國宇航局(NASA)設計了一系列終端區空域進場管理工具(CTAS)。隨后NASA 在丹佛機場利用波音737機型將實際飛行軌跡與預測軌跡進行了對比研究。
1996年,歐洲航行安全局(Eurocontrol)將航跡預測作為空中交通管理研究協調計劃(PHARE)的主要項目進行設計與測試。隨后Eurocontrol 在“歐洲空中交通管制協調實施計劃”(EATCHP)中從定義、數據以及性能角度分析了航機預測的需求。
1998 年,Tomlin 等基于多目標混合系統對航空器的沖突解脫問題展開研究,使用混合控制系統算出每架航空器最大的安全初始條件,可以保證在突發因素的干擾下仍然能夠安全運行,最終通過調整速度和航向實現沖突解脫。
Matsuno 等針對解決四維航跡預測不確定性因素問題,研究了一種基于廣義多項式的偽譜法解決方法,但文中涉及到的因素不夠全面,僅考慮了與時間相關因素的影響,未考慮到不隨時間變化因素的影響。
國內方面,陸志偉等在極大代數的基礎上實現了多航空器無沖突4D 航跡生成,基于航路模型的同時,基于極大代數設計出了一套終端區航跡交叉匯聚模型,從而有效規避終端區航空器在相同高度的航路交叉點的潛在飛行沖突。杜文彬等基于航空器動力學模型,根據飛行各個階段的動力學特點,建立了基本飛行模型的飛行剖面。
湯新民等通過運用混雜系統理論分析了航空器飛行階段,對飛行階段進行劃分,以及指定航空器的運行剖面參數,通過分析飛行過程中不同飛行階段的動力學模型,計算出某一時刻距某一點的距離和高度,進而實現四維航跡的預測。但其劃分航段的過程太過理想化,航空器在實際飛行過程中的諸多動力學參數難以獲取,理想的階段劃分與實際航段不一定相符,實際飛行過程中應當同時考慮管制意圖對實際飛行的約束,管制意圖和駕駛員意圖在模型中沒有得到相應的體現。
綜上所述,整個飛行過程中的影響因素較多,難以在建模階段考慮全面。隨著神經網絡的發展,對于航跡預測的方式不再局限于智能優化算法和運動學建模上,數據挖掘類方法對歷史航跡信息能夠更充分地挖掘利用,一條航跡本質上是一組時間序列,航跡數據具有累計影響的特點,航跡之間具備很強的時間關聯性。傳統的BP 神經網絡無法對時間關聯性強的問題進行有效準確的解決,但隨著神經網絡的發展,一種擅長處理時間序列問題的長短期記憶(Long Short-Term Memory,LSTM)神經網絡被提出,結合ADS-B數據,LSTM神經網絡能很好地對航跡進行較為精準的預測。
自深度學習被提出以來,越來越多的經典模型被設計出來,其中循環神經網絡(Recurrent Neural Network,RNN)是1990 年開發出來的經典模型。RNN 模型在全連接神經網絡的基礎上增加了前后時序上的關系,從而能較好地處理時間序列,但對于長序列數據仍然無法較好地處理,其對信息的記憶時間跨度十分有限,存在著明顯的“長期依賴”缺陷。針對RNN 模型的弊端,本文將采用LSTM 模型來彌補這一缺陷。
RNN 是指一種隨著時間推移,重復發生的結構。在自然語言處理(NLP),語言圖像等多個領域有非常廣泛的應用,其最大特點就是能實現某種“記憶功能”。RNN 的基本結構如圖1所示。

圖1 RNN神經網絡基本結構模型
其中,表示輸入數據,表示神經網絡單元上一時刻輸出的、作為當前時刻的權重矩陣,表示輸出數據,與其他神經網絡不同,RNN 神經網絡的神經網絡單元不僅僅是輸出,和輸出存在關聯,其自身也存在一個回路。
若將循環去掉,RNN 模型就是傳統的神經網絡。為了更好地了解RNN 模型,需要將RNN的隱藏層拆開來看,如圖2所示。

圖2 RNN模型隱藏層的展開示意圖
其中,表示輸入層到隱藏層的權重矩陣,表示隱藏層到輸出層的權重矩陣,表示隱藏層的值,- 1、、+1 表示時刻,s表示在時刻的樣本的記憶。可以看出,s受到s和X的影響。

其中,表示隱藏層的激活函數。
RNN的輸出層公式如下:

其中,表示輸出層的激活函數。
RNN 模型雖然能處理時間序列問題,但無法對長期記憶進行精準處理,隨著航跡時間序列的增長,RNN 將無法對信息保持持續性記憶、無法充分挖掘時間跨度較大的信息,所以RNN模型在處理時間跨度較大的問題時并不完全適用。航跡數據是一組較為連貫的數據,未來時刻的航跡數據受前一歷史時刻的航跡數據影響較大,所以需要使用能克服這一缺點的模型來對航跡進行預測研究。
長 短 期 記 憶(Long Short-Term Memory,LSTM)神經網絡是特殊的RNN 循環神經網絡,尤其適合順序序列處理,其內部由遺忘門、輸入門和輸出門組成了門控機制,用來對神經網絡中的信息進行傳輸控制。LSTM 的關建屬性為細胞狀態以及“門”結構。細胞狀態相當于信息向下一循環傳輸的路徑,可以將其看作網絡的“記憶”。遺忘門決定要將什么樣的信息內容從細胞狀態中舍去,輸入門決定將什么樣的信息在細胞狀態內存儲,最終再由輸出門決定將什么樣的信息進行輸出。
如圖3 所示,LSTM 包含短期記憶單元h和長期記憶單元C,在短期記憶單元h的基礎上新增單元C來保持長期記憶,即細胞狀態。x表示在t 時刻輸入,C表示上一時刻的狀態值,h表示上一時刻的隱藏層的值。x和h經過遺忘門時,經過計算得出需舍棄的信息。計算得出輸出到細胞狀態的值在0 和1 之間。0表示全部舍去,1 表示全部保留。三個門結構、更新后的細胞狀態和隱藏層的值計算如下:

圖3 LSTM神經網絡結構模型


在上述LSTM 模型原理的基礎上,本文針對飛行器航跡預測問題對LSTM 模型的輸入層節點、隱藏層節點數、輸出層節點數進行進一步設計。
輸入層用于控制當前時刻的候選狀態有多少信息需要保存,輸入的數據決定了輸入層的節點個數,為了保證模型訓練的效率,選取主要特征進行模型訓練。根據對目標影響程度的大小,將影響較小的數據適當減少。
隱藏層為模型運算層,隱藏層節點數的設置會影響預測精度,過少會導致模型網絡復雜度低、特征學習不充分、預測精度降低。隱藏層節點數過多則會使模型受數據噪音干擾過大,使得模型泛化能力差。
輸出層作為模型的最后一層,針對航空器航跡的主要研究目標來確定輸出節點個數,本文主要采用的維度為高度、經度、維度、時間。
本文主要研究目標是四維航跡,即通過歷史航跡信息對未來一段時間的航跡曲線進行預測,為了將航跡信息提取出來,結合LSTM 模型的特性建立基于長短期記憶神經網絡的航跡預測模型。

圖4 LSTM航跡預測模型框架
本文使用的航跡數據來源于ADS-B,ADS-B航跡數據每一條航跡在時刻的航跡特征信息表示為:

其中,,,,,,依次表示飛行器在時刻的緯度、經度、高度、時間、速度、航向。
對ADS-B 數據進行處理之后,將航跡數據輸入到LSTM 模型中,經過模型每一層LSTM 后都采用隨機失活(Dropout)降低神經網絡節點間的相互依賴性來防止過擬合,最后模型輸出的信息表示為:

從而根據預測所得航跡提前規避潛在沖突的發生,并且有助于ATM 做出合理、高效、安全的決策指令。
本次仿真實驗使用的是國內某真實航路上ADS-B 獲取的歷史飛行航跡數據,航班飛行路徑如圖5 所示。ADS-B 能夠實現飛行信息共享,對與空管活動中所截獲的航跡信息能夠及時地提供給飛行各方相關單位,相較于傳統雷達監視技術,ADS-B 具備遠程截獲、信息格式簡單、信息處理成本低等優點。目前我國機場大多已經具備ADS-B 設備及技術支持,故而對ADS-B截獲數據的分析和應用更具重要意義。

圖5 飛行路徑展示
3.1.1 ADS-B 數據格式
從ADS-B 所得的某一刻的數據是某架航空器在某一時間對應的航跡點信息。通過航空器的識別信息,可以獲取該航空器的一連串航跡信息。所以通過ADS-B 獲得的航跡數據不是連續的線性存在,而是由一系列離散的航跡點構成。
現假設有一歷史航跡集T,其中包含了多個歷史航跡,可表示為

其中,T表示中的第條航跡。
每架航空器對應的航跡不同,每條航跡是由多個航跡點組成的集合

其中,P表示航跡T上的第個航跡點。
每個航跡點包含了不同的特征,每個特征點包含多個航跡點特征。

其中,m表示航跡點P的第個特征。
本文所使用的每條ADS-B 航跡數據包含特征如下:

具體特征信息見表1。

表1 航跡點特征
3.1.2 ADS-B 數據處理
ADS-B 數據會受到多方面因素的干擾,截獲的航跡點難免會出現異常航跡點,例如會有重復航跡點、偏離航跡點、航跡點缺失等問題,因此對于初步獲得的ADS-B 數據需要針對目標問題進行預處理。如圖6 所示,將航班號3U8063 的ADS-B 的位置和高度數據顯示出來,然后根據顯示出來的問題進行有針對性的處理。

圖6 3U8063航跡數據離散點示意圖
航跡數據的重復現象主要集中在時間上的重復和空間位置上的重復。航跡點重復會影響數據的適用性,因此需要把每條航跡的重復信息點刪除掉。如表2所示,包含部分重復的航跡點數據示例。
從表2可以看出,第一組與第二組的航跡點數據的時間數據重復,第四組與第五組航跡點數據的經緯度數據重復,因此需對這兩組數據做出取舍。整個飛行過程中,航空器處于不同階段時,高度、速度、航向數據可能出現相同情況,故在去除航跡點數據過程中不考慮這三個指標。表2經過處理可得表3。

表2 重復航跡點數據示例

表3 重復航跡點去除后示例
ADS-B 航跡點數據本身會存在丟包現象,導致部分航跡點缺失。如再經過第一步的重復航跡點去除,會讓部分航跡數據出現缺漏現象,為保證航跡呈現出來的連續性和平滑性,我們需要對航跡點數據進行補充。本文主要采取三次樣條插值法來對缺失的航跡點數據進行處理。
在整個實驗仿真過程中,需要將數據集進行劃分,分為訓練集、測試集與驗證集,其比重為80%、10%、10%。通過創建模型、擬合訓練集、尋找初始參數值,再利用驗證集對模型的超參數進行進一步調整,最后通過測試集對模型進行評估。隨著模型的訓練,誤差曲線逐漸趨于穩定,展現出的效果較為理想,如圖7所示。

圖7 航跡預測模型訓練驗證誤差示意圖
本次實驗采用平均絕對誤差()和均方根誤差()作為評價指標。是預測值與觀測值間絕對誤差的平均值,是預測值與真實值之差平方的期望值,這兩種誤差的值越小,則說明模型的性能越好,與的數學表達式如下。

其中,P表示時刻預測航跡,R表示時刻實際航跡。
為了驗證本文所采用的模型的有效性,分析對比BP 神經網絡模型與LSTM 神經網絡模型的預測效果。在兩種模型中輸入相同的數據集,且保證訓練集、測試集、驗證集三個數據集的占比相同。BP 神經網絡與LSTM 神經網絡的誤差對比如圖8所示。

圖8 兩種模型誤差對比
從圖8 可以看出,LSTM 的與值均小于BP 對應值,體現了LSTM 模型的航跡預測性能更優秀,較強的記憶能力使得LSTM 模型能更好地記憶歷史航機數據,其特有的輸入門、遺忘門和輸出門的結構使得LSTM 模型對長序列問題的學習分析能力顯著提高。
本次實驗仿真主要以MATLAB 2021a 作為平臺展開,為了驗證模型預測值與真實值的誤差,在模型訓練、預測過程中使用不同的參數,發現參數會對模型的訓練及結果產生不同的影響。對模型性能進行對比評估,利用測試集數據驗證,檢驗模型的預測能力。
由圖9、圖10、圖11可以看出,結合ADS-B數據的LSTM 模型預測的高度、經度、緯度與實際數值十分接近,模型擬合度較高,非常接近實驗預期結果,表明LSTM 模型可以達到航跡預測的需求,達到了本文的實驗目的。

圖9 高度預測結果

圖10 緯度預測結果

圖11 經度預測結果
基于航跡運行是下一代空中交通管理體系(NextGen)和歐洲單一天空實施計劃(SESAR)的實施基礎,四維航跡預測是基于航跡運行的核心,因此,本文針對四維航跡預測的研究是有意義的。本文提出使用LSTM 模型預測航跡的方法,結合實用的ADS-B 數據,充分挖掘航跡歷史數據中有價值的航跡特征,準確地預測未來航跡數據,使得航跡預測在實際運行中具備了參考價值。
本文實現了預測航跡的目標,但仍存在許多不足。LSTM 能夠較好地挖掘時間序列信息,但對空間序列信息不夠敏感,且在理想仿真環境中的噪聲是人為設置保持不變的,而實際運行時噪聲是不確定和未知的,在適用性和通用性上模型還有待改進。今后的工作將會針對這些問題做進一步研究,使預測所得的航跡能更加準確。