彭 路, 柳俊凱, 盛愛晶, 張興海, 孫文正
(南京恩瑞特實業有限公司, 南京 211106)
跑道視程(runway visual range, RVR)是指起飛/著陸時飛機與跑道內地面物體之間的視程, 表示在大霧等惡劣天氣條件下跑道和跑道中心線的識別程度,是影響飛機起飛和降落的重要因素之一. 在能見度小于800 m 的情況下, 航空管制員需要根據跑道視程判斷飛機是否能夠起降[1]. 隨著民航航班總量的快速增長, 跑道視程對航班運行的影響愈加顯著, 已經成為影響航班安全、正常、效率的主要因素[2]. 實際機場運行管制過程中, 為了保障起降安全, 一般較低的跑道視程發生時不允許飛機起降. 相應地, 跑道視程降低將導致機場運行能力減弱, 機場航班容量降低, 進而引起航班堵塞延誤, 旅客滯留, 增加機場運行成本. 因此, 機場氣象或者管制人員就會特別關心未來一段時間內跑道視程的變化趨勢, 跑道視程預測將能夠為機場業務人員提前決策提供依據, 特別是對低跑道視程條件提前作出預警, 制定相關起降、管制預警應急方案.
跑道視程不是一個直接觀測量, 目前許多機場已經布設了民航自動氣象觀測系統(automated weather observing system, AWOS)通過參數計算實時的跑道視程值, 但觀測僅僅能夠反映當前狀態, 無法滿足機場業務部門對未來跑道視程變化趨勢的產品需求, 機場業務上至少需要提前預報未來近6 個小時的跑道視程變化情況輔助業務決策.
機場跑道視程預測常用的傳統方法多是基于不同天氣形勢的各種預報模型的知識積累和近似記憶, 但因知識更新手段的繁瑣, 近年來該方法逐漸被預報員拋棄[3]. 隨著計算機計算能力以及人工智能技術的進步, 深度學習預測技術在跑道視程預測領域日益受到關注. 朱蕾等人利用3 年的烏魯木齊機場RVR 觀測資料, 使用SVM 方法分別構建了大于800 m 和小于800 m的RVR 推理模型[3]. Ku 等人也采用了卷積神經網絡對韓國泰安機場的跑道視程預測進行了初步嘗試[4]. 周志洋利用數據挖掘技術, 通過多個維度的氣象特征首次對高高原機場的跑道視程進行了短時預測, 準確率最高達到81.14%[5].
長短時記憶網絡(long short term memory network,LSTM)是一種改進的循環神經網絡, 它有效解決了循環神經網絡在梯度消失和缺乏長期記憶能力等方面存在的問題, 能夠從海量的長時間序列信息中自動學習其特征并保存, 適合處理時序預測問題, 近年來在氣象領域已得到應用. 袁芳介紹了LSTM 技術的基本原理,并提出該方法在處理氣象領域非線性分類、回歸等問題應用建議[6]. 李芬等人將LSTM 方法用于細顆粒物(particle matter≤2.5 μm, PM2.5)的短期預測[7]. 魏昱洲等人使用LSTM 方法進行超短期風速的預測試驗, 均取得了一定的預報效果[8]. 此外, 羅芳瓊等人基于LSTM方法提取的特征信息, 結合隨機森林和支持向量機方法, 建立了低溫氣象災害預報混合模型, 取得了較高的預測精度[9].
低跑道視程現象受多重氣象和非氣象因子影響,不同因子之間也同樣存在相互作用關系, 具有明顯的非線性特征, 預報難度較大. 因而, 如何盡可能地提高對低跑道視程天氣的預報能力, 從而實現提前預警是航空氣象保障人員頗為關注的問題. 為確保飛機能夠安全起降, 本文采用咸陽機場2012-2018 年共7 年的民航自動氣象觀測系統觀測資料對跑道視程進行研究,采用新型的基于長短時記憶網絡方法, 建立機場跑道視程預測模型, 旨在為氣象保障人員提供一定的可供參考的預測產品, 輔助決策保障飛機的安全起降.
跑道視程是指在機場跑道中線上, 飛機上的飛行員能夠看到跑道面上的標志或者跑道邊界燈或中線燈的距離[10]. 跑道視程不是直接測量的氣象要素, 通過跑道燈光強度(I)、照度閾值(E)和大氣消光系數( σ),根據柯西米德定律(Koschmieder’s law)和阿拉德定律(Allard’s law)計算得出的數值[2], 將兩個定律計算得出的較大值作為要報告的RVR值.
在白天無燈光的情況下, 根據柯西米德定律,RVR的計算公式為[2]:

在白天能見度受限或夜晚的情況下, 此時需要開啟跑道燈, 依據阿拉德定律,RVR的計算公式為[2]:

其中, 跑道燈光強度可通過背景亮度儀測量的背景亮度估算得出, 照度閾值可按照設定的跑道燈光級數估算得到, 大氣消光系數可由大氣透射儀或前向散射儀測量的氣象光學視程得出[2].
從公式出發, 跑道視程似乎與氣象無關, 但實際業務中, 照度閾值及大氣消光系數的變化受到多種氣象要素綜合影響, 例如強降水導致能見度降低, 直觀上導致大氣消光系數增大, 跑道視程降低, 大霧也能導致能見度降低, 直觀上導致大氣消光系數增大, 跑道視程降低[2]. 跑道燈光級數調整導致照度閾值變化也受降水、大霧等低能見度天氣的影響. 氣象要素對跑道視程的影響作用是極其復雜的、非線性的, 還沒有任何一種數學物理公式或者模型能夠完全刻畫這種影響關系.
咸陽機場Ⅰ類精密進近著陸標準為主導能見度≥800 m 或RVR≥550 m, Ⅱ類精密進近著陸標準為300 m≤RVR<550 m[11]. 對于Ⅱ類精密進近, 當跑道視程觀測設備故障或無法獲得跑道視程報告時不得實施Ⅱ類運行[11]. 通常, 將RVR<550 m 定義為低跑道視程,低跑道視程下常引發大面積航班延誤, 嚴重影響航班正常運行, 易引發不安全事件, 飛行員及各安全保障部門均需要非常謹慎地對待這種運行情況[1,11].
LSTM 是Hochreiter 等人[12]1997 年提出的基于循環神經網絡理論的具有記憶長短期信息能力的神經網絡, 是一種特殊的循環神經網絡(recurrent neural network, RNN), 主要是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題, 相比普通的RNN, LSTM 在更長的序列中能夠有更好的表現[7,13]. 經過若干代的發展, 已經形成了比較系統且完整的LSTM 框架, 并且在語音識別、圖像描述、自然語言處理、市場調研和交通預測等領域得到了廣泛的應用[14-16]. LSTM 的基本節點結構如圖1 所示.

圖1 LSTM 基本節點結構


本文采用了2012-2018 年咸陽機場共7 年的民航氣象自動觀測系統AWOS 觀測資料, AWOS 每分鐘記錄一次各種氣象要素數據, 包括風向、風速、溫度、露點溫度、氣壓、相對濕度、降水量、背景亮度、氣象光學視程、跑道視程等.
咸陽機場南北兩條跑道沿東北-西南方向, AWOS觀測設備位于兩條跑道的4 個跑道端點及2 個中點,南側跑道東北端點編號RWY23L, 中點編號SOUTH MID, 西南端點編號RWY05R, 北側跑道東北端點編號RWY23R, 中點編號NORTH MID, 西南端點編號RWY05L.
影響機場跑道視程的天氣主要有霧、煙、沙塵、強降水等, 不同的天氣現象具有不同的氣象影響因子.因此, 本小節主要通過對低跑道視程的時序特征分析和相關分析, 獲取影響咸陽機場的典型氣象因子.
通過對咸陽機場2012-2018 年共7 年的AWOS觀測資料統計, 咸陽機場各端點低跑道視程的月際分布如圖2 所示.

圖2 咸陽機場各端點低跑道視程月際分布圖
圖2 中低跑道視程天氣的月際變化呈雙峰型分布,集中多發于秋冬季的9-12 月和2-3 月, 春季和夏季發生次數較少, 這種季節分布特征表明本場低跑道視程天氣主要是由霧造成. 而形成霧的相關氣象因子條件有: 地面氣溫相對較低, 大氣相對濕度較大, 接近準飽和狀態, 近地層無風.
經過統計, 本場各端點低跑道視程的小時分布如圖3 所示.
圖3 中低跑道視程天氣多發于凌晨至上午, 下午至傍晚較少發生, 并且在凌晨至清晨北側跑道明顯多于南側跑道, 而上午發生的低跑道視程天氣南側跑道多于北側跑道. 表明咸陽機場的大霧天氣主要以輻射霧為主, 機場西北部平原相對東南方向的渭河河谷輻射冷卻效應更強, 夜間至凌晨更容易產生輻射霧, 而日出后北部升溫快于南部, 輻射霧消散更快, 另一方面和渭河河谷冷氣墊的溫差造成的局地環流利于河谷區域的霧自東南向西北方向輸送.

圖3 咸陽機場各端點低跑道視程小時分布圖
此外, 針對AWOS 自動觀測資料中存在氣象要素較多, 以及考慮到跑道視程也與儀器自身特性相關. 為了盡可能多地獲取與低跑道視程相關的各類因子, 利用本場AWOS 自動觀測每分鐘的平均風、陣風、溫度、露點溫度、氣壓、相對濕度、背景光亮度等地面觀測要素進行相關性分析, 從而選擇預報因子.
AWOS 各地面觀測要素之間的相互相關性特征如圖4 所示.
圖4 可見, 風類要素和溫壓類要素各自之間相關性較高, 其他要素間相關性不明顯. 提取各要素與跑道視程的相關性(不考慮正負相關)從大到小排列, 結合專家經驗, 本文選取14 個相關性較強要素作為預報輸入因子, 依次分別為2 分鐘平均風速、2 分鐘平均風向、10 分鐘平均風速、10 分鐘平均風向、背景亮度、10 分鐘平均氣象光學視程、1 分鐘平均氣象光學視程、10 分鐘平均跑道視程、1 分鐘平均跑道視程、1 分鐘平均降水量、露點溫度、氣壓、相對濕度和溫度. 數據格式如表1 所示.

表1 數據格式

圖4 AWOS 地面觀測要素之間的相關性圖
以上輸入預報因子的選取, 不僅確保了對現有觀測資料的充分使用, 也能體現各要素之間的相互影響作用隨時間的動態變化過程, 進而構造一個比較完備的預測數據集.
多變量時序預測問題(multivariable time series prediction problem)是指用過去的多個變量的觀測值預測其中某一個或多個變量未來的觀測值. 多步預測(multi-step forecasting)是指用過去的觀測值預測未來一個時間序列的觀測值[18].
本文利用預報時間點前4 個小時的本場AWOS自動觀測的14 個預報因子作為輸入, 預測未來6 小時每分鐘的RVR值, 即多步多變量時序預測.
有過這段田園牧歌式的經歷,我有時會納悶:野花綠草很好看,但長年累月地看不會悶嗎?略薩的《情愛筆記》里有一個人物,當別人跟他描繪“牛群在芳香的野草上徜徉”之類的美景時,他生氣地喊叫:收起牛群野草小木屋的這一套!沒有了現代文明的襯托,那玩意兒有啥意思?“如果有一天,地球被摩天大廈、金屬大橋、柏油馬路、人工花園、巖石鋪地的廣場、地下停車場覆蓋,整個地球都澆筑了鋼筋混凝土并成為一座無邊無際的球形城市(很好!到處都是書店、畫廊、圖書館、餐廳、博物院和咖啡館),我會舉雙手贊成!”聽上去有點可怕,但如果非要選擇的話,我也會選球形城市吧。
時間序列數據集是由按時間索引排序的一系列數字組成, 為了能夠從輸入模式里學習如何預測輸出模式, 需要將時間序列數據集轉化為監督學習的數據格式, 即監督學習數據集由輸入模式X和輸出模式Y構成.將跑道視程預測時間序列數據集轉化為監督學習的數據格式, 如表2 所示.
如表2 所示, 這是多步多變量時序預測的監督學習數據格式, 表2 中t表示預報時間點,t-240表示預報時間點過去240 分鐘, 即過去4 個小時,t+359表示預報時間未來359 分鐘, 即未來6 個小時. 表2 左半部分即監督學習數據集中的輸入模式X, 其中包括過去4 個小時的14 個預報因子觀測值; 表2 右半部分即監督學習數據集中的輸出模式Y, 未來6 個小時的RVR觀測值.

表2 監督學習數據格式
將跑道視程預測的時間序列數據集轉化為監督學習數據集之后, 對數據集進行數據預處理, 包括缺省值處理、歸一化、樣本均衡等.
由于各輸入的預報因子存在量級和單位上的差異,為了消除各個預報因子之間的差異帶來的數據不均一性, 需要對跑道視程預測數據集作標準的歸一化處理,使每一個預報因子的數據落在區間[ -1,1]內.
由于低跑道視程天氣在整個數據集中所占比例較小, 樣本均衡就格外重要, 本文采用了分層抽樣法進行樣本均衡. 分層抽樣法就是將總體單位按其屬性特征分成若干類型或層, 然后在類型或層中隨機抽取樣本單位. 分層抽樣的特點是由于通過劃類分層, 增大了各類型中單位間的共同性, 容易抽出具有代表性的調查樣本[19]. 該方法適用于總體情況復雜, 各單位之間差異較大, 單位較多的情況.
將跑道視程預測數據集輸出模式Y中的t時 刻RVR值, 按照表3RVR等級進行劃分[20], 分成5 層, 然后在這5 層中進行隨機抽樣, 從而使跑道視程預測數據集中的樣本均衡.

表3 R VR等級
將經過數據預處理(缺省值處理、歸一化、樣本均衡)的跑道視程預測數據集按照6:2:2 的比例進行隨機抽樣, 并將樣本分組為訓練集、驗證集和測試集. 訓練集被用于預測模型構建, 驗證集被用于模型參數最優調試和測試集被用于模型預測效果檢驗, 從而保障模型的可信性和科學性.
根據柯爾莫哥洛夫理論(Kolmogorov theory), 當前饋型神經網絡具有3 層及以上結構時可實現以任意精度逼近任意非線性連續函數[13,21,22]. 因此, 本文的預測模型由3 個LSTM 層和1 個全連接的神經網絡層組成, 且為了避免過擬合, 在每個LSTM 層后面添加了dropout 層, 結構圖如圖5 所示. 過去4 個小時的氣象要素(風速、溫度、濕度和跑道視程等)被輸入網絡,預測跑道未來6 個小時的視程.



圖5 跑道視程預測模型網絡結構圖
LSTM 的遺忘門、輸入門和輸出門都是通過圖5中LSTM cell 實現, LSTM cell 具體算法流程如下:
輸入: 上一個狀態的信息, 假設輸入門表示為it, 遺忘門表示為ft和輸出門表示為ot, 下標t表示時刻, 使用Ct表 示LSTM cell 在t時刻的單元狀態[15];
步驟1. 接收輸入信息. 通過當前t時刻輸入數據Xt、上一時刻LSTM cell 輸出值Ht-1與上一時刻單元狀態Ct-1, 計算輸入門的值it, 輸入門決定了將多少當前時刻輸入數據Xt的 信息保存到單元狀態Ct;
步驟2. 遺忘狀態信息. 遺忘門用于控制上一個時刻單元狀態Ct-1的哪些信息保留到當前時刻的單元狀態Ct中;
步驟3. 更新狀態信息. 通過輸入門決定當前時刻單元狀態哪些信息需要被保留, 結合遺忘門新的需要添加的信息, 對當前時刻的單元狀態進行更新, 得到新的當前時刻單元狀態Ct;
步驟4. 輸出新的信息. 輸出門主要是通過Sigmoid層決定要輸出細胞狀態的相關信息, 然后將輸出門的輸出ot與tanh 處理后的記憶單元狀態Ct進行乘積, 得到最終當前層的輸出信息Ht;
輸出: 當前LSTM 單元的狀態信息Ct及 輸出Ht.
預測模型網絡結構確定之后, 為充分發揮LSTM網絡的非線性映射能力, 將它們的cell 輸出維度n分別從1 遞增到1 000, 并逐個進行實驗, 尋找最適合本研究的LSTM cell 輸出維度組合. 基于LSTM 的跑道視程預測模型的構建過程如圖6 所示.

圖6 基于LSTM 的跑道視程預測模型構建流程圖
為了避免隨機初始權重和偏置對預測結果的影響,分別將每種LSTM 輸出維度組合對應的預測模型進行100 次訓練和測試, 保存其效果最好時的網絡參數.
通過實驗發現, 隨著LSTM 層輸出維度的增加, 預測模型效果先急劇上升, 然后漸趨平緩, 特別地, 當LSTM 層1 的輸出維度大于490、LSTM 層2 的輸出維度大于420、LSTM 層3 的輸出維度大于360 時, 繼續增加輸出維度給預測模型帶來的效果提升幾乎可以忽略不計. 綜合考慮計算代價增量與效果提升幅度后認為: LSTM 層1、LSTM 層2 與LSTM 層3 的輸出維度數分別取490、420 與360 時最適合本研究.
其他相關的實驗參數設置如下: 隨機初始化權重和偏置, 損失函數為訓練集的均方誤差, 損失函數的優化算法采用RMSProp 優化器, d ropout比率為0.2, 終止條件為訓練集迭代次數達到1 萬次或者均方誤差小于1E-5.
該網絡采用基于TensorFlow 的Keras API 實現,并采用4 塊NVIDIA TiTAN V GPU 進行訓練.
AWOS 觀測設備分別位于兩條跑道的4 個跑道端點及2 個中點, 2 個跑道中點的AWOS 觀測設備只對少量氣象要素進行監測, 缺少與RVR相關性較強的預報因子(降水量、氣壓、相對濕度、溫度等), 因此無法進行跑道視程預測.
將兩條跑道4 個跑道端點RWY23L、RWY05R、RWY23R、RWY05 的AWOS 觀測數據經過數據預處理(缺省值處理、歸一化、樣本均衡)后, 按照6:2:2 比例進行隨機抽樣, 劃分成訓練集、驗證集和測試集, 送入第3.1 節構建的LSTM 跑道視程預測模型進行訓練,4 個跑道端點預測模型的訓練及驗證Loss曲線如圖7.
通過圖7 可以看出, 隨著迭代次數的增加, 4 個跑道端點的Loss值都在下降, 訓練集下降比較平滑, 最后趨于穩定, 驗證集下降過程起伏較大.

圖7 4 個端點訓練集及驗證集的L oss曲線
將測試集送入訓練后的預測模型, 對4 個跑道端點的跑道視程實際觀測值與預測值進行比較, 分別計算擬合度及均方根誤差. 擬合度(goodness of fit)是指預測值對觀測值的擬合程度[23], 一般使用變量R2表示,R2值越接近1, 說明擬合程度越好, 擬合度R2計算方法:設y為待擬合值, 其均值為yˉ, 擬合值為y?, 記總平方和SST:



圖8 可見, 跑道視程預測模型在0-2 小時內平均擬合度能夠達到72%, 隨著時間的增加, 預測模型的擬合度R2逐漸減小, 最后降至50%以下, 并且均方根誤差RMSE逐漸增大, 最后增至438.471 以上, 這說明跑道預測模型預測較近時間點的RVR值具有較高的擬合度, 較低的均方誤差, 預測得比較準確, 而預測未來較遠時間點的RVR值偏差會越來越大, 這也符合直觀認知, 跑道視程預測比較適合0-2 小時臨近預報.

圖8 4 個端點未來0-359 分鐘模型R 2 及R MSE變化圖
跑道視程的時序分布特征等分析結果表明影響咸陽機場低跑道視程的天氣主要是大霧. 由于大霧的局地特性很強, 其預報目前在氣象領域依然是業務難點. 雖然近年來大霧預報由傳統的經驗或者統計預報向數值模式或者大霧模式預報轉變, 但數值釋用和霧模式預報準確性仍有待提高, 難以在實際業務預報中直接使用[25].
考慮到每個預測時間前4 小時的多維氣象要素數據包含著各種氣象要素的變化趨勢, 例如降水增大, 未來跑道視程數據就會相應的降低, 濕度增大、溫度降低、風速較小, 一般會伴隨著大霧的發生(大霧的機理比較復雜, 濕度增大、溫度降低、風速較小只是其中3 個較為顯著的氣象條件), 未來跑道視程也會相應的降低. 本文基于長短時記憶網絡的多維時間序列預測方法, 采用多維氣象要素進行跑道視程預測, 旨在擬合出多維氣象要素與跑道視程之間的映射關系.
實驗表明采用長短時記憶網絡, 利用風速、溫度、濕度和跑道視距等預報因子建立一種機場跑道視程預測模型, 對測試集預測的0-2 小時擬合度在58%-88%之間, 擬合度結果表明本文搭建的LSTM 預測模型對跑道視程具有較高的預測能力, 具有推廣價值和發展前景, 其結果可被航空氣象保障人員參考應用LSTM 的優越性和推廣前景.
未來研究中將要改進的方面:
(1)低跑道視程天氣的出現與季節、晨昏時間信息有關, 之后的研究工作中預報因子的選取考慮季節、晨昏等時間信息.
(2)冬季出現較低跑道視程時, 邊界層內常出現大氣層結中性弱不穩定、逆溫以及大濕度區分布的垂直結構. 為了盡可能地描述大氣垂直結構對低跑道視程天氣的影響, 將增加探空觀測的多層次的位勢高度、溫度、露點溫度、風向、風速等資料作為預報因子[25].
(3)隨著人工智能技術的發展, 越來越多優秀的預測技術逐漸成熟, 采用最新的預測算法建模, 進行比較,選取較優的預測模型為跑道視程的預測提供指導, 更好的保障航空器的安全起降.
(4)雖然0-2 小時跑道視距預測具有很高的擬合度. 然而, 預測模型有幾個部分任然需要進行改進, 如跟蹤谷值[26], 跑道視程谷值是航空管制員重點關注的,需要根據跑道視程谷值判斷飛機是否能夠起降.