張啟凡 王永忠 王圣堂 裴柯欣
(中國民用航空飛行學院空中交通管理學院 廣漢 618300)
交通運輸是連接生產與消費的重要環節,是經濟運行的基礎。民航運輸系統的發展反映了一個國家或地區的經濟發展水平[1~2]。面對日益增長的航空運輸需求,政府部門可能會為此制定機場等交通建設的決策和計劃。對客運量進行預測,對于客運系統的規劃與建設、項目的投資和運輸資源的合理配置都具有重要的現實意義[3~4]。
民航客運量受到多種隨機性、模糊性因素的影響,其本質為非平穩的時間序列。目前,對民航客運需求主要的預測方法有:回歸分析、BP 神經網絡、SVM、SARIMA、ARIMAX 等[5]。這些方法大都是對數據進行了平穩處理,缺失了數據序列存在的非線性特征,從而限制了算法預測的精度。
本文提出一種基于NARX 動態神經網絡的民航客運量預測方法,從民航客運量的時間分布出發,利用NARX 模型從客運量的時間序列中挖掘數據的波動周期和變化特征,對民航客運量進行準確地預測。同時,本文還采用了ARIMA 和Holt-Winters模型進行對比仿真分析。
對于民航客運量發展趨勢的研究可以更清晰的了解序列數據的整體發展趨勢,而波動趨勢體現了客運量的周期性變化特征,這些對于預測模型的建立提供指導。根據CAAC 官方網站提供的生產統計數據,本文選取2008年1月~2019年12月的客運量數據進行研究。繪制客運量時序圖如圖1 所示。

圖1 2008年~2019年民航客運量時序圖
從圖1 可以看出隨我國經濟發展水平與航空運輸需求的增長民航客運量逐年遞增,總體發展趨勢較為穩定,存在受年中不同季度交通需求及公共假期等因素影響的周期性波動。為進一步明確周期性波動趨勢,繪制了2008年~2019年月平均客運量時序圖如圖2 所示,可以看受周期性波動因素的影響,8 月為客運量高峰期,而1 月為客運量低谷期。

圖2 2008年~2019年民航月平均客運量時序圖
NARX 動態神經網絡是具有外源輸入的非線性自回歸動態神經網絡,不同于集中輸入層的動態網絡或前饋網絡,NARX 是一種在靜態多層感知器基礎上通過引入延時模塊及反饋構成的遞歸動態網絡[6]。NARX 動態神經網絡模型基于線性ARX模型,適用于非平穩序列的建模問題。NARX 神經網絡的結構主要由輸入層、隱藏層和輸出層以及延時層構成[7]。結合數據序列增長趨勢,隱含層激勵函數選用softplus[8]函數,輸出層為purelin[9]傳遞函數。模型表達式為式(1)所示。

式中,f表示特定非線性函數,u(t)為網絡模型輸出變量;y(t)為網絡模型外部輸入變量;y(t-ny),u(t-1),u(t-2),…,u(t-nu)為網絡模型輸入變量和反饋時延變量[10]。
ARIMA 模型由三部分組成,分別為自回歸模型(AR)、移動平均模型(MA)[11~12]、差分階數(I)。模型表達式如式(2)所示:

其中:c 為常數項;α1,α2…αp是自回歸系數;θ1,θ2…θq為移動平均系數;εt是殘差。
由于客運量時序數據屬于非平穩序列,所以需要進行高階差分達到平穩要求。
從圖1 可以看出客運量時序數據在年中出現重復波動趨勢,存在季節性特征,因此以年為單位的時間間隔稱為一個季節。三次指數平滑模型在二次指數平滑的基礎上增加了季節分量。利用季節調整方法的離群值識別、節假日效應處理的優勢,對原始負荷序列進行季節調整,可得到消除了離群值影響和節假日影響的季節調整后序列和季節成分序列,然后用Holt-Winters 方法對季節調整后成分進行預測[13]。季節趨勢可以分為累加性和累乘性。累加三次指數平滑模型表達式為


累加三次指數平滑的預測公式為

累乘三次指數平滑模型表達式為

累乘三次指數平滑模型表達式為

其中α、β、γ、k 分別為數據平滑因子、趨勢平滑因子、季節改變平滑因子、周期。
為使得NARX 模型適應年中波動趨勢從而得到更好的訓練結果,采用大小12*2,步長為1 的滑動窗口進行客運量時序數據的切片,并使用連續的12 條數據構建時序數據集。為加強數據序列特征,加入季節分量作為輔助特征[14]。將2008年1月~2017 年12 月共120 個月的數據作為訓練集,將2018 年1 月~2019 年12 月共計24 個月的數據作為測試集。得到運行結果如圖3所示。
可以看出,經仿真得到的2018 年1 月~2019 年12 月的數據與真實值波動趨勢幾乎一致且數值上也較為接近。為進一步驗證模型的準確度,使用ARIMA 模型、Holt-Winters 加法、Holt-Winters 乘法模型進行對比仿真實驗得到結果如圖4~圖6所示。

圖4 Holt-Winters乘法模型仿真結果

圖6 ARIMA模型仿真結果
為驗證NARX 動態神經網絡模型的預測精度,本文采用R2、MAE、RMSE[15]三種指標對四種模型的仿真結果進行評價,公式如式(11)~式(13)所示。模型評價結果如圖7、圖8所示。

圖5 Holt-Winters加法模型仿真結果

圖7 各模型仿真結果誤差評價

圖8 各模型仿真結果擬合度評價


通過對比仿真實驗可以看出,NARX 動態神經網絡對于民航客運量的預測擬合度更高、誤差也更小。相比之下,ARIMA 模型的預測準確度不佳,ARIMA 模型對客運量時序數據變化趨勢預測相對準確,但由于缺乏對時序數據非線性特征以及季節性波動的學習,所以在整體上的準確度不佳。Holt-Winters三次指數平滑可以預測非線性時序數據,將時序數據分解為趨勢項和周期項并增加季節分量,對于民航客運量數據的趨勢比AMIMA 預測更準確。其中,乘法模型較加法模型的擬合度高,說明民航量客運量的增長趨勢更強偏向于累乘增長。但由于Holt-Winters 三次指數平滑模型對時序數據非線性特征提取不充分的問題,在連續預測中隨著預測步長的增大,預測結果的誤差也在增大。
本文對民航客運量的增長趨勢和波動規律進行了分析,民航客運量時序數據屬于非平穩序列數據,呈現年內波動規律。在此基礎提出基于NARX動態神經網絡的民航客運量預測方法,通過滑動窗口進行客運量時序數據的切片,并使用連續的12條數據構建時序數據集。為加強數據序列特征,加入季節分量作為輔助特征對模型進行訓練對2018年1 月~2019 年12 的客運量進行預測。同時,本文還采用了ARIMA 模型、Holt-Winters 加法模型、Holt-Winters乘法模型進行了對比仿真實驗。仿真結果表明NARX 動態神經網絡的擬合度和預測精度較高。民航客運量預測的復雜性還可以繼續深入的研究,尤其是在受到大流行等因素的影響下客運量的變化規律。