擺倩倩 吳薇薇 陸燕楠 魏文斌 張 潔
(南京航空航天大學民航學院 南京 210016)
目前國內民航機場運營收入的主要來源仍為航空性業務收入,多數機場尤其欠發達地區的支線機場仍處于依靠客貨吞吐量增長帶動收入增長的初級發展階段[1],客流量的大小直接影響民航機場航空性收入的多少.客流預測一直是民航業備受關注的研究領域,國內外學者對機場客流量預測的研究成果大致分為線性和非線性理論的預測方法.基于線性理論的預測方法有時間序列模型、灰色模型等[2]雖取得了較高的預測精度,但普遍存在無法反映非線性部分變化規律的問題.非線性預測方法主要有神經網絡、支持向量機等,多數從機場客流歷史數據本身挖掘有效信息.
近年國內支線機場建設的大發展加劇了多機場環境下鄰近機場間的客流競爭態勢[3],單純的線性回歸模型已經無法對復雜因素影響下的機場客流量做出準確的預測.神經網絡具有較強的非線性映射能力[4],本文選取GDP、全年接待游客數量及鄰近樞紐機場的旅客吞吐量為自變量[5],構造Elman神經網絡與多元線性回歸[6-7]的串聯組合預測模型,對支線機場的客流量進行預測.以江蘇地區支線機場——常州奔牛機場(以下簡稱常州機場)的客流預測為例驗證模型的有效性.結果表明,Elman神經網絡在多指標同步預測方面的穩定性較好,模型整體性能優于傳統的計量經濟模型,取得了較好的預測結果.
本文結合《常州市國民經濟和社會發展統計公報》與《南京市國民經濟和社會發展統計公報》中2001—2015年的相關數據,選取常州市GDP(x1)、常州市全年接待游客數量(x2)、南京祿口機場旅客吞吐量(x3)為自變量對常州機場旅客吞吐量(y)進行預測[8].
(1)
(2)
運用SPSS進行相關性分析,結果見表2.
由表2可知,各指標與因變量間的相關系數均大于90%,存在顯著的相關關系.

表1 常州機場旅客吞吐量及相關指標的歷史數據

表2 指標相關性分析
1.3.1Elman神經網絡的結構
Elman神經網絡是一種具有局部記憶和局部反饋連接功能的遞歸神經網絡,通過在BP神經網絡基本結構的基礎上加入一個承接層,將隱含層的輸出進行延遲與存儲,并自聯到隱含層的輸入.這種自聯方式在增強網絡對歷史數據敏感性的同時更好的實現了數據的動態映射,適用于時間序列問題的動態建模.
設網絡的輸入層包含r個節點,隱含層和承接層均包含n個節點,輸出層包含m個節點.則輸入向量I(k)∈Rr,輸出向量O(k)∈Rm,隱含層輸出向量x(k)∈Rn*n,承接層輸出向量xc(k)∈Rn*n.f,g分別為輸出層、隱含層的傳遞函數.
網絡的數學模型為
xk=f(wCxc(k)+wHI(k-1))
(3)
xc(k)=x(k-1)
(4)
o(k)=g(wOx(k))
(5)
式中:wH,wC,wO分別為輸入層與隱含層、隱含層與承接層、隱含層與輸出層之間的連接權陣,wH∈Rn×r,wC∈Rn×n,wO∈Rn×m.
1.3.2Elman神經網絡權值修正的學習算法
設訓練集為(I(k),Od(k)),網絡實際輸出為{O(k)},k=1,2,…,N.其中:
I(k)={I1(k),I2(k),…,Ir(k)}T,Od(k)=
{Od1(k),Od2(k),…,Odm(k)}T,O(k)=
{O1(k),O2(k),…,Om(k)}T
設網絡各層神經元的輸入輸出分別為μ、O,如隱含層第i個神經元在k時刻的輸入、輸出分別為μi(k),Oi(k);輸出層第j個神經元的輸入、輸出分別為μj(k),Oj(k).
Oi(k)=g(μi(k))
(6)
Oj(k)=f(μj(k))
(7)
由于動態遞歸網絡的輸出與當前及過去時刻的輸入信號均有關,因而必須采用動態學習規則.本文對遞歸網絡學習算法的研究采用有序鏈式法則.
令ej(k)為第j個輸出節點在k時刻期望輸出與實際輸出值之間的誤差,即
ej(k)=Odj(k)-Oj(k)
(8)
定義k時刻網絡權值調整的誤差函數為
(9)
修正后的權值計算公式為
w(k+1)=Δw(k)+w(k)
(10)
下面以隱含層與輸出層的之間的權值調整為例,分析逐層反向調整網絡權值的具體步驟:
(11)
根據微分鏈式法則
-ej(k)f′(μj(k))Oi(k)
(12)
權值修正量為
(13)
引入局部梯度的定義
ej(k)f′(μj(k))
(14)
則式(13)更新為
(15)
采用上述有序鏈式法則對圖1中的權值進行調整.
(16)
同理,隱含層的權值為
(17)
關聯層的權值為
(18)
1) Elman神經網絡預測的樣本數據劃分 以常州機場2001-2013年(下文分別以1~13表示)的指標數據為基礎,構造訓練樣本矩陣:
pk=(x1k,x2k,x3k),k=1,2…,13
(19)
式中:k為指標數據取自的年份.
令P1=p1:p4,P2=p2:p5,…,P10=p10:p13則訓練樣本矩陣T為
T=[P1,P2…,P10]=
(20)
以P1為例:p1:p3為模型輸入,p4為模型的目標輸出,依此類推,相當于一個時間序列問題,可以通過Elman神經網絡進行預測.其映射函數表示為
pk=f(pk-1,pk-2,pk-3),k=4,5…,13
(21)
2) 神經網絡的參數設置 反復訓練并不斷調整神經網絡的參數設置,對比發現,當隱含層節點數為9,學習速率為0.05,最大訓練次數為10 000時,網絡的預測誤差最小且預測性能穩定.
Elman神經網絡測試樣本輸出數據反歸一化處理后的結果見表3,預測誤差率圖見圖1.

表3 Elman神經網絡測試樣本指標輸出結果

圖1 Elman神經網絡預測誤差率圖
由于支線機場客流量大小還受到外來流動人口數量、旅客出行時間成本、地面交通可達性等隨地區經濟、發展現狀等快速變化且不易量化因素的影響,本文僅選取近三年的客流量數據進行模型驗證.驗證結果顯示,模型對13,14,15年指標預測值的平均誤差率分別為1.53%,3%,7.5%,雖呈現一定的誤差累積趨勢,但仍小于10%,說明該神經網絡對多指標預測的效果較好.模型訓練過程的誤差下降曲線見圖2.

圖2 Elman神經網絡訓練誤差下降曲線圖
用訓練好的網絡對2016-2018年指標值進行預測,結果見表4.

表4 Elman神經網絡指標預測結果
本節仍以表1所示歷史數據為基礎,常州機場年旅客吞吐量作為被解釋變量,常州GDP、常州全年游客量、南京機場旅客吞吐量作為解釋變量,構建多元線性回歸模型,表達式為
(22)
式中:k=1,2,…,12;α0,α1,α2,α3為模型中各影響因素的回歸系數.
運用Matlab對上述指標數據進行多元線性回歸分析,結果見表5.

表5 回歸模型系數、系數置信區間與統計量
由圖3可知,樣本殘差均勻分布在合理的區間范圍內,未出現異常的數據觀測點.R2=0.982 8,接近于1,表明模型擬合程度較好.F=152.120 5,p=0<0.05,說明模型的線性關系在95%的置信水平下顯著成立.

圖3 殘差杠桿圖
回歸模型為
y=-0.005 5+0.564 5x1+
0.622 1x2-0.392 8x3
(23)
分別將2013—2015年的指標實際值與Elman神經網絡輸出的指標預測值帶入式(23),對常州機場客流量進行預測并將結果反歸一化處理,分析比較不同模型的預測精度,結果見表6.

表6 常州機場旅客吞吐量預測結果對比
由表6可知,單純的多元線性回歸模型預測誤差率均大于15%,結合Elman神經網絡指標預測的多元線性回歸模型的平均誤差率為8%.其中2014年的預測誤差明顯大于其他年份.
2014年南京機場啟用T2航站樓,與新航站樓配套的停車場、地鐵機場線、長途大巴等公共交通設施齊全,大大提高了機場的服務能力.數據顯示,2015年南京祿口機場旅客增量為往年的3倍,可視為指標數據增長的異常值,導致常州機場2014年的吞吐量預測結果出現較大誤差,符合實際情況.
對常州機場2016-2018年的旅客吞吐量預測結果見表7.

表7 常州機場2016-2018年旅客吞吐量預測結果
Elman神經網絡因結構中包含特殊的延時算子而具備記憶隱含層神經元前一時刻輸出值的特性.模型通過修正前饋連接部分的連接權矯正并提高了預測精度,憑借神經網絡良好的學習能力實現了多個指標的同步預測,避免了傳統指標預測方法造成的誤差累積,在此基礎上結合多元線性回歸模型取得了誤差相對較小的預測結果;然而目前的研究成果仍存在缺點和不足:由于部分指標數據的獲取受到限制,本文僅考慮鄰近機場對客流的競爭,而地面交通(尤其高鐵)亦對民航旅客存在明顯的分流作用,對于民航與地面交通運輸方式間的客流競爭關系,有待進一步研究.