文/任 飛 朱美琳
改革開放以來,我國的航空運輸業發展很快,從運輸總量上來看,我國民航業已經成為全球僅次于美國的第二大航空運輸系統。航油供應對航空運輸業的發展密切相關,航空運輸的持續快速發展,使航油需求不斷增加。改革開放三十多年來,民航運輸總周轉量年均增長17%以上,遠高于其他交通運輸方式[1],如此高的快速發展,帶來航油消耗也不斷增加,航油的總消耗量也在以年均14.8%的速度增長。隨著西部經濟的不斷發展,也帶來西部民航運輸的發展,從而進一步帶動航油的快速消耗。2013年西北18個機場總加油量86.4萬噸,較2012年增長18.88%[2],高于全國加油量增長率49.84%[3]。
近幾年來,國際航油價格大幅度變化, 2013年航油的年平均價格比2009年增長了55%,從2009年到2013年,航油每噸價格的方差是均值的200倍[4]。如何在頻繁的油價變動環境下降低存儲和運營成本,對于航油公司來說是個亟待解決的重要任務。通常的策略是當航油價格較高時,航油公司僅購入滿足下月飛行需求且盡量少的航油,以減少運營成本,當航油價格較低時,可適當多儲備一些,以備油價較高時使用。 這一決策的前提條件就需要對短期(未來幾個月)的加油量有較為精確的預測,目前一般采用的方法還是靠經驗和歷年數據簡單估算所得,并沒有很精確的數學模型。
加油量和航油消耗量是兩個不同的概念,本文主要是站在航油公司的角度去分析各機場加油量,而不是站在航空公司的角度去分析航油消耗量,盡管兩者有一點的相關性,但出發點不同,分析的結果也是不同的。本文以西北航油公司的月度加油量數據為依據,深入分析,建立符合實際的數學模型,獲取未來短期的預測數據,進而可幫助航油公司確定采購量和庫存量,從而達到減少成本的目的。
目前,關于加油量預測的文獻還比較少見,研究部隊油料消耗預測的研究較多,見[5][6],國外的文獻大都是從飛機自身的工程結構上分析影響油耗的因素,而從大環境去考慮對油耗的預測則較少,Vedant Singh和Som esh K. Sharm a利用結構方程模型對燃油消耗做了全方位的預測,從航空器運行、飛機技術與設計、社會經濟政治、航空基礎設施等方面考慮油耗優化問題,算是分析較全面的文獻資料[7]。
由于民用機場主要是進行客運,呈比較明顯的季節性,所以機場加油量數據是較典型的周期型數據,對于有周期的時間序列數據預測,比較成熟的方法是ARIMA模型[8],它將非平穩時間序列轉化為平穩時間序列,然后進行回歸所建立的模型,還有一種方法是簡單線性回歸[9],其思想是將周期因素作為自變量,加入到原有自變量中,然后進行線性回歸。
上述方法都是針對線性數據的,它們描述時間序列的非線性關系的能力較差。在非線性回歸模型中,Vapnik等人提出支持向量機(SVM)理論[10]表現出比較優秀的性能,能較好地解決以往很多學習方法的小樣本、非線性、高維數、局部極小點等實際問題,被廣泛應用。但支持向量回歸并沒有考慮周期性。
本文針對機場加油量時間序列的特點, 提出了一種基于周期的支持向量機回歸算法用于機場加油量時間序列的預測。
要對機場加油量進行預測,尤其是月度預測,需要比較細致的模型,因此除了獲取歷年加油量數據以外,還應分析影響加油量的其他因素,抽絲剝繭,才能進行深層次的預測。
(1)首先考慮到不同的機場規模,加油量的變化也是不一樣的,因此,本文將機場進行歸納總結,分為三類:
①干線機場,如西安、蘭州機場,運作多年,客流量大,季節性突出,加油量較為穩定地同比增長。
②支線機場,如敦煌、延安機場,多是旅游城市,旅游季節客流較大,其他季節變化無常,有時還有停運現象。
③新接收機場,如中衛、金昌等機場,剛開始發展,歷史數據少,沒有自己的儲油設備,客流非常不穩定,季節性因素少,有些航班自帶回油,不在這些小機場加油。
針對上面三種不同的機場,其影響加油量的因素也各不相同,因此一定要區別對待。尤其是支線機場的加油量,對新接收機場的發展具有很重要的參考價值。本文對不同規模大小的機場分別建模,采用的預測參數設定是不一樣的。
(2)影響加油量的一個非常重要的因素就是季節性。民用機場主要進行的是客運,不同季節的旅游人數會給客運帶來不同的吞吐量,在旅游(春運)旺季,每個航空公司的航班都會比淡季有所增加,隨之帶來的加油量也有所不同。
(3)同(2)中所述,每月的旅客吞吐量直接影響到加油量的多少。但每月的吞吐量數據都是月末統計出來的,并不能夠提前獲取,對未來幾個月的吞吐量的值只能是預測,因此并不精確,為了避免誤差累積,因此在后續的建模中,將使用航班架次代替吞吐量。
(4)航班架次雖不能完全替代旅客吞吐量,但國內的機型差別不大,滿員率差別也不大,因此兩者的變化趨勢還是非常相似的。以西安機場為例,2009年到2013年,旅客吞吐量與航班架次的相關系數為99.8%[11],因此可以用航班架次作為影響加油量的因素之一。另外航空公司通常都會提前幾個月公布其航班計劃,因此相對精確的航班架次是可以通過各航空公司公布的數據得到。
(5)由于每個航班的飛行距離是不同的,而不同的飛行距離,加油量也隨之不同,因此航班飛行距離是必須考慮的因素。本文首先通過航班架次知道每個航班的起飛地點和降落地點,然后根據兩地的經緯度計算出兩地距離。
(6)另外不同的機型,其載客人數不同,帶來的加油量也不同。目前西部地區主要飛行的客機是波音系列和空客系列,受跑道長度限制,一般沒有超大型飛機。本文考慮以737機型作為基準,將其他機型與737飛機進行比較,給出不同的權重。當然飛機的新舊程度也會影響到加油量,不過這個引起的變化較小,于是忽略不計。
(7)其他影響因素。由于給飛機加油時是由人主觀控制,因此加油量的多少還會受一些人為因素的影響,另外天氣變化、少量軍用機加油等,這些因素在整個加油量里面所占的比重非常少,因此可以綜合用一個擾動隨機變量表示。
綜合上面所述,飛行距離是綜合了旅客吞吐、航班架次的復合指標,筆者將月度的加權飛行總距離作為最主要的影響因素。獲取步驟如下:
Step 1 獲取各航空公司月度的所有航班信息
Step 2 通過各機場的經緯度計算各機場間的距離dij,表示i機場到j機場的飛行距離。
Step 3 計算每個航班的機型權重,alpha=航班機型滿員數/737飛機滿員數。

表1 各模型參數表
Step 4 將每個航班的飛行距離乘以機型權重,再進行累加,得到月度所有航班的加權飛行距離之和distance。
支持向量回歸是在分類算法上演化來的,實質上是采用支持向量機對原因變量衍生出的兩類點X,X*分類,得到的分類超平面即為所求的回歸超平面。求解支持向量機回歸問題,首先將每個樣本點的y值分別減少和增加ε,得到包含兩類樣本的訓練集D。利用支持向量機求解分類問題,假設存在超平面在 精度下無誤差地完全將兩類點分開,即稱該ε-帶超平面為訓練樣本的線性回歸函數。
同時為增強泛化能力我們把線性硬ε-帶軟化,并引進松弛變量和懲罰參數C,在描述非線性問題時,用一個非線性映射)(xxΦ→把數據映射到一個高維空間,得到ε-帶支持向量回歸機的原始問題。

常用的核函數有:多項式核,高斯核,Sigm oid核等。
上述模型是普通的支持向量回歸模型,并沒有考慮到周期因素,本文在此基礎上,引入周期自變量,設時間變量為t,周期長度為T,對于一般的周期函數可以表示為:
本文使用西部地區民用機場的月加油量數據進行預測,主要包括敦煌機場、嘉峪關機場、蘭州中川機場、西安咸陽國際機場、西寧曹家堡機場、延安機場、銀川河東機場、榆林西沙機場等8個機場,按照第2節中的機場分類,西安咸陽國際機場、蘭州中川機場、西寧曹家堡機場、銀川河東機場為干線機場,敦煌機場、嘉峪關機場、延安機場、榆林機場為支線機場,本文分別對這8個機場建模??紤]到數據綱量的統一,對各項數據(包括自變量)進行了z-score標準化處理。
本文選取了2011年1月到2013年12月的加油量數據,并求出每個月的各機場航班的飛行距離。使用ARIM A模型、簡單線性回歸模型、傳統的支持向量機模型(不帶周期自變量,只有distance為自變量)、帶周期變動的支持向量機模型分別對8組數據進行擬合。ARIM A模型使用SPSS軟件,其中的各項參數由軟件經優化后自動選取,簡單線性回歸模型也使用了SPSS軟件,支持向量機模型使用的是matlab工具包,并在此基礎上修改而成,其中核函數為高斯核函數其余各項參數,由網格法自動尋優確定。各基本模型參數如表1所示。
在線性回歸里,飛行距離的系數都比較高,說明飛行距離同加油量是非常相關的,這與我們之前的分析相吻合。
以敦煌為例,可以得到各個算法的擬合曲線。

圖1 敦煌擬合圖
利用R方來計算各模型的擬合效果,得到表2。

表2 各模型擬合效果表
可以看出帶周期變動的支持向量機的擬合度是比較高的。
我們用上面的模型對2014年1月和2月的數據進行預測,將之與實際值進行比較,計算兩個月的平均誤差,如表3所示。

表3 各模型的預測誤差
從上表可以看出,傳統支持向量機和帶周期的支持向量機模型的預測能力都表現不錯,基本預測誤差都能控制在5%以內,尤其是對支線機場(敦煌、嘉峪關、延安、榆林)的預測,在其波動比較大的情況下,ARIMA模型以及簡單線性回歸模型就會出現比較大的誤差。當然支持向量機也會存在部分過擬合現象,因預測的月數較少,問題還不是很明顯。
機場加油量的估計對機場的發展有著十分重要的作用,可減少機場運營成本,提高機場的競爭力。本文使用基于結構風險最小化原理的支持向量機理論,根據時間序列的性質,給出了帶周期的支持向量機回歸方法。通過對機場加油量的預測實驗,表明支持向量機方法,有很強的學習和預測能力,在機場加油量預測上有很大的應用價值。在未來的研究工作中,將時間序列的方法組合,降低單一方法預測中一些不利因素的影響,提高學習和預測能力將是研究的重點。
[1]中國民航運輸總周轉量年均增17% 存四結構性問題。中國新聞網。http://finance.chinanew s.com/cj/2012/07-20/4046610.shtm l
[2]中國航空油料有限責任公司西北公司2013年財務決算報告
[3]中國航油集團公司2014年工作會議文件
[4]發改委內部數據
[5]李偉,王紅旗,嚴喬喬.BP神經網絡—馬爾科夫模型在軍用油料消耗預測中的應用研究[J],中國儲運,2012(01),125~126
[6]王冰,劉巖,周慶忠.軍隊油料消耗預測策略研究[J],中國儲運,2011(03),51~54
[7]Vedant Singh, Somesh K. Sharma. Evolving base for the fuel consumption optimization in Indian air transport: application of structural equation modeling[J], European Transport Research Review,February 2014
[8]Box G.E.P, Jenkins G.M, Reinsel G.C. Time Series Analysis: Forecasting and Control [M], 3th ed. Englewood Cliffs, Prentice Hall, 1994, 89~130
[9] 鄧明, 張荷觀. 利用線性回歸模型對季節指數的估計[J],江南大學學報(自然科學版), 2008, Vol 7(3), 375~378
[10]Vapnik V. Statistical learning theory[ M] . NY: Springer , 1998
[11]西安咸陽國際機場主頁 http://www.xxia.com/intro.aspx