何玥霓,崔 璨,關凱祥
(沈陽航空航天大學 民用航空學院,沈陽 110136)
根據《民航行業發展統計公報》[1]2018年航空安全部分的統計:2018年,民航安全運行穩定可控,航空運輸百萬小時重大事故率十年的滾動值為0.013(世界平均水平為0.153)。發生13起通用航空事故,死亡15人;發生了568起航空運輸事故征候,其中16起是航空運輸嚴重事故征候。自2010年8月25日至2018年底,航空運輸已經連續100個月安全飛行,累計飛行了6 836萬小時。更為重要的是:根據《新時代民航強國建設行動綱要》提出的戰略步驟,到2020年,民航加快實現從航空運輸大國向航空運輸強國的跨越。飛行安全是實現航空強國的一大基石,對于事故而言,將事故征候的統計與分析作為衡量一個國家的民航飛行的安全水平更為合理。如何科學、合理預測事故征候,從而做到事故早發現,事故早預防成為亟待解決的問題。民航事故及事故征候統計分析是科學預防飛行事故和事故征候的重要手段,通過開展準確、深入的數據統計、分析,制定針對性強、切合實際的對策和措施,可降低事故及事故征候的發生率,改善民航安全狀況[2]。
首先,在民航飛行事故及事故征候統計方面,劉雨行等[3]對近年來民航事故的統計分析指出民航飛行事故發展的總體趨勢在不斷減少,但全球空難平均死亡人數呈上升趨勢,并且從事故發生的原因提出相應的預防措施,即人為失誤是導致事故的重要原因。馬銳等[4]對飛行事故中人為失誤做了詳細分析,總結出要提高我國航空安全水平。Sen A等[5]通過對25年的航空事故數據時間序分析,從人為因素生理和心理的角度對航空事故原因進行深入分析。杜紅兵等[6]通過對370次飛行事故的分類和數據統計分析,了解了高風險事故的類型以及各種類型的飛行事故的主要原因。Alexander R.Crain[7]等統計分析了美國航空事故,利用到了鳥擊數據庫。Yafei Li[8]研究時間序列,對長期航空歷史事故數據中的變化規律進行探索,并對未來航空事故的可能變化進行預測。梁文娟等[9]結合ARIMA和LS-SVM模型預測航空公司每小時的飛行事故率。馬雅潔[10]結合中國民航業的特點和飛行事故的特點,建立了中國民航安全狀況指數,并用于量化中國民航的安全狀況。程明等[11-12]多元回歸統計分析了1995年至2014年中國民航安全生產數據,將ARIMA模型用于預測中國民航的安全性。何杏子等[13]以新疆自治區出口價值貿易的2009年第一季度至2016年第四季度的時間數據,使用X12-ARIMA模型預測2017年前三季度的數據。X-12季節調整模型可以將原始時間序列進行分解,將趨勢分量序列(SER_TC)、季節周期分量序列(SER_SF)和隨機分量序列(SER_IR)分解來研究規律。
上述研究并沒有從時域角度定量確定民用航空飛行事故發生的趨勢,而是更加側重于事故和事故征候的預測,沒有考慮某些季節的規律和趨勢之間的相互干擾,從而影響預測的準確性[14]。在不斷提高的中國民航安全管理水平背景下,僅僅依靠年度事故相關指標分析趨勢來研究民航安全的最新趨勢是不夠的。基于此,本文將以2008年至2018年的132個月的飛行事故征候率為樣本,分別使用X-12模型與ARIMA模型分析、預測飛行事故征候萬時率的時間序列,分析與預測飛行事故征候,為中國民航安全規劃提供有效的決策支持。
衡量安全水平的指標包括事故、事故征候和一般事件。由于事故發生的概率很低,而一般事件目前還沒有統一的執行標準,給數據的統計帶來了困難,因此現階段利用事故征候萬時率衡量安全水平較為合適。而事故征候萬時率的預測對建立準確的安全水平也會產生影響,因此年度/月度事故征候萬時率成為衡量民航安全水平的重要指標,科學地預測我國民航的事故征候萬時率已經成為合理確定未來安全水平的重要依據[15]。
該數據來源于中國民航安全信息系統、《中國民航安全報告》和中國民航總局發布的主要月度生產指標統計數據。從2008年至2018年,根據每月飛行時間(單位:10 000小時)和中國航空運輸不安全事件的統計數據,計算出每月飛行事故的萬時率。
圖1是經過篩選處理后統計得到的2008-2018年飛行事故征候萬時率變化趨勢,縱坐標是飛行事故征候萬時率,橫坐標代表年份。整個時間序列被記作SER。

圖1 2008-2018年飛行事故征候萬時率變化趨勢
由圖1可知,時間序列存在明顯波動,其波動范圍也很廣,每年的數據都有明顯的波峰和波谷,總體呈現出振蕩式波動,規律性不是很明顯。需要對上述的時間序列進行自相關分析和單位根檢驗來獲取詳細的信息,結果如圖2和表1所示。
從圖2可知,時間序列顯然是有季節性的,因為當滯后期為12和24時,自相關函數的標準差均大于兩倍。從表1單位根檢驗結果看出,飛行事故征候萬時率的時間序列是平穩的,因為該單位根檢驗(Augmented Dickey-Fuller test,ADF)值為-7.84,小于1%的統計臨界值。

表1 單位根檢驗結果
ARIMA通常適用于解決線性問題。但要想更深入分析飛行事故征候月度萬時率所展現的規律,就必須對該時間序列進行季節性調整,才能得到更全面的結果。因此需要通過X-12季節調整模型得到萬時率的趨勢分量、季節周期分量、隨機分量。旨在根據歷史數據時間序列深入分析,預測準確的未來萬時率。通過ARIMA模型預測趨勢分量、SPSS軟件預測季節周期分量和趨勢分量時間序列,最后利用X-12季節調整法還原萬時率,實現萬時率的預測。
首先,建立一個時間序列Xt,它是由飛行事故征候的萬時率(單位:每月)組成的。TCt表示由趨勢分量所組成的時間序列,St表示由季節周期分量所組成的時間序列,It表示由隨機分量所組成的時間序列。由于飛行事故征候率受多方面影響,各個影響要素之間并不完全獨立,因此我們利用X-12季節調整乘法模型對它進行季節調整,公式表示如式(1)所示。
Xt=TCt×St×It
(1)
設飛行事故征候萬時率為非平穩時間序列{Xt},它可以通過d階差分成一個平穩時間序列(當d-1階時該時間序列仍然是非平穩時間序列),然后d階差分后的{Xt} ARMA(p,q)模型稱為ARIMA(p,d,q)模型。
Xt=c+φ1Xt-1+ ... +φpXt-p+εt+θ1εt-1+...+θqεt-q
(2)
式(2)中Xt為經過n次差分后的滿足平穩性要求的序列,c為常數,p、q為模型的階,θi與φi為待估參數,εt為t時刻的隨機誤差。
首先分析它的自相關圖和偏相關圖以判斷序列的穩定性。如果序列是平穩的,就需要確定模型的階數p和q。其次,通過使用最小二乘法估計模型參數來確定模型的基本形式。再次,需計算每個參數的T檢驗值。如果參數未通過測試,需要重新定階。最后通過檢驗上一步驟中的誤差項,確定模型的誤差項是否為平穩的白噪聲序列。如果是平穩的白噪聲序列則建模已完成;否則需要重塑。通過已經生成好的模型預測出未來的值。
使用X-12季節調整乘法模型,利用Eviews9.0數據分析軟件,通過分解原始時間序列這一數據,可以得到趨勢分量序列(SER_TC)、季節周期分量序列(SER_SF)和隨機分量序列(SER_IR),分別如圖3、4、5所示。(圖中縱坐標是萬時率;橫坐標代表2008-2018年,其中每年等分為12份,代表1-12月。)

圖3 趨勢分量

圖4 季節周期分量

圖5 隨機分量
從圖3可知,2008年1月-2008年12月我國飛行月度事故征候萬時率呈波動下降趨勢,2008年12月-2010年12月呈波動上升趨勢,2010年12月2012年11月總體呈平穩性外,2012年12月-2013年12月呈快速下降趨勢,2013年12月-2016年12月呈快速上升階段,然后2016年12月-2018年12月呈現波動下降趨勢。
從圖4可以看出,圖中的曲線有季節性周期性波動,波動周期為12個月,每年的波動情況大致相同,但年度波動狀態略有變化。主要表現為:在2008-2014年間第一階段的高峰是5月,到2015-2017年間第一階段的高峰是4月,而在2018年高峰回到了5月。上述微小變化表明飛行事故萬時率的季節性影響有所改變。結果表明,運輸飛行的安全狀況受到年復一年的季節性因素影響,現有的季節性以周期形式呈現。此外,季節因素對飛行事故的總體影響呈上升趨勢,然后呈穩定趨勢,主要體現在2008年至2013年呈上升趨勢,2014年至2018年呈穩定趨勢。
由于圖5中隨機分量變化規律不明顯,所以本文著重研究飛行事故征候萬時率時間序列的趨勢性和季節性所顯示的相關規律。
(1)趨勢分量分析
為了更深入地研究趨勢分量,參照以下幾個版本的事故征候類型標準:MH/T 2001-2004、M/T 2001-2018、M/T 2001-2011和M/T 2001-2015。它可以反映出每年最主要的事故征候類型。把每年已知的事故征候類型的數量與標準預測的事故征候類型的數量做差值,若結果是正數,則說明該年、該事故類型的數量有所增加,反之則減少。具體每年每種主要飛行事故征候類型的統計如表2所示。

表2 各事故征候類型與標準變動前預測值的差值
2009-2011年飛行事故征候萬時率上升是由于鳥擊、外來物擊傷和雷擊/電擊,主要是由于鳥擊增長至最大。2012年飛行事故征候萬時率的增長主要來源是發動機停車和其他類。2013-2015年呈下降趨勢的有鳥擊和航空器碰撞,其他類呈上升趨勢。2016年事故征候類型是航空器碰撞障礙物事故征候,其余四類事故征候類型均呈上升趨勢,且幅度較大。2017年所有飛行事故征候類型均呈下降趨勢。2018年發動機停車、雷擊/電擊、航空器碰撞障礙物、其他類事故征候類型較平穩,鳥擊、外來物擊傷事故征候類型呈下降趨勢,鳥擊、外來物擊傷對2017-2018年飛行事故征候萬時率的下降貢獻最大。
以上分析結果表明,2008-2018年運輸飛行事故征候萬時率長期趨勢變動在不同階段受不同事故征候類型事故征候變動的影響。
(2)季節周期分量分析
表3是剔除趨勢分量和隨機分量后的季節周期分量,在2008-2018年1-12月份內,飛行事故征候萬時率季節周期分量的匯總情況。

表3 季節周期分量匯總表
表3是圖4的另一種表現形式,旨在按特定值分析和比較每月的發展趨勢,可看出飛行事故征候萬時率的數據季節性因素很強。9月的季節因子平均值為1.639,5月的季節因子平均值為1.426,這兩個月份的季節因子位于全部月份平均值的前兩位,表明這兩個季節受季節影響最大。一月和十二月則最少,每年的一月是事故率受季節因素影響最小的月份。從1月到5月,逐漸增加的鳥類活動等季節影響因素逐漸增加,飛行事故征候萬時率呈上升趨勢,并在5月達到一年中第一個峰值。6月是國家安全生產月,所以飛行事故征候萬時率稍有下降。7月之后,我國大部分地區進入了夏季,嚴峻的天氣條件(如汛期、暴雨)使民航飛行安全受到考驗。7月至9月,鳥類活動再次增加,所以飛行事故征候再次呈上升趨勢。所以,需要對5月和9月持續關注,同時由于春秋兩季鳥類的頻繁活動,也需注意3月、4月以及10月飛行事故征候萬時率。
(1)基于ARIMA模型的趨勢分量預測
對SER_TC序列進行單位根檢驗,發現該序列是非平穩的。經過一階差分后根據一階差分的單位根P值,判斷出該一階差分后的時間序列是平穩的。因此可以確定ARIMA(p,d,q)模型中d=1。
由自相關系數和偏相關系數得到截尾和拖尾特性。從圖6中可看出,自相關系數(Autocorrelation)為拖尾,偏自相關系數(Partial Correlation)為三階截尾。故一階差分后,自相關系數趨勢成分序列p=3,q=0。

圖6 一階差分后的趨勢分量相關圖
從表4中的P值可以看出,模型變量對應的參數全部通過顯著性檢驗(P<0.05),因此模型選擇ARIMA(3,1,2),模型參數估計結果為:
ωt=2.64ωt-1-2.45ωt-2+0.8ωεt-2+0.82εt-20.3
(3)

表4 ARIMA建模
檢查εt是否為平穩的白噪聲序列的過程基于自相關系數和偏自相關系數。如果K(K=1,2,…)周期中滯后的自相關系數和偏自相關系數趨于0,則表示εt是白噪聲序列,則模型可以預測。否則需要重塑。測試發現,殘差自相關圖均在標準偏差的兩倍之內,并且殘差是固定的。εt是平穩的白噪聲序列,可以用于預測。
(2)事故征候萬時率預測
將歷史月度趨勢分量時間序列代入公式(3),得到趨勢分量預測序列TCt。使用SPSS軟件的專家建模器對季節分量與隨機分量分別建模,得到季節分量St與隨機分量It的預測序列。之后將TCt、St、It代入X-12乘法模型,還原預測飛行事故征候的萬時率。本文選取2011年作為預測結果對比年份,驗證模型精度,萬時率預測值與真實值對比結果如表5所示。通過對比發現,此建模結果相對真實值誤差在百分之二十的范圍內進行波動,最小相對誤差值為0.721%,最大相對誤差值為17.481%。
通過與真實值對比的精度驗證,證明本文構建的模型有較高的精確度,可用于預測未來事故征候分析。對2020年整年飛行事故萬時率進行預測,預測結果如表6所示。

表5 2011年萬時率的預測結果

表6 2020年萬時率的預測結果
(1)X-12季節調整法分析了2008-2018年飛行事故萬時率的時間序列,深入分析了萬時率時間序列分解的趨勢分量、季節周期分量。可知,2008-2018年飛行事故征候萬時率的時間序列存在明顯的季節性和趨勢性。第一,以一年為周期的季節性影響中,9月和5月波動值最大,12月和1月波動值最小。第二,飛行事故征候萬時率時間序列數據在2008-2013年呈上升趨勢,2013年為峰值,2014-2018年呈平穩趨勢。
(2)預測了飛行事故征候萬時率。分別通過ARIMA模型預測了月度飛行事故征候萬時率的趨勢分量時間序列,SPSS專家建模預測了季節周期分量及隨機分量時間序列,并通過2011年預測模型結果與真實萬時率的精度對比,驗證了該預測模型的有效性,實現了對我國民航月度事故征候萬時率的預測。
通過對事故征候的規律性分析,從結果的準確性來看,可以將X-12季節調整乘法模型和ARIMA預測趨勢模型運用于實際的飛行事故征候統計分析。將季節性規律和周期性規律用于指導民航事故征候的預防工作,達到科學預防民航飛行事故和事故征候的目的。