馮慧嬌
【摘 要】 本文首先對時間序列主要特征和時間序列分析步驟進行介紹,然后在平穩時間序列建模的基礎上對非平穩時間序列的建模進行了分析。在分析的過程中將非平穩時間序列的建模分為基于確定性分析的建模和基于隨機性分析的建模兩大類,并對此進行了比較。最后本文運用 2013年 1月至 2017年 12月我國的民航客運量數據,基于 R 軟件進行分析,通過 ARIMA 模型、季節效應分析和 Holt-Winters 模型分別對我國的民航客運量數據進行擬合。最后經過模型比較選擇了Holt-Winters模型,并預測了我國2018年12個月的民航客運量。
【關鍵詞】 時間序列 民航客運量 季節效應分析
ARIMA模型 R軟件
第1章 緒 論
我國航空運輸需求量增長的主要因素首先是經濟總量擴張;其次對航空運輸影響最大的是結構因素;再次,國際貿易也是航空運輸需求的重要帶動因素。我國全球進出口貿易總額不斷增加,且城鎮居民消費有溫飽型轉向享受型發展型,都對我國旅游支出、民航發展提供了極具前景的良好的發展空間。所以在這種情況下,對我國民航客運量進行分析預測,對于民航業的發展具有重要的意義。
第2章 時間序列分析基本方法
2.1平穩性檢驗
時間序列法的核心是對數據進行平穩性檢驗。一般有兩種方法來檢驗序列的平穩性。其中一種是比較直觀的圖檢驗法,由時序圖和自相關圖的特征做出判斷,另外一種是具有理論依據的假設檢驗的方法,手段是構造合適的檢驗統計量。
2.2非平穩時間序列的確定性分析
2.2.1確定性因素分解
任意一個時間序列分析都可分解為由多項式決定的確定性趨勢分析和由平穩的零均值誤差成分。對于平穩序列,這兩種影響對序列的作用都是穩定的,而非平穩序列所受到的兩種影響至少有一種是不穩定的,這也是非平穩序列產生的機理。
2.2.2趨勢分析
一、指數平滑法
1、簡單指數平滑
適用于非季節性變動,處于恒定水平、沒有明顯趨勢的時間序列,可對其進行短期預測。
2、Holt兩參數指數平滑
適用于對含有線性趨勢、無季節性的序列進行修勻。適用于對含有線性趨勢、無季節性的序列進行修勻。基本思想是假定序列有每期遞增或遞減的固定趨勢趨勢變動值,則第前一期的觀察值加上每期固定的趨勢變動值就應該等于該期的估計值。
3、HW指數平滑
此模型為指數平滑方法的一種,包括想加模型以及相乘模型。主要適用于有增長或降低趨勢、季節性變化的時間序列。
二、季節效應分析
具有季節效應的時間序列的特點是事件呈現出了固定周期性變動。具體步驟分為三步:計算周期內的各期平均數;計算總平均數;季節指數等于時期平均數除以總平均數。
季節指數比值比1大,表示高于平均值,比值比1小,表示低于平均值,若都等于1表示序列無明顯的季節效應。
2.3非平穩時間序列的隨機性分析
2.3.1差分運算
對于觀察值序列,無論選取的是確定性還是隨機性的方法,都首先需要進行的是將序列中的確定性信息采用有效的手段提取出來。提取確定性信息的方法是差分運算的實質。
若序列蘊含固定周期,若想要比較好的提取周期信息,一般采用進行步長為周期長度的差分運算。
2.3.2求和自回歸移動平均模型
許多非平穩序列差分后會顯示出平穩序列的性質。這說明任何非平穩序列若能通過有效手段使序列平穩化,可以對處理后的序列進行模型擬合,而這個有效的手段就是上文介紹的適當階數的差分運算。
第3章 基于時間序列的民航客運量分析
3.1民航客運量數據
2013年1月到2017年12月民航客運量人數(萬人),數據來源于中國統計年鑒。
3.2指數平滑法模型的建立
分別為采用三種平滑法的樣本內實際值與樣本內預測值的擬合效果。從圖中很難看出哪一種模型更適合對原始時間序列的擬合。
可以通過比較樣本內誤差的誤差平方和來進行模型的取舍。由三種模型的樣本內預測誤差的誤差平方和可以得出HW >平滑簡單指數平滑>Holt兩參數指數平滑,可見HW指數平滑模型要比簡單指數平滑模型、霍特雙參數指數模型的精度都要高。因此,本文在指數平滑法里選擇H-W模型進行分析預測。通過STL分解進行進一步的驗證,第一行為原始數據、第二行為季節成分、第三行為趨勢成分以及第四行的剩余誤差成分。我們可以發現是季節項影響、趨勢項影響是影響序列的主要因素,剩余誤差部分是非隨機的波動,由于其影響很小無法用模型來描述,模型擬合時可以忽略。該模型非常成功的預測了季節峰值,其峰值大約發生在每年8月份左右。
Stl分解擬合結果中,意味著當期預測值基于平衡了最近和較遠期的觀測值。為0表明趨勢項影響因素在整個時間序列上不變,也就是初始值,這與我們的直觀感受是相符的,民航客運量的趨勢部分斜率基本是不變的,水平改變則比較多。
3.3季節效應分析
時間序列的分解即估計出趨勢、季節和不規則部分。R中可將時間序列的趨勢部分季節部分估計出來,同時還可以估計出時間序列的不規則部分。本文選擇相乘模型進行分析,首先提取模型中的趨勢項影響因素,再使用線性模型進行擬合。
模型診斷得回歸模型擬合效果一般,殘差在0值附近波動較大,且不服從正態分布,殘差出現了明顯的自相關性。優化解決方法就是在季節效應分析時針對季節性影響提取出序列的季節因子,將季節因子與線性擬合的趨勢項預測數據相乘就可以得到預測值。因此,可以通過提取出季節因子的方法得到季節指數sea。
8月份的季節指數最大,說明8月份是民航客運量最大的月的,12月份的季節指數最小,說明12月份的民航客運量最小。與原始序列所觀察結果十分符合,所以可以認為提取出季節因子的模型能夠很好對民航客運量進行擬合預測。
3.4ARIMA模型建立
由差分運算的實質可知提取確定性信息的方法可以采用差分運算,我們可以通過1階差分來提取趨勢的影響;可以通過2階或3階差分來提取曲線趨勢的影響;提取周期性信息時則可以通過歩長為周期的差分運算來實現平穩性。通過差分使非平穩序列顯示平穩性的差分后平穩序列,是可以用ARIMA模型來擬合的差分平穩序列。
本文進行時間序列的分析主要是通過R軟件來實現的,首先通過R軟件作出民航客運量原始數據的時間序列圖,可根據觀察時間序列圖中民航客運量呈現出的遞增的趨勢性來初步判斷序列是不平穩的。同時還可以發現序列的季節因素很明顯,每一年份的民航客運量變動都是有規律的。因此為了是序列平穩化,我們可以嘗試對數據做差分,通過使差分之后的序列平穩,進行ARIMA模型的擬合。
1階差分之后的序列可能已經平穩了。為了驗證我們的判斷是否正確,對差分之后的序列進行檢驗。
本文判斷序列平穩的手段是單位根檢驗。在R中ADF的檢驗里,得到1階差分以后的序列的P值為0.01,就可以認為拒絕不平穩的零假設,說明1階差分后的序列平穩。可用R來進行模型的定階與取舍。根據AIC準則應該優先考慮AIC值較小的模型,所以最優模型階數為為 (1,1,1) ,模型的信息赤函池準則數值為AIC,BIC均為最小的。接下來對該模型進行估計診斷,采用LB統計量來檢驗模型的殘差是否為白噪聲。
由P值顯著大于顯著性水平=0.05,因此可以判斷殘差序列為白噪聲序列。此ARIMA模型擬合效果較好 。
3.5民航客運量預測及模型比較
兩模型都可得出相應的預測區間,而季節效應分析無法得知預測的精度,所以優先選擇前兩個對原始序列進行擬合。
可根據模型的預測誤差來進行模型的取舍。由預測誤差的時間曲線圖看出后者的預測誤差值相對較小。
由預測誤差的直方圖可以看出第二個模型的預測誤差符合正態分布。綜上所訴,發現第二個模型能夠好的對未來值作出預測,因此最終選擇H-W進行預測。
2018年民航客運量每月份的預測值如下: