


【摘 要】 針對上證50指數的日收盤價格,選取2017年4月20日至2018年4月13日共240個交易日的收盤價格數據,使用R統計軟件建立 ARMA 模型,得到與實際數據高度吻合的ARIMA(1,1,5)模型,并對未來5天日收盤價格進行預測,結果表明預測模型達到比較理想的精度和效果。
【關鍵詞】 上證50指數;ARIMA模型;預測
一、引言
目前,股票投資成為許多人理財的方式之一,也有許多的學者投入到股市的分析與股價的預測中[1]。上證50指數是根據科學客觀的方法,挑選上海證券市場規模大、流動性好的最具代表性的50 只股票組成樣本股,以便綜合反映上海證券市場最具市場影響力的一批龍頭企業的整體狀況。故研究上證50指數對中國股市的行情具有指引作用。本文運用ARIMA模型對上證50指數的收盤價格進行建模分析,期望從中獲取有用信息來預測將來走勢。
二、模型簡介
ARMA(p,d,q)模型是一種常用的時間序列分析模型,通常被用來對非平穩時間序列進行分析[2],通過差分的方法使得差分序列變得平穩,接著在用ARMA(p,q)進行擬合建模。基本步驟為:
(1)先用觀察時序圖和單位根檢驗的方法對原序列進行平穩性檢驗,若序列是不平穩的,則用差分法對其進行平穩化處理,d等于所進行差分的次數。
(2)接著進行相關性檢驗,通過觀察序列的自相關圖和偏自相關圖的拖尾、截尾的狀態對模型進行初步識別。
(3)模型的定階,根據第2步的相關系數再結合赤池信息準則(AIC)來確定模型的p和q以建立ARMA(p,d,q)模型。
(4)模型診斷,對模型的殘差進行白噪聲檢驗,如果是白噪聲,表明信息已經被提取完畢。若不是白噪聲序列,就表示模型沒有把殘差中的信息完全提取出來,需重新選擇模型[3]。
三、實證分析
(一)數據來源
本文選擇上證50指數作為研究對象,選取2017年4月20日至2018年4月13日的收盤價格作為訓練集用R統計軟件來建立時間序列模型,文中所用的上證50指數數據來源于搜狐證券網[4]。
(二)模型的識別與建立
先用R軟件對原始序列進行單位根檢驗, 發現單位根結果對應的P值為0.966遠大于0.05,故認為收盤價格是非平穩的。對收盤價格序列進行一階差分后發現差分后序列的單位根檢驗的P值為0.01,故認為一階差分序列已經平穩。
接著觀察圖1差分序列的自相關圖和偏自相關圖。自相關函數和偏自相關函數均呈拖尾狀,故可以采用ARIMA(p,1,q)進行擬合。接著采用赤池信息準則(AIC)最小原則對模型進行不斷篩選,以得到最優模型,結果如下表所示。
通過表1發現,最優模型是ARIMA(1,1,5)。然后對模型的殘差序列進行白噪聲檢驗,檢驗結果發現殘差的自相關系數0階截尾,這表示殘差不存在自相關。Ljung-Box檢驗對應的P值遠大于0.05,表明信息已被完全提取,故ARIMA(1,1,5)通過模型檢驗。運用模型對接下來5天的收盤價格進行預測,預測結果如下表所示。
從表2中可以看出,相對誤差普遍較小,這意味模型總體上還是比較不錯的預測了收盤價的短期波動情況,說明使用時間序列模型對上證50指數收盤價進行短期預測是比較合理的。
四、結論
股票價格預測是一個充滿挑戰性的問題,但時間序列預測理論一直被認為是對股價變化進行統計預測的有效手段。本文對上證50指數歷史收盤價格進行了建模分析,并對未來幾期價格進行短期的預測驗證了模型的合理性。希望能夠幫助投資者進行股票投資提供參考和降低投資風險。
【參考文獻】
[1] 陳小玲.基于ARIMA模型與神經網絡模型的股價預測[J],經濟數學,2017,34(4).
[2] 范劍青,姚琦偉. 非線性時間序列—建模、預報及應用[M],北京:高等教育出版社,2005.
[3] 李波,朱恩文,馮倩.基于時間序列的長沙PM2.5的統計分析[J],經濟數學,2017,34(1),105-110.
[4] 搜狐證券網[EB/OL], http://q.stock.sohu.com/.
作者簡介:趙耀虎(1995-) 男,漢族,湖南湘潭人,遼寧大學經濟學院,2017級碩士研究生,應用統計學專業