摘 要:對汽車銷量時間序列的預測方法進行了研究,針對汽車銷量影響因素表現出的多樣性,應用灰色關聯分析法對其進行篩選。針對汽車銷量時間序列表現出的線性特征和環境動態變化導致的非線性規律,單一的線性預測方法和非線性預測方法都無法滿足時間序列的預測要求。提出了一種SARIMA-BP神經網絡預測方法,利用SARIMA方法對時間序列的線性部分進行建模,利用BP神經網絡方法對時間序列的非線性部分進行建模。仿真結果表明,SARIMA-BP神經網絡方法比單一模型的預測準確率更高。
關鍵詞:時間序列 灰色關聯分析法 SARIMA-BP神經網絡方法
中圖分類號:F714 文獻標識碼:A 文章編號:2096-0298(2017)08(a)-170-03
隨著經濟供給側改革力度的持續加大和宏觀政策效應的不斷釋放,汽車銷量逐年穩步增高。 如何根據市場需求來準確預測汽車銷量成為當前中國汽車產業經濟的研究熱點。
當前應用于汽車銷量的預測方法歸納起來主要有兩類:(1)單模型預測,如BP神經網絡、SARIMA方法、灰色模型等;(2)基于融合模型的預測,如神經網絡和粒子群算法的融合、主成分分析和神經網絡的融合等。張健[1]利用SARIMA模型提取了通貨膨脹中的月度頻率波動特征,有效降低了預測誤差。針對GDP表現出的季節性波動,趙喜倉和周作杰應用SARIMA方法建立季節時間序列模型,提高了預測準確性[2]。SARIMA方法在樣本數據特征提取、序列周期波動抑制、季節性干擾消除等方面得到了廣泛應用[3]。但由于其本質為線性控制,不能較好的擬合數據中的非線性的特征。神經網絡控制不依賴所建的模型精度,具有較強的自學習能力和任意非線性函數逼近能力,能較好的抑制環境干擾和非線性引起的誤差。曾納等人利用BP神經網絡模型對草地生物量信息和分布格局進行模擬和空間估算,仿真結果與實測值擬合度較高[4]。皮進修等人提出了一種基于SARIMA-GMDH組合預測方法[5],應用該方法對我國CPI月度序列進行預測,結果表明對具備優勢互補的兩種單一模型進行有效組合,大大提高了預測的誤差。
針對汽車銷量數據中包含的線性特征和非線性特征,本文提出了一種基于SARIMA-BP神經網絡的預測方法,利用BP神經網絡自學習能力強的特征實現對非線性動態變化的自適應調控,通過神經網絡的非線性函數逼近和收斂優勢保證了預測的精度和穩定性。
1 汽車銷量影響因素的選取
當前影響汽車銷量的因素[6]歸納起來大體有以下幾種:(1)社會因素,如人均可支配收入、道路基礎設施建設;(2)國家政策,如購置稅補貼、限購政策等;(3)價格因素,如燃油價格、汽車售價等;(4)技術因素,如汽車用料質量、制造工藝等。
灰色關聯分析法[7]主要通過對系統特征序列進行數據分析,得出相關因素的曲線形狀相似度,依據灰色關聯度的大小判斷因素的影響程度。針對汽車銷量影響因素呈現出多樣化且關聯性較強的特點,應用灰色關聯分析法對其進行篩選。
汽車銷量序列為,影響因素的特征序列為,汽車銷量與影響因素的灰色關聯度計算步驟為:

SARIMA模型的構建與預測步驟為:(1) 通過季節差分變化將季節性時間序列轉化為穩定序列,滿足模型的平穩觀測要求;(2)提取穩定序列的趨勢特征,采用AIC或SBC方法來確定模型的階數();(3)參數的估算(有效值、標準誤差和統計值)和顯著性檢驗(白噪聲值);(4)序列未來值的預估。
2.2 BP神經網絡模型
BP神經網絡是一種基于神經單元的多層前饋網絡,包含輸入層、輸出層和隱含層,其核心是逆向傳播學習過程(輸入信號的正向傳播和輸出信號的反向傳播)。BP神經網絡原理采用梯度下降法調整權值并更新網絡,使誤差函數滿足迭代要求,完成對樣本數據的訓練和學習過程。結合汽車銷量選取的6個汽車銷量影響因素,建立的BP神經網絡模型如圖1所示。
BP神經網絡模型中,定義各層神經元節點為節點數分別為、、,即輸入層輸入為,隱含層神經元輸入為,輸出為,輸出層神經元輸入為,輸出為,其表達式分別為:


3 模型比較與結果分析
以2014年~2016年度的汽車月銷量構成時間序列,共計36組實驗樣本。隨機從樣本數據中篩選出30組數據,分別使用SARIMA模型、BP神經網絡模型對其進行模擬。表1給出了實驗樣本數據(單位:萬輛),圖2給出了各模型對采用數據的預測效果。
由圖2可知,SARIMA模型和BP神經網絡模型對樣本數據的預測值整體高于樣本實際值,SARIMA模型預測精度比BP神經網絡模型高,這是由于SARIMA模型對帶有季節性的時間序列具有較高的辨識能力。SARIMA-BP神經網絡模型具備較高的樣本數據擬合能力,SARIMA模型和BP神經網絡模型對樣本數據的預測效果總體低于SARIMA-BP神經網絡模型。SARIMA模型、BP神經網絡模型和SARIMA-BP神經網絡模型的線性擬合度分別為0.9539、0.9527和0.9557,SARIMA-BP神經網絡方法的預測誤差最小。由表3可知,構建的預測方法的RMSE誤差、MAPE誤差和MAE誤差均大幅度低于SARIMA方法和BP神經網絡方法,證明所構建的SARIMA-BP神經網絡方法的預測效果較好。
4 結語
在汽車銷量預測中,由于汽車銷量時間序列表現出的影響因素多樣性、非線性和線性規律,本文通過灰色關聯分析法提取關聯度較高的銷量影響因素,融合SARIMA模型和BP神經網絡模型,提出一種SARIMA-BP神經網絡預測方法,應用該方法對汽車銷量時間序列數據進行建模及預測。試驗結果表明,所建模型比單一模型的預測準確率更高,驗證了所提出預測方法的可行性。
參考文獻
[1] 張健.SARIMA模型在預測中國CPI中的應用[J].統計與決策,2011(05).
[2] 趙喜倉,周作杰.基于SARIMA模型的我國季度GDP時間序列分析與預測[J].統計與決策,2010(22).
[3] 姜春雷,張樹清,張策,等.基于SARIMA-BP神經網絡組合方法的MODIS葉面積指數時間序列建模與預測[J].光譜學與光譜分析,2017(01).
[4] 曾納,任小麗,何洪林,等.基于神經網絡的三江源區草地地上生物量估算[J].環境科學研究,2017(01).
[5] 皮進修,趙清俊,彭建文.基于SARIMA-GMDH的CPI組合預測模型[J].統計與決策,2016(17).
[6] 尹小平,王艷秀.中國汽車銷量影響因素的實證分析[J].統計與決策,2011(08).
[7] 董少陽,夏清國,李寧.基于灰色關聯分析法的軟件缺陷類型預測[J].計算機工程與應用,2013(02).
[8] 楊峰,薛斌,劉劍. 基于非平穩時序ARIMA模型的W頻段雨衰預測[J].電子與信息學報,2015(10).
①基金項目:浙江省教育廳一般科研項目(Y201635219)。
作者簡介:范慶科(1991-),男,浙江江山人,助教,碩士,主要從事非線性控制方面的研究。