999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARIMA-RF組合模型的CPI預測

2023-09-14 13:23:16曾令麒
現代信息科技 2023年13期

摘? 要:居民消費價格指數(CPI)是一個重要的宏觀經濟變量,反映了國家的通貨膨脹水平、居民的消費水平和生活成本,它與國家、社會和個人有密切的聯系。基于Savitzky-Golay平滑濾波去噪后的2002年1月至2021年12月的CPI月度數據,構建ARIMA-RF組合模型,對CPI序列進行預測并與單一的ARIMA和RF模型進行比較。結果表明,ARIMA-RF組合模型的預測效果和穩定性均優于單一模型。

關鍵詞:CPI;Savitzky-Golay平滑濾波;ARIMA;隨機森林;ARIMA-RF

中圖分類號:TP391;TP18? 文獻標識碼:A? 文章編號:2096-4706(2023)13-0013-05

CPI Prediction Based on ARIMA-RF Combined Model

ZENG Lingqi

(School of Mathematical Sciences, South China Normal University, Guangzhou? 510631, China)

Abstract: Consumer price index (CPI) is an important macroeconomic variable, which reflects the inflation level of the country, the consumption level of residents and the cost of living. It is closely related to the country, society and individuals. Based on the monthly CPI data from January 2002 to December 2021 after Savitzky-Golay smooth filtering and denoising, an ARIMA-RF combined model is constructed to predict the CPI sequence and compare it with a single ARIMA and RF model. The results show that the prediction effect and stability of ARIMA-RF combined model are better than that of single model.

Keywords: CPI; Savitzky-Golay smooth filtering; ARIMA; random forest; ARIMA-RF

0? 引? 言

居民消費價格指數(CPI)是一個衡量消費者市場價格變動的定期測量指數,它綜合了不同商品和服務價格變動的平均水平,用于衡量消費者物價水平的變化情況,也在一定程度上反映了當前的通貨膨脹水平。由于CPI是基于收集的復雜金融數據而構成的,需要一定時間去收集、加工和處理數據,通常會出現延遲發布的情況[1]。而延遲發布會造成嚴重的信息流滯后,會對如企業高管、投資者和宏觀經濟政策制定者等需要實時監測經濟狀況并及時根據有關信息做出重大決定的人帶了嚴重的問題,因此在不能夠及時獲得CPI實際數據的情況下,對其合理的預測就顯得極其重要,所以建立一個合理、穩定、準確的模型來預測CPI,對于政府財政政策和貨幣政策的制定、企業經營決策、投資者決策以及居民消費決策都具有重要的現實意義。

近年來,國內外學者對CPI預測問題做了諸多的研究與探索,目前CPI預測方法主要有三類,分別是時間序列法、機器學習法和組合分析法。對于時間序列法,Mohamed和Weng[2,3]分別建立ARIMA(0,1,3)和ARIMA(12,1,12)模型對CPI進行預測,模型都通過了顯著性檢驗且預測效果較好;李紅娟[4]考慮到CPI的季節性,構建SAO-ARIMA-MA模型對CPI進行預測,其中使用X-11方法對季節進行分解,結果顯示季節因子序列有明顯的周期性,且利用此模型預測的效果優于普通的ARIMA模型。對于機器學習法,Zahara[5]等利用多層感知器和長短期記憶(LSTM)進行了基于云計算的多元CPI預測,實現了神經元數量、時代和隱藏層的架構變化,且模型運行速度快,結果符合實際;Qin[6]等采用遺傳算法調整支持向量機參數,建立基于遺傳算法-支持向量機(GA-SVM)的預測模型,該方法避免了人工選擇參數的盲目性,提高了模型的訓練速度和預測推廣速度,并且大大簡化了CPI的預測。對于組合分析法,吳曉峰[7]等建立了ARIMA-BP組合模型對北京市CPI進行預測,ARIMA模型提取序列的線性規律,BP神經網絡對ARIMA模型產生的殘差進行預測,以提取序列非線性規律,得到了精度高且穩定的結果;尹靜等[8]將ARIMA模型和GMDH模型預測的CPI作為初始值,重新輸入到GMDH模型中進行預測,以此構建ARIMA-GMDH組合模型,Bonferroni-Dunn檢驗結果顯示該模型的抗干擾性較強。

目前較少學者使用隨機森林(RF)回歸算法對CPI進行預測,本文基于2002年1月—2021年12月的CPI序列數據,分別利用ARIMA模型、RF模型和基于殘差優化的ARIMA-RF組合模型預測CPI,通過綜合比較三個模型預測的絕對誤差、相對誤差、MAE、MAPE、MSE、RMSE,ARIMA-RF組合模型的預測效果和穩定性優于單一模型。

1? 理論基礎

1.1? ARIMA模型

自回歸移動平均模型(ARIMA)是Box和Jenkin等人提出的用于時間序列預測的方法,也稱B-J方法。ARIMA模型是ARMA模型和差分運算結合而成的,ARMA模型可以較好地擬合平穩序列。若原始序列非平穩,則常常對原始序列進行d階差分提取其蘊涵的確定性信息,以將其轉化為平穩時間序列,進而對d階差分后的序列建立ARMA模型擬合。上述過程即為ARIMA模型建立過程,ARIMA(p,d,q)結構如下:

1.2? RF模型

隨機森林(RF)模型是以決策樹為基學習器構建的bagging集成機器學習算法,在決策樹的訓練過程中引入隨機選擇,常用于處理分類、回歸等問題[9],本文使用RF回歸算法對CPI序列數據進行建模。

RF回歸首先使用Bootstrap重抽樣方法在數據集進行有放回的隨機抽取n個樣本,重復K此這種抽樣方式,進而得到K個訓練樣本集合,同時將K次抽樣中未被抽到的樣本組成K個袋外數據(OBB),以生成K個測試樣本集。進而可以使用K個訓練樣本集合構建回歸樹,以所有回歸樹的預測均值作為最終的預測值。下面介紹回歸決策樹生成原理[10]。

回歸樹會遍歷給定樣本數據的所有特征,對每個特征的取值進行劃分,對劃分后的數據計算損失函數,直到找到最小損失值的劃分,計算公式如下:

其中j、s分別為切分變量和切分點,c1、c2為劃分后兩個結點的輸出值,R1、R2為劃分后形成的兩個區域。

繼續對兩個子區域進行上述步驟,直到滿足設置的停止條件,最終輸入空間被分為M個區域R1,R2,…,Rm,生成回歸樹:

最終一共生成K棵回歸樹,將這K棵回歸樹進行組合就可以構造隨機森林回歸模型,預測值可以用如下公式表示:

1.3? ARIMA-RF模型

CPI時間序列數據xt中既存在線性部分Lt和非線性部分Nt,因此可以表示成如下數學形式[11]:

單一的ARIMA模型僅能夠充分提取CPI序列數據的線性特征,而RF可以充分提取序列的非線性特征,因此將兩者結合理論上可以提高模型的預測效果,ARIMA-RF模型的建模步驟:

1)ARIMA建模。首先使用ARIMA模型對CPI序列數據進行擬合,提取出CPI序列的線性部分 ,那么殘差et可表示成如下形式:

2)RF建模。若ARIMA模型通過顯著性檢驗,說明CPI序列的線性部分已被充分提取,那么殘差中僅含有CPI序列的非線性部分,利用RF模型對殘差序列進行建模擬合。RF建模前需要將時間序列數據通過滑動窗口處理轉化為有監督學習的數據,本文將過去5個月的CPI數據作為特征進行RF建模,因此殘差序列擬合模型可表示成如下形式:

其中f為非線性部分,εt為隨機誤差。通過RF模型擬合殘差后,最終預測結果可以表示為:

圖1為ARIMA-RF模型建模流程。

1.4? 評價指標

本文主要采用四個指標來評估模型預測效果,分別是平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方誤差(MSE)、均方根誤差(RMSE),他們的計算公式如下:

MAE反映了預測值與實際值的相似程度,MAPE反映了預測值與實際值相似程度的百分比,MSE和RMSE則反映了預測值與實際值之間的總體偏差。這些評價指標都是數值越小,模型的預測效果越好,預測精度越高。

2? CPI預測

2.1? 數據說明

本文數據來源于choice金融終端數據庫。由于月度數據量大,較年度數據可以提供更加準確詳細的信息,因此本文選取2002年1月到2021年12月的數據,共計240條數據,無缺失值。該時間段的數據走勢,如圖2所示。

2.2? 數據去噪

宏觀經濟系統復雜多變,CPI的影響因素眾多,因此CPI數據通常會具有高噪聲的特點。為了清除不真實的和不重要的信號,以便準確地識別和預測CPI的未來趨勢,本文在建模預測之前先對原始CPI序列進行去噪處理,去噪方法選用Savitzky-Golay平滑濾波法,其核心思想是:在小窗口范圍內,使用多項式擬合方法來確定一個更平滑的窗口內數據曲線,然后用擬合出來的曲線來取代原始窗口內數據。它有助于去除噪聲并平滑數據中的不規則變化,使得序列趨勢更加清晰。

本文選取2002年1月到2021年6月的去噪后的CPI序列作為訓練集,2021年7月到2021年12月的CPI序列作為測試集。設置濾波窗口長度為5,平滑階數為3,繪制出去除噪聲后的2002年1月到2021年6月的CPI時間序列,如圖3所示,后文的實驗均基于去噪后的數據進行。

2.3? ARIMA模型預測

2.3.1? 平穩性檢驗和白噪聲檢驗

由圖3可以初步看出,CPI數據基本上在102上下波動,且無明顯的趨勢和周期性特征,可以初步判斷其為平穩序列。對2002年1月到2021年6月的CPI時間序列數據進行ADF單位根檢驗,結果顯示τ統計量的P值小于0.05,拒絕原假設,認為CPI序列是平穩的。因此不需要對序列進行差分運算,直接擬合ARMA模型。接著對序列進行白噪聲檢驗,結果顯示各階數延遲下LB統計量的P值均小于0.05,因此拒絕CPI序列為白噪聲的原假設,認為該序列為非白噪聲序列,具有研究的意義。

2.3.2? 模型識別和參數估計

繪制得到的平穩非白噪聲CPI序列的自相關函數圖(ACF)和偏自相關函數圖(PACF),結果如圖4所示。

由圖4可知CPI的自相關系數拖尾,而偏自相關系數無法準確地判斷其是拖尾還是截尾,因此嘗試擬合多個ARMA模型,結合AIC準則和BIC準則找出相對最優的模型。Python的statsmodels.api模塊中的sm.tsa.arma_order_select_ic()函數,可以快速找到使得AIC值和BIC值最小的模型,結果顯示兩個準則的最優模型均為ARMA(4,4)。進而使用極大似然估計得到ARMA(4,4)的模型口徑為:

xt = 102.135 - 0.287xt-1 + 0.166xt-2 + 0.594xt-3 + 0.336xt-4 + 2.423εt-1 + 3.273εt-2 + 2.277εt-3 + 0.860εt-4 + εt,εt?WN (0, 0.063)

2.3.3? 模型檢驗

模型檢驗主要是對殘差進行正態性檢驗和白噪聲檢驗,殘差正態性可由Q-Q圖判斷,殘差分位點基本分布在45度對角線上,表明殘差序列服從正態分布。計算得到延遲6階的LB統計量的P值大于0.1,因此可以認為殘差序列為白噪聲序列,表示擬合的模型顯著。

2.3.4? 預測分析

模型通過了檢驗后,先利用ARIMA(4,0,4)重新對2002年1月到2021年6月的CPI序列進行預測,擬合效果如圖5所示。

由圖5可知,ARIMA(4,0,4)擬合效果非常好,但是其預測能力需要進一步探討,下面利用ARIMA(4,0,4)模型對2021年7月到2021年12月的CPI數據進行預測,預測結果如表1所示。

由表1可知,除了2021年11月以外,其余月份預測值與實際值都非常接近,絕對誤差的絕對值都低于0.5,相對誤差的絕對值均低于0.5%,特別是2021年7月絕對誤差僅為0.002 7,相對誤差僅為0.002 7%,可以看出ARIMA(4,0,4)做一步預測的效果非常好,前六步預測的效果也較為優秀。計算各評價指標分別為:MAE為0.388,MAPE為0.459,MSE為0.267,RMSE為0.517。結合各評價指標含義可知模型總體預測效果較好,但是預測值并不穩定。

2.4? RF模型預測

使用Python的sklearn庫中的RandomForest

Regressor()函數直接構建隨機森林回歸模型,對2002年1月到2021年6月的CPI序列進行預測,擬合效果如圖6所示。

由圖6可知,RF擬合效果較好,但是結合圖5可知其擬合序列的效果比ARIMA(4,0,4)模型更差,下面對其預測能力進行探討,利用RF模型對2021年7月到2021年12月的CPI數據進行預測,預測結果如表2所示。

由表2可知,6個月份預測值與實際值都比較接近,絕對誤差的絕對值都低于1,相對誤差的絕對值均低于1%,可以看出RF模型做六步預測的效果還不錯。計算各評價指標分別為:MAE為0.504,MAPE為0.497,MSE為0.342,RMSE為0.585。所有評價指標都高于ARIMA(4,0,4)模型預測的結果,其中MAE較ARIMA(4,0,4)模型提高了0.116,因此在本文CPI的預測中,ARIMA(4,0,4)模型精度優于RF模型。

2.5? ARIMA-RF模型預測

根據前文可知,ARIMA(4,0,4)模型已經通過顯著性檢驗,說明殘差序列為白噪聲,ARIMA(4,0,4)模型已經將CPI序列數據中的線性相關性特征充分提取出來,因此殘差序列中僅存在非線性特征,利用RF模型對殘差序列進行建模預測,以充分提取其中的非線性相關信息。根據ARIMA(4,0,4)模型和RF模型預測殘差的結果,利用式(1)得到最終預測結果如表3所示。

由表3可知,6個月份預測值與實際值都非常接近,除了2021年11月以外,其余預測結果絕對誤差的絕對值都低于0.5,相對誤差的絕對值都低于0.5%,可以看出ARIMA-RF模型做六步預測的效果非常好。計算各評價指標分別為:MAE為0.372,MAPE為0.366,MSE為0.240,RMSE為0.490。所有評價指標都低于ARIMA(4,0,4)模型和RF模型預測的結果,尤其是MAPE,較ARIMA(4,0,4)模型降低0.093,較RF模型降低0.131。因此在本文CPI的預測中,ARIMA-RF模型精度優于ARIMA(4,0,4)模型和RF模型。

3? 結? 論

CPI會影響消費者價格水平、金融利率、企業的投資與經營和國家宏觀政策的制定等,與國家、企業和個人都有很大的關聯。因此,準確地預測CPI對國家制定經濟政策、企業調整經營管理活動和居民調整消費等都是十分重要的。本文首先使用Savitzky-Golay平滑濾波法對CPI序列進行處理,使得序列數據更加平滑,趨勢更加清晰,序列預測的準確度更高。進而運用ARIMA模型和RF模型分別對CPI預測,預測效果均較好,且ARIMA模型效果好于RF模型。由于CPI序列數據具有線性和非線性兩種特征,傳統ARIMA模型可以充分提取時間序列數據的線性特征,隨機森林(RF)模型可以提取殘差序列中的非線性特征,將二者結合可以實現互補,以此構造優化殘差的ARIMA-RF組合模型,結果顯示使用該組合模型預測CPI的精度和穩定性比單一模型更好。

參考文獻:

[1] 唐孝銀.基于因子分析和機器學習算法的通貨膨脹預測 [D].重慶:西南大學,2022.

[2] MOHAMED J. Time Series Modeling and Forecasting of Somaliland Consumer Price Index:A Comparison of ARIMA and Regression with ARIMA Errors [J].American Journal of Theoretical and Applied Statistics,2020,9(4):143-153.

[3] WENG D D. The Consumer Price Index Forecast Based on ARIMA Model [C]//2010 WASE International Conference on Information Engineering.Beidai:IEEE,2010:307-310.

[4] 李紅娟,盧天哲,祝漢燦.國房景氣指數對CPI和CCI影響及CPI預測模型研究 [J].數學的實踐與認識,2022,52(8):70-77.

[5] ZAHARA S,SUGIANTO. Multivariate Time Series Forecasting Based Cloud Computing For Consumer Price Index Using Deep Learning Algorithms [C]//2020 3rd International Seminar on Research of Information Technology and Intelligent Systems (ISRITI).Yogyakarta:IEEE,2020:338-343.

[6] QIN F H,MA T R,WANG J H,et al. The CPI forecast based on GA-SVM [C]//2010 International Conference on Information,Networking and Automation (ICINA).Kunming:IEEE,2010:142-147.

[7] 吳曉峰,楊穎梅,陳垚彤.基于BP神經網絡誤差校正的ARIMA組合預測模型 [J].統計與決策,2019,35(15):65-68.

[8] 尹靜,何躍.基于ARIMA-GMDH的GDP預測模型 [J].統計與決策,2011(5):35-37.

[9] 李欣海.隨機森林模型在分類與回歸分析中的應用 [J].應用昆蟲學報,2013,50(4):1190-1197.

[10] 周志華.機器學習 [M].北京:清華大學出版社,2016.

[11] 苗元鑫.基于機器學習和組合模型的匯率預測研究 [D].濟南:山東大學,2022.

作者簡介:曾令麒(2003—),男,漢族,湖南衡陽人,本科在讀,研究方向:應用統計學。

收稿日期:2023-02-09

主站蜘蛛池模板: 毛片基地视频| 最新亚洲人成无码网站欣赏网| 国产精品亚洲一区二区三区在线观看| 国产麻豆永久视频| 在线观看亚洲天堂| 精品国产自| 亚洲色图另类| 找国产毛片看| 中文字幕久久亚洲一区| 欧美一级在线看| 中文字幕无码中文字幕有码在线 | 国产69囗曝护士吞精在线视频| 国产理论最新国产精品视频| 亚洲天堂视频网| 欧美在线国产| 国产免费久久精品99re丫丫一| 免费观看成人久久网免费观看| 婷婷综合色| 国产第一页免费浮力影院| 亚洲国产欧洲精品路线久久| 国产美女一级毛片| 狼友视频一区二区三区| 久久综合国产乱子免费| 精品视频免费在线| 久久黄色一级视频| 中文字幕永久在线看| 亚洲国产亚综合在线区| 国产成人乱无码视频| 一本大道香蕉久中文在线播放| 国产特级毛片| 又爽又大又光又色的午夜视频| 国产成人狂喷潮在线观看2345| 国产综合网站| 91麻豆精品视频| 久久美女精品国产精品亚洲| 亚洲精品国产首次亮相| 成人福利免费在线观看| 国产亚洲欧美在线中文bt天堂| 久久一色本道亚洲| 四虎影院国产| 在线观看国产精品第一区免费 | 日本人真淫视频一区二区三区| jizz国产视频| 欧美a在线看| 夜夜操天天摸| 国产精品手机视频| 3p叠罗汉国产精品久久| 欧美在线网| 国内熟女少妇一线天| 最新无码专区超级碰碰碰| 国产迷奸在线看| 伊人91视频| 日本在线亚洲| 成人中文字幕在线| 亚洲激情99| 成人欧美在线观看| 免费一级α片在线观看| 一级做a爰片久久免费| 青青久视频| 国产成人精品2021欧美日韩| 色欲色欲久久综合网| 亚洲欧美在线综合图区| 91色在线视频| 亚洲天堂视频在线播放| 成人无码一区二区三区视频在线观看| 毛片久久久| 婷婷色狠狠干| 999国内精品久久免费视频| 超碰精品无码一区二区| 国产在线一区视频| 91丝袜美腿高跟国产极品老师| 夜精品a一区二区三区| 成人福利在线免费观看| 五月天久久综合国产一区二区| 一级片一区| 色综合日本| 久久精品人人做人人爽97| 国禁国产you女视频网站| 国产亚洲精品97在线观看| 久久精品国产免费观看频道| 午夜电影在线观看国产1区| 精品国产毛片|