王書平,朱艷云
(北方工業大學經濟管理學院,北京 100144)
?
基于多尺度分析的小麥價格預測研究
王書平,朱艷云
(北方工業大學經濟管理學院,北京 100144)
本文基于分解-重構-集成的思想,構建了一個多尺度組合預測模型,選取小麥作為糧食的代表,預測其價格走勢。首先,運用集合經驗模態分解方法(EEMD)分解價格序列,然后,用灰色關聯分析方法對分量序列進行重構,重構為高頻、中頻、低頻和趨勢項四個部分,并從不規則因素、季節因素、重大事件和世界經濟水平等方面對這四個部分波動特點進行解釋,針對不同特點的分量選擇不同的方法進行預測,最后對各預測結果用支持向量機集成,并與其他預測模型的預測結果進行比較。實證結果表明,本文構建的多尺度組合模型的預測效果優于灰色預測GM(1,1)、BP神經網絡、SVM方法、ARIMA模型等單模型方法和ARIMA-SVM組合模型以及基于EMD和EEMD分解的其他多尺度組合模型。
多尺度模型;集合經驗模態分解;灰色關聯度;神經網絡;支持向量機
在過去的10年,中國實現糧食產量的連續增長,但卻面臨著“產不足需”的現況,而且缺口日益增大,造成了我國糧食進口數量和比例不斷上升。與此同時,國際糧食價格劇烈波動,整體大幅走高,中國卻缺乏國際糧食定價的話語權,只能被動接受大幅增長的國際糧價,這直接影響了國家的糧食安全和經濟安全。因此,對糧食價格的波動特征進行比較準確的分析以及對未來的價格走勢做出準確預判,對國家政策的制定、企業進口時機的選擇以及農戶糧食生產的安排都是相當重要的。
糧食價格預測的方法,大體分為單模型方法和組合預測方法。其中單模型方法主要包括定性方法、時間序列方法、回歸分析以及數理方法等,由于單模型的方法單一,不能很好地抓住價格序列波動的復雜特性,因此組合預測方法成為糧價預測的重要方法。1969年,Bates和Granger[1]首次發表了有關組合預測的文章。1995年,Krogh和Vedelsby[2]證明了這樣一個思想:當構成組合預測模型的單獨模型足夠多樣化并且各單模型用得足夠精確的時候,組合預測模型一定能夠比單獨采用某個模型取得更好的預測效果。Antoniadis和Sapatinas[3]提出將小波分析方法和Hilbert自回歸隨機過程結合起來的組合預測模型;Kazem等[4]認為常規的ARIMA模型在預測非線性和非穩定的市場數據時精度不高,因此構建了基于混沌映射、Firefly算法以及支持向量回歸(SVR)的組合預測模型,實證結果表明,該組合模型比人工神經網絡和基于遺傳算法的支持向量回歸的預測精度要高。國內的專家學者在組合預測模型方面也作了很多研究,取得了一定的成果。例如,汪壽陽等[5-6]將文本挖掘技術、計量經濟模型和人工神經網絡進行綜合集成,提出了一個新的組合預測方法——TEI@I方法,并用于國際大宗商品價格的預測,取得了較好的效果;陳華友等[7-8]對組合預測權重問題進行了研究,給出了一些計算權重的方法;劉軼芳等[9]提出了GARCH-EWMA期貨價格預測模型并用于大豆類期貨交易價格的預測;陳兆榮等[10]基于ARIMA-SVM組合模型對農產品進行價格預測,結果表明組合模型的預測精度優于單模型。
由于糧食等大宗商品的價格序列一般具有非線性、非平穩性和多尺度(即多個頻率)等特征,為克服單模型和一般組合模型在預測方面存在的不足,近年來,一些學者開始利用一些多尺度分解方法(如傅里葉變換、小波分析和經驗模態分解方法等)來分析大宗商品價格的波動。這些分解方法在處理非平穩的數據上具有比較好的時域和頻域的分辨率,它們能夠將非平穩的價格序列分解為頻率特征不一致但相對平穩的多個時間序列,并在此基礎上根據各項不同的波動特征和規律選擇不同預測方法進行預測,以此建立多尺度組合模型。Bjorn[11]認為小波變換是一種非常好的多尺度分解工具,使用小波方法將時間序列分解成多個尺度,每個尺度單獨分析或者將幾個尺度組合分析,與一般的預測方法相比,這樣的預測效果更優,Edmundo等[12]運用小波分析去除高頻的價格變動,然后用隱馬爾科夫模型進行價格預測,曹霜和何玉成[13]構建了基于小波分解的SVM-ARIMA農產品價格預測模型,效果優于傳統預測模型,但是小波分析的前提是給定基函數,其分解結果不具有自適應性。經驗模態分解(EMD)由Huang等[14]首次提出,它是一種自適應的時頻處理方法,特別適用于非線性非平穩信號的分析處理,余樂安等[15]運用EMD方法對商品價格序列進行分解,然后用前置神經網絡對各分量進行預測,最后用自適應線性神經網絡進行集成,結果表明,基于分解、預測、集成的多尺度組合模型預測效果較好,預測優于一般的組合模型;王書平等[16]用EMD分解價格序列,提出了游程判定法重構分量序列,并分別采用Elman神經網絡、SVM和ARIMA方法對分解序列預測及集成,預測結果優于一般的單模型和組合模型,但是游程判定法只考慮了序列的頻率,沒有考慮到它們之間的相關關系,而且EMD分解不徹底,存在產生虛假分量和模態混疊的問題。Wu Zhaohua和Huang[17]提出改進的經驗模態分解(EEMD),它是一種噪聲輔助數據分析方法,引進了白噪聲擾動,然后對多次EMD分解的結果集合平均,避免了尺度的混合問題,使得最終分解的IMF保持了唯一性,能夠很有效地解決EMD的混頻現象在,這種分解方法現已運用在石油、銅等大宗商品的分析中。
多尺度組合模型的研究還處于初步發展階段,應用前景廣闊。關于該類模型的研究還存在以下幾個問題:一是分解后的子序列相對偏多,現有大部分文獻對子序列直接進行預測,預測工作量比較大,部分文獻雖然考慮到對子序列進行重構,但重構方法偏簡單,而且重構的項數是事先人為確定的,主觀性比較強;二是目前的多尺度組合模型基本上屬于“數據驅動建?!保纸獾淖有蛄袥]有太大的經濟含義,使得整個模型的經濟理論基礎比較單??;三是文獻中多尺度分解后的各子序列的預測方法是事先決定的,而且在大多數文獻中選擇方法比較單一。
本文選取小麥作為糧食的代表,運用集合經驗模態分解(EEMD)、灰色關聯度、神經網絡、SVM方法、時間序列分析等方法,基于分解-重構-集成的思想,構建一類多尺度組合預測模型,對小麥價格進行預測。在分量重構過程中,同時考慮分量的關聯度和波動頻率,并對重構項進行經濟解釋,使重構結果更加客觀,同時具有經濟意義。
2.1 多尺度組合模型構建的基本思想
一般來說,商品價格序列的波動具有非線性、非平穩性以及多尺度的特征,其中多尺度是指具有多個頻率,價格序列是由多個頻率波動疊加而成。單模型和一般組合模型的預測方法都不能很好地抓住數據波動的復雜規律,從而影響了預測的精度。為了研究價格數據中隱藏的規律,本文的思路是將原始數據分解成頻率不同的多個序列,分別分析每個序列的波動特征,然后選擇重構方法對子序列進行重構,這在減少預測工作量的同時賦予了重構序列一定的經濟含義,對多個重構序列分別進行預測,最后集成各預測結果,得到最終的預測值。采用正則均方誤差(NMSE)、平均絕對百分誤差(MAPE)以及Theil不相等系數(U)來衡量預測方法的預測精度;采用方向對稱值(DS)來衡量預測方法對價格走勢的預測能力。
2.2 多尺度組合模型構建的基本過程



式中,ρ為分辨系數,一般取0.5;求解絕對關聯度系數:

(3)運用不同的方法對不同的分項進行預測
根據重構項的不同尺度特征,選用神經網絡方法對高頻項y1(t)進行預測,選用SVM方法對中頻項y2(t)進行預測,選用時間序列對低頻項y3(t)進行預測,選用自回歸方程對趨勢項y4(t)進行預測。






圖1 多尺度組合預測模型構建示意圖
3.1 數據的收集整理以及預測的評價指標
本文選取1971年1月至2014年12月美國硬紅冬小麥的現貨價格月度數據進行研究,共528個數據,價格單位為:美元/蒲式耳。其中選取1971年1月至2012年12月的數據作為訓練集,共504個數據;選取2013年1月至2014年12月的數據作為測試集,共24個數據。
采用正則均方誤差(NMSE)、平均絕對百分誤差(MAPE)以及Theil不相等系數(U)來衡量預測方法的預測精度;采用方向對稱值(DS)來衡量預測方法對價格走勢的預測能力。這四個評價指標的計算公式分別如下:


對于一個預測方法,預測精度的三個指標NMSE、MAPE和U 值越小,而預測走勢的DS值越大,則說明預測效果越好。
3.2 小麥價格序列的分解與重構
對1971年1月至2012年12月的美國硬紅冬小麥的現貨價格進行EEMD分解,分解出8個本征模函數IMF分量和一個剩余分量R,分解結果如圖2所示。
IMF1至IMF8是頻率從高到低的8個本征模函數,R是剩余分量。根據EEMD分解原理可知,剩余分量R代表長期趨勢,因此把R單獨歸為趨勢項y4。然后計算各IMF之間的灰色關聯度,可以得到8個分量的關聯度系數結果如表1所示。
對8個本征模函數進行分類,既考慮到它們之間的關聯度系數,又考慮到它們自身的波動頻率,將關聯度系數高且波動頻率相近的歸為一項。

圖2 小麥價格的EEMD分解結果圖

表1 灰色關聯度系數表(綜合關聯度)

圖3 基于灰色關聯度系數的聚類
由圖3可以看出,在同時考慮關聯度和波動頻率的基礎上,本文的8個本征模函數可分為三類,IMF1、IMF2歸為一類,IMF3、IMF4和IMF5歸為一類,IMF6、IMF7和IMF8歸為一類。因此,本文將8個本征模函數重構成高中低頻三個序列,其中IMF1和IMF2疊加為高頻序列y1,IMF3、IMF4和IMF5疊加為中頻序列y2,、IMF6、IMF7和IMF8疊加為低頻序列y3。
根據灰色關聯分析重構后的高頻項、中頻項、低頻項和長期趨勢項這四個序列和小麥價格序列的走勢圖如圖4所示。

圖4 小麥價格序列和重構后的四個分量走勢圖
重構后的高頻項、中頻項、低頻項和趨勢項的頻率和振幅不相同,通過計算這四個序列的周期和方差貢獻率來觀察這四個序列的特點。周期是利用每個序列的數據個數除以極值點個數求得,代表每個序列的波動周期;方差貢獻率是通過計算每個序列的方差所占原數據總體方差的比率,即Ai=ξi/ξ,ξi為第i序列的方差,ξ為小麥價格序列的方差。這四項的統計結果如表2所示。

表2 各分項周期和方差貢獻率
由圖4和表2可以看出,高、中、低頻以及趨勢項都具有明顯的波動特征,對此,本文對各項特點作進一步的分析:
高頻項的周期為4.42個月,其方差貢獻率為4.29%。這可以看作是季節因素的影響,一般經濟時間序列比較容易受季節因素影響,而季節因素主要是從供給和需求兩方面影響經濟數據,尤其是小麥等糧食作物的供給,其受到季節因素的影響更為明顯。同時高頻項也包含了一些投機因素、心理因素等不規則因素對小麥價格的影響。
中頻項的周期為26.52個月,方差貢獻率為33.34%,這說明中頻項是小麥價格重要組成部分。從圖4可以看出,中頻項的波動趨勢與小麥價格的波動基本保持了一致,而且中頻部分的每個劇烈波動點都對應著影響小麥價格波動的重大事件。例如,1972年下半年(圖中25點)開始,小麥價格持續攀升,主要原因有連續的惡劣氣候和自然災害導致了小麥的歉收,同時前蘇聯改變“以肉抵糧”的傳統做法,進入國際小麥市場大量夠買糧食,這些引起了糧食供求關系的緊張化;1995年(圖中290點)開始,中頻項的波動達到了小高峰,這主要是因為烏拉圭回合談判農業協議的影響,各國調整了農業政策,減少了價格支持和出口補貼,同時美國、歐盟等經濟復蘇和東亞、拉美等地區經濟的迅速發展拉動了小麥價格的上漲;2007年下半年(圖中440點),全球氣候變暖,主要的糧食生產國如澳大利亞、歐盟、美國等遭遇旱災,國際糧食供求的失衡,國際糧價迅速攀升。2008年下半年之后,世界糧食增產,美國強化對商品期貨市場的監管,“熱錢”流出商品期貨市場,糧價快速下跌。這說明,中頻項主要反映的是重大事件下的小麥價格波動,主要是中短期的走勢。
低頻項的周期為168個月,方差貢獻率為15.88%。低頻項可以看作是小麥價格波動的循環周期,這也是影響小麥價格波動的組成成分之一。
趨勢項基本呈直線上升態勢,不存在周期波動,其方差貢獻率達到了43.23%,這說明趨勢項是小麥價格的主要部分,是小麥價格長期走勢的關鍵因素。趨勢項的走勢與小麥價格基本保持一致,盡管在一些時候小麥價格因為某些因素的影響發生了波動,但是隨著影響的逐漸消失,小麥價格又回到趨勢項價格附近。一般來說,小麥價格的長期走勢是由世界經濟水平決定的。
3.3 小麥價格的預測與對比
根據多尺度組合模型的構建步驟,對于重構后的各序列分別采用BP神經網絡、SVM、ARIMA模型以及自回歸方程進行預測,然后最后運用SVM對各項預測結果進行集成得到最終的預測結果。各項預測的方法具體操作如下:

表3 小麥價格預測效果比較
(1)運用BP神經網絡對高頻序列y1(t)進行預測,首先將高頻數據歸一化到[0,1]區間,然后確定輸入層節點為4,輸出節點為1,隱含層神經元節點數為5。
(2)運用SVM對中頻序列y2(t)進行預測。首先將低頻數據歸一化到[0,1]區間,核函數選用最常用的RBF核函數,并通過交叉驗證法確定最優參數c=2.83,g=1.62,γ=3,ε=0.01。
(3)運用ARIMA模型對低頻序列y3(t)進行預測,根據平穩性及自相關性檢驗,選用ARIMA(2,1,2)模型。
(4)運用自回歸方程預測趨勢序列y4(t),其方程為y4(t)=c+αy4(t-1)。
(5)運用SVM集成方法對高頻、中頻、低頻以及趨勢序列的預測結果進行集成。將各項預測值作為輸入項,實際價格作為輸出項,建立函數映射關系。其中最優參數為c=0.5,g=2.83,γ=1,ε=0.05。
為驗證本文構建的多尺度組合模型的有效性,以2013年1月至2014年12月的小麥價格數據作為測試集,并與灰色預測GM(1,1)、BP神經網絡、SVM方法、ARIMA模型等單模型方法,ARIMA-SVM組合模型(文獻[10],[13]提出)以及基于EMD分解的組合模型以及基于EEMD分解的未重構以及運用游程判定法重構的組合模型進行比較。預測效果如表3所示。
從表3的預測結果可以看出,對于小麥價格的預測,從正則均方誤差(NMSE)、平均絕對百分比誤差(MAPE)、Theil不相等系數(U)和方向對稱值(DS)等評價指標看,GM(1,1)、BP神經網絡、SVM方法、ARIMA模型等單模型方法效果比較差,組合模型和基于EMD、EEMD分解的其他多尺度組合模型效果較好,尤其是基于多尺度分解的組合模型效果優于一般模型,本文構建的多尺度組合模型效果最優。盡管本文模型的NMSE指標稍低于基于EEMD分解的未重構組合模型,但是其他三個指標都優于未重構模型,而且本文的重構模型減少了預測的計算量,并且賦予了重構想經濟含義以及分析了各項的影響大小。本文構建的模型對小麥價格方向走勢的判斷效果最好,明顯優于其他模型。
糧食價格的預測是國際大宗商品市場研究的一個重要領域,本文選取小麥作為代表,提出一個新的多尺度組合模型來分析小麥的波動并預測其走勢。本文運用EEMD多尺度分解方法將小麥價格序列分解成多個IMF分量和一個剩余分量R;采用灰色關聯分析方法對分量序列進行重構,計算各IMF分量之間的灰色關聯度系數,將關聯度系數高且波動頻率接近的IMF分量歸為一類,多個分量重構為高頻項、中頻項和低頻項,這種重構方法,一方面具有客觀性,另一方面減少了預測的工作量。運用此模型對小麥價格的波動特點進行了分析,并從不規則因素、季節因素、重大事件和世界經濟水平等方面,分別對小麥價格的高頻波動、中頻波動、低頻波動和長期趨勢進行了解釋,賦予了各項一定的經濟含義。針對各項波動的不同特點,分別選取BP神經網絡、SVM方法、ARIMA模型和自回歸方法進行預測,最后運用SVM集成方法對各部分預測結果進行集成,得到最終預測值。實證結果表明,本文構建的多尺度組合模型的預測效果優于灰色預測GM(1,1)、BP神經網絡、SVM方法、ARIMA模型等單模型方法和ARIMA-SVM組合模型以及基于EMD和EEMD分解的其他多尺度組合模型。
與現有的預測模型相比,本文構建的基于多尺度分析的組合模型有著一定的優勢:(1)通過EEMD分解,深入挖掘了價格序列的不同尺度上的波動特征和內在規律;(2)運用灰色關聯分析對分解的各序列進行重構,減少了預測的工作量,抓住了序列波動的主要特征,同時考慮序列間的相關關系以及波動頻率,使得重構過程具有客觀性,避免了主觀的干擾,最后對重構各項依據波動特點賦予經濟含義,使得重構過程更有意義。(3)根據各項不同的波動特點選擇不同的預測方法,則是充分發揮了各預測方法的優勢,選用SVM集成對變量之間的非線性關系進行捕捉和運用。綜合來說,本文構建的多尺度組合模型將“數據驅動建模”和“理論驅動建模”相結合,增加了預測精度的同時也使各項具有經濟含義,比較適合小麥等糧食價格的預測。
[1] Bates J M, Granger C W J.The combination of forecasts [J].Operational Research Quarterly, 1969, 20(4): 451-468.
[2] Krogh A, Vedelsby J.Neural network ensembles, cross validation, and active learning [J].Neural Computing & Applications, 1995, 7(10): 231-238.
[3] Antoniadis A, Saptinas T.Wavelets methods for continuous time prediction using Hilbert-valued auto-regressive processes [J].Journal of Multivariate Analysis, 2003, 87(1): 133-158.
[4] Kazem A, Sharifi E, Hussain F K, et al.Support vector regression with chaos-based firefly algorithm for stock market price forecasting [J].Applied Soft Computing, 2013,13(2):947-958.
[5] Wang Shouyang, Yu L, Lai K K.A novel hybrid AI system framework for crude oil price forecasting[M]//Shi yong,Xu Weixuan,Chen Zhengxin.Data Mining and knowledging management.Berlin Meidelbng:Springer,2005.
[6] Wang Shonyang, Yu L, Lai K K.Crude oil price forecasting with TEI@I methodology [J].International Journal of Systems Science and Complexity, 2005, 18(2): 145-166.
[7] 陳華友.廣義加權算術平均組合預測方法的最優化理論基礎及性質[J].系統工程理論與實踐,2003,23(4):37-41.
[8] 陳華友,盛昭瀚,劉春林.基于向量夾角余弦的組合預測模型的性質研究[J].管理科學學報,2006,9(2):1-8.
[9] 劉軼芳,遲國泰,余方平,等.基于GARCH-EWMA的期貨價格預測模型[J].哈爾濱工業大學學報,2006,38(9):1572-1575.
[10] 陳兆榮,雷勛平,王亮,等.基于ARIMA-SVM組合模型的我國農產品價格預測研究[J].財經理論研究,2013,(2):103-107.
[11] Bjorn V.Multiresolution methods for financial time series prediction [C]//Computational Intelligence for Financial Engineering, New York,April 9-11,1995.
[12] Edmundo G, Legey F L, Edmundo A. Forecasting oil price trends using wavelets and hidden Markov models[J]. Energy Economics, 2010, 32(6): 1507-1519.
[13] 曹霜,何玉成.基于小波分解的SVM-ARIMA農產品價格預測模型[J].統計與決策,2015,(13):92-95.
[14] Huang N E, Shen Zheng, Long S R, et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis [J].Proceedings of the Royal Society A Mathematical Physical & Engineering Sciences, 1998, 454(1971):903-995.
[15] Yu L, Wang Shouyang, Lai K K. Forecasting crude oil price with an EMD-based neural network ensemble learning paradigm [J].Energy Economics, 2008, 30(5):2623-2635.
[16] 王書平,胡愛梅,吳振信.基于多尺度模型的銅價預測研究[J].中國管理科學,2014,22(8):21-28.
[17] Wu Zhaohua, Huang N E.Ensemble empirical mode decomposition: A noise-assisted data analysis method [J].Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.
Forecasting of Wheatprice Based on Multi-scale Analysis
WANG Shu-ping, ZHU Yan-yun
(School of Economics and Management, North China University of Technology, Beijing 100144, China)
Forecasting of grain price is an important area of grain market research.In this paper a new multi-scale combined forecasting model was built based on the idea of decomposition-reconstruction-integration.It selected wheat as representative of grain and forecasted its price trend.It used ensembleempirical mode decomposition (EEMD) to decompose price series, then reconstructed the component sequences into high frequency, middle frequency, low frequency and trend sequences with grey correlation method, which can be explained from the angle of irregular factors, seasonal factor, major events and long-term trend.It forecasted different sequences by different methods according to their characteristics, such as BP neural network,Support Vector Machine (SVM), ARIMA and so on.Finally, it integrated prediction results with SVM.The empirical results show that comparing with GM (1, 1), BP neural network, SVM and other single models, ARIMA-SVM combined model as well as other multi-scale model based on EMD or EEMD, multi-scale combined model obtains the best forecast result.
multi-scale model; EEMD; grey correlation degree; neural network; SVM
1003-207(2016)05-0085-07
10.16381/j.cnki.issn1003-207x.2016.05.010
2015-05-29;
2015-11-11
北京市自然科學基金面上項目(9152007)
簡介:王書平(1977-),男(漢族),湖南漣源人,北方工業大學經濟管理學院副教授,經濟學博士,研究方向:大宗商品定價、計量經濟分析,E-mail: dwangshuping@163.com.
F224.0
A