賈德高 劉春雨 劉家鵬
摘 要:本文基于隱馬爾可夫模型(HMM)探究黃金期貨價格的變動趨勢,通過麻雀搜索算法(SSA)對HMM模型初始狀態的概率分布進行優化,解決HMM模型容易陷入局部最優的缺陷,得到了改進的模型(SSA-HMM)。文章通過實際應用比較證明了SSA-HMM在黃金期貨價格趨勢預測中是有效的,同時深入探究HMM模型隱狀態與實際問題之間的聯系,論證了結合期貨價格波動的驅動因素對隱馬爾科夫模型的隱狀態進行描述是更加合理的。
關鍵詞:價格趨勢;HMM;隱狀態;麻雀搜索算法;黃金期貨
本文索引:賈德高,劉春雨,劉家鵬.<變量 2>[J].中國商論,2024(11):-103.
中圖分類號:F830.94 文獻標識碼:A 文章編號:2096-0298(2024)06(a)--04
1 引言
黃金市場是金融市場中必不可少的重要組成部分,為中央銀行提供一個新的貨幣政策操作工具的同時,其期貨市場也為廣大投資者提供了一種避險和投資渠道。中國黃金期貨于2008年正式掛牌交易,自成立至今的價格多變、難以預測,但是也有幾次明顯的漲跌趨勢存在。由于成立時間短,市場有效程度有待加強,容易受各種影響,加之經濟全球化趨勢,也難以擺脫國際黃金價格的影響。影響黃金價格波動的因素大致可以分為以下五點:供需方面、實體經濟方面、金融市場方面、投機方面、聯動因素方面,這些因素之間相互影響,使得投資者很難從紛亂繁雜的市場信息中及時準確地判斷出未來黃金價格的走勢。隱馬爾科夫模型可以通過對已有的價格信息進行深入學習,挖掘出數據中隱藏的價格狀態,再通過“隱狀態”對未來價格走勢進行判斷。
將機器學習應用于證券價格的分析,是當下比較流行的一種趨勢。2005年,Hassan等(2007)首次提出將隱馬爾科夫模型應用于證券價格預測,并與ANN算法進行比較,發現兩者性能相近[1]。之后不斷有學者對隱馬爾科夫模型在證券價格方面的應用進行研究,比如Park,SH.(2009)將HMM應用于股票價格預測[2],Caccia M.(2019)將HMM用于期權方面[3]。傳統的隱馬爾科夫模型訓練方法存在局部極值陷入的問題,然而麻雀搜索算法相較其他智能優化算法,具有結構簡潔、實施方便等優點。此外,它所需控制參數少,全局搜索性能也較強,因此可以對隱馬爾科夫模型的初始參數分布進行優化。
因此,本文提出一個結合隱馬爾可夫模型(hmm)和麻雀搜索算法(ssa)的黃金期貨價格趨勢預測模型——SSA-HMM模型。經過實驗驗證,這個模型在預測方面表現優秀。
2 隱馬爾可夫模型
隱馬爾科夫模型起源于馬爾科夫鏈的發展,因為實際問題的復雜程度通常超出馬爾科夫鏈所能涵蓋的范圍。觀察到變量并不總是直接與狀態相對應,且每個狀態之間都有可能發生轉移,其發生的概率可以通過之前的狀況來計算。這種模式包含兩大部分:一是馬爾科夫鏈;二是普通隨機進程。馬爾科夫鏈的關鍵在于理解狀態之間的轉換;普通隨機進程則是關于如何確定觀察到變量與狀態的關系,這個狀態因為無法被觀測,所以被稱為隱狀態。隱狀態無法被觀測,可以看到的只有價格及其他指標,如持倉量、成交量這些觀測值。通過對這些觀測值進行數據學習和挖掘,得到隱狀態,再通過隱狀態來預測觀測值的后續走勢,是隱馬爾科夫模型解決WTI原油期貨價格趨勢預測問題的基本原理。
HMM存在三個主要問題,分別是評估、解碼和學習。
其中,評估問題是在模型參數λ已知的情況下計算觀測序列O出現的概率,用到的是前后向算法,公式如下:
其中,Q為隱狀態序列。
解碼問題的目標是在給定模型參數和觀測順序O下,找到最可能隱藏狀態順序Q,公式如下:
學習問題是在給定觀測序列O的情況下 ,估計模型的參數λ,使得觀測序列O在該模型中出現的概率達到最大值,公式如下:
3 麻雀搜索算法
麻雀搜索算法(SSA)是一種以自然鳥類行為為基礎的啟發式優化方案,模擬了麻雀在尋找食物時的搜尋動作,主要應用于連續優化問題,例如函數優化、參數優化等[4]。
麻雀搜索算法的基本思想是將搜索空間中的解看作食物,將搜索代理看作鳥群,鳥群在搜索空間中覓食。鳥群中的每只鳥代表一個解,每只鳥在搜索空間中隨機移動,其移動方向和距離受到當前最優解的影響,以期望找到更優的解。同時,算法引入了一些自適應機制,如變異和適應度修正等,以提高算法的全局搜索能力和局部搜索能力。
與其他優化算法相比,麻雀搜索算法具有以下優點:
(1)收斂速度快:算法使用自適應機制,可以在搜索過程中不斷修正適應度函數,加快算法的收斂速度。
(2)全局搜索能力強:算法具有較強的全局搜索能力,能夠在搜索空間中全面探索解空間。
(3)魯棒性好:算法對初始解的依賴性較小,對問題的初始值和參數設置不敏感。
總之,麻雀搜索算法是一種基于自然鳥類行為的啟發式優化算法,具有較好的全局搜索能力和魯棒性,可以應用于多種優化問題的求解。
4 SSA-HMM組合模型
基于HMM模型的期貨價格預測模型應用的關鍵問題是HMM模型的學習問題,該問題通常用Baum-Welch算法(Baum,1972) [5]來計算解決,一般選擇一系列隨機參數作為隱藏狀態的初始隨機分配。然而,使用不同隨機化的起始參數來構建模型時,所得出的結果可能有顯著差別,意味著這些初始化參數對識別效果有著重要影響。這種特殊形式的EM算法僅能確保找到局部最優解,因此需要盡可能地讓訓練結果接近全局最佳極值,以便提高模型的識別準確度。
麻雀搜索算法因全局優化能力卓越,能夠采用一種全面的搜尋方式而非僅依靠隨意選取hmm參數的單點搜尋。通過反復迭代,最終獲得更優質的初始參數。
利用麻雀搜索算法對隱馬爾科夫模型進行優化,以構建期貨價格預測模型,其過程分為三階段:首先,確定初始參數;其次,模型訓練;最后,對未來的預測。具體步驟如圖1所示。第一階段中,首先,本文運用了麻雀搜索算法選擇出模型的起始參數;其次,按照正常操作順序應用Baum-Welch算法完成模型的培訓工作;最后,借助前向算法計算目標序列出現的概率,并依據該數值通過多天加權平均方法推算出未來價格。
4.1 SSA優化HMM算法
前文提到HMNM算法容易陷入局部最優,這與算法初始參數的選取有關。其中,在參數訓練過程中,隱狀態個數需要人為設定,而初始狀態概率分布則是隨機生成,兩者是影響模型預測性能的關鍵。隱狀態的個數本文根據前文對黃金期貨價格驅動的機制分析來人為給定,初始狀態概率分采用麻雀搜索算法進行優化,具體步驟如下:
(1)劃分訓練集和預測集;
(2)確定適應度函數;
(3)確定最優變量及最優值;
(4)將最佳變量設定為初始狀態的概率分配,并使用Baum-welch算法對hmm進行訓練;
(5)根據尋找與測試集似然值相近的歷史數據,通過加權平均獲得預測值。
4.2 基于加權平均的期貨價格預測
20世紀50年代,部分學者開始對時間序列的長記憶性問題展開了研究,但是長記憶性模型被用于研究金融市場的時間序列[6]還經歷了漫長的30年。長期記憶是指當前數據受歷史數據影響,其中越接近當前時間的歷史數據,對當前數據的影響越大。兼顧長期、短期記憶的模型應用較多[7-10]。
本文提出的基于加權平均的期貨價格預測是以價格序列具有長期記憶性為前提的。具體如下:假設當前時間為t,在訓練數據中,第m日的期貨價格走勢與當前時間t的似然值相近,則第t+1日的期貨價格走勢就與m+1日的走勢相似。似然值越接近,走勢就越相似;反之,則相去甚遠。使用加權平均預測期貨價格具體步驟為,對某一段時期,首先,用SSA-HMM模型在歷史數據中找出一組數據稱之為歷史數據集Th,在歷史數據集Th中每一日期貨價格的似然值與今天期貨價格的似然值是相似的。其次,計算歷史數據集中每一個日期的收盤價與它下一交易日的收盤價的價格差,對這組價格差使用加權平均(似然值與日期t的似然值越接近的價格差權重越大)得到t日與t+1日收盤價的價格差,公式如下:
其中,wd——第t日與t+1日的收市價格差;i——歷史數據集Th中的第i個數據;diffi——第i日與i+1日的收盤價格差;ωi——第i個數據的價格差對wd的權重,ωi如下:
其中,Di-t——第i個數據的日期與第t日日期相差的天數,也就是若Di-t越小,第i個數據對價格差wd影響的越大。
在得到第t日與t+1日的收市價格差wd之后,第t+1日的收市價格為:P=Pt+wd,其中Pt為當日t的收盤價。
5 實證研究
5.1 實驗數據
為了測試提出的SSA-HMM模型的性能,本文用SSA-HMM模型對上海黃金交易所AU(T+D)2007-01-05—2023-05-12共3915日的數據進行測試。其中,后30日數據作為測試集,其余為訓練集。本文選擇日收盤價、加權平均價、交易量和持倉量作為輸入數據,這些數據都是從resset獲取的。
以往很少有人選取持倉量作為輸入變量,但持倉量是一個很重要的指標,它與成交量不同,成交量側重當日的交易狀態,持倉量更側重市場的后續狀態。持倉量是指在購買或銷售某些產品現貨合同后,未能完成對沖和實際交換的數目。通過觀察持倉量的變化,本文可以推斷出資金流向何處。如果持倉量增大,就說明資本開始進入期貨市場;反之,則意味著資本開始回流期貨市場。
5.2 實驗算法的參數設置
首先,本文對數據進行Box-Cox變換等處理后,使之符合正態分布。其次,本文對模型的參數進行設置,如表1所示。隱狀態個數依據上文分析,本文的隱狀態數量設置為5更有實際意義,分別對應影響黃金價格波動的五個方面。
另外,本文運用SSA方法來提升HMM模型的效果,結果顯示其初始狀態的概率分布是[0.0347 0.2147 0.2035 0.1218 0.4252],也就是說,有0.0347的可能性存在于狀態0中,而狀態1和狀態2分別占0.2147和0.2035的比例。同樣地,狀態3和狀態4也各占據0.1218和0.4252的比率。此外,本文在每一個馬爾科夫隱藏狀態中都引入了全局協方差矩陣作為觀測變量的選擇條件。這個矩陣中的所有元素都不等于零,這是因為本文的四維數據確實具備相互關聯的特點。
5.3 性能指標——趨勢同向率
本文提出的組合模型的性能是通過趨勢同向率來衡量的。影響黃金期貨的價格因素很多,對具體價格的預測較為困難,本文選擇預測期貨價格的趨勢。以當前價格為主,預測日的收益率為正則趨勢為正向,即黃金期貨價格上漲;反之,則為負向。趨勢同向率為:
趨勢同向率=
其中,n為待預測天數;Xi為:
5.4 實驗結果
本文為驗證提出的SSA-HMM模型的有效性,將其與未優化的HMM模型及SVM和BP神經網絡模型進行對比,結果如表2所示。由表2可以得出,在黃金期貨價格趨勢預測方面,HMM模型的預測性能優于SVM和BP神經網絡模型,而優化后的SSA-HMM模型的預測性能明顯得到了提高,說明SSA-HMM模型的有效性。
5.5 隱狀態分布分析
本文所選數據隱狀態散點圖分布如圖2所示,紫、藍、黃、紅、綠分布代表0~4五個不同隱狀態。從圖2可以看出,在一定的時期隱狀態,分布主要集中在1~2種,這與上文有關黃金期貨價格的驅動機制的分析保持一致。在一定的時期內影響價格的因素很多,但黃金的價格波動受主要因素影響較大。如2008年之后黃金的價格上漲,主要是因為次貸危機之后各國采取的量化寬松政策;又如近兩年黃金價格的波動主要受新冠疫情沖擊和俄烏沖突的影響。
基于SSA-HMM模型的預測結果可以看出,當前隱狀態分布與2012年前后相似,主要分布于隱狀態3,即分布圖2中紅色點為主,黃金期貨市場交易活躍,存在上漲預期。
6 結語
本文創新性地將麻雀搜索算法(SSA)與HMM模型結合來預測中國黃金期貨的價格走勢,隱狀態初始概率分布不再通過隨機選取,而是基于全局最優,通過SSA對HMM模型進行優化來得到,解決HMM模型容易陷入局部最優的缺陷。通過黃金期貨實際預測應用比較證明了模型的實際應用價值,同時結合期貨價格波動的驅動因素對隱馬爾科夫模型的隱狀態進行了更加合理的描述,論證了模型與實際問題之間的契合關系。
參考文獻
Hassan M R,Nath B,Kirley M.A fusion model of HMM,ANN and GA for stock market forecasting[J].Expert Systems with Applications,2007,33(1):171-180.
Park, SH., Lee, JH., Song, JW. Forecasting Change Directions for Financial Time Series Using Hidden Markov Model. In: Wen, P., Li, Y., Polkowski, L., Yao, Y., Tsumoto, S., Wang, G. (eds) Rough Sets and Knowledge Technology. RSKT 2009. Lecture Notes in Computer Science, vol5589. Springer, Berlin, Heidelberg,2009.
Caccia M, Rémillard B. Option pricing and hedging for discrete time autoregressive hidden markov model[M]//Innovations in Insurance, Risk-and Asset Management. 2019: 313-348.
Xue J, Shen B . A novel swarm intelligence optimization approach: sparrow search algorithm[J]. Systems Science & Control Engineering An? Open Access Journal, 2020, 8(1):22-34.
Baum, L. E..An inequality and associated maximization technique in statistical estimation for probabilistic functions of Markov processes[J].Inequalities III: Proceedings of the 3rd Symposium on Inequalities. Academic Press,1971.
王春峰,張慶翠.中國股票市場收益的長期記憶性研究[J].系統工程,2003,21(1):22-29.
K. Chen, Y . Zhou, and F. Dai. A LSTM-based method for stock returns prediction: A case study of China stock market,in Proc. IEEE Int. Conf. Big Data, Oct. 2015, pp. 2823–2824.
H. Y . Kim and C. H. Won,“Forecasting the volatility of stock price index: A hybrid model integrating LSTM with multiple GARCH-type models,”Expert Syst. Appl., vol. 103, pp. 25–37, Aug. 2018.
Z. Jin, Y . Yang, and Y . Liu, “Stock closing price prediction based on sentiment analysis and LSTM,” Neural Comput. Appl., vol. 32, no. 13, pp. 9713–9729, Jul. 2020.
Z. Su, H. Xie, and L. Han,“Multi-factor RFG-LSTM algorithm for stock sequence predicting,”Comput. Econ., vol. 57, no. 4, pp. 1041–1058, Apr. 2021.