999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于EMD和SSA的股票預測模型

2023-09-25 09:02:42謝游宇王萬雄
計算機工程與應用 2023年18期
關鍵詞:模型

謝游宇,王萬雄

甘肅農業大學理學院,蘭州730070

股市是經濟的晴雨表,各行各業的經營狀況和發展前景都可以通過股市反映出來。如果能夠預測和分析股市的走向,那么不僅能使投資者獲益,也能夠引導政府作出干預,避免股市崩盤。

股票序列具有非線性、非平穩等特征,同時含有大量噪聲。傳統統計模型如ARIMA[1]、GARCH[2]、VAR[3]、GM[4]等模型,雖然其具有完備的理論體系,可以根據統計原理來檢驗模型的優劣,但是傳統統計模型對數據具有嚴格的假定如平穩性、正態性等,由于股票數據的非平穩性和非線性以及強烈的波動性,這也導致了傳統統計模型在處理股票序列上具有局限性。相對于傳統統計模型,機器學習模型和深度學習模型能夠很好處理非線性非平穩序列,其對數據也沒有任何假定,常用的機器學習模型和深度學習模型有支持向量機、隨機森林、神經網絡等。其中神經網絡中的LSTM 模型對具有長期依賴性的數據有很好擬合效果,目前被廣泛應用于股票預測[5-7];機器學習中的SVR 模型對于非線性序列具有很好的泛化效果,也常被用于股票預測[8-10]。

道氏理論認為股票指數存在三種趨勢:長期趨勢、中期趨勢和短期趨勢,并且股票變動受到這三種趨勢的共同作用。因此有學者采用了分解的思想:將金融序列分解成具有不同時間尺度的若干分量,再分別利用單一模型對各個分量進行預測,最后再集成得到預測結果。基于這種思想,有學者提出了組合模型[11-13],這些組合模型大都采用了目前常用的數據分解方法:傅里葉變換、小波變換和經驗模態分解(EMD);與小波變換和傅里葉變換不同,EMD 僅僅依靠數據自身的特征來進行信號分解,而不依賴基函數;基于這一特點,EMD 幾乎適用于任何類型信號的分解,尤其是在非線性、非平穩序列上具有顯著優勢。因此有不少學者基于EMD得出了精度更高的股票組合預測模型如EMD-ARIMA[14]、EMD-SVR[15]、EMD-LSTM[[16]等模型。但是,經過EMD分解后得到的若干高頻分量依然存在噪聲,限制了模型的預測精度,有學者通過結合EMD 和SSA(奇異譜分析)兩種方法成功實現了降噪[17]:對經過EMD分解后的所有分量再進行SSA 分解,從而實現信噪分離,使信號分解更徹底。在此,本文引入SSA對高頻分量進行分解重構,實現對高頻分量的信噪分離,進而提高預測精度。同時,SSA 本身也存在缺陷,其嵌入維度的大小將影響分解效果,較大的嵌入維度將使信號過度分解,較小的嵌入維度則無法有效提取特征;并且經過SSA分解后的第一個SSA分量往往混合了絕大部分特征,容易導致分解不全而無法充分提取特征,影響預測效果,故不直接對原始序列進行SSA 分解。因此,本文結合EMD和SSA 兩種分解方法各自的優點,首先利用EMD 自適應性的優點將原始序列分解成具有不同特征的若干高頻分量和低頻分量以及殘差項,其次利用SSA對所有高頻分量進行重構,實現對高頻分量的信噪分離。

鑒于此,本文提出了一種基于EMD和SSA的EMDSSA-LSTM-SVR的股票組合預測模型,并利用滬深300指數序列來驗證模型的性能。首先利用EMD 將滬深300序列分解成具有若干不同時間尺度的IMF分量,再將各IMF分量進行組合:將低頻IMF分量和殘差項組合為趨勢項,將剩余高頻IMF 分量組合為波動項;其次利用LSTM 模型對趨勢項進行預測,利用LSTM 模型和PSO-SVR 模型對波動項進行預測:首先利用SSA 對趨勢項進行分解重構,利用LSTM 模型對長期依賴(自相關函數拖尾)子序列進行預測,利用PSO-SVR模型對短期依賴(自相關函數截尾)子序列進行預測,再將所有序列預測值合并為波動項預測值;最后將趨勢項預測值和波動項預測值集成得到最終滬深300 預測值,如圖1 所示。通過與LSTM、SVR、EMD-LSTM、EMD-SVR、SSALSTM和SSA-SVR六種模型對比,證明了本文所提組合模型的預測性能。

圖1 方法與流程Fig.1 Methods and Processes

1 研究方法

1.1 EMD的基本理論

經驗模態分解(empirical mode decomposition,EMD)[18],是一種信號分解的方法,其思想就是將信號分解為相互獨立的多個本征模態函數(IMF)的疊加,IMF必須滿足以下兩個條件:

(1)函數在整個時間范圍內,局部極值點和過零點數目必須相等,或者最多相差一個。

(2)在任何時間點,局部最大值的包絡線(上包絡線)和局部最小值的包絡線(下包絡線)平均必須為零。

算法流程如下:

步驟1 找到原始時間序列x(t)的所有極大值和極小值點,對所有極值點利用三次樣條插值法擬合上包絡線U(t)和下包絡線L(t)。

步驟2 求上下包絡線的均值M(t):

步驟3 原始序列減去均值包絡線,得到中間序列h(t)。

步驟4 判斷h(t)是否滿足IMF的兩個約束條件,如果滿足則是一個IMF分量,如果不滿足則返回步驟1反復迭代。

步驟5 假設h(t)是一個IMF 分量并記為IMF1,則重復步驟1~4,將M(t)當做原始序列繼續分解得到下一個IMF分量IMF2,直到殘余分量是單調函數或常量時,停止分解。殘余分量記為res。

分解完成后,原始序列x(t)可以表示為:

1.2 LSTM的基本理論

LSTM(long short term memory,LSTM)[19]網絡,是為了解決長期依賴問題而設計出來的一種神經網絡模型,是一種循環神經網絡(RNN)。所有的RNN 都具有一種重復的神經網絡模塊的鏈式形式,不同于標準RNN,LSTM 具有更為復雜的結構模塊,主要通過三個門(輸入門、遺忘門、輸出門)來實現信息的記憶和傳遞以及狀態的更新。

首先信息會經過遺忘門,遺忘門會讀取前一時刻的輸出以及當前時刻的輸入,輸出一個在0 到1 之間的數值ft,ft決定了信息的保留,1表示完全保留,0表示完全舍棄,如下:

其中,ht-1表示的是上一時刻的輸出,xt表示的是當前時刻的輸入,bf是偏置,σ是一個sigmod 函數。

其次信息會經過輸入門,輸入門決定了信息和狀態的更新,主要包括兩個步驟:一個sigmod 層決定哪些信息需要進行更新;一個tanh 層生成用來更新的內容,如下:

其中,Ct表示更新的信息,it為Ct的系數,Ct-1表示上一時刻的狀態,C表示更新后的狀態。

最后信息將會通過輸出門,得到最終的輸出值,輸出值將會基于更新后的狀態。首先,通過一個sigmod門確定哪一部分信息會被輸出,接著把更新后信息經過tanh 處理并將它和sigmod 門的輸出相乘,得到最終的輸出,如下:

其中,ht為最終輸出。

1.3 SSA的基本理論

奇異譜分析(singular spectrum analysis,SSA)[20],是一種處理非線性時間序列的方法,通過對所研究的時間序列的軌跡矩陣進行分解、重構等操作,提取出時間序列中的不同成分,從而實現對原始時間序列的分解和去噪。奇異譜分析主要包括四個步驟:嵌入—分解—分組—重構。

步驟1 嵌入。給一組有限長一維時間序列[x1,x2,…,xN],選擇合適的窗口長度L(2

步驟2 分解。對矩陣S=XXT進行奇異值分解,得到如下形式:

其中,U為左矩陣;Σ僅在對角線元素有值,就是奇異值,其他元素均為零;VT為右矩陣。此外U、V均為單位正交矩陣。對S分解后會得到特征值λ1>λ2>…>λL≥0 和對應的特征向量U1,U2,…,UL。并且有:

步驟3 分組。將下標集合{1,2,…,d}劃分成m個互不相交的子集I1,I2,…,Im,令I={i1,i2,…,ip},則對應于I的合成矩陣XI=Xi1+Xi2+…+Xip。則有:

其中,I1,I2,…,Im的選取過程即為分組。

步驟4 重構。將上式中的每個矩陣XIj變換為一個長度為N的新序列,即得到分解后的序列。令Y為一個L×K的矩陣,元素為yij,1 ≤i≤L,1 ≤j≤K。

令L*=min(L,K),K*=max(L,K),N=L+K-1,如果L

1.4 SVR的基本理論

SVR(support vector regression)[21]是一種基于結構風險最小化的回歸算法,對于非線性數據具有很好的泛化能力,其核心思想是通過非線性映射將原始數據映射到高維空間,在高維空間尋找最優回歸超平面,從而實現預測。

SVR的回歸函數表達式如下:

其中,ω為權值系數,φ(x)為非線性變換函數,b為偏置。

不同于普通線性回歸的損失函數,SVR的損失函數定義為:

其中,L[y,f(x)]為SVR的損失函數,ε為常數。只有當預測偏差小于ε時,才計算損失,否則不計入損失。上式相當于以f(x)為中心,構建了一個寬度為2ε的間隔帶,只有落在間隔帶以內的樣本才不計算損失。

再通過引入松弛變量εi、ε?i就可以得到SVR優化的目標函數:

其中,C為懲罰因子;為松弛因子。拉格朗日乘數法把式(17)的約束問題轉化為無約束的二次規劃問題求解,即原問題轉化為如下對偶問題:

2 實證分析

2.1 數據來源

本文以滬深300指數來測試EMD-SSA-LSTM-SVR模型的預測性能,選取了2014 年1 月3 日至2021 年12月31 日共1 950 個收盤價數據,數據來源于Tushare 財經數據接口,如圖2 所示。這段時間囊括了滬深300 指數上升、下降和震蕩等多個階段,同時滬深300 在一定程度上反映了整個股市的運行狀況。因此,本文的測試數據具有一定代表性。

圖2 滬深300Fig.2 hs300

2.2 EMD分解與SSA分解

2.2.1 EMD分解

滬深300 序列經過EMD 分解后一共得到8 個IMF分量,包含了4 個高頻IMF 分量(IMF1~IMF4)和3 個低頻IMF 分量(IMF5~IMF7)以及1 個殘差項(IMF8)。這8 個分量分別對應了滬深300 存在的短期變動趨勢(IMF1~IMF4)、中期變動趨勢(IMF5~IMF7)和長期變動趨勢(IMF8)。將4個低頻分量合并為趨勢項,再將4個高頻分量合并為波動項,如圖3和圖4所示;經過EMD分解與重構后能夠將原始序列分解為相對平滑的長期趨勢項和具有高噪聲的短期波動項。

圖3 EMD分解Fig.3 EMD decomposition

圖4 趨勢項和波動項Fig.4 Trend and fluctuation terms

2.2.2 SSA分解

SSA存在嵌入維度選取問題,因此引入具有較強適應性的Cao[22]方法。利用Cao方法選取嵌入維度L的步驟如下:

計算不同嵌入維度L下最近鄰點的距離變化值:

其中,‖ ? ‖為無窮范數,Xi(L)與Xi(L+1)分別表示在嵌入維度為L和L+1 時重構的相空間向量,Xn(i,L)(L)則表示該向量的最近鄰點。

計算相同嵌入維度L下相空間最近鄰點變動值的均值:

觀察E(L)的變化情況E1(L):

當E1(L)停止變動或者其值小于給定閾值時,此時的嵌入維度L0即為最佳嵌入維度。

利用Cao 方法對波動項進行SSA 分解,其E1(L)變化如圖5所示,當L等于17時E1(L)趨于穩定,因此L=17為最佳嵌入維度。

圖5 E1(L)變化Fig.5 E1(L)change

當嵌入維度為17 時,波動項經過SSA 分解得到的奇異值如圖6所示,將奇異值大小相近的SSA分量合并[1,2,3-4,5-6,7-9,10-12,13-17],最終得到7 個SSA 分量,如圖7所示。

圖6 奇異值Fig.6 Singular values

圖7 SSA分解Fig.7 SSA decomposition

經過SSA分解得到的7個SSA分量與經過EMD分解得到的4 個IMF(IMF1~IMF4)分量相比,SSA 分解能夠將超高頻分量(IMF1、IMF2)中的有效成分和噪聲分離,從而減小噪聲帶來的影響。

經過EMD 和SSA 分解一共得到11 個不同時間尺度的子序列。道氏理論認為金融序列的中長期變動趨勢在一定程度上有規律可循,因此將IMF5~IMF8 合并為一個長期趨勢項來進行預測;而短期變動趨勢較為復雜且不易把握,因此對剩余7個短期波動項分別單獨預測。

2.3 評價指標

本文選取均方根誤差(root mean square error)、平均絕對誤差和平均絕對百分比誤差三種指標來檢測模型的預測效果,計算公式如下:

其中,yi為序列真實值為序列預測值,n為序列長度,i為序列編號,三種指標的值越小,模型的預測精度就越高。

2.4 實證結果

選取前6年共1 708個數據作為訓練集,最后1年共242個數據為預測集來驗證模型的預測性能,為了提高模型的求解速度和預測精度,在實證之前對模型進行歸一化處理,歸一化公式如下:

其中,x為原始序列,xmax為原序列最大值,xmin為原序列最小值。

利用LSTM模型對長期趨勢項進行擬合,利用滑動窗口法預測下一期的值,根據趨勢項的自相關函數將窗口值設置為180,采用單層LSTM網絡,共50個神經元,激活函數為linear,損失函數為MSE,優化器為Adam,最大迭代次數為1 000 次,并設置了早停機制:當模型30次迭代后沒有提升就停止迭代,并返回最優參數設置。

分別利用LSTM(參數設置同上)模型和PSO-SVR模型對重構后的7個SSA分量進行預測,同樣采用滑動窗口法進行預測并根據其自相關函數來選取預測窗口長度,窗口長度分別設置為(30,20,15,10,7,5,4),最后將所有預測序列的結果合并得到滬深300 的預測結果。經過實證發現,LSTM 模型對前四個長期依賴(自相關函數拖尾)序列預測效果優于SVR模型,而對后三個短期依賴(自相關函數截尾)序列的預測效果劣于SVR 模型,因此利用LSTM 模型預測長期依賴序,利用SVR模型預測短期依賴序列。

為了凸顯模型的優越性,本文還將LSTM、SVR、EMD-SVR、EMD-LSTM、SSA-LSTM 和SSA-SVR 六個模型與本文提出的EMD-SSA-LSTM-SVR 組合模型進行了對比,結果如圖8~11所示。

圖8 單一模型的預測值和真實值Fig.8 Predicted and true values for single model

圖9 EMD分解模型的預測值和真實值Fig.9 Predicted and true values of EMD decomposition model

圖10 SSA分解模型的預測值和真實值Fig.10 Predicted and true values of SSA decomposition model

圖11 EMD-SSA-LSTM-SVR模型的預測值和真實值Fig.11 Predicted and true values of EMD-SSA-LSTM-SVR model

為了更加直觀地比較各個模型的優劣,表1是各個模型的RMSE、MAE、MAPE三種指標,從劣到優分別是SVR、LSTM、EMD-SVR、EMD-LSTM、SSA-SVR、SSALSTM、EMD-SSA-LSTM-SVR。

表1 實驗結果對比Table 1 Comparison of experimental results

結合圖8~11 以及表1 可以看出,EMD-SVR、EMDLSTM、SSA-LSTM和SSA-LSTM模型要比單一模型SVR和LSTM 表現要好,經過EMD 分解和SSA 分解后的模型精度有明顯的提升,而本文提出的EMD-SSA-LSTMSVR 模型的預測結果基本與原始滬深300 序列重合。由此可見本文提出的組合模型進一步提高了預測精度。

2.5 實驗結果分析

為了進一步驗證模型的優越性和適應性,以本文提出的EMD-SSA-LSTM-SVR 模型為基礎,對文獻[15]和文獻[16]中的數據進行預測,并與文獻中的原模型的預測結果進行對比分析。

對于文獻[15]中的上證指數收益率序列,以前976個數據作為訓練集和測試集,后202 個數據為驗證集,建立EMD-SSA-LSTM-SVR模型,預測結果如表2所示。

表2 上證指數收益率預測結果對比Table 2 Comparison of SSE index return forecast results

EMD-SSA-LSTM-SVR 模型在三種指標上都要優于EMD-SVRF 模型,尤其在R-square,這也表明EMDSSA-LSTM-SVR模型具有更優秀的預測能力。

對于文獻[16]中的綜合指數指數序列,分別對滬深300、上證指數和深證成指建立EMD-SSA-LSTM-SVR模型,預測結果如表3。

表3 綜合指數預測結果對比Table 3 Comparison of composite index forecast results

結合表2和表3的結果來看,EMD-SSA-LSTM-SVR模型無論是對相對平穩的收益率序列還是帶有趨勢的綜合指數序列都有著良好的預測性能。

金融序列往往含有大量噪聲,雖然EMD 分解能夠自適應地根據序列自身特點將原始序列分解為多個時間尺度的子序列,但是其分解出的前幾個高頻子序列往往含有大量噪聲,限制了其預測效果。SSA分解可以自適應地選擇嵌入維度實現對序列的分解重構,將EMD分解后的高頻分量再進行SSA 分解可以最大程度上實現對原始序列的完全分解,從而減小噪聲帶來的影響,最后再結合LSTM 模型處理長期依賴序列的優勢以及SVR模型對非線性序列的泛化能力,建立了預測精度更高的EMD-SSA-LSTM-SVR模型。

3 結束語

本文提出了一種基于EMD 和SSA 的EMD-SSALSTM-SVR模型,該模型能夠最大程度上實現對原始序列的完全分解,將原始序列分解為具有多個時間尺度的子序列,解決了EMD分解后高頻分量存在的噪聲問題,并且根據各個子序列的自相關函數選取相應的預測模型進一步提高了預測精度。同時以滬深300指數、上證指數、深證成指以及上證指數收益率進行驗證,實驗結果表明,EMD-SSA-LSTM-SVR模型具有更好的預測性能。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美成人精品在线| 内射人妻无套中出无码| 美女扒开下面流白浆在线试听| 91精品免费久久久| 成人国产一区二区三区| 99久久精品免费看国产电影| 青青草原国产精品啪啪视频| 国产在线视频福利资源站| 国产一区二区福利| 日本一区二区三区精品视频| 亚洲最大看欧美片网站地址| 91麻豆精品视频| 久久久国产精品无码专区| 国产国语一级毛片在线视频| 天堂在线视频精品| 综合人妻久久一区二区精品| 欧美色图久久| 免费看美女毛片| 激情无码视频在线看| 亚洲毛片一级带毛片基地| 国产91麻豆免费观看| 2021国产精品自产拍在线| 97国产成人无码精品久久久| 日韩无码视频播放| 亚洲国产一成久久精品国产成人综合| 欧美亚洲国产视频| 青青青视频91在线 | 国产精品入口麻豆| 一本色道久久88综合日韩精品| 女人av社区男人的天堂| 国产白浆在线| 亚洲无码电影| 91久久国产热精品免费| 国产成人亚洲欧美激情| 亚洲一区二区三区香蕉| 国内精品手机在线观看视频| 国产主播一区二区三区| 国产精品亚洲综合久久小说| 超碰91免费人妻| 久久综合伊人77777| 久久久久亚洲AV成人网站软件| 人妻免费无码不卡视频| 精品一区二区三区波多野结衣| 国产精品林美惠子在线播放| 久久女人网| 国产在线一区视频| 人妻丰满熟妇啪啪| 99热最新网址| 中文字幕人成乱码熟女免费 | 亚洲天堂色色人体| 国产一在线观看| 国产尤物视频网址导航| 国产一级毛片网站| 亚洲欧美不卡中文字幕| 国产噜噜噜视频在线观看 | av无码一区二区三区在线| 欧美在线网| 亚洲国产日韩一区| swag国产精品| 97成人在线视频| 国产福利在线观看精品| 色婷婷综合激情视频免费看| 精品欧美日韩国产日漫一区不卡| 国产一区二区三区精品久久呦| 91亚洲精选| 四虎在线观看视频高清无码| 久久人妻xunleige无码| 亚洲欧美日韩中文字幕一区二区三区| 男女精品视频| 19国产精品麻豆免费观看| 国产日韩欧美中文| 九九精品在线观看| 亚洲成人动漫在线观看| 久久青草热| 国产亚洲精品91| 免费在线看黄网址| 亚洲最大福利网站| 亚洲天堂.com| 成人综合网址| 女同久久精品国产99国| 亚洲最新在线| 在线日本国产成人免费的|