王 靜 鄒慧敏 曲東東 白 麗
(大連海事大學信息科學與技術學院 遼寧 大連 116026)
時間序列是各行各業的數據按照不同的時間間隔依次、連續產生的,它們通常包含著豐富且復雜的信息。由于人們需要從時間序列中獲取有價值的信息,因此時間序列分析技術應運而生。時間序列分析領域的關鍵一環是預測。時間序列預測是根據數據的歷史規律以及變化趨勢,對未來數據的發展狀況做出合理的推測。金融時間序列是時間序列的一種,對于政府、投資機構和投資者均有著重要的意義,一直以來都是金融領域和計算機領域的研究熱點。
由于金融時間序列非線性且非平穩的特性,進行預測時存在預測精度不高的問題,所以國內外學者進行了大量的研究,并提出了包括自回歸滑動平均模型(Auto-RegressiveandMovingAverageModel,ARMA)[1]、隨機森林(RandomForest,RF)[2]、長短時記憶神經網絡[3]等多種金融時間序列方法,這些模型都是有監督的學習方法。近年來,生成對抗網絡[4]以其獨特的對抗思想和無監督學習方式成為深度學習領域中的重要分支。Mathieu等[5]提出了一種用于視頻預測的GAN網絡結構;王玉龍等[6]提出了一種用于地面新增建筑檢測的GAN網絡模型;文獻[7]提出了一種使用注意力機制以提高生成圖像質量的SAGAN模型。上述文獻表明,雖然GAN已成功應用于計算機視覺并取得了不錯的效果,但是在金融時間序列分析領域的應用卻少之又少,本文將生成對抗網絡模型應用于金融時間序列預測領域。
鑒于GAN具有良好的捕捉數據間隱含深層關系的能力,本文致力于將GAN應用于金融時間序列預測。Zhou等[8]首次采用GAN對高頻股票市場進行預測,并有效地提高股價方向預測精度,降低預測誤差;Zhang等[9]將GAN應用于股票市場的預測。上述文獻雖然將GAN應用于金融時間序列預測,但都采用了原始GAN模型,存在預測精度不高、模型不穩定等問題。為了解決上述問題,首先本文在保留WGAN-GP[10]優點的基礎上,將經驗模態分解[11]與LSTM結合作為生成器,卷積神經網絡[12]作為判別器;然后將WGAN-GP生成器的損失函數與均方誤差結合作為本文生成器的損失函數;最后,使用該模型對滬深300指數進行實驗,驗證了該模型預測的準確性。
為了解決生成對抗網絡對金融時間序列進行預測時存在預測精度不高、模型不穩定等問題。本文提出了一種新型的用于金融時間序列預測的生成對抗網絡模型。由于金融時間序列大多數都是非線性且非平穩的,而經驗模態分解非常適合分析這類數據,故本文將經驗模態分解和生成對抗網絡的生成器結合;又因為生成對抗網絡生成器的目標函數和樣本數據沒有直接關聯,會導致模型不穩定,所以對其目標函數進行改進。
經驗模態分解生成對抗網絡的網絡結構如圖1所示,主要包括:數據預處理、生成模型G和判別模型D三部分。

圖1 EMD-WGAN結構
數據預處理可以從原始數據中獲取更多的信息,便于進一步分析及預測。本文首先對原數據中的異常數據進行降噪,得到降噪后的數據,然后進行線性歸一化處理:
(1)
式中:Xn表示歸一化后的數據;X表示降噪后的數據;Xmin表示降噪后數據的最小值;Xmax表示降噪后數據的最大值。
生成模型由經驗模態分解和N個長短時記憶神經網絡組成。LSTM具有良好的記憶性能,并且在對金融時間序列進行預測時表現出了良好的特性,所以采用LSTM作為生成對抗網絡生成模型的一部分。本文的生成模型與原始GAN生成模型不同之處在于其采用EMD和LSTM結合作為生成模型。改進后的生成對抗網絡不是直接將預處理后的數據輸入到生成模型中,而是將預處理后的數據先進行經驗模態分解得到N-1個包含原數據不同時間尺度特征的本征模態函數(Intrinsic Mode Function,IMF)和一個余波。然后將這N組數據分別輸入N個LSTM神經網絡中。最后將LSTM的輸出進行求和作為生成數據與真實數據一起輸入給判別模型。這樣做的優勢在于:經過EMD后的數據頻率相似并且具有良好的規律性,不僅可以降低生成模型的復雜度,而且可以提高預測精度。
本文采用CNN作為判別模型,結構如圖2所示。

圖2 卷積神經網絡
判別模型的作用是判別輸入數據是真實數據還是生成模型的生成數據,相當于一個二分類器。因為CNN具有良好的特征提取能力,并且在分類任務上表現良好,所以判別模型采用CNN。CNN是一種深度前饋神經網絡,由輸入層、輸出層和多個隱藏層組成,其中隱藏層包括卷積層、池化層、全連接層。首先輸入層輸入數據,然后卷積層通過卷積運算提取特征,池化層進行特征降維、壓縮數據和參數,防止過擬合,最后經過全連接層連接并進行輸出。
目標函數的設計是生成對抗網絡模型研究中的一個重要部分,一般可以采用交叉熵、均方誤差和Wasserstein距離等。均方誤差表示的是真實數據與預測數據之間距離平方和的平均數。本文使用WGAN-GP中使用的Wasserstein距離和均方誤差作為本文的目標函數:
(2)

本文判別器的目標函數采用WGAN-GP判別器的目標函數:
(3)
式中:m為小批量樣本的大小。
本文生成器的目標函數:
(4)
(5)
(6)

本文采用Adam優化算法[13]訓練EMD-WGAN,使模型參數達到最優,具體步驟如下:
1) 初始化生成器和判別器的學習率lg和ld,權重θ和w;設置超參數λ和ε;給定m組歷史數據X:(x(1),x(2),…,x(m))和真實數據Y:(y(1),y(2),…,y(m))。
2) 若模型未收斂,則:

(2) 更新判別器D:由更新好的生成器G*可以得到生成數據G*(z):(G*(z)(1),G*(z)(2),…,G*(z)(n)};將生成數據G*(z)和真實數據Y輸入給判別器,根據Adam算法更新判別器的權重w:w←Adam(▽wLD)。
3) 若模型收斂,則訓練結束。
本文數據釆集自“wind”上2002年1月-2019年3月的滬深300指數。數據集的生成方式為每天采集一次數據樣本,使用前20天的收盤價預測第21天的收盤價。由于金融時間序列在實際應用中,還存在各種數據處理時間及訓練時間的要求,所以在研究中采用了總數據中的最后4000個數據,其中前2/3作為訓練集,后1/3作為測試集。
誤差準則用來評估預測模型的性能。目前對于評價指標的選擇有很多種,一般是從不同的角度選取不同的評價指標對模型進行科學的衡量與評估。本文采用平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)作為模型評價指標,計算公式如下:
(7)
(8)
(9)
(10)

本文將分析非線性數據性能良好的EMD和WGAN-GP的生成器進行結合,即先將預處理后的數據進行EMD,再將分解后的數據輸入給LSTM,最后生成器和判別器進行對抗訓練得到最終的輸出。為了驗證本文金融時間序列預測算法的準確性,選取了已經成功應用于金融時間序列預測的LSTM和深度學習中具有代表性的WGAN-GP與本文模型進行對比。
本文模型生成器由EMD和9個LSTM神經網絡構成,每個神經網絡有2層LSTM隱藏單元,每層包含10個神經元,激活函數為tanh,學習率為0.0006并采用Dropout防止過擬合。判別器由3層CNN構成,卷積核分別為[1,32]、[1,64]、[1,128],激活函數為LReLU,學習率為0.0006,池化方法為最大池化,并采用Dropout防止過擬合。
圖3給出WGAN-GP、LSTM和EMD-WGAN的預測值與真實值,可以看出,LSTM、WGAN-GP與EMD-WGAN模型預測的數據走勢總體與實際數據的走勢相同,但EMD-WGAN相比于其他兩個模型能夠更好地擬合實際數據;EMD-WGAN模型相比于未加經驗模態分解的WGAN-GP能夠更多地提取到原始金融時間序列的非線性特征,能提高金融時間序列預測的精度;EMD-WGAN和LSTM相比,雖然LSTM對于一些轉折點的數據也能夠較好地擬合,但是LSTM的整體預測卻遠不如EMD-WGAN。雖然EMD-WGAN模型整體預測精度提高了,但在某些峰值處未能較好擬合,其主要原因是:1) 實驗中使用的金融時間序列的技術指標有限,僅僅使用了滬深300指數的收盤價。2) 實驗中使用的金融時間序列的數量有限,僅僅使用了2002年-2019年的數據。3) 實驗中使用的金融時間序列沒有考慮到政策、新聞等因素對股票價格的影響,僅僅從數據本身特征進行分析。

(a) WGAN-GP預測結果

(c) EMD-WGAN預測結果圖3 不同方法預測結果對比
為了進一步驗證本文算法的有效性,我們選取了最近一年LSTM、WGAN-GP、EMD-WGAN預測值與真實值的誤差進行對比,如圖4所示。可以看出EMD-WGAN的整體誤差最小,LSTM最差。但是在2019年1月-2019年3月,LSTM和EMD-WGAN誤差接近且比WGAN-GP誤差小,結合圖3可以看出,在這段時間內有一個較大的轉折點說明對于突變數據LSTM和EMD-WGAN擬合的效果比WAGN好。

圖4 預測誤差
由表1可以看出,從MAE、MSE、MAPE和RMSE這四個指標上來看,本文算法最優,WGAN-GP次之,LSTM效果最差。本文算法和WGAN-GP相比,加入經驗模態分解后能夠更好地捕捉金融時間序列的非線性特征,降低了預測誤差。

表1 不同預測方法結果對比
針對金融時間序列預測,本文提出了基于經驗模態分解的生成對抗網絡的時間序列預測模型。該模型的生成模型由EMD和LSTM神經網絡組成,判別模型為CNN。生成器的目標函數引入真實值和預測值的均方誤差以提高模型穩定性,并對其進行論證。采用滬深300指數對LSTM、WGAN-GP和本文模型進行實驗,綜合MAPE、MSE、MAE和RMSE四個指標,實驗結果表明本文模型具有較高的預測精度。后續研究工作將考慮政策、新聞等因素對股票價格的影響,以便得到預測準確率更高的模型。