基于社交媒體文本信息的金融時(shí)序預(yù)測(cè)

2021-08-23 04:00:18李大舟

計(jì)算機(jī)工程與設(shè)計(jì) 2021年8期

李大舟，于沛，高巍，馬輝

(沈陽(yáng)化工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院，遼寧沈陽(yáng) 110142)

0 引言

金融時(shí)序預(yù)測(cè)對(duì)于制定有效的市場(chǎng)交易策略和保持經(jīng)濟(jì)健康持續(xù)發(fā)展具有重要意義。近年來，深度學(xué)習(xí)技術(shù)在自然語言處理[1-3]、語音識(shí)別[4]等一系列的復(fù)雜時(shí)序任務(wù)中得到廣泛應(yīng)用。與傳統(tǒng)的淺層機(jī)器學(xué)習(xí)相比，深度學(xué)習(xí)通過構(gòu)造更深層的網(wǎng)絡(luò)結(jié)構(gòu)來加強(qiáng)模型捕捉高級(jí)復(fù)雜特征的能力，從而能夠挑戰(zhàn)更加復(fù)雜的問題。Peng等[5]將文本挖掘和詞嵌入相結(jié)合，從金融新聞中提取特征，并使用深度神經(jīng)網(wǎng)絡(luò)模型(deep neural networks，DNN)預(yù)測(cè)股票走勢(shì)。實(shí)驗(yàn)驗(yàn)證了金融新聞特征在股票預(yù)測(cè)任務(wù)中的有效性。Huy等[6]使用來自路透社、彭博社的財(cái)經(jīng)新聞和股票價(jià)格數(shù)據(jù)集，通過雙向門控循環(huán)單元(bidirectional gated recurrent unit，BiGRU)來預(yù)測(cè)未來的股票走勢(shì)。Ishan等[7]利用格蘭杰因果關(guān)系分析了大量過去可用的數(shù)據(jù)，將新聞數(shù)據(jù)與股票數(shù)據(jù)相結(jié)合，對(duì)股價(jià)的變動(dòng)進(jìn)行分類，并結(jié)合一定的因素進(jìn)行評(píng)估，提出了一種基于分段向量的信息分類機(jī)制和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short term memories，LSTM)的預(yù)測(cè)模型。Leonardo等[8]提出了一種基于字符級(jí)的神經(jīng)語言模型，并利用金融新聞數(shù)據(jù)集和LSTM網(wǎng)絡(luò)進(jìn)行趨勢(shì)預(yù)測(cè)的方法。Jordan等[9]使用各種文本情緒分析工具來處理金融新聞，如情緒分析和事件提取等，使用LSTM和特定的卷積架構(gòu)來進(jìn)行股市趨勢(shì)預(yù)測(cè)。Liu等[10]使用TransE模型和卷積神經(jīng)網(wǎng)絡(luò)來從金融新聞中提取特征。這種方法有效地提高了文本特征提取的準(zhǔn)確性，同時(shí)減少新聞標(biāo)題的稀疏性。另一方面，該文章提出了一種從每日交易數(shù)據(jù)和技術(shù)指標(biāo)中提取特征向量的聯(lián)合特征提取方法與LSTM模型相結(jié)合來進(jìn)行股票價(jià)格預(yù)測(cè)。Zhang等[11]使用RNN、LSTM、GRU分別對(duì)標(biāo)準(zhǔn)普爾(S&P)500股票指數(shù)進(jìn)行金融時(shí)序預(yù)測(cè)。基于以上針對(duì)金融時(shí)序預(yù)測(cè)任務(wù)所取得的成果，本文提出了一種基于社交媒體文本信息的股票趨勢(shì)預(yù)測(cè)(BiTCN-LSTM)模型，該模型主要包括：①構(gòu)建基于雙向時(shí)間卷積網(wǎng)絡(luò)的情感分類方法，對(duì)爬取的金融新聞文章進(jìn)行情感特征提取。②使用LSTM網(wǎng)絡(luò)和差分運(yùn)算完成金融時(shí)間序列預(yù)測(cè)任務(wù)。

1 構(gòu)建基于社交媒體文本信息的股票趨勢(shì)預(yù)測(cè)(BiTCN-LSTM)模型

本文提出了BiTCN-LSTM算法，用于股票預(yù)測(cè)任務(wù)。算法分為BiTCN情感分析和LSTM金融時(shí)序預(yù)測(cè)兩部分。情感分析部分使用雙向時(shí)間卷積網(wǎng)絡(luò)對(duì)整個(gè)社交媒體文本信息進(jìn)行情感分析，獲得情感特征；金融時(shí)序預(yù)測(cè)部分將差分運(yùn)算后的金融時(shí)間數(shù)據(jù)和從文本中得到的情感特征加權(quán)融合作為輸入，運(yùn)用LSTM神經(jīng)網(wǎng)絡(luò)完成股票預(yù)測(cè)任務(wù)。總體框架如圖1所示。

圖1 總體框架

1.1 構(gòu)建基于雙向時(shí)間卷積網(wǎng)絡(luò)的情感分類方法

為了能夠更好地解決時(shí)序性問題，本文提出的模型應(yīng)用了時(shí)間卷積網(wǎng)絡(luò)[12]。普通的時(shí)間卷積網(wǎng)絡(luò)對(duì)源文本數(shù)據(jù)進(jìn)行單向卷積計(jì)算，完成序列建模，每個(gè)詞匯(特指在文章分詞后的一個(gè)詞語，后文統(tǒng)稱為詞匯)的編碼信息僅僅來自于上文的文本語義特征。但是在文本處理任務(wù)中，詞匯的語義信息來源與詞匯的下文語義信息也有很大的關(guān)聯(lián)。因此，單向的時(shí)間卷積網(wǎng)絡(luò)會(huì)忽略下文的語義信息，不能夠更好地獲取全文的文本語義特征。針對(duì)以上情況，本文提出一種基于雙向時(shí)間卷積網(wǎng)絡(luò)的情感分類算法，對(duì)文本進(jìn)行雙向特征提取，再將前向和后向的最后一個(gè)時(shí)刻的特征向量進(jìn)行融合，從而得到文本整體語義向量，并在此基礎(chǔ)上對(duì)文本進(jìn)行情感分析。BiTCN情感分析部分框架如圖2所示。

圖2 BiTCN情感分析框架

(1)詞嵌入

本文使用fastText[13]工具來構(gòu)建詞向量。在金融文本數(shù)據(jù)集上進(jìn)行詞向量預(yù)訓(xùn)練，得到所有詞匯的稠密詞向量表示。該方式訓(xùn)練的詞向量能夠很好地表達(dá)詞匯的信息特征，能夠體現(xiàn)出詞匯之間的相似性和關(guān)聯(lián)性。此外，fastText工具還可以快速搭建簡(jiǎn)單的分類器，對(duì)每一個(gè)詞匯所屬于的情感類別進(jìn)行初步預(yù)判，從而幫助模型對(duì)文本進(jìn)行情感分析。

本文對(duì)一篇文章分詞后的序列E={e1,e2,…,en}進(jìn)行詞嵌入時(shí)，將每一個(gè)詞匯et在詞匯表中的one-hot編碼拼接成輸入矩陣nword∈Rn×Nword>，再通過嵌入矩陣Ww轉(zhuǎn)化為詞向量矩陣ew。詞嵌入矩陣如圖3所示

圖3 詞嵌入矩陣

ew=nword(Ww)T

(1)

其中，Ww∈RDd×Nword>，Nword表示詞匯表中的詞匯數(shù)，Dd表示詞向量維度。

(2)雙向空洞因果卷積層

時(shí)間卷積網(wǎng)絡(luò)中卷積的因果性質(zhì)主要通過因果卷積[14]實(shí)現(xiàn)。因果卷積的輸出僅與當(dāng)前(t時(shí)間點(diǎn))與過去(0～t-1時(shí)間點(diǎn))的輸入有關(guān)，不涉及到未來(t+1時(shí)間點(diǎn))的信息。一維因果卷積層可視化如圖4所示。

圖4 一維因果卷積層

本文在輸入序列的左側(cè)進(jìn)行k-1個(gè)零向量填充(k為卷積核大小)。目的是將輸入向量的維度與卷積計(jì)算后的結(jié)果維度相同，即

(2)

如圖3所示，若想要增加卷積的感受野，構(gòu)建長(zhǎng)期記憶，那么因果卷積需要非常多的層級(jí)數(shù)或較大的卷積核。而卷積層數(shù)的增加可能會(huì)帶來梯度消失、訓(xùn)練復(fù)雜、擬合效果不好等問題。為了杜絕這個(gè)問題，本文提出的模型在因果卷積的基礎(chǔ)上引入了空洞卷積。

空洞卷積的定義請(qǐng)參見文獻(xiàn)[15]，在保證參數(shù)個(gè)數(shù)不變和輸出的特征映射大小不變的情況下，增大了卷積核的感受野。對(duì)于一維的輸入序列ew∈R和卷積核filter:{1,2,…,k-1}∈R，對(duì)序列中的ω元素的空洞卷積運(yùn)算公式如下

(3)

其中，d為空洞系數(shù)，控制兩個(gè)卷積核之間插入多少個(gè)零向量，ω表示當(dāng)前元素所在的單元位置，ω-d·i表示上一層使用的輸入單元位置。

為了確保能夠產(chǎn)生足夠長(zhǎng)的有效歷史信息以及使卷積核能夠在有效的歷史信息中覆蓋所有的輸入單元，d將隨著網(wǎng)絡(luò)深度的增加而指數(shù)級(jí)地增大。空洞因果卷積層可視化如圖5所示。

圖5 空洞因果卷積層

如圖5所示，卷積核大小k為2，第一層使用的空洞系數(shù)d為1，后面層級(jí)的空洞大小依次加大。如圖4所示，常規(guī)因果卷積只能觀察到最后5個(gè)輸入數(shù)據(jù)，而空洞因果卷積可以觀察到所有16個(gè)輸入數(shù)據(jù)，并且空洞因果卷積執(zhí)行的速度更快，效率更高。

由于時(shí)間卷積網(wǎng)絡(luò)的感受野隨網(wǎng)絡(luò)深度的加深而擴(kuò)大，會(huì)出現(xiàn)訓(xùn)練困難、收斂緩慢等問題，因此，本文模型引入殘差模塊[16]和批標(biāo)準(zhǔn)化手段以解決上述問題。模型在應(yīng)用了批標(biāo)準(zhǔn)化后的殘差模塊結(jié)構(gòu)如圖6所示。

圖6 加入批標(biāo)準(zhǔn)化的殘差模塊結(jié)構(gòu)

批標(biāo)準(zhǔn)化是通過一定的規(guī)范手段，把在訓(xùn)練過程中越來越偏的分布強(qiáng)制拉回到均值為0方差為1的標(biāo)準(zhǔn)正態(tài)分布，讓梯度變大，從而避免梯度消失問題產(chǎn)生。

假設(shè)每個(gè)batch輸入為L(zhǎng)={l1,l2,…,lu},共有u個(gè)，則某個(gè)樣本li的線性激活值sli為

sli=Wlli+b

(4)

其中，Wl為權(quán)重矩陣，b為偏置系數(shù)。

如圖5所示，對(duì)隱藏層內(nèi)每個(gè)神經(jīng)元的激活值sli進(jìn)行均值為0，方差為1的正態(tài)分布變換。詳細(xì)計(jì)算過程如下

(5)

(6)

(7)

(8)

通過式(4)-式(8)，使模型的梯度增大并加快了訓(xùn)練收斂速度。但該正態(tài)分布變換會(huì)使網(wǎng)絡(luò)的表達(dá)能力下降，故本文設(shè)置了兩個(gè)調(diào)節(jié)參數(shù)γ,β。對(duì)變換后的值再進(jìn)行反變換操作，從而抵消正態(tài)分布變換的副作用。

(9)

(10)

其中，Wp×q是線性變換參數(shù)矩陣，p為原始向量維度，q為線性變換后的語義向量維度。

所謂“無理”，是指語言表達(dá)打破了習(xí)慣的思維邏輯，違反常情，不合常理；而所謂“妙”，是指讀者在品讀詩(shī)句，鑒賞詩(shī)情時(shí)，所產(chǎn)生的獨(dú)特深刻的審美快感。這些詩(shī)句有的描寫事物時(shí)用一種反常規(guī)的詞語搭配，或者反常規(guī)的句法結(jié)構(gòu)；有的表達(dá)情意時(shí)有悖常識(shí)，或者不合情理，但表達(dá)出來的卻是極為引人入勝的審美效果。詩(shī)歌若是寫，新穎且別有滋味。而個(gè)中韻味，則有待我們細(xì)咂慢品。

(11)

(3)softmax輸出

利用融合后的語義特征信息h，經(jīng)過softmax層得到每個(gè)交易日的文本情感特征向量

p=softmax(hW2q×c+b)

(12)

其中，W2q×c為參數(shù)矩陣，c是情感分類的類別，b為偏差，其維度也是c。

1.2 構(gòu)建基于LSTM神經(jīng)網(wǎng)絡(luò)的金融時(shí)序預(yù)測(cè)方法

在本小節(jié)中，將分別介紹差分運(yùn)算和LSTM神經(jīng)網(wǎng)絡(luò)。首先，對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行差分運(yùn)算預(yù)處理，處理后的金融時(shí)序數(shù)據(jù)和文本情感特征向量作為輸入，通過LSTM神經(jīng)網(wǎng)絡(luò)完成金融時(shí)序預(yù)測(cè)任務(wù)。金融時(shí)序預(yù)測(cè)部分框架如圖7所示。

圖7 金融時(shí)序預(yù)測(cè)框架

(1)差分運(yùn)算

平穩(wěn)的時(shí)間序列是建立時(shí)間序列預(yù)測(cè)模型的前提，由于金融時(shí)間數(shù)據(jù)具有非線性、非平穩(wěn)[17]的特性。因此，選用差分運(yùn)算對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行預(yù)處理。差分運(yùn)算通過計(jì)算相鄰交易日的調(diào)整后收盤價(jià)的差值，來獲得較為平穩(wěn)的時(shí)間序列。假設(shè)金融時(shí)間序列為D={d1,d2,…,dm}，m是金融時(shí)序數(shù)據(jù)量，t時(shí)刻的差分運(yùn)算如式(13)所示

d′>t=dt-dt-1

(13)

其中d′>t是差分后的序列(第t-1天和第t天調(diào)整后收盤價(jià)的漲跌點(diǎn))，dt和dt-1分別是原始序列中第t天和第t-1天的調(diào)整后收盤價(jià)。

(2)LSTM神經(jīng)網(wǎng)絡(luò)

循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network，RNN)是一種特殊的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，其與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比，RNN模型具有時(shí)序性，前一個(gè)隱層的輸出會(huì)作為下一個(gè)隱層的輸入，由此引入了時(shí)間維度。但在預(yù)測(cè)過程中，仍然存在梯度爆炸和梯度消失的問題。因此，使用RNN模型進(jìn)行長(zhǎng)序列處理的效果不佳，導(dǎo)致時(shí)間序列的長(zhǎng)期依賴關(guān)系難以學(xué)習(xí)[18]。

長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short term memories，LSTM)是一種特殊的循環(huán)體結(jié)構(gòu)，它的一個(gè)重要設(shè)計(jì)是加入了記憶細(xì)胞狀態(tài)c和三大“門”結(jié)構(gòu)。LSTM模型與RNN模型相比，克服了梯度爆炸和梯度消失的困難，更能夠記住長(zhǎng)期的信息[19]。LSTM網(wǎng)絡(luò)單元如圖8所示。

圖8 LSTM網(wǎng)絡(luò)單元

如圖8所示，差分后金融時(shí)間數(shù)據(jù)的輸入序列為D={d′>1,d′>2,…,d′>m}，文本情感特征的輸入序列為P={p1,p2,…,pm}，則LSTM的隱藏狀態(tài)分別為S1,S2,…,Sm。LSTM模型具有三“門”一狀態(tài)結(jié)構(gòu)，包括輸入門、遺忘門、輸出門和細(xì)胞狀態(tài)。其中，輸入門控制那些信息傳遞到當(dāng)前狀態(tài)中，遺忘門控制從當(dāng)前狀態(tài)中移除哪些信息，輸出門控制當(dāng)前狀態(tài)中的哪些信息用作輸出。

在LSTM循環(huán)體中，輸入門、遺忘門和輸出門的輸入均為t時(shí)刻的金融數(shù)據(jù)輸入d′>t、t時(shí)刻的文本特征輸入pt和t-1時(shí)刻的隱藏狀態(tài)St-1，并使用sigmoid函數(shù)將門的輸出控制在區(qū)間[0,1]。假設(shè)隱藏單元個(gè)數(shù)為s，t時(shí)刻的輸入門、遺忘門和輸出門分別計(jì)算如下

(14)

it=σ(d′>tWdi+ptWpi+St-1Whi+bi)

(15)

ft=σ(d′>tWdf+ptWpf+St-1Whf+bf)

(16)

ot=σ(d′>tWdo+ptWpo+St-1Who+bo)

(17)

其中，σ為sigmoid函數(shù)，Wdi,Wpi,Wdf,Wpf,Wdo,Wpo為輸入權(quán)重，Whi,Whf,Who分別為輸入門權(quán)重、遺忘門權(quán)重和輸出門權(quán)重，bi,bf,bo為偏差參數(shù)。

(18)

其中，Wdc,Wpc,Whc為權(quán)重參數(shù)，bc為偏差參數(shù)。

(19)

其中，?為按元素乘法。

最后，t時(shí)刻的記憶細(xì)胞ct經(jīng)過tanh層得到一個(gè)值域?yàn)閇-1,1]的向量，該向量與輸出門得到的輸出向量ot相乘，便可得到最終的隱藏狀態(tài)St

St=ot?tanh(ct)

(20)

2 實(shí)驗(yàn)與分析

2.1 數(shù)據(jù)集

本文以上海證券綜合指數(shù)(又稱上證指數(shù))作為研究對(duì)象，金融時(shí)序數(shù)據(jù)樣本采用從2010年1月1日到2020年4月15日的上證指數(shù)數(shù)據(jù)，共計(jì)2499個(gè)交易日的股票歷史數(shù)據(jù)。每個(gè)交易日都擁有5個(gè)標(biāo)簽(開盤價(jià)、最高價(jià)、最低價(jià)、調(diào)整后收盤價(jià)、振幅和成交額)，本文選用調(diào)整后收盤價(jià)作為該模型的預(yù)測(cè)目標(biāo)。上證指數(shù)的調(diào)整后收盤價(jià)如圖9所示。

圖9 上證指數(shù)的調(diào)整后收盤價(jià)

為了從數(shù)據(jù)源上保證文本語料和股市之間的領(lǐng)域相關(guān)性，本文自行爬取的金融社交媒體的文本信息主要來源是東方財(cái)富財(cái)經(jīng)新聞。每個(gè)交易日對(duì)應(yīng)數(shù)十條社交媒體信息，共371 020條社交媒體信息數(shù)據(jù)。

本文將金融時(shí)序數(shù)據(jù)按照80%和20%的比例分為兩部分，分別為訓(xùn)練集和測(cè)試集。測(cè)試集有252個(gè)數(shù)據(jù)，用于評(píng)估模型的預(yù)測(cè)效果。實(shí)驗(yàn)數(shù)據(jù)集見表1。

表1 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)

2.2 參數(shù)設(shè)置

本文中出現(xiàn)的符號(hào)說明見表2，其它符號(hào)均在文中詳細(xì)標(biāo)注。

表2 本文中出現(xiàn)的符號(hào)說明

本文通過對(duì)數(shù)據(jù)集與模型的分析，調(diào)整超參數(shù)初始值，以達(dá)到誤差最小化。模型的驗(yàn)證曲線與學(xué)習(xí)曲線如圖10所示。

如圖10(a)所示，網(wǎng)絡(luò)深度在0-5層內(nèi)，隨著網(wǎng)絡(luò)深度的增加，訓(xùn)練分?jǐn)?shù)和交叉驗(yàn)證分?jǐn)?shù)不斷增大。網(wǎng)絡(luò)深度到達(dá)5層之后，分?jǐn)?shù)慢慢接近最大值。因此本文的網(wǎng)絡(luò)深度選擇為5層。如圖10(b)所示，學(xué)習(xí)曲線顯示了一個(gè)非常高的可變性，并且在第520個(gè)交易日之前交叉驗(yàn)證分?jǐn)?shù)很低。第520個(gè)交易日后兩條曲線慢慢融合在一個(gè)很高的分?jǐn)?shù)上，因此，數(shù)據(jù)量大的數(shù)據(jù)集可以使模型預(yù)測(cè)效果變好。

圖10 BiTCN-LSTM模型的驗(yàn)證與學(xué)習(xí)曲線

正則化旨在引入一個(gè)α值參數(shù)來對(duì)其相互之間系數(shù)的權(quán)重進(jìn)行標(biāo)準(zhǔn)化并且懲罰其模型復(fù)雜度。α值與模型復(fù)雜度呈負(fù)相關(guān)性，α值越低，模型越復(fù)雜，由于方差增加而增加的誤差也會(huì)相應(yīng)增加。另一方面，α值越高，模型越簡(jiǎn)單，由于偏差造成的誤差就會(huì)越大。因此，選擇最佳的α值，以便達(dá)到最小化誤差的效果。不同α值選擇對(duì)正則化的影響如圖11所示。

圖11 誤差與不同α值選擇的變化曲線

如圖11所示，α值為2.006時(shí)，模型誤差達(dá)到最小化。故本文正則化參數(shù)α值設(shè)置為2.006。

2.3 金融時(shí)序預(yù)測(cè)的評(píng)價(jià)方法

(21)

2.4 實(shí)驗(yàn)結(jié)果分析

本文采用上述數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，在金融時(shí)序預(yù)測(cè)模型訓(xùn)練過程中使用均方誤差損失，使用Adam算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)重，batch_size為40，dropout[20]設(shè)置為0.8。迭代500輪的結(jié)果如圖12所示。虛線和實(shí)線分別代表訓(xùn)練損失值(train loss)變化情況和測(cè)試損失值(test loss)變化情況。

圖12 BiTCN-LSTM模型訓(xùn)練損失值與測(cè)試損失值變化曲線

模型測(cè)試集中500天的預(yù)測(cè)值與真實(shí)值的對(duì)比曲線如圖13(a)所示。實(shí)線和虛線分別代表數(shù)據(jù)標(biāo)準(zhǔn)化后的測(cè)試集預(yù)測(cè)值和真實(shí)值的變化情況。預(yù)測(cè)值與真實(shí)值之間的差異曲線如圖13(b)所示。殘差如圖13(c)所示。

圖13 BiTCN-LSTM模型預(yù)測(cè)值與真實(shí)值對(duì)比

如圖13(b)、圖13(c)所示，模型預(yù)測(cè)值曲線呈正態(tài)分布，符合自然規(guī)律。此外，本文提出的BiTCN-LSTM模型對(duì)由重大政治事件或重大自然災(zāi)害等因素影響而引起的突然的價(jià)格上漲或下跌也具有較好的預(yù)測(cè)效果。

此外，本文與3個(gè)傳統(tǒng)金融時(shí)序預(yù)測(cè)模型進(jìn)行了對(duì)比實(shí)驗(yàn)，實(shí)驗(yàn)結(jié)果詳情見表3。其中：

表3 不同模型之間的RMSE評(píng)價(jià)指標(biāo)對(duì)比

ARIMA[21]：代表文獻(xiàn)[21]中提出的股票趨勢(shì)預(yù)測(cè)模型。

RNN[22]：代表基于循環(huán)神經(jīng)網(wǎng)絡(luò)的股票趨勢(shì)預(yù)測(cè)模型。

LSTM[23]：代表基于長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的股票趨勢(shì)預(yù)測(cè)模型。

BiTCN-LSTM(本文)：代表本文提出的基于社交媒體文本信息和LSTM的股票趨勢(shì)預(yù)測(cè)模型。

由表3可以看出，以上海證券綜合指數(shù)作為研究對(duì)象，使用ARIMA模型、RNN模型和LSTM模型所得到的RMSE值分別為55.30、23.61和15.12。與此同時(shí)，本文設(shè)計(jì)的BiTCN-LSTM模型得到的RMSE值為11.68，本文模型與傳統(tǒng)金融時(shí)序預(yù)測(cè)模型相比，RMSE值分別降低78.88%、50.53%和22.75%。

2020年初的新冠肺炎疫情肆虐，從2020年第一個(gè)交易日的A股暴跌到美股的4次熔斷，疫情對(duì)股市的影響巨大。本文針對(duì)上述情況將LSTM模型與本文模型(BiTCN-LSTM)做對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如圖14所示。虛線代表使用LSTM模型的預(yù)測(cè)值，點(diǎn)線代表真實(shí)值，實(shí)線代表使用本文模型的預(yù)測(cè)值。

圖14 LSTM模型與本文模型的對(duì)比實(shí)驗(yàn)結(jié)果

如圖14所示，由于疫情影響，導(dǎo)致近期股市的波動(dòng)劇烈。LSTM模型無法做到準(zhǔn)確預(yù)測(cè)，而本文模型在加入社交媒體文本情感特征后，能夠較為準(zhǔn)確地預(yù)測(cè)股市趨勢(shì)。因此，本文所提出的BiTCN-LSTM模型具有更好的預(yù)測(cè)性能。

3 結(jié)束語

股市在市場(chǎng)經(jīng)濟(jì)中占據(jù)重要地位，準(zhǔn)確的金融時(shí)序預(yù)測(cè)結(jié)果對(duì)股市交易操作和規(guī)避股市風(fēng)險(xiǎn)都具有指導(dǎo)作用。本文通過對(duì)金融時(shí)序預(yù)測(cè)的研究與學(xué)習(xí)，針對(duì)傳統(tǒng)預(yù)測(cè)模型中忽略社交媒體文本信息對(duì)股價(jià)變化影響等問題，提出了一種融合社交媒體文本信息和LSTM的股票趨勢(shì)預(yù)測(cè)模型(BiTCN-LSTM)。針對(duì)傳統(tǒng)預(yù)測(cè)模型中忽略社交媒體文本信息對(duì)股價(jià)變化的影響，該方法使用雙向時(shí)間卷積網(wǎng)絡(luò)對(duì)社交媒體文本信息進(jìn)行特征提取和情感分類，在預(yù)測(cè)模型的輸入層面加入社交媒體文本信息特征。同時(shí)結(jié)合差分運(yùn)算和LSTM神經(jīng)網(wǎng)絡(luò)，有效解決了時(shí)間序列的平穩(wěn)性問題，進(jìn)一步提高了預(yù)測(cè)準(zhǔn)確率。采用上證指數(shù)和股票社區(qū)評(píng)論作為基準(zhǔn)數(shù)據(jù)集，實(shí)驗(yàn)對(duì)比分析了現(xiàn)有金融時(shí)序預(yù)測(cè)方法，本文的股票趨勢(shì)預(yù)測(cè)效果有了很大的提升。