999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習股票風險預測方法的研究

2022-03-15 05:50:27羅曉婷
時代金融 2022年2期
關鍵詞:特征模型

羅曉婷

隨著社會經濟的加速發展,市場發展股份制已經成為一種新的組織形態。越來越多的上市公司通過吸收投資大眾的儲蓄資金擴大籌資來源來賦予公司更大的經營自由度。但是股票屬于商品范圍,其價格波動不僅受市場的供求關系影響,同時還受到國家政策、基本面和行業景氣度的影響。因此,如何準確的預測股票走勢對商業回報和金融領域具有重要意義。

近年來,深度學習不但能夠實現機器學習在眾多場景的應用,而且拓展了人工智能的領域范圍,并使得基于數據驅動的機器輔助功能變為可能。卷積神經網絡(Convolutional Neural Network,CNN)是一種常見前饋神經網絡,是多層感知機(Multilayer Perceptron,MLP)的變種。卷積神經網絡通過自身的局部感受特點可以分別處理每個時間段的數據,將長輸入序列轉換為高級特征組成的更短序列,以此提取各數據的位置特征實現序列空間特征的編碼。長短時記憶網絡(Long Short Term Memory Network, LSTM)屬于循環神經網絡(Recurrent Neural Network,RNN)。當RNN網絡處理序列較長的數據時,由于網絡自身的記憶能力有限,在模型訓練過程中無法結合之前的信息對當前數據賦予權重,從而導致網絡梯度消失。而LSTM網絡在處理數據序列時和殘差網絡相似,通過對信息元各時間段的相加相乘繞過網絡中的部分單元信息從而記住更長的時間步驟,解決了一直以來RNN存在的缺陷。

股票作為典型的時序數據,越來越多的學者通過神經網絡致力于對股票數據的研究分析。早在1990年,Kimoto等人通過模塊化神經網絡對東京證券交易所的數據進行預測分析,取得較好效果。1996年Gen等人利用神經網絡對道瓊斯工業指數進行建模研究測試,證明了股票市場回報的可預測性。Rodriguez等人在2000年利用傳統神經網絡實現了股票預測上的可收益性。2021年黃潤鵬通過將微博情感融入到篩選出的股票指標中對股票漲跌情況進行預測,結果證明預測模型具有較高的準確性。

在時間維度上,股票市場的當前開盤價是在之前收盤價的基礎上加減百分比。在空間維度上,成交量數值的變化對于股票的漲跌影響較大,一般而言,成交量不斷增加股價也將隨之上升。基于此,我們提出一種基于卷積神經和長短時記憶的混合網絡,該網絡綜合考慮股票數據序列之間存在的時空特性。通過卷積神經網絡提取出最高價、前收盤等輸入屬性在空間位置上對收盤價產生影響的特征。利用長短時記憶網絡捕捉時間維度上之前各屬性和當前預測值之間的關系特征。

近年來,CNN在圖像處理方面的運用取得了良好成果,尤其是在步態識別和人臉識別方面取得的成果較為突出。CNN 可以很好地識別出數據中的簡單模式,可以從較短固定長度數據集片段中獲得感興趣特征,并且該特性在數據片段中的位置不具有高度相關性。另外,由于CNN 網絡本身包含池化層、全連接和卷積層,有效降低模型的復雜度提高網絡參數的利用率。因此,通過CNN可以學習數據集內在關系屬性,從而將股票間多元關系信息引入到傳統的時序建模中,進行端到端的趨勢預測。

RNN是根據以往的先驗知識預測當前節點的數值,在自然語言等方面運用的比較多。但是,當需要的歷史數據時間間隔比較大時,RNN很難處理長距離依賴問題,導致在實際應用中很難訓練具有長時間關系的數據特征。LSTM網絡是一種特殊的遞歸循環神經網絡,由于包含的特殊記憶門結構,因此通過LSTM可以深度挖掘股票數據中存在的時序特征解決RNN訓練過程中造成的梯度消失和梯度爆炸等問題。

一、模型構建原理

為了充分提取股票序列數據中存在的時空特性,本文提出了一種基于卷積神經和長短時記憶網絡的模型。該模型首先通過CNN提取出輸入數據的空間特性,然后將其輸出作為LSTM網絡的輸入提取時間特性。

預測模型結構。基于混合神經網絡的股票預測系統,該系統主要包括五部分,分別是輸入層、基于二維卷積神經網絡的局部空間特征子模型、基于長短時記憶網絡的時間特征提取子模型、用于融合全部特征的全連接層和輸出層。

(一)局部空間特征提取子模型

歷史股票數據作為輸入數據,通過多層卷積神經網絡提取數據序列之間在空間位置上存在的關系形成一定的規則,然后通過最大池化減少模型的復雜度,最后通過全連接網絡對提取的特征進行拼接和融合。局部空間特征提取子模型每層網絡的敘述如下:

輸入層:對長度為n的股票數據序列做數據清洗,將其作為整個模型的輸入,輸入數據具體表示為,式中代表股票的最高價、最低價、開盤價、收盤價和收益量等。

多層二維卷積神經網絡:CNN的作用是提取歷史各數據中的空間特征,本文中為了實現局部感知提高特征質量設置了兩層CNN,數據在該層中主要通過卷積核提取抽象特征。此外,由于CNN具有權值共享機制有利于減少網絡中的復雜參數,提高整個模型的健壯性。池化層采用的是最大池化,有利于特征降維,避免網絡訓練過程中容易出現的過擬合現象。

輸出層:CNN層通過卷積、池化等操作提取出數據序列之間的空間特征,將位置關系相對獨立的特征數據相互關聯起來。

(二)時間特征提取子模型

CNN在學習過程中對于時間序列的敏感度不高,因此本文將CNN 提取出的特征作為LSTM網絡的輸入進行時間序列維度方面的預測,從而解決網絡在訓練階段容易出現的梯度爆炸和梯度消失等問題。時間特征提取子模型網絡描述如下:

為了提高特征提取的質量,同時減少整個網絡的復雜度,我們在時間特征提取子模型中設置了三層LSTM網絡,LSTM網絡主要包括遺忘門、輸入門和輸出門和細胞結構。遺忘門的主要作用是幫助網絡在訓練的過程中選擇性的過濾掉特征不明顯的信息,以此提高網絡的存儲記憶能力,具體的計算公式如下:

(1)式中ft是遺忘門的輸出;ht-1和Xt代表遺忘門的輸入;bf是偏置參數,wf是線性關系的系數。

輸入門的作用是決定當前細胞的輸入需要加入多少新信息,用來決定細胞中的哪些信息需要更新哪些信息被用做備用更新內容。具體的表達方式如下:

(2)和(3)式主要包括兩部分內容,第一步首先通過sigmod函數決定網絡需要更新的數據,第二步是通過函數用來創建候選值Ct,以此去掉網絡中暫時不需要的信息,有效提高網絡存儲數據的能力。

輸出門決定模型的輸出,首先是通過sigmoid層得到初始輸出,然后通過tanh函數將Ct的值縮放到[-1,1],再與sigmoid得到的輸出逐對相乘,從而得到模型的輸出,表達公式如(4)和(5)式:

(三)特征融合及輸出

通過CNN和LSTM網絡提取到數據時空特征后,為了提高特征的區分性,本文進一步利用全連接線性方程對應的超平面逼近或者擬合了復雜的超曲面,整合了卷積層或者池化層中的局部信息,實現了特征的有效提取。輸出是指全連接層經過高維到低維映射之后實現的回歸線性輸出,輸出特征只包括一個預測收盤價格。

二、實驗與結果

(一) 數據集介紹

本文的實驗數據選用的是從網易財經獲取到的1992年到2021年滬深300指數。原始數據總共包括6700條,每條數據包括日期、股票代碼、名稱、收盤價、最高價、最低價、開盤價、前收盤、漲跌額、漲跌幅、成交量和成交金額12個屬性。經數據清理篩選出了6000條數據作為實驗數據,其中5500條作為訓練數據,300條數據作為驗證數據,剩余的200條數據作為測試集。同時,由于日期、股票代碼和名稱等屬性在網絡訓練過程中對于每個神經元沒有特征區分度,去除掉這些屬性減少網絡的輸入復雜度。

模型的輸入包括8個屬性分別是最高價、最低價、開盤價、前收盤、漲跌額、漲跌幅、成交量和成交金額,輸出是收盤價。由于股票屬于時序數據,所以當前收盤價作為標簽數據受到過去多個輸入數據的影響。因此在本文中利用前15條輸入數據預測第16天的股票收盤價,具體的輸入輸出數據樣例如表1所示:

(二)網絡超參數設置

本文提出的CNN+LSTM混合網絡由兩個卷積層,一個最大池化層與全連接層組成,其中為了把特征保留并映射出來,本文采用修正線性單元(Rectified linear unit, ReLU)作為提取空間特征神經元的激活函數。第一層卷積層有32個卷積核、尺寸為1*4;第二層卷積層有16個卷積核,尺寸為1*2,步長為4。在CNN網絡之后設置了三層LSTM網絡、隱藏層為64、學習率設置為0.00008,迭代總次數為500個epoch,每次輸入網絡中的數據批次為500。

在CNN和LSTM網絡前向傳播階段,依次調用每個網絡層的Forward函數,得到逐層的輸出,采用均方誤差(MSELoss)將最后一層與目標函數比較得到損失函數,然后計算二者誤差更新網絡中各個神經元的權重。經多次調參之后,最終模型接近收斂時驗證集損失函數。

橫坐標代表迭代次數,縱坐標代表隨著模型的訓練收盤價預測值和真實值之間產生的損失值。當迭代次數接近于50步時,損失值的變化趨于穩定。

(三)評價指標

本文采用實際數據(target data, td)和預測數據(predicted data, pre)之間的平均相對誤差(Mean Relative Error, MRE)和平均絕對誤差(Mean Absolute Error, MAE)作為模型預測的評價指標,具體的計算公式如式(6)和(7)所示:

以上兩個指標用來衡量模型的預測能力,在股票預測系統,如果值越小則代表預測值和實際股票的差值越小,模型預測的精度越高。

(四)實驗結果分析

為了驗證我們提出方法的可靠性和模型的精確性,本文對于收盤價的預測值和真實值做了對比,其中橫坐標代表不同時間點,縱坐標代表不同時間點上的收盤價格。此外,本文設置了三組控制組試驗,分別是:CNN+全連接、LSTM+全連接和CNN+RNN。

如果只通過CNN網絡預測收盤價,由于卷積神經網絡只提取的是特征數據之間的空間位置特性,對于股票這種時序數據的敏感度不高,因此模型效果較差。通過LSTM網絡預測收盤價,雖然LSTM網絡能夠提取數據之間的時間特性,但是迭漲額和前收盤屬性在空間位置上存在關聯,因此效果不理想。利用CNN+RNN網絡得到的預測值可以看出和真實值差值比較明顯,主要原因是RNN網絡存在的特有時間依賴性,導致網絡在訓練過程中不能關聯長時間距離節點的信息,從而使得網絡梯度消失。利用本文提出的方法得到的收盤價預測值接近于真實值,效果最好。為了更直觀的展現各個方法的精確性,4種模型的平均相對誤差和平均絕對誤差。

在各模型超參數達到最優的條件下,我們提出的模型精確度明顯優于其它三個控制組,利用LSTM+全連接的模型精確度高于CNN+全連接,而結合CNN網絡模型精確度在四個控制組里最低。

三、結語

股票市場通過促進資本的集中,有利于企業資本的有機構成,在很大程度上加快了商品經濟的發展。但由于受多種因素影響,股價的波動是一個極其復雜的非線性動力學系統,近年來對股價預測的研究結果往往不盡人意。利用神經網絡的復雜函數非線性無限逼近能力使深度學習在這一領域取得了令人矚目的成果。本文提出了一種基于卷積神經和長短時記憶的混合網絡,該網絡首先通過卷積神經網絡提取出輸入數據在空間位置上的相關性,并經過池化、全連接等操作實現特征的降維和壓縮,簡化整個的網絡復雜度,然后利用長短時記憶網絡提取出了信息之間的時間相關性,最后通過全連接網絡同時提取數據的時空特性。通過與控制組實驗結果的分析和比較,證明利用本文提出的混合網絡預測股票收盤價的預測方法在精確度方面較其他方法具有明顯的優越性。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 久久无码高潮喷水| 另类欧美日韩| 2020极品精品国产| 久久久久久高潮白浆| 久久无码av三级| 免费A∨中文乱码专区| 国产精品尹人在线观看| 国产97视频在线| 亚洲无码一区在线观看| 91在线播放国产| 91探花国产综合在线精品| 91精品国产福利| 综合五月天网| 免费看的一级毛片| 色噜噜在线观看| 国产一区二区三区视频| 国产欧美精品专区一区二区| 欧美一级专区免费大片| 亚洲丝袜第一页| 999国产精品| 国产精品微拍| 亚洲一区二区三区中文字幕5566| 一级毛片网| 青青操国产视频| 久久精品这里只有国产中文精品| 国产精鲁鲁网在线视频| a亚洲视频| 熟女成人国产精品视频| 久久人午夜亚洲精品无码区| 国产一区二区人大臿蕉香蕉| 欧美一级99在线观看国产| 自拍偷拍欧美| 久久五月天综合| 国产成人精品三级| 2021无码专区人妻系列日韩| 国产 在线视频无码| 亚洲伊人久久精品影院| 国产成人综合日韩精品无码不卡| 青青草原国产| 国产尤物在线播放| 97久久精品人人| 午夜激情福利视频| 无码中字出轨中文人妻中文中| 亚洲天堂日韩在线| 亚洲成人一区二区三区| 欧美a在线看| 2021亚洲精品不卡a| 久久久久青草线综合超碰| 国产福利在线观看精品| 日韩小视频在线观看| 又黄又湿又爽的视频| 日本一区中文字幕最新在线| 久久精品亚洲中文字幕乱码| 国产幂在线无码精品| 国产精品久久久精品三级| 四虎永久在线视频| 久久综合五月| 久久99国产精品成人欧美| 欧美一级99在线观看国产| 国产午夜精品鲁丝片| 国产啪在线91| 国产日本欧美在线观看| 无码精品国产dvd在线观看9久 | 欧美三级自拍| 波多野结衣一级毛片| 国产爽妇精品| 国产精品永久不卡免费视频| 国产成人高清精品免费| 亚洲欧美一区在线| 极品性荡少妇一区二区色欲| 99视频精品全国免费品| 免费不卡在线观看av| 国产精品久久久久久影院| 四虎国产成人免费观看| 高清无码手机在线观看| 日韩精品一区二区三区大桥未久 | 亚洲精品无码专区在线观看| 99精品伊人久久久大香线蕉 | 欧美a级在线| 成人国产小视频| 91色在线观看| 老司国产精品视频|