溫玉蓮,林培光
(山東財經大學計算機科學與技術學院,濟南,250014)
股票市場是國家經濟發展的重要組成部分,預測股票價格走勢對政府、投資者和投資機構有重要意義,吸引了很多學者進行研究.然而股票市場價格走勢受政治、經濟、法律、軍事等多方面因素的影響,導致股票價格的不確定性和波動性很大,難以挖掘有效特征,這是研究的一大難題.
2006 年以來,“深度學習”[1]受到工業界和學術界的廣泛關注,已成為人工智能發展的熱門技術之一,在語音識別[2-3]、計算機視覺[4-5]等領域取得了巨大成功.從2013 年開始,在自然語言處理[6-7]領域也出現深度學習的應用浪潮.近年來,深度學習在時間序列研究領域[8-9]也取得了初步的成果,例如,Fischer and Krauss[8]使用LSTM(Long Short-Term Memory)深度學習方法進行指數時間序列預測研究,Lasheras et al[9]使用Elman RNN(Recurrent Neural Network)深度學習方法對大宗商品價格進行時間序列預測研究,均取得了較好的成果.股票時序數據研究是時間序列研究領域的重要模塊,深度學習在其中的應用存在三個問題:第一,未來股票市場趨勢預測受多方面因素的影響,如何有效選擇、挖掘和提取影響股票預測的關鍵特征;第二,根據股票數據非線性和長期依賴關系的特點,如何有效地構建模型對未來股票市場趨勢進行更準確的預測;第三,不同行業的股票對于模型的超參數的敏感度可能不同,如何根據不同行業的股票信息特征選擇合適的超參數使模型的預測性能更好.
為解決上述三個問題,本文提出利用WBED混合模型對不同行業背景下的股票信息進行時間序列預測研究.首先,利用WB(Wrod2vec-Bi-LSTM)模型挖掘股民評論文本特征;……