衛海軍
如果把股票價格圖表看成圖像,則可以使用深度學習神經網絡(DLNN)進行圖像建模。DLNN 可以模仿技術分析師的工作,通過價格圖表和股票基本面(如市盈率)預測短期股價波動。本文運用2014—2019 年A 股股票數據進行研究,結果發現在我國股票市場價格的預測中,深度學習模型比單層模型表現更好。DLNN 能夠提供可定制的統計工具,有效分析價格圖表。更重要的是,過去不同時期的收盤價所形成的價格趨勢,在預測未來價格走勢時,主宰著股票基本面。因此本文提出建議,股市技術分析師應該通過DLNN 模型將價格趨勢納入他們的預測方法。
深度學習(DL)模型和人工神經網絡(ANN)模型最早于20 世紀50 年代在計算機科學中提出(Rosenblatt,1958)。DL 模型可以用神經網絡近似任何復雜函數,能夠達到無限維,具有很高的擬合能力。深度學習神經網絡(DLNN)采用多級信息提取過程,每個連續的層或非線性模塊將一個層的表示轉換為更高層的表示(LeCun等,2015)。與單層神經網絡(SLNN)不同,DL 模型可以通過構成足夠的變換來學習復雜的函數。DLNNs 顯著改善了語音識別、視覺物體識別等領域(Schmidhuber,2015)。
神經網絡以其可擬合高度復雜的非線性系統、擁有靈活并且可以根據自身情況進行自調節的拓撲結構、高度并行的處理機制以及具有自組織、自學習能力的特點受到了國內外研究者及行業從業人員的青睞和重視。國外方面,Gu 等人(2020)將神經網絡用于預測美國股票價格,并表明神經網絡優于其他模型,如廣義線性模型、主成分回歸和回歸樹。Bianchi 等人(2021)用神經網絡預測債券超額回報,并報告顯著的經濟收益。國內方面,周佩玲(2006)將神經網絡算法應用于道瓊斯股票指數預測中,增強了神經網絡的實用性。鄧鳳欣(2018)利用LSTM 模型對美港股票中市值較大的四只股票進行預測并獲得較好的效果,認為LSTM 在美港股市中具有較好的適用性。韓莉(2016)將LM-BP 算法運用到股票預測中,對美股上市的智聯招聘進行預測,取得了較好的成績,但其認為不能僅僅根據股價變化決定投資,并對多種指標進行了計算和分析,以此輔助投資者做出更好的決策。梁夏(1999)在神經網絡預測模型中加入自糾錯功能來預測股票滾動。李曉靜(2008)通過遺傳算法優化神經網絡的初始連接權并確定網絡隱節點個數進行預測建模,有效提高了模型預測精度。魏立龍、許東方(2011)把小波神經網絡和遺傳算法相結合,建立了基于遺傳算法的小波神經網絡股票預測模型GA-WNN,解決了收斂速度慢、易陷入局部極小值問題。楊青、王晨蔚(2019)構造深層LSTM 神經網絡模型對全球30個股票指數三種不同期限的預測研究,結果發現與SVR、MLP、和ARIMA 三種預測模型相比,LSTM 神經網絡模型具有更好的預測和穩定性。這些研究表明,神經網絡模型可以更好地預測未來的價格走勢。與以往的研究不同,本文引入了在圖像識別方面具有顯著優勢的DLNNs,實現了對股票價格趨勢的準確預測,也有助于經驗擴展技術分析與股票基本面分析。
DLNN 模型對圖像建模具有強大的統計能力,而股票價格圖表實際上是圖像。因此,可以使用DL 算法來分析股票價格趨勢。在圖1 中演示了DLNN 模型的基本結構,輸入層、隱藏層和輸出層。神經網絡是一組相互連接的節點(用圓圈表示),其靈感來自人腦中神經元的簡化,它通過激活函數將一層神經元與另一層神經元連接起來。激活函數是輸入信號的非線性變換,變換后的輸出作為輸入發送到下一層。這個功能決定了一個神經元是否應該被激活。通過這種多層神經網絡,輸入變量最終可以得到相應的輸出結果。
本文擴展了以往關于我國股票價格趨勢預測的文獻。首先,引入具有圖像識別能力的DL 模型,并將股價趨勢作為預測短期價格行為的解釋向量。其次,本文比較了DLNN 和SLNN,并闡明了DL 的實質優勢。最后,本文研究趨勢或股票基本面是否對未來股票價格有重要影響。使用價格趨勢作為輸入的結果和同時使用價格趨勢和股票基本面的單層模型的結果幾乎相同,證實了在預測價格走勢時價格趨勢在股票基本面中占有主導地位。
多因素模型的流行使學術界的注意力從絕對定價模型轉向了相對定價模型。目前,許多基于因子排序原則的因子檢驗和依賴因子模型間比較優勢的互跨檢驗變得不那么顯著。由于DL 模型的發展,本文研究可以聚焦于基本的價格趨勢,從時間序列中提取出可以確定股票價格的信息。
本文選取2014 年1 月4 日至2019 年12 月31 日期間上海證券交易所和深圳證券交易所的所有A 股的交易價格。樣本包含2809 個股票。從Wind 數據庫收集了Fama和French(2015)使用的每日收盤價和5 個股票基本面——PE(價格/收益)、PB(價格/賬面)、PS(價格/銷售)、PCF(價格/現金流)和TR(營業額)。TR 是一個每日變量,在每個交易日更新。其他四個股票基本面(PE,PB,PS 和PCF 比率)也是每日變量,變化來自兩個部分。第一部分是每日股票價格的分子比率,第二部分是每季度更新的分母。對于股票價格趨勢分析,數據頻率越高,信息量越大。如果使用每周或每月的數據,將無法捕捉到一周或一個月內的股價變化,不利于模型的訓練。每小時或更高頻率的數據比較嘈雜,可能會導致一些市場微觀結構問題。
本文使用DLNN 模型來預測2014—2019 年中國股票的價格變動。結果顯示DLNN 模型在驗證集的平均準確率為55.46%。與單層模型不同,DL 側重于學習不斷增加的有意義表示的連續層。它是一種能夠有效分析趨勢圖的高級統計模型,反映變量隨時間的變化趨勢。只要訓練數據包含足夠的概率關系就可以用于預測,DLNN 可以挖掘它們并提供良好的預測。
結果表明,DL 為學習價格趨勢和圖表表示提供了一個數學框架,這有利于圖像建模。DLNN 的預測能力幾乎完全基于對股價趨勢的分析。基本面和技術分析師應該通過DLNN 模型將價格趨勢納入他們的預測方法。