邢偉琛



摘 要:我國股票市場經過30多年的發展,逐漸形成了一個龐大的股票信息數據庫,隨著時間的積累,數據庫中包含了大量的股票數據信息。當前,大數據應用得到了蓬勃發展,大數據技術也得到了較廣泛的普及。為股票所產生的歷史數據進行收集,整理,分析提供了便利,為通過探究歷史數據對股票未來價格預測提供了可能。本文通過對大量的股票歷史數據進行分析,利用MATLAB軟件所帶的BP(back propagation)神經網絡模型對股票數據進行處理并分析。旨在為廣大的股票投資者提供更科學、更理性的建議。
關鍵詞:大數據 ?股票 ?BP神經網絡
中圖分類號:F830.9 文獻標識碼:A 文章編號:2096-0298(2020)02(a)--02
隨著股票市場的不斷發展,產生了大量的股票數據。但這些歷史數據往往被人們所忽略它們的價值或者在對歷史數據進行分析的過程中,難以深層次的挖掘出真正的對人們有用的價值,信息的利用率較低。并且股票市場向來“陰晴不定”,股價的高低起伏很大,而股票的價格變化又與每一位股票投資者的切身利益有著密切的聯系。因此,要充分利用好大數據技術所帶來的優勢,結合神經網絡算法,對股票的歷史數據進行分析,盡可能有效地挖掘出隱藏在股票大量數據中的規律,找出股票的價格走勢。
1 大數據的相關概念及發展
當前,信息技術和互聯網技術得到了快速的發展,大數據也應運而生。大數據是指在一定時間內,通過常規軟件或者是人工無法對涉及的規模巨大的數據量進行截取、管理、處理,并整理成為人類所能解讀的信息[1]。大數據概括來講具有以下五個基本特征,我們也常常稱做“5V”:一是體量(Volume)大;二是速度(Velocity)快;三是多樣性(Variety);四是價值(Value)密度低;五是真實性(Veracity)。
近年來,國家相繼出臺推動大數據產業發展的相關政策,涉及與數據相關的各個領域,完善大數據人才培養模式,加快大數據人才培養速度與質量。2016年“十三五規劃”中明確提出實施大數據戰略,把大數據資源作為戰略發展的基石,加快推動數據資源的開發和共享,推動多項產業的轉型升級[2]。圖1為我國大數據產業市場規模圖[3]。
2 我國股票市場的發展現狀
我國股票市場從1989年開始試運行,經過30多年的發展,經歷了從無到有,從少到多的重大跨越。起初,由于缺乏股票發展的相關經驗,一點點的摸索前進,直到現在股票市場已經發展成為中國經濟發展不可或缺的重要組成部分。我國股票市場在取得重大進步的同時也存在著一些潛在的問題。股票的價格會因為各種各樣的因素而產生較大波動,比如:有較多的內幕交易在股票市場中出現,在退市的規則執行中力度稍顯不足,股票市場中相關的法律法規未能及時制定等,以至于有一部分股民蒙受較大損失。并且我國股票市場還有“政策市”的特點,政府出臺的相關政策也會影響到我國股票市場個股的股票價格,因此,一種去除噪聲的科學合理的股票預測方法對于每一位股民來說就顯得很有必要了。
3 通過整理大數據信息對股票進行預測分析
3.1 BP神經網絡基本介紹
股票市場自身具有高噪聲、非線性的特點,而BP神經網絡可以較好的克服這些缺陷來對個股股票進行分析。BP神經網絡,是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,也稱之為誤差反向傳播神經網絡[4],其構造的基本思路是:由信號的正向和反向傳播兩部分構成了一個完整的學習過程。信號樣本值先從輸入層輸入,經過隱含層時按照制定的規則進行處理,再從輸出層將信號輸出,若輸出的樣本值與期望值存在較大差異,則進行反向傳播,通過調節各個參數的權重重新進行訓練學習,如此循環往復,直到滿足預期的標準為止。
3.2 BP神經網絡模型的參數確定及預測
首先,對神經網絡模型的參數進行選擇,主要通過獲取股票的收盤價和開盤價等指標來對神經網絡模型進行訓練。其次,由于各個股票的數據存在數量級的差別,為了減少因數量級差別而造成的非主要因素誤差,因此,對數據進行歸一化處理。再次,要對隱含層節點數的數量進行確定,隱含層的節點數的個數與網絡模型預測股票指標的精度之間關系密切。數量過多或者過少,都將會對預測精度產生重大影響。本文經過多次調試試驗,最終確定最佳的隱含層節點數數量為20。然后,就是對BP神經網絡結構進行確定。以MATLAB 2014a版本中所帶的BP神經網絡工具箱進行仿真實驗。用newff函數來創建BP神經網絡,BP神經網絡神經元的傳遞函數和輸出層神經元的傳遞函數用tansig函數,使用trainlm作為訓練函數,最大訓練次數為1000次,學習率為0.1次,目標精度為10~12次。最后,就是對實驗數據進行選取,為了最大限度的體現普適性,選取了四支股票進行預測,分別是中國石油(601857),中國平安(601318),中國聯通(600050),中國中鐵(601390)。通過大數據的收集和整理,選取2017年1月3日至2019年4月30日共492個交易日記錄為實驗基礎,其中,選擇462組交易數據對BP神經網絡進行訓練,剩下30組數據待輸出結果后與實際值進行對比。以下圖2~圖5是經過BP神經網絡訓練學習之后,預測的30組數據輸出值與實際值相對比所產生的四支股票收盤價的相對誤差圖。
3.3 對預測結果進行分析
通過對中國石油(601857),中國平安(601318),中國聯通(600050),中國中鐵(601390)這四支股票的歷史數據在BP神經網絡模型中進行學習訓練,得出了30組經過學習之后輸出的預測值,然后預測值與實際值相對比,我們進一步得出了這四支股票的相對誤差圖。通過看圖我們不難發現,中國石油和中國中鐵這兩支股票的相對誤差控制在2.5%以內,而中國聯通和中國平安這兩支股票的相對誤差大致在4%以內,考慮到由于企業的內在性質不同,導致中國石油和中國中鐵這兩支股票在相對誤差方面優于另外兩支,但總體來說,整個相對誤差在4%以內,已經能夠較好的對股票的收盤價的價格以及趨勢進行預測,可以實現通過對大數據的分析整理,利用BP神經網絡模型來對股票進行指導性預測,實現了為廣大股民提供科學、理性投資的目的。
4 結語
本文首先對大數據進行了相關介紹,再利用大數據技術對股票的歷史數據進行收集和整理,再將這些歷史數據輸入到BP神經網絡進行訓練并進一步預測,我們從各個股票的收盤價這一指標進行分析,產出了四支股票的相對誤差圖,從圖中我們可以非常直觀的看出該神經網絡模型在對股票進行預測的過程以及結果具有較高的精確度,結果較為理想。因此,在大數據背景下,以大數據技術和大數據分析為依托,能夠為廣大股票投資者選擇出更加科學、理性,適合自己的股票。
參考文獻
吉泉燁.產能過剩與商業銀行信貸風險的防范措施探討[J].全國流通經濟,2018.
我國大數據產業發展展望[J].軟件和集成電路,2017.
2018—2024年中國大數據行業發展趨勢及投資戰略研究報告[DB/OL].http://www.chyxx.com.
王磊,王汝涼,曲洪峰,等.BP神經網絡算法改進及應用[J].軟件導刊,2016(5).